关注我们
荆楚网 > 新闻 > 文化

中华书局搭建数字化整理平台,招募社会力量

发布时间:2019年01月10日11:58 来源: 人民日报

900多人,有大学生、出版社编辑、律师、教师,还有远在德国、俄罗斯的中国留学生。4个多月的时间,他们在线上共同参与近2亿字的古籍审校。是中华书局的数字化古籍整理工作平台让他们跨时空相聚。

“业余选手”保质保量地完成了一项原本不可能完成的任务,令人欣喜。更让人欣喜的是,他们中大多数都是年轻人,熟练掌握古文阅读、具备一定文字学基础、善于运用数字技术是他们的共同特点。

按照中华书局的设想,未来古籍整理出版的全部流程都可以在网络上完成,最后纸电同步出版。有这么多热爱中华传统文化的年轻人,这个设想应该可以实现。

2017年年底,随着耗时8年多的《中华大藏经续编》陆续交稿,中华书局总编辑顾青发现自己面临着一项不可能完成的任务:全书近2亿字,2019年必须出版——作为国家出版基金资助项目,出版计划是定死的,不能更改。

担心

用众包的方式审校古籍,能保证质量吗

顾青算了一笔账:假设一名高产的古籍编辑一年审校300万字,2亿字需要中华书局60名古籍编辑工作一年。按照“三校一读”的出版流程,2亿字的书稿要从头到尾通读4遍,60名编辑即使白天黑夜连轴转也要干3年。

巨大的工作量、日益紧迫的出版日期让顾青发愁。他突然想到中华书局刚刚搭建的数字化古籍整理工作平台,为什么不利用这个平台招募社会力量共同参与呢?

但是,古籍整理专业性很强,中华书局的编辑大都毕业于相关专业,通常要在书局浸润三五年才能独立承担任务。从社会上招募志愿者,用众包的方式审校古籍,这不是异想天开吗?能保证质量吗?顾青心里也打鼓。

《中华大藏经续编》是国家重大古籍整理出版工程,也是国学大师任继愈先生的未竟之志。1997年,历时15年的《中华大藏经》在任继愈的主持下终于出版,但106册、约1亿字的《中华大藏经》并未能将历代佛经一网打尽,之外尚有2000多种佛经未收录。《续编》就是要将这些古籍审校出版。2009年6月,93岁高龄的任继愈在病榻上与中华书局签订了《续编》的出版合同。一个月后,老人溘然长逝。

“如果《续编》出现质量问题,怎么对得起任先生?”顾青说。但形势的发展已容不得犹豫。

放心

一批批审校稿陆续传回,质量全都达标

2018年3月,中华书局发出了第一份启事,招募在线审校人员。短短一个月,全国竟有1500多人报名。经过试用考核,最终留下900多人。这其中有在校大学生、出版社编辑、律师、教师等,遍布全国各地,甚至远在德国、俄罗斯、泰国的中国留学生也申请成为审校者。

入选者会领到一个专业古籍整理网站籍合网的账号,在线接受任务。中华书局将底本即内容最全、错误最少的作为校勘的基本依据的古籍图片与文档通过网络发给审校者,后者对照底本,逐字逐句审阅,遇到错讹,直接在平台上修改,书局编辑借助平台版本对比功能来查看审校者的修改记录,判断修改内容是否合格。

《续编》所收经典上迄唐代下至明清,有刻本有抄本,有梵文有巴利文,历代字体不一,正字俗字异体字错杂,有的模糊不清,有的残缺不全,给审校者出了很多难题。但业余审校者们以高度的责任感和严谨细致的作风拿出了一份让内行也赞不绝口的成绩。

来自山东的心理学老师鄢敬新用两个月的时间完成了20卷、近65万字的在线校对工作,撰写注释多达1444条。在工作中发现书局发给他的一部古籍的底本少了4卷,书局委托鄢敬新补齐所缺文本,保证了书稿的完整性。鄢敬新说:“我们审校的目的就是把电子文档中出现的问题找出来,最大限度地减少讹误,呈现古籍的本来面目。”

复旦大学博士生方思园熟识梵文,当仁不让地承担了梵文古籍的审校。梵文之难是众所周知的,有的梵文字母外形极为类似,稍不留神就会辨识错误。古籍上的梵文字很小,密密麻麻堆在一起,方思园睁大眼睛,一个字一个字比对识读。日本人开发了一套梵文字库,要支付巨额使用费。在书局的委托下,方思园和其他几位复旦同学开发出中国第一套适用于计算机输入的梵文字库,7000多个梵文文字都是一笔一画手工绘制的,负责摹写的人累得得了腱鞘炎,但成就感满满——“我觉得我们开发的字库比日本人的漂亮多了,排版出来很好看。”方思园说。

来自温州医科大学的朱若溪是敦煌学博士,她翻了很多大英博物馆和法国国家图书馆等收藏的敦煌文献,挑选最为清晰的PDF文件下载,发现了不少文稿整理者忽视的地方。比如敦煌写经中的错字衍字,千年以前的书写者如果发现了就会在旁边做个删除的记号,但这种记号只有在高清的彩色图片上才能看出来。古籍中的一些讹误,就是这样被她发现的。

随着一批批审校稿陆续传回来,顾青渐渐松了口气,因为业余古籍审校者的工作质量是达标的。顾青问了几位资深编审,“这批审校稿拿出去会不会毁了中华书局的名声?老先生们说,不会!我心里一块石头落地了。”

信心

在线审校者中年轻人占大多数,古籍整理后继有人

利用数字技术调动社会力量参与古籍整理是一个全新的尝试,它使以往仅仅局限在专业人士小圈子里的工作迈向大众,古籍整理的效率成百倍地提高。

任继愈先生主持编纂的《中华大藏经》有160多人参与,前后共计15年。而《续编》在9个月的时间里完成900多部经书约6000万字的审校任务。按照目前的进度,2019年完成全书出版,应该不成问题。

“这些在线审校者真的令人感动,有的人腿摔断了还坚持看稿子,有的人在进手术室之前还不忘交稿子……没有他们的奉献,我们是不可能完成这么大的任务的。”古联公司文献编纂部主任朱翠萍说。

在顾青看来,古籍整理后继有人了。900多名在线审校者中,二三十岁的年轻人占绝大多数。热爱中华传统文化、熟练掌握古文阅读、具备一定文字学基础、善于运用数字技术是他们的共同特点。借助网络交流的便利,很多疑难问题,发在QQ群里,大家共同探讨,很快就会有结果。

为了进一步做好在线审校工作,2018年12月15日,中华书局举办了第一届古籍在线整理专家学者论坛,对精选出的70余位在线审校者进行业务研讨与培训。中华书局总编辑助理俞国林现场出了3道题,3首未经句读的古诗和古文出现在大屏幕上,3位在线审校者仅仅看了十几秒就准确无误地断句标点,流畅地朗读出来。

除了人才,技术的进步也是提升古籍整理效率与质量的利器。按照中华书局的设想,未来古籍整理出版的全部流程都可以在网络上实现。整理一部古籍,首先扫描底本,系统自动识别文字,经人工检查后,将电子文本上传至平台;编辑把电子文本分成若干任务包,在平台上发布;整理者申领任务,利用平台提供的自动校勘、标点系统,初步整理后,人工修正错误并提交稿件;最后,编辑在线审稿、加工,然后自动排版,实现纸电同步出版。

顾青表示,在古籍整理领域,人工智能不可能完全代替人的工作,每个环节都需要进行人工干预,只要做好前期的体例设计、后期的审核,完全可以编辑出符合古籍整理质量要求的出版物。

“和许多从事传统文化研究的老先生相比,我们是幸运的。他们没能赶上的好时候,我们赶上了。我们必须珍惜新时代给我们创造的机遇,殚精竭虑、全力以赴,为建设伟大祖国的优秀传统文化宝库,添砖加瓦,贡献自己的知识和力量。”作为在线审校者代表,鄢敬新说。

数字化 中华书局 “业余选手” 【纠错】编辑:覃梦颖

Copyright © 2001-2018 湖北荆楚网络科技股份有限公司 All Rights Reserved

营业执照增值电信业务许可证互联网出版机构网络视听节目许可证广播电视节目许可证

关于我们 - 版权声明 - 广告服务在线投稿

版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像