关注我们
荆楚网 > 新闻 > 文化

以大数据“全景式”呈现唐诗宋词

发布时间:2019年01月21日12:32 来源: 光明日报

一场读诗方式的创新——

以大数据“全景式”呈现唐诗宋词

光明日报记者 王子墨 王远方 卢璐

“问汝平生功业,黄州惠州儋州。”苏轼曾给自己做了这么个总结。但是苏轼一生到底有多颠沛?光看文字可能不太好想象。但是打开《唐宋文学编年地图》,输入“苏轼”,一张中国地图上被密密麻麻地标记了位置。这张地图,就是一张直观生动的“苏轼颠沛流离图”。

2017年3月,中南民族大学文学与新闻传播学院教授王兆鹏牵头打造的《唐宋文学编年地图》上线。在这张地图上,既可以查出唐宋时期某位诗人一生的足迹与作品,也能查出一个地方曾接纳过的所有诗人。该产品突破了唐诗宋词文字阅读的“套路化”模式,变成了直观生动的地图展示,一上线即收获广泛关注。最初上线的前两天,点击量超过220万。《唐宋文学编年地图》为何会产生这么大的影响?新版本又有哪些变化?记者就此进行了采访。

读诗方式的创新

“我当年写博士论文的时候,就考虑能不能用统计学的方法解读唐诗宋词,进行定量分析。那个时候没有计算机,就是靠人工录入。”王兆鹏用大数据解读唐诗宋词,并非一时突发奇想,而是贯穿在他一直以来的学术脉络中。

在《唐宋文学编年地图》之前,王兆鹏及其团队曾有一部著作引发了不小的舆论争议——《唐诗排行榜》。该书运用统计学的方法得出了一份唐诗前100名的排行榜,其中排在榜首的是崔颢的《黄鹤楼》。

“当时很多人不理解,觉得‘文无第一’,诗怎么可以排行呢?其实仔细阅读这本书就知道,这本书主要是还原文学评价的历史情境,哪首诗被历代文人最多地提起、引用、编入选本,这些都是有据可查的。排行榜是用数据得出的‘结论’。它不是对一首诗的价值评判,而是对一首诗影响力的评估。”

而这本书也进一步启发了王兆鹏:诗,不一定只是纸面诵读,还可以运用大数据,走进历史场景之中,还原当时的文学图景,进行一场读诗方式的创新。“名诗是一棵棵树,而还原历史,则是重现那片森林。”

之后,王兆鹏带领学生们与搜韵公司合作,参与的人数超过100人,历时5年,开发出了《唐宋文学编年地图》,一上线就反响不错。“直到今天我们还在不断维护,在后台添加数据。唐宋文学的数据量太大,必须不断更新。”

经过一年的运营与总结,王兆鹏又计划着对文学地图进行一次更新,让唐诗宋词不仅能读,能看,更能“走进”。

“全景式”呈现唐诗宋词

虽然《唐宋文学编年地图》反响不错,但也收到了一些意见,如页面卡顿、界面单调等等。除了改进这些用户体验上的问题,王兆鹏还有更多考量。

“就像一句‘江流天地外,山色有无中’,我们今天读起来觉得是好诗,但是如果能走到那个地方去,就会发现风景确实和诗人描写的是一样的。这时就会发现不只是诗人写得好,而且风景就是如此,如果知道这些,对解读一首诗必然大有帮助。”

王兆鹏希望改进后的地图,可以“全景式”呈现唐诗宋词。“比如在地图上点开一首诗,除了文字信息,还能弹出场景画面,重现诗人写作时看到的自然景观。像李白的‘两岸青山相对出’,诗人为什么这么写,一看图片就明白了。”

为了实现这一目标,王兆鹏及其团队,与市场上的数据公司合作,不断改进。王兆鹏在采访时除了诗词名句,还不时冒出编程的专业术语,对各类技术名词信手拈来。“我是研究古典文学的,但一点也不排斥技术。当今的技术手段能够极大地丰富我们对传统文学的解读方式,古典文学的学者应该多了解新的信息技术。现在的技术进步太快了,没有做不到,只有想不到。理解了技术的逻辑,会给我们的研究视野带来极大的拓展。”

预计2019年年中,新版本的《唐宋文学编年地图》将会上线。“原本《唐宋文学编年地图》主要是想面向学术界,新版本将更多面向大众,优化一般网民的使用体验。这将是一个尊重市场规律的产品,增强体验感。古典文学不只是一种读物,也能变成有科技感和现代感的产品。”王兆鹏这样介绍。

数据库自主权要掌握在自己手中

如今,王兆鹏考虑最多的还有一事——数据安全。“怎样防止别人入侵我们的数据库、扒走我们的整理成果,我们花了大量精力来做这件事。整理一个数据库的劳动量非常大,但被别人‘黑’走却是分分钟的事。”

王兆鹏使用了诸多技术办法,来给数据加密,“安全”,是王兆鹏在其团队里经常提起的词。

也正是在提升数据库安全性的过程中,王兆鹏发现了将数据库掌握在自己手里的意义。“现在包括中国文献在内的诸多数据库,其所有权都在国外。现在的学术研究,谁掌握了数据库,很大程度谁就拥有学术自主权,别人就可以来定义你的文献价值和学术走向。我在整理数据的时候,深感我们在数据库方面的薄弱,甚至是中国古典文学,有不少数据库都在国外。”

王兆鹏希望,借着梳理文学地图的契机,能够打造一个翔实、全面、具备学术价值的数据库。“因为我用定量分析的办法研究古典文学很多年,其实也暗自憋着一股劲儿,想做出一个优质的、属于中国人的数据库,争得一份学术自主权。”

《光明日报》( 2019年01月21日 08版)

【纠错】编辑:周喆宇

Copyright © 2001-2018 湖北荆楚网络科技股份有限公司 All Rights Reserved

营业执照增值电信业务许可证互联网出版机构网络视听节目许可证广播电视节目许可证

关于我们 - 版权声明 - 广告服务在线投稿

版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像