荆楚网首页 新闻 政务 评论 问政 舆情 社区 专题 视频 商业 健康 教育 汽车 房产 旅游 金融 手机报 手机荆楚网
微信
新闻频道 > 文化新闻

国家语委语言资源网上线 将为语言研究提供海量资源

发布时间:2017-12-14 13:34:38来源:湖北日报

湖北日报讯(记者韩晓玲、实习生万苏雅、通讯员党波涛)12月12日,国家语委语言资源网上线。该网站由华中师范大学国家语言资源监测与研究网络媒体中心研制,将汇聚优质语言资源,最终建设成为我国语言资源领域重要的信息门户,并为世界了解中国语言生活打开一扇窗口。

国家语言资源监测与研究网络媒体中心自2005年落户华中师大以来,一直致力建设汉语网络媒体监测语料库。目前,该语料库包括网络新闻、博客、微博、论坛四类语料,各类语料文本已近1.48亿篇次,总字符数达1500亿,其中汉字总数为1300亿。这些语料每年以数百万篇次的速度增加,为网络媒体语言现象的研究和监测提供了必要的数据基础。而今后,随着国家语委语言资源网的分期建设,一大批这样的语料库将共建共享,为学术研究提供海量资源。

该中心主任、华中师大计算机学院院长何婷婷教授介绍,国家语委语言资源网目前已汇集了国家语委19家科研机构的48种语言资源,以及来自其他高校、研究所、社会机构的开放的各类语言资源,还将不断补充完善、逐步优化。