关注我们
荆楚网 > 新闻频道 > 财经

“多语种智能语音关键技术及产业化”项目获国家科技进步奖一等奖

发布时间:2024年06月25日17:23 来源: 经济参考网

6月24日,2023年度国家科学技术奖在京揭晓,共评选出250个项目。其中,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。

据了解,多语种智能语音技术对于支撑人机交互、人类语言互通等具有重大战略意义,产业前景广阔。

为解决语音识别研究中远场、噪声、多人语音混叠等难题,该项目提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,使得复杂场景下语音识别准确率得到重大突破。

为应对小语种智能语音系统构建所面临的知识匮乏、训练数据稀缺等难题,科大讯飞设计了全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,又通过基于元学习的多语种预训练和基于语族分组的多语种共享建模。通俗地说,就是将不同的小语种进行分类,找到同类语种的共同规律,进行分析建模和训练,最终显著提升了小语种语音系统性能。

同时,为解决复杂应用场景下语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题,科大讯飞提出语音语义互增强的鲁棒口语理解技术,有效提升语音交互、语音翻译等复杂场景的语义理解准确率;提出多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。

目前,该技术成果得到广泛应用。以智能手机为例,项目支持各主流手机厂商累计激活设备超10亿台;智能汽车方面,车载智能化产品累计前装超5300万套。此外,该项目还构建了多语种智能语音技术及全球产业生态,2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿。

【责任编辑:肖梦吟】

Copyright © 2001-2024 湖北荆楚网络科技股份有限公司 All Rights Reserved

营业执照增值电信业务许可证互联网出版机构网络视听节目许可证广播电视节目许可证

关于我们 - 版权声明 - 合作咨询

版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像