关注我们
荆楚网 > 新闻频道 > 湖北日报

支持74个语种方言“自由对话” 星火语音大模型破解强干扰场景下语音识别难题

发布时间:2024年06月28日22:32 来源: 湖北日报

湖北日报讯(记者文俊、通讯员许可亮)6月27日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。据介绍,讯飞星火V4.0依托国内首个国产万卡算力集群“飞星一号”,七大核心能力全面提升。在国内外12项大模型主流测试中,讯飞星火的8项测试排名第一。

现场,科大讯飞董事长刘庆峰展示了讯飞星火V4.0在复杂指令、复杂逻辑推理、空间推理、高中数学等方面的效果,星火“智商”再度进化。他表示,面向未来的人工智能新生态,要关注源头技术生态、智能体生态、应用生态和行业生态,实现自主可控和软硬一体,才能实现大模型的深度落地。

刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。面向万物互联时代,本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。

针对强干扰场景下的语音识别难题,科大讯飞突破了多人混叠场景下的极复杂场景语音转写,即使在三人混叠说话场景也能实现86%的语音识别准确率。三位人员现场实测了在噪音场景下,同时混叠着说话,正常人耳已难以听清,只见讯飞星火的多模态能力不但实现了三人重叠语音的角色分离,还能实时转写出每个人的语音,炸裂的效果引发现场掌声不断。未来基于多模态的声音识别技术,将应用在讯飞听见智慧办公、智慧屏等办公产品中。

科大讯飞文旅大模型近日落地湖北,以智算中心和讯飞星火大模型为支撑,打造了利川文旅大模型。文旅大模型打造客服咨询助手,让景区与文旅企业可根据自身情况,量身打造面向游客的个性化、对话式客服咨询服务,降低沟通成本,帮助游客高效获取信息。依托文旅大模型打造的推广文案助手,小编们可以快速创作有关腾龙洞的旅游攻略,详细介绍恩施特色的土家族美食,将土家烧饼、张关合渣、利川红茶等安利出去。还可以生动介绍洞内的钟乳石、石柱、石帘等自然石,并通过丰富的模板素材让配图和文案更达心意,轻松抓住“Z世代”的注意力。

如何更好地解决企业大模型应用的“最后一公里”问题?刘庆峰谈到,企业首先要科学地认识大模型的能力边界,根据任务难度选择合适方案,并且用更少的算力、更高的效率,打造企业专属大模型。随着星火V4.0的发布,他认为,用智能体平台打造每个岗位专属助手的时间已经来到。

【责任编辑:周晓燕】

Copyright © 2001-2024 湖北荆楚网络科技股份有限公司 All Rights Reserved

营业执照增值电信业务许可证互联网出版机构网络视听节目许可证广播电视节目许可证

关于我们 - 版权声明 - 合作咨询

版权为 荆楚网 www.cnhubei.com 所有 未经同意不得复制或镜像