中国首个支持30种方言混说语音大模型发布

11

中新社福州5月25日电 (记者 刘育英)AI(人工智能)正在为传承语言文化注入全新生命力。中国运营商发布首个支持30种方言混说语音大模型。

25日,在第七届数字中国建设峰会上,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,打破单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。

中国幅员辽阔,“百里不同俗,十里不同音”。各种方言语法语音特征各不相同,传统的方言研究依赖于调查者主观感知标注,人力工程量巨大且难以系统标注。而AI能够更高效、系统地对方言进行整理归纳,对方言保护和传承意义重大。

构建高质量方言数据库,是方言保护和研究的基础。中国电信人工智能研究院已构建超过30种、超30万小时的高质量方言数据库,方言数据库在丰富性和高质量等层面均居于业内前列。

此外,中国电信研发团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题。

据悉,星辰语音大模型已广泛应用落地。星辰语音大模型已在福建、江西、广西、北京、内蒙古等地的中国电信10000智能客服试点应用。接入星辰大模型以后,智能客服秒懂30种方言,实现日均处理约200万通电话。此外,星辰语音大模型还落地多地市的12345平台。(完) 【编辑:邵婉云】

澜湄万里行记者团赴泰国皇家陆军电视台第五频道交流

世联赛逆转战胜美国队,中国女排世界排名升至第五

莫斯科重新强化限制措施应对疫情

中国完成世界首台兆瓦级商用浮空风电系统戈壁工况试飞

“台版陈同佳”被判刑10年10个月,曾在香港抢劫表行

1日新增确诊病例降至1例 中国已向16个国家派出15批医疗专家组

年度“Flag”不立了!扎克伯格:新年将专注长期挑战

2023中国新媒体大会在长沙举行 李书磊出席并发表主旨演讲

日企高管:“排除中国的”供应链不现实

中国铁建华东公司快速发展背后:用开放的心态创新经营

事关养老、出行、市场监管……你关心的事,5位部长回应了

福建海事再推8项创新举措 试点采认台湾地区船员相关证书

中共中央政治局召开会议 分析研究当前经济形势和经济工作 中共中央总书记习近平主持会议

美国再向乌提供7.25亿美元军援 含军用车辆及弹药

台湾劳保连续八年赤字 岛内舆论讽“民进党抢劫”

文章版权声明:除非注明,否则均为清明上河图吧原创文章,转载或复制请以超链接形式并注明出处。