©科技日报 2024-06-18 (23)赞 (0)回应
官方 网站建设:企业、政府、学校网站建设、开发、运营,3D网页开发(广州13423640808,深圳13922266979,微信同号) *在线咨询
官方 全能网队:让企业内低性价比的网站运营/设计师下岗!每月最低仅需375元统一包起网站运营+编辑+设计+推广+服务器维护工作 *在线咨询
官方 丰业合作社:广东省级示范社,30多年原产地批发供应荔枝、圣女果、番石榴、火龙果等 #13922255007 *在线咨询 *填写收购意向
官方 场地租赁:廉江良垌水果收购场地/冷库/办公室租用 了解详情 #13542015105 *填写意向
记者6月16日获悉,中国电信人工智能研究院发布业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型。它打破了单一模型只能识别特定单一方言的困境,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持方言种类最多的语音识别大模型。
基于几亿用户和丰富应用场景优势,中国电信人工智能研究院构建了超30种、超30万小时的高质量方言数据库,推出星辰超多方言语音识别大模型。研发团队通过超大规模语音预训练和多方言联合建模,率先实现单一模型支持30种方言自由混说语音识别,是国内支持方言种类最多、覆盖人口最多的语音大模型。
团队首创“蒸馏+膨胀”联合训练算法,解决超大规模多场景数据集和大规模参数条件下,预训练坍缩的问题,实现1B参数80层模型稳定训练。星辰超多方言语音识别大模型也是业内首个开源的基于离散语音表征的语音识别大模型,将推理时语音传输比特率降低数十倍。
据悉,星辰超多方言语音识别大模型已在福建、江西、广西等地的智能客服试点应用。接入大模型后,智能客服能秒懂30种方言,日均处理约200万通电话。星辰超多方言语音识别大模型还落地多地市12345平台,为客服人员赋能,提升沟通效率,助力政务工作智能化升级。(崔爽)
粤人/粤机构/粤村镇