通义实验室于4月20日发布语音识别模型Fun-ASR 1.5,该模型已在阿里云百炼上线API,并在魔搭社区提供在线体验。
核心功能亮点
- 广泛覆盖:采用单一模型,支持30种语言、汉语七大方言体系及20多种地区口音,无需为不同方言单独部署模型。
- 性能提升:据官方内部评测,在典型方言场景下,字错误率较上一版本相对下降56.2%。其中,5种方言准确率超90%,15种方言超80%。
- 专项优化:针对古诗词识别进行了专门优化,内部测试的字符级准确率达到97%。
应用场景价值
该模型将方言识别这一长尾难题整合进一套可直接商用的方案,显著简化了教育直播、地方政务热线、采访整理等场景的部署流程。接入方无需再为不同口音搭建多条识别链路。