关闭导航

包含标签"语音识别"的内容

↕️ 2029 史诗级长牛现货建仓实验室

直播中
📅 熊市布局期:2026-04-01 → 2029-12-31(目标牛市)
加载中...
⏳ 距离计划结束还有 00000000
英伟达开源Nemotron 3.5:ASR语音识别与Content Safety安全模型
市场资讯部 23 小时前 24 0

英伟达开源两款针对智能体生态优化的专用模型。 Nemotron 3.5 ASR(语音识别) 6亿参数,支持实时多语言处理。 采用缓存感知架构,支持流式推理,延迟低于100毫秒。 支持40余种语言,具

通义Fun-ASR1.5发布:单模型精准识别30种语言与七大方言
市场资讯部 1 个月前 119 0

通义实验室于4月20日发布语音识别模型Fun-ASR 1.5,该模型已在阿里云百炼上线API,并在魔搭社区提供在线体验。 核心功能亮点 广泛覆盖:采用单一模型,支持30种语言、汉语七大方言体系及20

xAI开放Grok语音API:STT词错率低至6.9%,支持实时转录与情感TTS
市场资讯部 1 个月前 86 0

xAI 正式开放了两个独立的音频API:Grok Speech to Text (STT) 和 Grok Text to Speech (TTS)。它们基于支撑 Grok Voice、特斯拉车载系统和

sitemap