登录之后可以开启更多功能哦
英伟达开源两款针对智能体生态优化的专用模型。 Nemotron 3.5 ASR(语音识别) 6亿参数,支持实时多语言处理。 采用缓存感知架构,支持流式推理,延迟低于100毫秒。 支持40余种语言,具
通义实验室于4月20日发布语音识别模型Fun-ASR 1.5,该模型已在阿里云百炼上线API,并在魔搭社区提供在线体验。 核心功能亮点 广泛覆盖:采用单一模型,支持30种语言、汉语七大方言体系及20
xAI 正式开放了两个独立的音频API:Grok Speech to Text (STT) 和 Grok Text to Speech (TTS)。它们基于支撑 Grok Voice、特斯拉车载系统和
盘前逻辑 | 实时预警 | 电报同步