当业界还在讨论大模型的价值时,金山云高级副总裁刘涛认为,这并非泡沫。其判断依据是“沉浸式开发”等AI应用热潮的兴起,代码自动迭代已触及产业变革的“奇点”。

面对这一趋势,金山云宣布对其智算平台“金山云星流”进行全面升级,发布了覆盖模型全生命周期的训推平台、机器人平台及模型API服务,旨在重塑自身角色,投身未来生产力的竞争。

推理需求爆发,云厂商角色转变

过去一年,智算需求的主要推手已从模型训练转向推理侧。火山引擎日均Token调用量已达50万亿,豆包、千问等模型的外溢需求急速扩张。这标志着AI正深入实际场景,成为企业降本增效的实用工具。

金山云助理总裁孙晓指出,这种增速超越了传统IT基础设施的认知。因此,金山云将自身定位为“工程化的陪伴者”,致力于提供稳定、高效且具备极致性价比的Token服务,成为大模型这个“大脑”所需的“循环系统”。

平台演进:从资源交付到任务交付

金山云的演进路径清晰:

  • 2023年:聚焦大规模智算网基础设施建设,比拼异构资源管理。
  • 2024年:转向平台化与Serverless,核心是将资源交付转变为任务交付。
  • 2026年目标:升级后的“星流平台”锚定效率提升、行业平台构建与推理加速。

为应对大规模训练任务的脆弱性,金山云自研了基于故障感知的自愈技术,能对硬件及软硬结合故障进行分级、秒级感知与快速处理,保障客户训练任务不中断。

布局“下半场”:具身智能与机器人平台

金山云将具身智能视为智算云的“下半场”。其发布的“星流机器人平台”旨在打通从数据采集、标注到模型训练、部署与仿真的全链路闭环,解决“从算法研发到真实场景部署”的落地难题。

以自动驾驶为例,云端训练对多模态点云数据的处理能力要求极高。金山云通过构建闭环数据平台,帮助客户更便捷地处理海量数据。刘涛展望,未来5到10年,家庭服务机器人将逐步落地,形成一个万亿级赛道,金山云的目标是成为该赛道的“底座”和“引擎”。

开放生态与极致工程优化

坚持“不做大模型”的承诺,使金山云在生态建设上更加开放。其基于开源模型,依托自研技术,提供高性价比的Token服务,并能快速上线业内热门模型的推理服务。

在技术栈上,金山云聚焦以推理加速为核心,通过PD分离(预填充和解码分离)及量化技术,极致压低时延、提升吞吐。其从游戏等高并发场景中沉淀的极限压测经验,也被应用于大模型推理的优化中。

未来竞争:应用驱动与工程能力

未来,技术层面的竞争将持续,但真正的分水岭在于“应用”。视频生成实用化、VLA模型在终端泛化、Agent在日常生活中的渗透,将推动推理需求指数级增长。

智算云的红利期不会永久持续。唯有能解决极限工程难题、打通行业数据闭环、提供极致性价比Token服务的厂商,才能在潮水退去后屹立不倒。


🔥 实时行情点位,群内抢先看!

进群蹲精准做单提示→青岚免费交易社群 (电报)

以上仅为青岚姐个人观点,不作为投资建议,交易需谨慎|本文由青岚加密课堂整理优化