一个做服务器代理的朋友说:今年客户聊国产DCU的次数明显变多了。之前海光DCU接连适配腾讯混元Hy3 preview、智谱、商汤,现在连最新的腾讯混元Hy-MT2翻译模型也完成了深度适配。
这说明一个问题:国产AI生态开始真正往前滚了。
Hy-MT2这种模型,方向很明确:轻量化、多语言、低门槛。很多企业现在不一定追求千亿大模型,反而更关心能不能快速部署,能不能省成本,边缘设备能不能直接推理。这种情况下,算力平台的兼容性和易用性就特别关键。
很多企业IT负责人最怕什么?买回去之后一堆环境适配、算子优化、推理部署搞不定。海光这次依托DAS(DCU AI Software Stack)中针对大模型推理优化的vLLM、SGLang等组件,结合DTK(Deep Computing Toolkit)中对各类算子的高效实现与优化,开发者不需进行复杂的底层修改,就能在海光DCU算力平台上快速部署、高效运行,本质上是在降低开发门槛。
以前国产算力讨论最多的是“有没有”,现在开始进入“好不好用”。这就是现在国产AI最明显的变化。
