塔斯娱乐资讯网

微博大模型可真能省钱过去一年,大模型行业的竞争很大程度上围绕参数规模和算力投入展

微博大模型可真能省钱过去一年,大模型行业的竞争很大程度上围绕参数规模和算力投入展开。但VibeThinker-3B给出了另一种思路:推理能力的提升,并不一定完全依赖参数扩张。30亿参数规模能够在数学推理、代码生成等任务上取得不错表现,说明模型架构设计、训练策略以及数据质量的重要性正在被重新认识。从产业角度看,这种高效率路线的价值甚至不亚于单纯追求更大模型。因为决定AI普及速度的,除了能力上限,还有成本下限。