塔斯娱乐资讯网

【从“全员AI化”到“限Token”——大厂的AI账单,终于把增长叙事逼进了成本

【从“全员AI化”到“限Token”——大厂的AI账单,终于把增长叙事逼进了成本核算时代】 Meta据The Information披露的动向很说明问题:内部AI用量过去几个月涨得太猛,管理层开始上限额/预算/配额,并搭统一的AI Gateway看板做实时追踪与异常告警;更长期的计划是到2027把token管理做成结构化预算分配,而不是“谁跑Agent猛谁就赢”。

导火索不止是钱——而是激励设计翻车:把“用量”当指标,就会长出tokenmaxxing(刷无意义任务抬消耗量),内部甚至出现过按token消耗排行的“Claudeonomics”式游戏。CTO Bosworth的定调很直白:别为了用AI而用AI,token用量≠影响力。

这并非Meta独有问题——亚马逊这边更早一步:FT报道其关停了内部AI用量排行榜KiroRank,原因是员工“刷分”导致不必要的算力/成本上升;替代方向是用更接近产出的指标(所谓normalized deployments/有效部署)来衡量价值。一句话:当KPI变成token数,Agent会把消耗量自己造出来。

同时,需求侧也在变: WSJ报道OpenAI在评估显著下调token计费来抢企业客户(竞品压力+客户对成本反弹是明线),Sam Altman也公开承认成本是“巨大问题”。 市场上开始有人拿Silicon Data的LLM Token支出指数(更偏“每百万token均价/支付意愿”的晴雨表)说事:连跌不一定等于“AI没人用”,也可能是用量结构下沉(更多走便宜模型/批处理),但它确实在提醒市场:定价权与毛利率的讨论再也躲不掉。

所以别只盯着“大厂用不起Token”这种标题党因果——更本质的信号是三点:AI采纳第一阶段(“用起来”)结束第二阶段是“用得值”:从用量考核切到产出/边际贡献考核(转化率、缺陷率、人力节省、错误成本下降…)。

外部API用量会成为首批被管线的成本项:大厂会更强推自研/私部模型、缓存与路由、RAG与更小模型分流,把token花在“不可替代的推理”上。

对供给端(OpenAI/Anthropic等)意味着:token价格战越打,越要求用推理效率/MOE/蒸馏/量化把单token成本压下去——否则“以价换量”只会把IPO叙事从“高增长高毛利”改成“高流水低利润”。

这一轮的讽刺在于:过去一年最流行的AI KPI,恰好是把“烧钱”包装成了“文化”。现在大家同时学乖——不是不用,是开始算。