塔斯娱乐资讯网

Anthropic转向按量计费确认算力需求非线性爆发,GPU物理稀缺锁死2027

Anthropic转向按量计费确认算力需求非线性爆发,GPU物理稀缺锁死2027年,建议关注Neocloud及云厂商板块拐点The Information 4月14日独家报道——Anthropic近期已将企业客户定价从按席位转向按实际AI使用量计费,这是AI推理需求超预期增长的最直接定价确认:1)Agent需求击穿传统订阅模型。 Anthropic ARR达$30B(4月初),较年底近三倍。Agent产品(Claude Code、Cowork)可无人值守连续运行、按30分钟间隔自动执行任务,单Agent Token消耗量为传统chat用户数十倍。旧模式下部分客户触顶被中断、部分远未用满,Anthropic发言人称新模式"更好地反映了从座位生产力向Agent使用的转变"(来源:The Information, 2026.4.14)。2)推理成本三倍增长确认GPU需求黑洞。Anthropic去年增长使推理成本增至三倍以上,毛利率低于预期。Claude Code ARR从25年12月$10亿跃至26年2月$25亿,周活用户1-2月翻倍,日均GitHub提交约13.5万次占全球4%(来源:The Information/SemiAnalysis)。按量计费将推理成本部分转嫁客户——但Agent ROI 5-10倍下企业对价格脱敏,ARPU大概率上升而非用量收缩,对GPU需求是纯增量。3)GPU租赁价继续上涨,全市场售罄。SemiAnalysis H100 1Y合约价从25年10月$1.70涨至26年3月$2.35(+38%),月环比15-20%。全市场按需产能(H100/H200/B200)售罄至8-9月。B200租赁价3月环比+24%。四大Hyperscaler 2026年AI CapEx合计约$7,000亿仍无法满足需求(来源:SemiAnalysis, 2026.4.2; Dylan Patel CNBC, 2026.4.1)。4)供给三层瓶颈锁死2027-2028年。台积电N3利用率100%,3nm/5nm全年100%预定,先进制程预订至2028年。Q1收入$35.7B创纪录,3月单月$13.1B同比+45.2%为历史最强。HBM短缺持续至2027年底,三星/SK Hynix上调HBM3E价格约20%。PC DRAM合约价Q1环比+105-110%创纪录(来源:TrendForce; TSMC Q1 2026月度营收公告)。5)建议关注三家Neocloud及云厂商。- Nebius (NBIS):Meta $270亿+NVIDIA $20亿战略投资,合同积压约$460亿,Q4收入+547% YoY,AI Cloud EBITDA首次转正。- IREN:采购50,000+ B300 GPU扩至15万块目标,Sweetwater 1(1,400MW)4月通电在即。- CoreWeave (CRWV):4月9-10日连签Meta $210亿+Anthropic多年期协议,积压约$878亿。6)对CSP及中国云厂商利好。按量计费意味着AI推理成为云计算新核心计量单位——从"卖虚拟机小时"变为"卖Token"。AWS(Bedrock推理)、Google Cloud(Vertex AI,外部收入增速40%+)、Azure均直接受益于Token消耗的非线性增长。国内Agent生态(Coze/通义/文心/AutoGLM)正复刻相同路径,且国产GPU(昇腾910B/C)供给更紧、稀缺性溢价可能更高。阿里云AI收入增速40%+,腾讯混元MoE推理成本已降至行业最低——均处于抢占Agent时代Token份额的战略窗口。Anthropic的定价转型是中国云厂商从"卖算力"向"卖智能"转型的最佳参照。跟踪指标:1)Anthropic/OpenAI月度ARR增量;2)SemiAnalysis H100 1Y合约价;3)26年8-10月GB300上线后Token价格走势;4)台积电4/16 earnings call;5)IREN 5/13财报;6)中国云厂商季报AI推理收入占比。风险提示:Agent渗透率放缓、GB300上线后供过于求、台积电/存储瓶颈提前解除、按量计费短期摩擦致客户缩减用量、芯片管制升级。