美国AI大厂跑通了B端盈利模式 然后呢

最近翻阅了一大摞各大科技公司的财报和行业实证数据,我留意到一个有些反常的现象。大家对人工智能的讨论,似乎已经悄然从“哪个聊天机器人更聪明”的趣味测试,变成了一场关乎生存的基建狂飙与饭碗重塑。作为一名长期的旁观者,我试图把这些繁杂的线索拼凑起来,看看水面之下到底发生了什么。

悄然转舵

过去两年,科技巨头们不惜重金在普通用户端进行补贴,但现在风向看来变了。资料显示,Google 在最新财报中不再披露 Gemini 的 C 端月活用户数,转而高调宣布其企业端智能体服务 Gemini Enterprise 月活环比增长了 40%。与此同时,OpenAI 也关停了 Sora 等面向消费者的产品,集中资源力推对标 Claude 的企业端代码应用 Codex,据说其企业端收入占比已超总收入的 40%。

另一家公司 Anthropic 更是凭借企业端商业模式的跑通,在一个季度内将企业经常性收入从 90 亿美元狂飙至 300 亿美元。一个解释是,C 端用户付费意愿较弱,而企业主们发现智能体能实打实地替代人工、节省成本,所以极其愿意买单。

这种转变直接重塑了商业模式——从传统的按月固定订阅制,全面转向按需购买 Token 的“按量计费制”。因为智能体会二十四小时无休止地运转,这让底层算力储备成了真正的硬通货。

算力成底牌

据行业观察,商业模式跑得最快的 Anthropic 目前仅有 6GW 的算力储备,面临严重不足的窘境,甚至开始变相涨价并限制用户的 Token 使用量,导致部分用户流失。相比之下,OpenAI 早期通过低价锁定了超过 30GW 的庞大算力储备。资料显示,充足的算力让 Codex 在不到三个月内就从 50 万用户冲到 400 万。

巨头们为了打消市场对“只烧钱不赚钱”的担忧,有了更强底气加大投入,以 Microsoft 为首的大厂将今年的资本性支出从 1300 亿大幅上调至 1900 亿,与 OpenAI 深度绑定的 Oracle 等云计算公司也迎来了估值修复。囤积算力成了大厂的执念,但这直接撞上了现实物理世界的铁壁。

六道物理墙

资料显示,要落地百万级芯片集群的大型项目,大厂们正面临六道极难逾越的物理阻碍。

第一道是能源与电网承载力。全美数据中心预计到 2026 年耗电量将高达 1050 太瓦时。面对扩容滞后的传统电网,Microsoft 直接与 Constellation Energy 签约重启三哩岛核电站,OpenAI 则与 Helion 合作探索核聚变,Meta 和 Amazon 也纷纷注资小型模块化反应堆。

第二道是内存与封装瓶颈。目前高带宽内存的产能已售罄至 2026 年底。大厂不得不深度绑定 Samsung、SK Hynix 和 Micron 等寡头,并提前锁定 TSMC 的 CoWoS 先进封装产能,甚至采用将 16 位权重降至 8 位或 4 位的量化策略来妥协。

第三道是通信网络。传统铜线触及了耗电极限,行业正全面转向 Silicon Photonics(硅光技术)和 CPO。Broadcom 已推出了相关交换机并在 Meta 部署,Marvell 也斥巨资收购了 Celestial AI。

第四道是物理散热。随着 Blackwell 架构新 GPU 的推出,单机柜功率密度飙升至高达 100kW。风冷已经失效,液冷和采用 GaN 的 PMIC 芯片成了新建机房的标配。

第五和第六道则是芯片与供应链物流。为了摆脱算力税,大厂推行 A3C3 软硬协同模式,并大量部署自研芯片如 Maia、Braga 以及 Google 的 TPU v7。在供应链端,由于高度依赖 TSMC 且面临变压器等数年交货期的拖延,美国牵头多国发起了 Pax Silica 倡议,SoftBank 等也纷纷组建财团应对。

巨头们在机房里死磕物理定律,但在外围的软件世界,一场算力私有化的反击已经兵临城下。

开源的反击

就在大厂砸下千亿基建时,企业端的生态却出现了分化。资料表明,目前高达 76% 的企业组织在混合使用开源模型。Llama 4、Gemma 4 以及 DeepSeek V3 和 Qwen 3 等模型,在标准测试中已逼近前沿闭源水平。出于成本考量,77% 的用户偏爱参数量在 130 亿以下的小型模型以微调私有数据。

在本地部署 B200/B300 或 L40S 等推理芯片,投资回本周期已经被压缩到了短短 4 个月。在本地运行 700 亿参数模型,生成一百万个 Token 的摊销成本仅需 0.11 美元,比调用前沿闭源接口便宜高达 18 倍。这种趋势催生了 Neocloud 供应商,它们能以不到 AWS 三分之一的价格提供算力。

科技巨头们预计到 2026 年的资本支出将高达 7200 亿美元,而新硬件的更换周期仅为两三年。看来,巨额研发正变成一堵极高的“折旧墙”,如果软件端变现速度持续慢于预期,巨头们可能会陷入尴尬的效率悖论。然而,比起利润表,这场效率革命对普通人饭碗的冲击显得更为真切。

隐性失业潮

资料显示,企业采购工具已经从辅助生产转变为实质上的劳动力替代战略。预算正从初级员工的薪水直接转移给智能体。据高盛数据显示,替代效应已使美国月度就业人数净减少约 1.6 万人,22 至 25 岁年轻人在白领领域的求职成功率下降了 14%。

企业通过采购工具停止了新增招聘,制造了一场隐性的失业潮。这种悄无声息的岗位置换,可能会在更深层的宏观经济中引发连锁反应。

宏观的反噬

高收入白领群体贡献了发达经济体约 65% 的非必需消费品支出。可能的情况是,如果他们大量失业或被迫降薪,整体购买力会遭到结构性破坏;企业面临利润压力会继续投入算力裁员,从而形成一个极其危险的“AI 消费螺旋”。

这种收入的受损,可能会动摇建立在收入稳定基础上的 13 万亿美元美国住房抵押贷款市场,以及按人头收费的软件服务企业。在经济承压的大背景下,AI 大厂很难独善其身。Microsoft 和 OpenAI 筹划的 Stargate 超级计算机项目耗电高达 10GW。一个解释是,如果占经济大头的消费端枯萎了,机器本身并不会消费,海量算力产出的效率将面临“卖给谁”的困境。

一旦终端变现逻辑崩塌,排名前十的科技巨头一年内发行的 1200 亿美元债券,以及高达 20 万亿美元的股东财富,都将面临巨大的泡沫破裂风险。技术生态与宏观经济,终究是一条谁也无法脱身的利益链条。

什么样的将来?

总体看来,这场算力霸权之争远比想象中复杂,它既是挑战物理边界的工业奇迹,也可能是一场悬在人类经济循环头顶的豪赌。一个合理的预测是,随着现实物理约束的收紧和宏观购买力的承压,纯靠烧钱换规模的模式在未来几年内大概率会遭遇一次理性的估值修正。作为身处浪潮中的个体,我们也许应该尽早盘点一下自己当前的工作中,还有哪些是无法被固化流程与代码轻易替代的核心价值,以此在不断蔓延的替代潮中寻找立足之地。