算力霍尔木兹：别再盯订阅了，AI 早该挪进你的水电科目

四十天内，全球 AI 订阅市场同步塌房

2026 年 4 月 21 日下午，Anthropic 在定价页面悄悄把 Claude Code 从 20 美元的 Pro 套餐里剥离了一次。消息在 Reddit 和 X 上扩散后不到 24 小时又匆匆放回，但这只放飞 24 小时的测试气球，已经把所有付费开发者炸出了冷汗。

往前推一个多月。3 月 18 日，Google 的 Gemini CLI 团队在 GitHub 发了一则服务更新公告：从 3 月 25 日起，Gemini Pro 系列模型不再向免费用户开放，免费账号只能用 Flash；付费账号之间也要按 license 等级分配流量优先级。那条公告下面，社区留下了 917 个踩、131 个赞——接近 7 比 1 的差评。

再把镜头转回国内。智谱的 GLM Coding Plan 每天上午 10 点准时限量放号，晚一秒就只能第二天再抢；闲鱼上代抢服务的叫价从 100 元一路爬到 300 元以上，成了程序员之间半公开的段子。4 月 12 日，阿里云官方宣布：百炼旗下性价比最高的 Coding Plan Lite 基础版——原价 40 元 / 月、每月 18000 次请求——于 4 月 13 日 18 时起停止续费与升级；更早的 3 月 20 日，它就已经停止接受新购。新用户现在只能直接买 Pro 版——200 元 / 月，整整贵 5 倍。

再加上字节火山引擎 4 月把 GLM-5.1 接进来之后频繁卡死，用户连成功发起一次推理都费劲；Anthropic 对中国大陆账号的 KYC 审查一轮紧过一轮，大量 Pro 订阅被直接封停；就连最顶级的 Gemini Ultra 250 美元 / 月订阅，用户在 Reddit 和 Google 支持社区里排队反馈「high traffic」错误已经持续一个多月。

四十天，六家头部厂商，六种不同的动作，指向同一个结论：那个你用 20 美元就能敞开调用全球顶级模型的包月红利窗口，正在被全球同步关闸。 你手上那一堆花花绿绿的 Coding Plan 订阅账号，已经凑不出一个能让全公司放心用的稳定算力通道了。

真正被这轮洗牌率先碾过去的不是大公司。大公司有预算切换厂商、有法务谈合约、有 IT 团队做迁移，断供对他们只是多一个 PPT 议题。真正最先挨刀的，是那些已经把 AI 当做第 11 个员工、第 12 个客服、第 13 个运营来使唤的小微企业和一人公司。过去半年你靠 Claude 一个人扛下一个小团队的活，现在这套战术的底层算力突然开始断供、限流、涨价。对大厂是大会议题，对你是现金流的生死线。

真正值得警惕的不是下架，是 Opus 4.7 悄悄翻的那一倍账单

下架 Claude Code 这种事件看起来惊悚，但它本质只是定价表层的操作，厂商今天拿走、明天可能就还你。真正应该让老板后背发凉的，是同一家公司 4 月发布的 Opus 4.7。

Anthropic 的官方定价表上，Opus 4.7 和它的前代 4.6 维持完全一致的标价：输入 5 美元 / 百万 Token、输出 25 美元 / 百万 Token。看起来什么都没发生。但翻开工程细节会发现，Opus 4.7 换了一套全新的分词器，同一段代码、同一份结构化数据、同一段中文文本，在新分词器下会被切成最多多出 35% 的 Token。

第三方成本分析机构 Finout 给出的样板计算一目了然：一个日均 100 万输入 Token、20 万输出 Token 的标准编程代理，在 Opus 4.6 上月度消耗约 300 美元；同样的工作量迁移到 4.7，因为分词器膨胀，月度成本会抬到 405 美元。同样一份活，同样的产出，账单多交 35%。

更极端的是 Finout 给出的第三档场景：一个跑自主化软件工程代理的团队，日均 1000 万输入、200 万输出 Token，不开缓存折扣的情况下月度开销从 3000 美元直接跃至 4050 美元，一个月多烧出一台中高配笔记本的钱。走 batch 异步通道能打五折、走 prompt caching 能打一折，但这些优惠都是工程团队的活，而不是 CEO 签字就能解决的。

Opus 4.7 并不是孤例，它是一个信号：当模型本身的智力边际收益开始变钝，厂商会被迫把 agentic harness 那一套工程外挂塞进基础模型里去赢得跑分。 跑分是赢了，但 Token 消耗按几倍甚至几十倍的速度跳升，单价不动、实付翻倍。你看到的账单涨幅和你看到的价格表，彻底脱钩了。

Anthropic 自家的 Sonnet 4.6 在输入、输出两端都比 Opus 便宜四成，能覆盖大部分 RAG 和内容生成场景；Haiku 4.5 在高频、低延迟的分类和路由任务上单价只有 Opus 的五分之一。但大多数企业当前是一股脑把所有活都丢给 Opus——这就是典型的屠龙刀杀鸡，也是企业 AI 账单里被忽略最久的一处漏洞。

真正的地雷埋得更深——过去三年企业主习惯了单价逐月下降的心智模型，所以不太在意 AI 预算有没有上限。从 Opus 4.7 开始，单价那一栏可能永远不动，但同一个业务动作的 Token 消耗会持续膨胀。对大厂这是下一次预算会的议题；对那些用 AI 省下了两三个人头的小公司，这 35% 直接吃掉你的利润。过去一年你靠自动化省下来的人力成本，会被单价不动、Token 膨胀的账单逐月啃回去。

算力霍尔木兹：三条死线同时收紧

把上面两幕连起来看，就是一张非常清晰的结构图。这一轮并不是某家厂商经营不善，而是三条底层约束同时收紧到了临界点。

第一条，能源价格。Transformer 是典型的大力出奇迹路线，每多一个参数、每多一个推理 Token，背后都是实打实的电表在转。全球数据中心的电价和用地成本从去年开始持续上扬，英伟达 H100、B200 这类高端卡供不应求，谁能拿到电、谁能拿到卡，直接决定了能卖多少个 Coding Plan。

第二条，算力供给。OpenAI 和 Anthropic 这类公司，本质是靠风投输血在赔钱卖 Token。用户用量越大，亏得越多。过去两年它们能维持 20 美元 Pro 的幻觉，是因为融资预期撑得住；现在融资环境一变，第一件要做的事就是把最贵、最不可控的那一批重度用户配额砍掉——KYC、限流、强制实名、区域性封禁，都是同一个逻辑的不同包装。

第三条，模型瓶颈。过去一年头部厂商的核心模型升级幅度越来越温和，真正让用户眼前一亮的创新几乎都来自工程层——各种 harness、各种编排框架、各种多 Agent 协作。这些工程创新的共同特征是：不降模型单价，靠更高的 Token 消耗换更好的输出。Anthropic 自己测试的数据里，上了 harness 的任务，Token 消耗比传统模式高几十倍。

三条线各自独立发作是小麻烦，三条线同时拉紧才是危机。对企业而言，它的直观体感和国家层面的能源安全高度同构：当你对某个战略物资的单一通道依赖度过高，这个通道一旦波动，整条业务链路就会立刻停摆。石油的命门，是一条狭窄的运输海峡；算力的命门，是一条狭窄的进口通道。两条通道的上游都攥在少数几只手里，只要上游稍一收紧，越靠下游的小玩家就越先停摆。

双账成本结构

破局第一步：把 AI 支出单独挪进水电科目

意识到危机之后，第一个要动的其实不是技术架构，而是账本的记法。

过去两年，大多数公司的 AI 支出被顺手塞进 IT 杂项或软件订阅费里，既没有独立预算，也没有独立考核。在包月红利时代这不是问题——反正一个账号 20 美元，一年封顶 240 美元，丢到哪个科目都不显眼。进入按量付费时代，这笔糊涂账会直接把你的成本中心炸掉。

正确的动作是把 AI 支出单独列为一个水电性科目，与水费、电费、带宽费、机房租金并列，每月单独出一张明细表。大公司由财务出一张报表，小公司老板自己在 Excel 或一本手账里记一页就够。这样做有三个立竿见影的好处：

高层第一时间感知到成本曲线的异常。当某个业务链路因为换了新模型、换了新 Agent 工具导致 Token 消耗突然翻倍时，财务报表上会立刻跳出红字，而不是被稀释在几十个软件订阅里等半年才被发现。

看清单位成本和市场比价。AI 账单浮出水面之后，你才能算清每一张订单、每一次客服对话、每一条商详到底烧了多少 Token、折合多少人民币，然后拿这个数字去比照 Sonnet、通义 Max、DeepSeek 的公开价位——哪条链路该从 Claude 换到通义、哪条链路可以直接降到 Haiku，才有判断依据。否则每次换模型都是凭直觉赌一把，既不知道省了多少，也不知道亏了多少。

倒逼业务线承担算力成本。水电费从来都是摊到各个业务单元的，AI 一旦进入水电科目，销售部、市场部、研发部、客服部用 AI 的 ROI 就会第一次被单独拎出来讨论。那些看起来很炫、但实际不产生营收的 AI 玩具，会在这一轮被自然淘汰掉。

破局第二步：成本锚定营收占比，而不是人头数

接下来要改的，是 AI 预算的定价锚点。

传统的 IT 预算逻辑是按人头买 license：100 人的公司买 100 个 Office、100 个 Zoom、100 个 CRM 座席。这套逻辑在按量付费的 Token 时代会被彻底碾碎。原因很简单：同样一个销售，一天可能只用 AI 写三封邮件，也可能驱动一整套 Agent 跑一整天的市场扫描——两种场景的 Token 消耗可以差一百倍以上。按人头预算意味着你永远在两个极端之间摇摆：要么预算严重不足、要么严重浪费。

更稳的锚点是年度营收占比。参考数据：大多数中型企业的 IT 总支出占营收的 2% 到 5%，其中 AI 这一部分未来两年会从不到 10% 提升到 20% 到 30%。换算下来，AI 支出占年度营收的合理区间大约在 0.4% 到 1.5%。

把这条红线写进预算制度，比去纠结到底买 Pro 还是 Max 套餐重要得多。具体做法是一张三栏表：

营收占比上限：给全公司 AI 支出定一个年度百分比上限，比如 1%。一旦累计烧超，所有非核心业务链路自动降级到 Sonnet 或国产主力模型。
业务线分账：把这个总预算按业务贡献分到各业务单元，让每个业务线自己对单位营收的 Token 消耗负责。
按量预警机制：给每条核心业务链路定一个单任务 Token 成本基准，一旦某周平均值突破 1.5 倍基准，系统自动报警并冻结进一步调用，由技术负责人复盘后才能解冻。

这套机制看起来繁琐，但它是你在 Opus 4.7 这类「单价不变、实付翻倍」的新常态下，唯一能防止账单失控的结构性工具。

一个具体的参考画面：某 200 人规模的 SaaS 公司，年营收 8000 万，AI 红线设 1%，也就是 80 万 / 年。拆下去，研发 30 万、客服 20 万、市场 15 万、销售 10 万、综合 5 万。客服业务链路跑在国产主力模型上，单任务 Token 基准 800；当系统监测到某一周均值跳到 1500 以上，自动冻结并推送复盘报告到技术负责人手机。简单、可执行、不依赖任何新工具，只要有预算条线和监控脚本就能跑起来。

再换一个更小的镜头：一家 5 人的跨境电商公司，年营收 500 万，AI 红线 1% 就是 5 万 / 年、每月 4000 块。这笔钱平分到选品、客服、翻译、投放四条线上，每条线月度上限 1000 元。某个月投放自动化 Agent 突然狂烧 Token，超过 1500 元立即停掉复盘——这就是小公司真正能救命的预算纪律，不需要任何财务系统，一张 Excel 加一个计量日志表就够了。

破局第三步：像中国对冲石油那样，搭一条多渠道算力供应链

多渠道算力供应链

成本结构理顺之后，下一个量级的动作是供应链安全。

中国之所以敢在霍尔木兹海峡之外谈能源安全，靠的不是某一种替代来源，而是中东、俄罗斯、中亚、非洲的多线进口叠加国内风光水核的新能源自给。任何一条通道被掐断，其余通道的冗余都能顶上来。企业级算力要做的是同一件事：把单一厂商依赖度拉到一个任何一家出事都打不倒主营业务的水平。

照这个逻辑去倒推，企业的算力供应链应该拆成三层结构：

境外进口层：Claude、Gemini、GPT 系列。这一层真正不可替代的是顶级编程能力、复杂 Agent 编排、前沿推理——这也是一人公司和独立开发者目前还离不开 Claude 和 GPT 的原因，你能用 20 美元扛起一个初级团队的活，靠的就是它。但它也是最容易被地缘政治、定价策略、KYC 审查扰动的通道。合理的定位是只留给真正硬骨头的核心任务，占比控制在总 Token 消耗的 30% 以内，剩下的全部往下迁。
国产自主层：通义、智谱、MiniMax、Kimi、豆包、DeepSeek。这一层是你的国产新能源，文档翻译、客服应答、商详文案、货运状态追踪这些中等难度的重复活，都该在这里跑。虽然顶级单点能力比美系差 10% 到 20%，但价格便宜、供给可预期、合规风险低。抗断供的战略价值，远高于账面评测分。合理占比 50% 到 60%。
开源应急层：Qwen、DeepSeek、Llama 这类开源模型。对大企业，值得投一台能跑 70B 量化版的 GPU 机器当应急发电机，硬件一次性投入几万到几十万，换来客服、内部问答、文档检索这些不能停的基础业务一定有兜底。对小微企业和一人公司，本地自建完全不必——硬件投入算不过账，运维也没人兜底。更明智的做法是用硅基流动、together.ai、火山方舟这类云上托管的开源模型 API 做第三通道，算力池是云厂商的、账单按 Token 付、随时可切。合理占比 10% 到 20%。

落地时的关键动作是绘制一张公司级的算力供应图谱：标注每一条核心业务目前依赖的厂商、国别、协议条款、以及过往的封号或限流历史。对单一厂商依赖度超过 60% 的业务链路，必须在未来 12 个月内安排第二路由；对单一国别依赖度超过 80% 的业务链路，必须安排国产或本地替代作为兜底。

更具体一点，给小微公司的场景：如果你做跨境，靠 GPT 在翻 Shopify 商详、写海外客户邮件，一次 KYC 封号就能让整个店铺哑火三天；正确的兜底是同一套 prompt 在通义 Max、DeepSeek-V3 上各跑一份影子流量，效果相差 10% 以内就能做无缝切换。如果你是一人公司开发者、所有代码都压在 Claude Code 上，注册个智谱 GLM Max 和 DeepSeek 账号、在 Cursor 里配好二通道，只是 30 分钟的事；但一旦你需要它的那天没配，损失的可能是一整个项目的交付期。

这不是民族主义，是最基本的商业常识。你的仓库不会把所有货都押在一个供应商身上，你的银行账户不会只开在一家银行，AI 算力没有理由例外。

过去二十年，做外贸的老板已经被一轮又一轮的汇率波动、关税战、航线中断训练出了一套成熟的供应商分级与备份机制。AI 算力只不过是刚刚从奢侈品滑入战略物资这一档的新来者。你对集装箱、对货源、对汇率的那一套冗余思路，原封不动套过来就够用。真正需要转的只有一个认知：AI 不再是技术部门自由采购的小硬件，而是老板必须亲自盯的战略性物资。

从今天起，立刻可做的三件事

危机已经明确，诊断也已经给出。剩下的只是老板愿不愿意在本周就动起来。最值得优先处理的三个动作：

本周内把 AI 支出从 IT 杂项里拆出来，单独列一个科目，让下个月就能看到第一张独立明细表——大公司让财务出报表，小公司自己在 Excel 或记账本里拉一页。这一步不花钱，但会让所有后续决策有数据底座。
本月内给 AI 支出定一条年度红线，用年度营收的 1% 做参考基准，上不封顶、下按业务线分账。把谁超标、谁复盘、谁审批的流程写进制度，别让这件事停在老板口头。
本季度内列出你的算力供应清单。大公司画一张核心链路×厂商×国别的供应图谱；小微公司和一人公司只要在纸上列下你当前在用的 3 款 AI 工具、各对应的厂商和国别就够了。对任何单一依赖度超过 60% 的关键链路，立刻注册一个替代账号配好二通道，不用上来就全量切换，但要在业务停摆的那一天你有备胎。

回头看真正的霍尔木兹海峡。每一次油轮被拦、管线被炸，最先崩盘的从来不是石油巨头。受伤的是印度——化肥原料断供，小农田下一季播种都成问题，饥荒阴影蔓延；是越南——加油站排出几公里长队，摩托车队伍里夹着等不起的小商贩；是日本——猪肉批发价一夜翻倍，家庭式自助餐馆只能把猪肉切薄到透光。

算力霍尔木兹的杀伤轨迹完全一样。大厂顶多是下次董事会多一张 PPT；被碾碎的会是那些把 Claude 当全能员工使的小微企业——客服机器人第一个掉线，报价自动化半夜停摆，跨境翻译延迟三天到不了客户邮箱，投放 Agent 集体罢工，运营 Agent 写了一半的文案卡在屏幕中间。你招不起这些人，现在又开始养不起这些 AI 替身。

包月红利的那扇门，不会再为任何一家公司敞开。大公司只是多一笔水电预算，小微企业和一人公司赌的是下一季度的生死。现在动手，你还握着主动权——选模型、选渠道、按自己的节奏定预算；再晚半年，是账单替你做选择——替你砍掉哪条业务线、裁掉哪个岗位，甚至替你决定这家公司还要不要继续开下去。