返回洞察
企业AI化实战2026-04-23· Akumas

算力霍尔木兹:别再盯订阅了,AI 早该挪进你的水电科目

包月红利正在全球同步关闸。与其在订阅市场反复挑品牌,不如把 AI 算力当成水电费重编预算,并像对冲石油通道那样搭一套多渠道、国产自主的算力供应链。

分享文章

四十天内,全球 AI 订阅市场同步塌房

2026 年 4 月 21 日下午,Anthropic 在定价页面悄悄把 Claude Code 从 20 美元的 Pro 套餐里剥离了一次。消息在 Reddit 和 X 上扩散后不到 24 小时又匆匆放回,但这只放飞 24 小时的测试气球,已经把所有付费开发者炸出了冷汗。

往前推一个多月。3 月 18 日,Google 的 Gemini CLI 团队在 GitHub 发了一则服务更新公告:从 3 月 25 日起,Gemini Pro 系列模型不再向免费用户开放,免费账号只能用 Flash;付费账号之间也要按 license 等级分配流量优先级。那条公告下面,社区留下了 917 个踩、131 个赞——接近 7 比 1 的差评。

再把镜头转回国内。智谱的 GLM Coding Plan 每天上午 10 点准时限量放号,晚一秒就只能第二天再抢;闲鱼上代抢服务的叫价从 100 元一路爬到 300 元以上,成了程序员之间半公开的段子。4 月 12 日,阿里云官方宣布:百炼旗下性价比最高的 Coding Plan Lite 基础版——原价 40 元 / 月、每月 18000 次请求——于 4 月 13 日 18 时起停止续费与升级;更早的 3 月 20 日,它就已经停止接受新购。新用户现在只能直接买 Pro 版——200 元 / 月,整整贵 5 倍。

再加上字节火山引擎 4 月把 GLM-5.1 接进来之后频繁卡死,用户连成功发起一次推理都费劲;Anthropic 对中国大陆账号的 KYC 审查一轮紧过一轮,大量 Pro 订阅被直接封停;就连最顶级的 Gemini Ultra 250 美元 / 月订阅,用户在 Reddit 和 Google 支持社区里排队反馈「high traffic」错误已经持续一个多月。

四十天,六家头部厂商,六种不同的动作,指向同一个结论:那个你用 20 美元就能敞开调用全球顶级模型的包月红利窗口,正在被全球同步关闸。 你手上那一堆花花绿绿的 Coding Plan 订阅账号,已经凑不出一个能让全公司放心用的稳定算力通道了。

真正被这轮洗牌率先碾过去的不是大公司。大公司有预算切换厂商、有法务谈合约、有 IT 团队做迁移,断供对他们只是多一个 PPT 议题。真正最先挨刀的,是那些已经把 AI 当做第 11 个员工、第 12 个客服、第 13 个运营来使唤的小微企业和一人公司。过去半年你靠 Claude 一个人扛下一个小团队的活,现在这套战术的底层算力突然开始断供、限流、涨价。对大厂是大会议题,对你是现金流的生死线。

真正值得警惕的不是下架,是 Opus 4.7 悄悄翻的那一倍账单

下架 Claude Code 这种事件看起来惊悚,但它本质只是定价表层的操作,厂商今天拿走、明天可能就还你。真正应该让老板后背发凉的,是同一家公司 4 月发布的 Opus 4.7。

Anthropic 的官方定价表上,Opus 4.7 和它的前代 4.6 维持完全一致的标价:输入 5 美元 / 百万 Token、输出 25 美元 / 百万 Token。看起来什么都没发生。但翻开工程细节会发现,Opus 4.7 换了一套全新的分词器,同一段代码、同一份结构化数据、同一段中文文本,在新分词器下会被切成最多多出 35% 的 Token

第三方成本分析机构 Finout 给出的样板计算一目了然:一个日均 100 万输入 Token、20 万输出 Token 的标准编程代理,在 Opus 4.6 上月度消耗约 300 美元;同样的工作量迁移到 4.7,因为分词器膨胀,月度成本会抬到 405 美元。同样一份活,同样的产出,账单多交 35%。

更极端的是 Finout 给出的第三档场景:一个跑自主化软件工程代理的团队,日均 1000 万输入、200 万输出 Token,不开缓存折扣的情况下月度开销从 3000 美元直接跃至 4050 美元,一个月多烧出一台中高配笔记本的钱。走 batch 异步通道能打五折、走 prompt caching 能打一折,但这些优惠都是工程团队的活,而不是 CEO 签字就能解决的。

Opus 4.7 并不是孤例,它是一个信号:当模型本身的智力边际收益开始变钝,厂商会被迫把 agentic harness 那一套工程外挂塞进基础模型里去赢得跑分。 跑分是赢了,但 Token 消耗按几倍甚至几十倍的速度跳升,单价不动、实付翻倍。你看到的账单涨幅和你看到的价格表,彻底脱钩了。

Anthropic 自家的 Sonnet 4.6 在输入、输出两端都比 Opus 便宜四成,能覆盖大部分 RAG 和内容生成场景;Haiku 4.5 在高频、低延迟的分类和路由任务上单价只有 Opus 的五分之一。但大多数企业当前是一股脑把所有活都丢给 Opus——这就是典型的屠龙刀杀鸡,也是企业 AI 账单里被忽略最久的一处漏洞。

真正的地雷埋得更深——过去三年企业主习惯了单价逐月下降的心智模型,所以不太在意 AI 预算有没有上限。从 Opus 4.7 开始,单价那一栏可能永远不动,但同一个业务动作的 Token 消耗会持续膨胀。对大厂这是下一次预算会的议题;对那些用 AI 省下了两三个人头的小公司,这 35% 直接吃掉你的利润。过去一年你靠自动化省下来的人力成本,会被单价不动、Token 膨胀的账单逐月啃回去。

算力霍尔木兹:三条死线同时收紧

把上面两幕连起来看,就是一张非常清晰的结构图。这一轮并不是某家厂商经营不善,而是三条底层约束同时收紧到了临界点。

第一条,能源价格。Transformer 是典型的大力出奇迹路线,每多一个参数、每多一个推理 Token,背后都是实打实的电表在转。全球数据中心的电价和用地成本从去年开始持续上扬,英伟达 H100、B200 这类高端卡供不应求,谁能拿到电、谁能拿到卡,直接决定了能卖多少个 Coding Plan。

第二条,算力供给。OpenAI 和 Anthropic 这类公司,本质是靠风投输血在赔钱卖 Token。用户用量越大,亏得越多。过去两年它们能维持 20 美元 Pro 的幻觉,是因为融资预期撑得住;现在融资环境一变,第一件要做的事就是把最贵、最不可控的那一批重度用户配额砍掉——KYC、限流、强制实名、区域性封禁,都是同一个逻辑的不同包装。

第三条,模型瓶颈。过去一年头部厂商的核心模型升级幅度越来越温和,真正让用户眼前一亮的创新几乎都来自工程层——各种 harness、各种编排框架、各种多 Agent 协作。这些工程创新的共同特征是:不降模型单价,靠更高的 Token 消耗换更好的输出。Anthropic 自己测试的数据里,上了 harness 的任务,Token 消耗比传统模式高几十倍。

三条线各自独立发作是小麻烦,三条线同时拉紧才是危机。对企业而言,它的直观体感和国家层面的能源安全高度同构:当你对某个战略物资的单一通道依赖度过高,这个通道一旦波动,整条业务链路就会立刻停摆。石油的命门,是一条狭窄的运输海峡;算力的命门,是一条狭窄的进口通道。两条通道的上游都攥在少数几只手里,只要上游稍一收紧,越靠下游的小玩家就越先停摆。

双账成本结构

破局第一步:把 AI 支出单独挪进水电科目

意识到危机之后,第一个要动的其实不是技术架构,而是账本的记法

过去两年,大多数公司的 AI 支出被顺手塞进 IT 杂项或软件订阅费里,既没有独立预算,也没有独立考核。在包月红利时代这不是问题——反正一个账号 20 美元,一年封顶 240 美元,丢到哪个科目都不显眼。进入按量付费时代,这笔糊涂账会直接把你的成本中心炸掉。

正确的动作是把 AI 支出单独列为一个水电性科目,与水费、电费、带宽费、机房租金并列,每月单独出一张明细表。大公司由财务出一张报表,小公司老板自己在 Excel 或一本手账里记一页就够。这样做有三个立竿见影的好处:

高层第一时间感知到成本曲线的异常。当某个业务链路因为换了新模型、换了新 Agent 工具导致 Token 消耗突然翻倍时,财务报表上会立刻跳出红字,而不是被稀释在几十个软件订阅里等半年才被发现。

看清单位成本和市场比价。AI 账单浮出水面之后,你才能算清每一张订单、每一次客服对话、每一条商详到底烧了多少 Token、折合多少人民币,然后拿这个数字去比照 Sonnet、通义 Max、DeepSeek 的公开价位——哪条链路该从 Claude 换到通义、哪条链路可以直接降到 Haiku,才有判断依据。否则每次换模型都是凭直觉赌一把,既不知道省了多少,也不知道亏了多少。

倒逼业务线承担算力成本。水电费从来都是摊到各个业务单元的,AI 一旦进入水电科目,销售部、市场部、研发部、客服部用 AI 的 ROI 就会第一次被单独拎出来讨论。那些看起来很炫、但实际不产生营收的 AI 玩具,会在这一轮被自然淘汰掉。

破局第二步:成本锚定营收占比,而不是人头数

接下来要改的,是 AI 预算的定价锚点

传统的 IT 预算逻辑是按人头买 license:100 人的公司买 100 个 Office、100 个 Zoom、100 个 CRM 座席。这套逻辑在按量付费的 Token 时代会被彻底碾碎。原因很简单:同样一个销售,一天可能只用 AI 写三封邮件,也可能驱动一整套 Agent 跑一整天的市场扫描——两种场景的 Token 消耗可以差一百倍以上。按人头预算意味着你永远在两个极端之间摇摆:要么预算严重不足、要么严重浪费。

更稳的锚点是年度营收占比。参考数据:大多数中型企业的 IT 总支出占营收的 2% 到 5%,其中 AI 这一部分未来两年会从不到 10% 提升到 20% 到 30%。换算下来,AI 支出占年度营收的合理区间大约在 0.4% 到 1.5%。

把这条红线写进预算制度,比去纠结到底买 Pro 还是 Max 套餐重要得多。具体做法是一张三栏表:

  • 营收占比上限:给全公司 AI 支出定一个年度百分比上限,比如 1%。一旦累计烧超,所有非核心业务链路自动降级到 Sonnet 或国产主力模型。
  • 业务线分账:把这个总预算按业务贡献分到各业务单元,让每个业务线自己对单位营收的 Token 消耗负责。
  • 按量预警机制:给每条核心业务链路定一个单任务 Token 成本基准,一旦某周平均值突破 1.5 倍基准,系统自动报警并冻结进一步调用,由技术负责人复盘后才能解冻。

这套机制看起来繁琐,但它是你在 Opus 4.7 这类「单价不变、实付翻倍」的新常态下,唯一能防止账单失控的结构性工具。

一个具体的参考画面:某 200 人规模的 SaaS 公司,年营收 8000 万,AI 红线设 1%,也就是 80 万 / 年。拆下去,研发 30 万、客服 20 万、市场 15 万、销售 10 万、综合 5 万。客服业务链路跑在国产主力模型上,单任务 Token 基准 800;当系统监测到某一周均值跳到 1500 以上,自动冻结并推送复盘报告到技术负责人手机。简单、可执行、不依赖任何新工具,只要有预算条线和监控脚本就能跑起来。

再换一个更小的镜头:一家 5 人的跨境电商公司,年营收 500 万,AI 红线 1% 就是 5 万 / 年、每月 4000 块。这笔钱平分到选品、客服、翻译、投放四条线上,每条线月度上限 1000 元。某个月投放自动化 Agent 突然狂烧 Token,超过 1500 元立即停掉复盘——这就是小公司真正能救命的预算纪律,不需要任何财务系统,一张 Excel 加一个计量日志表就够了。

破局第三步:像中国对冲石油那样,搭一条多渠道算力供应链

多渠道算力供应链

成本结构理顺之后,下一个量级的动作是供应链安全

中国之所以敢在霍尔木兹海峡之外谈能源安全,靠的不是某一种替代来源,而是中东、俄罗斯、中亚、非洲的多线进口叠加国内风光水核的新能源自给。任何一条通道被掐断,其余通道的冗余都能顶上来。企业级算力要做的是同一件事:把单一厂商依赖度拉到一个任何一家出事都打不倒主营业务的水平

照这个逻辑去倒推,企业的算力供应链应该拆成三层结构:

  • 境外进口层:Claude、Gemini、GPT 系列。这一层真正不可替代的是顶级编程能力、复杂 Agent 编排、前沿推理——这也是一人公司和独立开发者目前还离不开 Claude 和 GPT 的原因,你能用 20 美元扛起一个初级团队的活,靠的就是它。但它也是最容易被地缘政治、定价策略、KYC 审查扰动的通道。合理的定位是只留给真正硬骨头的核心任务,占比控制在总 Token 消耗的 30% 以内,剩下的全部往下迁。
  • 国产自主层:通义、智谱、MiniMax、Kimi、豆包、DeepSeek。这一层是你的国产新能源,文档翻译、客服应答、商详文案、货运状态追踪这些中等难度的重复活,都该在这里跑。虽然顶级单点能力比美系差 10% 到 20%,但价格便宜、供给可预期、合规风险低。抗断供的战略价值,远高于账面评测分。合理占比 50% 到 60%。
  • 开源应急层:Qwen、DeepSeek、Llama 这类开源模型。对大企业,值得投一台能跑 70B 量化版的 GPU 机器当应急发电机,硬件一次性投入几万到几十万,换来客服、内部问答、文档检索这些不能停的基础业务一定有兜底。对小微企业和一人公司,本地自建完全不必——硬件投入算不过账,运维也没人兜底。更明智的做法是用硅基流动、together.ai、火山方舟这类云上托管的开源模型 API 做第三通道,算力池是云厂商的、账单按 Token 付、随时可切。合理占比 10% 到 20%。

落地时的关键动作是绘制一张公司级的算力供应图谱:标注每一条核心业务目前依赖的厂商、国别、协议条款、以及过往的封号或限流历史。对单一厂商依赖度超过 60% 的业务链路,必须在未来 12 个月内安排第二路由;对单一国别依赖度超过 80% 的业务链路,必须安排国产或本地替代作为兜底。

更具体一点,给小微公司的场景:如果你做跨境,靠 GPT 在翻 Shopify 商详、写海外客户邮件,一次 KYC 封号就能让整个店铺哑火三天;正确的兜底是同一套 prompt 在通义 Max、DeepSeek-V3 上各跑一份影子流量,效果相差 10% 以内就能做无缝切换。如果你是一人公司开发者、所有代码都压在 Claude Code 上,注册个智谱 GLM Max 和 DeepSeek 账号、在 Cursor 里配好二通道,只是 30 分钟的事;但一旦你需要它的那天没配,损失的可能是一整个项目的交付期。

这不是民族主义,是最基本的商业常识。你的仓库不会把所有货都押在一个供应商身上,你的银行账户不会只开在一家银行,AI 算力没有理由例外。

过去二十年,做外贸的老板已经被一轮又一轮的汇率波动、关税战、航线中断训练出了一套成熟的供应商分级与备份机制。AI 算力只不过是刚刚从奢侈品滑入战略物资这一档的新来者。你对集装箱、对货源、对汇率的那一套冗余思路,原封不动套过来就够用。真正需要转的只有一个认知:AI 不再是技术部门自由采购的小硬件,而是老板必须亲自盯的战略性物资。

从今天起,立刻可做的三件事

危机已经明确,诊断也已经给出。剩下的只是老板愿不愿意在本周就动起来。最值得优先处理的三个动作:

  • 本周内把 AI 支出从 IT 杂项里拆出来,单独列一个科目,让下个月就能看到第一张独立明细表——大公司让财务出报表,小公司自己在 Excel 或记账本里拉一页。这一步不花钱,但会让所有后续决策有数据底座。
  • 本月内给 AI 支出定一条年度红线,用年度营收的 1% 做参考基准,上不封顶、下按业务线分账。把谁超标、谁复盘、谁审批的流程写进制度,别让这件事停在老板口头。
  • 本季度内列出你的算力供应清单。大公司画一张核心链路×厂商×国别的供应图谱;小微公司和一人公司只要在纸上列下你当前在用的 3 款 AI 工具、各对应的厂商和国别就够了。对任何单一依赖度超过 60% 的关键链路,立刻注册一个替代账号配好二通道,不用上来就全量切换,但要在业务停摆的那一天你有备胎。

回头看真正的霍尔木兹海峡。每一次油轮被拦、管线被炸,最先崩盘的从来不是石油巨头。受伤的是印度——化肥原料断供,小农田下一季播种都成问题,饥荒阴影蔓延;是越南——加油站排出几公里长队,摩托车队伍里夹着等不起的小商贩;是日本——猪肉批发价一夜翻倍,家庭式自助餐馆只能把猪肉切薄到透光。

算力霍尔木兹的杀伤轨迹完全一样。大厂顶多是下次董事会多一张 PPT;被碾碎的会是那些把 Claude 当全能员工使的小微企业——客服机器人第一个掉线,报价自动化半夜停摆,跨境翻译延迟三天到不了客户邮箱,投放 Agent 集体罢工,运营 Agent 写了一半的文案卡在屏幕中间。你招不起这些人,现在又开始养不起这些 AI 替身。

包月红利的那扇门,不会再为任何一家公司敞开。大公司只是多一笔水电预算,小微企业和一人公司赌的是下一季度的生死。现在动手,你还握着主动权——选模型、选渠道、按自己的节奏定预算;再晚半年,是账单替你做选择——替你砍掉哪条业务线、裁掉哪个岗位,甚至替你决定这家公司还要不要继续开下去。

需要专业的技术诊断?

预约一次免费的IT健康度评估,让我帮您识别潜在的技术风险和优化机会。

预约免费诊断