从道歉到全量开放只用4个月：智谱GLM-5.2背后的芯片账和定价暴力

今年2月，智谱发了一封公开道歉信。

"流量超出预期，扩容节奏没有跟上。"GLM-5发布后用户涌入太猛，他们不得不把模型按Max→Pro→Lite的顺序逐步开放，先给付费用户，再慢慢放开免费层。那封信读起来有点尴尬——一个AI公司，因为自己的模型太受欢迎而道歉。

4个月后，GLM-5.2全量开放。

没有分阶段，没有排队，没有"先到先得"。Lite、Pro、Max三个Coding Plan套餐，全部支持最新模型。从道歉到全量铺开，智谱只用了不到4个月。

我打开定价页，盯着那个数字看了好几秒。

Lite套餐，49元/月。Pro套餐，149元/月。Max套餐，469元/月。三个档位，全部包含GLM-5.2。

做一下除法。49元约合7美元。Claude Pro每月20美元，约145元。GLM Lite的价格是Claude的三分之一，但用量是Claude的3倍以上。Pro档149元，和Claude Pro几乎同价，但GLM给你的额度远多于此。

价格天平：49元 vs 美元定价的不对称价值

我试了一下GLM-5.2。打开编辑器，模型选择列表里它排在第一个。写一个React组件，它能准确理解上下文——上文提到的变量名、组件结构、甚至注释里随口写的TODO，它都记得。生成的代码基本可用，偶尔有个小细节需要手动调。

这不是玩具。

在SWE-bench Pro这个测试编程能力的基准上，GLM-5.1拿了45.3分，Claude Opus 4.6是47.9分。差2.6分。而GLM-5.2在GLM-5.1基础上又做了优化，智谱官方说"整体表现对标Claude Opus 4.6"。

更值得注意的是另一个数字：8小时。GLM-5.1是唯一一个在SWE-bench Pro上达到8小时级持续工作的开源模型。不是生成一段代码然后卡住，是真的能像程序员一样坐下来，持续推进一个真实软件开发任务。排在它前面的全是闭源模型。

8小时持续编码：开源模型的耐力马拉松

这让我开始算另一笔账。

智谱的GLM-5系列，全部基于华为昇腾芯片训练。744B参数的MoE架构，全部跑在国产芯片上。美国实体清单从2025年1月就把智谱列入了，禁止向他们提供H100和H200 GPU。10万块昇腾芯片，训练出了一个在编程能力上逼近全球顶尖的模型。

这意味着什么？49元的月费不是赔本赚吆喝。国产芯片的训练成本比英伟达方案低一大截，这个成本优势直接体现在了终端定价上。智谱不是在补贴用户，是用成本结构碾压。

这才是真正的定价暴力：当你的训练成本比竞争对手低，你就有空间用价格锁死整个开发者生态。49元/月，所有套餐支持前沿模型——用的人越多，生态越厚，迁移成本越高。

从芯片到模型：国产硬件驱动的成本优势链条

但Reddit上有人泼冷水。

一位用户反馈，Coding Plan套餐的输出质量和按量计费接口有差距。"套餐输出与按量计费输出的品质差异非常大。"还有人注意到GLM-5.1调用时按"高峰期3倍、非高峰期2倍"消耗额度——标价49元，实际成本可能更高。

冰山之下：49元套餐表面之下的隐藏消耗

智谱从道歉到全量开放只用了4个月。49元的月费背后，是芯片自主化在改写AI定价的底层逻辑。但低价能持续多久、套餐质量能否跟上按量计费——这些问题，49元套餐页上没写。

不错过下一篇