从道歉到全量开放只用4个月:智谱GLM-5.2背后的芯片账和定价暴力
从道歉到全量开放只用4个月:智谱GLM-5.2背后的芯片账和定价暴力 今年2月,智谱发了一封公开道歉信。 "流量超出预期,扩容节奏没有跟上。"GLM-5发布后用户涌入太猛,他们不得不把模型按Max→Pro→Lite的顺序逐步开放,先给付费用户,再慢慢放开免费层。那封信读起来有点尴尬——一个AI公司,因为自己的模型太受欢

今年2月,智谱发了一封公开道歉信。
"流量超出预期,扩容节奏没有跟上。"GLM-5发布后用户涌入太猛,他们不得不把模型按Max→Pro→Lite的顺序逐步开放,先给付费用户,再慢慢放开免费层。那封信读起来有点尴尬——一个AI公司,因为自己的模型太受欢迎而道歉。
4个月后,GLM-5.2全量开放。
没有分阶段,没有排队,没有"先到先得"。Lite、Pro、Max三个Coding Plan套餐,全部支持最新模型。从道歉到全量铺开,智谱只用了不到4个月。
我打开定价页,盯着那个数字看了好几秒。
Lite套餐,49元/月。Pro套餐,149元/月。Max套餐,469元/月。三个档位,全部包含GLM-5.2。
做一下除法。49元约合7美元。Claude Pro每月20美元,约145元。GLM Lite的价格是Claude的三分之一,但用量是Claude的3倍以上。Pro档149元,和Claude Pro几乎同价,但GLM给你的额度远多于此。

我试了一下GLM-5.2。打开编辑器,模型选择列表里它排在第一个。写一个React组件,它能准确理解上下文——上文提到的变量名、组件结构、甚至注释里随口写的TODO,它都记得。生成的代码基本可用,偶尔有个小细节需要手动调。
这不是玩具。
在SWE-bench Pro这个测试编程能力的基准上,GLM-5.1拿了45.3分,Claude Opus 4.6是47.9分。差2.6分。而GLM-5.2在GLM-5.1基础上又做了优化,智谱官方说"整体表现对标Claude Opus 4.6"。
更值得注意的是另一个数字:8小时。GLM-5.1是唯一一个在SWE-bench Pro上达到8小时级持续工作的开源模型。不是生成一段代码然后卡住,是真的能像程序员一样坐下来,持续推进一个真实软件开发任务。排在它前面的全是闭源模型。

这让我开始算另一笔账。
智谱的GLM-5系列,全部基于华为昇腾芯片训练。744B参数的MoE架构,全部跑在国产芯片上。美国实体清单从2025年1月就把智谱列入了,禁止向他们提供H100和H200 GPU。10万块昇腾芯片,训练出了一个在编程能力上逼近全球顶尖的模型。
这意味着什么?49元的月费不是赔本赚吆喝。国产芯片的训练成本比英伟达方案低一大截,这个成本优势直接体现在了终端定价上。智谱不是在补贴用户,是用成本结构碾压。
这才是真正的定价暴力:当你的训练成本比竞争对手低,你就有空间用价格锁死整个开发者生态。49元/月,所有套餐支持前沿模型——用的人越多,生态越厚,迁移成本越高。

但Reddit上有人泼冷水。
一位用户反馈,Coding Plan套餐的输出质量和按量计费接口有差距。"套餐输出与按量计费输出的品质差异非常大。"还有人注意到GLM-5.1调用时按"高峰期3倍、非高峰期2倍"消耗额度——标价49元,实际成本可能更高。

智谱从道歉到全量开放只用了4个月。49元的月费背后,是芯片自主化在改写AI定价的底层逻辑。但低价能持续多久、套餐质量能否跟上按量计费——这些问题,49元套餐页上没写。