
中国首个在国产芯片上完成全程训练的多模态SOTA模型“GLM‑Image”,正式开源。
出品丨自主可控新鲜事
转载请注明出处
正文共1678,建议阅读时间3分钟
今天,智谱和华为搞了波大的:开源新一代图像生成模型GLM‑Image。
这则消息看似寻常,但其背后却蕴含着不同寻常的信号:该模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架,完成了从数据到训练的全流程。也就是说,这是中国首个在国产芯片上完成全程训练的多模态SOTA模型!

当前,正值美国政府批准英伟达重启对华出口其AI芯片H200的微妙时刻。智谱此次的发布,用实际成果展示了中国在高端AI算力领域已不再是单纯的“追赶者”。它提供了一个明确的信号:对于顶级模型而言,高端算力已不再是必须依赖进口的“卡脖子”命门。
就在GLM‑Image模型发布的前一天,国际科技博弈的棋盘上落下了一颗棋子。
当地时间1月13日,美国政府正式批准英伟达向中国出口其人工智能芯片H200。
这一决定被外界解读为美国在确保本土供应前提下,对华技术贸易的有限松动。根据相关规定,中国接收的芯片数量不得超过销往美国客户总量的50%,且在出货前需经第三方实验室审查。
此前,英伟达CEO黄仁勋曾在采访中坦言,如果英伟达永远不被允许在中国销售芯片,中国科技巨头华为将满足中国对AI芯片的需求。此番H200的解禁,被视为美国试图重返并重新占据中国巨大AI芯片市场的重要一步。
在这个微妙的时点上,智谱与华为的联合动作,被视为对“国产替代”命题最直接的回应。GLM‑Image并非简单地在国产硬件上“跑起来”,而是在全栈自主的算力底座上完成了从数据清洗、模型训练到最终推理的完整闭环。
模型采用了自主创新的「自回归+扩散解码器」混合架构,实现了图像生成与语言模型的深度融合。
更重要的是,官方介绍称,GLM‑Image是面向以Nano Banana Pro为代表的新一代「认知型生成」技术范式的重要探索。
这意味着模型不止于“看图说话”或“文生图”,而是向更高阶的、具备一定理解和推理能力的“认知型”生成迈进。这恰恰是当前全球AI竞赛的前沿方向。
据了解,GLM-Image一经发布便拿下了CVTG-2K(复杂视觉文字生成)和LongText-Bench(长文本渲染)双榜单的第一。不仅超越 Qwen-Image、Z-Image 达到开源SOTA水平,部分指标甚至超越了Nano Banana Pro。

过去,国产芯片和框架在AI领域的应用,常被冠以“可用”的标签,但距离支撑前沿模型的规模化训练和持续迭代,往往被认为尚有距离。GLM‑Image的成功实践,正在改变这一固有印象。
观察者网的实测报告指出,作为一款由纯国产芯片完成全流程训练的多模态模型,GLM‑Image在各类图片生成上均展现出不逊于行业头部的表现,且对中文场景的生成尤为擅长。


GLM-Image原生支持1024x1024至2048x2048的任意比例输出。智谱开放平台体验中心提供了10个尺寸的选项,可以适配各种类型的社交媒体平台。
在商业化层面,智谱公布的API调用价格极具竞争力,生成一张图片仅需0.1元,并预告了速度优化版本即将更新。
这标志着,基于国产全栈技术的AI模型,不仅在技术上可行,在商业成本和规模化应用上也具备了现实可能性。这为国产AI生态的独立、健康发展提供了关键范本。
国际业界对此次美国解禁H200的反应,普遍认为其象征意义大于实际影响。
科技市场研究公司Counterpoint Research的合伙人尼尔·沙阿对此评论道:“虽然此举重新打开了美国收入的大门,但战略列车已经驶离车站了。”
他所指的“战略列车”,正是中国坚定不移推动核心技术自主可控的长期趋势。美国消费者新闻与商业频道(CNBC)也指出,中国一直在努力摆脱对美国技术的依赖,并大力推动本土人工智能半导体发展。
GLM‑Image的诞生,正是这趟“战略列车”驶过的一个重要里程碑。它证明了,即便在最考验算力与算法协同的顶级多模态模型领域,中国也已具备了不依赖外部供应链的完整研发能力。
对于美国解禁H200芯片的举动,英伟达首席执行官黄仁勋早前就曾承认,华为的AI芯片产品可能与英伟达的H200相当。如今,这句话正在以超出预期的速度变成现实。
当GLM‑Image的模型权重在开源社区公开发布,它所释放的信号远不止于一个强大的图像生成工具。它更像一枚精确制导的“认知炸弹”,宣告了一个新时代的开启——在这个时代里,中国顶级AI模型的训练,将不再需要等待大洋彼岸的“通行证”。





免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。

