聚焦科学传播 弘扬科学精神
APP下载
扫码下载APP
融媒矩阵
  • 人民号
  • 科普号
  • 北京号
  • 微博号
  • 头条号
  • 腾讯号
  • 百度号
  • 央视频号
  • 抖音号
  • 微信号
QR Code
当前位置: 首页 科创关注 正文
“北京造”大模型GLM-4.5发布!性能领跑国产并主攻AI智能体
2025-07-30 来源:北京科技报 阅读量:41.4万

7月28日,北京智谱华章科技股份有限公司(以下简称“智谱”)发布其新一代旗舰级大模型GLM-4.5。该模型不仅在多项综合能力评测中居于国内首位,更将战略重点放在了驱动“AI智能体(Agent)”。

这款新模型的发布,代表了AI发展方向的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“AI员工”。例如,开发者仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可发弹幕的“B站”Demo,甚至是一个完整的“Flappy Bird”小游戏。

据了解,GLM-4.5之所以能实现如此性能,其核心在于采用了“混合专家(MoE)”架构。该架构可被理解为一个庞大的“智囊团”,在处理任务时,系统会智能地激活最相关的“专家”小组进行应对,而非调动全体资源。这使得模型在拥有3550亿总参数量的庞大规模以确保能力强大的同时,每次任务仅需激活320亿参数,从而大幅提升了运算效率并降低了成本。官方资料显示,GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现却更为出色。

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

对于开发者与企业而言,价格因素同样是关注焦点。其API(应用程序接口)调用价格低至输入0.8元/百万Tokens(约50万个汉字),输出2元/百万Tokens,远低于市场主流价格。同时,其高速版的生成速度实测超过100 tokens/秒,是许多主流模型速度的2-3倍,能有效保障用户交互的流畅性。

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。它的出现,有望大幅降低开发者和企业使用顶尖AI技术的门槛,催生出更多富有创意的AI智能体应用。

来源:北京科技报

撰文:记者 段大卫

典赞时刻·2024首都科普年度榜单发布
2024年我和妈妈学科学
医路·新青年:述说新时代首都青年医者故事
要闻关注
京华启新程——中国式现代化的首都示范
市属公园推出110余场活动,开启生物多样性保护科普宣传月
2025年度“中国科学十大进展”发布,4项涉及北京科研主体
北京昌平添沉浸式航天科普新地标
推荐阅读
超脑AI大模型驱动,京东“异狼”再添一臂
2026-03-30 网络
“京医千询”登顶医疗大模型榜单双料冠军 京东健康“AI+供应链”加速全场景落地
2026-03-27 网络
京东公布五项AI进展 开源大模型JoyAI-LLM Flash 并推出“龙虾天团”
2026-03-25 网络
京东智能客服斩获GSMA全球移动大奖 5G+JoyAI大模型融合创新获国际认可
2026-03-12 网络
QR Code
扫码分享当前页面