GLM-4与AutoGLM:从对话到行动
2025年,大模型竞争进入新阶段:从”能说会道”到”能做事情”。智谱AI这一年推出了GLM-4和AutoGLM,完成了从对话AI到智能体(Agent)的关键跨越。
对话的瓶颈
2024年之前,大模型的核心能力是”对话”。
你问问题,它回答;你给指令,它生成内容。无论是ChatGPT、文心一言,还是智谱清言,本质上都是”聊天机器人”。
但用户很快发现了一个问题:聊天很爽,但做不了事。
“帮我订一张明天上午10点北京到上海的机票。”
大模型可以回答”好的,我来帮你”,但它真的能订吗?不能。它没有订票系统的权限,也没有操作接口的能力。
“帮我生成一份周报,并发送给团队。”
大模型可以生成周报内容,但它真的能发送吗?不能。它没有邮件系统的访问权限。
这就是”对话AI”的瓶颈:能理解、能生成,但无法执行。
2025年,这个瓶颈到了必须突破的时候。
AutoGLM的诞生:能行动的AI
2025年3月31日,智谱发布了一个新产品:AutoGLM。
名字里的”Auto”,就是答案——自动执行。
AutoGLM不是聊天机器人,而是”智能体”(Agent)。它不仅理解你的需求,还能真的去执行:打开App、点击按钮、填写表单、完成任务。
你可以对它说:
– “帮我点外卖,要麻辣烫,加两份牛肉”
– “帮我订一张周末的机票”
– “帮我在闲鱼上发布一个二手商品”
AutoGLM会自动打开对应的App,模拟人类操作,完成任务。
这不是科幻,是2025年就能用到的技术。
技术原理:屏幕理解与操作
AutoGLM的核心技术,是”屏幕理解+自动操作”。
当你给AutoGLM一个任务时,它会:
1. **识别你的意图**:理解你要做什么(点外卖、订票、发布商品)
2. **分析屏幕界面**:识别当前显示的App、按钮、输入框
3. **规划操作步骤**:确定先点击什么,后输入什么
4. **执行操作**:模拟人类点击、滑动、输入
5. **确认结果**:检查任务是否完成,是否需要重试
整个过程,AutoGLM就像一个”看不见的助手”,在手机屏幕上帮你操作。
2025年6月,智谱开源了AutoGLM的框架,不到24小时就斩获1700+Star。开发者们惊呼:这才是真正的智能体。
GLM-4:更强的基座
AutoGLM的成功,背后是GLM-4的强劲支撑。
GLM-4是智谱在2025年推出的新一代基座模型,参数量、推理能力、多模态处理,都比GLM-3提升显著。
但更重大的是,GLM-4是”为智能体而设计”的模型:
– **更强的规划能力**:能把复杂任务拆解成可执行的步骤
– **更强的理解能力**:能理解App界面、表格、文档中的信息
– **更强的决策能力**:能根据情况调整策略,处理意外情况
– **更强的记忆能力**:能记住之前的对话和操作,保持上下文连贯
这些能力,让GLM-4成为AutoGLM的”大脑”。
2025年3月31日:历史性的一天
2025年3月31日,是AutoGLM的发布日,也是智谱AI的重大里程碑。
这一天,智谱宣布:AutoGLM成为全球首个”免费可用的智能Agent产品”。
在此之前,智能体产品要么是闭源付费的(列如OpenAI的GPTs),要么是实验性质的不稳定版本。AutoGLM是第一个真正开放给大众使用的智能体。
开发者可以下载AutoGLM框架,在自己的应用里集成智能体功能。
企业客户可以用AutoGLM打造自己的”AI员工”——列如客服、销售、运营。
普通用户可以用智谱清言App,体验AutoGLM的自动化功能。
“智能体时代,从今天开始。”
这是智谱的宣传语,但也是实际。
竞争:谁先跨过智能体的门槛
2025年,大模型公司都在布局智能体:
– **OpenAI**:推出GPTs,让用户可以创建定制化的智能体,但需要付费
– **MiniMax**:发布Talkie智能体,主打社交场景
– **月之暗面**:在Kimi中嵌入智能体功能,支持多步任务
– **阿里云、百度云**:推出企业级智能体平台
但智谱的AutoGLM有几个独特优势:
1. **开源免费**:其他公司的智能体是闭源付费的,AutoGLM是开源免费的,开发者门槛低
2. **手机端支持**:AutoGLM支持Android系统,能直接操作手机App,这是许多竞品做不到的
3. **中文优化**:针对中文应用场景优化,能识别微信、支付宝、美团等主流App
4. **学术背书**:智谱的清华背景,让企业客户更信任其技术可靠性
2025年的进展
AutoGLM发布后,智谱在2025年持续迭代:
– **6月**:AutoGLM 2.0发布,支持更复杂的任务规划,支持50+主流中文App
– **9月**:推出AutoGLM-Phone-9B,专为手机端优化的轻量级模型
– **12月**:企业版AutoGLM上线,支持私有化部署,满足企业数据安全需求
同时,GLM-4也在不断升级:
– GLM-4-9B开源,成为开发者社区的热门模型
– GLM-4-Plus通过生成式人工智能服务备案,正式商用
– GLM-4-Long推出,支持超长上下文,处理长文档、长对话
2025年底,智谱的智能体生态已经成型:
– 下载量:AutoGLM框架下载超过50万次
– 应用数:基于AutoGLM的应用超过5000个
– 企业客户:使用AutoGLM的企业超过2000家
从对话到行动的意义
为什么”从对话到行动”如此重大?
由于AI的终极目标,不是陪人聊天,而是帮人做事。
2025年之前,大模型是”工具”——你需要主动调用它,让它生成内容。
2025年之后,大模型是”助手”——它能主动帮你完成任务,减少你的操作成本。
这是一个质的跨越。
想象一下未来的场景:
– 你早上醒来,AutoGLM已经帮你订好了早餐
– 你开会时,AutoGLM自动记录会议纪要,并发送团队
– 你下班前,AutoGLM自动整理了今天的邮件,标注了重大事项
– 你周末旅行,AutoGLM自动规划路线、订酒店、买门票
这不是科幻,是智谱正在做的未来。
技术积累:不是一蹴而就
AutoGLM的成功,不是一夜之间的奇迹,而是多年技术积累的结果:
– **2019-2020**:GLM-1的”双向注意力+自回归”架构,为智能体打下了技术基础
– **2020-2022**:GLM-2、GLM-3的持续迭代,提升了模型的理解和推理能力
– **2023**:ChatGLM的开源,积累了大量中文对话数据
– **2024**:开源生态的建立,让智谱了解了开发者的真实需求
– **2025**:GLM-4的发布,实现了”从对话到行动”的跨越
六年时间,智谱一步步走到今天。
下一场硬仗
GLM-4和AutoGLM的成功,让智谱在2025年成为了”智能体赛道”的领先者。
但下一场硬仗已经来了:
– **如何让智能体更稳定?** 目前的AutoGLM,有时会识别错按钮、操作错误,需要重试
– **如何让智能体更安全?** 自动操作App,可能误触敏感功能,需要严格的安全控制
– **如何让智能体更机智?** 复杂任务需要更强的规划能力,这需要更大的模型、更多的算力
– **如何让智能体更便宜?** 智能体运行成本高,企业客户可能用不起
这些问题的答案,智谱还在探索。
六年后的回望
站在2026年,回望GLM-4和AutoGLM的发布,它们是智谱AI历史上的重大节点:
– **GLM-4**:智谱基座模型的巅峰,为智能体提供了强劲的技术支撑
– **AutoGLM**:智谱从”对话AI”到”行动AI”的跨越,打开了智能体时代的大门
2025年3月31日,AutoGLM发布的那一天,可能不会像ChatGLM发布那样被广泛记住。但多年后,当智能体成为AI的主流形态时,人们会发现:那是一个时代的起点。
—
*上一篇:开源才是护城河(2023-2024)*
*下一篇:全球大模型第一股(2026年1月港交所)*
智谱AI 编年体系列 · 2026年3月


