当AI能自己写代码、查资料、点鼠标时,我们还在问它“今天天气怎么样”。

OpenClaw 的浪潮下,Agent概念又一次提起,似乎我们所说的小龙虾,就是 Agent 的代名词。
刚接触AI时,一堆术语扑面而来:LLM、Chatbot、Agent。分不清?很正常。它们不是同一种东西,但许多人把它们混为一谈。
这篇文章不讲术语,只讲人话:LLM、Chatbot、Agent,到底有什么区别?它们是怎么一步步从“会说话”变成“能干活”的。
一、LLM
官方叫它“大语言模型”。简单说,它是个靠猜字写文章的机器。
1.1、工作原理
三步走:输入、预测、输出。
你问一句,它根据过去看过的所有文本,猜下一个字该是什么,再猜下一个,直到凑出一段话。

1.2、训练原理
它怎么学会的?分三步。
预训练
工程师把互联网上能抓到的文本——小说、论文、论坛、新闻——全喂给它。它不理解意思,只是记住哪些词常在一起。
指令微调
光会拼词不够。它分不清“你好”和“滚”哪个更合适。于是工程师给它看了成千上万组“好问题+好回答”,让它知道:什么叫得体,什么叫废话。
强化学习
接着,它被扔进一场持续考试。
你问一个问题,它给出五个答案。人工打分:这个好,那个烂。它记下哪些回答得分高,下次就多用。反复练,它慢慢知道:原来好回答要清晰、有逻辑、不胡扯。
这套训练方法,叫Transformer。不只是LLM,目前所有AI模型——画图的、剪视频的——背后都是它。

二、Chatbot
你用过的AI聊天窗口,都是Chatbot。
列如Gemini的网页界面:

2.1、Chatbot的三大护法
提示词
就是你输入的那句话。分两种:
- 系统提示词:后台写的“潜规则”,列如“你不能说政治”“语气要友善”。用户看不见。
- 用户提示词:你问的“今天几点下班?”
上下文
你和AI的对话历史,全塞进这一段里。你问“北京天气”,它答“25度”;你接着问“明天呢?”,它靠上下文知道你在问北京。
但上下文有长度限制。超过就截断。你得手动清空,或新开对话。
会话
每一次完整的对话,就是一个会话。你删掉它,历史就没了。AI不会记得你。

2.2、Chatbot是什么
三个组件:
- 界面:你看到的输入框和回复区
- 模型配置:用哪个LLM,温度设多少
- 会话管理:保存、切换、删除对话
它能聊,但不能动。你让它订机票,它只会说:“提议您打开携程。”
三、Agent
Chatbot缺手缺脚。Agent不一样——它有眼睛,有手,还能自己想办法。
3.1、工具调用原理
四步走:声明工具、模型决策、外部执行、整合结果。
声明工具
工程师给LLM一本“工具手册”:
- 名字:实时天气查询
- 功能:查某个城市的温度
- 要求:必须提供城市名
LLM不会联网,但知道:遇到天气问题,可以翻这本手册。
模型决策
你问:“深圳今天热吗?”
LLM一查:我知识库里没有实时数据。它翻工具手册:有“实时天气查询”。它提取关键词:“深圳”。然后生成指令:“请用‘实时天气查询’查深圳。”
外部执行
LLM不会点网页。但有个程序替它跑腿:
- 接到指令
- 打开气象网站,抓取数据
- 返回结果:{“温度”: “28度”, “天气”: “晴”}
整合结果
LLM拿到原始数据,润色成一句人话:
“深圳今天28度,晴空万里,出门记得防晒。”

3.2、Manus的工具设计
Manus不是广告,但它的确 把Agent做到了极致。
它的工具清单里有:
- 浏览网页
- 运行代码
- 读写文件
- 截图保存
它能自己搜资料、写报告、跑程序、存结果。不是调接口,是真在操作电脑。

3.3、Chatbot与Agent的区别
早年,区别很简单:会用工具的是Agent,不会的是Chatbot。
后来,Chatbot也能调工具了。界限模糊了。
真正的分水岭,是任务闭环能力。
Chatbot:你问“写个周报”,它写完就停。Agent:你问“调研深圳南山区低空经济,出份报告”,它会:
自主规划
拆解任务:
- 查政府官网政策
- 搜大疆、小鹏的公开数据
- 整理成PDF
它不等你一步步指挥,自己列清单。
环境操作
它能像人一样:
- 打开浏览器
- 点链接、翻页
- 遇到验证码,自己尝试绕过
- 把截图存进本地文件夹
不是调API,是真在操作电脑界面。
自我纠正
网页打不开?它不报错。
它会:
- 发现:链接404
- 调整:换关键词,去另一个网站
- 重试:直到拿到数据
这种“发现问题→想办法→再试”的循环,叫ReAct框架。它让Agent不再依赖完美指令,而是能自己把活干完。

3.4、常见的Agent
通用型
ClaudeCode、OpenClaw、Manus
垂直型
Lovart(设计)、Codex(编程)、Perplexity AI(研究)、Notion AI(文档)
3.5、Agent的未来
OpenClaw爆火,Manus抢码万人排队。人们说:AGI要来了。
AGI,就是能替你处理生活琐事的AI——订餐、写邮件、查机票、做PPT。
可现实是:
- 用一次成本高
- 许多网站它进不去
- 结果不稳定,今天能跑,明天就崩
另一方面,Lovart、Codex这些垂直Agent,已经在各自领域干得风生水起。设计、编程、写作、办公——旧互联网产品,正在被一个个重做。
但浪潮终会退去。
当Agent不再被当成“新奇功能”,而是默认的交互方式——就像今天没人再说“我用互联网”一样。
那时,Agent就不再是产品。
它成了软件本身。

