本文主要补充主流的智能体工具有哪些,智能体工具不是代码框架,是每个人都可上手使用的工具。
COZE
COZE 是比较早的一批智能体工具了,从开始快速搭建对话框,到目前功能越来越丰富。国内最好的智能体值得一试。
字节针对Coze这个产品部署了两个站点,分别是国内版和海外版
国内版
- 网址:https://www.coze.cn
- 官方文档教程:https://www.coze.cn/docs/guides/welcome
- 大模型:豆包、Deepseek等大模型 国内网络即可以正常访问
海外版
- 网址:https://www.coze.com
- 官方文档教程:https://www.coze.com/docs/guides/welcome
- 大模型:GPT-4、GPT-3.5等大模型 访问需要突破网络限制的工具
核心功能:
可开发单智能体和多智能体: 多智能体可以理解为是多个人,单智能体是一个人。
技能:
- 插件: 能够使用不属于coze平台的能力
- 工作流:用于实现复杂、稳定的业务流程。
- 触发器:使智能体在特定时间或接收到特定事件时自动执行 工作流或者插件等。
- 卡片: 用于分享展示(比较鸡肋)。
知识库:
- 获取方式:网页,飞书知识库等在线知识库,手动导入。
- 知识库类型: 文档知识库,表格知识库,图片知识库
- 调用方式: 按需调用,自动调用
- 搜索策略:语义检索,全文检索,混合(前两种结合)
记忆:
- 变量:可以自定义保存一些个性化信息。
- 数据库:可以保存一些结构化数据。
- 长期记忆: 总结聊天对话的内容,并用于更好的响应用户的消息。(不可自定义控制)
- 文件盒子:存储多样化数据格式
音色: 克隆声音,创建个性化声音。
模型微调:可以自己微调coze提供的模型。
应用: 可以创建用户界面,并且发布到小程序等环境中
MetaGPT
MetaGPT也是一款比较早的多智能体框架,需要编程经验。
下面这是MetaGPT对当下智能体的理解
智能体:一个智能体应具备类似人类的思考和规划能力,拥有记忆甚至情感,并具备必定的技能以便与环境、智能体和人类进行交互。
智能体 = 大语言模型(LLM) + 观察 + 思考 + 行动 + 记忆
- 大语言模型(LLM):LLM作为智能体的“大脑”部分,使其能够处理信息,从交互中学习,做出决策并执行行动。
- 观察:这是智能体的感知机制,使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
- 思考:思考过程涉及分析观察结果和记忆内容并思考可能的行动。这是智能体内部的决策过程,其可能由LLM进行驱动。
- 行动:这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码,或是手动预定义的操作,如阅读本地文件。此外,智能体还可以执行使用工具的操作,包括在互联网上搜索天气,使用计算器进行数学计算等。
- 记忆:智能体的记忆存储过去的经验。这对学习至关重大,由于它允许智能体参考先前的结果并据此调整未来的行动。
多智能体: 可以视为一个智能体社会
多智能体 = 智能体 + 环境 + 标准流程(SOP) + 通信 + 经济
- 智能体:在上面单独定义的基础上,在多智能体系统中的智能体协同工作,每个智能体都具备独特有的LLM、观察、思考、行动和记忆。
- 环境:环境是智能体生存和互动的公共场所。智能体从环境中观察到重大信息,并发布行动的输出结果以供其他智能体使用。
- 标准流程(SOP):这些是管理智能体行动和交互的既定程序,确保系统内部的有序和高效运作。例如,在汽车制造的SOP中,一个智能体焊接汽车零件,而另一个安装电缆,保持装配线的有序运作。
- 通信:通信是智能体之间信息交流的过程。它对于系统内的协作、谈判和竞争至关重大。
- 经济:这指的是多智能体环境中的价值交换系统,决定资源分配和任务优先级。
FastGPT
FastGPT 是一个基于模型的知识库问答系统,可以通过 Flow 可视化进行工作流编排。
在线使用:https://tryfastgpt.ai
核心功能:
- 工作流:用于实现复杂、稳定的业务流程。
- 模型库:支持主流的模型接入
- 对话问题引导: 预设一些问题,可以引导用户对话(实则目前这个已经是基础功能了)。
- 知识库集合标签: 对知识库中的数据集合添加标签进行分类,更高效地管理知识库数据。
- 文件输入功能:可以在跟用户对话过程中,让用户输入文件,然后调用自定义工作流或者读取内容。
- 插件:目前只有搜索插件
- 知识库:可以同步外部知识库,列如飞书、语雀等。
Dify
Dify 是基于大语言模型的 AI 应用开发平台,也是一款问答系统的工具。
在线使用: https://cloud.dify.ai/
核心功能:
- 模型库: 可以自定义模型地址 系统推理模型:列如文心一言、通义千问、豆包这种 Embedding模型: 向量模型处理分段过的数据。 Rerank模型: 用于增强检索知识库的能力。 语音转文字模型: 将语音转成文字这种。
- 智能体:支持多智能体和单智能体
- 技能: 敏感内容审查: 可以自定义关键词 自定义设计插件:列如搜索,视频,comfyUI等 标注回复内容:对内容进行标注回答 监测:监测用户的回复信息,进行数据分析。
- 常用的工作流和知识库都支持
© 版权声明
文章版权归作者所有,未经允许请勿转载。
收藏了,感谢分享
感谢!你的转发是对我最大的鼓励~