v2026.5.12
的更新内容:
主要新功能
Agent / 工具权限
- 按发送者工具策略 — 支持根据请求者身份限制危险工具的使用(全局、agent、群组级别),可以精细控制谁能用哪些工具
- Agent 间对话链 — maxPingPongTurns 上限从默认 5 提升到最多 20 轮,支持更长的 agent 间对话
- Agent 消息工具独立配置 — 支持每个 agent 单独设置 crossContext 和 actions.allow,沙盒 agent 可以限制消息发送范围
上下文 / 诊断
- /context map 命令 — 生成当前会话上下文贡献者的树形图可视化,直观看到 token 消耗分布
- 模型传输诊断 — 新增模型传输、负载、SSE 和代码模式的详细诊断日志
⏰ Cron
- cron.get 命令 — 支持通过 ID 查看单个 cron 任务的详细配置
️ Discord 语音
- 实时语音诊断 — 新增说话人轮换、播放重置、打断检测、音频截断分析
- 语音频道限制 — 新增 voice.allowedChannels 配置,限制 bot 只能加入指定语音频道
- 语音风格指令 — 新增 talk.realtime.instructions 配置,自定义语音交互风格
Slack 改善
- 链接/媒体预览控制 — 新增 unfurlLinks 和 unfurlMedia 配置,可以抑制 Slack 链接和媒体预览
- 回复广播 — 支持 Slack 的 reply_broadcast 行为,线程回复可推送到父频道
- 提及元数据 — 改善入站 prompt 上下文,区分直接提及 bot 和间接唤醒
Google Gemini
- Gemini 3 Pro Preview ID 规范化 — 大量更新将所有过时的 Gemini 3 Pro Preview 引用统一为 google/gemini-3.1-pro-preview
️ 图片编辑 (Fal)
- GPT Image 2 / Nano Banana 2 — 参考图编辑请求路由改善,支持最多 10/14 张输入图,支持宽高比提示
其他改善
- 私有技能归档上传 — 支持通过 zip 文件安装技能(需开启 skills.install.allowUploadedArchives)
- 系统提示词精简 — 减少默认系统提示词 token 消耗
- 进度预览加宽 — Discord 内联工具更新显示更多命令上下文
- 压缩时保留会话引用 — 背景 exec/process 会话在压缩后仍可访问
- OpenAI CLI 登录优化 — openclaw models auth login –provider openai 默认启动 ChatGPT/Codex 账户登录
- max_completion_tokens 支持 — OpenAI 兼容 HTTP 接口支持客户端 token 上限设置
- pnpm 11 升级 — 工作区包管理升级到 pnpm 11
主要修复
- Codex 超时客户端清理 — 修复 Discord agent 复用 CPU 空转的 Codex 进程问题
- Slack DM 线程分裂 — 修复同一 Slack DM 被拆分成不同 channel session 的问题
- 构建/依赖 — 大量依赖版本刷新和锁定
总的来说 v2026.5.12 是个比较大的更新,重点在 工具权限控制、语音功能、Slack/Discord 渠道改善、以及上下文管理 方面。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...

