实操导向。2026年4月16日更新,macOS可用,Windows等待中。
一、这次更新,不是升级,是跨越
2026年4月16日,OpenAI发布了一篇博文:Codex for (almost) everything。
标题里那个”almost”很诚实——Codex目前能做的事,已经接近”软件开发全生命周期”,但还没到”everything”。
在这次更新之前,Codex是一个很强的代码助手:你说”帮我写一个登录功能”,它写代码,你复制粘贴,你去测试,你再告知它”这个不对,改一下”。
这次更新之后,Codex可以自己测试了。
它有了眼睛(看你的屏幕),有了手(点击、输入),有了记忆(记住你的偏好),有了计划(定时唤醒自己,继续昨天没做完的任务)。
这是从”辅助工具”到”协作开发者”的跨越。
二、这次更新了什么?(完整功能清单)
1. Background Computer Use(后台计算机操控)
这是本次最大的更新,目前仅限macOS。
Codex有了自己的独立光标,可以:
- 看:实时观察你的屏幕
- 点:操作任何桌面应用
- 输入:在任何应用里键入文字
最关键的特性:后台并行运行。
多个Codex Agent可以同时在Mac上工作,不会干扰你正在进行的操作。
你在前台写代码,后台的Agent在跑测试、修复发现的bug、更新文档——这是开发效率的并行化,不是”更快的串行”。
这解决了什么痛点?
以前的AI编码助手,有一个固执的盲点:”代码写完了,但测没测?”
Codex可以自己打开浏览器,加载你的localhost:3000,截图检查,然后告知你”第三个卡片的按钮没对齐”——不再需要你来回截图反馈。
2. In-App Browser(内置浏览器)
Codex内嵌了浏览器,你可以直接在渲染后的页面上加注释和指令。
不再需要:截图 → 传给AI → AI猜你想改哪里 → 你说不对 → 再截图……
目前是:在浏览器里用鼠标框选要改的元素,直接说”把这个按钮变成红色,圆角8px”,Codex定位到代码,直接改。
这对前端开发者和全栈独立开发者尤其有价值——设计迭代的反馈循环,从”分钟级”压缩到”秒级”。
3. Memory Preview(记忆功能,预览版)
这是一个范式级的转变,值得单独解释。
以前,每次打开Codex,它对你的项目一无所知——你得重新解释”这是用Next.js做的,数据库是Supabase,包管理用pnpm不用npm”。
有了Memory之后:你说一次,它永远记得。
不只是项目规范,还有:
- 你的代码风格偏好(”注释要写中文”)
- 你纠正过的错误(”上次你这样做不对,由于……”)
- 项目上下文(”这个功能和上次做的认证模块有依赖关系”)
战略意义:Codex从”每次对话都从零开始的工具”,变成了”了解你项目历史的持久化开发者”。
4. Scheduled Automations(定时自动化)
Codex目前可以定时唤醒自己。
你可以告知它:
- “每天早上8点,检查一下是否有新的GitHub PR评论需要回复”
- “每周一,生成上周的代码变更报告”
- “这个数据同步任务,每隔4小时跑一次”
结合线程复用(可以在之前的对话上下文里继续工作),Codex开始有了”长时任务”的能力——不再是一次性的提问-回答,而是持续追踪的运维工作者。
5. 90+ 新插件 + GitHub工作流
- GitHub PR评论处理:Codex可以自动读取PR里的review评论,生成修改方案
- 多终端标签页:同时开多个终端会话,不同任务并行
- SSH连接远程Devbox(Alpha):直接连到远程开发环境操作
- 文件预览增强:支持PDF/表格/幻灯片/文档,不只是代码文件
三、功能 × 平台对照表
|
功能 |
macOS |
Windows |
Linux |
|
Background Computer Use |
✅ |
❌ |
❌ |
|
In-App Browser |
✅ |
部分 |
部分 |
|
Memory Preview |
✅ |
部分 |
部分 |
|
Scheduled Automations |
✅ |
✅ |
✅ |
|
90+ Plugins |
✅ |
✅ |
✅ |
|
GitHub PR评论处理 |
✅ |
✅ |
✅ |
|
多终端标签页 |
✅ |
✅ |
✅ |
|
SSH远程Devbox(Alpha) |
✅ |
✅ |
✅ |
结论:Computer Use是本次最核心的功能,但目前只有macOS能用。Windows用户还要等。
四、上手指南:新功能怎么用?
如何开启Computer Use
前提:macOS + ChatGPT账号 + Codex桌面App
- 更新Codex App到最新版(2026年4月16日之后的版本)
- 在Codex设置里启用”Computer Use”权限——它需要屏幕录制权限和辅助功能权限
- 启动一个新任务时,可以选择”让Codex自动测试结果”
推荐第一个测试场景:
告知Codex:
"帮我给登录页面加一个'记住我'的checkbox,
加完之后在浏览器里打开localhost:3000/login,
检查这个checkbox是否正常显示,如果有样式问题,自己修复。"
观察它是否能:①写代码 → ②打开浏览器 → ③发现问题 → ④自己修复,全程不需要你操作。
如何设置Memory
- 打开Codex设置 → Memory(记忆)
- 点击”添加记忆”,告知它项目规范:
- 本项目使用: – 框架:Next.js 15 + TypeScript – 数据库:Supabase(PostgreSQL) – 包管理器:pnpm(禁止使用npm或yarn) – 代码风格:函数组件 + hooks,禁止class组件 – 注释语言:中文
- 后来每次新会话,这些规则会自动应用
注意:Memory目前是预览版,提议把重大项目规范同时保存在CLAUDE.md或README里,不要只依赖Memory。
如何设置定时自动化
在Codex里,你可以这样设置:
任务:每天早上9点,检查GitHub仓库的open issues,
如果有标记为"easy fix"的issue,
自动生成修复方案并创建一个draft PR,
等我来review。
Codex会在指定时间自动唤醒,完成任务,然后发通知给你。
五、三个最值得立刻用上的场景
场景1:前端UI迭代(对独立开发者/全栈工程师)
以前:改代码 → 截图 → 发给AI → AI看不清楚 → 再截图 → 来回5轮 目前:在浏览器里标注”这个元素改成这样”,Codex直接改,自己在浏览器里验证
时间节省:每轮UI迭代从15分钟压缩到3-5分钟。
场景2:测试无API的老系统(对企业开发者)
许多遗留系统没有API,只能通过GUI操作。
以前的Agent需要截图+OCR才能”看懂”界面,准确率不高。
Computer Use让Codex直接操作界面——点击、填表、提交、验证结果,像一个真实的QA测试员。
场景3:自动化开发运维(DevOps小团队)
设置定时任务,让Codex每天:
- 检查生产环境的错误日志
- 生成”今天需要关注的问题”报告
- 对于已知类型的错误,自动生成修复PR
从”有问题了才查”,进化到”问题出现前就发现”。
六、需要注意的地方
权限安全
Computer Use需要屏幕录制权限和辅助功能权限——这意味着Codex可以看到你屏幕上的一切,包括密码输入框。
提议:
- 不要在有敏感信息(密码/私钥/个人隐私)可见的情况下开启Computer Use任务
- 涉及生产环境操作时,先在测试环境验证
- 定期检查Codex的”动作记录”,了解它操作了什么
Memory的边界
Memory目前是预览版,可能在某些情况下”记错”或”混淆不同项目的信息”。
提议:重大项目规范,把它写在项目根目录的AGENTS.md或CODEX.md文件里,比只依赖Memory更可靠。
不要100%信任自动化结果
Codex在测试UI时”觉得没问题”,不代表真的没问题——它可能漏掉边缘case,或者对某些交互的判断标准和你不一样。
原则:自动化提升效率,但关键功能的最终验证还是要人来做。
七、结语:开发者工作流的分水岭
Codex这次更新,不是让你”写代码更快”——代码生成这件事,已经很快了。
它在做的事,是消除开发工作流里的”中断点”:不再需要你来回截图、手动测试、反复解释上下文、记录项目规范……
这些中断点,每次只花几分钟,但加起来可能是你每天工作时间的30-40%。
消除中断,不是提升10%的效率,是让你的专注时间翻倍。
这,才是Computer Use的真正价值。