Codex的Computer Use：让AI直接操作你的开发环境

内容分享3小时前发布查看个人主页

实操导向。2026年4月16日更新，macOS可用，Windows等待中。

一、这次更新，不是升级，是跨越

2026年4月16日，OpenAI发布了一篇博文：Codex for (almost) everything。

标题里那个”almost”很诚实——Codex目前能做的事，已经接近”软件开发全生命周期”，但还没到”everything”。

在这次更新之前，Codex是一个很强的代码助手：你说”帮我写一个登录功能”，它写代码，你复制粘贴，你去测试，你再告知它”这个不对，改一下”。

这次更新之后，Codex可以自己测试了。

它有了眼睛（看你的屏幕），有了手（点击、输入），有了记忆（记住你的偏好），有了计划（定时唤醒自己，继续昨天没做完的任务）。

这是从”辅助工具”到”协作开发者”的跨越。

二、这次更新了什么？（完整功能清单）

1. Background Computer Use（后台计算机操控）

这是本次最大的更新，目前仅限macOS。

Codex有了自己的独立光标，可以：

看：实时观察你的屏幕
点：操作任何桌面应用
输入：在任何应用里键入文字

最关键的特性：后台并行运行。

多个Codex Agent可以同时在Mac上工作，不会干扰你正在进行的操作。

你在前台写代码，后台的Agent在跑测试、修复发现的bug、更新文档——这是开发效率的并行化，不是”更快的串行”。

这解决了什么痛点？

以前的AI编码助手，有一个固执的盲点：”代码写完了，但测没测？”

Codex可以自己打开浏览器，加载你的localhost:3000，截图检查，然后告知你”第三个卡片的按钮没对齐”——不再需要你来回截图反馈。

2. In-App Browser（内置浏览器）

Codex内嵌了浏览器，你可以直接在渲染后的页面上加注释和指令。

不再需要：截图 → 传给AI → AI猜你想改哪里 → 你说不对 → 再截图……

目前是：在浏览器里用鼠标框选要改的元素，直接说”把这个按钮变成红色，圆角8px”，Codex定位到代码，直接改。

这对前端开发者和全栈独立开发者尤其有价值——设计迭代的反馈循环，从”分钟级”压缩到”秒级”。

3. Memory Preview（记忆功能，预览版）

这是一个范式级的转变，值得单独解释。

以前，每次打开Codex，它对你的项目一无所知——你得重新解释”这是用Next.js做的，数据库是Supabase，包管理用pnpm不用npm”。

有了Memory之后：你说一次，它永远记得。

不只是项目规范，还有：

你的代码风格偏好（”注释要写中文”）
你纠正过的错误（”上次你这样做不对，由于……”）
项目上下文（”这个功能和上次做的认证模块有依赖关系”）

战略意义：Codex从”每次对话都从零开始的工具”，变成了”了解你项目历史的持久化开发者”。

4. Scheduled Automations（定时自动化）

Codex目前可以定时唤醒自己。

你可以告知它：

“每天早上8点，检查一下是否有新的GitHub PR评论需要回复”
“每周一，生成上周的代码变更报告”
“这个数据同步任务，每隔4小时跑一次”

结合线程复用（可以在之前的对话上下文里继续工作），Codex开始有了”长时任务”的能力——不再是一次性的提问-回答，而是持续追踪的运维工作者。

5. 90+ 新插件 + GitHub工作流

GitHub PR评论处理：Codex可以自动读取PR里的review评论，生成修改方案
多终端标签页：同时开多个终端会话，不同任务并行
SSH连接远程Devbox（Alpha）：直接连到远程开发环境操作
文件预览增强：支持PDF/表格/幻灯片/文档，不只是代码文件

三、功能 × 平台对照表

功能	macOS	Windows	Linux
Background Computer Use	✅	❌	❌
In-App Browser	✅	部分	部分
Memory Preview	✅	部分	部分
Scheduled Automations	✅	✅	✅
90+ Plugins	✅	✅	✅
GitHub PR评论处理	✅	✅	✅
多终端标签页	✅	✅	✅
SSH远程Devbox（Alpha）	✅	✅	✅

结论：Computer Use是本次最核心的功能，但目前只有macOS能用。Windows用户还要等。

四、上手指南：新功能怎么用？

如何开启Computer Use

前提：macOS + ChatGPT账号 + Codex桌面App

更新Codex App到最新版（2026年4月16日之后的版本）
在Codex设置里启用”Computer Use”权限——它需要屏幕录制权限和辅助功能权限
启动一个新任务时，可以选择”让Codex自动测试结果”

推荐第一个测试场景：

告知Codex：
"帮我给登录页面加一个'记住我'的checkbox，
加完之后在浏览器里打开localhost:3000/login，
检查这个checkbox是否正常显示，如果有样式问题，自己修复。"

观察它是否能：①写代码 → ②打开浏览器 → ③发现问题 → ④自己修复，全程不需要你操作。

如何设置Memory

打开Codex设置 → Memory（记忆）
点击”添加记忆”，告知它项目规范：
本项目使用： – 框架：Next.js 15 + TypeScript – 数据库：Supabase（PostgreSQL） – 包管理器：pnpm（禁止使用npm或yarn） – 代码风格：函数组件 + hooks，禁止class组件 – 注释语言：中文
后来每次新会话，这些规则会自动应用

注意：Memory目前是预览版，提议把重大项目规范同时保存在CLAUDE.md或README里，不要只依赖Memory。

如何设置定时自动化

在Codex里，你可以这样设置：

任务：每天早上9点，检查GitHub仓库的open issues，
如果有标记为"easy fix"的issue，
自动生成修复方案并创建一个draft PR，
等我来review。

Codex会在指定时间自动唤醒，完成任务，然后发通知给你。

五、三个最值得立刻用上的场景

场景1：前端UI迭代（对独立开发者/全栈工程师）

以前：改代码 → 截图 → 发给AI → AI看不清楚 → 再截图 → 来回5轮目前：在浏览器里标注”这个元素改成这样”，Codex直接改，自己在浏览器里验证

时间节省：每轮UI迭代从15分钟压缩到3-5分钟。

场景2：测试无API的老系统（对企业开发者）

许多遗留系统没有API，只能通过GUI操作。

以前的Agent需要截图+OCR才能”看懂”界面，准确率不高。

Computer Use让Codex直接操作界面——点击、填表、提交、验证结果，像一个真实的QA测试员。

场景3：自动化开发运维（DevOps小团队）

设置定时任务，让Codex每天：

检查生产环境的错误日志
生成”今天需要关注的问题”报告
对于已知类型的错误，自动生成修复PR

从”有问题了才查”，进化到”问题出现前就发现”。

六、需要注意的地方

权限安全

Computer Use需要屏幕录制权限和辅助功能权限——这意味着Codex可以看到你屏幕上的一切，包括密码输入框。

提议：

不要在有敏感信息（密码/私钥/个人隐私）可见的情况下开启Computer Use任务
涉及生产环境操作时，先在测试环境验证
定期检查Codex的”动作记录”，了解它操作了什么

Memory的边界

Memory目前是预览版，可能在某些情况下”记错”或”混淆不同项目的信息”。

提议：重大项目规范，把它写在项目根目录的AGENTS.md或CODEX.md文件里，比只依赖Memory更可靠。

不要100%信任自动化结果

Codex在测试UI时”觉得没问题”，不代表真的没问题——它可能漏掉边缘case，或者对某些交互的判断标准和你不一样。

原则：自动化提升效率，但关键功能的最终验证还是要人来做。

七、结语：开发者工作流的分水岭

Codex这次更新，不是让你”写代码更快”——代码生成这件事，已经很快了。

它在做的事，是消除开发工作流里的”中断点”：不再需要你来回截图、手动测试、反复解释上下文、记录项目规范……

这些中断点，每次只花几分钟，但加起来可能是你每天工作时间的30-40%。

消除中断，不是提升10%的效率，是让你的专注时间翻倍。

这，才是Computer Use的真正价值。

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

AI助攻谷歌二季度云收入首超百亿美元，但广告放缓，盘后震荡转跌 | 财报见闻

AI助攻谷歌二季度云收入首超百亿美元，但广告放缓，盘后震荡转跌 | 财报见闻

1个月前

020

检查 Linux CPU 使用率的 8 个命令，妥妥的好用！

检查 Linux CPU 使用率的 8 个命令，妥妥的好用！

7个月前

1470

pmp考试多长时间出成绩？

pmp考试多长时间出成绩？

3个月前

030

uniapp微信小程序分包处理

uniapp微信小程序分包处理

3个月前

050

1 条评论

none

暂无评论...