Codex的Computer Use:让AI直接操作你的开发环境

实操导向。2026年4月16日更新,macOS可用,Windows等待中。


一、这次更新,不是升级,是跨越

2026年4月16日,OpenAI发布了一篇博文:Codex for (almost) everything

标题里那个”almost”很诚实——Codex目前能做的事,已经接近”软件开发全生命周期”,但还没到”everything”。

在这次更新之前,Codex是一个很强的代码助手:你说”帮我写一个登录功能”,它写代码,你复制粘贴,你去测试,你再告知它”这个不对,改一下”。

这次更新之后,Codex可以自己测试了。

它有了眼睛(看你的屏幕),有了手(点击、输入),有了记忆(记住你的偏好),有了计划(定时唤醒自己,继续昨天没做完的任务)。

这是从”辅助工具”到”协作开发者”的跨越。


二、这次更新了什么?(完整功能清单)

1. Background Computer Use(后台计算机操控)

这是本次最大的更新,目前仅限macOS。

Codex有了自己的独立光标,可以:

  • :实时观察你的屏幕
  • :操作任何桌面应用
  • 输入:在任何应用里键入文字

最关键的特性:后台并行运行

多个Codex Agent可以同时在Mac上工作,不会干扰你正在进行的操作。

你在前台写代码,后台的Agent在跑测试、修复发现的bug、更新文档——这是开发效率的并行化,不是”更快的串行”。

这解决了什么痛点?

以前的AI编码助手,有一个固执的盲点:”代码写完了,但测没测?”

Codex可以自己打开浏览器,加载你的localhost:3000,截图检查,然后告知你”第三个卡片的按钮没对齐”——不再需要你来回截图反馈。

2. In-App Browser(内置浏览器)

Codex内嵌了浏览器,你可以直接在渲染后的页面上加注释和指令

不再需要:截图 → 传给AI → AI猜你想改哪里 → 你说不对 → 再截图……

目前是:在浏览器里用鼠标框选要改的元素,直接说”把这个按钮变成红色,圆角8px”,Codex定位到代码,直接改。

这对前端开发者全栈独立开发者尤其有价值——设计迭代的反馈循环,从”分钟级”压缩到”秒级”。

3. Memory Preview(记忆功能,预览版)

这是一个范式级的转变,值得单独解释。

以前,每次打开Codex,它对你的项目一无所知——你得重新解释”这是用Next.js做的,数据库是Supabase,包管理用pnpm不用npm”。

有了Memory之后:你说一次,它永远记得。

不只是项目规范,还有:

  • 你的代码风格偏好(”注释要写中文”)
  • 你纠正过的错误(”上次你这样做不对,由于……”)
  • 项目上下文(”这个功能和上次做的认证模块有依赖关系”)

战略意义:Codex从”每次对话都从零开始的工具”,变成了”了解你项目历史的持久化开发者”。

4. Scheduled Automations(定时自动化)

Codex目前可以定时唤醒自己

你可以告知它:

  • “每天早上8点,检查一下是否有新的GitHub PR评论需要回复”
  • “每周一,生成上周的代码变更报告”
  • “这个数据同步任务,每隔4小时跑一次”

结合线程复用(可以在之前的对话上下文里继续工作),Codex开始有了”长时任务”的能力——不再是一次性的提问-回答,而是持续追踪的运维工作者。

5. 90+ 新插件 + GitHub工作流

  • GitHub PR评论处理:Codex可以自动读取PR里的review评论,生成修改方案
  • 多终端标签页:同时开多个终端会话,不同任务并行
  • SSH连接远程Devbox(Alpha):直接连到远程开发环境操作
  • 文件预览增强:支持PDF/表格/幻灯片/文档,不只是代码文件

三、功能 × 平台对照表

功能

macOS

Windows

Linux

Background Computer Use

In-App Browser

部分

部分

Memory Preview

部分

部分

Scheduled Automations

90+ Plugins

GitHub PR评论处理

多终端标签页

SSH远程Devbox(Alpha)

结论:Computer Use是本次最核心的功能,但目前只有macOS能用。Windows用户还要等。


四、上手指南:新功能怎么用?

如何开启Computer Use

前提:macOS + ChatGPT账号 + Codex桌面App

  1. 更新Codex App到最新版(2026年4月16日之后的版本)
  2. 在Codex设置里启用”Computer Use”权限——它需要屏幕录制权限和辅助功能权限
  3. 启动一个新任务时,可以选择”让Codex自动测试结果”

推荐第一个测试场景

告知Codex:
"帮我给登录页面加一个'记住我'的checkbox,
加完之后在浏览器里打开localhost:3000/login,
检查这个checkbox是否正常显示,如果有样式问题,自己修复。"

观察它是否能:①写代码 → ②打开浏览器 → ③发现问题 → ④自己修复,全程不需要你操作。

如何设置Memory

  1. 打开Codex设置 → Memory(记忆)
  2. 点击”添加记忆”,告知它项目规范:
  3. 本项目使用: – 框架:Next.js 15 + TypeScript – 数据库:Supabase(PostgreSQL) – 包管理器:pnpm(禁止使用npm或yarn) – 代码风格:函数组件 + hooks,禁止class组件 – 注释语言:中文
  4. 后来每次新会话,这些规则会自动应用

注意:Memory目前是预览版,提议把重大项目规范同时保存在CLAUDE.md或README里,不要只依赖Memory。

如何设置定时自动化

在Codex里,你可以这样设置:

任务:每天早上9点,检查GitHub仓库的open issues,
如果有标记为"easy fix"的issue,
自动生成修复方案并创建一个draft PR,
等我来review。

Codex会在指定时间自动唤醒,完成任务,然后发通知给你。


五、三个最值得立刻用上的场景

场景1:前端UI迭代(对独立开发者/全栈工程师)

以前:改代码 → 截图 → 发给AI → AI看不清楚 → 再截图 → 来回5轮 目前:在浏览器里标注”这个元素改成这样”,Codex直接改,自己在浏览器里验证

时间节省:每轮UI迭代从15分钟压缩到3-5分钟。

场景2:测试无API的老系统(对企业开发者)

许多遗留系统没有API,只能通过GUI操作。

以前的Agent需要截图+OCR才能”看懂”界面,准确率不高。

Computer Use让Codex直接操作界面——点击、填表、提交、验证结果,像一个真实的QA测试员。

场景3:自动化开发运维(DevOps小团队)

设置定时任务,让Codex每天:

  • 检查生产环境的错误日志
  • 生成”今天需要关注的问题”报告
  • 对于已知类型的错误,自动生成修复PR

从”有问题了才查”,进化到”问题出现前就发现”。


六、需要注意的地方

权限安全

Computer Use需要屏幕录制权限和辅助功能权限——这意味着Codex可以看到你屏幕上的一切,包括密码输入框。

提议

  • 不要在有敏感信息(密码/私钥/个人隐私)可见的情况下开启Computer Use任务
  • 涉及生产环境操作时,先在测试环境验证
  • 定期检查Codex的”动作记录”,了解它操作了什么

Memory的边界

Memory目前是预览版,可能在某些情况下”记错”或”混淆不同项目的信息”。

提议:重大项目规范,把它写在项目根目录的AGENTS.md或CODEX.md文件里,比只依赖Memory更可靠。

不要100%信任自动化结果

Codex在测试UI时”觉得没问题”,不代表真的没问题——它可能漏掉边缘case,或者对某些交互的判断标准和你不一样。

原则:自动化提升效率,但关键功能的最终验证还是要人来做。


七、结语:开发者工作流的分水岭

Codex这次更新,不是让你”写代码更快”——代码生成这件事,已经很快了。

它在做的事,是消除开发工作流里的”中断点”:不再需要你来回截图、手动测试、反复解释上下文、记录项目规范……

这些中断点,每次只花几分钟,但加起来可能是你每天工作时间的30-40%。

消除中断,不是提升10%的效率,是让你的专注时间翻倍。

这,才是Computer Use的真正价值。

© 版权声明

相关文章

1 条评论

none
暂无评论...