还在手动敲代码?这个 AI 已经能在你锁屏的时候帮你干活了。
一、先搞清楚:Codex 到底是什么?
许多人以为 Codex 就是个写代码的 AI。这个理解有点窄——准确地说,它目前是覆盖整个开发流程的 AI 代理工作台。
OpenAI 在 2026 年对 Codex 做了两次大升级:
- 4月16日:一口气加了 Computer Use(全系统操作)、Memory(记忆系统)、ImageGen(图像生成)、90+ 插件生态、浏览器控制等能力
- 5月22日:上线 Appshots(屏幕快照增强)、/goal 长周期自主编码正式版、锁屏运行、团队插件共享、分析看板升级
一句话定位:Codex = AI 编程助手 + 自动化工作台 + 7×24 小时数字员工。
二、跟 Claude Code 比,该选谁?
这是新手最常问的问题,直接给结论:
|
Claude Code |
Codex |
|
|
速度 |
快 |
慢(但越来越快) |
|
查 bug |
一般 |
精准到行号 |
|
代码细节 |
过得去 |
极强 |
|
多轮对话 |
强 |
中等 |
|
桌面操作 |
弱 |
可操作本机应用 |
|
长周期任务 |
需持续关注 |
可锁屏自主运行 |
推荐组合用法:日常让 Claude Code 当主力(执行快、理解好),遇到复杂 bug、长周期任务、需要桌面操作时,扔给 Codex。
两者不是竞争关系,是搭档关系。
三、三步上车:安装、配置、激活
Step 1:开通付费
Codex 需要 ChatGPT 付费会员才能用。开通 ChatGPT **Plus($20/月)**或 **Pro($200/月)**即可。
新手选 Plus 足够了。Pro 多出来的主要是调用次数和推理强度,日常开发用 Plus 完全够。
Step 2:安装 Codex CLI
Codex 有三种使用方式:
- 网页版:直接在 ChatGPT 网页端用,最省事
- IDE 扩展:在 VS Code 等编辑器里用
- CLI 命令行版:功能最全,推荐
安装 CLI(命令行版),一行命令搞定:
npm install -g @openai/codex
前提是你的电脑装了 Node.js(版本 ≥ 22)。
如果 NPM 下载慢,加个国内镜像:
npm install -g @openai/codex –registry=https://registry.npmmirror.com
Mac 用户也可以用 Homebrew:
brew install codex
安装完在终端输入 codex,回车,首次需要登录你的 ChatGPT 账号。
Step 3:关键初始配置
进了 Codex 之后,做三件事:
① 切换模型:输入 /model,选 gpt-5 通用版(不是 codex 专业版),推理强度设 high。
为啥不选 codex 专业版?由于通用版理解能力更强,新手不容易被 AI”误解”。专业版适合那种你对需求超级清晰、就要它出代码的场景。
② 设置权限:输入 /approvals,选「自动判断」模式——读文件自动通过,改文件弹窗确认。既安全又不耽误事。
③ 初始化项目:在项目目录下运行 codex,然后输入 /init,让 Codex 先扫描一遍项目结构,建立上下文。这一步很重大,别跳过。
四、Codex App 桌面应用完整指南
许多人装完 CLI 就完事了,实则 Codex 还有一个桌面应用(Codex App),这才是完整形态。
如果说 CLI 是代码编辑器里的终端,那 Codex App 就是一个集成开发工作台。下面把它拆开讲。
4.1 怎么装 Codex App?
Mac 用户:
从 Mac App Store 搜索 “Codex” 直接下载安装。或者用官方直链:
https://persistent.oaistatic.com/codex-app-prod/Codex.dmg
双击 .dmg,拖进 Applications 文件夹即可。
Windows 用户:
打开 Microsoft Store,搜索 “Codex”,或直接访问:
https://apps.microsoft.com/detail/9plm9xgg6vks
点击”获取”,系统要求 Windows 10 19041 以上。
安装后登录 ChatGPT 账号(Plus 及以上),授权完成就能用了。
4.2 界面布局:每个模块干什么?
打开 Codex App 后,你会看到这样的布局:
① 对话面板(中间,主区域)
这就是你跟 Codex 对话的地方。支持多行输入(Alt + Enter 换行)、拖拽文件(按住 Shift 再拖)、粘贴代码块。
左上角有标签页可以开启多个对话线程,每个线程独立上下文。输入 /new 新建线程,输入 /init 让 Codex 扫描当前项目。
② 文件侧边栏(左侧)
可以浏览当前项目的文件结构。不止是看代码——它能直接预览 PDF、Excel 表格、PPT、Word 文档。
这意味着什么?你把产品需求文档(PRD)、接口设计表、测试用例表格扔进项目目录,Codex 就能直接读这些文件的内容来做开发决策。
③ 终端标签页(底部,多标签)
Codex App 内可以同时运行多个终端 Tab。一个跑 dev server,一个看日志,一个跑测试——跟真实开发者的工作习惯完全对齐。
Windows 下可选终端类型:PowerShell、Command Prompt、Git Bash、WSL。
Agent 运行模式也可以独立切换:
- Windows Native(默认):命令在 PowerShell 执行,使用 Windows 沙盒
- WSL Agent:切到 WSL 环境运行,适合 Linux 项目
④ Summary 总结面板(右侧/底部)
这个面板会实时显示 Codex 的当前计划、使用了哪些数据源、产出了哪些文件——让长链路任务有透明度。
列如你让 /goal 跑一个重构任务,Summary 面板会告知你:
- 它目前在做什么步骤
- 读了哪些文件来获取上下文
- 为什么要做当前这个操作
- 已经完成了什么、还剩什么
不是黑箱,你能随时掌握进度。
⑤ 应用内浏览器(内置)
Codex App 里内嵌了一个浏览器。前端工程师可以直接在 App 里预览页面效果,然后用浏览器标注工具在上面画圈、标注需要调整的元素,Codex 自动读取标注并修改代码。
典型场景:写完前端页面 → 浏览器打开 localhost → 发现按钮颜色不对 → 标一下 → Codex 自己改。
⑥ 设置面板(File → Settings)
关键设置项:
|
设置项 |
选项 |
说明 |
|
模型 |
gpt-5 / codex 专业版 |
新手用 gpt-5 |
|
推理强度 |
low / medium / high / xhigh |
复杂任务选 high |
|
权限模式 |
只读 / 自动判断 / 全通过 |
新手选自动判断 |
|
默认编辑器 |
VS Code / Visual Studio / 其他 |
设置”在编辑器中打开”的目标 |
|
集成终端 |
PowerShell / Git Bash / WSL |
Windows 用户按需选 |
|
沙盒模式 |
workspace-write / danger-full-access |
新手保持默认 |
|
界面语言 |
English / 中文(中国) |
英文界面不想看?切中文 |
Windows 用户重点注意:“Agent 运行模式”和”集成终端类型”是两个独立的设置。前者决定 Codex 在什么环境跑命令,后者决定你手动操作时用什么终端。
4.3 Codex App 独有的功能
App 有,CLI 没有的:
|
功能 |
App |
CLI |
|
文件预览(PDF/Excel/PPT) |
✅ |
❌ |
|
应用内浏览器 + 标注 |
✅ |
❌ |
|
多终端标签页 |
✅ |
❌ |
|
图形化设置面板 |
✅ |
❌ |
|
Summary 可视化面板 |
✅ |
❌ |
|
插件市场浏览 |
✅ |
❌ |
|
SSH 远程连接 |
✅(Alpha) |
❌ |
4.4 App vs CLI,新手怎么选?
两个都装。
- 日常交互:用 App,体验好。看文件、看进度、调设置都方便
- 写命令/脚本自动化:用 CLI,一条命令搞定
- CI/CD 集成:用 CLI,能在流水线里调用
App 和 CLI 共享同一个账号数据和配置(.codex/config.toml),你不用纠结数据同步问题。
App 操作效率小技巧:
- 拖文件到对话:按住 Shift,把文件拖进对话框
- 换行输入:Alt + Enter(Windows)或 Option + Enter(Mac)
- 快速截图给 Codex:Mac 双击 Command(Appshots),Windows 用截图工具再粘贴
- 中断 Codex 响应:Ctrl + C
五、五大核心功能,上手就能用
1. Appshots — 双击 Command,AI 看懂你的屏幕
这个功能是 5 月新上的,简单说就是:双击 Mac 的 Command 键,Codex 就能”看到”你当前的窗口内容。
不只是截图——它能读出窗口里所有文字,包括你没滚动到的部分。列如一个很长的网页、一份邮件、一段 API 文档,它都能完整读取。
然后你就可以直接在对话里说:”帮我把这个按钮改成蓝色”、”按照这个 API 文档写个调用代码”。不用复制粘贴,不用截图。
更智能的是:如果你 60 秒内跟同一个对话线程有过交流,新的 Appshot 会自动追加进去,不会乱开新对话。
2. /goal — 设个目标,AI 自己干
在 Codex 里输入 /goal,告知它你要做什么,然后你就可以去泡杯咖啡了。
列如:”帮我重构这个支付模块,把回调逻辑拆成三个独立服务,写完整测试。”
Codex 会自动分解任务、逐个执行、遇到问题自己尝试修复。它可能跑几个小时,不需要你盯着。
中途你可以随时查看进度、调整方向,或者在终端用 Ctrl+C 暂停它。
这是 Codex 跟传统 AI 编程工具最本质的区别:不是”你发指令然后等结果”,而是”你定目标,它持续执行”。
3. 锁屏运行 — 电脑锁了,AI 还在干
这个是 5 月大更新里最让程序员兴奋的功能。
在 Codex 设置里打开 Locked Use 开关,然后你合上电脑走人,Codex 照样在后台跑。
你甚至可以从手机上看到它的进度。等于你多了个 7×24 小时不睡觉的搭档。
OpenAI 团队自己管这个叫 “Codex 的黑魔法”。
4. Computer Use + 浏览器 — AI 能操作桌面了
Codex 目前能直接控制你的鼠标和键盘,在桌面上:
- 点按钮、填表单、拖文件
- 在浏览器里测试网页、看控制台报错、截图对比
- 操作那些没有 API 的软件界面
这意味着它不只是写代码,还能帮你测试代码。写完前端页面,让它自己打开浏览器看看效果对不对——你验收就行。
5. Memory 记忆系统 — 越用越懂你
Codex 目前能记住你的偏好、你的习惯、你之前纠正过它的东西。
列如你习惯用 TypeScript 不用 JavaScript、喜爱某个命名风格、对某个框架有特定写法偏好——说一次,它记着,下次不用再教。
这可能是最被低估的功能。 随着使用时间越长,Codex 会越来越”像你”。
六、进阶玩法
MCP 插件:给 Codex 装”外挂”
MCP 就是 AI 的插件系统。装了 Chrome DevTools MCP 后,Codex 能自动测试网页。装了 GitLab MCP 后,它能帮你管理 Issue 和 MR。
目前官方发了 90+ 插件,覆盖 CI/CD、项目管理、设计协作、数据库管理等领域。
安装方式(用提示词语法):
codex mcp add-json 插件名 '{“command”: “…”, “args”: […]}'
双 AI 联动:Claude Code + Codex
这是目前程序员圈子里流行的终极玩法:
Claude Code 当项目经理(拆任务、写框架、快速迭代) Codex 当技术专家(查深层 bug、长周期重构、桌面自动化)
在 Claude Code 里装 Codex MCP,遇到 Claude 搞不定的问题自动转发给 Codex,解决了再回来。
定时任务:让 Codex 自己看家
你可以给 Codex 设定定时任务:
- 每天早上 8 点检查昨晚的 CI 有没有挂掉
- 每周五生成项目进度报告
- 有新的 Issue 评论被 @ 到你时自动提醒
这些不是”让 AI 生成代码”,而是让 AI 像一个真正的团队成员那样参与工作流。
七、新手常见翻车点和排坑
翻车 1:直接选 codex 专业版模型
codex 专业版理解能力弱,你的需求稍微模糊一点,它就可能跑偏。新手先老老实实用 gpt-5 通用版 + high,熟了再说。
翻车 2:不跑 /init 就直接干活
Codex 不知道你的项目长什么样,直接让它写功能,很容易写出跟现有代码风格完全不同、甚至冲突的代码。进项目第一件事永远是 /init。
翻车 3:开了全通过权限
新手别逞能开”全自动”模式。Codex 有时候会自作主张删掉你觉得重大的代码。用”自动判断”模式,改文件前三思。
翻车 4:一个线程聊到底
一个对话线程塞了太多上下文后,Codex 会变慢、变”健忘”。及时用 /new 开新线程,每个线程聚焦一个任务。
翻车 5:装太多 MCP 插件
插件太多会拖慢响应速度,还容易出兼容性问题。只装你实际需要的,按需加。
翻车 6:App 装好不配 API Key 就想用
Windows 或 Mac 上装了 Codex App,打开发现没反应——由于你没配 API Key 或没登录 ChatGPT 账号。App 安装后需要登录授权,别以为装完就能直接干活。
翻车 7:App 的沙盒设成了”全开放”
App 设置里的 sandbox_mode,新手别手贱改成 danger-full-access。默认的 workspace-write 模式只在项目目录里动文件,够用了。全开放模式下,Codex 能摸到你电脑上任何文件。
八、总结:新手入门路线图
第 1 天:开通 Plus → 装 App(图形化上手) + CLI → 登录 → 换 gpt-5 模型 → 跑 /init
第 1 周:用 App 的对话面板让它帮你读代码、解释逻辑、打开文件侧边栏看项目结构
第 2 周:试试 /goal 长周期任务、Appshots 屏幕交互、应用内浏览器预览前端
第 3 周:装 1-2 个 MCP 插件,试试 Claude Code + Codex 双 AI 联动
第 4 周:设个定时任务,让 Codex 开始”看家”
Codex 不是来替代你的,是来给你配了个不睡觉的搭档。
它能帮你从重复性劳动(改样式、写样板代码、查日志、跑测试)里解放出来。省下的时间,去思考架构、去理解业务、去提升自己那些”AI 干不了”的能力。
2026 年了,不会用 AI 编程工具的程序员,就像 2010 年还在用记事本写代码的人。
(关注我,持续分享 AI 编程工具实战经验和开发者效率提升干货。)
本文基于 OpenAI Codex 官方 2026 年 4 月 16 日及 5 月 22 日更新内容撰写。