OpenAI Codex 2026 新手入门指南:从安装到锁屏干活,一篇讲透

内容分享2小时前发布
0 1 0

还在手动敲代码?这个 AI 已经能在你锁屏的时候帮你干活了。

一、先搞清楚:Codex 到底是什么?

许多人以为 Codex 就是个写代码的 AI。这个理解有点窄——准确地说,它目前是覆盖整个开发流程的 AI 代理工作台

OpenAI 在 2026 年对 Codex 做了两次大升级:

  • 4月16日:一口气加了 Computer Use(全系统操作)、Memory(记忆系统)、ImageGen(图像生成)、90+ 插件生态、浏览器控制等能力
  • 5月22日:上线 Appshots(屏幕快照增强)、/goal 长周期自主编码正式版、锁屏运行、团队插件共享、分析看板升级

一句话定位:Codex = AI 编程助手 + 自动化工作台 + 7×24 小时数字员工

二、跟 Claude Code 比,该选谁?

这是新手最常问的问题,直接给结论:

Claude Code

Codex

速度

慢(但越来越快)

查 bug

一般

精准到行号

代码细节

过得去

极强

多轮对话

中等

桌面操作

可操作本机应用

长周期任务

需持续关注

可锁屏自主运行

推荐组合用法:日常让 Claude Code 当主力(执行快、理解好),遇到复杂 bug、长周期任务、需要桌面操作时,扔给 Codex。

两者不是竞争关系,是搭档关系。

三、三步上车:安装、配置、激活

Step 1:开通付费

Codex 需要 ChatGPT 付费会员才能用。开通 ChatGPT **Plus($20/月)**或 **Pro($200/月)**即可。

新手选 Plus 足够了。Pro 多出来的主要是调用次数和推理强度,日常开发用 Plus 完全够。

Step 2:安装 Codex CLI

Codex 有三种使用方式:

  • 网页版:直接在 ChatGPT 网页端用,最省事
  • IDE 扩展:在 VS Code 等编辑器里用
  • CLI 命令行版:功能最全,推荐

安装 CLI(命令行版),一行命令搞定:

npm install -g @openai/codex

前提是你的电脑装了 Node.js(版本 ≥ 22)。

如果 NPM 下载慢,加个国内镜像:

npm install -g @openai/codex –registry=https://registry.npmmirror.com

Mac 用户也可以用 Homebrew:

brew install codex

安装完在终端输入 codex,回车,首次需要登录你的 ChatGPT 账号。

Step 3:关键初始配置

进了 Codex 之后,做三件事:

① 切换模型:输入 /model,选 gpt-5 通用版(不是 codex 专业版),推理强度设 high。

为啥不选 codex 专业版?由于通用版理解能力更强,新手不容易被 AI”误解”。专业版适合那种你对需求超级清晰、就要它出代码的场景。

② 设置权限:输入 /approvals,选「自动判断」模式——读文件自动通过,改文件弹窗确认。既安全又不耽误事。

③ 初始化项目:在项目目录下运行 codex,然后输入 /init,让 Codex 先扫描一遍项目结构,建立上下文。这一步很重大,别跳过。

四、Codex App 桌面应用完整指南

许多人装完 CLI 就完事了,实则 Codex 还有一个桌面应用(Codex App),这才是完整形态。

如果说 CLI 是代码编辑器里的终端,那 Codex App 就是一个集成开发工作台。下面把它拆开讲。

4.1 怎么装 Codex App?

Mac 用户

从 Mac App Store 搜索 “Codex” 直接下载安装。或者用官方直链:

https://persistent.oaistatic.com/codex-app-prod/Codex.dmg

双击 .dmg,拖进 Applications 文件夹即可。

Windows 用户

打开 Microsoft Store,搜索 “Codex”,或直接访问:

https://apps.microsoft.com/detail/9plm9xgg6vks

点击”获取”,系统要求 Windows 10 19041 以上。

安装后登录 ChatGPT 账号(Plus 及以上),授权完成就能用了。

4.2 界面布局:每个模块干什么?

打开 Codex App 后,你会看到这样的布局:

① 对话面板(中间,主区域)

这就是你跟 Codex 对话的地方。支持多行输入(Alt + Enter 换行)、拖拽文件(按住 Shift 再拖)、粘贴代码块。

左上角有标签页可以开启多个对话线程,每个线程独立上下文。输入 /new 新建线程,输入 /init 让 Codex 扫描当前项目。

② 文件侧边栏(左侧)

可以浏览当前项目的文件结构。不止是看代码——它能直接预览 PDF、Excel 表格、PPT、Word 文档。

这意味着什么?你把产品需求文档(PRD)、接口设计表、测试用例表格扔进项目目录,Codex 就能直接读这些文件的内容来做开发决策。

③ 终端标签页(底部,多标签)

Codex App 内可以同时运行多个终端 Tab。一个跑 dev server,一个看日志,一个跑测试——跟真实开发者的工作习惯完全对齐。

Windows 下可选终端类型:PowerShell、Command Prompt、Git Bash、WSL。

Agent 运行模式也可以独立切换:

  • Windows Native(默认):命令在 PowerShell 执行,使用 Windows 沙盒
  • WSL Agent:切到 WSL 环境运行,适合 Linux 项目

④ Summary 总结面板(右侧/底部)

这个面板会实时显示 Codex 的当前计划、使用了哪些数据源、产出了哪些文件——让长链路任务有透明度

列如你让 /goal 跑一个重构任务,Summary 面板会告知你:

  • 它目前在做什么步骤
  • 读了哪些文件来获取上下文
  • 为什么要做当前这个操作
  • 已经完成了什么、还剩什么

不是黑箱,你能随时掌握进度。

⑤ 应用内浏览器(内置)

Codex App 里内嵌了一个浏览器。前端工程师可以直接在 App 里预览页面效果,然后用浏览器标注工具在上面画圈、标注需要调整的元素,Codex 自动读取标注并修改代码。

典型场景:写完前端页面 → 浏览器打开 localhost → 发现按钮颜色不对 → 标一下 → Codex 自己改。

⑥ 设置面板(File → Settings)

关键设置项:

设置项

选项

说明

模型

gpt-5 / codex 专业版

新手用 gpt-5

推理强度

low / medium / high / xhigh

复杂任务选 high

权限模式

只读 / 自动判断 / 全通过

新手选自动判断

默认编辑器

VS Code / Visual Studio / 其他

设置”在编辑器中打开”的目标

集成终端

PowerShell / Git Bash / WSL

Windows 用户按需选

沙盒模式

workspace-write / danger-full-access

新手保持默认

界面语言

English / 中文(中国)

英文界面不想看?切中文

Windows 用户重点注意:“Agent 运行模式”和”集成终端类型”是两个独立的设置。前者决定 Codex 在什么环境跑命令,后者决定你手动操作时用什么终端。

4.3 Codex App 独有的功能

App 有,CLI 没有的:

功能

App

CLI

文件预览(PDF/Excel/PPT)

应用内浏览器 + 标注

多终端标签页

图形化设置面板

Summary 可视化面板

插件市场浏览

SSH 远程连接

✅(Alpha)

4.4 App vs CLI,新手怎么选?

两个都装。

  • 日常交互:用 App,体验好。看文件、看进度、调设置都方便
  • 写命令/脚本自动化:用 CLI,一条命令搞定
  • CI/CD 集成:用 CLI,能在流水线里调用

App 和 CLI 共享同一个账号数据和配置(.codex/config.toml),你不用纠结数据同步问题。

App 操作效率小技巧:

  • 拖文件到对话:按住 Shift,把文件拖进对话框
  • 换行输入:Alt + Enter(Windows)或 Option + Enter(Mac)
  • 快速截图给 Codex:Mac 双击 Command(Appshots),Windows 用截图工具再粘贴
  • 中断 Codex 响应:Ctrl + C

五、五大核心功能,上手就能用

1. Appshots — 双击 Command,AI 看懂你的屏幕

这个功能是 5 月新上的,简单说就是:双击 Mac 的 Command 键,Codex 就能”看到”你当前的窗口内容

不只是截图——它能读出窗口里所有文字,包括你没滚动到的部分。列如一个很长的网页、一份邮件、一段 API 文档,它都能完整读取。

然后你就可以直接在对话里说:”帮我把这个按钮改成蓝色”、”按照这个 API 文档写个调用代码”。不用复制粘贴,不用截图。

更智能的是:如果你 60 秒内跟同一个对话线程有过交流,新的 Appshot 会自动追加进去,不会乱开新对话。

2. /goal — 设个目标,AI 自己干

在 Codex 里输入 /goal,告知它你要做什么,然后你就可以去泡杯咖啡了。

列如:”帮我重构这个支付模块,把回调逻辑拆成三个独立服务,写完整测试。”

Codex 会自动分解任务、逐个执行、遇到问题自己尝试修复。它可能跑几个小时,不需要你盯着。

中途你可以随时查看进度、调整方向,或者在终端用 Ctrl+C 暂停它。

这是 Codex 跟传统 AI 编程工具最本质的区别:不是”你发指令然后等结果”,而是”你定目标,它持续执行”

3. 锁屏运行 — 电脑锁了,AI 还在干

这个是 5 月大更新里最让程序员兴奋的功能。

在 Codex 设置里打开 Locked Use 开关,然后你合上电脑走人,Codex 照样在后台跑。

你甚至可以从手机上看到它的进度。等于你多了个 7×24 小时不睡觉的搭档。

OpenAI 团队自己管这个叫 “Codex 的黑魔法”

4. Computer Use + 浏览器 — AI 能操作桌面了

Codex 目前能直接控制你的鼠标和键盘,在桌面上:

  • 点按钮、填表单、拖文件
  • 在浏览器里测试网页、看控制台报错、截图对比
  • 操作那些没有 API 的软件界面

这意味着它不只是写代码,还能帮你测试代码。写完前端页面,让它自己打开浏览器看看效果对不对——你验收就行。

5. Memory 记忆系统 — 越用越懂你

Codex 目前能记住你的偏好、你的习惯、你之前纠正过它的东西。

列如你习惯用 TypeScript 不用 JavaScript、喜爱某个命名风格、对某个框架有特定写法偏好——说一次,它记着,下次不用再教。

这可能是最被低估的功能。 随着使用时间越长,Codex 会越来越”像你”。

六、进阶玩法

MCP 插件:给 Codex 装”外挂”

MCP 就是 AI 的插件系统。装了 Chrome DevTools MCP 后,Codex 能自动测试网页。装了 GitLab MCP 后,它能帮你管理 Issue 和 MR。

目前官方发了 90+ 插件,覆盖 CI/CD、项目管理、设计协作、数据库管理等领域。

安装方式(用提示词语法):

codex mcp add-json 插件名 '{“command”: “…”, “args”: […]}'

双 AI 联动:Claude Code + Codex

这是目前程序员圈子里流行的终极玩法:

Claude Code 当项目经理(拆任务、写框架、快速迭代) Codex 当技术专家(查深层 bug、长周期重构、桌面自动化)

在 Claude Code 里装 Codex MCP,遇到 Claude 搞不定的问题自动转发给 Codex,解决了再回来。

定时任务:让 Codex 自己看家

你可以给 Codex 设定定时任务:

  • 每天早上 8 点检查昨晚的 CI 有没有挂掉
  • 每周五生成项目进度报告
  • 有新的 Issue 评论被 @ 到你时自动提醒

这些不是”让 AI 生成代码”,而是让 AI 像一个真正的团队成员那样参与工作流

七、新手常见翻车点和排坑

翻车 1:直接选 codex 专业版模型

codex 专业版理解能力弱,你的需求稍微模糊一点,它就可能跑偏。新手先老老实实用 gpt-5 通用版 + high,熟了再说。

翻车 2:不跑 /init 就直接干活

Codex 不知道你的项目长什么样,直接让它写功能,很容易写出跟现有代码风格完全不同、甚至冲突的代码。进项目第一件事永远是 /init

翻车 3:开了全通过权限

新手别逞能开”全自动”模式。Codex 有时候会自作主张删掉你觉得重大的代码。用”自动判断”模式,改文件前三思。

翻车 4:一个线程聊到底

一个对话线程塞了太多上下文后,Codex 会变慢、变”健忘”。及时用 /new 开新线程,每个线程聚焦一个任务。

翻车 5:装太多 MCP 插件

插件太多会拖慢响应速度,还容易出兼容性问题。只装你实际需要的,按需加。

翻车 6:App 装好不配 API Key 就想用

Windows 或 Mac 上装了 Codex App,打开发现没反应——由于你没配 API Key 或没登录 ChatGPT 账号。App 安装后需要登录授权,别以为装完就能直接干活。

翻车 7:App 的沙盒设成了”全开放”

App 设置里的 sandbox_mode,新手别手贱改成 danger-full-access。默认的 workspace-write 模式只在项目目录里动文件,够用了。全开放模式下,Codex 能摸到你电脑上任何文件。

八、总结:新手入门路线图

第 1 天:开通 Plus → 装 App(图形化上手) + CLI → 登录 → 换 gpt-5 模型 → 跑 /init
第 1 周:用 App 的对话面板让它帮你读代码、解释逻辑、打开文件侧边栏看项目结构
第 2 周:试试 /goal 长周期任务、Appshots 屏幕交互、应用内浏览器预览前端
第 3 周:装 1-2 个 MCP 插件,试试 Claude Code + Codex 双 AI 联动
第 4 周:设个定时任务,让 Codex 开始”看家”

Codex 不是来替代你的,是来给你配了个不睡觉的搭档。

它能帮你从重复性劳动(改样式、写样板代码、查日志、跑测试)里解放出来。省下的时间,去思考架构、去理解业务、去提升自己那些”AI 干不了”的能力。

2026 年了,不会用 AI 编程工具的程序员,就像 2010 年还在用记事本写代码的人。

(关注我,持续分享 AI 编程工具实战经验和开发者效率提升干货。)

本文基于 OpenAI Codex 官方 2026 年 4 月 16 日及 5 月 22 日更新内容撰写。

© 版权声明

相关文章

1 条评论

none
暂无评论...