Codex 全场景使用攻略:Desktop、CLI、IDE 插件一篇看懂
一文讲清 Codex 三大形态——Codex Desktop(Compute Use 自动操控浏览器)、Codex CLI(新版 /goal 自动化)、VS Code/JetBrains 插件(类 Cursor 体验),含零基础安装步骤、典型场景、FAQ 与权威资料索引。
如果你最近频繁看到"Codex"被讨论,但又分不清它到底是网页、桌面应用、命令行还是 IDE 插件——这篇文章就是为你写的。
简单先下结论:Codex 现在是一整套产品矩阵。同一个底层模型,被打包成三种使用形态,分别覆盖三类完全不同的人群:
| 对比维度 | 正规平台 | 风险渠道 |
|---|---|---|
| 想“让 AI 自己动手”做事 | Codex Desktop + Compute Use:自动开浏览器、点按钮、抓数据 | 不需要编程基础,适合 vibe coding 玩家 |
| 想批量跑自动化、写脚本、做代码审查 | Codex CLI + /goal:命令行直接喂目标,自动完成多步任务 | 适合开发者、运维、SRE、数据工程师 |
| 想边看代码边改、像 Cursor 那样丝滑 | VS Code / JetBrains Codex 插件:内嵌侧栏对话与 inline diff | 适合日常写代码的工程师 |
下面把这三种形态一个一个拆开讲:是什么、能干什么、怎么装、坑在哪。文末附 FAQ 和权威资料索引,方便检索和二次确认。
第一部分:Codex Desktop —— 让 AI 帮你"动手"的桌面端#
Codex Desktop 是 OpenAI 推出的桌面应用,最大的卖点不是聊天,而是 Compute Use(计算机使用能力)——AI 可以直接接管你的浏览器和部分桌面操作,像一个真实助理那样替你完成任务。
1.1 什么是 Compute Use#
Compute Use 是 OpenAI 在 Operator/Computer Use 系列上演进出来的能力。它让模型不仅"知道答案",还能:
Compute Use 的核心能力
- ✓自动打开浏览器,访问指定网站
- ✓识别页面元素,点击按钮、填写表单、切换标签页
- ✓读取页面内容,把多页信息整理成结构化结果
- ✓多步骤任务编排,比如"搜索 → 比价 → 截图 → 写报告"一气呵成
- ✓可视化回放,你能看到它每一步在干什么,可以随时打断
通俗讲,过去你问 ChatGPT "帮我找一下深圳到香港最近一周机票",它只能给你思路;现在用 Codex Desktop + Compute Use,它真的会打开机票网站、输入日期、抓取价格、生成对比表。
1.2 为什么"不需要编程背景"#
这是 Codex Desktop 区别于 CLI 和 IDE 插件最重要的地方。它的交互是自然语言 + 屏幕,不是代码。
典型流程是:
打开 Codex Desktop
登录你的 ChatGPT 账号(Plus / Pro / Business 都可以,具体能力随订阅档位变化)。
新建一个任务
用大白话描述你想做什么,例如"帮我把这个 Notion 页面里的所有外链整理成 Excel"。
授权它使用浏览器
第一次使用时会弹出权限请求,确认后它会启动一个受控的浏览器实例。
盯着屏幕,必要时介入
它每一步都可视化,遇到登录、验证码、敏感操作会暂停等你确认。
整个过程你不需要写一行代码,也不需要懂 API、不需要懂 Selenium、不需要懂任何"自动化框架"。
1.3 集成浏览器与自动化优势#
很多人把 Codex Desktop 当作"会自己开浏览器的 ChatGPT",但它真正的优势在于把浏览器变成 AI 的工作台:
| 对比维度 | 正规平台 | 风险渠道 |
|---|---|---|
| 传统浏览器插件 | Codex Desktop 内置受控浏览器,无需另外装扩展 | 传统插件能力受网页权限限制,跨站操作很麻烦 |
| 本地 RPA 工具 | Compute Use 用视觉识别,不依赖固定 DOM,页面改版不容易崩 | RPA 脚本一旦页面结构变了就要重写 |
| 纯聊天 AI | 不只是回答你,能真正“动手”产出可下载的成果 | 纯聊天只能给你思路和文本 |
1.4 Vibe Coding:用 Desktop "创造"#
Vibe coding 是这两年兴起的说法,指的是"凭感觉、靠对话、靠氛围写代码"——不预先设计架构,不写规范文档,全靠和 AI 反复对话把想法变成可运行的产物。Codex Desktop 是目前对 vibe coding 最友好的形态之一:
Desktop 上 vibe coding 的常见玩法
- ✓做个人小工具:让它边搜资料边帮你拼一个本地小网页
- ✓复刻一个网站:截图 + "做一个长这样的页面",配合 Compute Use 自动调本地预览
- ✓抓取 + 可视化:自动浏览数据源、汇总成图表,全程无脚本
- ✓写自动报告:每天定时打开几个网站、汇总成日报、发到你的邮箱
1.5 安装步骤(macOS / Windows)#
确认订阅
Codex Desktop 的高级能力(特别是 Compute Use)需要 ChatGPT Plus / Pro / Business 订阅,且账号在支持区域。
官方下载
访问 OpenAI 官方 Codex 产品页面(参见文末权威资料),选择对应的 macOS(含 Apple Silicon)或 Windows 安装包。不要从第三方网盘下载,避免被植入劫持版本。
安装与首次登录
macOS 把 .dmg 拖入 Applications;Windows 双击 .exe 安装。打开后用 ChatGPT 账号登录,会自动同步你的订阅状态。
开启 Compute Use 权限
首次触发自动化任务时,系统会请求屏幕录制、辅助功能、网络访问等权限。只授予你需要的最小权限,不要全选。
跑一个 Hello World 任务
建议第一次任务选择"打开某个网页,提取一段公开信息"这种无风险动作,先熟悉它的可视化执行界面。
如果你还没有 ChatGPT 订阅,可以先看一下 ChatGPT Plus 充值指南 或 ChatGPT Pro 充值 比较一下档位选择再下手。
第二部分:Codex CLI —— 命令行里的"自动化合伙人"#
Codex Desktop 适合"动手做事",Codex CLI 适合"批量做事"。它是一个命令行工具,让你在终端里直接调用 Codex 的能力,写脚本、跑测试、做 code review,全都行。
2.1 CLI 的基础形态#
最基础的用法非常简单:
codex "把这个目录下所有 .ts 文件的导出全部改成 named export"
它会:
- 扫描当前目录
- 规划改动
- 列出会修改的文件
- 让你确认后再动手
整个过程像和一个真实的 Pair Programmer 对话,只是这位 Partner 全程住在终端里。
2.2 新版 /goal:从"指令"到"目标"#
/goal 是 Codex CLI 最近一次重要更新带来的能力。它把交互范式从"逐条命令"升级成"长期目标驱动":
| 对比维度 | 正规平台 | 风险渠道 |
|---|---|---|
| 传统 CLI 用法 | 你下一条命令,它执行一步,结果你再判断下一步 | 跑长任务要不停干预,断了就要重来 |
| /goal 模式 | 你说“把这个仓库的测试覆盖率提到 80%”,它自己拆解、循环执行、验证、回滚 | 适合多步骤、有验证标准、可以自动循环的目标 |
典型用法长这样:
codex /goal "把 src/ 下所有用 any 的地方改成精确类型,并保证 npm test 全绿"
它会自己进入一个循环:改 → 跑测试 → 看失败 → 再改 → 再跑,直到目标达成或者卡在某一步主动求助。
2.3 适合 CLI 的几个核心场景#
Codex CLI 高 ROI 场景
- ✓Vibe coding 自动化:用一句话让它把整个原型从无到有跑起来
- ✓自动化测试:生成单元测试、补齐边界用例、批量提高覆盖率
- ✓集成测试:通过 /goal 让它跑 e2e、看日志、反复修脚本直到全过
- ✓Code Review:在 PR / commit diff 上跑 Codex CLI,让它指出风险、不规范写法、潜在 bug
- ✓重构脚本:批量改命名、迁移依赖、升级框架版本
- ✓CI 钩子:在 GitHub Actions 里把 Codex CLI 当成一个"自动化审查员"
2.4 安装步骤#
CLI 安装本身非常轻量,有 Node.js 基本就行:
准备环境
建议 Node.js 20 或更高。macOS 用 Homebrew,Windows 用官方安装包或 WSL2 都可以。
全局安装
在终端执行(具体包名以官方文档为准):npm install -g @openai/codex
登录授权
第一次运行 codex 会引导你完成账号授权,可以用 ChatGPT 订阅登录,也可以用 API Key。
启用 /goal 等新指令
升级到最新版后,在交互模式下输入 /help 可以看到所有可用指令,包括 /goal、/plan、/diff 等。
第一个真实任务
选一个低风险的目录,比如个人项目,先跑一遍 "写一份 README" 之类的小任务,熟悉它的确认/差异界面。
2.5 在 CI 里跑 Codex CLI 做 Code Review#
简单示例(伪代码示意,实际语法以官方文档为准):
# .github/workflows/codex-review.yml
name: Codex Review
on: [pull_request]
jobs:
review:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- run: npm install -g @openai/codex
- run: codex review --base=origin/master --report=review.md
env:
OPENAI_API_KEY: ${{ secrets.OPENAI_API_KEY }}
- uses: actions/upload-artifact@v4
with: { name: codex-review, path: review.md }
跑起来之后,每个 PR 会自动产出一份 Codex 写的 review 报告。这不是替代人审,是省掉重复的初筛——风格问题、明显遗漏、低级 bug,先让它过一遍。
第三部分:VS Code / JetBrains Codex 插件 —— 类 Cursor 的"丝滑边写边改"#
如果你日常就在 VS Code(或 JetBrains 全家桶)里写代码,完全不需要切到 Desktop 或 CLI——直接装 Codex 官方插件,把能力嵌进 IDE。
3.1 它和 Cursor 的关系#
很多人第一次用过 Cursor 后回不去,原因就是它把 AI 和编辑器深度结合了:选中代码就能让 AI 改、整段重写、生成测试一键搞定。
Codex 插件做的事情很类似,主要包括:
Codex IDE 插件的核心能力
- ✓Inline 修改:选中一段代码 → 自然语言描述 → 直接生成 diff,预览后再决定接受
- ✓侧栏对话:和当前文件 / 整个工作区上下文做问答,类似 Copilot Chat 但更主动
- ✓多文件编辑:让它跨文件改一组相关代码,统一接受/回滚
- ✓任务编排:把 CLI 里的 /goal 那套搬到 IDE,可视化看每一步
- ✓和本地终端共享上下文:它能看到你正在调试的输出,进一步参与
3.2 为什么"适合边看代码边修改"#
IDE 插件最大的价值不是"更快",而是保留你的判断权:
| 对比维度 | 正规平台 | 风险渠道 |
|---|---|---|
| Desktop / CLI | 适合大块、独立、可批量的任务 | 对正在调试中的代码不太适合 |
| IDE 插件 | 每一次改动你都能在编辑器里直接看到、对比、采纳或拒绝 | 更慢一些,但反馈循环更细 |
| Cursor 风格 | 选中即改、Cmd+K 速成,工作流几乎零摩擦 | 需要适应它接管编辑器的方式 |
这也是为什么很多团队推荐**"日常写代码用 IDE 插件,跑大任务切到 CLI"**——两边数据是打通的,不冲突。
3.3 安装步骤(VS Code)#
打开 VS Code 扩展面板
快捷键 Cmd/Ctrl + Shift + X,在搜索框输入 "Codex"(或 "OpenAI Codex")。
确认官方发布者
只装发布者是 OpenAI 的版本,谨防同名第三方插件。装完先看一眼权限请求。
登录
点击侧边栏的 Codex 图标,用 ChatGPT 账号登录,或填写 API Key。
试一下 Inline Edit
随便打开一个文件,选中一段代码,按 Cmd/Ctrl + I 之类的触发键(具体看插件文档),用一句话描述你想改成什么样。
把侧栏对话用起来
对于跨文件、需要解释整体逻辑的任务,用侧栏 chat。它默认能看到当前打开的文件,节省你不停粘贴代码的功夫。
JetBrains 系(IntelliJ / WebStorm / PyCharm 等)的安装路径几乎一样:Settings → Plugins → Marketplace 搜 Codex,认准官方发布者。
3.4 让 IDE 插件像 Cursor 一样丝滑的几个小技巧#
三者怎么选?一张表说清#
| 对比维度 | 正规平台 | 风险渠道 |
|---|---|---|
| 目标用户 | Desktop:非程序员 / vibe coder;CLI:开发者 / SRE;IDE 插件:日常编码工程师 | 走错形态会觉得“难用”——其实是没匹配场景 |
| 核心能力 | Desktop:Compute Use 操控浏览器;CLI:/goal 长任务循环;IDE:Inline Edit + 侧栏对话 | 不要拿 Desktop 写代码、也不要拿 IDE 插件抓网页 |
| 学习曲线 | Desktop ≈ 0;IDE ≈ 0.5 天;CLI ≈ 1–2 天(要熟悉指令) | CLI 看似难,但一旦熟了 ROI 最高 |
| 是否需要订阅 | Desktop / IDE 多数能力随 ChatGPT 订阅解锁;CLI 也可走 API Key 计费 | 频繁跑 /goal、Compute Use 任务时,注意账号配额 |
如果你正在考虑订阅哪一档,可以参考:
- ChatGPT Plus 充值指南:日常 vibe coding、IDE 插件够用
- ChatGPT Pro 充值:跑 Compute Use、长任务 /goal 更稳
- ChatGPT vs Claude vs Gemini 横评:横向看一遍再决定
总结:三种形态,一个 Codex#
Codex 不是一个"App",而是 OpenAI 围绕代码与自动化能力做的一整条产品线:
结论速记
- ✓Codex Desktop + Compute Use:让 AI 替你操作浏览器和桌面,零编程门槛,最适合 vibe coding
- ✓Codex CLI + /goal:在终端跑长任务,最适合自动化测试、集成测试、code review 和 CI 集成
- ✓Codex IDE 插件:内嵌 VS Code / JetBrains,类 Cursor 的丝滑边看边改,最适合日常编码
真正高效的用法不是三选一,而是组合拳:用 Desktop 起点子,用 CLI 跑批量,用 IDE 插件精修。每一步都可控、可回滚、可观察。
FAQ:搜索引擎与生成式引擎常被问到的问题#
Q1:Codex 是免费的吗?#
Codex 的桌面端、CLI、IDE 插件本身免费下载,但要触发模型能力,需要 ChatGPT 订阅(Plus / Pro / Business / Enterprise)或绑定 OpenAI API Key 按量计费。Compute Use 等高级能力通常需要更高档位的订阅。
Q2:Codex Desktop 和 ChatGPT 桌面版是同一个吗?#
不是同一个产品形态。ChatGPT 桌面版是聊天为主;Codex Desktop 在它基础上加上了 Compute Use、长任务编排、代码与自动化场景。具体融合情况会随版本演进,以官方文档为准。
Q3:没有编程经验,能用 Codex Desktop 干什么?#
可以做这些事:
- 自动浏览多个网站、整理对比信息(机票、酒店、商品)
- 把一段 PDF / 网页内容转成结构化表格
- 让它"做一个长这样"的小网页,全程不写代码
- 重复性日常操作,比如每天打开某些站点抓取数据发到邮箱
Q4:Compute Use 安全吗?#
Compute Use 在受控环境内运行,每一步都有可视化,可以随时暂停。但安全核心在用户自己:不要授权它登录敏感账户、不要让它执行不可逆操作(删数据、付款、发邮件)而不二次确认。
Q5:Codex CLI 的 /goal 和普通 Prompt 有什么区别?#
/goal 是一个长期目标驱动的运行模式。它会把目标拆解成多步、自动验证、循环改进,直到达成或主动求助。普通 prompt 是一次性问答,/goal 是带闭环的自动化执行。
Q6:Codex CLI 适合放进 GitHub Actions 做 Code Review 吗?#
适合,但建议作为初筛而不是替代人审。它能稳定指出格式问题、明显遗漏、潜在 bug,但架构判断、业务上下文还是要人来把关。
Q7:Codex IDE 插件和 GitHub Copilot 是什么关系?#
两者都做代码补全与对话,不冲突可以共存。粗略区别:Copilot 在补全/小段建议上很强;Codex 插件在长任务、多文件编辑、和 CLI / Desktop 数据打通上更强。很多人会同时装。
Q8:Codex 插件和 Cursor 哪个更好?#
不分高下,看习惯:
- Cursor:把 AI 编辑器做到了极致,但需要切换 IDE
- Codex 插件:让你继续用 VS Code / JetBrains,把生态保留下来
如果你团队都在 VS Code 上,Codex 插件迁移成本最低;如果你愿意换编辑器,Cursor 上手体验更激进。
Q9:账号会因为大量自动化任务被风控吗?#
存在概率。频繁、剧烈、跨地域的自动化行为有可能触发账号验证。关键是控制节奏,必要时手动接管。如果遇到验证弹窗,可以参考站内 Codex 突然弹出手机号验证。
Q10:在中国大陆能正常用 Codex 吗?#
需要满足两个前提:
- 账号在支持的国家/地区,并完成必要的手机号验证
- 网络可以稳定访问 OpenAI 服务
订阅充值方面,可以参考 ChatGPT Plus 充值指南 与 正规充值平台安全指南 选择合适方式。
Q11:Codex 会不会偷看我的代码?#
这是企业用户最关心的问题。官方有明确的数据使用政策(个人 / 企业账号策略不同,企业版默认不用于训练)。核心建议:
- 重要项目用企业版或自己的 API Key
- 不要把密钥、私钥、数据库连接串等敏感信息直接贴给它
- 配置好
.gitignore和忽略规则,限制它能看到的范围
Q12:Codex Desktop / CLI / 插件,新手应该先从哪个上手?#
按这个顺序最稳:
- 完全不会编程:直接 Desktop,先体验 Compute Use
- 会用 VS Code:先装 IDE 插件,从 Inline Edit 开始
- 想搞自动化、CI、批量任务:再上 CLI,重点掌握 /goal
权威资料索引(一手来源)#
以下都是官方或一手来源,建议作为你后续深挖时的入口,避免被二手内容误导:
官方与权威资料
- ✓OpenAI 官方网站:https://openai.com — 产品总入口
- ✓OpenAI Codex 产品页:https://openai.com/codex — 最新形态与功能介绍
- ✓OpenAI 开发者平台:https://platform.openai.com — API、模型与计费
- ✓OpenAI 官方文档:https://platform.openai.com/docs — Codex / Compute Use / Responses API 全部以这里为准
- ✓OpenAI Help Center:https://help.openai.com — 订阅、账号、验证类问题官方答复
- ✓OpenAI GitHub 组织:https://github.com/openai — CLI / SDK 等开源代码与 Issue 区
- ✓OpenAI Status:https://status.openai.com — 排查"是不是又挂了"
- ✓VS Code 插件市场:https://marketplace.visualstudio.com — 搜索官方发布者名称下载
- ✓JetBrains 插件市场:https://plugins.jetbrains.com — 同上,确认 Verified 发布者
继续阅读
相关文章推荐
GPT-Image2 / ChatGPT Images 2.0 解读:新一代 AI 图像生成到底强在哪?
一篇讲清 GPT-Image2 与 ChatGPT Images 2.0 的命名关系、核心能力、适用场景、可用范围和使用注意事项。
Claude 使用指南:为什么 Claude Code 和 Opus 4.6 更像真正的生产力助手
想把 Claude 用成稳定生产力,而不是偶尔问几句?这篇文章从 Claude Code、Opus 4.6、充值方式到风险边界,讲清楚国内用户怎么更务实地上手。
5个用 AI 工具提高工作效率的实用技巧
不谈空泛的"AI 改变世界",只讲 5 个能立刻放进日常工作流的小技巧,帮你把 ChatGPT、Claude、Gemini 真正用起来。