Codex CLI

基于云的软件工程智能体。...

【产品介绍】

一款基于云的软件工程智能体,可以并行处理多项任务。

【产品功能】

Codex 可以为您执行各种任务,如编写功能、回答有关代码库的问题、修复错误和提出拉取请求以供审核;

每项任务都在自己的云沙箱环境中运行,并预装了您的存储库。

13 个评论

降临派6617

codex 已经作为我的主力 AI coding 工具使用半个月了,完全替代了 Claude Code

优点:

1. 给出的代码可用性极高,基本上 review 一下就能用了。之前 Claude Code 有时候会跑偏,没有充分理解项目,经常重复造轮子。而且感觉 Claude Code 越更新越降智了。

2. token 消耗量比 Claude Code 低了一大截,之前为了 Claude Code 买的月卡,转成 Codex 后根本用不完。

缺点:

1. 输出结果太慢了,一直在思考。只能多开session, 等一个跑完再去 review 了。

2. 配套设施太简陋了,基本只用对话管理功能。好在给出的代码质量够高,也不需要其他功能辅助了。

3. rust 沙箱本意是好的,但是远程服务器的 kernel 版本太低,不支持沙箱,导致 codex 一直在想办法绕过沙箱,用 cat/echo/python 修改代码,太抽象了。所以我现在都是把沙箱关了。

tips:AGENTS.md 里面可以请神 Linus, 用 Linus 编程哲学规范 codex 的行为。当然他也会很严苛,要求你一定要把需求说清楚,作为用户要做好和 codex 吵架的准备。

oil 欧呦

我是搭配 GPT5 High 模型使用的,第一个执行的指令就能感觉出来比 Claude Code + Claude 4 Sonnet 效果更好,指令遵循性超级强,以前如果有复杂的功能需要提前设计方案我会使用 Gemini 2.5 Pro 先做方案,然后再让 Claude 实施,但是使用 codeX 我已经不需要再切出去用 Gemini 了,它的方案设计很完善,实施的时候也很稳定,除了输出速度比 Claude 慢很多,其他方面几乎没啥缺点,而且在编程的场景,很多时候慢就是快,一次稳定的输出胜过缝缝补补几个来回。上下文也比 Claude 长很多,而且每一次完成任务后,他会自己反思有哪些可以继续优化的点,然后通过带序号的分点展示出来,我们下一次对话只要简单输入序号就好了(可以看图二)。由于执行速度比较慢,我一般都会把 approval 改为 Full Access,相当于 Claude Code 的 --dangerously-skip-permissions 这样它就可以自己长时间的执行任务了。

我用 CodeX 实现了自己用的维护产品特性列表的小工具,使用 DND 实现拖拽排序的效果,全程没有什么返工的情况。而且在让它实现一些 AI 相关的功能的时候,它能够自己想是不是需要用流式输出, Prompt 要如何设计,是不是可以复用组件等,把很多我自己想要一步一步实现的功能提前想到了。在之前使用 Claude 的时候,由于幻觉问题,它经常把我明确说明的某个模型给修改,比如我说要用 GPT-5,它会认为 GPT-5 还没发布,偷偷改成 GPT-4o 了,而 CodeX 就不会这样,用了一周之后几乎不再想用 Claude 模型了。非常推荐!

怒了

优点:

1.你的plus会员又又又增值了,不需要api,plus账号登录就能用

2.写的代码比较干净,修改一个功能不会对整段代码块重构也不会添加很多comment,最小化修改的地方

缺点:

1.功能还不够完善,对应的vscode插件中,checkpoint,diff,better ui这些都没有

2.对win支持不够完善,点击approve this session后,竟然还会向我询问

总结:还蛮好用的,未来会更好用

第三个火枪手

Codex >> Claude Code

我现在已经让 Codex 主要负责编程,而 Claude Code 主要负责命令行杂活(比如 Git 操作、测试、写文档等)

优点:

  • 没有 “You are right...”,Codex 会认真思考你给出的方案并且提出合理且适当的质疑,不像 Claude Code 一样没有任何建设性的作用,只是带着你沿着错误的道路一直走下去

  • 极强的指令遵循能力,极少做你没有要求的事情

  • 不论是写代码还是做代码理解还是做架构设计,都远超 Claude Code

缺点:

  • UX 没有 Claude Code 少(但这不是重点)

  • “@” 无法引用目录

我的编码循环:

  • 与 Codex 讨论新功能

  • Codex 出 Plan -> Markdown Doc

  • Claude Code 根据 Doc 快速 Verify

  • Codex 写代码,Claude Code verify 每一个 Commit 并且跑测试

  • Codex 完成所有代码,Claude Code 写 integration test,回归测试

kamiyd

Codex上手体验真的很惊艳,原来这就叫专业,OpenAI 终于下场和 Anthropic 抢人了,除了慢亿点点外,效果真的很不错,“慢工出细活”嘛,可以理解~Plus最值的一次!

神奇小喷菇AIGC

重要的事情说三遍!省钱!省钱!巨省钱!我用的第三方api,gpt5 high 每调用一次才扣0.02美元到0.03左右,随着上下文增多后价格也会增加,但是相比claude 4系列还是要省好多钱,1美元可以调用好多次哈哈,我用它做了一款web3监控大户地址的工具,目前只是模拟数据,还在制作中,openAi这次真是大善人开恩,让我这种编程文盲也能爽爽用,用嘴编程目前还是很难,好多东西不懂就找不到问题瞎转浪费时间,但现在的ai工具已经能够让我这样的小白用嘴做小工具了,感谢openai把价格打下来

夜幕

codex这个模型我感觉真不错在代码方面,虽然慢,但是他准确性高,不过就是codex cli有点简陋,不过现在0.47版本比之前0.3x版本哪些好多了。不过好像在 windows 中使用会有点bug,我现在一般都是在wsl中使用

晓尘Louie

优点:
1. 相对来说比CC便宜,充plus会员还能同时用ChatGPT对我来说几乎就是免费送的了功能了
2. 测试下来codex的代码规范性会比其他的AI coding工具会好,相对来说比较适合写后端

缺点:
1.非常非常的慢,我CC转10轮了,codex还在跑第一轮

2.有时候会发神经直接删掉我的文件然后复原不回去,然后他还不带rewind功能,只能重新git回去

降临派 3059

在后端上效果比cc好很多,干活比较细节,bug就是太久了,适合晚上世界前,安排好任务,睡醒验收

fancyboi999

Codex CLI 可以说是 是一个非常有前途的工具。它在「把那些重复性、规则明确的小任务从脑子里挪出来」这块做得很好。它既能生成代码、修 bug、做改进建议,也能反思优化、分阶段执行。你目前把它当主力工具用来替换 Claude Code,是有道理的。

但我不会说它是完美无缺的。对于跨模块重构、大型项目重构、多回合复杂协作任务,它还没完全成熟(在你和外界的反馈里都有这个趋势)。就像你说的,“慢就是快,一次稳定的输出胜过缝缝补补几个来回”——这个比喻很贴。

作为一名原生Vibe coding程序员,感觉在当下AI还只是Copilot,尽管他已经足够强大可以调用各种工具,但是还会有出错不清晰的地方。所以我给自己/给你这样的人建议把它当成“主力助理”,而不是“全场替代者”。有些任务还得人工接管。