作者 | 陈骏达

编辑 | 心缘

Codex,打了场漂亮的翻身仗。

今年6月3日,OpenAI披露,其Agent产品Codex的周活跃用户已经突破500万,而这一数字在2026年初还仅有60万左右。5个月时间,Codex周活用户数量增长了730%。

被骂了一年的Codex,怎么突然爆了?

Codex并非像ChatGPT那样一经问世便引爆市场的明星产品,恰恰相反,从2025年4月Codex CLI发布到2026年初的相当长一段时间里,它甚至有些“存在感不足”

在技术社区里,关于Codex的讨论始终热度不高,而相同形态的Claude Code则迅速占领开发者心智。2026年3月,市场分析机构Presenc AI的数据显示,2026年第一季度,Claude Code的周活用户数量达420万,彼时Codex的周活用户不超过100万,不到Claude Code的1/4。

Claude Code凭借更强的口碑和更贴近开发者的交互体验,几乎成了终端AI编程的代名词。驱动Codex的OpenAI GPT系列模型在开发者群体里的口碑,也被Anthropic的Claude系列模型压过一头。

然而,也正是从2026年第一季度末开始,Codex逐渐走出了困境。随着多个重磅更新的陆续推出,Codex摇身一变成为OpenAI增长最快的产品之一,其周活用户数量从200万攀升至300万耗时大约4周,300万到400万仅耗时大约2周,从400万到500万耗时大约4周,增速惊人。

Codex的用户群体也在不断丰富,使用场景早已超越软件工程,目前其大约20%的用户,是非开发者的知识工作者。

那么,一个原本不温不火的产品,究竟是如何被重新激活的?

一、

错过第一波浪潮:

Codex为何长期不温不火?

如果回顾Codex刚刚发布时的处境,会发现它并不是一个被市场普遍看好的项目。

首先,它进入市场的时间并不理想。2025年初,AI编程工具已经完成了第一轮市场教育。GitHub Copilot让开发者习惯了AI辅助写代码,Cursor则率先验证了AI IDE路线,先于Codex发布的Claude Code,迅速树立了“Agentic自主编程”的行业标杆。

2025年4月17日,OpenAI在YouTube上发了条视频,宣告了Codex CLI的到来,杀进了AI编程工具这一拥挤的赛道。当时,Codex只有CLI一个形态,长得几乎和Claude Code一模一样,都是跑在终端里的命令行工具。

被骂了一年的Codex,怎么突然爆了?

▲初代Codex CLI

在那条视频的评论区里,舆论风向几乎一边倒地倾向于唱衰OpenAI,网友们纷纷发表风凉话。

这种情绪集中体现在几条高赞评论中。有网友直言:“OpenAI终于意识到Anthropic做对了。”还有人带着讽刺的口吻评论道:“谢谢Anthropic,你们用Claude Code把OpenAI拉回了正轨。

被骂了一年的Codex,怎么突然爆了?

更有网友翻起了旧账,直指OpenAI过去一系列模仿Anthropic的行为:“先是Canvas,又是Codex。Anthropic搞创新,OpenAI照着抄。真心觉得Anthropic做得好,我挺你们。”

被骂了一年的Codex,怎么突然爆了?

除了外部环境逆风之外,OpenAI自身也没有像今天这样全力推动Codex。从官方表述来看,Codex最初更接近研究性质项目,与ChatGPT、GPT系列模型相比,Codex获得的资源投入和市场曝光明显有限。

这也导致Codex的产品力提升十分缓慢。2025年10月,在Reddit社区“ChatGPTCoding”里,有这样一条热帖代表了当时Codex用户的心声:“为什么Codex CLI目前仍然如此不完善?

被骂了一年的Codex,怎么突然爆了?

当时Codex对Windows系统的支持并不到位,编辑文件、联网搜索等基础功能远没有Claude Code方便,开发者常常需要自行摸索、安装插件,才能获得更好的体验。

另一个现实问题则是模型能力。今天很多人会默认OpenAI在所有AI领域都处于领先位置,但在2025年,编程能力并非其最突出的优势。当时开发者社区普遍认为,Claude在大型代码库理解、复杂工程任务以及长上下文场景下表现更出色。

对于Codex而言,这意味着一个尴尬局面:它既没有最好的模型,也没有最成熟的产品体验。在这种情况下,增长缓慢几乎是必然结果。

二、

5个月三次大更新,Codex逆势崛起

Codex在发布后的8个多月时间里一直陷于沉寂,在2026年1月,其周活用户的数量甚至还出现了一定幅度的下滑。

Codex的转折点,出现在今年2月。OpenAI接连发布了Codex桌面应用和GPT-5.3 Codex两大新品,一个重塑Codex入口,一个则大幅提升了OpenAI模型在编程和智能体场景的实用性。

先来看看模型侧的变化。OpenAI和Anthropic在同一天发布了GPT-5.3 Codex和Claude Opus 4.6。在Artificial Analysis的智能指数榜单上,这两个模型的得分完全打平。在Terminal Bench等核心编程基准测试中,GPT-5.3 Codex甚至实现了超过10%的领先。

被骂了一年的Codex,怎么突然爆了?

▲GPT-5.3 Codex和Claude Opus 4.6的得分(图源:Artificial Analysis)

而OpenAI发布Codex桌面应用的意义可能更为重大。它并不只是简单地把Codex CLI“图形化”了,而是在产品定位上,将Codex从Agent工具升级为“Agent指挥中心”。

被骂了一年的Codex,怎么突然爆了?

OpenAI认为,如今模型已经可以自主完成长期、复杂的任务,这种情况下,开发者真正需要的是一个能在多项目间协调、管理Agent“数字劳动力”的产品。

Codex CLI、Claude Code等命令行工具,虽然也具备通过子Agent并行执行任务的能力,例如拆分代码搜索、实现不同模块或并发分析问题,但这些Agent更多是服务于一次任务执行过程中的“内部协作”,用户主要仍是在与一个Agent对话。

为适应Codex的新定位,OpenAI在Codex桌面应用中将Agent提升为独立的工作单元,每个Agent拥有独立线程、独立上下文、独立代码工作区(Worktree)和长期运行能力,用户可以像管理团队成员一样同时分配任务、查看进度、审阅结果,并通过自动化能力让Agent持续执行周期性工作。其实,OpenAI是把一个完整的AI开发团队交给了用户。

被骂了一年的Codex,怎么突然爆了?

自此次升级之后,Codex的用户体验有了大幅度的提升。在Reddit社区上,有位开发者在一条高赞讨论中写道,在使用CLI工具时,经常需要等待Agent完成任务后才能继续下一步操作,而Codex App允许同时管理多个项目和多个对话线程,使整个开发过程更接近即时通讯软件的体验,从而能够更轻松地并行推进多个项目。

被骂了一年的Codex,怎么突然爆了?

不过,当时Codex桌面应用并没有Windows和Linux版本,这点遭到不少用户吐槽。

到4月份,OpenAI又进行了一个更加关键的调整。

在“Codex for (almost) Everything”更新中,OpenAI开始丰富Codex的能力。Codex拥有了直接在后台操作计算机的能力,内置了浏览器和图像生成功能,新增了对GitHub PR审查、多终端标签和远程开发箱(SSH)的支持,并提供了超过90个新插件(如JIRA、CircleCI)来打通日常工具链。

这些能力的引入,让用户可以在文档处理、流程自动化、信息整理以及跨工具协作等新场景使用Codex。

被骂了一年的Codex,怎么突然爆了?

这次更新也拉高了Codex的市场天花板。此前,Codex给外界的印象始终停留在AI编程工具阶段,现如今,Codex已经成为了一个通用Agent平台,其目标客户扩展至整个知识工作者群体,比如产品经理、分析师、运营人员、研究人员等,而非仅仅局限于程序员。

与Codex这一更新所配套的,是GPT-5.4的升级。在这代模型中,OpenAI首次加入了原生的Computer Use能力和100万上下文支持。这些能力共同构成了Codex进一步进入白领工作场景的重要基础,使其能够更自然地参与跨应用、跨系统的复杂任务执行。

5月份的GPT-5.5则进一步优化了token效率、长上下文、编程等能力,并改善了模型在长任务中的任务保持能力。有不少用户反馈,Codex+GPT的组合,在使用成本上比Claude Code+Claude模型的组合要更具有性价比。

今年6月的Codex大更新与4月的更新一脉相承。Codex面向白领工作推出了智能体插件功能,首发了6个特定角色插件,包括数据分析、创意制作、销售、产品设计、股票投资等,每个插件都捆绑了相关角色的应用程序、技能、说明和工作流程。这些新功能,让Codex可以在更丰富的企业级场景中,扮演生产力系统的角色。

除了在产品和模型上下功夫,OpenAI在过去几个月时间里还进一步整合了ChatGPT与Codex,用户可以在ChatGPT手机应用里完成从任务发起、Agent运行监控到结果审查的完整流程,使用门槛进一步降低。Codex还定期推出额度重置福利,用户有不少免费的羊毛可以薅。

这一系列调整,最终转化为Codex活跃用户数量的迅猛增长,在短短5个月内从2026年初的约60万周活跃用户跃升至500万以上,成为OpenAI近一年增长最快的产品之一。

三、

Codex成为战略级产品之后

Codex的未来,要往何处去?

过去几年,无论从资源配置还是战略规划角度来看,OpenAI最重要的产品始终是ChatGPT。而现在,Codex的资源投入正在不断提升,持续快速更新的产品、频繁重置的免费额度、以及OpenAI在超级碗比赛期间为Codex投放的60秒天价广告,这种种举措都在释放一个信号:Codex正在被提升为战略级产品线。

结合OpenAI从去年年底以来对企业级市场的持续加码,这一变化并不难理解。无论是编程,还是白领工作,Codex瞄准的始终是企业级市场。在增长逻辑上,相比个人用户,企业客户或者说在工作中使用Codex的用户,拥有更强的付费能力和意愿,也更容易帮助OpenAI形成长期稳定的收入结构。

这已经是一个被验证过的叙事,Anthropic在ARR和估值层面对OpenAI的超越,很大程度上正是依赖其在企业市场的渗透能力。

Codex也是一款更适合企业级场景的产品。对于企业客户而言,一个能够完成代码开发、自动化流程、文档处理以及任务执行的Agent,其价值要高于纯粹的大模型API服务或者聊天机器人。它可以直接嵌入企业的生产系统与业务流程,成为实际的“执行层组件”。

在这种结构下,企业内部AI投资的ROI计算可以变得更加容易。例如,一个Agent如果能够替代部分开发、测试或数据处理流程,本质上就是在降低固定人力成本或提升人均产出。这类收益是可量化、可归因的,其ROI叙事更为清晰。负责制定企业信息化战略的CIO们,也更容易在内部论证这一投资的价值。

当然,挑战依然存在。

首先是可靠性。Agent类产品的能力虽在快速提升,但复杂任务执行中仍会出现错误。对企业而言,稳定性往往比能力上限更重要,尤其是在医疗、金融等强监管行业。Codex的可靠性将直接影响其在这些市场的扩展。

其次是竞争。Anthropic的Claude Code、Claude Cowork在开发者口碑和企业治理成熟度上仍然领先Codex。Claude Cowork的管理控制台、RBAC、审计日志已全面可用,而Codex的对应能力尚在“即将推出”阶段。Copilot则凭借微软生态,在分销渠道上拥有难以复制的优势,其多模型策略也给用户更多选择空间。

最后是成本。Agent的token消耗远高于对话,如何实现成本和性能的平衡是一个复杂问题。2026年4月,OpenAI将Codex从按消息计费改为基于token点数的滚动窗口计费,本意是让成本更精确反映实际消耗,实践中却带来不可预测性和总体成本上升。这可能导致部分用户转向开源方案,或至少在日常高消耗任务中用开源方案替代部分Codex的工作。

结语:

Codex还有硬仗要打

如今,国内外的头部大模型玩家,都在围绕Agent的“入口权”展开新一轮较量。Codex用5个月时间从60万周活冲到500万,证明了即便起步落后、口碑被压制,只要找准定位、持续迭代,依然有机会翻盘。

但复盘这场翻身仗,Codex的成功并不只靠产品功能堆叠,模型能力的追赶、产品定位的优化、目标市场的扩张、以及资源投入的倾斜,缺一不可。

500万周活用户已经证明了Codex在通用Agent赛道的吸引力。接下来要看的是,当成本优势消退、竞品加速跟进之后,Codex是否还能保持这样的迭代节奏和产品定力。要守住增长,Codex还需要在产品体验和商业模式上建立更深的护城河。

本文转自:凤凰网科技

原文地址: https://tech.ifeng.com/c/8uCHjuhMliW