GPT-5-Codex测评：前端能力碾压，复杂项目轻松搞定

2026-06-22阅读 0热度 0

昨天，OpenAI正式发布了GPT-5-Codex——一个专门为Codex编码智能体量身打造的GPT-5版本。看了全球网友的实测反馈后，结论很清晰：Claude Code可以放一放，Cursor可以先收起来，Codex值得直接上手。为了验证这些说法是否靠谱，我们做了一次全面的实测。结果证明，这次OpenAI没有“狼来了”。不少项目的表现确实令人眼前一亮——比如一键生成像素风小游戏，效果相当丝滑。

或者做一个页面，演示强化学习里经典的CartPole平衡实验——让小车左右移动，同时保持杆子竖直不倒。

几分钟内，一个贪吃蛇游戏就能秒出。

甚至，你还可以给某些知名角色制作一段火柴人动画——只需上传一张经典图片即可。

当然，这种任务多少有点为难GPT-5-Codex了。下面这张图虽然比较完美地还原了场景，但动作识别出了偏差，物理逻辑也不太对。

而这张呢，动作是对的，但少了一点那个味儿……

最终效果大概就是下面这样。等GPT-5-Codex再“练习两年半”，应该就能完美生成了。

不得不说，这次GPT-5-Codex的前端能力提升非常大。随手就能制作一个记录每日AI精选新闻的网站。

顺便提一句，有网友感慨：现在这个阶段，最前沿的程序员面对的技术迭代速度快得惊人。实际上，他们都不怎么写代码了——直接对着Codex智能体“大喊大叫”（发号施令），AI包揽一切。

而且，GPT-5-Codex上线后，OpenAI自己也没料到需求会如此猛烈——运行速度竟然比预期慢了整整两倍。研究人员已经确认，正在补上GPU，算力即将再次起飞。可见，确实好用，用户才会“疯狂使用”。

## GPT-5-Codex实测先简单介绍一下实测方法。Codex官方提供了多种使用方式：可以用npm安装在终端，也可以以扩展形式在Cursor、VS Code等编辑器中使用。

这次我们实测了终端方式和Cursor中的扩展方式。

### 像素风游戏 OpenAI Developers官方账号给出了几个示例，我们就拿这些来测试。第一个任务：“制作一个像素风游戏，让我可以四处走动、与村民交谈，并捕捉野外昆虫。” 以下是官方给出的效果。

下面是我们实测的效果。

玩起来还是相当丝滑的。 ### 手稿直出还可以将手画的草稿直接制作成一个网页。

效果相当不错，毕竟只有一张图和简单的提示。提示词：“以这张图片为灵感，在此创建一个简单的 HTML 页面 aiera.html，包含所有资源/Ja vaScript 和内容，以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒，但不要弄得太花哨。”

### 复杂项目直接使用OpenAI开发者账号的草图，将这个图片制作为一个复杂的项目。刚开始GPT-5-Codex给了一个和草图类似的HTML页面，所以我要求它用Next.js框架重新制作。

最终效果如下，UI设计稿的页面布局还原得相当到位。

实测过程中，也不得不感叹：自从有了AI智能体，写代码真的就是“大喊大叫”。比如在测试GPT-5-Codex时，可以后台同步开启N个项目并行测试。这次ChatGPT给Plus和Pro用户的用量也很大方。

### 贪吃蛇游戏这次Codex提供的终端体验也很棒，比如制作一个贪吃蛇游戏。

效果如下，Codex严格按要求实现了。

### 飞行器用GPT-5-Codex测试了经典的“飞行器从火星飞往地球”的动画演示，整体表现还行，飞行器能飞起来。当然，这个模型并非完美。实测中发现，GPT-5-Codex生成的页面UI经常出现“堆叠”情况，这一点也得到了其他网友的印证。

这些都是小瑕疵。更值得关注的是：当Claude Code还在偷偷给模型降智的时候，OpenAI却专门为Codex更新了编程场景优化的GPT-5-Codex——高下立判。

这次，还是要支持奥特曼的。 ## 彩蛋有意思的是，GPT-5-Codex发布后不久，Grok 4宣布在AGI基准测试中取得了突破。马斯克今天突然发帖说，他觉得Grok 5有可能实现通用人工智能，让我们拭目以待。也许谷歌的Gemini 3和马斯克的Grok 5，年底前就会给我们一个惊喜。

另外，有网友爆料Codex的提示词现已泄露，不妨一探究竟。

GPT-5-Codex测评：前端能力碾压，复杂项目轻松搞定

相关阅读

最新教程

最新资讯