GPT-5-Codex测评:前端能力碾压,复杂项目轻松搞定
或者做一个页面,演示强化学习里经典的CartPole平衡实验——让小车左右移动,同时保持杆子竖直不倒。
几分钟内,一个贪吃蛇游戏就能秒出。
甚至,你还可以给某些知名角色制作一段火柴人动画——只需上传一张经典图片即可。
当然,这种任务多少有点为难GPT-5-Codex了。下面这张图虽然比较完美地还原了场景,但动作识别出了偏差,物理逻辑也不太对。
而这张呢,动作是对的,但少了一点那个味儿……
最终效果大概就是下面这样。等GPT-5-Codex再“练习两年半”,应该就能完美生成了。
不得不说,这次GPT-5-Codex的前端能力提升非常大。随手就能制作一个记录每日AI精选新闻的网站。
顺便提一句,有网友感慨:现在这个阶段,最前沿的程序员面对的技术迭代速度快得惊人。实际上,他们都不怎么写代码了——直接对着Codex智能体“大喊大叫”(发号施令),AI包揽一切。
而且,GPT-5-Codex上线后,OpenAI自己也没料到需求会如此猛烈——运行速度竟然比预期慢了整整两倍。研究人员已经确认,正在补上GPU,算力即将再次起飞。可见,确实好用,用户才会“疯狂使用”。
## GPT-5-Codex实测
先简单介绍一下实测方法。Codex官方提供了多种使用方式:可以用npm安装在终端,也可以以扩展形式在Cursor、VS Code等编辑器中使用。
这次我们实测了终端方式和Cursor中的扩展方式。
### 像素风游戏
OpenAI Developers官方账号给出了几个示例,我们就拿这些来测试。
第一个任务:“制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。”
以下是官方给出的效果。
下面是我们实测的效果。
玩起来还是相当丝滑的。
### 手稿直出
还可以将手画的草稿直接制作成一个网页。
效果相当不错,毕竟只有一张图和简单的提示。
提示词:“以这张图片为灵感,在此创建一个简单的 HTML 页面 aiera.html,包含所有资源/Ja vaScript 和内容,以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒,但不要弄得太花哨。”
### 复杂项目
直接使用OpenAI开发者账号的草图,将这个图片制作为一个复杂的项目。刚开始GPT-5-Codex给了一个和草图类似的HTML页面,所以我要求它用Next.js框架重新制作。
最终效果如下,UI设计稿的页面布局还原得相当到位。
实测过程中,也不得不感叹:自从有了AI智能体,写代码真的就是“大喊大叫”。比如在测试GPT-5-Codex时,可以后台同步开启N个项目并行测试。这次ChatGPT给Plus和Pro用户的用量也很大方。
### 贪吃蛇游戏
这次Codex提供的终端体验也很棒,比如制作一个贪吃蛇游戏。
效果如下,Codex严格按要求实现了。
### 飞行器
用GPT-5-Codex测试了经典的“飞行器从火星飞往地球”的动画演示,整体表现还行,飞行器能飞起来。
当然,这个模型并非完美。实测中发现,GPT-5-Codex生成的页面UI经常出现“堆叠”情况,这一点也得到了其他网友的印证。
这些都是小瑕疵。更值得关注的是:当Claude Code还在偷偷给模型降智的时候,OpenAI却专门为Codex更新了编程场景优化的GPT-5-Codex——高下立判。
这次,还是要支持奥特曼的。
## 彩蛋
有意思的是,GPT-5-Codex发布后不久,Grok 4宣布在AGI基准测试中取得了突破。马斯克今天突然发帖说,他觉得Grok 5有可能实现通用人工智能,让我们拭目以待。
也许谷歌的Gemini 3和马斯克的Grok 5,年底前就会给我们一个惊喜。
另外,有网友爆料Codex的提示词现已泄露,不妨一探究竟。