GPT-5-Codex测评:前端能力碾压,复杂项目轻松搞定

2026-06-22阅读 0热度 0
ai
昨天,OpenAI正式发布了GPT-5-Codex——一个专门为Codex编码智能体量身打造的GPT-5版本。 看了全球网友的实测反馈后,结论很清晰:Claude Code可以放一放,Cursor可以先收起来,Codex值得直接上手。 为了验证这些说法是否靠谱,我们做了一次全面的实测。结果证明,这次OpenAI没有“狼来了”。不少项目的表现确实令人眼前一亮——比如一键生成像素风小游戏,效果相当丝滑。 或者做一个页面,演示强化学习里经典的CartPole平衡实验——让小车左右移动,同时保持杆子竖直不倒。 几分钟内,一个贪吃蛇游戏就能秒出。 甚至,你还可以给某些知名角色制作一段火柴人动画——只需上传一张经典图片即可。 当然,这种任务多少有点为难GPT-5-Codex了。下面这张图虽然比较完美地还原了场景,但动作识别出了偏差,物理逻辑也不太对。 而这张呢,动作是对的,但少了一点那个味儿…… 最终效果大概就是下面这样。等GPT-5-Codex再“练习两年半”,应该就能完美生成了。 不得不说,这次GPT-5-Codex的前端能力提升非常大。随手就能制作一个记录每日AI精选新闻的网站。 顺便提一句,有网友感慨:现在这个阶段,最前沿的程序员面对的技术迭代速度快得惊人。实际上,他们都不怎么写代码了——直接对着Codex智能体“大喊大叫”(发号施令),AI包揽一切。 而且,GPT-5-Codex上线后,OpenAI自己也没料到需求会如此猛烈——运行速度竟然比预期慢了整整两倍。研究人员已经确认,正在补上GPU,算力即将再次起飞。可见,确实好用,用户才会“疯狂使用”。 ## GPT-5-Codex实测 先简单介绍一下实测方法。Codex官方提供了多种使用方式:可以用npm安装在终端,也可以以扩展形式在Cursor、VS Code等编辑器中使用。 这次我们实测了终端方式和Cursor中的扩展方式。 ### 像素风游戏 OpenAI Developers官方账号给出了几个示例,我们就拿这些来测试。 第一个任务:“制作一个像素风游戏,让我可以四处走动、与村民交谈,并捕捉野外昆虫。” 以下是官方给出的效果。 下面是我们实测的效果。 玩起来还是相当丝滑的。 ### 手稿直出 还可以将手画的草稿直接制作成一个网页。 效果相当不错,毕竟只有一张图和简单的提示。 提示词:“以这张图片为灵感,在此创建一个简单的 HTML 页面 aiera.html,包含所有资源/Ja vaScript 和内容,以实现该网络应用的展示版本。宜人的动画和响应式设计会很棒,但不要弄得太花哨。” ### 复杂项目 直接使用OpenAI开发者账号的草图,将这个图片制作为一个复杂的项目。刚开始GPT-5-Codex给了一个和草图类似的HTML页面,所以我要求它用Next.js框架重新制作。 最终效果如下,UI设计稿的页面布局还原得相当到位。 实测过程中,也不得不感叹:自从有了AI智能体,写代码真的就是“大喊大叫”。比如在测试GPT-5-Codex时,可以后台同步开启N个项目并行测试。这次ChatGPT给Plus和Pro用户的用量也很大方。 ### 贪吃蛇游戏 这次Codex提供的终端体验也很棒,比如制作一个贪吃蛇游戏。 效果如下,Codex严格按要求实现了。 ### 飞行器 用GPT-5-Codex测试了经典的“飞行器从火星飞往地球”的动画演示,整体表现还行,飞行器能飞起来。 当然,这个模型并非完美。实测中发现,GPT-5-Codex生成的页面UI经常出现“堆叠”情况,这一点也得到了其他网友的印证。 这些都是小瑕疵。更值得关注的是:当Claude Code还在偷偷给模型降智的时候,OpenAI却专门为Codex更新了编程场景优化的GPT-5-Codex——高下立判。 这次,还是要支持奥特曼的。 ## 彩蛋 有意思的是,GPT-5-Codex发布后不久,Grok 4宣布在AGI基准测试中取得了突破。马斯克今天突然发帖说,他觉得Grok 5有可能实现通用人工智能,让我们拭目以待。 也许谷歌的Gemini 3和马斯克的Grok 5,年底前就会给我们一个惊喜。 另外,有网友爆料Codex的提示词现已泄露,不妨一探究竟。
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策