Codex AI开发实战：从PPT到App全流程测评

2026-06-09阅读 0热度 0

最近明显感觉到，Codex 已经不只是“帮你写代码”的工具了。它能调用插件生成 PPT，能做数据分析和模型预测，能开发网页，也能尝试开发 App。这次重点试了几个典型场景：PPT 生成、世界杯数据分析与预测、网页开发，以及更复杂的 App 开发。

1. PPT 生成插件

调用 PPT 生成插件，选中“Presentations”，让它帮忙生成一个 PPT。

Q：帮我创建一个蓝色风格、白色底的 PPT，介绍一下 DeepSeek-V4 的架构。

可以看到，最后的 PPT 效果不错，贴合了要求，而且元素是可以编辑的。

2. 数据分析与模型预测：AI 预测世界杯晋级

26 年世界杯队伍冠军之路预测，大致流程是这样的：先去 Kaggle 下载历史 FIFA 数据；搞清楚本届世界杯的晋级规则；收集 26 年世界杯所有队伍的信息，包括队伍名称、近半年的交手记录、人员情况等；最后根据这些信息，构建一个预测分类器，给出晋级名单和夺冠概率。

一开始，Codex 只生成了一个比较简单的效果，就是初步用分类器去预测每支队伍的胜率。以前也做过类似的事情，但有个问题：近半年的球队战绩和人员配置，其实会很大概率影响世界杯上的发挥。历史数据的权重分配必须更精细，不能简单地把过去几年的表现一视同仁。

具体来说，需要引入“时间衰减函数”来重新校准模型。距离世界杯开赛前三个月的热身赛和预选赛，参考价值应该远高于一年前的联赛数据。核心球员的伤病、新老教练的战术磨合度，这些动态特征往往比静态的历史胜率更能反映球队的即时战斗力。

此外，世界杯的特殊性在于它的赛会制性质，这与漫长的联赛积分制截然不同。联赛里稳定性是王道，但在世界杯的短周期内，球队的爆发力、阵容厚度以及应对逆风球的能力，往往决定了能走多远。因此在构建模型时，除了基础的 Elo 评分或逻辑回归，可能还需要加入针对“杯赛基因”的专项特征，比如该队过往在大赛中的心理素质评分，或者关键球员的国际大赛经验值。

所以，在最后的场景展示和计算中，使用了官方球队的 26 人名单，通过阵容分来加入 ELO 评分机制：

阵容分 = 0.60 × 五大联赛球员占比 + 0.30 × 强联赛球员占比 + 0.10 × 俱乐部国家分布多样性

最终得出小组赛名单：

最稳的球队是：巴西 97.4%、荷兰 97.3%、瑞士 96.4%、美国 92.6%。

第三名竞争里比较强的是：巴拉圭 67.9%、苏格兰 62.5%、捷克 55.6%、瑞典 51.8%、科特迪瓦 50.4%。

整体看，E 组最接近双强并列，D 组第三名巴拉圭最有冲击力，C 组巴西和 F 组荷兰出线最稳。

从剩下的组别来看：

西班牙 99.4%、英格兰 98.8%、阿根廷 98.6%、法国 97.5%、哥伦比亚 97.2%。

第三名里比较有竞争力的是：塞内加尔 70.9%、奥地利 56.4%、伊朗 62.5%、埃及 51.3%。

整体看，H 组、L 组、K 组强弱分化最明显；G 组最混乱，比利时之外其他三队差距不大；I 组塞内加尔虽然排第三，但晋级概率很高，是强第三名候选。

阵容分怎么计算

阵容分 = 0.60 × 五大联赛球员占比 + 0.30 × 强联赛球员占比 + 0.10 × 俱乐部国家分布多样性

意思是：

五大联赛球员占比权重最高，占 60%。五大联赛包括：英格兰、西班牙、意大利、德国、法国。
强联赛球员占比占 30%。在五大联赛基础上，再加入葡萄牙、荷兰、比利时、巴西、阿根廷、美国、墨西哥等联赛。
俱乐部分布多样性占 10%。如果球员来自更多不同国家/联赛体系，说明阵容国际化程度更高，也会略微加分。

阵容分怎么影响比赛概率？

阵容分不会直接决定胜负，而是先转成一个 Elo 修正项：调整后 Elo = 历史 Elo + 阵容 Elo 修正。

具体做法是：先对 48 支球队的阵容分做标准化，限制在 ±2 个标准差内，避免某些球队被极端放大；然后再乘以 30，这个修正后的 Elo 会继续参与：

单场胜/平/负概率计算；
小组排名模拟；
淘汰赛晋级概率模拟。

英格兰是当前第一热门。夺冠概率 32.1%，进入决赛概率 47.5%，阵容深度和路径落位共同推高它的上限。

西班牙保持第二梯队顶端。夺冠概率 25.6%，官方 26 人名单几乎全部来自五大联赛，阵容修正后仍是最稳候选之一。

法国、荷兰、哥伦比亚、巴西是第二集团。它们都有强出线能力，但在官方第三名落位和淘汰赛路径下，冠军概率明显低于前两队。

3. 开发一个网页

让它生成一个介绍最新 Codex 和 ChatGPT 合并等功能的页面。

等待一会儿后，得到了一个具有很强设计感的页面。右上角有几个按钮。第一个是截图，点一下就能截取当前页面。第二个是注释功能，这个是用得最多的功能之一，真的很香。

启用批注功能后，可以直接在页面内圈选任意元素并标注修改意见。比如，想把某元素替换为官方 Logo，只需要手动输入文字说明就行，不再需要通过截图或冗长的口头描述来传达。

最后生成的效果就能用上官方 logo 信息了。

4. 开发一个 APP

Codex 还能做一个更复杂的内容——直接开发一个 APP。因为做 APP 比做网页更复杂，所以这次要启用它的“计划模式”功能。

这种方式可以让你先检查一下它的实施计划，让 Codex 有了先想后做的能力，这样任务的成功率往往更高。确定好计划后，接下来什么都不用管，直接交给 Codex 去执行就好。

这份计划比较详细，确定之后就可以让它开始执行了。

网页开发多依赖浏览器环境，而 APP 则需直面多样的操作系统、设备型号与硬件接口。这意味着除了核心代码，还得处理原生 SDK 的调用、应用商店的审核规则，以及本地算力与电池续航的平衡。这些额外的技术栈与生态约束，让 APP 开发的复杂度呈指数级上升。

比如这里会遇到 SDK 和 Gradle 的问题，遇到不懂的，直接让它帮忙安装相关依赖就行。

最后，对应的 APK 安装包已经做好了，可以下载到手机里看看效果。当然，也可以用 USB 连接电脑，让它帮我们实时查看和修改。

最后的效果，整体感觉是 7/10，已经有 Demo 产品感。优点很明显：暗色主题统一，绿色高亮和足球预测主题比较搭；首页、冠军、小组赛、淘汰赛、球队、热点这些模块划分清楚，用户一眼能知道这是一个“世界杯概率预测 App”；冠军榜页面的信息密度不错，冠军、进决赛、进四强、进八强、进 16 强逐层展示，逻辑是成立的。

当然，一开始生成的界面不太符合 APP 的设计要求，所以让它重新生成，同时让它在生成过程中进行界面可视化模拟，这样就可以利用截图功能，实时查看效果。要让 Codex 能实时看到截图，需要打开里面的 Computer Use 功能。

最后生成的 APP 包含了几个模块：

首页界面：整体展示模型的预测效果；
赛程预测：展示每个小组赛中每支队伍的胜率情况，通过了上千次预测和队伍的 ELO 评分机制；
冠军预测：预测每支队伍的胜率情况；
球队：展示每支队伍的名单；
热点：筛选出比赛中具体有哪些看点。

写在最后

这次体验下来，最大的感受是，它已经能把很多原本需要程序员、设计师、数据分析师一起配合的事情，压缩成一个人和 AI 的协作流程。

当然，它远远不是万能的。数据预测场景里，模型一开始给出的结果会比较粗糙，需要继续补充业务假设、特征权重和计算逻辑；做 App 的时候，会碰到 SDK、Gradle、界面适配等各种工程问题；做页面时，如果不告诉它哪里不好，它也未必能自动改到满意。

但这恰恰说明，AI 时代真正重要的能力，已经从“会不会写代码”，变成了“能不能把问题讲清楚、把任务拆明白、把结果验出来”。这或许才是 Codex 这类工具最值得关注的地方。