牛马模型Minimax M2.5实测：特斯拉股票交易系统评测

2026-06-01阅读 0热度 0

Mini

绝大多数人对 AI 的耐心，正在消失。

过去两年，我们似乎陷入了一个巨大的误区。

每一次新模型发布，大家都在盯着榜单看。MMLU 多少分？数学推理是不是第一？参数量是不是又大了？

但每天处理大量业务的创业者心里清楚：这些分数与真实工作流是割裂的。真正在乎的，不是它能不能做奥数题，而是它能不能像一个真正的「员工」那样，接过手里那些繁琐、枯燥甚至复杂的任务，并且按时交付。

昨天，Minimax 发布了 M2.5，官方给它贴的标签很有意思：Workhorse Model（主力生产力模型）+ 100 TPS（每秒处理100个Token的疯狂速度）。

horse？这不妥妥的牛马模型吗？

于是抓了几个真实的办公室场景，看看它到底是不是「白领生产力」。

结果非常意外。

不是因为完美，而是因为它展现出了一种极其可怕的「执行惯性」。

01 深度结合Office 三件套

第一个任务，扔给它一份 80 多页的PDF《2025年跨境电商行业年度报告》。

这通常是公司里初级分析师最头疼的工作：阅读几十页的原始资料，提取数据，然后重构成一份新的、符合公司品牌调性的 Word、Excel 和 PPT。

令人惊讶的不是内容的准确性，而是它对「文档工程」的理解。

先看Word的实力。提示词是这样写的：

附件《2025年跨境电商行业年度报告-AMZ123-202601.pdf》我们是 NGS 全称是 NextGrowthSail Ltd，是帮助国内品牌做出海营销的机构，目前主营 Reddit 代运营、GEO （AI SEO）的服务。我们也想出一个类似的品牌出海营销报告。现在需要你帮我完成这个任务。首先需要你把这个 pdf读一遍，把其中关于「品牌营销」「市场营销」「社交媒体」「Reddit」「SEO」「GEO」「AI」相关的内容都抓出来，尤其是数据。写到一个Word 文档里，重新写成《2025 NGS品牌出海营销洞察报告》，要求图文并茂。所有内容都不能你自己捏造，要求注明来自原 pdf 的第几页哪个位置，如果是外部的引用也要给出详细具体的网址，确保真实可靠性。

直接在MiniMax 页面 Agent 里测的：

在子袋里把 office 相关能力火力全开：

结果还真靠谱，既有「插入目录」

又有封面、页头页尾、表格，排版完成度很高，非常省事。

这种对文档结构的还原能力，意味着它已经脱离了“文本生成”的范畴，进入了“文档处理”的领域。

接着看Excel能力怎么样。提示词：

接下来，把 word 里的所有表格数据都整理到 Excel 里的多个 sheet，并且做透视表、图表等「进阶操作」使得 Excel 看起来很复杂、老板很喜欢看。

排版不错，Excel 的表格也美化了。

图表也能做好。

这就是 Minimax 强调的 Workhorse Model（主力模型）能力。在处理 docx、xlsx 这种核心生产力格式上，它确实跨过了一个门槛：从生成内容，变成了生成交付物。

当然，槽点也有。当让它基于这些数据生成 PPT 时，虽然内容逻辑是对的，但那个审美和排版……

这是我们 NGS 出海营销的 logo，接下来需要你设计配色，基于前面的 word、Excel 做一份 pptx 报告，要有欧美品牌的高逼格审美，内容详实、数据可信。

整体来说还行，但如果论 AI 生成 PPT 而言，仿佛还是上一代的产品。

完整 PPT 报告：xqmenq48tn6h.space.minimaxi.com/

这揭示了一个真相：在结构化和逻辑严谨的工作（Word 和 Excel）上，M2.5 已经是行业 SOTA（领先）水平；但在需要审美和创意的PPT环节，它依然需要人类去把关。

02 AI 数据分析：速度提高 73%

如果说 Office 三件套是基础题，那接下来的任务就是附加题。

扔给它两份脏乱差的亚马逊竞品评论数据（xlsx），要求它扮演一位“商业洞察分析师”，写 Python 脚本进行清洗、情感分析，并输出一份 HTML 格式的深度交互报告。

注意，这不是简单的总结，而是需要 Coding 能力介入的深度数据挖掘。同类的任务，半年前用其他顶级模型跑过，耗时半小时以上。看原文设计的提示词就知道需求有多复杂。

但这一次，Minimax M2.5 只用了8 分钟。

整体的报告是到位的。

可视化效果很好。

排版真不错，图下面给了解读。

Prompt 的要求也遵循得很好。

这验证了 M2.5 的一个核心逻辑：Coding 能力的下放。它不再只是程序员的工具，而是变成了业务人员的数据铲子。你不需要懂 Python，你只需要懂业务，它就能帮你把数据变成结论。

03 全栈开发一个美股模拟交易系统

前两个 Case 还是在处理静态文件，最后这个 Case，测的是它的Agentic（智能体）能力。

要求它开发一个「特斯拉股票与舆情监控 AI 系统」。这极其复杂：

1.前端：要用 React 写一个特斯拉风格的仪表盘。
2.后端：要连接真实的新闻数据源和股票接口。
3.数据库：要连接 Supabase，记录交易数据。
4.Agent：AI 要自己根据舆情判断买卖，并自动执行操作。

参考提示词：

独立开发一个企业级的「特斯拉股票与舆情监控AI系统」就只看特斯拉这只美股股票，左边是 K 线趋势可能占 60%，右边40% 是「马斯克」这个人和「特斯拉」的相关最新的新闻滚动分析并且右边给出买卖的决策建议，需要有美股价值投资、短期投机的理论支撑。并且自带一个「模拟交易」系统的后端，让 AI 自动根据收集到的舆情信息、对特斯拉股票的技术分析等，自行去交易，记录下关键的操作的时间、金额等核心数据，用于后续复盘策略。所以你要判断这个前后端项目需要什么、需要真正能长期跑起来、并且审美高级好看、符合特斯拉风格的。我已经连好 supabase 数据库了，接下来就交给你了。

Minimax 现在的 Agent 平台直接内置了 Supabase 支持，大大降低了门槛。

老实说第一次问题不小，页面需要下拉，导致 K 线图被拉变形了。

好在一次就改好了。

(图注：左侧是实时的 K 线，右侧是 AI 分析出的舆情与决策建议)

右边的模块包含三个部分：理论、舆情监控、模拟交易。

感兴趣可以试试：7y35p3ao81zr.space.minimaxi.com/

整体前后端是通的。例如操作一下，买 10 股特斯拉。

数据库马上有记录了，余额也对得上。

这意味着什么？意味着 AI 不再是只能在对话框里口嗨的“大脑”，它有了“手”。它可以通过数据库、通过API，去真实地触碰这个数字世界。

Designed for Agent-verse（为智能体生态设计），在 M2.5 身上不是一句空话。它极强的任务规划能力和长链路执行力，让它能够像一个资深全栈工程师一样，自己去 Debug，自己去调优。

04 结论：效率即正义

三个 Case 跑完，最大的感受其实不是“智能”，而是“快”。

官方数据说 M2.5 支持100 TPS的超高吞吐量，推理速度是 Claude Opus 的 3 倍。在实际体验中，这种“快”带来了质变。当 AI 写代码像流式输出一样快，当它生成一份万字报告只需要几十秒时，试错成本被无限降低了。

PPT 丑了？两句话让它重做。代码报错了？一秒钟让它修复。这才是 AI 融入工作的真实路径：它不需要一次就做到 100 分，它只需要以人类 10 倍的速度拿出 80 分的初稿，然后陪你快速迭代到 95 分。

牛马模型Minimax M2.5实测：特斯拉股票交易系统评测

01

深度结合Office 三件套

02

AI 数据分析：速度提高 73%

03

全栈开发一个美股模拟交易系统

04

结论：效率即正义

相关阅读

最新教程

最新资讯