Kimi编程模型深度评测:Token消耗直降30% 彻底解决过度思考 附真实一手实测

2026-06-13阅读 0热度 0
Kimi

6月12日,月之暗面正式发布并开源了Kimi K2.7 Code编程模型。这款参数规模达1.1万亿的模型,配备了256K上下文窗口,专门针对长上下文编程中的指令遵循能力以及长程编程任务的性能做了深度优化。最直观的变化是:在长程任务中,它的“过度思考”现象显著缓解——平均token消耗减少了30%。


基准测试成绩相当亮眼:K2.7 Code在多项编程与Agent评测中,相对K2.6实现了全面跃升,提升幅度在10%到31.5%之间。当然,距GPT-5.5(xhigh)、Opus 4.8(xhigh)这些头部模型仍有追赶空间。


目前,该模型已在Kimi API开放平台(platform.kimi.com)正式上线。每百万token的标准输入输出价格与K2.6保持一致,分别为6.5元和27元;不过命中缓存的输入价格微调了0.2元,降至1.3元。同时,Kimi Code Plan的默认模型也已同步升级至K2.7 Code。需要特别留意:要充分发挥这个模型的性能,必须开启思考模式。Kimi API和Kimi Code默认即为思考开启状态;若手动关闭,API端会直接报错,Kimi Code则会回退到K2.6模型。

下周一,月之暗面还计划在Kimi API开放平台推出Kimi K2.7 Code高速版,并逐步向“抢鲜体验计划”成员和Kimi会员开放。高速版的输出速度约为普通版的5-6倍——价格为2倍,常规编程场景下输出速度约180 Token/s,短上下文场景更可达260 Token/s。不过,它在Kimi Code Plan中的用量消耗也是普通版的3倍。

K2.7 Code上线后,智东西第一时间进行了初步体验。测试以编程类案例为主,环境为VS Code搭配Kimi Code插件。


第一个实测案例是一个轻量级任务:在单个html文件内,复刻一个mac OS风格的桌面操作系统demo。这个任务主要考察K2.7 Code的前端能力。测试中能明显感受到,这代Kimi模型确实更“果断”了。项目不复杂,它没在思考上耗费过多时间,很快就进入了开发流程。加上每次生成耗时较短,迭代过程相当顺畅。

最终效果如下。经过逐步迭代,这个demo的完成度相当不错,包含完整的开机动画和基本功能,像便签、浏览器都能正常使用。


美中不足的是,多次让K2.7 Code修改它生成的SVG开机动画图,最终效果仍与苹果的logo关联不大。算是一个小遗憾。


下一个任务,是让K2.7 Code开发一个“智能体小镇”复刻版。这个实验项目出自斯坦福大学与谷歌的合作,通过大语言模型驱动虚拟小镇中的智能体,模拟人类日常行为、社交互动及社会现象。开发之前,先让K2.7 Code撰写了一份简易的PRD文档。文档结构清晰,既有对产品的一句话形象概述,也包含了市场背景、功能架构、非功能需求和技术方案等细节,对后续开发起到了良好的指导作用。


接着,让K2.7 Code在PRD文档指导下开发一个最小可行版本(MVP)。one-shot生成的结果仍存在一些bug,画面无法正常渲染。继续让它改进,同时要求优化美术设计,并改造为可本地部署的方案。


连续开发30多分钟后,K2.7 Code终于交付了一个完整可用的项目。虽然视觉上比较简陋,但基本功能都已实现,接入大模型后能正常与智能体对话。如果后续继续迭代,效果还会有很大提升空间。


查看项目文件夹后,可以看到K2.7 Code构建的项目文件架构清晰,职责划分合理。


结语:编程场景下,速度本身就是体验的核心

初步体验下来,K2.7 Code给人最直接的印象就是更“果断”了。过去在简单任务上反复自我怀疑、长篇大论思考再动手的问题明显减少。生成速度方面,K2.7 Code的优化也贴合当前行业趋势。近期国内不少大模型厂商都在力推高速模型,Kimi这次同步预告的5到6倍速高速版,算是顺势而为。这种提速绝非偶然——在编程这种高频交互场景中,速度本身就是决定用户体验的关键变量。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策