Kimi K2.7 Code编程模型实测:Token消耗降低30%
响应延迟直接决定了编程工具的可用性。
6月12日,月之暗面正式开源Kimi K2.7 Code编程模型,参数量达1.1万亿,支持256K上下文窗口。该模型重点强化了长上下文编程场景下的指令遵循能力与长程任务性能,显著缓解了“过度思考”问题,平均token消耗缩减30%。
月之暗面基准测试显示,K2.7 Code在多项编程及Agent基准测试中较K2.6提升10%至31.5%。但与GPT-5.5(xhigh)、Opus 4.8(xhigh)等模型相比仍存在差距。
K2.7 Code现已上线Kimi API开放平台(platform.kimi.com),标准输入输出价格与K2.6一致,分别为每百万token 6.5元和27元;缓存命中输入价微调0.2元至1.3元。
Kimi Code Plan的默认模型同步升级为K2.7 Code。注意:使用K2.7 Code必须开启思考模式以获得最佳性能。Kimi API和Kimi Code默认开启思考,若手动关闭则API会报错,Kimi Code自动回退至K2.6。
下周一,月之暗面将在Kimi API开放平台推出K2.7 Code高速版,逐步面向“抢鲜体验计划”成员及Kimi会员开放。高速版输出速度约为普通版的5至6倍,价格为普通版的2倍。常规编程场景下输出约180 Token/s,短上下文下可达260 Token/s。高速版在Kimi Code Plan中的用量消耗为普通版的3倍。
K2.7 Code上线后,我们第一时间在VS Code + Kimi Code插件环境下进行了编程类实测。
首个任务为轻量级:在单一HTML文件中复刻macOS风格操作系统demo,重点考察前端能力。
实测中,K2.7 Code决策果断,未在简单任务上过度思考,快速进入开发。每次生成耗时短,迭代迅速。
最终生成的前端代码完成度较高,包含完整开机动画及基本功能,如便签、浏览器等均可正常使用。
不足在于,多次要求修改SVG开机动画后,最终效果仍与苹果公司logo关联不大。
下一任务:使用K2.7 Code开发“智能体小镇”复刻版。该项目源自斯坦福大学与谷歌合作的多智能体交互实验,利用大语言模型驱动虚拟小镇中的智能体,模拟人类日常行为、社交互动及社会现象。
开发前让K2.7 Code撰写简易PRD文档,包含产品概述、市场背景、功能架构、非功能需求及技术方案,对后续开发有明确指导。
要求K2.7 Code在PRD指导下开发MVP。一次生成结果存在bug,画面无法渲染,经多次改进并优化美术设计后,改造为可本地部署方案。
连续开发30余分钟后,K2.7 Code交付完整可用项目。界面虽简陋,但基本功能实现,接入大模型后可与智能体正常对话。后续迭代空间大。
项目文件架构清晰,模块分工合理。
结语:编程工具的速度直接决定开发体验
初步体验中,K2.7 Code决策更果断,显著减少了简单任务中的过度自我质疑与冗长思考。
生成速度优化贴合行业趋势。近期国内大模型厂商纷纷推出高速模型,Kimi同步预告5至6倍速的高速版。
这种提速并非巧合——编程作为高频交互场景,速度本身就是关键的用户体验指标。








