Kimi K2.7 Code编程模型实测：Token消耗降低30%

2026-06-13阅读 0热度 0

Kimi

响应延迟直接决定了编程工具的可用性。

6月12日，月之暗面正式开源Kimi K2.7 Code编程模型，参数量达1.1万亿，支持256K上下文窗口。该模型重点强化了长上下文编程场景下的指令遵循能力与长程任务性能，显著缓解了“过度思考”问题，平均token消耗缩减30%。

月之暗面基准测试显示，K2.7 Code在多项编程及Agent基准测试中较K2.6提升10%至31.5%。但与GPT-5.5（xhigh）、Opus 4.8（xhigh）等模型相比仍存在差距。

K2.7 Code现已上线Kimi API开放平台（platform.kimi.com），标准输入输出价格与K2.6一致，分别为每百万token 6.5元和27元；缓存命中输入价微调0.2元至1.3元。

Kimi Code Plan的默认模型同步升级为K2.7 Code。注意：使用K2.7 Code必须开启思考模式以获得最佳性能。Kimi API和Kimi Code默认开启思考，若手动关闭则API会报错，Kimi Code自动回退至K2.6。

下周一，月之暗面将在Kimi API开放平台推出K2.7 Code高速版，逐步面向“抢鲜体验计划”成员及Kimi会员开放。高速版输出速度约为普通版的5至6倍，价格为普通版的2倍。常规编程场景下输出约180 Token/s，短上下文下可达260 Token/s。高速版在Kimi Code Plan中的用量消耗为普通版的3倍。

K2.7 Code上线后，我们第一时间在VS Code + Kimi Code插件环境下进行了编程类实测。