快手可灵2.6模型上线，解锁视频AIGC新能力

2025-12-12阅读 0热度 0

保卫萝卜安卓

近日，快手旗下备受关注的AI视频生成技术迎来重要升级，其新一代模型——可灵 2.6正式发布。这不仅是一次版本迭代，更标志着AI视频创作工具在生成逻辑与用户体验上的一次革新。

作为可灵“音画同出”模式的核心模型，可灵 2.6最引人注目的能力在于，它能够根据用户指令，在一次生成中直接输出包含同步动态画面、自然语音、贴合的动作音效及环境氛围音在内的完整视频。这种“音画一体”的生成方式，从根本上改变了传统AI视频生成中“先无声画面、后人工配音”的割裂式工作流，显著提升了创作效率和作品的沉浸感。

技术突破：深度语义对齐带来的音画协同

实现这一突破的关键，在于可灵 2.6对物理世界的声音与动态画面进行了深度的语义对齐训练。简单来说，模型学会了理解“画面中正在发生什么，应该匹配什么样的声音”。这使得它在音画协同、音频语义理解和整体生成质量上表现亮眼。

具体到音频质量，该模型在支持人声、音效、环境声等多类型声音生成的基础上，实现了更干净的音质、更丰富的层次感。其生成的音频整体听感，已非常接近真实的专业混音效果，能够满足专业级创作对声音细节的严格要求。

创作应用：两大路径，适配多元场景

在创作流程上，可灵 2.6为用户提供了两条高效路径：文生音画与图生音画。无论是输入一段文字描述，还是上传一张图片并配上提示词，都能直接生成音画同步的完整视频。

同时，模型高度适配多种内容创作场景，包括但不限于：

单人口播/旁白解说： 自动生成口型匹配、情感自然的讲解视频。
多人对话： 模拟多人交流场景，生成不同角色的对话内容。
音乐表演： 为音乐类内容生成匹配的动作和舞台氛围。

愿景与规划：让每个人用AI讲出好故事

在不久前举行的快手2025年第三季度财报电话会上，公司创始人兼首席执行官程一笑明确阐述了可灵的愿景，即“让每个人都能用AI讲出好故事”。他表示，公司将持续聚焦于AI影视创作这一核心目标，聚合资源深入打磨技术与产品能力。

这一战略决心体现在其不断加码的投入上。快手首席财务官金秉透露，由于可灵的收入增长与AI业务整体进展超预期，公司正在不断追加算力投入。为应对用户对视频生成模型持续增强的需求，快手已多次扩充可灵在推理侧的算力储备。同时，随着模型加速迭代，公司也开始提升训练算力，以保持可灵在技术上的前沿性和市场竞争力。

商业化前景：收入预期大幅上调

市场的热烈反响直接体现在商业数据上。根据快手方面公布的相关数据，预计2025年全年可灵的收入将达到1.4亿美元。这一数字相较年初制定的6000万美元目标，提升幅度超过100%，显示出该业务强大的增长潜力和市场接受度。

目前，用户已经可以通过可灵App与其官方网站体验可灵 2.6的强大功能。该服务采用会员制，付费会员用户可享受标准与高品质两种生成模式，以满足不同精细度的创作需求。

快手可灵2.6模型上线，解锁视频AIGC新能力

技术突破：深度语义对齐带来的音画协同

创作应用：两大路径，适配多元场景

愿景与规划：让每个人用AI讲出好故事

商业化前景：收入预期大幅上调

相关阅读

最新教程

最新资讯