快手可灵2.6模型上线,解锁视频AIGC新能力
近日,快手旗下备受关注的AI视频生成技术迎来重要升级,其新一代模型——可灵 2.6正式发布。这不仅是一次版本迭代,更标志着AI视频创作工具在生成逻辑与用户体验上的一次革新。
作为可灵“音画同出”模式的核心模型,可灵 2.6最引人注目的能力在于,它能够根据用户指令,在一次生成中直接输出包含同步动态画面、自然语音、贴合的动作音效及环境氛围音在内的完整视频。这种“音画一体”的生成方式,从根本上改变了传统AI视频生成中“先无声画面、后人工配音”的割裂式工作流,显著提升了创作效率和作品的沉浸感。
技术突破:深度语义对齐带来的音画协同
实现这一突破的关键,在于可灵 2.6对物理世界的声音与动态画面进行了深度的语义对齐训练。简单来说,模型学会了理解“画面中正在发生什么,应该匹配什么样的声音”。这使得它在音画协同、音频语义理解和整体生成质量上表现亮眼。
具体到音频质量,该模型在支持人声、音效、环境声等多类型声音生成的基础上,实现了更干净的音质、更丰富的层次感。其生成的音频整体听感,已非常接近真实的专业混音效果,能够满足专业级创作对声音细节的严格要求。
创作应用:两大路径,适配多元场景
在创作流程上,可灵 2.6为用户提供了两条高效路径:文生音画与图生音画。无论是输入一段文字描述,还是上传一张图片并配上提示词,都能直接生成音画同步的完整视频。
同时,模型高度适配多种内容创作场景,包括但不限于:
- 单人口播/旁白解说: 自动生成口型匹配、情感自然的讲解视频。
- 多人对话: 模拟多人交流场景,生成不同角色的对话内容。
- 音乐表演: 为音乐类内容生成匹配的动作和舞台氛围。
愿景与规划:让每个人用AI讲出好故事
在不久前举行的快手2025年第三季度财报电话会上,公司创始人兼首席执行官程一笑明确阐述了可灵的愿景,即“让每个人都能用AI讲出好故事”。他表示,公司将持续聚焦于AI影视创作这一核心目标,聚合资源深入打磨技术与产品能力。
这一战略决心体现在其不断加码的投入上。快手首席财务官金秉透露,由于可灵的收入增长与AI业务整体进展超预期,公司正在不断追加算力投入。为应对用户对视频生成模型持续增强的需求,快手已多次扩充可灵在推理侧的算力储备。同时,随着模型加速迭代,公司也开始提升训练算力,以保持可灵在技术上的前沿性和市场竞争力。
商业化前景:收入预期大幅上调
市场的热烈反响直接体现在商业数据上。根据快手方面公布的相关数据,预计2025年全年可灵的收入将达到1.4亿美元。这一数字相较年初制定的6000万美元目标,提升幅度超过100%,显示出该业务强大的增长潜力和市场接受度。
目前,用户已经可以通过可灵App与其官方网站体验可灵 2.6的强大功能。该服务采用会员制,付费会员用户可享受标准与高品质两种生成模式,以满足不同精细度的创作需求。