Claude Fable 5纯代码剪4K宣传片,无需剪辑软件
核心结论:AI正在彻底重构视频剪辑的工作方式,不只是提速,而是整个生产流程的范式迁移。
Claude Code团队成员Thariqi进行了一项实验——他使用Claude Fable 5完成该产品的发布视频剪辑,全程未开启任何传统非线性编辑软件。也就是说,介绍Claude Fable 5的视频,完全由AI自主完成后期。
最终成片:
以下是完整的技术拆解,每一个环节都值得视频从业者深度参考。
素材基础:17条片段,25GB容量,横跨4个场景
视频共涵盖四个拍摄场景:开场叙述、思维协作伙伴、目标与验证、愿景表述。拍摄了17条原始素材,均为S-Log3灰片格式,总数据量约25GB。
Thariqi并未手动筛选素材,而是将这一工序全权交给Claude Code。
阶段一:一条提示词触发全自动工作流
起始指令如下:
“现有批录像文件,脚本在此。请先为每个文件执行语音转录服务,然后拼接选取最佳镜头输出完整成片。注意:每个场景均有多条备选,通常越靠后录制、‘嗯’字越少的片段质量越高,但并非绝对。最后场景已补拍。开头若干条含热身话,需裁掉。生成一个JSON记录每个场景采用的素材ID和时间区间,随后调用ffmpeg输出成品。连续执行直至生成最终视频。”
仅此一条,未做任何补充。
阶段二:Whisper逐字转录17条素材
Claude Code调用Whisper转录服务(本地M4 Max运行),为17条素材中的每一个语音单元标注毫秒级时间戳。
值得注意:Whisper误将“Thariqui”识别为“Sark”,但时间戳精度未受影响。每条素材的每个单词均具备精确的入点和出点。
阶段三:生成剪辑决策文件
转录完成后,Claude Code启动多个子智能体分别处理四个场景,每个场景对应一个智能体,另设验证智能体交叉校验。为每场景选出最优片段,并将选择逻辑写入JSON文件。每个剪辑点均落在自然停顿处,杜绝句中切断。
该JSON详细记载:每个场景的候选素材列表、最终选用哪一条、选中的理由、精确的入点和出点。
例如:场景一,C017(补拍版)因中间存在5.8秒停顿被排除,C003因零“嗯”字、结尾干净而胜出。场景三选用C012,理由为入点落在一段自然气口处。每条剪辑决策均有书面依据,最终成品内“嗯”字出现次数归零。
阶段四:ffmpeg执行自动剪辑
基于剪辑决策JSON,Claude Code调用ffmpeg按照指定入出点逐段切割并拼接,输出一段2分50秒的初版。
此时素材仍为S-Log3灰片未调色,但可浏览的剪辑雏形已成型。
阶段五:从零编写调色LUT
有趣的是,Thariqi并无专业调色背景,他的做法是直接对Claude Code下令:“当前调色太闷,能否生成若干方案供选择?”
Claude Code随即生成四套色彩方案:标准Rec.709、暖色调电影感、高对比度、青橙风格。全部采用自编.cube格式LUT文件,共7个,实现从S-Log3到Rec.709的色彩空间转换,未使用任何第三方预设包。
最终选用的是一套偏冷、中性的调色方案。
阶段六:将静态设计图转换为React组件
视频中需要动态字幕和图形遮罩,Thariqi提供了11张静态PNG设计图,无动画规格、无时间轴说明,仅图片。
Claude Code将这11张图全部重建为基于Remotion框架的React组件。Remotion可将React组件渲染为视频帧,每个组件内的文字颜色、出现时机、动画节奏均转化为可由提示词调整的参数。
整套动画节奏由6个核心数值控制:元素入场时长、子元素交错间隔、面板滑入时长、淡出时长、重点词出现延迟、以及统一的缓动函数。若需加快动画速度,修改一行代码即可。
图形切入时机并非手动设定,而是Claude Code在转录文件中检索对应关键词,找到其时间戳,并将组件入点对齐至那一帧。例如关键词“right”出现在第295帧,对应图形组件便在第295帧切入。
阶段七:导出至Figma供设计团队修改
为实现设计团队直接修改组件,Claude Code通过Figma MCP将所有组件导出为真实的Figma文件,包含组件页、调色控制页以及带实时GIF渲染的动效预览页。
设计团队还收到一个HTML版调色控制面板,可拖动滑块实时预览调色效果,确认后点击按钮将调整参数复制为提示词,直接粘贴回Claude Code继续迭代。
设计团队拿到Figma文件后进行了修改,将原来的奶油色卡片风格替换为更简洁、透明的视觉语言。
阶段八:将修改结果同步回视频
Thariqi对Claude Code下达指令:“设计团队已在Figma完成更新,请同步至视频。”
Claude Code通过Figma MCP读取更新后的设计,重建React组件并重新渲染。
最终输出
成片参数:分辨率3840×2160,帧率24fps,总帧数4334,时长3分钟,文件大小653MB。在全量渲染前,Claude Code还逐帧截图进行自检。
工程结构全景
本次剪辑无需项目文件、无需时间轴。剪辑决策为JSON,调色为纯文本.cube文件,图形为React代码,时间节点源自转录文件,渲染靠一行命令。
所有要素均为可读、可比对、可重渲染的文本。
核心文件清单如下:
17条素材的Whisper转录文件,每词均带时间戳,所有剪辑点和字幕位置由此检索而出,无需手动拖拽时间轴。
最终剪辑决策JSON,记载每场景的候选素材、入出点及选择逻辑,ffmpeg直接执行该文件。
7个自编调色LUT,实现S-Log3至Rec.709色彩转换,调色本身为纯文本,由ffmpeg在编码时应用。
11个图形React组件,将设计师的PNG全部代码化,每个词和颜色均转为可调参数。
全局动画参数文件及剪辑编排文件,6个数字控制所有动效节奏,字幕时机由转录文件的词语时间戳驱动。
最终由npx remotion render命令无头输出4K成片,共4334帧。
复盘总结
相机共拍摄17条素材,合计25GB原始数据。自编7个LUT,生成11个图形组件。代码与Figma之间双向同步2次。整体耗时约4天(6月6日至6月9日)。视频剪辑软件打开次数:0次。
视频剪辑由Claude Code完成,拍摄由摄影师负责,审美决策来自Thariqi。中间所有自动化流程全部由Claude Fable 5执行。这种全代码化、非破坏性的剪辑方式,为定制化视频生产提供了全新思路。
此外,该视频剪辑耗费约100美元,但大部分成本投入在UI迭代环节,转录与剪辑仅约10美元。若只做单次版本,token消耗可显著降低。















