AI歌手MV生成全流程教学:从零到专业制作指南
培养一个AI明星出道,需要多长时间?答案是,72小时。
先看成果:这是手搓出来的AI女明星,这是为她生成的定妆照,还有这些——结合故事剧本生成的一系列剧照。整个过程,可以拆解为AI音乐、AI捏脸、AI生图、AI视频、AI数字人五个关键步骤。下面就直接进入正题,聊聊如何用AI打造一条虚拟明星的音乐MV。
动手之前,先想好MV的大致基调。比如,喜欢大气磅礴、有吟唱部分、带中国风的内容,那就提炼出这三个核心词。
第一步:AI音乐
打开Tunee这个音乐智能体。在输入框里把三个核心词粘贴进去,再加上一句指令:按照以上关键词,为我生成一个纯音乐的BGM。AI会给出三种风格选项供筛选。当然,也可以全都要——让AI为每种风格生成两首音乐,质量都不错。最终选定一个版本作为基底。这里有一个经验:先出音乐,然后听AI去想象画面,这样创作起来的代入感会更强。
第二步:AI捏脸
确定主角形象。手头有一张之前AI生成的现乘人物图,很多人说这张图撞脸张元英了,你们觉得有几分像?
如果没有现成形象,可以先找一张喜欢的明星照片。把它上传给豆包,补充提问:“请为我详细描述这个人的五官特征。”复制这串描述词后,在即梦里输入提示词:“为我生成一个明星长相,详细描述如下”,再粘贴刚才的词,点击生成,就能得到相应的人物长相。
第三步:AI生图
这一步是把指定角色放进指定场景,生成一张张静态图。用的是海螺Agent搭配Nano Banana。在海螺首页点击Agent,新建项目,上传之前捏好的形象。点击对话按钮,把准备好的分镜脚本粘贴进去,附上一句描述:“请根据以上所有分镜和我提供的角色图,为我生成全部图片,尺寸均为16:9。”生成后所有图片会铺在界面上,方便挑选和修改。最终的生图效果,部分展示如下。
值得强调的是,Nano Banana对人物一致性的保持非常出色,甚至可以生成同一个角色在不同角度、不同动作、不同景别下的图片。
第四步:视频生成
挑选几个典型案例来具体说明。
细节类生成:比如女人近距离围观火苗的镜头(生成AI:可灵)。第一次图生视频提示词是“女人看着眼前的火焰燃烧”,但生成的效果缺少了眼中倒影的细节。第二次生成,增加了“眼中反射跳动的火光”这句提示词,细节就得到了补充。
运镜类转场:秦始皇在宫殿内的镜头(生成AI:海螺)。首尾帧生视频提示词是:“男人坐着不动,镜头向右旋转,转为正视视角,镜头急速后退,高速摄影动态模糊。”这里用两张坐姿不同的图做了首尾帧合成。为了让后退的视觉冲击感更强,加入了“镜头急速后退,高速摄影动态模糊”,最终效果相当震撼。
表情:图生提示词用“抿紧嘴唇 忍住不哭”(生成AI:可灵)。正常人忍住不哭时,一定会有微表情和小动作。如果直接输入“忍住不哭”,不符合真实状况。加上了“抿紧嘴唇”这个细节,表情效果就更像真人。
动作类型:女人求救的演技非常出神入化(生成AI:可灵)。图生提示词用了“奄奄一息的女人,朝天伸出手,俯视视角”。带上了“奄奄一息”的描述,再加上“俯视视角”来保持拍摄角度。这个角度下的女人显得更加无助,戏剧效果被瞬间放大。
第五步:数字人
还有一个关键步骤不能跳过。用剪辑软件把音乐里的吟唱部分单独剪出来。然后在即梦里切换到数字人功能,分别上传人物的露脸视频和吟唱音频。模式记得选大师版,点击生成,就能得到带口型的数字人视频。
最后,把所有生成的视频素材按照音乐节奏剪辑在一起,一段AI歌手唱歌的MV就完成了。今天就分享到这里。
