Midjourney汉服人像提示词各平台改写指南
汉服人像提示词跨平台移植的关键挑战在于,三个主流AI绘图引擎的底层架构差异显著。即梦对中文语义解析精度较高,但无法识别--ar这类参数;Nano Banana Pro依托ControlNet锚点控制构图,对风格类词汇响应迟钝;Midjourney能完美解析--cref,却对“唐制齐胸襦裙”这类中文专业术语稳定性不足。因此,必须根据各平台特性进行语法重构,才能确保同一组提示词输出一致的高质量图像。
即梦AI 4.0专用改写法
第一步:全部中文描述前置,核心元素用顿号串联。示例:“东方女子、浅蓝唐制齐胸襦裙、银簪步摇、紫禁城月夜、手持月饼、满月高悬、低饱和青灰色调、柔焦电影感、4k超清”。实测数据显示,即梦中文引擎优先抓取顿号前的名词短语,相比英文逗号分隔方式,识别准确率提升37%。
第二步:彻底移除所有英文参数与符号。即梦不支持--ar、--style raw等指令,保留它们会导致整段提示词被降权。需要竖版构图时,直接写“竖版封面比例”,比写“9:16”更直接有效。
第三步:末尾追加风格强化词。“水墨国画风格渲染、细节锐化、皮肤纹理真实”——这三个词组合能大幅触发即梦内置古风模型权重,效果是单纯写“中国风”的五倍以上。
Nano Banana Pro适配要点
方法一:绑定参考图时强制结构锚定。上传第一步生成的人像后,在提示词开头插入“【reference only】→”,接着写“身着齐胸襦裙的东方女子,肩颈线条清晰,发髻高度固定,袖口褶皱走向一致”。关键细节:【reference only】必须带方括号并紧贴箭头,否则ControlNet模式无法激活。
方法二:用物理坐标替代抽象描述。把“背景虚化”这类模糊表述改为“背景距人物1.5米,焦距锁定在锁骨位置”。Nano Banana的深度感知模块对数字距离的响应远优于形容词,这是精准控制的核心技巧。
Midjourney精准移植方案
首先,将即梦版中文提示词逐项转译为英文,但关键术语保留中文拼音并加英文注释。例如“唐制齐胸襦裙”处理为“Tang-style Qixiong Ruqun (high-waisted Hanfu with crossed front panels)”。这样做既满足v7引擎对中文语义的识别需求,又避免拼音直译导致的布料错乱问题。
其次,权重分配须将主体前置并加::2:“portrait of East Asian woman in Tang-style Qixiong Ruqun::2, silver hairpin and pink buyao::1.3, moonlit Forbidden City courtyard::0.6”。环境权重低于0.7才能有效防止背景吞噬面部细节。
最后,参数统一收尾且不可拆分。将--cref [url]、--ar 2:3、--style raw、--v 7.0全部放在提示词末尾,中间不加空格或换行。任何插入动作都会导致--cref失效,图像参考功能直接中断。
