Midjourney提示词标准结构详解(新手必读)
想要Midjourney精准输出脑海中的画面,单凭堆砌关键词远远不够。大量形容词叠加的结果常常是主体模糊、风格飘忽不定,甚至同样的提示词重复生成,输出结果大相径庭。
专业级的提示词究竟如何编写?以下这套经过海量实战验证的方法,可以实现AI生成的精准可控,堪称标准操作流程。
高效提示词的三元基础结构:主语描绘 + 场景条件 + 风格属性
这是Midjourney解析文本的底层语法骨架。关键原则:三个模块的排列顺序不可颠倒。位置越靠前的词权重越高,AI会优先处理其语义。
“主语描绘”必须使用具象名词短语,例如“穿靛蓝工装裤的银发女机械师”。若只写“一个技术人员”,AI极有可能生成手持罗盘、焊枪或全息屏的画面,导致主体偏离预期。
紧随其后的“场景条件”负责锁定空间与物理上下文。例如“雨夜车库内,霓虹灯光反射在油渍地面上”。硬性要求是:必须同时包含空间(车库)、时间(雨夜)和材质反馈(油渍反光)三个要素。仅写一句“赛博朋克场景”等同于无效输入。
最后的“风格属性”用于收束整体风格与技术执行参数,例如:“赛博朋克插画, 8k细节, --ar 4:5 --v 6.2”。必须注意:--v 6.2 版本号需要显式声明。V6版本默认启用更强的语义理解,不加版本号将触发旧版解析逻辑,前面的权重设定会直接失效。
七段式高控语义公式
当你需要精细控制人物神态、动态叙事或进行商业级交付时,三元结构略显不足。七段式公式每段承载独立的语义功能,组合成完整的指令链。
- ① 主题: 嵌入生物特征锚点。例如“赤足少女,琥珀色瞳孔,编着铜铃辫”——铜铃的位置、辫子的走向、瞳孔的反光点,都是AI建模过程中的关键坐标。
- ② 环境: 激活材质衰变与光线穿透记忆。例如“废弃天文台穹顶,晨雾弥漫,碎玻璃散落”。写“老房子”无效,“碎玻璃”才是触发AI调用玻璃破碎物理模拟模块的精准开关。
- ③ 行为: 驱动肢体动力学建模。例如“踮脚伸手触碰悬浮的星图投影”。缺少行为描述,AI默认输出静态站姿;而“触碰”这一动词强制启用手指弯曲、重心前倾、衣料拉伸三重约束。
- ④ 构图: 直接干预像素分配逻辑。例如“低角度仰拍,三分法构图,主体居右”。不写构图时,AI会默认采用中心对称布局,容易将关键元素挤压到画面边缘。
- ⑤ 风格: 调用特定训练数据集的纹理。例如“吉卜力工作室手绘质感,柔和水彩边缘”。仅写“动画风格”过于宽泛,AI可能调用皮克斯或迪士尼数据源,导致笔触混乱。
- ⑥ 质量: 激活高采样率模块。例如“超精细纹理,皮肤毛孔可见,景深虚化”。“毛孔可见”是触发微表面建模的硬性关键词,缺失这一词汇,皮肤渲染始终呈现塑料质感。
- ⑦ 参数: 强制技术规范落地。例如“--s 800 --q 2 --style raw”。注意:--style raw 必须放在所有参数最后,否则会被前面的风格描述覆盖,导致默认美化滤镜重新生效。
模块化拼接法
这种方法最适合快速试错与团队协作。核心思路是用逗号分组,提升可读性与复用性——Midjourney对逗号分隔的短语识别稳定性远高于自然语言长句。
- 方法一:四组拆分法
- 主体组(含修饰):
a vintage brass pocket watch, open face, visible gears, patina on metal - 场景组(含光影):
on weathered oak desk, top-down macro view, shallow depth of field, f/1.4 - 风格组(含媒介):
Kodak Portra 400 film grain, soft vignette, muted tones - 参数组:
--no text --style raw --s750
- 主体组(含修饰):
- 方法二:符号隔离法
使用“|”明确背景隔离。示例:(Shanghai skyline:1.6)+(neon reflections on wet pavement:1.2) | depth:0.85。竖线右侧内容仅作用于背景层,避免霓虹反射干扰建筑主体结构。 - 方法三:括号嵌套法
使用括号绑定不可分割的语义单元。示例:portrait of (woman:1.5 wearing silk scarf) :: style:oil-painting-vincent。括号内“silk scarf”与“woman”形成强耦合,防止AI将围巾生成在肩膀以外的位置。
权重标注的标准化写法
关于权重,核心规则是:双冒号语法是Midjourney V6唯一支持的显式权重调控方式。其他括号、加号、斜杠等形式均不触发权重计算。
正确写法:a cyberpunk cat::2 wearing neon goggles::1.5 --v6.2 --style raw。其中 ::2 表示猫的权重为基准值的两倍,::1.5 表示眼镜的权重为1.5倍。注意:数值必须紧贴关键词后面,中间不允许有空格。
常见错误包括写成“cyberpunk cat :2”或“cyberpunk cat:: 2”,解析器会直接忽略权重,相当于无效标注。V6解析器对空格极其敏感,::和数字之间绝不能插入空格。
调试权重时建议:每次只调整一个元素的权重,然后对比四宫格输出结果。例如先将“neon goggles::1.5”改为“neon goggles::2.5”,观察眼镜是否从配饰升级为视觉焦点。同时调整多个权重,将无法定位具体哪个参数引发了偏差。
负向提示的强制隔离机制
负向提示并非可选项,而是语义压缩的必要手段。它的作用在于主动抑制干扰性语义域,将AI的生成空间压缩至目标区间。
四条基础负向指令必须包含:--no text --no logo --no border --photorealistic。其中“--photorealistic”并非风格描述,而是用来关闭AI对照片级真实感的默认追求。若不添加此条,画插画时AI可能生成过度锐化、皮肤带油光的照片式图像。
高阶负向控制针对常见失效类型追加限定。例如生成机械装置时,添加 --no wires, --no visible screws,可有效抑制AI默认添加的冗余工程细节;生成古风人物时,添加 --no modern clothing, --no smartphone,切断现代语义的污染。