3C数码多模态内容理解高阶版提示词
为3C数码领域的高阶多模态内容理解任务提供专业提示词方案,帮助用户以产品分析专家或视觉创意策...
提示词内容
复制角色定义与任务定位
你应以3C数码产品多模态内容理解专家的身份使用本组提示词,核心目标是:针对智能手机、平板电脑、可穿戴设备、笔记本电脑等数码产品的图像、视频或多模态素材,进行深度信息提取(如材质、交互界面、接口布局、品牌标识、技术规格等),并转化为可直接用于产品文案、评测报告、视觉设计或AI训练数据集的结构化输出。你需要同时具备技术分析能力与视觉审美感知,确保生成的描述既精准可量化,又具备专业传播价值。
适用场景
- 电商详情页的产品图多模态标签生成与卖点提炼
- 数码产品评测视频的关键帧信息提取与文字化总结
- 多模态AI训练数据标注(如目标检测、属性分类)
- 产品发布会或广告片中的视觉元素拆解与创意再创作
- 智能硬件说明书与宣传素材的视觉-文本对齐
核心提示词(可直接复制使用)
- “以专业数码产品分析师视角,详细提取上图智能手机的背面视觉信息,包括摄像头模组排列(如三摄+激光对焦)、机身材质(如磨砂玻璃)、Logo位置与工艺、边框弧度及对角线长度,输出为技术参数+设计语言双重描述的JSON结构。”
- “此视频片段展示了一台笔记本电脑的展开过程,请提取以下多模态信息:屏幕边框宽度与材质、键盘背光颜色与键帽字符清晰度、转轴阻尼表现、接口类型与排布(左侧USB-C/右侧HDMI等),并以表格形式呈现。”
- “针对上图中的智能手表表盘界面,分析其UI布局:表盘背景色、复杂功能模块(如心率/步数/天气)的位置与尺寸比例、指针样式与动画细节,输出可用于前端还原的规范描述。”
- “这幅产品渲染图需进行视觉创意拆解:镜头光影方向、产品表面反射类型(镜面/哑光/拉丝)、环境光颜色与强度、产品阴影的柔和度,作为后续三维渲染参数参考。”
风格方向
- 技术诊断风:客观、参数化、无冗余修饰,适合标注与数据提取
- 极简科技风:突出几何感、高光、冷色调(金属灰、深空蓝),适合视觉创意
- 场景化叙事风:结合用户使用环境(如桌搭、运动、商务),增加情感与氛围词
- 微观质感风:强调细节纹理(如CNC切割边、激光蚀刻字母、纳米涂层反光)
构图建议
- 产品主体:中心对称或黄金螺旋构图,相机焦距推荐75-100mm(等效)以凸显质感
- 特定视角:45°前侧光突出立体感;俯拍展示布局与接口;微距局部聚焦新工艺(如摄像头镀膜颜色)
- 背景与氛围:渐变灰/黑背景避免干扰;或加入对应场景元素(如笔记本电脑放在大理石桌面旁边一杯咖啡)
- 动态提示:若为视频,选择关键帧(如开盖瞬间、接口插入瞬间、屏幕亮起瞬间)进行分析
细节强化
- 表面处理:区分镜面、磨砂、拉丝、类肤涂层、陶瓷质感,用“抗指纹涂层”“哑光处理”等术语
- 交互元素:按键反馈(段落感/线性)、指示灯颜色与闪烁模式、指纹识别区域材质差异
- 文字与标识:品牌Logo字体风格(无衬线/斜体)、端口旁丝印(如“HDMI/Thunderbolt 4”)、IMEI刻印深度
- 光线环境:自然光/棚拍硬光/混合环境光,色温(冷白/暖黄),高光是否溢出,阴影是否保留细节
- 结构层次:开孔倒角、拼接缝隙宽度、升降摄像头机械结构露出程度
使用建议
- 输入素材前先明确任务类型(信息提取 vs 创意表达),对应选择核心提示词中的范例并适当修改产品名称与细节范围。
- 若使用多模态大模型(如GPT-4V、Claude 3 Vision),可将“核心提示词”作为系统提示词,再上传具体图片/视频帧;若用于人工标注团队,可直接作为标注规范手册的参考语句。
- 对于复杂场景(如整机拆解图),可将提示词分解为多个子任务(如“先提取正面屏幕信息,再提取背面信息”),逐步生成后合并。
- 注意平衡专业术语的可读性:面向设计师可加入“P3色域覆盖率”“AG蚀刻玻璃”等词;面向文案可改为“超窄边框”“一体式金属机身”等营销化表述。
- 定期根据最新的3C硬件趋势更新细节强化词汇(如折叠屏铰链工艺、钛金属边框、AI芯片外观标识等),保持提示词的高阶时效性。