实战型测试工程数据集清洗方案提示词
本文为测试工程师与数据科学家提供一套结构化提示词方案,旨在生成用于指导数据集清洗工作的实战...
提示词内容
复制角色定义与任务定位
请以“数据可视化架构师”兼“测试流程专家”的身份进行创作。您的核心目标是:生成一套高度结构化、信息层级分明、且极具实用指导意义的“数据集清洗方案”视觉图表。该图表需服务于测试工程团队,能直观展示从原始数据到高质量测试数据集的完整清洗流程、关键决策点与技术要点,而非简单的概念说明。
适用场景
- 测试团队内部的数据预处理流程培训与知识沉淀。
- 测试方案文档中,用于阐释数据准备阶段的视觉化补充。
- 向项目管理者或非技术成员汇报测试数据质量保障措施。
- 作为自动化测试脚本中数据清洗模块的设计思路导图。
核心提示词
可直接组合使用的提示词序列:
- infographic flowchart of a robust data cleaning pipeline for testing engineering datasets
- steps: raw data ingestion, duplicate detection, outlier handling with statistical bounds, null value imputation strategies, format standardization, consistency validation
- visual elements: data bins, funnel filters, magnifying glass on anomalies, checkmarks and warning signs, before-and-after data table comparison
- style: clean corporate blue and gray color scheme, isometric or flat design, with clear connectors and minimal text labels
风格方向
- 视觉风格:现代极简的信息图(Infographic)或等距立体(Isometric)流程图。避免卡通化,追求专业、冷静的科技感。
- 色彩控制:主色调采用蓝色系(象征可靠、科技),搭配中性灰与白色作为背景。使用警示性的橙色或红色高亮标注“异常数据”、“清洗失败”等关键节点,使用绿色表示“通过验证”、“清洗完成”。
- 版面构图:从左到右或自上而下的线性流程布局,确保视觉动线清晰。关键步骤使用图标(Icon)加简短术语的形式呈现。
构图建议
- 采用“漏斗”或“流水线”作为整体隐喻构图,象征数据从杂乱到纯净的筛选过程。
- 将“原始数据源”描绘为多个不同形状/颜色的数据块涌入管道入口。
- 每个清洗步骤(如去重、处理缺失值)设计为一个独立的“处理箱”或“过滤站”,箱体上可带有代表该操作的小图标。
- 用清晰的箭头或管道连接各步骤,箭头旁可附加简短的决策逻辑,如“IF NULL THEN mean”。
- 在流程旁侧,开辟“案例区”对比展示某个数据记录在清洗前与清洗后的具体变化。
细节强化
- 数据形态:用不同几何图形(立方体、球体、文档图标)代表不同类型数据(数值型、类别型、文本日志)。
- 异常可视化:离群点可用偏离主要集群的闪烁点或“刺状”图形表示;缺失值可用透明或网格填充的方块表示。
- 技术标注:在关键步骤旁,以非侵入性的小字标注可能采用的技术或工具,例如:“(使用Pandas drop_duplicates)”、“(应用IQR准则)”。
- 质量指标:在流程最终输出端,展示如“数据完整性:99.8%”、“一致性:100%”等虚拟的质量指标仪表盘。
使用建议
- 生成图像时,将“核心提示词”部分作为主体描述,并根据需要从“风格方向”和“细节强化”中选取关键词进行追加,以控制输出效果。
- 若需强调某一环节,可在提示词中增加权重,例如“highlighting outlier handling with bright red color”。
- 本方案生成的图表可作为母版,通过替换具体步骤名称和图标,快速适配于不同的测试数据清洗场景(如API响应数据清洗、UI测试截图数据清洗等)。
- 建议最终产出为高清分辨率,以便嵌入文档或演示文稿中。