高质量数据分析代码生成调试提示词
这是一份专为数据分析师与开发者设计的结构化提示词方案,旨在通过精准的角色定义与任务拆解,指...
提示词内容
复制角色定义与任务定位
请以“数据分析与代码生成专家”的身份,并设定“生成可直接运行、逻辑清晰且包含必要错误处理与可视化功能的数据分析代码”为核心目标。你的任务不仅是写出代码,更是通过提示词精准描述分析需求、数据特征、预期输出及潜在问题,引导AI生成兼具功能性、健壮性与可读性的完整代码方案。
适用场景
- 需要快速生成数据清洗、探索性分析(EDA)、统计建模或可视化的Python代码脚本。
- 对现有代码进行调试、优化或添加注释,提升代码可维护性。
- 为特定数据分析任务(如时间序列预测、用户行为聚类)构建标准化代码模板。
- 在编写技术文档、教程或报告时,需要嵌入高质量、可复现的代码示例。
核心提示词
可直接复制使用的提示词结构示例:
- “作为数据分析师,请生成一段Python代码,使用pandas和matplotlib,读取‘sales_data.csv’文件,计算每月销售额总和并绘制折线图。要求包含数据缺失值检查与处理逻辑。”
- “调试以下Python代码:[粘贴代码片段]。指出其中的逻辑错误与潜在的性能瓶颈,并提供修正后的完整代码。”
- “生成一个用于客户分群(聚类分析)的代码模板。要求包含数据标准化、使用K-Means算法、确定最佳聚类数(肘部法则)以及可视化聚类结果的步骤。请为关键步骤添加中文注释。”
风格方向
- 代码风格:优先遵循PEP 8规范,变量命名需具有描述性,函数设计遵循单一职责原则。
- 输出风格:代码块应完整,并附带简要的步骤说明或注释。解释应聚焦于“为什么这么做”而非单纯复现代码。
- 文本风格:提示词本身应具体、无歧义,明确指定库版本(如必要时)、输入数据格式及期望的输出格式。
“构图”建议(代码结构框架)
- 导入区:明确定义需要导入的库(如:import pandas as pd, import matplotlib.pyplot as plt)。
- 数据加载区:指定数据源路径、格式及编码方式,并立即添加基础信息查看(如 .info(), .head())。
- 预处理区:结构化描述清洗步骤(处理缺失值、异常值、类型转换)。
- 分析/建模区:清晰定义分析逻辑、算法选择及参数设置意图。
- 结果输出区:明确可视化要求(图表类型、标题、标签、保存格式)或结果导出要求。
- 错误处理区:建议添加try-except块或数据验证断言,增强代码鲁棒性。
细节强化
- 数据假设:在提示词中明确数据集的假设条件(如“假设日期列名为‘date’,格式为YYYY-MM-DD”)。
- 性能提示:对于大数据集,可指定使用更高效的方法(如向量化操作、避免循环)。
- 可视化细节:指定图表颜色主题(如Seaborn的‘darkgrid’)、图形尺寸(figsize)、是否保存为文件。
- 调试焦点:调试时,指出具体报错信息或异常行为,并限定调试范围(如“重点检查第15行到第20行的循环逻辑”)。
使用建议
- 将复杂的分析任务拆解为多个连续的提示词对话,例如先生成数据清洗代码,验证无误后再生成分析代码。
- 在提示词中直接要求“对关键代码段添加行内注释”或“提供代码的简要执行流程说明”。
- 生成代码后,可追加提示词如:“请为上述代码生成一个单元测试示例”或“如何将这段代码重构为一个可配置的函数?”。
- 结合标签“文本创作”,可将最终生成的优质代码与解释文本整合,用于创建技术博客或项目文档。