数据分析Python脚本编写高阶版提示词

2026-05-09阅读 864热度 864

本提示词方案专为需要编写高效、专业Python数据分析脚本的用户设计,提供从角色定位到具体代码实...

数据分析 Python脚本编写 数据处理

提示词内容

复制

角色定义与任务定位

请以“资深数据分析工程师”或“数据科学项目架构师”的身份,运用本提示词方案。您的核心目标是:针对复杂、非标准化的数据分析需求,构思并生成结构严谨、执行高效、可复用性强的Python脚本。这不仅是编写代码,更是设计一套可靠的数据处理解决方案。

适用场景

  • 处理多源、异构、海量数据的清洗与整合任务。
  • 构建自动化数据分析流水线,实现从数据输入到可视化报告的全流程。
  • 进行探索性数据分析(EDA),需要快速生成统计摘要、相关性矩阵与异常值检测。
  • 开发可嵌入到生产环境或定期调度任务中的标准化分析模块。

核心提示词

以下提示词组合可直接用于引导AI生成或优化您的脚本:

  • “编写一个Python脚本,使用pandas和numpy,从[CSV/API/数据库]读取数据,执行以下步骤:1. 处理缺失值(采用前后填充或插值法);2. 过滤异常值(基于3σ原则或IQR);3. 按[特定维度]分组并计算[均值、总和、标准差];4. 使用matplotlib/seaborn生成分组柱状图和趋势折线图,并保存为PDF。”
  • “设计一个模块化的数据预处理类(DataPreprocessor),包含方法:load_data(), detect_outliers(), encode_categorical(), normalize_features()。要求支持日志记录和参数配置化。”
  • “创建一个脚本,利用pandas_profiling或sweetviz自动生成详细的EDA HTML报告,并集成关键统计指标的文本摘要输出。”
  • “开发一个脚本,使用Dask或Modin库对超出内存的大型数据集进行并行计算,实现[特定聚合操作],并监控内存使用情况。”

风格方向

  • 代码风格:遵循PEP 8规范,函数与类命名清晰,有详细的docstring注释。采用面向对象或函数式编程中适合的一种,保持一致性。
  • 架构风格:模块化设计,将数据I/O、清洗逻辑、分析计算、可视化输出分离。考虑使用配置文件(如YAML)管理路径和参数。
  • 输出风格:脚本输出应包括明确的日志信息(如使用logging模块)、结构化的结果数据(如保存至CSV或数据库)以及可直接用于汇报的图表。

构图建议(逻辑结构)

  • 导入区块:集中导入所需库,并注明主要用途。
  • 配置区块:定义常量、文件路径、数据库连接字符串等。
  • 核心函数/类定义区块:按数据处理流程顺序组织功能单元。
  • 主执行流程:使用 `if __name__ == "__main__":` 控制脚本执行逻辑,清晰展示从加载到输出的每一步。
  • 错误处理与日志区块:在关键步骤添加try-except,记录运行状态和错误信息。

细节强化

  • 性能细节:在循环操作中优先使用向量化计算;对大数据集,提示使用分块读取(chunksize)或高效数据类型。
  • 可维护性细节:在关键算法旁添加简要的原理或公式说明;为函数参数和返回值提供类型提示(Type Hints)。
  • 用户体验细节:通过argparse库添加命令行参数支持,使脚本更灵活;在脚本开头提供简明的使用示例。
  • 可视化细节:指定图表配色方案(如Set2、tab20c)、字体大小、图像DPI(≥300),确保图表专业且可出版。

使用建议

  • 将“核心提示词”中的具体需求替换为您的实际数据源、字段名和分析目标,即可作为完整提示直接使用。
  • 在生成代码后,可追加“请为上述脚本添加单元测试示例”或“请将上述脚本重构为支持并行处理的版本”等指令进行深化。
  • 本方案强调“设计”而非“一次性脚本”,建议在提示中明确要求生成易于扩展和集成的代码结构,以适应未来需求变化。

常见问题

相关提示词

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策