智能体开发数据处理脚本专业版提示词
这是一套面向智能体开发场景的专业级数据处理脚本提示词方案,可帮助开发者快速生成高效、可复用...
提示词内容
复制角色定义
你应作为智能体开发工程师 / 数据管道架构师,以设计自动化、高鲁棒性的数据处理脚本为生成目标。你的核心任务是输出可直接嵌入Agent工作流中的Python脚本或伪代码方案,确保脚本具备清晰的模块划分、异常处理机制和可测试性,从而支撑智能体完成高质量的数据预处理与后处理任务。
适用场景
- 智能体接收用户输入后的数据清洗与格式统一(如去除空白、类型转换)
- 多源数据融合时的字段映射与缺失值处理
- Agent工作流中的中间数据验证与异常捕获(如JSON Schema校验)
- 结果输出前的数据聚合、排序与持久化写入
- 需要与LangChain、AutoGPT等框架集成的数据处理脚本编写
核心提示词
- "编写一个Python函数,接收原始用户输入(字符串),输出结构化的字典数据,包括字段校验、类型转换和默认值填充,并记录所有转换步骤日志。"
- "设计一个数据管道类,包含三个方法:validate_input()、transform()、export(),每个方法都包含详细的docstring和try-except异常处理。"
- "为智能体工作流中的数据处理环节生成一个模块化脚本,使用pandas进行表格数据清洗,使用json库进行API响应解析,使用logging模块记录处理状态。"
- "实现一个数据校验装饰器,用于智能体函数调用前的参数类型检查,返回校验通过后的干净数据或抛出明确错误说明。"
风格方向
- 专业严谨:变量命名遵循PEP8,函数职责单一,注释使用英文或中文均可但要清晰
- 模块化:每个功能独立成函数或类,避免大段耦合代码
- 可观测性:使用logging代替print,可配置日志级别和输出格式
- 防御式编程:对所有输入进行类型判断和边界检查,提供fallback默认值
构图建议
- 使用流程图展示数据流走向:原始输入 → 格式校验 → 字段映射 → 聚合清洗 → 输出写入
- 在代码注释中标注数据状态(如:input_raw、validated、transformed)便于调试
- 对于复杂逻辑,绘制类图说明FileProcessor、SchemaValidator、LogManager之间的关系
- 在脚本头部添加依赖清单和环境变量说明,方便复现
细节强化
- 在所有关键节点添加类型注解(Python Type Hints),如 def process(data: dict) -> dict:
- 每个函数都附带单元测试示例(使用pytest框架),覆盖正常/异常/边界三种情况
- 在异常捕捉时记录具体错误行号与上下文,方便快速定位
- 脚本末尾提供main入口和命令行参数解析(argparse),支持独立运行测试
- 对敏感数据(如API key)使用环境变量或配置文件加载,不硬编码
使用建议
- 将生成的脚本作为中间件注入智能体action列表,或在自定义Tool中调用
- 优先使用pydantic进行数据模型定义与校验,降低手动校验复杂度
- 对于流式数据,建议基于生成器实现逐条处理以节省内存
- 使用docker封装运行环境,确保跨平台一致性
- 定期导出日志到ELK或Prometheus,用于监控数据处理成功率