开源模型Python脚本编写清晰框架提示词
本文为开源模型Python脚本编写提供一套清晰、可落地的提示词框架,旨在帮助技术开发者与项目管理...
提示词内容
复制角色定义与任务定位
请以“资深开源项目技术架构师”的身份,并围绕“为开源AI模型项目编写高质量、可维护的Python脚本”这一核心目标来使用本提示词框架。你的任务是生成逻辑清晰、结构规范、注释完备的代码,确保脚本具备良好的可读性、可扩展性,并能直接服务于模型训练、推理、数据处理或工具链构建等实际开发环节。
适用场景
- 为特定开源模型(如Stable Diffusion、LLaMA、Whisper等)编写数据处理或格式转换脚本。
- 构建模型训练流程中的辅助工具脚本,如学习率调度、日志记录、检查点管理。
- 开发模型部署与推理的自动化脚本,包括API封装、批量预测等。
- 创建模型性能评估与结果可视化的分析脚本。
- 编写用于模型权重转换、适配不同框架的实用工具脚本。
核心提示词
以下提示词组合可直接使用或作为基础进行微调,以生成目标脚本:
- 编写一个Python脚本,使用[指定库,如PyTorch/TensorFlow/HuggingFace Transformers]加载[具体开源模型名称]模型,并实现一个完整的[具体任务,如图像生成/文本分类]推理流程。
- 创建一个脚本,用于预处理[数据类型]数据以适配[模型名称]模型的输入要求,包含数据读取、清洗、标准化和批次生成功能。
- 开发一个工具脚本,能够将[模型A]的权重文件转换为与[模型B]框架兼容的格式,并保留所有必要的参数和结构。
- 设计一个训练监控脚本,实时记录损失、准确率等指标,并生成动态的[Matplotlib/Seaborn]可视化图表,保存至日志文件。
风格方向
- 代码风格:严格遵循PEP 8规范,使用明确的变量名和函数名(如`preprocess_image_batch`),采用4个空格缩进。
- 结构风格:模块化设计,将配置参数、模型定义、数据处理、主流程分离。使用`if __name__ == "__main__":`作为程序入口。
- 文档风格:在文件开头使用多行注释说明脚本目的、作者、版本及使用示例。为每个函数和复杂逻辑块添加清晰的Docstring或行内注释。
- 错误处理风格:使用`try-except`块进行健壮的错误捕获和日志记录,对关键操作(如文件I/O、模型加载)提供明确的成功/失败反馈。
构图建议(代码结构布局)
- 导入区块:集中放置所有import语句,并按标准库、第三方库、本地模块分组。
- 配置区块:使用字典或类来集中管理所有可配置参数(如路径、超参数),便于修改。
- 函数定义区块:按逻辑顺序定义功能函数,每个函数职责单一,高内聚低耦合。
- 主逻辑流:在`main()`函数或`if __name__`块中,清晰地串联起初始化、数据处理、核心计算、结果输出等步骤。
- 输出与日志区块:确保结果(如预测文件、图表)的保存路径明确,并在控制台输出关键进度信息。
细节强化
- 路径处理:使用`os.path`或`pathlib`确保跨平台路径兼容性。
- 进度提示:在处理大量数据时,使用`tqdm`库添加进度条,提升用户体验。
- 类型提示:为函数参数和返回值添加Python Type Hints,增强代码可读性和IDE支持。
- 环境说明:可在注释中注明所需的Python版本和关键依赖库及其版本号(如`torch==2.0.0`)。
- 示例数据:在注释或文档中提供一小段示例输入和期望输出,方便快速测试。
使用建议
- 在使用核心提示词时,请将方括号`[]`内的占位符替换为具体的模型名、任务或数据类型,越具体越好。
- 生成代码后,务必在目标环境中进行测试,并根据实际依赖调整`import`语句和版本。
- 可将本框架中的“风格方向”和“细节强化”要点作为补充要求,附加在核心提示词之后,以引导AI生成更符合工程规范的代码。
- 对于复杂脚本,建议采用“分步生成”策略:先生成主体框架和函数定义,再逐步细化每个函数的具体实现。