智能体开发模型微调计划完整流程提示词
这是一套为智能体开发项目量身定制的模型微调计划提示词方案,以AI微调工程师的角色出发,覆盖从...
提示词内容
复制角色定义与任务定位
你应以AI模型微调工程师或智能体开发项目经理的身份使用本组提示词。核心目标是:为智能体项目制定一份可落地、可复现的模型微调计划,明确各个阶段的关键动作、参数策略和评估标准。这份提示词方案旨在输出一套结构化的操作流程,适合直接用于技术方案编写、团队任务分配,或作为图像生成工具(如流程图、工作流示意图)的输入。
适用场景
- 智能体开发中的模型微调阶段规划与评审
- 面向AI开发者的技术文档与教程内容
- 团队协作中的任务拆解与进度管理
- 生成可视化流程图或工作流示意图的提示词输入
核心提示词
以下提示词可直接复制并用于文本生成或图像生成工具,可根据需要调整括号内的具体参数。
- 计划框架提示词:“一份完整的智能体模型微调计划,包含六个阶段:数据准备(数据清洗、标注质量检查、分布采样)、基础模型选型(Llama-3、GPT-2、BERT-base等)、微调策略选择(LoRA或全参数微调)、超参数配置(学习率1e-4~5e-5、batch size 16~32、epochs 3~10并配合早停)、验证与评估(使用Hold-out验证集,监控损失和BLEU/ROUGE分数)、部署优化(INT8量化、知识蒸馏、推理延迟测试)。请按时间顺序列出每个阶段的操作清单与检查点。”
- 流程说明提示词:“请生成一份智能体开发中模型微调计划的流程图描述:以‘数据预处理’为起点,依次经过‘模型加载与冻结’、‘LoRA适配器配置’、‘训练循环(含学习率调度与早停)’、‘验证集评估’、‘导出与量化’,最终到达‘部署验证’。每个节点附上关键参数(如LoRA rank=8, alpha=16)。”
- 风险控制提示词:“在智能体微调计划中,需重点防范过拟合(使用Dropout和权重衰减)、灾难性遗忘(经验回放或EWC)、数据分布偏移(在线数据采样与分布监控)。请为每个风险提供缓解策略并嵌入计划模板。”
风格方向
- 叙事风格:技术文档式、步骤化、清单化,避免口语化与感性描述
- 视觉风格:理性、干净,适合黑白或低饱和配色,强调流程节点与箭头连接
- 语言风格:中英混合关键词保留(如LoRA、epochs、batch size),便于专业团队快速理解
构图建议(用于图像生成)
- 采用横向或纵向流程图布局,从左到右或从上到下排列,节点间用箭头连接
- 节点采用圆角矩形,内部标注阶段名称和关键参数(如“数据集划分:80%训练 / 10%验证 / 10%测试”)
- 在流程末尾增加“部署”节点,附带“量化INT8”和“推理延迟<50ms”等约束条件
- 配色使用科技蓝+灰色,字体使用无衬线等宽字体
细节强化
- 在数据准备阶段强调标签质量校验:交叉验证重复标注样本,剔除矛盾数据
- 在微调策略中增加学习率预热(前10%步骤线性增长)和余弦退火调度
- 评估阶段加入对抗样本测试,验证智能体在噪声输入下的鲁棒性
- 部署优化中注明模型分片或异步推理以降低显存占用
使用建议
- 将核心提示词直接复制到AI文本生成工具(如ChatGPT、Claude)中以获取完整计划文档
- 若需生成流程图,将核心提示词中的流程节点描述输入到Midjourney或DALL·E等图像工具,并附加“流程图风格、无背景、专注于节点与连线”等控制词
- 可根据实际基础模型类型(如Llama、GPT、BERT)和任务类型(对话、分类、生成)调整参数范围
- 建议将本提示词方案作为模板,每次使用时仅替换数据规模、算力限制等变量即可快速复用