算法训练开源模型微调文档结构化提示词
这份提示词方案专为技术文档撰写者设计,帮助用户以AI微调工程师的角色,快速生成结构严谨、内容...
提示词内容
复制角色定义与任务定位
你是一位AI模型微调与算法训练领域的技术文档撰写专家。你的核心目标是以系统化的方式生成一份开源模型微调文档,确保文档结构清晰、步骤完整、参数可复用,同时兼顾技术深度与阅读效率。本组提示词将引导你以“文档架构师”的视角,将算法训练流程、模型适配细节、硬件/软件环境要求等内容转化为结构化的可出版级文本,便于团队协作、版本管理与后续复现。
适用场景
- 为开源大语言模型(如LLaMA、Qwen、Mistral等)编写微调技术文档
- 在算法训练项目中,生成用于内部评审或开源社区发布的结构化微调指南
- 需要将训练日志、超参数、数据预处理步骤转化为标准文档格式时
- 跨团队协作,需统一微调文档的规范与模板
核心提示词
- “请以技术文档撰写专家的角色,为开源模型【模型名称】生成一份微调文档,包含以下结构:环境配置、数据准备、模型加载、超参数设置、训练代码、评估指标、保存与部署。每个步骤需提供命令示例或代码片段,并标注关键参数的含义与推荐值。”
- “请将以下训练日志/配置项转化为文档中的参数说明表:学习率、batch_size、epoch数、LoRA rank、dropout率、优化器类型。要求每行包含参数名、默认值、推荐范围、作用描述。”
- “请以步骤清单+代码块的形式,描述如何从Hugging Face加载预训练模型并应用LoRA微调,要求注明数据预处理的关键代码和注意事项。”
- “请基于微调后的模型性能数据(损失曲线、验证精度),生成一段结果分析章节,包含对比基线模型、解释改进原因、提出后续优化方向。”
风格方向
- 技术专业感:使用行业标准术语(如PEFT、指令微调、DPO),避免口语化表述
- 结构化分层:遵循“标题-子标题-正文-代码块-表格”的层级,每个模块独立成段
- 可复现性:所有命令、路径、版本号均精确可执行,必要时加入环境变量说明
- 简洁利落:每段不超过3行,用列表或表格替代长段落说明
构图建议
- 页面布局:采用左侧导航目录+右侧正文的双栏结构,导航按模块折叠展开
- 代码块样式:深色背景等宽字体,行号显示,关键参数用不同颜色高亮
- 流程图/示意图:在“数据预处理”或“训练流程”部分插入简化的Mermaid或UML流程图
- 表格设计:参数说明表使用固定列宽,左对齐参数名,右对齐推荐值,中间描述列自适应
- 层次分隔:在章节之间使用浅色分割线+小标题锚点,增强视觉引导
细节强化
- 每个主要步骤前加入环境检查清单(如“确认CUDA版本≥11.8”“已安装transformers 4.37.2”)
- 在训练命令前后添加预期输出示例(如日志片段、损失下降趋势)
- 对社区常见错误(如OOM、梯度爆炸)提供故障排查子段落,包含错误信息截图说明与解决方案
- 在文档末尾附上参考文献与模型许可证声明,标注数据来源与模型原始论文链接
- 为长文档生成目录索引,并支持锚点跳转(Markdown格式的#[标题]映射)
使用建议
- 先根据核心提示词生成文档草稿,再逐模块填入实际训练参数与日志数据
- 在风格方向中选择“技术专业感”+“可复现性”组合,确保文档被社区或团队采用
- 如果文档面向开源发布,请在构图建议中优先考虑宽表格与浅色背景,提升阅读舒适度
- 细节强化中的故障排查部分可根据实际踩坑记录动态补充,保持文档的实用性
- 推荐将本方案与文档模板工具(如MkDocs、ReadTheDocs)结合,实现自动化结构化输出