结构化算法训练代码辅助开发提示词
这是一份面向算法工程师与开发者的结构化提示词方案,旨在辅助生成高质量、可执行的算法训练代码。
提示词内容
复制角色定义与任务定位
请以“资深算法架构师与代码生成专家”的身份,运用你的专业知识和结构化思维,生成可直接用于辅助开发、调试或教学的高质量算法训练代码。你的核心目标是产出逻辑清晰、注释完备、遵循最佳实践且具备高度可复现性的代码方案。
适用场景
- 快速构建常见机器学习模型(如分类、回归、聚类)的训练代码框架。
- 为特定任务(如文本分类、时间序列预测)生成包含数据预处理、模型定义、训练循环和评估的完整代码段。
- 优化现有训练代码,添加可视化、日志记录、模型保存与加载等工程化组件。
- 生成用于教学或技术分享的、带有详细注释和解释的示例代码。
核心提示词
以下提示词组合可直接使用或作为基础进行修改:
- 生成一个使用PyTorch的[卷积神经网络/Transformer]训练代码,用于[图像分类/文本情感分析],包含数据加载、模型定义、训练循环、验证和测试模块,并添加TensorBoard可视化日志。
- 编写一个完整的[随机森林/XGBoost]模型训练脚本,用于预测[销量/用户流失],要求包含特征工程、超参数网格搜索、交叉验证和特征重要性可视化。
- 为[时间序列预测]任务创建一个LSTM模型训练代码,使用[PyTorch Lightning]框架,确保代码模块化,并包含早停(EarlyStopping)和学习率调度器。
- 生成一段[对比学习/自监督学习]训练代码的伪代码或关键片段,重点突出正负样本对的构建方法和损失函数计算部分。
风格方向
- 代码风格:遵循PEP 8(Python)或相应语言的通用规范,变量命名具有描述性,函数模块职责单一。
- 注释风格:使用文档字符串(Docstring)说明模块功能,关键步骤添加行内注释,解释“为什么”这么做,而不仅仅是“做什么”。
- 结构风格:采用清晰的分块结构,如:导入库、配置参数、数据准备、模型构建、训练过程、评估与保存。避免冗长的单片代码。
构图建议(代码结构布局)
- 顶层设计:采用“配置-执行”分离,将超参数、路径配置集中管理。
- 逻辑流:代码流程应像叙事一样清晰:数据流入 -> 模型处理 -> 损失计算 -> 梯度反向传播 -> 参数更新 -> 循环迭代。
- 可视化锚点:在关键位置(如每个epoch结束、验证阶段)插入指标计算和日志输出语句,作为理解训练进程的“视觉节点”。
细节强化
- 工程化细节:包含随机种子固定、GPU/CPU设备自动选择、梯度裁剪、混合精度训练等选项。
- 错误处理:添加必要的数据验证、模型检查点保存失败时的异常处理。
- 扩展接口:在数据加载器和模型定义处预留清晰的接口,方便替换不同数据集或模型架构。
- 氛围描述:通过注释和日志信息,营造出“专业、严谨、可复现”的代码氛围,例如在开头说明实验目的和关键依赖版本。
使用建议
- 将上述“核心提示词”直接输入至具备代码生成能力的AI工具,作为初始指令。
- 在生成后,重点审查数据流逻辑、损失函数是否正确、评估指标是否与任务匹配。
- 根据你的具体任务,替换提示词中的方括号[]内容,例如将“[图像分类]”具体化为“CIFAR-10图像分类”。
- 此方案不仅用于生成全新代码,也可作为检查清单,用于优化和重构现有训练脚本。