专业版Python开发本地RAG流程设计提示词

2026-05-20阅读 767热度 767

这是一份为Python开发者与架构师设计的专业提示词方案,聚焦于本地RAG流程的构建与设计。

Python开发 本地RAG 流程设计 文本创作 完整流程

提示词内容

复制

角色定义与任务定位

请以“资深Python后端架构师兼技术方案设计师”的身份,运用你的系统设计思维与工程化经验。你的核心目标是:生成一份详尽、模块化、可直接指导代码实现的“本地检索增强生成(RAG)系统”流程设计方案,确保方案具备高内聚、低耦合的特性,并兼顾性能、可维护性与本地化部署要求。

适用场景

  • 为个人知识库或企业私有文档构建本地智能问答系统。
  • 设计一个脱离云服务依赖、保障数据隐私的本地化AI应用原型。
  • 编写技术方案文档或项目README,清晰阐述RAG系统各模块职责与数据流。
  • 指导中级开发者进行模块化编码,或作为代码审查的架构参考依据。

核心提示词

可直接复制用于生成详细设计描述或代码注释的提示词组合:

  • 模块化设计:文档加载器 -> 文本分割器 -> 向量化嵌入 -> 向量数据库存储 -> 查询检索 -> 提示词工程 -> LLM生成 -> 输出格式化。
  • 技术栈推荐:LangChain/LlamaIndex框架组织流程,sentence-transformers生成嵌入,Chroma/FAISS作为本地向量数据库,Ollama或本地部署的LLM(如Qwen、ChatGLM)作为生成模型。
  • 关键流程描述:实现一个完整的本地RAG流水线,重点描述文档预处理阶段的清洗与分块策略,以及检索阶段的多路召回与重排序(Rerank)机制设计。
  • 异常处理与日志:在数据加载、嵌入失败、检索无结果、LLM调用超时等关键节点设计重试与降级策略,并输出结构化日志。

风格方向

  • 表达风格:采用技术架构图说风格,语言精准、逻辑严密,避免文学化修饰。多使用“接口”、“流水线”、“中间件”、“持久化”、“并发处理”等工程术语。
  • 文档风格:产出内容应类似于开源项目的高质量技术设计文档,结构清晰,层次分明,包含明确的模块边界定义和接口说明。

构图建议(流程可视化)

  • 建议采用横向数据流图(Data Flow Diagram)或纵向的架构层次图来组织你的描述。
  • 顶层构图:以“用户查询”为起点,“答案输出”为终点,中间描绘清晰的单向或双向数据流。
  • 核心层:突出“离线处理”与“在线服务”两大阶段的分界。离线侧重点描述文档入库的批处理流程;在线侧重点描述查询响应的实时链路。

细节强化

  • 性能细节:指明文本分块的长度与重叠度建议,讨论嵌入模型的选择(如BGE、text2vec)与维度对存储和速度的影响,描述向量索引的优化策略(如HNSW)。
  • 扩展点:提示系统应设计为可插拔,例如易于更换向量数据库、嵌入模型或LLM,并考虑未来引入Agent进行复杂查询分解的可能性。
  • 实用代码片段提示:在描述关键步骤时,可提示生成伪代码或Python代码片段示例,例如使用LangChain的`RecursiveCharacterTextSplitter`或自定义检索器的类结构。

使用建议

  • 直接复制“核心提示词”中的短语组合,输入至你的代码生成AI工具(如Cursor、Copilot)或文档生成工具,以获取更具体的代码或段落。
  • 将本方案中的模块作为你项目目录结构的参考,例如按“data_loader”、“embedding”、“retriever”、“generator”等划分包名。
  • 在团队评审时,可依据此方案的结构逐一讨论每个模块的技术选型与实现细节,确保分工明确。
  • 根据实际项目复杂度,可优先实现核心流水线(加载-嵌入-检索-生成),后续再迭代增加缓存、重排序、评估等高级特性。

常见问题

相关提示词

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策