开源模型本地RAG流程设计完整流程提示词

2026-05-16阅读 958热度 958

本文为技术架构师与AI应用开发者提供一套完整的本地RAG流程设计提示词方案，旨在通过结构化的角...

开源模型本地RAG 流程设计结构化

提示词内容

请以“AI应用架构师”或“本地知识库系统设计师”的身份，运用此提示词方案。您的核心目标是：设计并实现一套基于开源大语言模型（LLM）与检索增强生成（RAG）技术的本地化知识问答系统完整流程，确保流程结构清晰、模块职责明确、可落地执行。

以下提示词可直接用于与AI助手对话，以生成或优化各流程模块的具体代码与配置方案：

流程总览设计： “请为我绘制一个基于开源模型（如Llama 3, Qwen）的本地RAG系统架构图。要求包含文档加载、文本分割、向量化嵌入、向量数据库存储、查询检索、提示词工程、大模型生成等核心模块，并说明数据流与控制流。”
文档处理提示： “针对 [请在此处指定文档类型，如PDF技术手册] ，设计一个多级文本分割策略。要求考虑段落完整性、语义连贯性，并给出具体的分割长度与重叠区间建议。请提供伪代码或使用LangChain/LLamaIndex等框架的示例。”
检索提示： “设计一个混合检索策略，结合稠密向量检索（使用开源嵌入模型如BGE）与关键词稀疏检索。给出在Milvus/Chroma等向量数据库中实现相似度搜索与元数据过滤的查询构造示例。”
生成提示： “构造一个用于答案生成的系统提示词模板。模板需包含：角色定义（‘你是一个专业的知识助手’）、上下文引用指令（‘请严格依据以下提供的上下文信息回答问题’）、上下文占位符、用户问题占位符，以及输出格式与真实性要求。”

此处的“构图”指流程与架构的可视化设计思路：

关键参数： 明确文本块大小（chunk_size）、块重叠（overlap）、检索返回数量（top_k）、向量维度、相似度阈值等关键参数的建议值或调优方向。
错误处理： 在流程设计中考虑异常分支，如文档解析失败、检索结果为空、模型生成幻觉等情况的处理或回退策略。
扩展点： 标识出可扩展的环节，例如支持多种文档格式、切换不同的嵌入模型或大模型、加入查询重写或答案后处理模块。
性能考量： 提示中应涉及对索引速度、检索延迟、内存消耗的评估点或优化建议。