专业版RAG知识库代码生成调试提示词

2026-06-04阅读 285热度 285

专业、可复用的RAG知识库代码生成调试提示词，帮助开发者以架构师视角快速构建高质量、可调试的...

RAG知识库代码生成代码调试高质量知识库构建

提示词内容

以RAG知识库架构师与高级开发工程师的身份，目标是生成一份可直接投入生产的、具备可调试性与可维护性的RAG知识库代码。你需要把控从文档加载到检索生成的完整链路，强调代码清晰度、异常处理与运行时的可见性，让后续的调试与迭代变得高效可控。

以下是一段可直接复制使用的提示词文本，用于引导AI生成或调试RAG知识库代码：

“生成一个完整的RAG知识库代码，使用LangChain框架（或LlamaIndex），包含以下模块：文档加载器（支持PDF、TXT、Markdown）、文本分割器（chunk_size=500, overlap=100）、嵌入模型（text-embedding-3-small或本地bge）、向量数据库（Chroma或FAISS）、检索器（支持MMR或相似度检索）、LLM链（调用GPT-4或本地模型）。要求：每个步骤添加详细日志输出（使用logging模块，级别INFO），打印加载文档数量、分割后chunk数、嵌入耗时、检索结果top-3及相似度分数；异常处理完备（try/except捕获文件加载、API调用、数据库连接等错误）；函数独立封装，主流程清晰可读；变量命名遵循PEP8；提供单元测试示例（pytest）以验证各模块正确性。”
附加要求：“添加超时重试机制（用于LLM调用），支持缓存检索结果（使用LRU缓存），并输出性能监控指标（每步耗时统计）。”

这里的构图指代码结构与模块组织方式，建议采用以下分层架构布局：

入口层：main.py，读取配置，依次调用各模块，输出最终回答。
数据层：data_loader.py（多格式支持）、text_spliter.py、embedding_provider.py、vector_store.py。
检索层：retriever.py（支持多种检索策略）、reranker.py（可选）。
生成层：llm_chain.py（对话+检索结果注入）、memory.py（可选对话记忆）。
调试层：logger_config.py、performance_monitor.py、exception_handler.py。

视觉上可参考UML组件图或系统架构图，但代码实现建议按此目录组织，以便快速定位问题。