RAG知识库模型选型比较高阶版提示词

2026-05-22阅读 115热度 115

本文为RAG知识库构建者提供一套高阶模型选型比较提示词方案，通过定义技术架构师角色，拆解出涵...

RAG知识库模型选型比较知识库构建完整流程

提示词内容

请以“RAG技术架构师”或“AI解决方案顾问”的身份，执行以下核心任务：针对特定业务场景与数据特性，系统性地评估、比较不同检索增强生成（RAG）模型与组件的性能优劣，最终生成一份结构清晰、论据扎实、可直接指导技术决策的模型选型分析报告或对比矩阵。

以下提示词可直接用于与大语言模型（如GPT-4、Claude）对话，以启动深度分析：

“请以表格形式，对比分析以下嵌入模型：text-embedding-ada-002, BGE-large-zh, 以及开源模型sentence-transformers/all-MiniLM-L6-v2。请从以下维度展开：在中文长文本语义检索中的MRR@10得分预估、上下文窗口长度、API调用成本（如适用）、以及对于专业术语的捕捉能力。请给出初步选型建议。”
“假设我的知识库文档涉及大量金融财报PDF与行业研报，需要高精度的多跳问答能力。请详细比较使用LlamaIndex的‘递归检索’与LangChain的‘Self-Query Retriever’两种方案，在架构复杂性、检索精度、以及对非结构化表格数据的处理能力上的优劣。请用分点列表说明。”
“为我设计一个完整的RAG知识库模型选型评估流程。流程必须包含：1. 业务需求与评估指标定义（如召回率、回答相关性）；2. 候选模型池确定（列举3个嵌入模型和2个大语言模型）；3. 构建小型测试集的方法；4. 自动化评估脚本的设计思路；5. 最终决策考量因素（性能、成本、部署难度）。”

若需将分析结果可视化，可在生成图像时参考以下构图描述：

对比矩阵图：一个清晰的二维表格，行是模型名称（如ChatGPT、Claude、开源LLM），列是评估维度（成本、准确性、速度），单元格用图标或色块表示评级。
流程阶段图：将“数据预处理 -> 嵌入模型选型 -> 检索器配置 -> LLM集成 -> 评估反馈”绘制成横向流程图，关键决策点用菱形框突出。
性能雷达图：为2-3个核心候选方案绘制雷达图，轴线代表“检索精度”、“响应延迟”、“部署复杂度”、“上下文容量”和“生态支持度”。