多查询检索通过生成多个角度问题提升召回率,弥补语义鸿沟。LangChain借助MultiQueryRetriever
1742
RAG通过检索外部知识库获取与用户查询相关的信息,作为上下文输入大语言模型生成回答,
1562
基于大语言模型的LLMRG框架通过构建个性化推理图,将用户历史行为与属性信息进行因果与
354
检索增强生成(RAG)将生成式AI与实时信息检索结合,提升回复准确性和上下文丰富度。借
1800
大型多模态模型在多轮对话中易受前置话题误导产生对话幻觉。为此构建EvalDial基准并设计
25
基于QWEN基座,使用约80亿tokens数据在两张A100显卡上耗时100小时预训练了1 4B参数中文大模型
299
大语言模型训练依赖归一化稳定收敛,主流方法有层归一化、均方根归一化、深度归一化。
716
模块化RAG提出三层架构:模块类型、模块及操作符,涵盖6种模块类型、14个模块与40多个操
327
开源项目EasyContext以极低资源实现大模型长上下文扩展,仅用8张A100即可训练700K上下文的7B
803
SalesforceAIResearch开源轻量级库AgentLite,核心代码不足千行,旨在简化LLM智能体设计与部署。
1355