利用Ollama可跨平台加载HuggingFace等社区的GGUF格式大模型,通过创建Modelfile配置文件实现客制
786
多查询检索通过生成多个角度问题提升召回率,弥补语义鸿沟。LangChain借助MultiQueryRetriever
960
RAG通过检索外部知识库获取与用户查询相关的信息,作为上下文输入大语言模型生成回答,
534
基于大语言模型的LLMRG框架通过构建个性化推理图,将用户历史行为与属性信息进行因果与
1535
检索增强生成(RAG)将生成式AI与实时信息检索结合,提升回复准确性和上下文丰富度。借
1643
大型多模态模型在多轮对话中易受前置话题误导产生对话幻觉。为此构建EvalDial基准并设计
1514
基于QWEN基座,使用约80亿tokens数据在两张A100显卡上耗时100小时预训练了1 4B参数中文大模型
1372
大语言模型训练依赖归一化稳定收敛,主流方法有层归一化、均方根归一化、深度归一化。
562
模块化RAG提出三层架构:模块类型、模块及操作符,涵盖6种模块类型、14个模块与40多个操
233
开源项目EasyContext以极低资源实现大模型长上下文扩展,仅用8张A100即可训练700K上下文的7B
262