LLM参数知识：训练阶段核心学习内容全解析

2026-06-23阅读 0热度 0

ai 人工智能

聊到大语言模型，大家都觉得它挺神奇的。可一旦你让它查点最新的数据、或者是内部的知识，它立刻就没辙了。原因出在它的学习方式上——它所有的能力都来自训练阶段掌握的“参数知识”。

所谓“参数知识”，就是模型在训练过程中，把训练数据集里的信息编码进了自己的内部参数里。想给它加点新东西？那就得重新训练或微调。可这个过程，既烧钱又费时，根本不是我们想用来持续更新模型知识的法子。于是，检索增强生成（RAG）就来了。它的思路很巧妙：与其费劲把新知识硬塞进模型，不如给模型外设一个可伸缩的“知识库”。这个库我们可以像管理传统数据库一样管理，而且在很多场景下，它可能比微调更靠谱、更灵活。举个例子。LLM 目前最给力的应用之一，就是做复杂的问答聊天机器人。这类应用需要靠外部资料来回答问题，玩的就是 RAG 技术——先从外部数据源检索相关信息，再把这些额外知识塞进提示词里，最后喂给模型生成答案。

什么是RAG？

一句话说清楚：RAG 就是用额外数据，给 LLM 的知识做增强的技术。 LLM 能聊很多话题，但它们知道的东西，都停留在训练时那个时间点，而且大多是公开数据。想做能处理私有数据、或者模型训练后才出现的信息的AI应用，就得给模型补充它需要的特定知识。找到这些信息并塞进提示词的过程，就是检索增强生成。

RAG架构

一个典型的 RAG 应用，主要包含两大块： - **索引**：负责从数据源头获取内容并建立索引的管道。这部分通常离线完成。 - **检索和生成**：运行时的那套 RAG 链条。它接收用户查询，从索引里捞出相关数据，再交给模型处理。从原始数据到最终答案，最典型的流程大概是下面这样：

索引

1. **加载**：先把数据装进来。 2. **分割**：用文本分割器，把大的文档切成更小的块。这一步对索引和后续传给模型都很有用，因为大块难搜，也放不进模型有限的上下文窗口。 3. **存储**：得有个地方存放这些切好的小块，方便后面检索。通常用向量数据库和嵌入模型来搞定。

检索和生成

1. **检索**：用户输入问题后，检索器就从存储里找出相关的分块。 2. **生成**：聊天模型或大模型拿到提示词，结合问题和检索到的数据，生成最终的回答。参考资料： Q&A with RAG | ????️???? LangChain Making Retrieval Augmented Generation Fast | Pinecone

LLM参数知识：训练阶段核心学习内容全解析

什么是RAG？

RAG架构

索引

检索和生成

相关阅读

最新教程

最新资讯