LLM参数知识:训练阶段核心学习内容全解析

2026-06-23阅读 0热度 0
ai 人工智能
聊到大语言模型,大家都觉得它挺神奇的。可一旦你让它查点最新的数据、或者是内部的知识,它立刻就没辙了。原因出在它的学习方式上——它所有的能力都来自训练阶段掌握的“参数知识”。 参数知识”是指在 LLM 训练阶段学习的信息。 所谓“参数知识”,就是模型在训练过程中,把训练数据集里的信息编码进了自己的内部参数里。想给它加点新东西?那就得重新训练或微调。可这个过程,既烧钱又费时,根本不是我们想用来持续更新模型知识的法子。 于是,检索增强生成(RAG)就来了。它的思路很巧妙:与其费劲把新知识硬塞进模型,不如给模型外设一个可伸缩的“知识库”。这个库我们可以像管理传统数据库一样管理,而且在很多场景下,它可能比微调更靠谱、更灵活。 举个例子。LLM 目前最给力的应用之一,就是做复杂的问答聊天机器人。这类应用需要靠外部资料来回答问题,玩的就是 RAG 技术——先从外部数据源检索相关信息,再把这些额外知识塞进提示词里,最后喂给模型生成答案。

什么是RAG?

一句话说清楚:RAG 就是用额外数据,给 LLM 的知识做增强的技术。 LLM 能聊很多话题,但它们知道的东西,都停留在训练时那个时间点,而且大多是公开数据。想做能处理私有数据、或者模型训练后才出现的信息的AI应用,就得给模型补充它需要的特定知识。找到这些信息并塞进提示词的过程,就是检索增强生成。

RAG架构

一个典型的 RAG 应用,主要包含两大块: - **索引**:负责从数据源头获取内容并建立索引的管道。这部分通常离线完成。 - **检索和生成**:运行时的那套 RAG 链条。它接收用户查询,从索引里捞出相关数据,再交给模型处理。 从原始数据到最终答案,最典型的流程大概是下面这样:

索引

1. **加载**:先把数据装进来。 2. **分割**:用文本分割器,把大的文档切成更小的块。这一步对索引和后续传给模型都很有用,因为大块难搜,也放不进模型有限的上下文窗口。 3. **存储**:得有个地方存放这些切好的小块,方便后面检索。通常用向量数据库和嵌入模型来搞定。

检索和生成

1. **检索**:用户输入问题后,检索器就从存储里找出相关的分块。 2. **生成**:聊天模型或大模型拿到提示词,结合问题和检索到的数据,生成最终的回答。 参考资料: Q&A with RAG | ????️???? LangChain Making Retrieval Augmented Generation Fast | Pinecone
免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策