AI智能体实战：Python+LangChain+LangGraph对话记忆

2026-06-18阅读 0热度 0

Python

想要打造一个能持续感知对话上下文的AI智能体，已经成为众多开发者的核心诉求。设想一个智能客服，能精准捕捉用户上一轮的抱怨并给出针对性回应；或者一个个人知识管家，顺着你之前的推理链条继续深入分析；又或者一个代码陪练，能记着十分钟前你写下的那个bug——所有这些体验的根基，就是“记忆”。

但关键问题在于：能否不依赖外部向量数据库或知识库（即不走RAG路线），仅靠大语言模型自身的推理能力以及对话上下文的记忆能力，就构建出一个可理解、可规划、可交互的AI智能体？本文基于LangChain与LangGraph框架，提供了一套模块化的实现方案。从环境配置、状态定义、工作流编排到可视化调试，完整展示每一步的落地细节。希望这篇分享能帮助大家掌握状态图驱动的工作流设计思路，并以此为基石扩展到更复杂的智能体应用。

LangChain与LangGraph的技术定位

正式开始实现之前，先理清两个框架各自的分工。这就像搞清楚发动机和变速箱在汽车中的角色——它们解决不同层面的问题，但必须协同工作才能驱动整车。

LangChain是面向大语言模型应用的开发框架。它的核心价值在于将LLM调用中的常见操作——提示词管理、链式调用（多个操作串联成流水线）、对话记忆管理、外部工具连接（如API、数据库）——封装成可复用的模块。可以把它看作连接LLM与上层业务逻辑的“万能粘合层”。

LangGraph则专注解决更复杂的问题：当AI应用不是单向直线执行，而是需要条件分支、循环迭代、状态流转时，LangGraph通过“状态图（State Graph）”来描述整个工作流。每个节点代表一个逻辑步骤（如分类、生成、优化），节点间的边定义数据流转方向。这种设计让复杂的工作流变得可视化和可调试——就像用流程图描述业务流程一样直观。

两者组合，创造出一种“模块化搭建AI系统”的模式：LangChain负责每个节点内部的LLM交互，LangGraph负责节点间的编排。后续各节将展示这一组合的具体落地过程。

构建带记忆的AI智能体

直接进入动手环节。

1. 环境准备与依赖安装

首先安装所需的核心依赖包。本文涉及LangChain（LLM交互层）、LangGraph（工作流编排）、OpenAI接口适配，以及NetworkX和matplotlib（可视化）。

pip install langchain langgraph langchain-openai networkx matplotlib

一条命令即可完成全部环境准备工作。

2. 大语言模型接口配置

接下来需要配置OpenAI API密钥，让LangChain能够正常发起模型调用。密钥应通过环境变量传入，而非硬编码在代码中——这是一项良好的安全实践。

3. 智能体状态结构定义

智能体之所以能“记住”对话，核心在于设计了一个结构化的状态对象。这里使用Python的TypedDict类型注解，明确状态中每个字段的含义和类型约束。

具体来说，状态对象包含三个字段：user_query用于存储用户最新输入的问题，bot_reply保存模型生成的回复内容，chat_log以列表形式累积全部历史对话记录，为后续轮次提供上下文。这个结构就是智能体的“记忆盒子”，管理好它，就实现了对话的连贯性。

第一轮对话：搭建基础智能体状态与工作流
我需要在LangGraph中定义一个带记忆的AI对话智能体。智能体需要维护三个状态字段：用户当前问题、模型回复、以及历史对话记录列表（用于跨轮次记忆）。同时，请帮我定义三个工作流节点函数——意图分类、生成回复、结果润色——并将它们组装成一个线性状态图。请使用LangChain的init_chat_model来初始化GPT-4.1模型，temperature设为0.3以保证回复的稳定性。

上述代码完成了从状态定义到工作流编排的全部核心逻辑。categorize → produce_answer → polish_response 三个节点按顺序执行，形成一个完整的“接收输入→生成回复→记忆更新”闭环。每个节点各司其职：分类节点理解用户意图，生成节点产出内容，润色节点负责最终优化并更新历史记录。

4. 工作流可视化分析

LangGraph构建的工作流可以通过NetworkX转换为拓扑图，直观呈现数据在各节点间的流转路径。每个节点用不同颜色区分功能角色，箭头标明执行顺序。

第二轮对话：增加工作流可视化与交互式对话循环
前面已经搭建好了基于LangGraph的智能体工作流。现在请帮我做两件事：第一，用NetworkX和matplotlib把工作流的拓扑结构画出来，每个节点用不同颜色标识、箭头标明方向；第二，写一个交互式的对话循环，让用户能持续输入问题，智能体基于累积的对话记忆给出上下文相关的回复。输入"exit"或"quit"退出循环。

工作流拓扑图清晰展示了三个节点的线性串联关系：消息从用户输入进入categorize节点，经produce_answer生成回复，最后由polish_response完成润色并更新记忆。这张图在团队协作和调试阶段极有价值，让所有人都能一眼看明白系统的工作逻辑。

5. 运行带对话记忆的交互式智能体

最后一步是将编译好的状态图投入实际使用。我们构建一个持续运行的对话循环：用户每次输入问题后，智能体结合chat_log中积累的历史上下文，给出连贯的回复，并将本轮问答追加到记忆中供下次使用。

agent_state = {"user_query": "", "bot_reply": "", "chat_log": []}
print("带记忆的AI智能体已就绪！输入 'exit' 或 'quit' 退出。\n")

while True:
    user_input = input("请输入您的问题：")
    if user_input.lower() in ("exit", "quit"):
        break
    agent_state["user_query"] = user_input 
    result = agent_graph.invoke(agent_state)
    agent_state.update(result)
    print("\n智能体回复：\n", result.get("bot_reply", "未能生成回复。"))
    print("\n" + "=" * 60 + "\n")

运行效果表明，智能体能够在多轮对话中保持上下文连贯——当用户连续追问时，模型基于chat_log中已有的回复来理解新问题的意图，而非孤立地处理每次输入。这种感觉，就像在和一位拥有完整记忆的助手交流，而不是一个每次都“重启”的机器。

方案优势与技术对比

为了更清晰地理解本方案的价值，下表从多个维度对比了本文方案的特性与两种常见替代路线（无记忆的简单LLM调用、基于外部知识库的RAG系统）。

对比维度	本文方案（LangChain+LangGraph+记忆）	无记忆LLM调用	RAG系统（外部知识库）
对话连贯性	基于chat_log保持多轮上下文	每轮独立，无上下文	取决于检索质量
架构复杂度	中等（状态图+三节点）	低（单次API调用）	高（向量库+检索+生成）
外部依赖	仅需LLM API	仅需LLM API	需向量数据库、嵌入模型
可扩展性	节点可自由增删	有限	检索策略可调
工作流可视化	支持（LangGraph+NetworkX）	无	部分支持
适用场景	客服助手、个人管家、代码陪练	单次问答	文档问答、知识检索

技术特性分析

持久化记忆使智能体在会话期间能记住此前所有交互内容。模块化设计将分类、生成、优化拆分为独立节点，便于单独调试和替换——例如未来可将categorize节点替换为更复杂的意图路由器。可视化能力让工作流的逻辑一目了然，降低团队协作中的沟通成本。无需外部知识库意味着部署更轻量，只需确保LLM接口可用即可运行。

值得强调的是，在论文答辩或技术评审场景中，经常遇到一个提问：“为什么选择状态图而不是简单的顺序调用？”关键在于：状态图提供了条件分支和循环的能力。当未来需要根据用户意图（如“闲聊”vs“任务执行”）导向不同处理链路时，只需在categorize后增加条件边即可，无需重构整体架构。这一设计的前瞻性正是LangGraph区别于传统链式调用的核心优势。

总结

核心问题与解决方案

问题一：如何让AI智能体记住对话历史而不依赖外部数据库？
解决方案：通过TypedDict定义chat_log字段，在每次交互后调用polish_response节点将本轮问答追加到列表中，下次调用produce_answer时自动拼接历史上下文到提示词中。这种方式完全基于运行时内存，无需引入向量数据库或检索组件，是轻量级记忆方案的首选。
问题二：如何将多个处理步骤（分类、生成、优化）编排为一个可控的工作流？
解决方案：使用LangGraph的StateGraph定义状态图和节点序列，通过add_sequence将三个节点串联，add_edge(START, "categorize")标记入口，最后compile()编译为可执行图。每个节点的输入输出通过统一的State对象传递，保证数据流的一致性。
问题三：如何直观展示和调试工作流结构？
解决方案：利用NetworkX将StateGraph的节点和边转换为有向图，通过spring_layout自动布局节点位置，不同颜色区分功能角色。这一方法在开发调试阶段能快速发现节点连接错误或遗漏。

技术创新与业务价值

有状态对话范式：在不引入RAG基础设施的前提下，通过TypedDict + 列表追加机制实现跨轮次记忆，降低系统复杂度，适用于快速原型验证和轻量部署场景。
图驱动模块化架构：将LLM调用拆解为可组合、可替换的节点，每个节点职责单一。这一设计使团队可以并行开发不同节点，且单元测试可精确到单个节点级别。
实际业务收益：在客服场景中，记忆能力使重复问题率大幅降低，用户无需反复提供上下文；在个人AI管家场景中，连贯的多轮对话更接近人类交流体验，从而提升用户留存。