LangChain Agent 实战接入指南

2026-06-20阅读 0热度 0

其他

前言

上篇聊完“AI 产品为什么需要内置本地 Agent”，今天直接进入正题——从架构设计到代码落地，把这套方案怎么搭、怎么接、怎么跑，从头到尾拆一遍。

一、整体架构：五层分离

先看分层设计，这决定了整个系统的扩展性和维护成本。

层级	技术选型	职责
UI 交互层	React + 流式 Hook	对话界面、审批卡片、结果展示
基础 Agent 层	LangChain `createAgent()`	通用问答与工具调用循环
工作流编排层	LangGraph `StateGraph`	复杂任务、检查点、中断恢复
工具接入层	自研 Tool Adapter	屏蔽数据源、本地命令、第三方差异
宿主层	Electron Main + Local Service	密钥安全、进程管理、随包发布

几个关键的设计判断：

前端直接调模型？这个想法趁早打消。必须在服务层封装一个本地的 Agent Runtime。
API Key 不能暴露给前端，工具执行需要统一收口，后续加能力也不用推翻前端重来。
LangChain 用来快速起步，LangGraph 用来做复杂编排，工具层则根据业务需求封装。

二、接入步骤

Step 1：建立本地 Agent 服务

新建 ai-agent-server workspace，基于 Hono 框架起一个 HTTP 服务：

// apps/ai-agent-server/src/server.ts
import { Hono } from 'hono';
import { serve } from '@hono/node-server';

export const createAiAgentServer = async (config) => {
  const app = new Hono();
  
  // 健康检查
  app.get('/health', (c) => c.json({ status: 'ready', model: config.model }));
  
  // 问答接口（Step 2 实现）
  registerChatRoutes(app, config);

  const server = serve({ fetch: app.fetch, hostname: config.host, port: config.port });
  return { origin: `http://{config.host}:{server.address().port}`, close: () => ... };
};

这里有两个要点：

服务只监听 127.0.0.1:39321，确保外部无法访问。
API Key 只存在服务端环境变量里，永远不会进前端 bundle。

Step 2：接入 LangChain createAgent

先做一个最简的 Agent，只跑普通问答，工具后续再逐步接入：

// apps/ai-agent-server/src/agent/createHomeAiQaAgent.ts
import { createAgent } from 'langchain';
import { ChatOpenAI } from '@langchain/openai';

export const createHomeAiQaAgent = (config) => {
  const model = new ChatOpenAI({
    apiKey: config.apiKey,
    model: config.model,
    temperature: 0.2,
    configuration: { baseURL: config.baseUrl },
  });

  return createAgent({
    model,
    tools: [], // 先不加工具，二期再扩展
    systemPrompt: '你是本地 AI 助手...',
    name: 'home_qa_agent',
  });
};

SSE 流式接口的实现也很直接：

// apps/ai-agent-server/src/routes/chat.ts
export const registerChatRoutes = (app, config) => {
  const agent = createHomeAiQaAgent(config);

  app.post('/api/agent', async (c) => {
    const body = await c.req.json();
    const stream = await agent.stream(
      { messages: body.messages },
      { encoding: 'text/event-stream', streamMode: ['values', 'updates', 'messages'] }
    );

    return new Response(stream, {
      headers: {
        'Content-Type': 'text/event-stream',
        'Cache-Control': 'no-cache'
      },
    });
  });
};

Step 3：Electron 托管进程

Agent 服务需要随应用自动启动。开发态用 pnpm dev，打包态用 fork：

// electron/src/main/processManager/aiAgentProcess/index.ts
export const startAiAgentProcess = () => {
  if (app.isPackaged) {
    // 打包态：fork 打包后的 js 文件
    aiAgentProcess = childProcess.fork(path.join(__dirname, 'aiAgentServer.js'), []);
  } else {
    // 开发态：pnpm 启动 dev server
    aiAgentProcess = childProcess.spawn('pnpm', ['--filter', 'ai-agent-server', 'dev'], { env: { ...process.env } });
  }
};

前端通过 LinkService 获取运行状态：

// 前端调用
const runtime = await window.LinkService.request('v1/aiAgent/getRuntime');
// runtime = { ready: true, status: 'ready', baseUrl: 'http://127.0.0.1:39321' }

Step 4：前端面板接入

右侧副面板使用 LangGraph SDK 的 useStream Hook：

// apps/src/features/home/components/AiQaPanel/index.tsx
import { FetchStreamTransport, useStream } from '@langchain/langgraph-sdk/react';

const AiQaPanel = ({ runtime }) => {
  const transport = useMemo(() =>
    new FetchStreamTransport({
      apiUrl: `${runtime.baseUrl}/api/agent`,
    }),
    [runtime.baseUrl]
  );

  const stream = useStream({ transport });
  
  return (
    <section>
      <header><h2>AI 问答h2>header>
      {/* 消息列表 */}
      <div>{stream.messages.map(renderMessage)}div>
      {/* 输入框 */}
      <input value={input} onChange={(e) => setInput(e.target.value)} />
      <button onClick={() => stream.submit({ messages: [{ type: 'human', content: input }] })}>发送button>
    section>
  );
};

Step 5：权限审批机制

Agent 一旦能执行本地命令，权限审批就是一道必须跨过的门槛。推荐三层模型：

风险等级	典型操作	默认策略
`low`	读笔记、读线程上下文	自动执行
`medium`	新建文档、导出 PDF	首次确认，可记住
`high`	Shell 命令、发消息	必须逐次审批
`critical`	删除文件、批量外发	默认拒绝

用 LangGraph 的 interrupt() 实现审批中断：当 Agent 调用高风险工具时，中断执行并等待用户确认；用户点击"允许"后，resume 继续执行。

前端渲染审批卡片：

<ApprovalCard
  title="读取文件"
  reason="需要读取首页实现文件"
  riskLevel="low"
  onApprove={() => AiAgentApis.approveRequest(requestId)}
  onDeny={() => AiAgentApis.denyRequest(requestId)}
/>

三、记忆管理：短期和长期必须分开

这可不是普通聊天，这是 Agent 和普通 Chat 之间最本质的区别。

短期记忆（Thread Memory）

基于 thread_id 的状态持久化，保存当前会话的：消息历史、任务计划、已调用工具结果、中断点。用 LangGraph 的 checkpointer 实现，开发阶段用 MemorySa ver，生产环境用 PostgresSa ver。

长期记忆（User Memory）

跨会话持久保存用户偏好（输出风格、常用配置）、授权偏好、常用操作模板。但不是说所有内容都要记住——只保存三类：用户显式要求记住的、高频重复出现且对后续有帮助的、权限与偏好类配置。

四、任务编排：简单 vs 复杂

简单任务（普通问答、单工具调用）直接用 Agent ReAct 循环即可。

复杂任务（多步骤、有审批、多阶段产物）则需要用 LangGraph StateGraph 显式编排。推荐这样分层：

层次	作用
Intent Classifier	识别意图：问答 / 查询 / 生成 / 执行 / 工作流
Planner	拆解目标为可执行步骤
Supervisor	调度子袋里、审批、重试
Executor	执行工具或子图
Verifier	检查结果是否完整

五、错误处理与并发

错误分类

错误类型	示例	处理
`model_error`	超时、429	自动重试 / 模型降级
`tool_error`	参数错误	让 Agent 自修复
`permission_error`	审批被拒	中断提示用户
`sandbox_error`	路径非法	终止并诊断

重试原则

前提很硬：不是所有错误都能重试。

幂等是重试的第一道门槛：涉及副作用的动作必须带幂等键。
非幂等动作绝不重试：已发送的消息、已执行的外发动作。
LLM 429 用指数退避 + 模型降级。

六、总结

LangChain Agent 接入的核心，远不止"接个模型"那么简单。从业务落地来看，需要做好三件事：

分离架构：UI、Agent、编排、工具、宿主各司其职。
分步接入：启动服务 → 创建Agent → 进程托管 → UI 面板 → 权限审批。
安全兜底：权限、记忆、沙箱，一个都不能少。

但更关键的认知是：Agent 本身只是一套执行和编排任务的框架，真正让大模型发挥价值的，还是我们背后的工程化能力——Prompt 调优、RAG 向量工程、模型微调、业务数据集评测、人工复核指标，这些才是更深远的课题。