LangChain.js实战指南：ReAct循环构建AI编程助手

2026-05-28阅读 0热度 0

Claude Code 通过其精准的代码理解与生成能力，已成为开发者提升效率的关键工具。其核心本质，是将大语言模型与工具调用能力在编程场景下深度融合。利用 LangChain.js，我们能够自主构建具备类似核心能力的智能体。

在之前的系列文章中，我们已经系统掌握了 LangChain.js 的基础知识，包括模型接入、流式输出、消息体系以及自定义 Tool 的开发与闭环实现。这些技术积累，为我们构建专属的代码智能助手奠定了坚实基础。

本文将基于 LangChain.js，整合大模型能力与自定义工具链，指导你逐步构建一个功能完整的简易版 Claude Code。我们将实现从本地文件读写、代码生成落地，到执行系统命令的全流程自动化，使大模型成为一个能感知上下文、生成代码并验证执行的智能编程伙伴。

一、核心能力拆解

Claude Code 的强大之处，在于其能理解代码上下文并执行具体操作。我们可以将其核心能力抽象为三个基础工具，分别对应代码操作中的三大核心模块：

工具	功能定位	技术实现
`read_file`	代码理解与分析	`fs.readFile` 读取项目文件
`write_file`	代码生成与落地	`fs.writeFile` + 自动目录创建
`execute_command`	环境交互与验证	`child_process.spawn` 支持前后台

这三个工具构成了代码助手的最小可行闭环：读（感知上下文）→ 写（生成代码）→ 执行（验证运行）。

二、核心代码解析：工具实现细节

2.1 文件读取工具

const readFileTool = tool(async ({ filePath }) => {
  try {
    const content = await fs.readFile(filePath, 'utf-8');
    return `文件内容:\n${content}`;
  } catch (error) {
    return `读取文件失败: ${error.message}`;
  }
}, {
  name: 'read_file',
  description: '用此工具来读取文件内容...',
  schema: z.object({
    filePath: z.string().describe('要读取的文件路径'),
  }),
});

在设计文件读取工具时，需关注以下几个关键点：

路径兼容：需同时支持相对路径与绝对路径，以适应不同项目结构和用户习惯。
错误透传：需将文件不存在、权限不足等错误信息清晰地反馈给模型，使其能基于错误上下文自主决策下一步行动，例如重试或调整策略。
UTF-8 默认：将编码默认设置为 UTF-8，以覆盖绝大多数代码文件场景，避免因编码问题引入额外干扰。

当用户提出“帮我分析一下 src/utils/helper.js 的问题”时，模型便能自主调用此工具获取完整的代码上下文，无需用户手动复制粘贴代码内容。

2.2 文件写入工具

const writeFileTool = tool(async ({ filePath, content }) => {
  try {
    const dir = path.dirname(filePath);
    await fs.mkdir(dir, { recursive: true }); // 关键：自动创建目录
    await fs.writeFile(filePath, content, 'utf-8');
    return `文件写入成功: ${filePath}`;
  } catch (error) {
    return `文件写入工具调用失败: ${error.message}`;
  }
}, {
  name: 'write_file',
  description: '向指定路径写入文件内容，自动创建目录',
  schema: z.object({
    filePath: z.string().describe('文件路径'),
    content: z.string().describe('写入的文件内容'),
  }),
});

此工具的核心设计在于 recursive: true 参数，它能自动创建完整的目录链。这正是实现流畅用户体验的关键——用户只需发出指令“创建一个 React 组件 components/UserProfile/index.tsx”，工具便会自动处理 components/ 和 UserProfile/ 目录的创建，无需用户进行分步操作。

2.3 命令执行工具 —— 环境交互的“双脚”

这是三个工具中复杂度最高的一个，需要支持交互式命令（如 npm install）和常驻后台服务（如 npm run dev）：

const executeCommandTool = tool(async ({ command, workingDirectory, background = false }) => {
  const [cmd, ...args] = command.split(' ');
  const child = spawn(cmd, args, {
    cwd: workingDirectory || process.cwd(),
    stdio: background ? 'pipe' : 'inherit', // 前台交互 或者 后台静默
    shell: true,
    detached: background, // 关键：后台运行解耦
  });

  if (background) {
    child.unref(); // 允许父进程退出而子进程继续运行
    return `命令已在后台启动: ${command}`;
  }
  // ... 前台模式等待完成
}, {
  name: 'execute_command',
  schema: z.object({
    command: z.string(),
    workingDirectory: z.string().optional(), // 项目隔离
    background: z.boolean().optional(), // 服务启动模式
  }),
});

其双模式设计解析如下：

模式	场景	技术特征
前台模式 (`background: false`)	`npm install`、`git status`	`stdio: 'inherit'` 实时展示输出，用户体验如同在终端直接执行
后台模式 (`background: true`)	`npm run dev`、启动数据库服务	`detached: true` + `unref()` 实现服务常驻，不阻塞对话流程

workingDirectory 参数至关重要。在多项目场景下，通过它直接指定工作目录，可以避免使用 cd 命令带来的副作用和路径混乱。例如：

// 正确：直接指定目录
executeCommandTool.invoke({ command: "npm run build", workingDirectory: "./my-project" })

// 避免：依赖 cd 的不可靠方式
executeCommandTool.invoke({ command: "cd my-project && npm run build" })

为什么 `cd` 命令不可靠？

核心原因在于平台兼容性。cd my-project && npm run build 这种写法强依赖 Shell 语法，在不同平台上的支持度不一致。

平台	命令分隔符	问题
Linux/macOS	`&&`	正常执行
Windows CMD	`&&`	支持，但行为略有差异
Windows PowerShell	`;` 或换行	`&&` 在旧版本可能不兼容

更隐蔽的是路径分隔符问题：

// Unix
cd ./my-project && npm start
// Windows（可能失败）
cd .\my-project && npm start // 反斜杠
// 或
cd my-project && npm start // 驱动器根目录问题

而 workingDirectory 参数由 Node.js 的 path 模块统一处理，能自动适配不同操作系统的路径格式。

另一个问题是当路径包含空格时，cd 命令容易解析错误：

// 危险：路径带空格导致命令被截断
executeCommandTool.invoke({ command: "cd ./my project && npm start" })
// 实际执行：cd ./my （"project" 被当作新命令）
// 报错：/bin/sh: line 0: cd: too many arguments
// 即使加引号也复杂
executeCommandTool.invoke({ command: "cd "./my project" && npm start" })
// 需要处理嵌套引号、转义，容易出错

最关键的是，相对路径的基准会混乱。cd 改变的是进程级的工作目录，而 spawn 的 cwd 选项只影响子进程。在 background: true 模式下使用 cd，很容易导致目录上下文丢失。

三、Agent 核心引擎

工具准备就绪后，我们需要构建 Agent 的大脑——让大模型能够理解需求、决策使用哪个工具、执行动作、观察结果，并循环这一过程直至任务完成。本节将实现一个支持流式输出和多轮工具调用的交互式 Agent。

3.1 架构设计：ReAct 循环

ReAct（Reasoning + Acting，推理+行动）是 Agent 设计的经典范式。它模拟人类解决问题的思维过程：不是一次性给出答案，而是通过“思考→行动→观察”的循环逐步推进。

与传统 LLM 调用的区别显而易见：

模式	交互方式	特点
标准 LLM	一问一答	依赖预训练知识，无法获取实时信息
ReAct Agent	多轮工具调用	通过工具与外部世界交互，动态获取信息

3.2 模型初始化与工具绑定

模块	作用
`ChatOpenAI`	大模型接口，支持工具调用（兼容 OpenAI 格式）
`InMemoryChatMessageHistory`	内存级对话历史，维护多轮上下文
`JsonOutputToolsParser`	解析模型输出的工具调用 JSON
`HumanMessage/SystemMessage/ToolMessage`	构建标准消息体系

选择 InMemoryChatMessageHistory 的原因很简单：作为简易版实现，内存存储足以演示核心逻辑。

const model = new ChatOpenAI({
  modelName: process.env.MODEL_NAME,
  apiKey: process.env.API_KEY,
  configuration: {
    baseURL: process.env.BASE_URL, // 兼容第三方 API（如 DeepSeek、豆包）
  },
});
const tools = [readFileTool, writeFileTool, executeCommandTool];
const modelWithTools = model.bindTools(tools);

bindTools 这一步至关重要，它将工具的定义（名称、描述、参数模式）注入模型上下文，让模型知道：有哪些工具可用、在什么场景下使用、以及参数应该如何填写。

3.3 核心循环：`runAgentWithTools` 实现

这是整个 Agent 的心脏，实现了 ReAct 循环：

async function runAgentWithTools(prompt, maxIterations = 30) {
  // 1. 记录用户输入
  await history.addMessage(new HumanMessage(prompt));
  let toolParser = new JsonOutputToolsParser();

  // 2. 多轮迭代，直到完成或达到上限
  for (let i = 0; i < maxIterations; i++) {
    let messages = await history.getMessages();
    console.log(`⏳ 正在等待 AI 思考...`);

    // 3. 流式调用模型
    let fullResponse = null;
    let hasStartedOutput = false;
    const stream = await modelWithTools.stream(messages);

    // 4. 实时处理流式响应
    for await (const chunk of stream) {
      // 累积完整响应（用于后续工具调用判断）
      if (!fullResponse) {
        fullResponse = chunk;
      } else {
        fullResponse = fullResponse.concat(chunk);
      }

      // 尝试解析工具调用（流式过程中可能不完整，用 try-catch 保护）
      let parsedTools = null;
      try {
        parsedTools = await toolParser.parseResult([{ message: fullResponse }]);
      } catch (error) {
        // 解析失败说明工具调用尚未完整，继续等待
      }

      // 5. 实时流式输出内容
      let outputContent = '';
      // 情况 A：普通文本回复
      if (chunk.content) {
        outputContent = chunk.content;
      }
      // 情况 B：工具调用中的代码生成（如 write_file 的内容字段）
      else if (parsedTools && parsedTools.length > 0) {
        for (const toolCallChunk of parsedTools) {
          if (toolCallChunk.type === 'write_file' && toolCallChunk.args.content) {
            outputContent += toolCallChunk.args.content;
          }
        }
      }

      // 6. 实时打印到终端
      if (outputContent && outputContent.trim() !== '') {
        if (!hasStartedOutput) {
          console.log(`\n✨ AI 回复:\n`);
          hasStartedOutput = true;
        }
        process.stdout.write(outputContent);
      }
    }

    // 7. 保存完整响应到历史
    const response = fullResponse;
    await history.addMessage(response);

    // 8. 判断是否需要工具调用
    if (!response.tool_calls || response.tool_calls.length === 0) {
      if (hasStartedOutput) console.log('\n');
      return response.content; // 无需工具，直接返回
    }
    if (hasStartedOutput) console.log('\n');

    // 9. 执行工具调用闭环
    for (const toolCall of response.tool_calls) {
      const foundTool = tools.find(t => t.name === toolCall.name);
      if (foundTool) {
        console.log(`[工具调用] ${toolCall.name}(${JSON.stringify(toolCall.args)})`);
        // 执行工具
        const toolResult = await foundTool.invoke(toolCall.args);

        // 10. 将工具结果反馈给模型（关键！）
        await history.addMessage(new ToolMessage({
          content: toolResult,
          tool_call_id: toolCall.id, // 必须匹配，让模型知道对应哪个调用
        }));
      }
    }
    // 11. 循环继续：模型收到工具结果后，决定下一步行动
  }
  return '达到最大迭代次数';
}

整个循环流程可以概括为：用户输入 → 模型思考 → 判断是否需要调用工具 → 是则执行工具并反馈结果 → 模型基于结果再次思考 → 循环直至任务完成或达到迭代上限。

3.4 流式输出的工程细节

为什么要做流式处理？体验差异立竿见影。

场景	体验差异
非流式	等待 10 秒后才一次性看到结果，用户可能以为程序卡死
流式	立即看到“正在分析...”、“发现依赖问题...”，能清晰感知响应进度

代码中处理了两种输出源：一是模型的自然语言回复（用于解释思路或询问确认），二是 write_file 工具调用中的代码内容。特别优化的一点是代码生成的实时预览：当模型调用 write_file 生成数百行代码时，用户能立即看到内容，而不是等待整个文件写入完成。

3.5 工具调用闭环：为什么 `ToolMessage` 至关重要

这是最容易被忽视但最核心的机制：

await history.addMessage(new ToolMessage({
  content: toolResult, // 工具执行结果（成功/失败/输出）
  tool_call_id: toolCall.id, // 必须匹配模型的 tool_call.id
}));

闭环逻辑是这样的：模型发出指令（如“读取 package.json”），系统执行工具并得到结果，然后将结果包装成 ToolMessage 并关联对应的 tool_call_id 反馈给模型。模型“观察”到这个结果后，才能基于新信息决策下一步（如“建议升级依赖”或“执行更新命令”）。

如果缺少 ToolMessage，模型就会遗忘自己已经调用了工具，很可能陷入“重复调用同一工具”或“幻觉执行结果”的死循环。

3.6 交互层：命令行对话界面

const rl = readline.createInterface({
  input: process.stdin,
  output: process.stdout
});
let history = new InMemoryChatMessageHistory();
let systemMessage = new SystemMessage(`你是一个经验丰富的程序员，善于使用工具完成任务。工具：1. read_file: 读取文件2. write_file: 写入文件3. execute_command: 执行系统命令，支持指定工作目录`);

async function interactiveChat() {
  await history.addMessage(systemMessage);
  console.log('\n=== AI 编程助手 ===');
  console.log('输入 "exit" 或 "quit" 退出\n');

  while (true) {
    const userInput = await new Promise((resolve) => {
      rl.question('用户: ', resolve);
    });

    if (userInput.toLowerCase() === 'exit' || userInput.toLowerCase() === 'quit') {
      console.log('\n再见！');
      rl.close();
      break;
    }
    if (userInput.trim() === '') continue;

    try {
      await runAgentWithTools(userInput);
    } catch (error) {
      console.error(`\n❌ 错误: ${error.message}\n`);
    }
  }
}
interactiveChat().catch(console.error);

设计上需要注意：在对话开始时注入持久的 SystemMessage 来定义 AI 角色和工具说明；实现循环对话以支持连续多轮交互，并自动累积历史记录；同时提供 exit/quit 命令和 Ctrl+C 的安全退出方式。

四、实战演示：完整工作流

来看一个真实的对话流程，展示三大工具如何协同工作。

场景：创建并运行一个 Express 服务

用户输入：“帮我创建一个简单的 Express 服务器，监听 3000 端口，并启动它。”

模型执行流程将是：首先调用 write_file 创建项目目录和 package.json、app.js 等文件；然后调用 execute_command 执行 npm init -y 和 npm install express；最后再次调用 execute_command，以 background: true 模式启动 node app.js 服务。

最终，模型会返回类似这样的信息：“Express 服务器已创建并在后台启动，运行在 http://localhost:3000。你可以使用 curl http://localhost:3000 进行测试。”

五、总结

至此，我们基于 LangChain.js 完整复刻了 Claude Code 的核心能力闭环。回顾整个实现，关键突破点在于三个工具的精巧设计和 ReAct 循环的稳健实现。

模块	解决的问题	技术亮点
`read_file`	代码上下文感知	错误透传，让模型自主决策重试策略
`write_file`	代码自动化落地	`recursive: true` 实现目录链自动创建
`execute_command`	环境交互与验证	双模式设计（前台/后台）+ 工作目录隔离
`runAgentWithTools`	多轮工具调用闭环	流式输出 + `ToolMessage` 反馈机制

这个简易版 Claude Code 的真正价值，不在于单个工具的能力，而在于让大模型成为了工作流的智能编排者：用户意图 → 模型决策 → 工具执行 → 结果观察 → 再决策 → ... → 任务完成。每一次循环迭代，都是模型对当前状态的重新评估和策略调整。ReAct 范式的引入，让 AI 从“回答问题”进化到了“解决问题”。

流式体验带来的用户价值也不容小觑。对于代码生成这类长耗时任务，流式输出不仅提升了感知性能，更重要的是建立了信任——用户能实时看到 AI 的思考过程和代码构建进度，而不是面对一个黑盒等待。

当然，当前实现只是一个最小可用版本（MVP）。在生产级场景中，还需要考虑以下增强方向：

方向	当前局限	优化方案
上下文长度	大文件读取会撑爆 Token	实现 `read_file` 的分块读取 + 智能摘要
安全管控	无命令白名单，可执行任意操作	增加危险命令拦截 + 用户确认机制
状态持久化	进程退出即丢失对话历史	接入 Redis/数据库实现跨会话记忆
多模态扩展	仅支持文本交互	增加图片输入（UI 设计稿转代码）
协作能力	单 Agent 串行执行	多 Agent 协作（生成 Agent + 审查 Agent）

写在最后

Claude Code 的流行，证明了“大模型 + 工具调用 + 代码场景”这一范式的巨大潜力。通过 LangChain.js，我们无需依赖闭源产品，就能构建出完全符合自身工作流和习惯的专属助手。

更重要的是，这个过程让我们深入理解了 AI 应用开发的本质：它不是要替代开发者，而是将重复性、机械性的操作自动化，从而让人类能够更专注于那些需要创造性、策略性思考的决策环节。

LangChain.js实战指南：ReAct循环构建AI编程助手

一、核心能力拆解

二、核心代码解析：工具实现细节

2.1 文件读取工具

2.2 文件写入工具

2.3 命令执行工具 —— 环境交互的“双脚”

为什么 `cd` 命令不可靠？

三、Agent 核心引擎

3.1 架构设计：ReAct 循环

3.2 模型初始化与工具绑定

3.3 核心循环：`runAgentWithTools` 实现

3.4 流式输出的工程细节

3.5 工具调用闭环：为什么 `ToolMessage` 至关重要

3.6 交互层：命令行对话界面

四、实战演示：完整工作流

场景：创建并运行一个 Express 服务

五、总结

写在最后

相关阅读

最新教程

最新资讯

一、核心能力拆解

二、核心代码解析：工具实现细节

2.1 文件读取工具

2.2 文件写入工具

2.3 命令执行工具 —— 环境交互的“双脚”

为什么 cd 命令不可靠？

三、Agent 核心引擎

3.1 架构设计：ReAct 循环

3.2 模型初始化与工具绑定

3.3 核心循环：runAgentWithTools 实现

3.4 流式输出的工程细节

3.5 工具调用闭环：为什么 ToolMessage 至关重要

3.6 交互层：命令行对话界面

四、实战演示：完整工作流

场景：创建并运行一个 Express 服务

五、总结

写在最后

相关阅读

最新教程

最新资讯

为什么 `cd` 命令不可靠？

3.3 核心循环：`runAgentWithTools` 实现

3.5 工具调用闭环：为什么 `ToolMessage` 至关重要