LangChain.js实战指南:ReAct循环构建AI编程助手

2026-05-28阅读 0热度 0
ai

Claude Code 通过其精准的代码理解与生成能力,已成为开发者提升效率的关键工具。其核心本质,是将大语言模型与工具调用能力在编程场景下深度融合。利用 LangChain.js,我们能够自主构建具备类似核心能力的智能体。

在之前的系列文章中,我们已经系统掌握了 LangChain.js 的基础知识,包括模型接入、流式输出、消息体系以及自定义 Tool 的开发与闭环实现。这些技术积累,为我们构建专属的代码智能助手奠定了坚实基础。

本文将基于 LangChain.js,整合大模型能力与自定义工具链,指导你逐步构建一个功能完整的简易版 Claude Code。我们将实现从本地文件读写、代码生成落地,到执行系统命令的全流程自动化,使大模型成为一个能感知上下文、生成代码并验证执行的智能编程伙伴。

一、核心能力拆解

Claude Code 的强大之处,在于其能理解代码上下文并执行具体操作。我们可以将其核心能力抽象为三个基础工具,分别对应代码操作中的三大核心模块:

工具 功能定位 技术实现
read_file 代码理解与分析 fs.readFile 读取项目文件
write_file 代码生成与落地 fs.writeFile + 自动目录创建
execute_command 环境交互与验证 child_process.spawn 支持前后台

这三个工具构成了代码助手的最小可行闭环:读(感知上下文)→ 写(生成代码)→ 执行(验证运行)。

二、核心代码解析:工具实现细节

2.1 文件读取工具

const readFileTool = tool(async ({ filePath }) => {
  try {
    const content = await fs.readFile(filePath, 'utf-8');
    return `文件内容:\n${content}`;
  } catch (error) {
    return `读取文件失败: ${error.message}`;
  }
}, {
  name: 'read_file',
  description: '用此工具来读取文件内容...',
  schema: z.object({
    filePath: z.string().describe('要读取的文件路径'),
  }),
});

在设计文件读取工具时,需关注以下几个关键点:

  • 路径兼容:需同时支持相对路径与绝对路径,以适应不同项目结构和用户习惯。
  • 错误透传:需将文件不存在、权限不足等错误信息清晰地反馈给模型,使其能基于错误上下文自主决策下一步行动,例如重试或调整策略。
  • UTF-8 默认:将编码默认设置为 UTF-8,以覆盖绝大多数代码文件场景,避免因编码问题引入额外干扰。

当用户提出“帮我分析一下 src/utils/helper.js 的问题”时,模型便能自主调用此工具获取完整的代码上下文,无需用户手动复制粘贴代码内容。

2.2 文件写入工具

const writeFileTool = tool(async ({ filePath, content }) => {
  try {
    const dir = path.dirname(filePath);
    await fs.mkdir(dir, { recursive: true }); // 关键:自动创建目录
    await fs.writeFile(filePath, content, 'utf-8');
    return `文件写入成功: ${filePath}`;
  } catch (error) {
    return `文件写入工具调用失败: ${error.message}`;
  }
}, {
  name: 'write_file',
  description: '向指定路径写入文件内容,自动创建目录',
  schema: z.object({
    filePath: z.string().describe('文件路径'),
    content: z.string().describe('写入的文件内容'),
  }),
});

此工具的核心设计在于 recursive: true 参数,它能自动创建完整的目录链。这正是实现流畅用户体验的关键——用户只需发出指令“创建一个 React 组件 components/UserProfile/index.tsx”,工具便会自动处理 components/UserProfile/ 目录的创建,无需用户进行分步操作。

2.3 命令执行工具 —— 环境交互的“双脚”

这是三个工具中复杂度最高的一个,需要支持交互式命令(如 npm install)和常驻后台服务(如 npm run dev):

const executeCommandTool = tool(async ({ command, workingDirectory, background = false }) => {
  const [cmd, ...args] = command.split(' ');
  const child = spawn(cmd, args, {
    cwd: workingDirectory || process.cwd(),
    stdio: background ? 'pipe' : 'inherit', // 前台交互 或者 后台静默
    shell: true,
    detached: background, // 关键:后台运行解耦
  });

  if (background) {
    child.unref(); // 允许父进程退出而子进程继续运行
    return `命令已在后台启动: ${command}`;
  }
  // ... 前台模式等待完成
}, {
  name: 'execute_command',
  schema: z.object({
    command: z.string(),
    workingDirectory: z.string().optional(), // 项目隔离
    background: z.boolean().optional(), // 服务启动模式
  }),
});

其双模式设计解析如下:

模式 场景 技术特征
前台模式 (background: false) npm installgit status stdio: 'inherit' 实时展示输出,用户体验如同在终端直接执行
后台模式 (background: true) npm run dev、启动数据库服务 detached: true + unref() 实现服务常驻,不阻塞对话流程

workingDirectory 参数至关重要。在多项目场景下,通过它直接指定工作目录,可以避免使用 cd 命令带来的副作用和路径混乱。例如:

// 正确:直接指定目录
executeCommandTool.invoke({ command: "npm run build", workingDirectory: "./my-project" })

// 避免:依赖 cd 的不可靠方式
executeCommandTool.invoke({ command: "cd my-project && npm run build" })

为什么 cd 命令不可靠?

核心原因在于平台兼容性。cd my-project && npm run build 这种写法强依赖 Shell 语法,在不同平台上的支持度不一致。

平台 命令分隔符 问题
Linux/macOS && 正常执行
Windows CMD && 支持,但行为略有差异
Windows PowerShell ; 或换行 && 在旧版本可能不兼容

更隐蔽的是路径分隔符问题:

// Unix
cd ./my-project && npm start
// Windows(可能失败)
cd .\my-project && npm start // 反斜杠
// 或
cd my-project && npm start // 驱动器根目录问题

workingDirectory 参数由 Node.js 的 path 模块统一处理,能自动适配不同操作系统的路径格式。

另一个问题是当路径包含空格时,cd 命令容易解析错误:

// 危险:路径带空格导致命令被截断
executeCommandTool.invoke({ command: "cd ./my project && npm start" })
// 实际执行:cd ./my ("project" 被当作新命令)
// 报错:/bin/sh: line 0: cd: too many arguments
// 即使加引号也复杂
executeCommandTool.invoke({ command: "cd "./my project" && npm start" })
// 需要处理嵌套引号、转义,容易出错

最关键的是,相对路径的基准会混乱。cd 改变的是进程级的工作目录,而 spawncwd 选项只影响子进程。在 background: true 模式下使用 cd,很容易导致目录上下文丢失。

三、Agent 核心引擎

工具准备就绪后,我们需要构建 Agent 的大脑——让大模型能够理解需求、决策使用哪个工具、执行动作、观察结果,并循环这一过程直至任务完成。本节将实现一个支持流式输出和多轮工具调用的交互式 Agent。

3.1 架构设计:ReAct 循环

ReAct(Reasoning + Acting,推理+行动)是 Agent 设计的经典范式。它模拟人类解决问题的思维过程:不是一次性给出答案,而是通过“思考→行动→观察”的循环逐步推进。

与传统 LLM 调用的区别显而易见:

模式 交互方式 特点
标准 LLM 一问一答 依赖预训练知识,无法获取实时信息
ReAct Agent 多轮工具调用 通过工具与外部世界交互,动态获取信息

3.2 模型初始化与工具绑定

模块 作用
ChatOpenAI 大模型接口,支持工具调用(兼容 OpenAI 格式)
InMemoryChatMessageHistory 内存级对话历史,维护多轮上下文
JsonOutputToolsParser 解析模型输出的工具调用 JSON
HumanMessage/SystemMessage/ToolMessage 构建标准消息体系

选择 InMemoryChatMessageHistory 的原因很简单:作为简易版实现,内存存储足以演示核心逻辑。

const model = new ChatOpenAI({
  modelName: process.env.MODEL_NAME,
  apiKey: process.env.API_KEY,
  configuration: {
    baseURL: process.env.BASE_URL, // 兼容第三方 API(如 DeepSeek、豆包)
  },
});
const tools = [readFileTool, writeFileTool, executeCommandTool];
const modelWithTools = model.bindTools(tools);

bindTools 这一步至关重要,它将工具的定义(名称、描述、参数模式)注入模型上下文,让模型知道:有哪些工具可用、在什么场景下使用、以及参数应该如何填写。

3.3 核心循环:runAgentWithTools 实现

这是整个 Agent 的心脏,实现了 ReAct 循环:

async function runAgentWithTools(prompt, maxIterations = 30) {
  // 1. 记录用户输入
  await history.addMessage(new HumanMessage(prompt));
  let toolParser = new JsonOutputToolsParser();

  // 2. 多轮迭代,直到完成或达到上限
  for (let i = 0; i < maxIterations; i++) {
    let messages = await history.getMessages();
    console.log(`⏳ 正在等待 AI 思考...`);

    // 3. 流式调用模型
    let fullResponse = null;
    let hasStartedOutput = false;
    const stream = await modelWithTools.stream(messages);

    // 4. 实时处理流式响应
    for await (const chunk of stream) {
      // 累积完整响应(用于后续工具调用判断)
      if (!fullResponse) {
        fullResponse = chunk;
      } else {
        fullResponse = fullResponse.concat(chunk);
      }

      // 尝试解析工具调用(流式过程中可能不完整,用 try-catch 保护)
      let parsedTools = null;
      try {
        parsedTools = await toolParser.parseResult([{ message: fullResponse }]);
      } catch (error) {
        // 解析失败说明工具调用尚未完整,继续等待
      }

      // 5. 实时流式输出内容
      let outputContent = '';
      // 情况 A:普通文本回复
      if (chunk.content) {
        outputContent = chunk.content;
      }
      // 情况 B:工具调用中的代码生成(如 write_file 的内容字段)
      else if (parsedTools && parsedTools.length > 0) {
        for (const toolCallChunk of parsedTools) {
          if (toolCallChunk.type === 'write_file' && toolCallChunk.args.content) {
            outputContent += toolCallChunk.args.content;
          }
        }
      }

      // 6. 实时打印到终端
      if (outputContent && outputContent.trim() !== '') {
        if (!hasStartedOutput) {
          console.log(`\n✨ AI 回复:\n`);
          hasStartedOutput = true;
        }
        process.stdout.write(outputContent);
      }
    }

    // 7. 保存完整响应到历史
    const response = fullResponse;
    await history.addMessage(response);

    // 8. 判断是否需要工具调用
    if (!response.tool_calls || response.tool_calls.length === 0) {
      if (hasStartedOutput) console.log('\n');
      return response.content; // 无需工具,直接返回
    }
    if (hasStartedOutput) console.log('\n');

    // 9. 执行工具调用闭环
    for (const toolCall of response.tool_calls) {
      const foundTool = tools.find(t => t.name === toolCall.name);
      if (foundTool) {
        console.log(`[工具调用] ${toolCall.name}(${JSON.stringify(toolCall.args)})`);
        // 执行工具
        const toolResult = await foundTool.invoke(toolCall.args);

        // 10. 将工具结果反馈给模型(关键!)
        await history.addMessage(new ToolMessage({
          content: toolResult,
          tool_call_id: toolCall.id, // 必须匹配,让模型知道对应哪个调用
        }));
      }
    }
    // 11. 循环继续:模型收到工具结果后,决定下一步行动
  }
  return '达到最大迭代次数';
}

整个循环流程可以概括为:用户输入 → 模型思考 → 判断是否需要调用工具 → 是则执行工具并反馈结果 → 模型基于结果再次思考 → 循环直至任务完成或达到迭代上限。

3.4 流式输出的工程细节

为什么要做流式处理?体验差异立竿见影。

场景 体验差异
非流式 等待 10 秒后才一次性看到结果,用户可能以为程序卡死
流式 立即看到“正在分析...”、“发现依赖问题...”,能清晰感知响应进度

代码中处理了两种输出源:一是模型的自然语言回复(用于解释思路或询问确认),二是 write_file 工具调用中的代码内容。特别优化的一点是代码生成的实时预览:当模型调用 write_file 生成数百行代码时,用户能立即看到内容,而不是等待整个文件写入完成。

3.5 工具调用闭环:为什么 ToolMessage 至关重要

这是最容易被忽视但最核心的机制:

await history.addMessage(new ToolMessage({
  content: toolResult, // 工具执行结果(成功/失败/输出)
  tool_call_id: toolCall.id, // 必须匹配模型的 tool_call.id
}));

闭环逻辑是这样的:模型发出指令(如“读取 package.json”),系统执行工具并得到结果,然后将结果包装成 ToolMessage 并关联对应的 tool_call_id 反馈给模型。模型“观察”到这个结果后,才能基于新信息决策下一步(如“建议升级依赖”或“执行更新命令”)。

如果缺少 ToolMessage,模型就会遗忘自己已经调用了工具,很可能陷入“重复调用同一工具”或“幻觉执行结果”的死循环。

3.6 交互层:命令行对话界面

const rl = readline.createInterface({
  input: process.stdin,
  output: process.stdout
});
let history = new InMemoryChatMessageHistory();
let systemMessage = new SystemMessage(`你是一个经验丰富的程序员,善于使用工具完成任务。工具:1. read_file: 读取文件2. write_file: 写入文件3. execute_command: 执行系统命令,支持指定工作目录`);

async function interactiveChat() {
  await history.addMessage(systemMessage);
  console.log('\n=== AI 编程助手 ===');
  console.log('输入 "exit" 或 "quit" 退出\n');

  while (true) {
    const userInput = await new Promise((resolve) => {
      rl.question('用户: ', resolve);
    });

    if (userInput.toLowerCase() === 'exit' || userInput.toLowerCase() === 'quit') {
      console.log('\n再见!');
      rl.close();
      break;
    }
    if (userInput.trim() === '') continue;

    try {
      await runAgentWithTools(userInput);
    } catch (error) {
      console.error(`\n❌ 错误: ${error.message}\n`);
    }
  }
}
interactiveChat().catch(console.error);

设计上需要注意:在对话开始时注入持久的 SystemMessage 来定义 AI 角色和工具说明;实现循环对话以支持连续多轮交互,并自动累积历史记录;同时提供 exit/quit 命令和 Ctrl+C 的安全退出方式。

四、实战演示:完整工作流

来看一个真实的对话流程,展示三大工具如何协同工作。

场景:创建并运行一个 Express 服务

用户输入:“帮我创建一个简单的 Express 服务器,监听 3000 端口,并启动它。”

模型执行流程将是:首先调用 write_file 创建项目目录和 package.jsonapp.js 等文件;然后调用 execute_command 执行 npm init -ynpm install express;最后再次调用 execute_command,以 background: true 模式启动 node app.js 服务。

最终,模型会返回类似这样的信息:“Express 服务器已创建并在后台启动,运行在 http://localhost:3000。你可以使用 curl http://localhost:3000 进行测试。”

五、总结

至此,我们基于 LangChain.js 完整复刻了 Claude Code 的核心能力闭环。回顾整个实现,关键突破点在于三个工具的精巧设计和 ReAct 循环的稳健实现。

模块 解决的问题 技术亮点
read_file 代码上下文感知 错误透传,让模型自主决策重试策略
write_file 代码自动化落地 recursive: true 实现目录链自动创建
execute_command 环境交互与验证 双模式设计(前台/后台)+ 工作目录隔离
runAgentWithTools 多轮工具调用闭环 流式输出 + ToolMessage 反馈机制

这个简易版 Claude Code 的真正价值,不在于单个工具的能力,而在于让大模型成为了工作流的智能编排者:用户意图 → 模型决策 → 工具执行 → 结果观察 → 再决策 → ... → 任务完成。每一次循环迭代,都是模型对当前状态的重新评估和策略调整。ReAct 范式的引入,让 AI 从“回答问题”进化到了“解决问题”。

流式体验带来的用户价值也不容小觑。对于代码生成这类长耗时任务,流式输出不仅提升了感知性能,更重要的是建立了信任——用户能实时看到 AI 的思考过程和代码构建进度,而不是面对一个黑盒等待。

当然,当前实现只是一个最小可用版本(MVP)。在生产级场景中,还需要考虑以下增强方向:

方向 当前局限 优化方案
上下文长度 大文件读取会撑爆 Token 实现 read_file 的分块读取 + 智能摘要
安全管控 无命令白名单,可执行任意操作 增加危险命令拦截 + 用户确认机制
状态持久化 进程退出即丢失对话历史 接入 Redis/数据库实现跨会话记忆
多模态扩展 仅支持文本交互 增加图片输入(UI 设计稿转代码)
协作能力 单 Agent 串行执行 多 Agent 协作(生成 Agent + 审查 Agent)

写在最后

Claude Code 的流行,证明了“大模型 + 工具调用 + 代码场景”这一范式的巨大潜力。通过 LangChain.js,我们无需依赖闭源产品,就能构建出完全符合自身工作流和习惯的专属助手。

更重要的是,这个过程让我们深入理解了 AI 应用开发的本质:它不是要替代开发者,而是将重复性、机械性的操作自动化,从而让人类能够更专注于那些需要创造性、策略性思考的决策环节。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策