开源AI可视化工具AgentCanvas深度评测
AgentCanvas 核心功能详解
AgentCanvas 是 Vstorm 开源的一款专为 Pydantic AI 设计的可视化工具,核心价值在于将 Agent 运行日志转化为可交互的 HTML 流程图。只要你的 Agent 接入了 Logfire 追踪,它就能自动解析每次模型调用、工具执行、嵌套子智能体、Token 消耗及精确成本,生成一份自包含的 HTML 文件,无需服务器即可离线查看。对于客户演示场景尤其实用——既能清晰展示“AI 的决策过程”,又无需对方深入技术细节。
AgentCanvas 功能特性一览
- 块状流程图:以
User → Agent → Model → Tools → Answer的流式结构呈现完整运行链路,支持画布平移、缩放和拖拽,操作流畅直观。 - 嵌套子智能体递归展示:当工具本身也是 Agent 时,自动绘制嵌套框架,支持任意深度递归展开——复杂层级结构也能清晰呈现。
- 完整对话记录:每轮对话独立成帧,侧边栏展示完整的
user → assistant → user → assistant原始 transcript,方便上下文回溯。 - 推理过程可视化:将模型“思考”摘要及 reasoning token 数量展示在每个模型调用节点和对话记录中,辅助理解模型内部推理逻辑。
- 精确成本计算:基于
genai-prices库,按每次模型调用及整体运行分别计算实际美元成本,告别估算。 - Token 用量统计:逐层展示 Input / Output / Reasoning Token 数量并汇总总计,便于性能优化。
- 深度详情面板:点击穿透查看 Provider、Finish Reason、Response ID、可用工具列表及描述、输出模式、Thinking 配置等元数据,技术细节一应俱全。
- 引导式演示模式:支持自动播放和手动逐步(Space/点击/方向键,可回退),附带自然语言旁白,Demo 场景加分。
- 单文件自包含输出:最终产物为单个 HTML 文件,无需构建、无需服务器、可离线运行、便于邮件分发,省心高效。
AgentCanvas 使用步骤
- 安装工具:执行
pip install agentcanvas即可完成安装。 - 配置读取令牌:设置环境变量
LOGFIRE_READ_TOKEN(或写入.env文件),用于通过 Logfire Query API 读取 Agent 运行追踪数据。 - (可选)配置区域地址:如需读取欧盟区 Logfire 数据,设置
LOGFIRE_BASE_URL=https://logfire-eu.pydantic.dev。 - 生成最新运行报告:执行
agentcanvas命令,自动读取最近一次 Agent 运行记录,输出agent_flow.html并在浏览器中打开。 - 查看历史运行列表:执行
agentcanvas --list列出近期所有可用运行记录。 - 指定特定 Trace 可视化:执行
agentcanvas --trace-id对特定运行生成流程图。 - 自定义输出文件名:执行
agentcanvas -o report.html --no-open指定文件名并禁止自动打开浏览器。 - (可选)运行示例 Agent:在仓库目录下执行
uv sync --all-extras --prerelease=allow和uv run --prerelease=allow python assets/scripts/main.py生成示例追踪数据,再执行agentcanvas可视化。 - 库模式集成:在 Python 代码中导入
LogfireClient、parse_run、render_html,程序化获取 Trace 数据并渲染为 HTML 字符串写入文件。
AgentCanvas 项目地址
- Github 仓库:https://github.com/vstorm-co/agentcanvas
AgentCanvas 核心优势
- 零侵入可视化:无需修改现有 Agent 代码,直接读取 Logfire 已有的 OpenTelemetry GenAI spans 数据,开箱即用。
- 生产级成本透明:基于真实 Token 数据计算精确费用,解决“AI 黑盒”与“成本不可控”两大痛点。
- 客户沟通利器:将技术实现转化为业务语言,非技术客户也能理解 Agent 的决策路径和工具调用逻辑。
- 递归架构原生支持:不同于普通流程图工具,它对 Pydantic AI 的嵌套子 Agent 模式具备原生递归渲染能力,复杂系统也能应对自如。
- MIT 开源协议:可自由集成到内部工具链或商业项目中,无后顾之忧。
AgentCanvas 与同类竞品对比
为便于你快速判断 AgentCanvas 的定位,这里将其与 LangSmith 和 Phoenix(Arize)进行横向对比:
| 对比维度 | AgentCanvas | LangSmith | Phoenix (Arize) |
|---|---|---|---|
| 核心定位 | Pydantic AI 专用可视化报告生成 | LangChain 生态全链路追踪与评估 | 多框架 LLM 可观测性与评估 |
| 可视化形式 | 单文件交互式 HTML 流程图(可离线) | 在线 Web 平台(需登录) | 在线 Web 平台(需登录) |
| 成本展示 | ✅ 精确到每次调用的美元成本 | ⚠️ Token 统计,成本需额外配置 | ⚠️ Token 统计,成本需额外配置 |
| 嵌套 Agent 支持 | ✅ 原生递归渲染 | ⚠️ 支持但非专门优化 | ⚠️ 支持但非专门优化 |
| 部署方式 | 本地 CLI 工具,输出单 HTML | SaaS 平台 + 本地 SDK | SaaS 平台 + 本地 SDK |
| 开源协议 | MIT | 部分开源(LangSmith 闭源) | Apache 2.0 |
| Pydantic AI 原生 | ✅ 深度集成 | ⚠️ 通用兼容 | ⚠️ 通用兼容 |
| 演示模式 | ✅ 自动导览 + 手动逐步 | ❌ 无 | ❌ 无 |
AgentCanvas 应用场景
- 客户 Demo 与汇报:会议中直接展示 Agent 的完整决策链路、工具调用顺序和实时成本,让客户看到具体细节,快速建立信任。
- 生产环境调试:通过可视化快速定位 Agent 在哪一步调用了错误工具或产生了异常高的 Token 消耗,大幅提升问题定位效率。
- 成本审计与优化:基于精确到每次模型调用的成本数据,识别高消耗环节,针对性优化 Prompt 或调整模型选择。
- Agent 架构文档化:将运行时的实际流程图作为技术文档或交付物,比静态架构图更真实、更具说服力。
- 多智能体系统监控:在复杂的嵌套 Agent 系统中,递归可视化各层级调用关系,避免“俄罗斯套娃”式的黑盒,系统运行状态一览无余。