Claude工程师深度解析：为何Agent时代HTML将超越Markdown？

2026-05-13阅读 0热度 0

markdown

当AI Agent能够生成动辄数百行的规格文档、项目计划或研究报告时，一个核心挑战随之而来：这些冗长的输出，人类是否还有耐心审阅？

近期，Claude Code工程师Thariq Shihipar发表的一篇深度分析在技术社区引发了广泛共鸣。文章标题直指要害——《在Claude Code工作流中，HTML为何“不讲道理地好用”》。该文在X平台的浏览量已突破950万，收藏量近3000。一个看似基础的格式转换——从Markdown转向HTML，究竟如何重塑AI协作的效能？

Shihipar的核心观点可以概括为：当任务复杂度攀升时，Markdown的阅读体验与信息承载能力迅速触及天花板；而HTML凭借其强大的表现力，正将AI的输出从静态文档，转变为可阅读、可交互、甚至可临时编辑的“动态工作界面”。

一、Agent越会写，Markdown越不够看了

Markdown成为AI输出主流格式有其历史原因：语法简洁、便于移植，也方便人工手动调整。像Claude这类AI，甚至已能运用ASCII字符在Markdown中绘制示意图来解释流程。

然而，Agent所承担的工作正变得日益复杂。它不再仅是回答简单问题或罗列清单，而是需要生成包含上百行的详细规格、多阶段项目计划、深度技术分析报告以及复杂的代码逻辑阐述。

Shihipar坦言，他自己都难以耐心通读超过100行的Markdown文件，更不用说要求团队同事逐字审阅。

与此同时，另一个趋势正在形成：人工直接编辑这些文件的行为正在减少。大量Markdown文档仅作为规格参考、研究记录、头脑风暴存档或汇报材料存在。即便需要修改，用户也更倾向于通过新的提示词交由AI完成，而非亲自打开文件进行逐行编辑。

这意味着，Markdown“便于人类编辑”这一核心优势，在AI主导的协作流程中正逐渐失效。当人类角色更多地转向“审阅、理解与决策反馈”时，Markdown在视觉组织、信息分层与复杂表达上的局限性，便暴露无遗。

二、HTML的关键优势，在于把复杂信息讲清楚

转向HTML，并非追求视觉炫技，其根本价值在于HTML能承载的信息类型与密度，远超Markdown。

Markdown擅长处理标题、列表、粗体和代码块。但HTML的“工具箱”则丰富得多：表格能清晰呈现结构化数据，CSS可传达设计意图，SVG支持绘制精准示意图，脚本能嵌入可运行代码片段，甚至可集成滑块、按钮、标签页等交互组件。对于工作流、空间布局、图像嵌入及复杂页面结构，HTML的表达能力更为强大。

可以说，只要Claude能够解析和理解的信息，几乎都能被相对高效地转化为HTML。这相当于为AI提供了一块更广阔、更自由的“表达画布”。

在Markdown中，AI处理复杂信息时常显得力不从心。例如，用ASCII字符拼凑流程图，或用Unicode字符近似模拟颜色。这些方法并非完全无效，但本质是用文本“模拟”视觉元素。一旦内容复杂度上升，读者的认知负荷便会急剧增加。

▲Claude Code试图在Markdown中展示颜色

HTML的价值正在于此。它能够将信息拆解为更易于消化的模块，并通过图示、色彩、布局乃至交互来显著降低理解门槛。对AI而言，这是一种更高效的表达方式；对用户而言，这无疑提供了更友好、更愿意持续阅读的体验。

▲同样的信息，HTML换成了更适合阅读的结构

三、从方案规划到代码评审，HTML可以成为“工作看板”

在实际应用中，Shihipar最常将HTML用于规格文档、方案规划和探索性分析。

启动新项目时，他不再要求Claude Code仅生成一份Markdown计划，而是指令其输出一组HTML文件。例如，先让AI探索多个潜在方案方向，随后展开最具潜力的选项，补充界面草图、数据流图和关键代码片段，最终形成一份可视化实现计划。方案确认后，他会开启新会话，将这些HTML文件作为上下文，交由Agent执行后续任务。

▲通过HTML生成可交互调节面板后，用户可以调整参数，再将结果复制回Claude Code执行

这套流程的精妙之处在于，规划过程不再是枯燥的文字段落，而是演变为更接近“工作看板”的可视化界面。不同方案可并排对比，关键权衡点被直接标出，数据流和模块关系也通过图示一目了然。用户能更快地把握AI的思考路径与行动逻辑。

▲可将不同实现方案整理成并排对比页面，方便用户查看各方案的取舍并选择后续方向

代码评审也遵循类似逻辑。在Shihipar看来，将代码和差异对比（diff）置于Markdown中并不友好，而HTML可以高亮渲染差异、添加旁注注释、绘制流程图和模块关系图，还能用颜色区分问题严重等级。他提到，现在会为每个拉取请求（PR）附上一份HTML格式的代码解释文件。

▲代码评审将代码diff、问题标注和修改建议整合到同一页面中

这实质上将AI的输出从“口头解释”，升级为“可视化整理”。它将代码变更、潜在风险、相关上下文和核心逻辑，全部整合在一个更便于审阅的界面中。对于复杂的PR、陌生的代码模块或团队协作场景，这种呈现方式的清晰度与易理解性，远超冗长的Markdown文字说明。

四、HTML还能变成一次性的临时工具

更具启发性的是，Shihipar并不只将HTML视作最终文档，也将其作为一种“临时编辑器”。

某些需求很难仅通过文本框描述清楚。例如，重新排列数十个工单、调整一系列功能开关配置、调试复杂的系统提示词、筛选标注数据集，或选择颜色、定义动画曲线、设定定时任务规则等。这些任务若仅靠文字来回沟通，效率低下且易产生歧义。

他的解决方案是，直接让Claude Code生成一个“用完即弃”的HTML编辑器。这个编辑器并非正式产品，也无需长期维护，唯一目的就是高效解决当前特定问题。

▲设计方向的临时编辑器，包含颜色、字体、按钮和间距规范等

例如，他可以让Claude将30个Linear工单转为可拖拽的卡片，分别放入“立即执行”、“下一步”、“稍后”和“砍掉”等栏目，并添加“复制为Markdown”按钮。

他也可以让Claude针对一组功能开关配置生成表单式编辑器，直观展示不同开关间的依赖关系，并自动提醒必要的前置开关是否尚未开启。

同样，他还能让Claude创建提示词调试界面：左侧编辑提示词模板，右侧实时预览不同输入下的填充结果，同时提供Token计数和一键复制功能。

▲提示词调试的临时编辑器

这类HTML文件的关键不在于“编辑”本身，而在于“导出”。用户在界面中完成调整后，可一键将结果复制为JSON、Markdown、代码差异或格式化后的提示词，然后粘贴回Claude Code，让AI基于此继续执行。如此一来，HTML便不再仅仅是AI呈现给人类的结果，更演变为人类向AI反馈结构化信息的“中间层”与“协作界面”。

▲提示词临时编辑器，直接导出Prompt

五、让人重新跟上Agent的工作过程

Shihipar在文末点明了他推崇HTML的核心原因：它能让用户在AI工作流中重新获得参与感与掌控感。

随着Agent能力日益强大，用户可能倾向于将任务直接抛给它，然后等待结果，而非仔细审阅AI生成的详细计划。表面看，这提升了效率；但另一面是，人类可能逐渐脱离AI的决策过程。AI为何选择此方案、判断依据何在、不同方案间的利弊权衡——这些关键信息，极易被埋没在无人细读的长篇文本中。

HTML在一定程度上缓解了这一问题。它让计划、报告、代码解释和设计探索变得更容易阅读与理解，同时也允许用户通过滑块、按钮、拖拽、表单等交互方式进行微调与反馈。相比一份冗长的Markdown文档，HTML更像一个可操作、可协作的交互界面。

当然，采用HTML并非没有代价。Shihipar也承认，生成HTML通常比生成Markdown耗时更长，可能需要2到4倍的时间；同时，HTML文件的版本控制也更复杂，代码差异对比（diff）往往显得杂乱，不如Markdown那样清晰易审。

然而，在他看来，只要最终的产出物能够被用户真正读完、理解并有效使用，那么这些额外的成本，便是完全值得的。毕竟，效率的提升，最终应服务于有效的人机协作与深度理解，而非单纯的输出速度。

Claude工程师深度解析：为何Agent时代HTML将超越Markdown？

一、Agent越会写，Markdown越不够看了

二、HTML的关键优势，在于把复杂信息讲清楚

三、从方案规划到代码评审，HTML可以成为“工作看板”

四、HTML还能变成一次性的临时工具

五、让人重新跟上Agent的工作过程

相关阅读

最新教程

最新资讯