Claude工程师深度解析:为何Agent时代HTML将超越Markdown?
当AI Agent能够生成动辄数百行的规格文档、项目计划或研究报告时,一个核心挑战随之而来:这些冗长的输出,人类是否还有耐心审阅?
近期,Claude Code工程师Thariq Shihipar发表的一篇深度分析在技术社区引发了广泛共鸣。文章标题直指要害——《在Claude Code工作流中,HTML为何“不讲道理地好用”》。该文在X平台的浏览量已突破950万,收藏量近3000。一个看似基础的格式转换——从Markdown转向HTML,究竟如何重塑AI协作的效能?
Shihipar的核心观点可以概括为:当任务复杂度攀升时,Markdown的阅读体验与信息承载能力迅速触及天花板;而HTML凭借其强大的表现力,正将AI的输出从静态文档,转变为可阅读、可交互、甚至可临时编辑的“动态工作界面”。
一、Agent越会写,Markdown越不够看了
Markdown成为AI输出主流格式有其历史原因:语法简洁、便于移植,也方便人工手动调整。像Claude这类AI,甚至已能运用ASCII字符在Markdown中绘制示意图来解释流程。
然而,Agent所承担的工作正变得日益复杂。它不再仅是回答简单问题或罗列清单,而是需要生成包含上百行的详细规格、多阶段项目计划、深度技术分析报告以及复杂的代码逻辑阐述。
Shihipar坦言,他自己都难以耐心通读超过100行的Markdown文件,更不用说要求团队同事逐字审阅。
与此同时,另一个趋势正在形成:人工直接编辑这些文件的行为正在减少。大量Markdown文档仅作为规格参考、研究记录、头脑风暴存档或汇报材料存在。即便需要修改,用户也更倾向于通过新的提示词交由AI完成,而非亲自打开文件进行逐行编辑。
这意味着,Markdown“便于人类编辑”这一核心优势,在AI主导的协作流程中正逐渐失效。当人类角色更多地转向“审阅、理解与决策反馈”时,Markdown在视觉组织、信息分层与复杂表达上的局限性,便暴露无遗。
二、HTML的关键优势,在于把复杂信息讲清楚
转向HTML,并非追求视觉炫技,其根本价值在于HTML能承载的信息类型与密度,远超Markdown。
Markdown擅长处理标题、列表、粗体和代码块。但HTML的“工具箱”则丰富得多:表格能清晰呈现结构化数据,CSS可传达设计意图,SVG支持绘制精准示意图,脚本能嵌入可运行代码片段,甚至可集成滑块、按钮、标签页等交互组件。对于工作流、空间布局、图像嵌入及复杂页面结构,HTML的表达能力更为强大。
可以说,只要Claude能够解析和理解的信息,几乎都能被相对高效地转化为HTML。这相当于为AI提供了一块更广阔、更自由的“表达画布”。
在Markdown中,AI处理复杂信息时常显得力不从心。例如,用ASCII字符拼凑流程图,或用Unicode字符近似模拟颜色。这些方法并非完全无效,但本质是用文本“模拟”视觉元素。一旦内容复杂度上升,读者的认知负荷便会急剧增加。
HTML的价值正在于此。它能够将信息拆解为更易于消化的模块,并通过图示、色彩、布局乃至交互来显著降低理解门槛。对AI而言,这是一种更高效的表达方式;对用户而言,这无疑提供了更友好、更愿意持续阅读的体验。
三、从方案规划到代码评审,HTML可以成为“工作看板”
在实际应用中,Shihipar最常将HTML用于规格文档、方案规划和探索性分析。
启动新项目时,他不再要求Claude Code仅生成一份Markdown计划,而是指令其输出一组HTML文件。例如,先让AI探索多个潜在方案方向,随后展开最具潜力的选项,补充界面草图、数据流图和关键代码片段,最终形成一份可视化实现计划。方案确认后,他会开启新会话,将这些HTML文件作为上下文,交由Agent执行后续任务。

▲通过HTML生成可交互调节面板后,用户可以调整参数,再将结果复制回Claude Code执行
这套流程的精妙之处在于,规划过程不再是枯燥的文字段落,而是演变为更接近“工作看板”的可视化界面。不同方案可并排对比,关键权衡点被直接标出,数据流和模块关系也通过图示一目了然。用户能更快地把握AI的思考路径与行动逻辑。

▲可将不同实现方案整理成并排对比页面,方便用户查看各方案的取舍并选择后续方向
代码评审也遵循类似逻辑。在Shihipar看来,将代码和差异对比(diff)置于Markdown中并不友好,而HTML可以高亮渲染差异、添加旁注注释、绘制流程图和模块关系图,还能用颜色区分问题严重等级。他提到,现在会为每个拉取请求(PR)附上一份HTML格式的代码解释文件。

▲代码评审将代码diff、问题标注和修改建议整合到同一页面中
这实质上将AI的输出从“口头解释”,升级为“可视化整理”。它将代码变更、潜在风险、相关上下文和核心逻辑,全部整合在一个更便于审阅的界面中。对于复杂的PR、陌生的代码模块或团队协作场景,这种呈现方式的清晰度与易理解性,远超冗长的Markdown文字说明。
四、HTML还能变成一次性的临时工具
更具启发性的是,Shihipar并不只将HTML视作最终文档,也将其作为一种“临时编辑器”。
某些需求很难仅通过文本框描述清楚。例如,重新排列数十个工单、调整一系列功能开关配置、调试复杂的系统提示词、筛选标注数据集,或选择颜色、定义动画曲线、设定定时任务规则等。这些任务若仅靠文字来回沟通,效率低下且易产生歧义。
他的解决方案是,直接让Claude Code生成一个“用完即弃”的HTML编辑器。这个编辑器并非正式产品,也无需长期维护,唯一目的就是高效解决当前特定问题。
例如,他可以让Claude将30个Linear工单转为可拖拽的卡片,分别放入“立即执行”、“下一步”、“稍后”和“砍掉”等栏目,并添加“复制为Markdown”按钮。
他也可以让Claude针对一组功能开关配置生成表单式编辑器,直观展示不同开关间的依赖关系,并自动提醒必要的前置开关是否尚未开启。
同样,他还能让Claude创建提示词调试界面:左侧编辑提示词模板,右侧实时预览不同输入下的填充结果,同时提供Token计数和一键复制功能。
这类HTML文件的关键不在于“编辑”本身,而在于“导出”。用户在界面中完成调整后,可一键将结果复制为JSON、Markdown、代码差异或格式化后的提示词,然后粘贴回Claude Code,让AI基于此继续执行。如此一来,HTML便不再仅仅是AI呈现给人类的结果,更演变为人类向AI反馈结构化信息的“中间层”与“协作界面”。
五、让人重新跟上Agent的工作过程
Shihipar在文末点明了他推崇HTML的核心原因:它能让用户在AI工作流中重新获得参与感与掌控感。
随着Agent能力日益强大,用户可能倾向于将任务直接抛给它,然后等待结果,而非仔细审阅AI生成的详细计划。表面看,这提升了效率;但另一面是,人类可能逐渐脱离AI的决策过程。AI为何选择此方案、判断依据何在、不同方案间的利弊权衡——这些关键信息,极易被埋没在无人细读的长篇文本中。
HTML在一定程度上缓解了这一问题。它让计划、报告、代码解释和设计探索变得更容易阅读与理解,同时也允许用户通过滑块、按钮、拖拽、表单等交互方式进行微调与反馈。相比一份冗长的Markdown文档,HTML更像一个可操作、可协作的交互界面。
当然,采用HTML并非没有代价。Shihipar也承认,生成HTML通常比生成Markdown耗时更长,可能需要2到4倍的时间;同时,HTML文件的版本控制也更复杂,代码差异对比(diff)往往显得杂乱,不如Markdown那样清晰易审。
然而,在他看来,只要最终的产出物能够被用户真正读完、理解并有效使用,那么这些额外的成本,便是完全值得的。毕竟,效率的提升,最终应服务于有效的人机协作与深度理解,而非单纯的输出速度。





