Table-as-Search权威测评：阿里国际站如何用表格革新复杂搜索

2026-05-12阅读 0热度 0

阿里巴巴

你是否曾在处理一项复杂的信息搜集任务时，打开十几个浏览器标签页，却在搜索中途忘记了自己已经找到了什么、还需要查找什么？或者，面对海量的搜索结果，感觉如同陷入信息迷宫，不知如何有效整理和利用这些碎片化内容？如果你有同感，那么你正在体验的，正是当前AI信息搜索系统在处理长期、复杂任务时同样面临的普遍困境——它们也会“迷失方向”。

近期，阿里巴巴国际数字商务团队的一项研究（论文编号：arXiv:2602.06724v1）为这一难题提供了一个全新且优雅的解决方案。他们提出的“Table-as-Search”（简称TaS）框架，其核心理念简洁而有力：将混乱的搜索过程，转变为如同填写一张表格般条理清晰的任务。

从“边走边想”到“按表索骥”

传统AI搜索系统的工作模式，类似于一个“边走边想”的人。它将所有搜索历史和中间结果存储在“大脑”（即工作记忆）中，并据此规划下一步。对于简单任务，这种方式尚可应对。然而，一旦任务变得复杂、步骤繁多，系统极易因信息过载而“丢三落四”，这在学术上被称为“迷失在中间”现象。

TaS框架的巧妙之处，在于它为这个“健忘的思考者”提供了一张永不混乱的“任务清单”。具体而言，当用户提出复杂需求时，系统首先生成一张结构化表格。这张表的“行”代表需要寻找的候选对象，“列”代表需要验证的条件或需要收集的信息维度。整个搜索任务，就此转化为一个直观的“填表”过程：获取的信息填入对应单元格，空白的单元格则清晰指明了下一步的搜索目标。

这就像在进行大规模采购前，你列出了一份详尽的购物清单，每完成一项就勾选一项。通过这种方式，系统对搜索进度和状态一目了然，彻底告别了混乱与遗忘。

一招鲜，吃遍天：统一三类搜索难题

更值得关注的是，这种“表格化”思路并非局限于单一问题类型，它能统一处理三种截然不同的信息搜索任务：

深度搜索：寻找符合多个严苛条件的“唯一目标”。例如，“找到一位在出生省份上大学、20岁左右为电视剧演唱过主题曲、且在22岁左右发行了首张专辑的歌手”。这需要层层递进的深度挖掘与交叉验证。

广度搜索：大规模收集一批对象的基础信息。例如，“搜集2005年至2015年间所有TED奖获得者的详细履历”。这要求搜索具备高度的覆盖面和全面性。

深广结合搜索：最具挑战性的一类，既要“广撒网”寻找候选，又要对每个候选“深挖洞”。一个典型的商业情报场景是：“找到30家在西班牙市场销售阿迪达斯运动鞋、价格具备竞争力且拥有成熟B2C运营经验的商家，并获取其有效联系方式”。

多智能体协同的“填表”流水线

那么，这张“表格”在技术上是如何运转的呢？TaS采用了一种多智能体协同的架构。你可以将其理解为一个高效的项目团队：

一个主规划智能体担任“项目经理”，负责解析任务、设计表格结构并协调全局进程。多个执行智能体则如同“专业搜索员”，被派遣执行具体的搜索指令。所有搜集到的信息，都会被规整地存入一个外部数据库，有效避免了内存过载问题。

其工作流程清晰地划分为三个阶段：

表格初始化：根据用户查询，生成最适配的表格模板。
动态协调执行：这是核心环节。系统会智能地在两种模式间切换：当候选对象不足时，启动“行扩展”模式，派遣多个搜索员并行寻找新目标；当候选足够但信息不全时，则切换到“单元格填充”模式，针对每个目标补全缺失的信息项。
答案综合：表格填写完毕后，系统整合所有信息，生成结构化的最终答案交付给用户。

实验数据：结构化带来的降维打击

为验证TaS的效能，研究团队进行了大规模实验。结果极具说服力：

在深度搜索任务中，使用成本较低的Gemini-2.5-Flash模型的TaS系统，准确率达到了52.4%，甚至超越了使用更强大模型（GPT-4o）的传统多智能体系统（38.4%）。这清晰地表明，在复杂任务中，有效的状态管理与结构化规划，比单纯的模型推理能力更为关键。

在广度搜索任务中，TaS同样表现卓越。它成功打破了传统系统中“覆盖率”和“精确度”难以兼得的困局，在显著提升搜索覆盖面的同时，保持了较高的信息准确率。

在最能体现商业价值的深广结合搜索任务中（团队为此专门构建了包含20个真实商业场景的测试集），TaS的优势更为突出。与谷歌的商用系统Gemini DeepResearch相比，TaS在候选发现准确率和信息收集精确度上分别提升了4.7%和5.1%。这证明了开放式结构化规划相比封闭式黑盒系统的显著优势。

不止于准确：鲁棒、高效且灵活

深入分析可以发现，TaS的优势是全方位的：

鲁棒性随复杂度提升：任务越复杂，TaS的优势越明显。在简单任务中，其优势约为14.3%，而在最复杂的任务中，优势可扩大至17.9%。这说明它天生就是为驾驭高复杂度任务而设计的。

效率源自精准规划，而非暴力搜索：TaS的性能提升并非依靠简单增加搜索次数“堆砌”而来。实验显示，它在使用相同甚至更少搜索次数的情况下，就能获得优于传统系统的结果，体现了更优的搜索策略与资源分配。

出色的可扩展性与灵活性：当分配更多计算资源时，TaS能更有效地利用资源以获得性能提升。同时，其执行层智能体可以轻松替换为更小、更专业的模型，从而大幅降低成本，并能无缝集成现有的专业搜索工具与API。

直面传统痛点与自身局限

通过具体案例，研究团队展示了TaS如何根治传统方法的两个顽疾：一是过早收敛（找到部分匹配结果便停止搜索），TaS的表格结构强制系统验证所有预设条件；二是搜索不充分（遗漏关键信息维度），TaS通过明确的表格单元格确保了信息收集的完整性与系统性。

当然，团队也客观指出了框架的当前局限：TaS主要针对信息搜索类任务进行优化，对于无需外部搜索的普通问答任务可能显得冗余；其整体性能高度依赖主规划智能体的任务分解与表格设计能力；此外，深广结合搜索任务的评估目前仍需一定程度的人工参与，限制了大规模自动化测试的效率。

结语：一次思维范式的转变

Table-as-Search框架的意义，远超一项具体的技术创新。它本质上是一次思维范式的转变——将复杂信息搜索从依赖“生成文本”的模糊过程，重构为基于“管理结构化信息”的清晰过程。

在信息爆炸的时代，这种能够有效驾驭复杂性的工具，其价值不言而喻。无论是商业情报调研、学术文献综述还是日常生活中的复杂决策，TaS都指明了一条更可靠、更高效的路径。它或许正在为下一代智能搜索系统，铺就一条完全不同的发展道路。

Q&A

Q1：Table-as-Search框架是什么？
A：Table-as-Search是阿里巴巴国际团队开发的信息搜索框架，它将复杂的搜索任务转化为填写结构化表格的过程。系统创建表格，行代表候选对象，列代表需验证的条件或收集的信息项，通过管理表格进度来避免传统方法在复杂任务中容易迷失方向的问题。

Q2：TaS框架比传统搜索方法好在哪里？
A：TaS的核心优势在于其结构化的状态管理能力。传统方法在复杂搜索中容易“迷路”或遗忘进度，而TaS通过表格清晰追踪每一步。实验证明，TaS能使成本较低的模型在复杂任务中超越更强大的传统系统，且在提升搜索覆盖面的同时保持高精确度。

Q3：TaS框架能处理哪些类型的搜索任务？
A：TaS能统一处理三类搜索任务：深度搜索（寻找符合多重严格条件的特定目标）、广度搜索（大规模收集对象的基础信息）、深广结合搜索（既需广泛寻找候选又需深入收集每个候选的详细信息）。它尤其擅长处理商业开发、市场研究、学术调研等需要多步骤、系统性信息收集的场景。