Perplexity搜索即代码测评:AI智能体自主编写搜索管道
当AI智能体处理复杂的研究任务时,传统的搜索引擎越来越像一套为人类眼球设计的蓝色链接列表——对AI而言,这种输入形态效率极低,限制重重。AI必须反复人工调整关键词,靠多次API调用拼凑信息,结果架构缺乏弹性,上下文窗口被大量低质冗余内容挤占。这显然不是一个理想的交互体验。
更深层看,这暴露了一个核心矛盾:我们给AI接入的工具,本质上仍是为人机交互优化的。Perplexity近期提出了“搜索即代码”(Search as Code)新范式——不再依赖封装好、功能固定的搜索API,而是让AI模型直接用Python代码动态生成并执行个性化的搜索流程。这一思路带来了根本性的转变。
三层协同架构
具体如何运作?Perplexity的SaC方案采用垂直分层设计,共三层,各司其职:
- 模型层(顶层):负责解析研究意图,规划宏观搜索策略——核心是让AI明确检索方向与路径;
- 安全沙箱(中层):提供一个受控的执行环境,内置持久化文件系统用于暂存中间状态,兼顾安全性与灵活性;
- 智能搜索SDK(底层):将检索、扇出查询、条件过滤、结果去重、相关性重排及结构化解析等细粒度能力,封装成可编程的函数原语,支持代码直接调用。
这样AI智能体就能并行发起多路查询,按需剔除噪声,仅将真正关键的信息注入上下文窗口。对于长周期、多步骤的研究任务,逻辑一致性与推理连贯性得到了有效保障。
CVE漏洞分析实战:效率跃升与Token大幅缩减
理论之外,看看实战效果。Perplexity设计了一项高难度的网络安全任务:系统性地追踪200个发布于2023至2025年间的重点软件漏洞(CVE),并准确提取其官方披露文档、受影响产品清单及对应的修复版本号。
在SaC支持下,AI自动编写了一套“三阶段自动化脚本”:第一阶段根据各厂商(如Mozilla、Google)公告格式差异,启动并行定制化搜索;第二阶段自动扫描首轮结果中的缺口,触发补充查询;第三阶段通过Schema校验机制,确保最终输出的漏洞数据字段完整、语义对齐。
结果相当可观:不仅高质量完成了全部任务,Token使用量相比传统标准流程下降了85%。在Perplexity内部基准测试(涵盖DSQA、BrowseComp、HLE、WideSearch以及最新推出的广度研究评测集WANDR)中,SaC在五项指标里拿下四项领先,相对原有架构提升显著。尤其在最具挑战性的WANDR上,增益高达45%——这是真正的效率跃升。
编程能力正演变为AI的核心交互界面
从行业趋势看,代码书写正在加速成为AI智能体与现实世界连接的主流接口。传统软件依赖确定性指令流,而前沿大模型在Token空间中进行概率化推理。真正有竞争力的系统,往往将两者优势融合:大模型负责策略生成,确定性运行环境承担批量处理与精细过滤,搜索基础设施则作为统一的输入/输出通道。
目前,“搜索即代码”能力已全面集成到Perplexity Computer平台与Agent API接口中,逐步向开发者开放。面对当前AI搜索智能体普遍存在的过度依赖训练数据产生幻觉、难以响应实时信息等瓶颈,这一新范式提供了一条切实可行的破局路径。

