Databricks LTAP架构深度评测:智能体应用数据基础新标杆

2026-06-23阅读 0热度 0
智能体应用

企业正加速部署AI智能体——这类能基于业务数据自主推理并执行的系统。但你有没有注意到,长期以来操作型数据与分析型数据各自独立存储、互不打通的做法,如今正成为瓶颈。

Databricks发布LTAP架构,重塑智能体应用数据基础

云数据仓库服务商Databricks直接点出核心差异:AI智能体的数据需求与人类截然不同。人可以容忍几分钟甚至几小时的数据延迟,但智能体必须在同一时刻获取实时操作数据与历史上下文信息,才能做出实时决策并执行动作。因此,那种“交易数据存一处、分析数据存另一处,中间靠ETL管道缓慢搬运”的分离式数据架构,已承受越来越大的压力。

在今年的Data + AI峰会上,Databricks正式发布了新架构——湖事务与分析处理架构(LTAP)。目标很直接:将事务型数据与分析型数据统一存放在同一存储层,不再各自为政。

这与传统的OLTP(联机事务处理)和OLAP(联机分析处理)做法截然不同。旧模式是:OLTP库负责订单、支付、库存等日常业务运营,OLAP系统专职处理大规模查询和报表。企业不得不在两套环境间反复搬运数据——ETL管道、数据复制、独立基础设施……光是维护这些环节就耗费巨大精力。

LTAP的思路是:所有数据统一存储在共享的湖仓层,事务型与分析型工作负载分别由专门的计算引擎处理。如此一来,AI智能体及其相关应用可以直接访问实时操作数据和历史分析上下文,无需搬运数据,也无需创建副本再执行任务。

分析师们普遍认同这一判断——AI智能体确实正对企业数据架构提出全新要求。

Moor Insights and Strategy首席分析师迈克尔·莱昂指出:“智能体的行为模式不同于人类,也不同于我们为人类设计的应用。它会大量读取上下文、循环执行、反复尝试,然后写回结果,执行次数不可预测。在这种规模下,让它在生产系统与分析系统之间频繁切换,瓶颈必然出现。这种压力真实存在,LTAP提供了一条可行路径。”

IT咨询公司Kanerika联合创始人兼首席营收官布彭德拉·乔普拉则表示,自主智能体的数据访问模式已经让传统架构变得脆弱:“我们在客户部署多智能体系统时亲眼看到——智能体每完成一次任务就要执行数百次操作,管道层几乎瞬间成为瓶颈上限。”

分析师们也提到,缩小OLAP与OLTP之间的差距,能帮助开发者设计出更稳固的AI智能体或应用——这正是企业当前最核心的目标。

HyperFRAME Research AI技术栈业务负责人斯蒂芬妮·沃尔特举例说明:“最有价值的工作流,是把事务、分析和AI整合到同一流程中的实时上下文感知应用。比如一边查看历史账户背景,一边更新客户工作流的AI智能体;或者基于实时交易与长期行为模式做出判断的风控系统。”

但莱昂也提醒,要在现有条件下构建这种应用,开发者需要通过自定义集成,把事务系统、数据仓库、向量数据库等多个数据源的数据拼合在一起——工程复杂度与维护成本都极高。

HFS Research执行研究负责人阿希什·查图尔维迪从CIO视角审视这一问题:“LTAP降低工程复杂度,带来的是运营简化和成本节约。最明显的收益是减少数据管道数量,以及由此产生的连锁效益。大多数企业根本没意识到,自己的数据工程预算里有多少花在了纯粹维护管道上。”

乔普拉补充说,在中大型企业中,相当大一部分数据工程资源目前都耗在维护事务系统与分析系统之间的同步上。

查图尔维迪还强调了一个战略层面的价值:“治理的简化。当你用统一的治理模型管理一份数据,而不是让相同数据散落在操作数据库、副本、数据仓库和向量数据库中时,你就从根本上解决了治理碎片化的问题。”

乔普拉认为,这种简化对于部署多智能体的企业尤其重要——因为这些工作流可能以任何人工流程都无法比拟的速度和规模,放大治理漏洞。

不过,业界并非首次尝试统一操作型与分析型工作负载。此前有一个名为HTAP(混合事务与分析处理架构)的方案也做过类似尝试,但它试图在一个紧耦合的基础设施上同时处理两类工作负载。

LTAP则不同。它将存储与计算分离——不同的计算引擎可以共享同一数据层,同时各自独立扩展。

正是这种“计算引擎分离”的设计,让分析师们认为LTAP比HTAP更有前景。

莱昂解释道:“HTAP未能普及的原因在于,让一个紧耦合的系统同时在事务和分析两方面都表现优秀,结果往往两头都差强人意,企业还为此付出了额外代价。存储与计算分离是正确的思路,现代云数据体系得以成立的核心逻辑就在这里。关键在于——HTAP失败的根本原因是两类工作负载相互争夺资源,而为每类工作负载配备独立的专用引擎,正好能避免这个问题。”

ISG软件研究执行总监大卫·梅宁格也指出,HTAP的另一个失败原因,是它要求企业用全新架构替换现有的数据平台。相比之下,LTAP建立在“计算与存储分离”这个已被广泛接纳的实践基础上,改造幅度相对更小,采用门槛也就更低。

但尽管业界对LTAP热情不小,分析师也提醒CIO,不要急于将其视为现有数据架构的必然替代品。

沃尔特说:“CIO仍需根据延迟要求、可靠性、生态系统适配性、成本、合规性和开发者体验等因素,综合选择适合自己的数据架构。”

查图尔维迪补充道:“架构在纸面上看起来合理,真正的验证在于实际负载下——从提交到查询的延迟数据,才是硬道理。”

Databricks表示,LTAP预计将作为Lakebase产品的一部分在近期发布,但具体时间表尚未公布。

Q&A

Q1:LTAP架构与传统的OLTP、OLAP架构相比有哪些核心差异?

A:传统OLTP架构专为订单处理、支付等日常业务运营优化,OLAP架构专为大规模分析查询设计,两者数据存储相互独立,依赖ETL管道在不同系统间传输数据。LTAP将数据统一存储在共享湖仓层,让不同计算引擎独立处理各自的工作负载,从而消除数据复制和管道维护需求,使AI智能体能够同时访问实时操作数据与历史分析数据。

Q2:LTAP与HTAP有何区别,为什么分析师认为LTAP更具前景?

A:HTAP采用紧耦合架构,试图让同一系统同时处理事务与分析两类工作负载,结果往往两方面表现平平,且要求企业替换现有数据平台。LTAP则采用存储与计算分离的设计,不同计算引擎共享同一存储层但各自独立扩展,避免了工作负载互相竞争资源的问题。此外,LTAP构建在已被广泛接受的分离式架构基础之上,企业改造成本更低。

Q3:LTAP对企业CIO来说主要带来哪些收益?

A:LTAP对CIO的价值主要体现在三个层面:一是运营简化,减少数据管道数量,降低工程维护成本;二是成本节约,消除数据工程预算中大量用于管道维护的“纯管道”支出;三是治理简化,用统一治理模型管理单份数据,解决数据散落在多个系统中导致的治理碎片化问题,这对于部署多AI智能体的企业尤为重要。

免责声明

本网站新闻资讯均来自公开渠道,力求准确但不保证绝对无误,内容观点仅代表作者本人,与本站无关。若涉及侵权,请联系我们处理。本站保留对声明的修改权,最终解释权归本站所有。

相关阅读

更多
欢迎回来 登录或注册后,可保存提示词和历史记录
登录后可同步收藏、历史记录和常用模板
注册即表示同意服务条款与隐私政策