贝莱德AI战略揭秘:数据所有权与语义先行
过去两年,围绕AI的讨论几乎被模型本身垄断了——模型有多强大,演进速度有多快。但一个更根本的问题往往被忽略了:这些模型所仰仗的数据,质量到底怎么样?
在金融服务行业,数据从始至终都是管理风险和生成洞察的核心。这一点,从未改变。AI真正改变的是:它让数据策略中的缺陷暴露得更快。如果所有权不明确,一个系统叫“风险敞口”,另一个系统也叫“风险敞口”,但口径完全不一样——AI非但不会帮你弥合,反而会第一时间把这些裂隙放大给你看。这就是贝莱德AI战略的底色,不是从模型开始的,而是从更基础的地方:数据所有权和语义。
很多组织里,数据是作为应用程序和工作流程的副产品一点点堆积起来的。这些“排放物”被存储、转换、出报表,但随着时间的推移,上下文一点点流失,定义开始漂移,责任归属也变得模糊。经验丰富的分析师还能凭直觉和机构知识填补这些空白,但机器不行。当AI系统需要对同一个资产进行推理时,这种模糊性就是灾难。
所以,要让AI系统可靠运行,首先得确保数据有明确的所有权、记录完整的血缘关系,以及一致的语义定义。贝莱德的做法是,把数据当作产品来对待,而不是副产品。这意味着:有人对它负责,治理从一开始就嵌入其中,数据的设计从一开始就考虑可复用性——不只是为某一次报表服务,而是要能支撑所有工作流程,包括AI驱动的那部分。
有意思的是,推行这一理念的过程中,一个关键决策是:标准化,但不集中化。
在受监管的行业里,面对复杂性的本能反应是整合——把所有东西塞进一个仓库,集中管控。这确实能加强监督,但也容易拖慢前线的节奏,让数据离最懂它的人越来越远。贝莱德选择了联邦模式:业务团队和产品团队对自己产出的数据产品保持最终责任,因为他们最贴近这些数据所支撑的投资流程。这一点很关键——数据不是被“收走”管理的,而是被“授权”管理的。
而Snowflake扮演的角色,是在这套联邦架构下提供标准化的能力:一致的方式去做数据保护、共享和审计。强大的基于角色的访问控制和原生数据共享,让整个公司在保持互操作性的同时,可以灵活扩展规模,而不必每个决定都等集中化小组点头。
这种平衡,在Aladdin数据云的交付方式上也能看到。过去,分发数据意味着平面文件、FTP传输、大型模式定义。能跑通,但效率完全跟不上今天的需求。如今呢?客户能以现代化、云原生方式,把自己的记录账簿和市场数据直接集成到更广泛的数据资产里。这才算真正进入状态。
在金融领域,治理是不能后期“打补丁”的。随着数据平台持续迭代,贝莱德对元数据和问责制的重视程度非常之高。平台有一条硬规矩:任何资产,如果没有明确的所有权和来源记录,压根进不来。随着AI驱动的工作流程和自然语言界面逐渐深入日常操作,这种可追溯性只会变得更重要,而不是相反。
AI还让一个更微妙的问题浮出水面:语义。两个系统用同一个字段名,但意思可能完全不同。比如“交易对手”,在风控系统里和在前台系统里,口径差得可能不止一星半点。人类能凭上下文绕过去,但AI系统不行。如果上下文是隐式的、靠默契传递的,而不是显式定义的,系统的可靠性很快就崩了。
这也是为什么特别关注行业在开放语义交换(OSI)方向上的探索——原因很简单,目标也极其务实:让组织之间不仅能交换数据,还能交换数据背后的含义。语义一旦可移植,每次引入新工具、新模型、新智能体时,就不用重新搭建解释层。在AI驱动的生态里,这种互操作性迟早会成为刚需。
随着所有权和共享标准逐渐到位,团队的工作方式也在发生明显变化。花在管理定制传输和拼凑系统上的时间在减少,更多精力被投入到提升数据产品本身的清晰度和实用性上。从贝莱德的实践来看,敏捷性和控制力不是矛盾的。有了明确的标准和问责制,两者反而能相互支撑。
市场和技术不会停下来。新的资产类别会不断涌现,数据界面的交互方式也会变得越来越直观。为未来做准备,不是去追逐下一个模型发布,而是把最基础的东西打磨到极致——数据本身的所有权、治理和清晰含义。
说到底,AI可以加速实现贝莱德的使命——帮助越来越多人体验财务健康。但前提是,底层的那些数据,必须是有主的、有规矩的、能被清楚理解的。
对于任何正在规划AI战略的组织来说,这才是真正需要下功夫的地方。
Q&A
Q1:贝莱德为什么认为AI战略应该从数据所有权和语义开始?
A:因为AI会像一面照妖镜,快速放大这些数据策略上的问题。如果数据所有权不明确,或者不同系统之间用的定义各说各话,AI系统根本没法可靠运行。贝莱德的做法是把数据当产品管,而不是当副产品堆。谁对数据负责、治理从哪一步开始、数据能不能跨工作流复用,这些基础问题比追着最新的模型跑重要得多。
Q2:贝莱德在数据管理上用了什么模式?为什么不直接集中化?
A:贝莱德走的是联邦模式——业务和产品团队对自己管的数据保持责任,因为他们最了解这些数据背后的投资逻辑。集中化虽然能加强监督,但容易拖慢节奏,让数据和最懂它的人之间隔上一层。借助Snowflake平台,贝莱德做到了标准化但不集中化,既能保持互操作性,又能保障灵活扩展的能力。
Q3:开放语义交换(OSI)对AI应用意味着什么?
A:OSI解决的是“字段名一样,意思不一样”的问题。两个系统用同一个字段,但口径或定义完全不同,人能靠经验识别,AI做不到。语义一旦可移植,每次引入新工具或新模型时就不用重新搭解释层。在AI生态里,这种互操作性会直接影响系统的可靠性,不是“锦上添花”,而是基础能力。
