AI数据基础设施实战精选：5位开源专家深圳Meetup

2026-06-11阅读 0热度 0

人工智能

过去一年，AI 应用几乎冲刷了每一块业务土壤，但真正的卡点正从模型层滑向数据层——实时分析怎么落地？上下文理解如何破局？多模态数据怎么整合？搭建一套真正适配 AI 场景的数据架构，已是技术团队绕不开的硬仗。这种语境下，线下碰撞的价值愈发凸显。与其刷推文、看录播，不如一群人围坐在一起，当面拆解架构、复盘实践、对答案。3 月 7 日，Data for AI Meetup 落地深圳。这不止是一场技术分享，更是你与同行在社区里建立真实连接的机会。

这次我们聊什么

数据湖元数据与治理如何支撑 AI 场景
多模态数据湖在真实业务中的架构实践
云原生数据平台的设计演进
半结构化数据与 No-ETL 实时分析解法
开源、AI 和 Data 技术社区生态的趋势和共建

分享嘉宾来自腾讯、OPPO、Datastrato、ScopeDB 等团队，以及 Apache 软件基金会、LF APAC AI & Data 和开源社等知名社区。既有大规模业务实践，也有开源基础设施经验，将从不同角度呈现 AI 数据层的真实挑战与解决思路。

如果你正在搭建 AI 数据架构，这些议题值得现场深聊。

议程亮点

堵俊平｜Datastrato

Datastrato 创始人兼 CEO，原 LF AI & Data 基金会董事主席，Apache 软件基金会成员，数据与开源领域专家。曾任全球 500 强企业开源业务总经理、腾讯开源负责人兼大数据研发总监、Cloudera Hadoop 团队负责人等。

AI Agent 时代的数据控制：从「什么时候我们才可以用 OpenClaw 来做数据管理？」谈起

近期 OpenClaw 的快速走红，让不少团队开始重新思考 AI Agent 的演进路径。随着 AI Agent 从工具走向系统，数据控制层正在成为新的基础设施问题。OpenClaw 虽仍处于早期阶段，但其设计理念为 AI 原生数据管理提供了重要线索。本分享将以「何时可以用 OpenClaw 进行数据管理」为切入点，讨论 AI Agent 时代数据治理与控制范式的演进。

张帅｜腾讯

腾讯云 TBDS 大数据存储团队核心成员，AI 数据湖研发负责人，深耕大数据技术近 10 年，在 Iceberg、Lance 等表格式优化和治理方面有丰富经验。

AI 数据湖元数据和存储治理

在 AI 场景下，数据湖不仅承载数据，更需要支撑高频迭代与复杂治理需求。张帅将结合腾讯云 TBDS 团队实践，分享在 Iceberg、Lance 等表格式体系下的数据湖元数据与存储治理设计，以及其在真实业务中的应用经验。

Da vid｜OPPO

OPPO 大数据高级架构师，开源高性能云原生缓存系统 Curvine 项目负责人。

OPPO 多模态数据湖架构实践：统一元数据与高性能访问

随着多模态 AI 应用在手机、影像与智能服务中的不断落地，数据湖需要同时承载图像、日志、向量等多种数据形态，传统架构在元数据统一与访问性能上面临新的挑战。多模态场景的复杂性，也让数据治理与数据访问路径成为系统设计的关键。本分享将基于 OPPO 的一线实践，介绍多模态数据湖的整体架构设计，以及 Gra vitino 与 Curvine 在统一元数据管理与加速数据读写方面的组合应用经验，呈现多模态数据基础设施在真实业务中的落地路径与技术取舍。

史少锋｜Datastrato

Datastrato VP of Engineering, Apache Member, Apache Incubator PMC, Gra vitino PMC member，超过 18 年的云计算、大数据和开源项目经验。

AI 原生元数据平台的能力与实践

在多云与 AI 协同场景下，统一元数据平台成为数据治理的重要基础。本议题将介绍 Apache Gra vitino 的架构与核心能力，并解析 1.1.0 新特性（包括 Lance 支持与安全增强等），分享其在跨集群与 AI 数据治理中的落地价值；同时还会和大家剧透即将在 3 月中发布的 1.2.0 最新版本内容。

tison｜ScopeDB

ScopeDB 联合创始人，Apache 软件基金会董事，以及多个顶级开源项目（OpenDAL、ZooKeeper、Flink）的核心成员。

半结构化数据实时分析实践：No-ETL 与按需建模

云原生技术已经发展十余年，但不少数据平台仍沿用传统架构，将复杂的数据流水线直接搬到云上，未能真正释放弹性计算与对象存储的优势。与此同时，日志、事件流与 AI 对话数据的爆发，使半结构化数据逐渐成为实时分析的核心形态。本分享将结合 ScopeDB 的设计实践，探讨 No-ETL 与按需建模（Schema on the fly）如何简化数据链路、降低数据处理成本，并更好地支撑 AI 与 Agent 场景下的新型数据模型，呈现数据架构在 AI 时代的演进趋势。

谁适合参加

正在搭建或优化 AI 数据基础设施的架构师和工程师
关注数据湖、元数据管理、多模态数据处理的技术负责人
希望了解开源数据项目（Iceberg、Gra vitino、Lance 等）实践经验的开发者
对 AI Agent、云原生数据架构感兴趣的从业者

活动信息

? 时间：2026 年 3 月 7 日（周六）下午 13:00-17:30
? 地点：深圳·深国际华南数字谷 H 栋 4 楼
? 报名：免费参加，需通过审核（请完整填写报名信息）。

期待 3 月 7 日（周六）在深圳与你相见。