中关村学院GaussianPile技术:切片式容积影像快速重建权威解析
3D Gaussian Splatting (3DGS) 凭借其卓越的场景表征与实时渲染性能,已成为三维视觉领域的一项突破性技术。它摒弃了传统的体素或神经辐射场方法,转而采用一组可优化的各向异性高斯来构建三维场景,在连续空间表达与实时性能之间取得了精妙的平衡。
然而,一个关键问题随之而来:当处理对象并非自然场景的表面,而是超声、显微或MRI等通过切片成像重建得到的三维容积数据时,3DGS这套方法是否依然有效?
这正是北京中关村学院与清华大学联合研究团队在GaussianPile项目中探索的核心议题。他们提出了一种面向切片式容积成像的稀疏高斯表示与重建框架,旨在将传统的体素网格数据,转换为一组名为“3D Focus Gaussian primitives”的基元。其目标清晰:在精准重建内部解剖或显微结构的同时,实现数据的高效压缩、快速渲染以及便捷的三维体素化评估。
论文标题:GaussianPile: A Unified Sparse Gaussian Splatting Framework for Slice-based Volumetric Reconstruction
arXiv 地址:https://arxiv.org/abs/2603.20611
上图综合对比了GaussianPile与现有方法在重建质量、渲染速度及训练耗时上的表现。
切片式容积成像为何需要新的表示方法?
在生物医学成像领域,海量的三维数据并非一次性采集的完整体积,而是由一系列二维切片堆叠而成。无论是自动乳腺超声、光片显微、结构光显微,还是特定MRI序列,均可归为此类切片式容积数据。
这类数据通常面临几项固有挑战:
首先是数据体量庞大。高分辨率三维图像会迅速带来存储与传输压力。传统的体素网格虽直观,但其存储成本与分辨率呈三次方增长,开销巨大。
其次是成像物理过程的特殊性。真实的成像系统并不产生理想的“无限薄切片”。每一张切片都具有特定的厚度与有限的焦深,其像素值是沿成像方向一定厚度内所有结构信号的积分贡献。这一特性在超声与光片显微成像中至关重要,忽略它将导致三维重建的内部结构失真。
第三是交互效率的刚性需求。许多基于隐式神经表示的方法虽能获得较高的压缩率,但其优化与查询过程通常较慢,更适合作为“冷存储”方案,难以满足需要快速访问、实时浏览乃至机器人导航等对延迟敏感的应用场景。
因此,GaussianPile的设计初衷,是构建一种既能继承3DGS的高效、紧凑与实时渲染特性,又能严格遵循切片式成像物理约束,从而确保医学与科学分析所依赖的内部结构准确性的新型表示方法。
GaussianPile的核心创新:将“厚度”建模融入渲染方程
GaussianPile最关键的突破,在于将切片式成像中“有限厚度”这一核心物理特性,显式地建模并整合至高斯的渲染流程中。
标准3DGS主要针对自然场景的表面渲染设计,通常假设相机为全焦模式,即三维点投影至图像平面时,不考虑沿景深方向的模糊效应。若将此模型直接套用于切片数据,可能导致一个严重问题:二维切片看似拟合良好,但三维内部结构却不可靠,甚至产生漂浮伪影。
为此,GaussianPile引入了一套焦点感知的物理模型。具体而言,它将成像系统在切片方向上的点扩散函数,建模为一个有限厚度的灵敏度图,并将此物理响应与每个3D高斯的投影过程相融合。这使得距离当前虚拟切片平面较近的高斯对图像贡献主要信号,而远离焦平面的高斯信号则自然衰减,从而更贴合真实的成像物理。
上图清晰地展示了GaussianPile的焦点感知渲染管线。
整个流程可概括为三个核心步骤:
1. 扫描:在三维高斯表示中,沿轴向采样不同深度的虚拟切片平面。
2. 聚焦:依据预设的切片厚度与系统焦深,对高斯进行轴向重参数化,并调制离焦区域的贡献权重。
3. 堆叠:将经过聚焦调制后的高斯投影至二维切片平面,并采用加性光栅化来累积体积强度信号。
此处的“加性光栅化”是一项关键设计。自然场景渲染常使用Alpha混合处理遮挡关系,但切片式医学成像中的像素强度,更接近于沿成像路径的体积信号积分。因此,GaussianPile采用加性累积来描述不同高斯对同一像素的贡献,使得整个渲染过程在物理含义上更贴合容积成像的本质。
从体素到高斯:迈向可计算表示的范式转换
GaussianPile的目标远不止于将体数据“压缩”得更小。它实质上完成了一次格式的范式转换:将离散的切片序列,转变为一种连续、稀疏且可计算的三维中间表示。
在此表示中,每个高斯基元包含了位置、尺度、旋转方向和强度等参数。由于高斯函数本身具有连续性,一个基元即可覆盖一片空间区域,因此通常无需像体素网格那样进行逐点存储,天然具备稀疏性。同时,GaussianPile移除了标准3DGS中用于建模视角相关外观的球谐系数,因为医学切片强度通常是视角无关的体积密度或吸收系数,而非颜色信息。
在压缩阶段,GaussianPile进一步利用了高斯参数在空间上的相关性,对位置、尺度、旋转和透明度等属性进行了量化与熵编码。实验数据表明,相较于原始体素网格,GaussianPile能够实现平均约16倍的稳定压缩,在部分数据集上压缩比甚至达到20至26倍,同时依然保持了优异的二维切片重建质量与三维结构一致性。
实验结果:在速度、质量与压缩率间达成卓越平衡
研究团队在自动乳腺超声、光片显微以及多组细胞显微数据上对GaussianPile进行了全面评估,并将其与HEVC(高效视频编码)、基于隐式神经表示/NeRF的压缩方法以及原始3DGS方法进行了对比。
结果显示,GaussianPile在多个数据集上的二维和三维重建指标(PSNR/SSIM)均表现领先。与HEVC相比,它能更好地保留细微的生物组织结构;与INR类方法相比,它在高频细节重建和优化速度上优势显著;与直接应用3DGS相比,它有效改善了三维结构不一致和“漂浮伪影”等问题。
上图直观对比了不同方法在超声和显微数据上的二维重建效果。
在效率方面,GaussianPile能够在数分钟内达到高质量的重建结果。论文报告的平均收敛时间约为8分钟,部分数据在约3分钟内即可获得良好重建。相比优化时间较长的INR/NeRF类方法,最高实现了约11倍的加速,同时保留了高斯表示带来的实时渲染能力。
上图的三维重建对比尤为关键。可以看到,简单适配后的原始3DGS方法虽然可能拟合出看似不错的二维切片,但其三维内部结构容易出现严重失真;而GaussianPile则保持了更好的三维体积结构一致性。
除了常规医学数据,研究团队还在电子显微等更大规模数据上进行了扩展实验。结果表明,GaussianPile在更高分辨率的体数据上仍表现出良好的可扩展性。这预示着该框架不仅适用于实验室规模的小样本,也具备服务于更大规模科学成像数据浏览与分析的潜力。
上图展示了该方法在大型数据集上的可扩展性分析结果。
未来方向:构建实时三维感知的新路径
这项工作的应用前景十分广阔。以机器人辅助手术为例,系统需要近乎实时地获取组织的三维结构,并进一步完成对肿瘤、血管等关键区域的定位与理解。传统方案往往依赖更复杂的硬件阵列或机械扫描来提升三维成像质量,但这不可避免地增加了成本、设备体积和扫描时间。另一方面,如果算法侧的重建过程过于缓慢,同样难以集成到“成像-理解-规划-执行”的实时闭环中。
GaussianPile提供了一条极具吸引力的技术路径。它可以在不改变底层成像硬件的前提下,将采集到的切片数据转换为紧凑、连续、可实时渲染的三维高斯表示。这一表示既可用于快速浏览和高效压缩存储,也能为后续的体素化评估、三维分割乃至未来的可变形组织建模提供强有力的支持。
总结
GaussianPile试图解答一个典型的交叉领域问题:3DGS这种源于计算机图形学的高效三维表示,能否成功迁移至具有明确物理约束的切片式容积成像中?答案是肯定的,但绝非简单移植。其成功的关键,在于将真实成像系统中的有限切片厚度与焦深效应,巧妙地整合至高斯前向投影的物理模型,使得新表示不仅能精确拟合二维切片图像,更能确保三维内部结构的物理一致性。
从实验结果看,GaussianPile在重建质量、训练速度和压缩率之间取得了出色的平衡。更重要的是,它实现了一种范式转换——将离散的体素网格转化为一种连续、稀疏、可交互的高斯基元集合。这为医学影像压缩、科学数据可视化,以及手术机器人等场景下的实时三维环境感知,开辟了一条新的技术路径。






