稀疏建模医疗AI方案推荐:快速节能可解释
在人工智能领域,谈及高效与可解释性,树模型或规则引擎常被优先提及。但日本企业HACARUS另辟蹊径,深耕稀疏建模(Sparse Modeling, SM)——这项源自2000年前后大学实验室的技术,直到2014年HACARUS在京都创立,才真正迈入商业化轨道。稀疏建模的独特价值在于:它能够从极有限的数据中精确提取关键特征,同时输出高度可解释的结果。在深度学习主导的今天,坚持并商业化这样一套“轻量级”方法,确实需要精准的战略眼光与扎实的技术根基。
HACARUS 首席执行官兼创始人 Kenshin Fujiwara 直言:“相比其他 AI 技术,稀疏建模的优势一目了然。我们的核心能力在于处理超小数据集,并交付可追溯的‘白盒’结果,而非深度学习的‘黑盒’输出。”更关键的是,SM 在速度与能效方面的表现同样令人惊叹。在一次客户对比测试中,SM 模型的训练速度比深度学习模型快五倍,而能耗仅为后者的 1%(图 1)。
**图 1 | 稀疏建模 AI 与深度学习 AI 的能耗对比。** 测试表明,在达到相同准确度水平时,稀疏建模的能耗仅为传统深度学习平台的 1%。
表型药物发现:从 40 分钟到 1 分钟的效率跃升
表型药物发现(PDD)正获得越来越多的关注,原因在于它可以在不完全了解疾病机制的前提下筛选新药,从而有潜力实现“首创药物”并提升临床可预测性。然而,这类研究通常伴随着庞大且嘈杂的数据集。HACARUS 的一家制药客户最初考虑采用深度学习来提升命中化合物的筛选效率。深度学习确实能缩短图像分析时间,但问题也随之暴露:针对每种化合物,必须单独构建判别模型,单个化合物就需要 20–40 分钟。更棘手的是,深度学习的“黑箱”特性让研究人员无法了解哪些因素影响了命中化合物的判定。
HACARUS 的稀疏建模系统则截然不同。它不仅能检测命中化合物,还能同步识别影响因子。具体实现是:仅利用对照特征训练异常检测模型,从而让一个通用模型适用于多种化合物,处理时间从每个化合物最多 40 分钟直接缩减至不到一分钟。
如何解决“无法确定影响因素”的问题?HACARUS 在两组对照数据之间引入了 Kullback-Leibler (KL) 散度法与稀疏结构学习。KL 方法定位特征值变化,稀疏结构学习则进一步揭示特征间相关性的变化。通过这些手段,研究人员现在可以精确量化每个特征值对最终结果的贡献度。客户对结果高度认可,不仅验证了最初假设,还希望借助 HACARUS 持续优化模型性能。Fujiwara 总结道:“仅依靠对照数据完成分析,这本身就是一项独特的方法。更可贵的是,我们现在能精准定位影响结果的特征值。未来,我们期待利用患者 iPSC(诱导性多能干细胞)筛查疾病类型与基因多态性等多种状况。这项技术有望在高精度医疗应用中发挥关键作用。”
不止于药物发现:医疗领域的多点布局
HACARUS 的稀疏建模技术已在多个医疗场景落地,合作对象涵盖多家知名机构(见方框1)。
- AI 脑梗塞诊断:与大原制药及一家顶尖医科大学合作,将专家知识数字化,让缺乏脑梗塞专科医师的医院也能快速完成诊断。
- 肝癌诊断支持:与神户大学联合开发诊断工具,旨在利用 AI 在 MRI 图像中识别风险区域,并进行肝细胞癌(HCC)的疾病类型分类,最终形成精准诊断辅助系统。
- 心电图(ECG)异常检测:两个并行项目同步推进——与德国 ITK Engineering(博世子公司)合作开发人体 ECG 信号异常监测系统;与 DS Pharma Animal Health 合作研发基于感应片的非侵入式动物心电图测量工具,可站在动物爪子上捕获关键心脏数据。
- 基因组分析:协助完成 DNA 序列、结构变异、基因表达等基因组特征的识别、测量与比较。
方框 1 | 与 HACARUS 的合作项目:AI + 稀疏建模的实战案例AI 支持的脑梗塞诊断辅助
脑梗塞诊断需要高度专业的 MRI 图像判读技术,但许多医院虽有设备却缺乏专家。HACARUS 与 Ohara Pharmaceutical 及一家领先医科大学合作,将专家知识数字化,开发 AI 辅助的急性脑梗塞诊断系统。患者数据和 MRI 图像被输入模型,帮助无专科医师的医院快速、准确地做出诊断。
肝癌诊断支持工具的联合研究
肝癌诊断需求不断攀升,但专业判读人员严重短缺。HACARUS 与神户大学合作,目标包括:
- 使用 AI 进行监督学习,检测 MRI 图像中的风险区域;
- 在风险区域进行 HCC 疾病类型分类;
- 构建准确的 AI 分类与诊断支持系统。
基于 SM 的心电图信号异常检测
ITK Engineering(博世子公司)与 HACARUS 联合开发个性化患者监测系统的概念验证。该系统不仅能近乎实时评估单个人心电图的异常情况,还能立即与预期的正常心电图曲线进行对比。
动物心电图测量与分析工具
与 DS Pharma Animal Health 合作,为兽医诊所开发非侵入式动物心电图测量工具,可在动物站立时从爪子中捕获心脏数据。
可持续技术:低能耗才是未来
随着全球对零碳排放目标的追求,深度学习的高能耗问题正成为医疗机构的隐忧。除了数据处理本身的高耗电,计算机硬件还需持续冷却以应对散热。马萨诸塞大学的一项研究显示,训练几个大型 AI 模型的生命周期排放量,几乎是美国普通汽车(含制造)一生排放量的五倍。Fujiwara 还引用了一项大学研究:如果全球所有行业都大规模部署深度学习,需要额外建设 100 多座核电站才能满足电力需求。
HACARUS 的 SM 系统与传统深度学习的对比测试印证了这一点。两个模型均使用 1,000 张图像的数据集进行预测,精度相当,但 SM 系统在标准 x86 系统(Intel Core i5-3470S + 16GB RAM)上的训练速度快了五倍,而深度学习模型则需工业级开发平台(如基于 Nvidia DEVBOX)。最终,SM 方法仅消耗了深度学习 1% 的能量,就达到了相同的准确度(图 2)。
**图 2 | 稀疏建模与传统深度学习的基本概念对比。** SM 所需训练数据更少、学习速度更快、能耗更低,且能在普通计算硬件上运行。
HACARUS 的理念是“AI 应该高效而简单”。其轻量级的 SM 方案不仅易于向最终用户解释,还能将 AI 引入嵌入式低功耗应用,与本地设备(即“边缘 AI”)无缝结合。与 DS Pharma Animal Health 的合作项目就是一个典型——将 AI 功能带到边缘站点,在本地实时分析动物的心电图数据,而非依赖云端计算。
与三菱电机的跨界合作:机器人 + AI 的自动化实验
HACARUS 与三菱电机在细胞分析领域建立了新的合作,将 SM 驱动的医学成像分析能力与三菱的先进工业机器人结合。Fujiwara 介绍:“合作的重点是实现细胞分析实验室工作的自动化。”该解决方案分为三个阶段:首先,机器人准备并运输细胞样本;接着,通过由 HACARUS AI 驱动的数字显微镜进行检查;最后,机械臂自动将处理过的样本移出,并进入下一轮作业。该系统大幅提升了细胞处理量,减少了人为错误和对人力资源的依赖,同时也满足了新冠疫情引发的远程工作需求。
2020:成长与认可的一年
稀疏建模作为一项前沿技术,让 AI 在提供快速、可解释结果的同时,保持低能耗与高集成度。经过 2020 年的积累,HACARUS 显然已准备好向全球市场进发。公司员工数量大幅增长,完成了 B 轮融资(累计筹集 13 亿日元,约合 1200 万美元),并在东京剑桥创新中心设立了新的研发中心。同时,HACARUS 也收获了多项荣誉——包括 CB Insights 评选的“AI 100:重新定义行业的人工智能初创公司”,以及 inVISION 2020 年创新奖(仅 10 家创新公司入选)。从这些成绩来看,稀疏建模这条路,走得远比预期更坚实。
