AutoML医疗模型精选：更小参数量实现更高分类准确率

2026-05-15阅读 0热度 0

AutoML

在医学这一对精确性要求严苛的领域，人工智能正从概念验证走向深度应用。核心挑战在于，如何让算法模型更智能、更高效地赋能精准诊疗，成为临床医生的可靠助手。

自动机器学习（AutoML）技术为此提供了新的路径。它通过自动化模型设计与超参数调优，将研究者从繁复的迭代工作中解放，已在多个行业验证了其效能。当这项技术应用于医学影像分析、疾病风险预测等场景时，其潜力正被逐步释放。

香港科技大学（广州）数据科学与分析学域正教授褚晓文及其团队，是这一交叉领域的早期探索者。他们的研究表明，通过驾驭复杂的医疗场景数据，AutoML能够有效辅助医生决策，推动计算机辅助诊断向更精准、更高效的方向演进，从而优化诊疗流程与医疗资源配置。

AutoML + 医学：从辅助诊断到效率革命

从疾病筛查、影像诊断到慢病管理，AI技术正在重塑医疗研究与实践的范式。其中，基于医学影像的AI辅助诊断，其覆盖的病种范围、诊断速度与判读准确性持续提升，成为关键技术突破口。

图注：褚晓文

褚晓文教授于1999年获清华大学计算机科学与技术系学士学位，2003年于香港科技大学计算机科学系获博士学位。2003年至2021年，他在香港浸会大学计算机科学系历任助理教授、副教授、正教授，现任香港科技大学（广州）数据科学与分析学域正教授。他的研究方向涵盖GPU计算、分布式机器学习、云计算与无线网络等，在国际期刊与会议上发表论文200余篇，谷歌学术H指数46，引用超7900次，并多次获得IEEE INFOCOM等顶级会议的最佳论文奖。

自2018年起，褚晓文团队便开始系统研究AutoML在医学场景的应用。2019年末新冠疫情爆发，暴露出传统诊断体系在效率与可及性上的瓶颈：核酸检测耗时且依赖特定试剂，而基于影像的人工诊断则对医生经验依赖度高，分析流程长，难以快速识别早期病变。

针对这一痛点，团队着手探索利用AutoML技术提升COVID-19影像诊断效率的可能性。随着公开的胸部X光与CT影像数据集陆续发布，褚晓文与博士研究生贺鑫以此为基础，构建了深度学习检测诊断模型，并对主流数据集与评估指标进行了系统性梳理。

在相关综述论文中，团队从模型任务与影像数据类型两个维度，系统梳理了当时的COVID-19检测诊断模型，并从骨干网络、数据集、影像模态等六个层面进行了深入比较与分析。

然而，一个现实困境是：人工设计的深度学习模型在不同数据集上表现波动大，缺乏一种通用性强、能自适应不同数据特性的网络架构。AutoML的价值正在于此——它能针对特定数据集自动搜索出高性能的网络模型，大幅降低人工试错与调参成本。

为提升基于权重共享的神经架构搜索的稳定性，团队提出了一种高效的进化多目标结构搜索框架。同时，针对医疗数据常面临的小样本、不均衡问题，他们创新性地提出了一个集成自动数据增强与自动网络搜索的联合优化框架。该框架在多个公开COVID-19数据集上均取得了领先的性能表现。

对话褚晓文：深入AutoML的医疗实践

为更深入理解AutoML在医疗领域的应用逻辑与核心挑战，我们与褚晓文教授进行了一次对话。

问：在COVID-19辅助诊断研究中，你们使用的是开源工具还是自研平台？目前预测效果如何，在哪种任务上表现更优？

褚晓文：我们基于微软亚洲研究院开发的NNI早期版本，搭建了自己的分布式AutoML框架，并重构了基础模块以提升复用性。后续研究都基于此框架展开。

目前，我们主要在CT影像分类任务上进行了验证。实验结果显示，通过AutoML搜索到的模型，不仅参数量更小，分类准确率也优于许多流行的卷积神经网络。此前，英伟达团队利用AutoML在医疗影像分割任务上也取得了显著效果。

问：COVID-19传播快，意味着图像数据集需要不断扩充。团队如何应对数据动态增长，并提升模型泛化能力？

褚晓文：AutoML可视为超参优化、神经架构搜索和数据增强等技术的集成。我们目前的研究重点在神经架构搜索上，即针对特定任务自动搜索模型结构与超参数。

医疗数据涉及隐私，初期往往规模有限且存在类别不均衡问题。实际上，COVID-19数据集规模的扩大，反而有助于我们搜索到更优的模型。我们正在尝试将数据增强与神经架构搜索结合，以期获得更好的泛化性能。

问：面对医疗数据中的噪声和不一致性，如何保证算法的准确与高效？

褚晓文：我们前期工作基于3D CT数据集，其噪声表现为切片不含肺部、顺序错误或重复等。目前，这类问题主要通过人工方式进行修正。自动化数据清理本身是一个重要课题，但我们尚未展开相关研究。

对于数据不均衡，我们采用数据增强和调整采样频率的方法。而数据不一致性带来的启示是：数据集质量对识别精度的影响，有时甚至超过模型本身。很难找到一个“万能”的人工设计模型去适配所有数据集。因此，利用AutoML为特定来源的数据集（如同一医院、同一设备）定制模型，是一个极具潜力的方向。

问：系统部署的难度如何？面对大规模诊断需求，您此前在分布式机器学习（如联邦学习）上的研究是否带来了灵感？

褚晓文：由于缺乏与医疗机构的实际合作，模型尚未在真实场景中部署测试。但在公开数据集实验中，AutoML确实能搜索到更轻量、更准确的模型。

我们也研究过联邦学习在COVID-19诊断上的应用。模拟实验发现，数据质量较差的“孤岛”能从联邦学习中受益，但高质量的数据“孤岛”性能提升有限，甚至可能被拖累。这是一个非常有趣的现象，值得未来深入探索。

问：您的主要研究方向是什么？有哪些突出成果？

褚晓文：我目前主要聚焦于高性能机器学习系统。得益于在GPU与分布式计算领域的积累，我们团队较早关注大规模分布式机器学习，于2016年研发了早期开源深度学习基准测试系统DLBench，获得了学界与业界的关注。

随后，我们与企业合作研发了一系列原创分布式训练技术，并在2018年使用2048块GPU，在ImageNet数据集上实现了当时全球最快的图像分类训练速度。团队还在分布式机器学习通信优化方面提出了多种方法，相关成果发表在IEEE INFOCOM等顶级会议与期刊上，并获得了IEEE INFOCOM 2021最佳论文奖。

问：您从何时开始AutoML研究？经历了哪几个阶段？

褚晓文：2018年我们开始调研AutoML。其最吸引人的地方就在于“自动化”这一美好愿景，能将研究者从枯燥的调参中解放出来。

我们的研究大致经历了几个阶段：首先，通过调研数百篇文献，完成了一篇AutoML综述，它已成为国际期刊《Knowledge-Based Systems》近三年来引用和下载最高的论文之一，对普及AutoML起到了一定作用。其次，在神经架构搜索研究热潮中，我们在医学图像分类等任务上验证了其有效性。之后，我们开始更深入地探究模型结构对性能的本质影响，并从系统设计角度提升AutoML的效率和可扩展性。

问：医学场景是团队的第一选择吗？最初针对的是哪种疾病？

褚晓文：团队涉足医学场景始于2018年。当时，香港发生了一起与皮肤病相关的社会事件。我从媒体报道中了解到，香港公立医疗系统仅有30多位皮肤科专科医生，却要面对数万人的轮候名单。这让我深受触动，并开始思考能否用人工智能辅助皮肤病诊断。

我们随后从互联网收集了大量相关数据，也取得了一些初步成果。但由于图片版权限制，已整理的数据集无法公开，相关研究目前仍停留在学术层面。

问：当前医学场景对AutoML提出了哪些特殊要求？研究难点何在？

褚晓文：医学数据敏感且私密，获取大规模高质量数据集本身就很困难。同时，资深医生的标注成本极高。因此，如何在有限的数据上搜索出泛化能力强的模型，是一大挑战。

此外，还必须防范数据隐私泄露风险，例如模型逆向攻击可能还原原始数据。因此，如何利用AutoML搜索出既高效又安全的模型，是未来需要关注的方向。

问：AutoML在医学场景的应用，距离真正进入临床还有多远？

褚晓文：AutoML是一个快速发展的新兴技术，但其本质仍属于机器学习范畴，只是用新的优化方法和大量算力替代了部分人工工作。它本身并未缩短或拉长机器学习技术走向临床的距离。

AutoML包含多个流程，但目前大多数研究只聚焦于单个流程，如神经架构搜索或数据增强。因为当多个流程联合搜索时，搜索空间会呈指数级增长，如何在这个巨大空间中高效寻优，仍是严峻挑战。此外，厘清AI医疗器械相关的法律与伦理问题，也是一个紧迫且复杂的课题。

问：未来是否有计划将AutoML拓展到其他领域？

褚晓文：是的，团队已开始将AutoML技术应用于智能驾驶的感知环节。目标是搜索出同时满足高精度、实时推理要求，并能适应特定硬件约束的轻量化模型。

AutoML医疗模型精选：更小参数量实现更高分类准确率

AutoML + 医学：从辅助诊断到效率革命

对话褚晓文：深入AutoML的医疗实践

相关阅读

最新教程

最新资讯