船用柴油机热力学仿真:可解释故障诊断方法全面对比
论文题目:
Thermodynamic Simulation-assisted Random Forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines
原文出处(ScienceDirect)
作者开源资源(包含代码与数据集)
一、高可靠性系统为何需要透明决策
轨道交通、船舶航行等高安全等级工业场景,系统复杂度持续攀升。操作人员难以信任一个缺乏物理机理支撑的“黑箱”诊断输出——尤其当该结果缺少热力学或工程依据时。船用柴油机作为核心动力装置,可靠性设计裕度极高,运行期间重大故障样本极为稀缺。传统方法在融合实测数据与物理模型方面存在明显短板,且难以解释特征选择与决策逻辑。2025年《Measurement》期刊发表的一项工作,提出热力学仿真辅助随机森林(ThermoRF)方法,旨在突破故障样本稀缺与模型可解释性之间的矛盾,为复杂系统的智能运维提供一条可行路径。
二、ThermoRF架构:物理模型与数据驱动协同
整个诊断框架可概括为“模型-数据协同”,包含四个核心阶段:
1. 热力学建模与模型校准
首先构建柴油机一维热力学模型,用于模拟多种故障工况并生成训练数据。借助实船航行数据进行模型校准,最终参数误差控制在5%以内,确保仿真环境的高保真度。下图展示该一维热力学模型的结构。
2. 高保真故障数据集构建
通过调节关键物理参数,仿真生成了气缸盖开裂(F1)、活塞烧蚀(F2)、缸套磨损(F3)、活塞环磨损(F4)及活塞环粘着(F5)五种典型故障模式。实际运维中此类故障数据极难获取,仿真手段有效弥补了这一缺口。下表详列各故障状态的参数配置与特征。
3. 基于SHAP值的特征选择
采用SHAP(Shapley Additive Explanations)值定量评估14个热力学参数的重要性,从中筛选出涡轮后排气温度(P14)、缸套壁热流(P05)等8个核心特征。精简后的特征子集显著提升了诊断效率与模型泛化能力。下图为基于SHAP值的特征筛选流程。
4. 智能故障分类与识别
将优化后的特征子集输入随机森林(RF)分类器。实验结果表明,RF平均分类准确率达到99.07%,显著优于KNN、SVM等对比算法。下图展示了KNN、SVM与RF的精度-召回率曲线对比。
三、双尺度可解释性故障诊断分析
该研究的关键贡献在于揭示了故障诊断决策的物理逻辑,从两个尺度提供了可解释性分析:
1. 局部尺度解释
利用瀑布图直观呈现模型对单个样本的决策路径。例如,通过识别窜气热流(P06)与质量流量(P07)的特定异常模式,可揭示模型依据热力学规律判定特定故障类型的机制。
2. 全局尺度解释
借助蜂群图、交互图及依赖图,从全局视角提炼核心影响指标。分析发现例如“窜气引起涡轮前排气压力(P11)下降”等深层物理关联,验证了数据驱动特征与内燃机热力学机理的一致性。
下图展示了基于SHAP值的双尺度故障分析结果:(a)瀑布图;(b)蜂群图;(c)交互图;(d)依赖图。
四、结论与展望
ThermoRF方法有效融合了物理建模与数据驱动的优势:不仅实现了高精度故障诊断,还通过双尺度可解释性分析为诊断结果提供了坚实的物理依据。这种可解释故障诊断范式对提升重大装备运维的安全性和科学决策水平具有重要价值。
原始文献
C. Luo, M. Zhao, X. Fu, S. Zhong, S. Fu, K. Zhang, X. Yu. Thermodynamic simulation-assisted random forest: Towards explainable fault diagnosis of combustion chamber components of marine diesel engines[J]. Measurement, 2025, 251: 117234.





