论文题目:ISONet: Reforming 1DCNN for aero-engine system inter-shaft bearing fault diagnosis via input spatial over-parameterization
论文期刊:Expert Systems with Applications
论文日期:2025年
作者:
Qian Xiang(a), Xiaodan Wang(b), Yafei Song(b), Lei Lei(c)
本文提出了一种新型一维卷积神经网络(One-Dimensional Convolutional Neural Networks, 1DCNN)变体——ISONet,旨在解决传统1DCNN在航空发动机系统轴间轴承故障诊断中性能不足的问题。ISONet通过引入输入空间过参数化技术,在训练阶段卷积层的优化能力得到了提升,同时保持测试阶段的计算效率。理论分析表明,这种过参数化等效于从动态微分的角度隐式集成特定的预处理方案,显著提升了模型收敛速度和稳定性。实验采用真实航空发动机振动数据集验证,结果显示ISONet在有限样本条件下诊断准确率超过99%,优于当前主流深度学习模型(如LSTM、Transformer等)。该研究为复杂机械系统的故障诊断提供了一种高效且鲁棒的新方法。
关键词:航空发动机系统;故障诊断;一维卷积神经网络;过参数化;预处理方案
航空发动机是飞行安全的核心部件,其轴间轴承需在高转速、高温、高负载下工作,易发生内圈、外圈等故障。故障的早期精准诊断可避免重大事故,但传统方法依赖人工特征提取,难以适应复杂工况下的信号变化。现有方法的局限性包括如下三方面:传统信号处理(如傅里叶变换、稀疏表示)依赖专家经验,泛化能力差;深度学习方法(如CNN、LSTM)虽能自动提取特征,但标准1DCNN在复杂振动信号中收敛慢、小样本性能不足;改进模型(如多尺度卷积、注意力机制)虽提升性能,但结构复杂且缺乏理论解释。 针对1DCNN优化不足的问题,提出通过输入空间过参数化增强模型训练能力,同时保持测试阶段的高效性,为工业诊断提供可解释、低成本的解决方案。
图1 模型整体结构
ISONet由输入层、1D-ISOConv层(过参数化卷积)、批量归一化(Batch Normalization, BN)、Mish激活函数、池化层、展平层和Softmax分类器组成。核心创新在于1D-ISOConv层。
过参数化核:将标准卷积核分解为两个张量 和 ,其中 初始化为零矩阵叠加单位矩阵, 采用Kaiming初始化。
图2 卷积核的输入空间
训练阶段过参数化策略:将标准卷积核分解为两个张量 和 ,其组合形式为:
其中, 为过参数化核, 为传统卷积核。
初始化与训练机制: 采用Kaiming正态分布初始化,与标准卷积一致; 初始化为零矩阵叠加单位矩阵,零矩阵对应可训练参数,确保训练初期行为与标准卷积一致。训练时, 的零矩阵部分通过梯度更新学习信号特征,单位矩阵部分保持固定,防止初始阶段参数剧烈波动。
测试阶段:将 和 折叠为等效标准卷积核,确保计算效率。
维度选择理由与优势: 选择输入通道( )和卷积核空间维度( )进行过参数化,而非输出通道。原因包括: 1.减少参数量:每个输出通道共享同一组 ,避免参数爆炸(若选择输出通道过参数化,参数量为 ,远超输入通道方案)。 2.矩阵运算友好:输入通道作为连续内存存储,便于高效矩阵乘法加速。
图3 将输入通道过参数化卷积的张量计算过程转化为矩阵计算过程
动态微分方程视角分析:由于卷积运算是张量运算,无法从理论上对输入通道过参数化进行解释,因此本文按照图3的方式将卷积的张量操作转化为矩阵形式,通过矩阵运算和微分动力学证明,输入空间过参数化等效于隐式引入动量项和自适应学习率。
定理1(动态微分方程视角):假设参数 ,其连续时间梯度下降动态满足:
其中, 为梯度在 方向上的投影。 动态调整学习率,实现自适应步长。第二项隐含动量效应,沿历史梯度方向加速收敛。
定理2(离散时间更新规则):通过离散化定理的微分方程,得到参数更新规则:
该式表明,过参数化通过以下机制加速优化:
1、自适应学习率: 随参数范数增大而提升步长,增强远离初始点的探索能力。
2、动量机制:投影项 继承历史梯度方向,抑制震荡。
预条件梯度下降:过参数化等价于对损失函数引入预条件矩阵 ,调整梯度方向以绕过鞍点。
隐式正则化:单位矩阵初始化约束参数空间,避免过拟合。
图4 ISONet训练和测试流程
优化器:采用Adan优化器(Nesterov加速的Adan变体,TPAMI2024发表的优化器),结合动态学习率调整和梯度投影,过程如图4所示。
损失函数:交叉熵损失,通过小批量随机梯度下降优化。
HIT数据集:来源于哈尔滨工业大学航空发动机测试台包含2412组航空发动机振动信号,涵盖健康、内圈故障、外圈故障三种状态,采样频率25 kHz,数据划分按70%训练、30%测试。
硬件环境:8块NVIDIA Tesla T4 GPU,PyTorch框架,固定超参数(学习率 ,批量大小32,训练200轮)。
通道数与卷积核尺寸: ISONet在通道数 和卷积核 时达到最高准确率(98.92%),表明深层、大核结构更适应复杂振动模式。标准1DCNN在相同配置下准确率为98.55%,差距源于过参数化的隐式优化效应。 批量大小影响:ISONet在 时表现最优,过大( )导致梯度估计偏差,过小( )增加更新方差。
表1 不同通道配置和批量大小的1DCNN和ISONet性能比较
图6 ISONet在不同优化器下的精度曲线:(a)训练精度曲线,(b)测试精度曲线
图7 使用不同优化器的ISONet和1DCNN的损失曲线:(a)Adadelta,(b)Adamax,(c)AdaBelief,(d)CAME,(e)Adan。
表2 不同激活函数的结果
由论文表3可知,ISONet分类效果优于主流模型,Transformer-C准确率仅70.56%,CA-1DCNN(通道注意力)准确率98.03%,弱于ISONet的99.92%,表明过参数化比注意力更有效。
表3 比较SOTA模型在加权平均精确度、召回率和F1分数方面的性能
图14 各种模型在PQS-FP坐标系中的定位
作者引入参数量变化-拟合性能坐标系坐标系(Parameter Quantity Shifting-Fitting Performance coordinate system,PQS-FP)旨在解决传统模型评估中参数量与性能关系难以量化的问题。通过将模型的参数量作为横轴、拟合性能作为纵轴,该坐标系能够直观展示模型在增加复杂度时性能的变化趋势:若模型随参数量增加持续提升性能位于欠拟合衰减区(UAR, Underfitting Attenuation Region)则表明其尚未充分利用容量,适合进一步优化;反之,若性能停滞或下降位于过拟合加剧区(Overfitting Exacerbation Region, OER),则需抑制冗余参数。例如,ISONet在UAR区呈现参数量与准确率的正向关联(从87%提升至99.9%),验证了过参数化技术通过隐式正则化平衡学习能力与泛化的有效性,而Transformer等模型因陷入OER区揭示了结构对小样本振动信号的不适应性。这一坐标系为模型设计提供了动态权衡参数效率与性能的理论工具,尤其在资源受限的工业场景中,可指导工程师避免盲目增加复杂度,实现高效诊断。
表4 各种模型在不同训练样本量条件下的性能
本文提出了一种提升1DCNN在航空发动机轴间轴承故障诊断中性能的新方法。所提出的ISONet架构通过引入输入空间过参数化,在诊断准确率上展现出显著提升,尤其在小样本条件下优势明显。这一进步归因于创新的1D-ISOConv层设计,其为模型引入了额外的可学习参数。通过矩阵和向量操作分析,本文阐明了输入空间过参数化的理论基础,为观察到的性能提升提供了坚实的理论支撑。1D-ISOConv层将张量操作转化为矩阵/向量操作,形成了一种特定的预处理方案,有效融合了动量和自适应学习率的优势。通过航空发动机试验台的真实振动数据验证,ISONet的性能优于现有深度学习模型。对比分析表明,即使在数据稀缺的挑战下,ISONet仍展现出强大的故障诊断鲁棒性,满足航空发动机维护和可靠性领域的关键需求。研究结果不仅丰富了神经网络优化的理论理解,还为提升航空发动机诊断系统的可靠性和性能提供了实用解决方案。ISONet的变革潜力标志着预测性维护领域的重要进展,对更广泛的工程诊断领域具有借鉴意义。
编辑:曹希铭
校核:李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫
该文资料搜集自网络,仅用作学术分享,不做商业用途,若侵权,后台联系小编进行删除