中科院一区TOP期刊论文分享| 自主学习进化图神经网络驱动的软测量模型_ACT_System_Flux_非线性_燃烧

通过输入空间过参数化改进一维卷积神经网络的航空发动机轴间轴承故障诊断

本期给大家推荐的文章是《ISONet：通过输入空间过参数化改进一维卷积神经网络的航空发动机轴间轴承故障诊断》。本文提出了一种新型一维卷积神经网络变体——ISONet，旨在解决传统1DCNN在航空发动机系统轴间轴承故障诊断中性能不足的问题。作者写作思路清晰，实验丰富，结果分析详实且开源代码，小编建议阅读公众号简介推文后对全文仔细研究。开源代码: https://gitee.com/frontxiang/torch_isonet.git 论文基本信息8论文题目：ISONet: Reforming 1DCNN for aero-engine system inter-shaft bearing fault diagnosis via input spatial over-parameterization论文期刊：Expert Systems with Applications论文日期：2025年作者：Qian Xiang(a), Xiaodan Wang(b), Yafei Song(b), Lei Lei(c)机构： a:Laboratory of Intelligent Control, PLA Rocket Force University of Engineering, Xian, 710025, China b:College of Air and Missile Defense, Air Force Engineering University, Xi'an, 710051, Chinae c:College of information and Navigation, Air Force Engineering University, Xi'an, 710077, China 第一作者简介：向前，男，火箭军工程大学“装备智能应用”教育部重点实验室讲师，主要研究兴趣为深度学习在故障诊断中的应用。以第一作者在Pattern Recognition, Expert Systems with Applications等杂志发表学术论文13篇，其中SCI一区Top论文4篇。申请国家发明专利13项、软件著作权1项。参与国家自然科学基金项目3项、省级项目3项。Journal of Artificial Intelligence and Control Systems杂志青年编委（2025.04-2027.04）。IEEE transactions on cybernetics, Engineering applications of artificial intelligence, Applied Soft Computing, Neurocomputing, Measurement Science and Technology, Applied Intelligence等人工智能和工程领域SCI杂志审稿人。邮箱: qianxljp@126.com; ORCID: https://orcid.org/0000-0001-6810-8446 目录0 摘要 1 引言 2 ISONet模型架构 2.1 整体结构 2.2 1D-ISOConv层设计 3 理论分析：过参数化的隐式优化机制 3.1 关键定理与证明 3.2 理论意义 4 ISONet训练策略 5 实验验证 5.1 数据集与实验设置 5.2 关键实验结果与分析 5.2.1 超参数敏感性测试 5.2.2 优化器对比 5.2.3 激活函数选择 5.2.4 与SOTA模型对比 5.2.5 不同有限样本条件下分类效果 6 结论摘要本文提出了一种新型一维卷积神经网络(One-Dimensional Convolutional Neural Networks, 1DCNN）变体——ISONet，旨在解决传统1DCNN在航空发动机系统轴间轴承故障诊断中性能不足的问题。ISONet通过引入输入空间过参数化技术，在训练阶段卷积层的优化能力得到了提升，同时保持测试阶段的计算效率。理论分析表明，这种过参数化等效于从动态微分的角度隐式集成特定的预处理方案，显著提升了模型收敛速度和稳定性。实验采用真实航空发动机振动数据集验证，结果显示ISONet在有限样本条件下诊断准确率超过99%，优于当前主流深度学习模型（如LSTM、Transformer等）。该研究为复杂机械系统的故障诊断提供了一种高效且鲁棒的新方法。关键词：航空发动机系统；故障诊断；一维卷积神经网络；过参数化；预处理方案1 引言航空发动机是飞行安全的核心部件，其轴间轴承需在高转速、高温、高负载下工作，易发生内圈、外圈等故障。故障的早期精准诊断可避免重大事故，但传统方法依赖人工特征提取，难以适应复杂工况下的信号变化。现有方法的局限性包括如下三方面：传统信号处理（如傅里叶变换、稀疏表示）依赖专家经验，泛化能力差；深度学习方法（如CNN、LSTM）虽能自动提取特征，但标准1DCNN在复杂振动信号中收敛慢、小样本性能不足；改进模型（如多尺度卷积、注意力机制）虽提升性能，但结构复杂且缺乏理论解释。针对1DCNN优化不足的问题，提出通过输入空间过参数化增强模型训练能力，同时保持测试阶段的高效性，为工业诊断提供可解释、低成本的解决方案。2 ISONet模型架构2.1 整体结构图1 模型整体结构 ISONet由输入层、1D-ISOConv层（过参数化卷积）、批量归一化（Batch Normalization, BN）、Mish激活函数、池化层、展平层和Softmax分类器组成。核心创新在于1D-ISOConv层。2.2 1D-ISOConv层设计过参数化核：将标准卷积核分解为两个张量和，其中初始化为零矩阵叠加单位矩阵，采用Kaiming初始化。图2 卷积核的输入空间训练阶段过参数化策略：将标准卷积核分解为两个张量和，其组合形式为：其中，为过参数化核，为传统卷积核。初始化与训练机制：采用Kaiming正态分布初始化，与标准卷积一致；初始化为零矩阵叠加单位矩阵，零矩阵对应可训练参数，确保训练初期行为与标准卷积一致。训练时，的零矩阵部分通过梯度更新学习信号特征，单位矩阵部分保持固定，防止初始阶段参数剧烈波动。测试阶段：将和折叠为等效标准卷积核，确保计算效率。维度选择理由与优势: 选择输入通道（）和卷积核空间维度（）进行过参数化，而非输出通道。原因包括： 1.减少参数量：每个输出通道共享同一组，避免参数爆炸（若选择输出通道过参数化，参数量为，远超输入通道方案）。 2.矩阵运算友好：输入通道作为连续内存存储，便于高效矩阵乘法加速。3 理论分析：过参数化的隐式优化机制图3 将输入通道过参数化卷积的张量计算过程转化为矩阵计算过程动态微分方程视角分析：由于卷积运算是张量运算，无法从理论上对输入通道过参数化进行解释，因此本文按照图3的方式将卷积的张量操作转化为矩阵形式，通过矩阵运算和微分动力学证明，输入空间过参数化等效于隐式引入动量项和自适应学习率。3.1 关键定理与证明定理1（动态微分方程视角）：假设参数，其连续时间梯度下降动态满足：其中，为梯度在方向上的投影。动态调整学习率，实现自适应步长。第二项隐含动量效应，沿历史梯度方向加速收敛。定理2（离散时间更新规则）：通过离散化定理的微分方程，得到参数更新规则：该式表明，过参数化通过以下机制加速优化：1、自适应学习率：随参数范数增大而提升步长，增强远离初始点的探索能力。2、动量机制：投影项继承历史梯度方向，抑制震荡。3.2 理论意义预条件梯度下降：过参数化等价于对损失函数引入预条件矩阵，调整梯度方向以绕过鞍点。隐式正则化：单位矩阵初始化约束参数空间，避免过拟合。4 ISONet训练策略图4 ISONet训练和测试流程优化器：采用Adan优化器（Nesterov加速的Adan变体，TPAMI2024发表的优化器），结合动态学习率调整和梯度投影，过程如图4所示。损失函数：交叉熵损失，通过小批量随机梯度下降优化。5 实验验证5.1 数据集与实验设置HIT数据集：来源于哈尔滨工业大学航空发动机测试台包含2412组航空发动机振动信号，涵盖健康、内圈故障、外圈故障三种状态，采样频率25 kHz，数据划分按70%训练、30%测试。硬件环境：8块NVIDIA Tesla T4 GPU，PyTorch框架，固定超参数（学习率，批量大小32，训练200轮）。5.2 关键实验结果与分析5.2.1 超参数敏感性测试通道数与卷积核尺寸： ISONet在通道数和卷积核时达到最高准确率（98.92%），表明深层、大核结构更适应复杂振动模式。标准1DCNN在相同配置下准确率为98.55%，差距源于过参数化的隐式优化效应。批量大小影响：ISONet在时表现最优，过大（）导致梯度估计偏差，过小（）增加更新方差。表1 不同通道配置和批量大小的1DCNN和ISONet性能比较5.2.2 优化器对比通过与不同的训练方法对比，由论文图6可知，Adan训练器效果最优。论文图7展示了在不同优化器下标准1DCNN与ISONet的对比实验，可知ISONet都优于标准1DCNN，证明了输入通道过参数化的通用性。另外，不同优化器都引入了一定加速机制，而输入通道过参数化在此基础上仍然可以进一步加速，说明其对于网络的加速机制具有不可替代性。图6 ISONet在不同优化器下的精度曲线:(a)训练精度曲线,(b)测试精度曲线图7 使用不同优化器的ISONet和1DCNN的损失曲线:(a)Adadelta,(b)Adamax,(c)AdaBelief,(d)CAME,(e)Adan。5.2.3 激活函数选择论文对比了不同激活函数对结果的影响，由论文表2可知，Mish在各个指标上综合来看效果最优。表2 不同激活函数的结果5.2.4 与SOTA模型对比由论文表3可知，ISONet分类效果优于主流模型，Transformer-C准确率仅70.56%，CA-1DCNN（通道注意力）准确率98.03%，弱于ISONet的99.92%，表明过参数化比注意力更有效。表3 比较SOTA模型在加权平均精确度、召回率和F1分数方面的性能图14 各种模型在PQS-FP坐标系中的定位作者引入参数量变化-拟合性能坐标系坐标系(Parameter Quantity Shifting-Fitting Performance coordinate system，PQS-FP）旨在解决传统模型评估中参数量与性能关系难以量化的问题。通过将模型的参数量作为横轴、拟合性能作为纵轴，该坐标系能够直观展示模型在增加复杂度时性能的变化趋势：若模型随参数量增加持续提升性能位于欠拟合衰减区(UAR, Underfitting Attenuation Region）则表明其尚未充分利用容量，适合进一步优化；反之，若性能停滞或下降位于过拟合加剧区(Overfitting Exacerbation Region, OER)，则需抑制冗余参数。例如，ISONet在UAR区呈现参数量与准确率的正向关联（从87%提升至99.9%），验证了过参数化技术通过隐式正则化平衡学习能力与泛化的有效性，而Transformer等模型因陷入OER区揭示了结构对小样本振动信号的不适应性。这一坐标系为模型设计提供了动态权衡参数效率与性能的理论工具，尤其在资源受限的工业场景中，可指导工程师避免盲目增加复杂度，实现高效诊断。5.2.5 不同有限样本条件下分类效果由论文表4可知，ISONet通过不同比列的训练集训练之后，在各个指标上绝大多数都优于其它方法，展现了较好的有限样本分类效果。表4 各种模型在不同训练样本量条件下的性能6 结论本文提出了一种提升1DCNN在航空发动机轴间轴承故障诊断中性能的新方法。所提出的ISONet架构通过引入输入空间过参数化，在诊断准确率上展现出显著提升，尤其在小样本条件下优势明显。这一进步归因于创新的1D-ISOConv层设计，其为模型引入了额外的可学习参数。通过矩阵和向量操作分析，本文阐明了输入空间过参数化的理论基础，为观察到的性能提升提供了坚实的理论支撑。1D-ISOConv层将张量操作转化为矩阵/向量操作，形成了一种特定的预处理方案，有效融合了动量和自适应学习率的优势。通过航空发动机试验台的真实振动数据验证，ISONet的性能优于现有深度学习模型。对比分析表明，即使在数据稀缺的挑战下，ISONet仍展现出强大的故障诊断鲁棒性，满足航空发动机维护和可靠性领域的关键需求。研究结果不仅丰富了神经网络优化的理论理解，还为提升航空发动机诊断系统的可靠性和性能提供了实用解决方案。ISONet的变革潜力标志着预测性维护领域的重要进展，对更广泛的工程诊断领域具有借鉴意义。编辑：曹希铭校核：李正平、陈凯歌、赵栓栓、赵学功、白亮、任超、Tina、陈宇航、海洋、陈莹洁、王金、赵诚、肖鑫鑫该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除来源：故障诊断与python学习

中科院一区TOP期刊论文分享| 自主学习进化图神经网络驱动的软测量模型

论文基本信息

目录

摘要

1 引言

2 方法理论

2.1 问题描述

2.2 SENGraph总体框架

2.3 自学习图生成模块

2.4 自主进化模块

2.5 节点感知模块

3 实验案例

3.1 案例一：发电过程

3.2 案例二：造纸过程

3.3 案例三：烧结过程

结论

通过输入空间过参数化改进一维卷积神经网络的航空发动机轴间轴承故障诊断