从航空发动机到通用时序分析：ITFormer首次系统化定义复杂时序问答

1天前浏览3

ICML 2025 | 上海交通大学×上海创智学院×复旦大学联合出品

时序数据分析在工业监控、医疗诊断等领域至关重要。然而，现有研究多聚焦于分类、预测等单一任务，与实际工业场景中专家通过自然语言进行复杂交互和决策的需求存在显著差异。上海交通大学航空航天学院李元祥教授团队以航空发动机运维为背景，首次系统性地提出并解决了复杂时序问答（Time-Series QA）问题，为时序数据建模和应用提供了新的思路。

核心贡献

1.结合工业场景，系统化定义复杂时序问答

本研究深入航空发动机维护这一复杂工业场景，将专家诊断过程抽象为”理解、感知、推理、决策”四个认知层次，并首次系统性地定义为”时序问答”任务范式。

2.构建首个工业级、认知层次化时序问答数据集

基于NASA航空发动机数据，构建了包含11万余问答对的EngineMT-QA数据集。该数据集的任务设计紧密贴合专家的认知流程，为评估模型在真实工业场景下的推理能力提供了首个标准化基准。

3.提出ITFormer：高效、可迁移的时序-语言桥接架构

ITFormer以模块化设计实现了时序数据与大语言模型的高效融合，仅需训练不足1%的额外参数，便可在通用时序问答数据集上表现出优越的性能和良好的迁移能力。

研究动机与挑战

工业应用需求

在航空发动机监控等复杂工业场景中，工程师需分析海量多通道传感器数据，以判断设备状态并制定维护决策。传统方法依赖专家经验，效率有限且难以处理大规模数据。更重要的是，知识的传递与协同主要依靠自然语言，而现有分析工具普遍缺乏与语言的有效交互能力。

技术难点

1.高维数据的语义提取：单个时序样本可包含数万个数值（如32通道×600时间步），如何从中提取出有效的语义特征是首要难题。

2.抽象语义的对齐建模：时序信号的模式变化（如缓慢上升、突然波动）与物理系统的状态转换（如设备老化、突发故障）之间的对应关系高度抽象，难以直接建模。

3.多尺度时间依赖的处理：时序数据中的关键信息可能分布在不同的时间尺度上，模型必须具备处理多尺度依赖的能力。

ITFormer架构与关键模块

ITFormer的设计思想是作为一个轻量级的”桥梁”，在冻结预训练时序编码器和大型语言模型（LLM）的前提下，实现两者的高效对齐与融合。

时间令牌位置编码（TPE）

为精确表征多维时序数据的结构，TPE在三个层次上进行位置编码：时间步（Temporal Steps）、通道（Channels）和时序片段（Segments），确保模型能区分不同时间点、不同传感器以及不同数据段的语义信息。

可学习指令令牌（LIT）

为了让模型理解具体的任务指令，LIT在文本查询前添加了一组可学习的令牌。这些令牌通过自注意力机制，能够从自然语言查询中自动捕获并浓缩任务相关的语义信息，从而指导后续的跨模态融合。

指令时间注意力（ITA）

作为ITFormer的核心创新，ITA通过一个高效的两阶段过程实现跨模态对齐： 1. 通道指令融合（Channel Instruct Fusing）：根据LIT提供的任务指令，动态地对每个时间步上的多通道特征进行加权聚合，筛选出与任务最相关的传感器信息。 2. 时间指令注意力（Time Instruct Attention）：在上一步的基础上，再次根据任务指令，在时间维度上进行注意力加权，聚合最关键的时间片段信息。

这一设计显著提升了计算效率，同时保证了对齐的精确性。

时间令牌即语言（TAL）

该策略将ITA融合后的时序特征向量直接视为语言令牌，并替换掉文本查询中预设的占位符。这使得时序信息能以一种与语言模型兼容的方式，无缝嵌入到LLM的输入序列中，从而实现端到端的建模。

EngineMT-QA数据集设计

EngineMT-QA基于真实的工业应用场景设计，其任务层次反映了专家处理时序数据的认知过程。

任务类型	认知层次	典型场景	查询示例
理解	基础感知	信号模式解释	“燃油流量变化趋势说明了什么？”
感知	状态评估	设备健康判断	“低压压气机是否存在异常？”
推理	趋势预测	前瞻性分析	“未来5个周期故障概率如何？”
决策	行动规划	维护策略制定	“应该预防性维护还是继续监控？”

·数据规模：包含超过11万对高质量问答数据，源于NASA N-CMAPSS标准数据集。

·数据维度：覆盖32个传感器通道，每个样本包含600个时间步。

·质量保证：所有数据均经过领域专家的交叉审核，确保技术准确性。

Task Sample

实验结果与分析

1. EngineMT-QA数据集上的性能对比

在EngineMT-QA数据集上，ITFormer的性能全面超越了包括主流多模态API（ChatGPT-4o, Gemini）和专用时序-文本模型（Time-LLM, AutoTime）在内的所有基线。尤其在需要深度分析的”推理”和”决策”任务上，F1分数和BLEU得分的显著领先，证明了ITFormer对复杂时序-语言关系具备强大的建模能力。

2. ITFormer模块有效性验证：消融实验

消融实验结果量化了ITFormer各核心组件的贡献。实验表明：TPE（时间令牌位置编码） 对模型性能的提升最为关键，是模型理解多维时序结构的基础。同时，ITA（指令时间注意力） 与TPE的结合能够产生显著的协同效应。最终，包含全部组件的完整架构性能最佳，验证了ITFormer系统性设计的有效性。

3. 架构通用性：适配不同时序编码器与语言模型

ITFormer展现了卓越的”即插即用”特性。实验证明，它可无缝适配PatchTST、Informer、Crossformer等多种时序编码器，以及Qwen、LLaMA、GLM等不同规模和架构的大语言模型。此外，随着底层语言模型规模的提升，整体任务性能也随之稳步提高，表现出良好的可扩展性。

4. 跨域泛化与数据集价值

为验证模型与数据集的通用价值，研究团队在公开基准TimeSeriesExam上进行了测试。结果显示： 1. ITFormer方法的有效性：即便不经过预训练，ITFormer直接在TimeSeriesExam上训练，其性能已在多个任务上优于通用基线，证明了其架构设计的先进性。 2. EngineMT-QA数据集的价值：在使用EngineMT-QA进行预训练后，ITFormer的性能得到进一步的巨大提升，在全部五项任务上均达到SOTA水平，其中”因果分析”准确率高达0.83。

这充分说明，EngineMT-QA作为一个时序文本对数据集，能够为模型提供关于时序-文本关系的本质性知识，从而显著提升其在其他任务上的泛化能力。

5. 推理效率验证

效率测试表明，ITA机制相较于传统的跨模态注意力（cross-attention），在处理多通道、长序列数据时推理速度优势明显。同时，LIT模块也能有效降低长文本输入带来的计算开销。这些结果证明，ITFormer的架构设计兼顾了高性能与高效率，为大规模实时应用提供了可能。

总结与展望

本研究首次系统性地提出了复杂时序问答任务，并结合工业场景构建了大规模数据集，设计了高效、可迁移的ITFormer架构。实验结果充分验证了该框架在准确率、泛化能力和推理效率上的综合优势。

时序问答（Time-Series QA）这一新范式为时序分析领域带来了两个核心价值：

·在输入端，它允许通过自然语言灵活地融合领域知识与上下文信息，提升了分析的灵活性与精度。

·在输出端，它通过可交互、可解释的自然语言反馈，极大地降低了时序数据分析的使用门槛。

ITFormer及EngineMT-QA为时序AI社区提供了新的研究范式和宝贵资源，在工程和科学领域均具有广阔的应用前景。

研究机构

上海交通大学航空航天学院、上海创智学院、复旦大学数据科学学院

项目资源

·项目主页：https://pandalin98.github.io/itformer_site/

·论文仓库：https://github.com/Pandalin98/Awesome-Time-Series-QA-Papers

总结与展望：时序问答开启的新范式

这项研究不仅是时序分析领域的一次重要技术突破，更重要的是，它为时序AI研究社区提供了一个全新的视角。时序问答（Time-Series QA）这一范式有望从根本上改变我们与时序数据交互的方式：

1.在输入端，让知识融合更自然

传统的时序模型只能处理纯数值输入，无法利用人类的先验知识。而时序问答范式允许用户通过自然语言，将丰富的外部知识和上下文信息注入到分析过程中。

例如，工程师可以告诉模型：“忽略下午3点到3点10分的数据，期间在进行设备校准”，或者”重点关注振动和温度传感器的关联性，我们怀疑是轴承问题”。这种灵活的知识注入方式，能够显著提升模型在复杂场景下的分析精度和鲁棒性。

2.在输出端，让数据分析更普及

时序问答将复杂的模型输出转化为可理解的自然语言，极大地降低了时序数据分析的使用门槛。它使得非数据科学专家（如生产线经理、设备维护人员）也能通过对话的方式，与时序数据进行深度交互。

用户可以进行追问式探索：“昨天哪个设备的能耗最高？” -> “为什么它的能耗这么高？” -> “和上周同期相比情况如何？”。这种交互式的分析流程，让数据探索过程更符合人类的思维习惯，从而真正实现了数据分析的”平民化”。

ITFormer及其背后的时序问答范式，不仅仅是解决了一个具体的工业问题，更是为整个时序AI领域的发展，提供了一套富有想象力和实用价值的全新解决方案。

来源：故障诊断与python学习

综述 | 旋转机械智能故障诊断中的多传感器数据融合综述（上）

本期给大家推荐旋转机械智能故障诊断中的多传感器数据融合综述（上）。旋转机械的故障可能引发重大的经济损失和安全风险。因此，利用多传感器状态监测数据对其进行分析引起了广泛关注。然而，目前仍缺乏针对多传感器数据融合方法应用的全面综述文章。为填补这一空白，本文系统梳理并深入分析了应用多传感器数据融合技术诊断旋转机械故障的相关文献。首先，文章阐述了多传感器数据融合的基本概念，为后续讨论奠定理论基础。随后，重点分析了该融合技术在旋转机械智能故障诊断中的具体应用。此外，本文还明确指出当前该技术在实际应用中面临的关键挑战。通过剖析这些挑战，文章进一步提出了该领域未来有价值的研究方向。论文链接：通过点击本文左下角的阅读原文进行在线阅读及下载。论文基本信息论文题目：Multi-Sensor data fusion in intelligent fault diagnosis of rotating machines: A comprehensive review论文期刊：Measurement论文日期：2024年论文链接：https://doi.org/10.1016/j.measurement.2024.114658作者：Fasikaw Kibrete (a, b), Dereje Engida Woldemichael (a, b), Hailu Shimels Gebremedhen (a, b)机构：a: Department of Mechanical Engineering, College of Engineering, Addis Ababa Science and Technology University, P.O. Box 16417, Addis Ababa, Ethiopia；b: Artificial Intelligence and Robotic Center of Excellence, Addis Ababa Science and Technology University, P.O. Box 16417, Addis Ababa, Ethiopia；通讯作者邮箱: dereje.engida@aastu.edu.et目录1 摘要2 引言3 多传感器数据融合的基本概念4 用于旋转机械故障诊断的多传感器数据融合 4.1 数据级融合4.2 特征级融合4.3 决策级融合（以上标记章节为本文内容）4.4 多级融合5 观察、现有挑战和未来研究方向6 总结1 摘要旋转机械在多种工业中被广泛使用，其故障可能导致重大的经济损失和安全风险。因此，旋转机械的智能故障诊断，特别是通过利用多传感器状态监测数据，引起了越来越多的研究兴趣。然而，目前缺乏一篇专注于多传感器数据融合方法的全面综述。为了解决这一问题，本文对应用多传感器数据融合技术诊断旋转机械故障的现有文献进行了全面分析。首先提供了多传感器数据融合的基本概念，为后续讨论奠定了坚实的基础。然后，深入分析了多传感器数据融合在旋转机械智能诊断中的应用。此外，本综述论文强调了当前在多传感器数据融合用于旋转机械智能故障诊断中遇到的挑战。通过考虑这些挑战并整合来自各种来源的知识，本文提出了该领域未来的研究方向。这篇综述文章对于旋转机械智能故障诊断领域的研究人员、从业者和决策者来说是一个宝贵的资源。该综述全面洞察了多传感器数据融合技术的最新进展，并指导了测量科学领域的未来研究方向。关键词：状态监测，智能故障诊断，多传感器数据融合，旋转机械，传感器集成2 引言旋转机械是现代制造业运作不可或缺的部分。这些机器的可靠和高效运行对于保持生产力、提高安全性和最小化停机时间至关重要。旋转机械通常承受各种运行条件和应力，可能导致各种类型的机械故障，包括不平衡、不对中、轴承磨损和机械损伤[1]。任何此类故障都可能导致整个工业设备的意外停机、重大的经济损失，甚至潜在的健康和安全风险[2, 3]。因此，及时准确的故障诊断对于工业系统中旋转机械的可靠和高效运行至关重要。随着传感器和数据采集技术的巨大进步，基于数据驱动的方法，特别是基于人工智能（Artificial Intelligence, AI）的方法，已引起极大的兴趣。然而，先前在旋转机械智能故障诊断（Intelligent Fault Diagnosis, IFD）方面的研究主要依赖于单个传感器数据进行状态监测[4-7]。这种方法在覆盖范围和安装位置方面存在局限性，这使得捕捉大型旋转机械的全面信息变得具有挑战性[8]。单传感器数据可能导致漏检，并且易受外部干扰和噪声的影响[9]。此外，环境条件和运行变化会显著影响从单个传感器获得的测量结果，导致不准确的故障诊断结果。为了应对这些挑战，研究重点已转向基于多传感器数据融合的故障诊断[10-12]。通过集成多个传感器，可以捕获更广泛的故障信息，包括振动、温度、声学、电流和磨屑。多个传感器的集成使得冗余和互补的故障指标测量成为可能，这有助于更详尽地分析目标机器的状态。通过考虑多个数据源并解决单传感器方法的局限性，这种方法提高了故障诊断的准确性和可靠性。在过去的几十年里，研究人员为开发旋转机械IFD的多传感器数据融合方法做出了巨大努力。这些方法涉及在多个层级融合多个数据源的数据或相关信息[13]。多传感器数据融合在旋转机械故障诊断中具有若干优势。首先，通过融合多个相似传感器的数据，增强了诊断准确性，从而捕获了更广泛的信息。融合这些数据使得识别可能无法被单个传感器检测到的故障特征成为可能[14]。此外，多传感器数据融合通过减少噪声影响和最小化误报来提高故障分类性能。集成来自多个传感器的数据使得系统在区分不同故障类别和准确分类故障方面更加鲁棒和可靠。此外，多传感器数据融合能够提取更丰富的特征和模式，有助于实现更有效的故障诊断。通过考虑不同传感器测量值之间的相关性和相互作用，可以揭示隐藏的关系，从而为故障诊断算法或模型推导出更具信息量的特征。这提高了旋转机械故障诊断的准确性，并加深了对潜在故障机理的理解。在此之前，尽管针对旋转设备故障诊断的多传感器数据融合已开展大量研究，但专门聚焦该主题的综述文章却寥寥无几。例如，Gawde等[15]试图对多传感器数据在旋转机械故障诊断中的应用进行范围界定综述。同样，Guo等[16]专注于信息融合在轴承故障诊断中的应用。而Das等[17]则对旋转机械故障诊断的融合技术进行了综述。此外，一项研究[18]总结了用于诊断燃气轮机故障的多传感器数据融合方法。上述综述文章共同强调了利用多传感器数据融合进行旋转机械IFD日益增长的兴趣。然而，据我们所知，目前缺乏一个包含旋转机械IFD多传感器数据融合最新研究成果的全面综述。先前的综述也很少涵盖未来几年预期的发展趋势。因此，迫切需要一篇既涵盖该领域当前研究进展又涵盖未来趋势的全面综述。因此，本综述文章致力于对旋转机械IFD中多传感器数据融合的最新研究进展进行全面综述。通过解决表1中提出的研究问题，本研究旨在提供对该领域所取得进展的见解，并确定潜在的未来方向。通过深入研究文献，本综述工作旨在促进对该研究领域的理解，并为进一步的研究工作和实际应用提供有价值的指导。表1 本综述旨在解答的研究问题为了回答这些综述问题，作者遵循PRISMA指南[19]，对旋转机械IFD中多传感器数据融合的相关研究进行了批判性分析。文献检索在Scopus索引数据库中进行，采用以下查询字符串：（multi-sensor data fusion 或 data fusion 或 information fusion 或 sensor integration) 和 (fault diagnosis 或 fault classification 或 fault detection) 和(rotating machine 或 rotating equipment 或 bearing 或 turbine 或 gear 或 motor 或 pump 或 engine）。由于生成的文献数量庞大且丰富，审阅所有文献是不切实际的，一些论文不可避免地会被遗漏。因此，建立了以下纳入标准来选择最合适的文章：（i）出版年份：2012年至2023年；（ii）学科领域：工程或计算机科学；（iii）语言：英语；（iv）文章类型：期刊文章、综述、会议论文或书籍章节。还采用了一些排除标准来排除不需要的出版物：（i）出版阶段：正在印刷的文章；（ii）来源类型：行业期刊或丛书；（iii）仅发表摘要。为了确保综述的质量和相关性，缺乏关于旋转机械IFD中多传感器数据融合的足够信息的文件以及重复项被排除在分析之外。此外，我们还人工核对了每份文献的参考文献，以寻找研究领域内的相关文献。文献筛选流程如图1所示。最终共有146份符合筛选标准的文献被用于整合撰写本综述报告。图1 文献筛选流程示意图，其中N代表每个阶段的文献数量第3节概述了多传感器数据融合的基本概念。第4节深入综述了多传感器数据融合在旋转机械故障诊断中的应用。第5节介绍了研究过程中观察到的结果，指出当前研究中遇到的主要挑战，并强调了未来的研究方向。最后，第6节以总结性评论结束这篇全面的综述文章。 3 多传感器数据融合的基本概念多传感器数据融合的概念，属于多源数据融合[20]的范畴，出现于20世纪80年代中期，最初是为军事应用设计的[21, 22]。如今，多传感器数据融合已引起广泛关注，并成为跨不同应用领域的跨学科研究领域。多传感器数据融合指的是整合和组合来自多个传感器的信息，以获得比使用单个传感器更全面和可靠的洞察的过程[23]。多传感器数据融合的基本概念包括传感器集成、数据预处理、特征提取和融合算法。传感器集成是多传感器数据融合的一个基本概念。它涉及同时使用不同类型的传感器，每个传感器提供关于目标系统的独特信息。通过整合来自多个传感器的数据，可以获得对系统更全面的理解，从而在各种应用中提高准确性和可靠性。数据预处理是多传感器数据融合的另一个关键概念。它涉及通过清洗、滤波和归一化技术来准备传感器数据以进行融合。此步骤旨在去除传感器数据中的噪声、异常值和不一致性，确保融合数据准确表示底层系统特性。此外，特征提取在多传感器数据融合中起着至关重要的作用。它涉及从预处理后的传感器数据中提取相关特征，这些特征捕获了关于系统的重要信息。这些特征作为融合算法的信息输入，辅助决策和模式识别任务。多传感器数据融合的最终概念是融合算法本身。融合算法在多个层级上进行，包括数据级（或传感器级）、特征级和决策级融合[24-26]。图2说明了不同层级的数据融合。图2 不同层级数据融合的说明[27] 数据级融合是最低级别的数据融合，其中来自多个传感器的原始同质数据被直接整合以创建统一的原始数据。此融合过程之后是后续步骤，例如从整合数据中提取特征和进行决策。数据级融合策略的主要优点是能够充分利用源数据并减少信息损失[28]。与更高级别的融合方法相比，该策略需要的专家知识更少，并且保留了更多的信息，使其能够实现更好的性能。常见的数据级融合方法包括加权平均、选举决策、卡尔曼滤波器[29]、扩展卡尔曼滤波器[30]、基于机器学习的融合方案和基于深度学习的融合方案。这些技术旨在有意义地整合原始传感器数据，同时考虑传感器的可靠性、准确性以及与诊断任务的相关性等因素。尽管数据级融合具有优势，但它也带来某些挑战。处理大量的原始数据可能是繁重且计算密集的。这可能导致更长的处理时间和更高的计算负担。由于处理大型数据集的要求很高，实时性能在数据级融合中可能尤其难以实现。此外，在数据级融合不同类型传感器的数据可能很困难，因为每个传感器可能具有其独特的特性、测量单位和数据格式。在这种情况下，建立一个一致的融合框架变得具有挑战性。此外，数据级融合假设数据结构高度一致，这在实际情况中可能并不总是可行或能得到保证的。特征级融合是一种融合过程，专注于从单个传感器获取的原始传感器数据中提取相关特征或特性，并将最佳特征融合作为输入传递给输出层。这种融合级别通过放宽传感器间数据需可通约的要求提供了灵活性。特征级融合旨在通过融合从不同传感器提取的特征来创建更高级别的共享表示。该融合级别通常采用各种技术，包括特征串联、特征选择、主成分分析[31]、独立成分分析[32]、典型相关分析[33]、线性判别分析[34]和基于深度学习的融合方法[35]。每种技术都有其优势并适用于特定应用。特征级融合的优点是相比于数据级融合信息损失更少。这一特性使得特征级融合在许多情况下非常实用，特别是在故障诊断中，因为准确且信息丰富的特征对于识别和表征故障至关重要[36]。然而，必须要考虑到与特征级融合相关的某些挑战。当融合不同的特征时，得到的特征向量可能具有很高的维度。这种高维表示可能导致计算资源需求增加，使得融合过程计算密集且耗时。此外，特征提取步骤可能引入冗余或噪声信息，导致信息丢失。决策级融合涉及统一来自多个传感器的决策或输出以做出最终决策或推断[37]。与其他层级的融合不同，决策级融合是通过整合各独立信息源在决策层面提供的数据，在更高的抽象级别上进行的。在该层级应用的各种融合技术，包括多数投票、加权投票、Dempster-Shafer（D-S）理论[38]、模糊逻辑[39]、贝叶斯决策理论[40]、神经网络[41]和基于机器学习的融合方法[42]。决策级融合的关键优势之一是其高度的灵活性。它允许根据应用的具体要求纳入不同的融合规则和算法。这种灵活性使融合过程能够适应不同的场景，并适应不同的传感器特性和数据源。决策级融合也表现出强大的抗干扰性能，因为它可以有效地处理不同传感器提供的冲突信息。通过整合来自多个传感器的决策，即使在某些传感器可能提供不一致或冲突的输出时，也能得出相对可靠的结论。然而，决策级融合存在某些局限性。它不允许分类器或决策系统同时训练所有数据，因为它基于个体传感器提供的决策或输出运行。如果决策系统无法访问完整的数据集，这可能导致性能次优。此外，决策级融合需要将传感器数据压缩为最终决策或推断，这可能导致高昂的处理成本。这种压缩过程可能涉及丢弃存在于原始或特征级数据中的某些详细信息，从而导致潜在的有价值信息的丢失。 4 用于旋转机械故障诊断的多传感器数据融合在本节中，我们综述了旋转机械故障诊断的多传感器数据融合方法的最新成果。故障诊断是一个关键过程，涉及基于传感数据识别和定位故障，从而能够采取适当的维护措施并防止工业系统中出现严重后果。探索多传感器数据融合的最新成果，以了解这些方法如何有助于旋转机械的有效故障诊断。4.1 数据级融合数据级融合，也称为传感器融合，涉及融合安装在旋转机械上的多个相同类型传感器收集的原始数据。原始数据被统一为单一数据集，从中提取具有代表性的故障特征。然后，这些特征被用作故障诊断算法或模型的输入。图3提供了故障诊断背景下数据级融合过程的可视化描述。图3 数据级融合方法（基于[28]绘制）在旋转机械的故障诊断中，已经开发并应用了多种数据级融合方法。一种常用的方法是加权平均融合，通过计算加权平均值来整合来自多个传感器的数据。例如，Xu等[43]进行的一项研究采用加权数据融合，利用多传感器振动数据来诊断轴承故障。同样，Zheng等[44]提出了一种新颖的加权证据数据融合框架，用于机械传动系统的故障诊断。该框架利用了从油液分析中获得的状态监测数据集。基于卡尔曼滤波器的融合方法也被用于故障诊断任务。例如，Gou等[45]采用免疫融合卡尔曼滤波器，通过整合来自多个传感器的数据来诊断航空发动机控制系统的故障。Kim等[46]提出了一种基于自适应卡尔曼滤波器的方法，利用振动传感器进行电机故障诊断。此外，扩展卡尔曼滤波器已被用于旋转机械故障诊断的多传感器数据融合。Lu等[47]开发了一种基于扩展卡尔曼滤波器的融合方法，用于燃气轮机的性能监测和故障诊断。该方法通过在数据级融合多个传感器的压力数据，提高了传感器系统中的故障识别准确性。这些融合方法，如加权平均融合、卡尔曼滤波器和扩展卡尔曼滤波器，有效地处理了故障诊断中的不确定性、噪声和非线性。它们在处理实际工况和提高旋转机械故障诊断性能方面发挥着至关重要的作用，从而能够更准确地进行故障诊断。近年来，基于机器学习的数据级融合方法在旋转机械故障诊断领域进行了诸多尝试。研究人员探索了各种方法来提高故障检测能力和准确性。例如，Min等[48]利用卷积神经网络（ConvolutionalNeuralNetwork,CNN）融合多个振动信号，有效地诊断了滚动轴承和齿轮箱的故障。该方法通过从融合数据中提取相关特征，增强了故障检测能力。类似地，Chen等[49]介绍了一种基于深度CNN的融合方法，利用振动信号识别行星齿轮箱的故障，提高了准确性。Huang等[50]开发了一种用于行星齿轮箱的诊断框架，该框架采用了多视图数据级信息融合方法。他们集成了注意力机制和CNN以实现准确分类。Yu等[51]提出了一种针对液压泵融合方法，该方法利用经验小波变换和方差贡献率来处理来自三个通道的原始振动信号。尽管振动信号经常用于旋转机械的故障诊断，但它们存在固有的缺陷，例如易受机械共振影响、外部噪声干扰、对传感器位置敏感以及设备成本高[52]。为了解决这些限制，电机电流信号分析已成为故障诊断的一种可行替代方案。在Guo等的一项研究[25]中，提出了一种数据融合框架，该框架结合了改进的循环谱协方差矩阵和电机电流信号分析，以提高旋转机械故障诊断的准确性。同样，Azamfar等[53]开发了一种用于齿轮箱故障诊断的数据级融合方法，该方法利用二维CNN通过集成来自多个电流传感器的数据来分类故障。他们研究中提出的故障诊断方法如图4所示。图4 提出的组合故障诊断方法[53] 此外，声发射分析作为一种监测各种旋转设备健康状况的方法受到了广泛关注[54,55]。这些研究证明了智能融合方法在提高旋转机械诊断性能方面的有效性。这些方法利用机器学习的能力来处理数据复杂性并自动提取相关特征。在旋转机械故障诊断中使用数据级融合带来了诸多优势，例如有效捕获故障特征、数据损失最小以及高可靠性。然而，这种方法也存在一些挑战。一个挑战是原始数据中存在冗余信息，这可能阻碍数据级融合方法充分利用多个传感器的互补性[56]。数据中的冗余可能导致融合过程效率低下，降低故障检测的准确性和有效性。另一个挑战是由融合过程导致的数据量显著增加。这需要使用能够处理大型数据集计算要求的高性能设备。处理和分析如此大量的数据需要强大的计算资源，这在成本和基础设施方面可能带来实际挑战。此外，现有的数据级融合方法通常只关注单一传感器信号类型，例如振动、电流或声发射信号。这种狭隘的聚焦限制了它们检测细微故障的能力，并将它们的适用性限制在特定的状态监测场景中[57]。在现实场景中，旋转机械可能具有不同的传感器模态，提供不同类型的信息。忽略这些不同传感器模态的融合限制了对机器健康状况的整体理解，并可能导致不完整的故障诊断。解决这些挑战需要开发先进的技术，以有效处理冗余信息、优化计算资源，并实现跨不同传感器模态的融合。鉴于当前状况，未来的研究应优先开发智能算法和方法，以有效地从多个传感器中提取相关信息，同时解决当前数据级融合方法的局限性。4.2 特征级融合在旋转机械的故障诊断中，特征级融合技术对于整合从单个传感器数据中提取的代表性特征，然后进行故障分类非常重要。融合的特征提供了对机器状况的更全面表示，这可以改善故障检测和识别。图5展示了旋转机械故障诊断中特征级融合的过程。图5 特征级融合方法（基于[28]绘制）在多传感器数据特征融合算法领域，研究人员开发了各种方法，大致可分为三种主要类型：基本特征融合、概率融合和AI融合方法[58]。基本特征融合技术利用简单的数学运算来整合来自不同传感器的特征。一种广泛使用的方法是加权平均，其中从每个传感器提取的特征乘以相应的权重然后进行融合[59, 60]。在这种方法中，权重可以基于专家知识分配或使用算法进行优化。其他基本融合方法包括特征串联（将来自不同传感器的特征整合成一个单一的特征向量）以及特征选择和特征排序技术[61]。这些方法为实现多传感器信息融合以进行故障诊断提供了实用途径。总体而言，这些基础融合方法实施相对简单，为实现多传感器信息融合以达成故障诊断目标提供了切实可行的解决方案。基于概率的融合技术已被广泛用于故障诊断领域，用来整合来自多个传感器的特征。这些方法利用统计方法纳入个体特征的概率分布，并估计融合特征集的联合概率分布。例如，Parai等人[62]利用主成分分析（PCA）来整合与不同输入刺激相关的输出信息，从而提高了诊断模拟电路故障的精度。从PCA获得的融合特征随后用于训练支持向量机（SVM）进行故障分类。Pan等人[63]采用独立成分分析（ICA）来融合来自振动传感器的特征用于齿轮箱故障诊断。结果证明了故障诊断性能的增强，特别是对于微弱故障信号。Song等人[64]利用线性判别分析（LDA）来融合时域特征，用于电机故障诊断。所综述的研究强调了基于概率的融合技术在旋转机械故障诊断中的有效性。然而，在故障诊断中使用多个传感器的基于概率的融合技术存在局限性。这些方法通常假设特定的分布，并且可能对这些假设的偏差敏感。它们可能计算复杂，特别是对于高维数据，并且可能在处理噪声大或相关的传感器测量值时遇到困难。基于概率的融合技术对动态故障条件的适应能力可能有限，并且可能难以解释。来自多个传感器的数据的可用性和质量也会影响其性能。在故障诊断场景中应用基于概率的融合技术时，必须仔细考虑这些缺点。基于AI的融合技术利用机器学习算法整合来自多传感器数据的故障敏感特征，生成高级的共享表示[65]。这些技术涉及通过傅里叶频谱分析、小波变换和经验模态分解等方法从原始传感器信号中提取相关信息。随后，融合的特征通过应用机器学习算法用于故障诊断。例如，Pan等[66]利用变分模态分解和小波包算法分解振动信号以提取统计特征。这些特征经过优化、融合并用于一个双隐藏层极限学习机进行齿轮故障诊断。Saimurugan和Ramprasad[67]采用小波变换从振动和声音信号中提取相关信息，用于旋转机械的故障诊断。决策树算法用于从提取的特征集中选择最相关的特征，然后使用人工神经网络（Artificial Neural Network, ANN）进行分类。Jiang等[68]提出了一种融合模型，该模型结合了信息熵和概率神经网络来处理旋转机械中振动信号的复杂性。通过融合这些特征，该方法相比使用单个信息熵度量实现了更高的准确性。Khazaee等[69]提出了一种融合方法，该方法结合了声学和振动数据，使用小波变换和ANN来诊断行星齿轮箱的故障。同样，Wu等[70]在不同速度下从时域和频域提取故障特征。然后使用多域特征融合技术将这些特征整合起来，利用广度学习系统对轴承故障进行分类。研究结果展示了在不同运行条件下诊断可靠性的提高。Vanraj等[71]开发了一种用于固定轴齿轮箱故障诊断的融合方法，他们利用Teager-Kaiser能量算子和经验模态分解方法从声学和振动信号中提取特征。Martinez-Morales等[72]提出了一种三相感应电动机的故障诊断方法，采用特征数据融合来整合从定子电流和振动信号中提取的特征。其他研究人员也提出了旋转机械故障诊断的特征融合方法[73, 74]。虽然传统的具有浅层结构的模式识别分类器已被普遍使用并在故障诊断中被证明有效，但它们确实存在某些局限性：（1）故障特征是从各种类型的多传感器信号中手动提取的，这需要先验知识和专业知识[75]；（2）故障诊断过程与特征提取和融合是分离的，这可能导致相关信息丢失。这反过来又可能导致故障诊断的准确性较低和泛化能力较弱。许多学者广泛探索了基于深度学习的特征融合方法在旋转机械故障诊断中的应用。与依赖特征工程的传统方法不同，深度学习（DL）模型可以自动从原始传感器数据中提取特征。这消除了对领域特定知识的需求，并使模型能够学习数据中固有的复杂模式[75]。因此，研究人员利用不同的深度学习模型来自动学习和融合来自多个传感器的特征，实现端到端的故障诊断[76]。Liu等人[75]设计了一种利用深度特征学习和多传感器融合来识别故障严重程度的旋转机械诊断方法。Wang等人[77]、Xie等人[78]和Gong等人[79]引入了基于CNN的特征级融合模型，以利用振动信号增强故障诊断。在另一项研究[80]中，提出了一种利用CNN和深度神经网络（DNN）的集成模型进行轴承故障诊断。该模型从多传感器振动数据中提取多样化的特征，并融合它们以进行准确诊断，利用了CNN和DNN两者的能力。此外，在一种不同的方法[81]中，提出了一个用于齿轮箱和滚动轴承的故障诊断框架，采用了CNN模型。除了基于CNN的特征级数据融合方法外，Chen等[82]开发了一种用于轴承故障诊断的特征融合方法，该方法涉及稀疏自动编码器和深度信念网络的使用。在另一项研究[83]中，使用一维卷积长短期记忆（Long Short Term Memory, LSTM）融合振动信号，改进了轴承故障诊断。该方法通过使用LSTM集成来自多个传感器的信息，提高了故障诊断的准确性。Wang等[84]提出了一种诊断方法，该方法利用瓶颈层优化的CNN进行多振动传感器数据融合。该方法通过利用加速度计的振动数据融合，有效增强了故障诊断性能。上述研究突出了基于深度学习的特征融合方法在旋转机械故障诊断中的多样化应用。这些方法有效地捕获了多传感器振动数据中存在的复杂模式和关系，展示了它们在该领域的有效性。然而，需要注意的是，在现实场景中遇到的振动信号，特别是对于复杂的旋转机械，通常具有非线性、非平稳性和噪声的特性[85]。为了克服这些挑战，研究人员努力使用深度学习方法在特征级融合振动和电流信号[86-88]。Shao等[89]采用深度CNN，通过整合来自振动和电流传感器的数据来诊断工业感应电机的故障。在[90]和[91]的研究中，振动和电流信号在特征级融合用于轴承和齿轮箱的故障诊断。这些研究强调了在故障诊断中结合振动和电流信号的好处，因为它们提供了关于机器机械行为、结构完整性、电气性能和负载条件的互补信息。通过基于深度学习的特征融合集成这些信号，可以实现对机器健康状况更全面的理解，从而提高故障诊断能力。研究人员还探索了利用深度学习模型融合振动与声学信号的方法。Wang等[92]采用一维CNN从轴承振动与声学信号中提取代表性特征，随后在另一个一维CNN模型中进行特征融合，从而提高了故障分类的准确率。Jiao等[93]开发了深度耦合密集CNN网络用于行星齿轮箱诊断，有效整合振动与声学信号以增强故障诊断能力。Ma等[94]提出深度耦合自编码器融合振动与声学信号进行齿轮箱故障诊断，显著提升了诊断效果。Li等[95]采用深度随机森林融合方法，结合声学与振动信号提取的相关特征诊断齿轮箱故障，实现了更优的诊断性能。类似地，Ma等[96]开发了深度耦合受限玻尔兹曼机用于刀具故障诊断，成功整合振动与声发射传感器数据。He等[97]提出深度多信号融合对抗模型诊断轴向柱塞泵故障，利用迁移学习与残差网络提升诊断准确率。这些研究共同证明了数据融合（特别是振动与声学数据融合）在提升各类机械故障诊断精度方面的有效性。通过整合多源传感器信息，深度学习模型能够充分发挥振动与声学信号的互补特性，从而获得更强大的诊断能力。在Wang等的研究[98]中，利用多传感器振动信号实现了旋转设备的故障诊断。该研究验证了通过整合来自不同传感器的振动数据来精确检测系统故障的有效性。Janssens等[99]开发了一种将振动测量与红外热数据相结合的方法，用于旋转机械的故障诊断，在不同类型机械中实现了更优的故障检测效果。Wang等[100]提出了一种三阶段特征融合方法，用于结合轴承的振动和扭矩信号。他们采用基于注意力的多维串联卷积神经网络进行特征融合，从而提高了分类准确率。类似地，Xue等[101]开发了一种通过结合双流特征融合卷积神经网络，结合粒子群优化-支持向量机分类器来检测滚动轴承故障的方法。该方法能自主学习和提取输入信号特征，并利用优化后的支持向量机分类器实现滚动轴承的精确故障诊断。Liu等[102]采用多维特征融合技术提升了梯度提升决策树在重载列车制动系统中的诊断准确率，取得了令人满意的结果。He等[103]将甲虫触角搜索算法与群分解优化、一维CNN以及特征融合相结合，用于滚动轴承故障诊断，显著提高了滚动轴承故障诊断的准确性。Shang等[104]提出了一种基于信息熵的多尺度深度特征融合方法，用于平行轴齿轮箱的故障诊断。该方法通过自动编码器进行特征提取，融合低维特征后采用深度信念网络进行分类，相比未采用特征融合技术的模型获得了更高的诊断准确率。同样地，Liu等[105]将多传感器信号的统计特征和隐性特征整合到轻量梯度提升机中进行故障分类，通过特征融合技术的应用，所开发方法的性能超越了未采用该技术的模型。综合研究表明，与数据级融合相比，特征级融合是多传感器信号融合的首选技术，因其比决策级融合更易实施[106]。然而，特征级融合在捕捉和保留同质信号的互补特性方面存在局限，可能导致关键故障信息的丢失。对所有特征进行同等处理，可能无法有效区分和捕捉各传感器信号中独特的故障相关特征，从而导致故障特征弱化和诊断性能下降。相比之下，基于多传感器融合的方法能充分利用多个传感器之间相关且互补的故障敏感信息，从而提升性能并更全面地理解机械状态。为克服上述局限，值得探索决策级或多级融合等替代性融合技术，这些技术有望提高旋转机械故障诊断的准确性。4.3 决策级融合决策级融合涉及组合来自多个传感器的输出或决策，以得出关于旋转机械故障状况的最终诊断或推断。在这种方法中，每个传感器基于其测量值和算法生成其诊断输出[107]。如图6所示，决策级融合使用融合规则或算法组合这些个体决策，以获得一个统一且可靠的诊断。图6 决策级融合方法（基于[28]绘制）在旋转机械故障诊断领域，已经提出了决策级融合方案来组合来自多个传感器的决策或输出。这些方法分为统计方法和机器学习方法。统计融合方法利用统计技术来组合来自多个传感器的决策或输出。加权投票、Dempster-Shafer（D-S）理论、模糊逻辑和贝叶斯决策理论是常用的统计融合方法[108, 109]。这些统计融合方法有效地利用了来自多个传感器的信息，提高了诊断的准确性和可靠性。Li等[110]提出了一种改进的加权投票融合方法，该方法利用振动数据诊断滚动轴承故障。Shao等[28]开发了一种融合方法，利用具有Morlet小波函数的堆叠小波自动编码器来映射不同工况下的非平稳振动信号，同时引入了一种改进的投票融合策略用于协作诊断。Zeng等[109]提出了一种基于组合权重和改进投票规则的决策级融合方法，以提高旋转机械的诊断准确性和可靠性。D-S证据理论已被Mi等[111]、Khazaee等[112]和Ji等[113]用于故障诊断中的传感器融合。这些研究考虑了多个传感器信号（如振动和声学信号）以提高准确率。Fu等[114]引入了一个用于齿轮箱故障诊断的决策级融合框架，该框架将对称点模式（Symmetrized Dot Pattern, SDP）图像与VGG16相结合。来自多个传感器的振动信号被转换为SDP图像，用于训练使用VGG16的故障诊断模型。该模型整合了来自不同传感器的SDP图像，并利用D-S证据理论获得诊断结果。D-S证据理论的改进版本也被应用于处理故障诊断任务中的冲突证据[115-119]。Liu等[120]引入了一种基于Sugeno模糊积分的决策级融合框架，用于融合振动和电流信号，提高了感应电机的诊断准确性。另一项研究[121]展示了使用加权平均、D-S证据推理和模糊积分对不同振动传感器的信息进行决策级融合。与使用单个传感器信息相比，这种融合方法提高了诊断准确性。此外，贝叶斯网络已被用于融合多传感器信号进行旋转机械故障诊断[122,123]。然而，需要注意的是，统计模型依赖于正态性、线性或变量独立性等假设。偏离这些假设可能会破坏模型的准确性和可靠性，导致错误的结果。因此，仔细审查和验证这些假设对于确保可靠的故障诊断至关重要。基于机器学习的融合方法在旋转设备故障诊断中利用机器学习算法来组合多个传感器的输出。这些方法通常采用集成学习技术，其中独立分类器被单独训练，然后合并它们的决策以获得统一的诊断结果[124]。Zhong等[125]开发了一种新颖的集成技术，在旋转设备的故障诊断中整合多个概率分类器的输出。该集成技术旨在提高诊断方案的性能，相较于单独使用个体分类器。Qiao等[126]开发了一种创新的齿轮箱故障诊断框架。该方法利用多类SVM在决策级融合来自振动和电流信号的信息，如图7所示。然而，基于机器学习的融合方法的一个挑战是从多源数据中手动提取特征，这可能非常耗时并显著影响最终结果。不同类型的传感器可能表现出不同的隐藏特征，这使得设计合适的特征提取技术具有挑战性。手动选择特征可能导致质量有限和信息丰富度不足，可能加剧特征之间的冲突并降低融合的有效性。因此，依赖手动选择的特征可能会阻碍全面学习数据中复杂模式的能力。图7 基于数据融合的风力涡轮机传动齿轮箱故障诊断方法近年来，在旋转机械故障诊断中，基于深度学习的决策级融合模型的使用显著增长。由于能够克服传统基于机器学习的融合方法遇到的挑战，这些模型变得流行起来。例如，Chao等[127]开发了一种使用CNN和多通道振动信号的自适应决策级融合框架，用于诊断轴向柱塞泵的故障。他们的方法旨在提高故障诊断性能。类似地，Di等[128]介绍了一种方法，该方法结合了集成深度迁移学习与改进的投票多传感器振动信号融合策略，用于不同工作环境中的锥齿轮故障诊断。通过将深度迁移学习技术与融合策略相结合，他们的方法旨在提高锥齿轮的诊断准确性。Hoang等[129]开发了一种结合深度学习和基于电机电流信号的数据融合的轴承故障诊断技术。该方法利用深度学习模型从电机电流信号中提取相关信息，然后融合这些信息以提高轴承的诊断准确性。在某些情况下，研究人员还提出了混合方法，将传统的决策级数据融合方法与基于深度学习的融合方法相结合用于故障诊断。这些混合方法旨在利用两种技术的优势，进一步提高诊断准确性和性能。例如，Li等[130]开发了一个用于轴承的诊断框架，该框架集成了深度CNN和改进的D-S证据理论。他们的方法融合来自两个传感器的振动信号，以提高故障分类准确性，并解决仅依赖单一模型进行诊断的缺点。通过组合多个不确定的证据片段，并合并共识信息同时排除冲突信息，该方法显著提高了准确率。总体而言，在旋转设备故障诊断中使用决策级融合的好处是有效处理多样化信息并展现出强大的容错能力。然而，一个显著的缺点是与处理多源和高维数据相关的高计算成本。这可能导致诊断速度和处理效率下降。实现决策级融合也可能很复杂，需要精确的数据同步、产生通信开销，并且需要仔细选择融合策略。此外，冲突结果的存在可能影响分类准确性。因此，决策级融合仍然是该领域一个活跃的研究领域和持续的挑战。编辑：陈宇航校核：李正平、陈凯歌、赵栓栓、曹希铭、赵学功、白亮、任超、海洋、Tina、陈莹洁、王金、赵诚，肖鑫鑫该文资料搜集自网络，仅用作学术分享，不做商业用途，若侵权，后台联系小编进行删除来源：故障诊断与python学习