(论文速读)MLFNet:基于多层次特征融合网络的机械故障特征学习

张开发
2026/4/9 10:55:15 15 分钟阅读

分享文章

(论文速读)MLFNet:基于多层次特征融合网络的机械故障特征学习
论文题目Multi-level features fusion network-based feature learning for machinery fault diagnosis基于多层次特征融合网络的机械故障特征学习期刊Applied Soft Computing 2022摘要轴承是旋转机械中最关键的部件之一。由于轴承的故障会引起意想不到的机器损坏因此及时准确地识别轴承的缺陷具有重要意义。然而由于振动信号的非线性和非平稳特性实现基于振动信号的特征提取和故障诊断仍然是一个具有挑战性的问题。卷积神经网络(convolutional neural network, CNN)被广泛应用于机械故障诊断中振动信号的特征学习。由于CNN的层次化结构在深度网络中通过逐层卷积计算生成多层次特征。因此在串联层中逐层选择特征以进行多层次特征融合是一个有趣的问题。针对振动信号的特征学习问题提出了一种新颖的多层特征融合网络(MLFNet)。首先在MLFNet中发展多尺度卷积利用不同核大小的多分支提取故障相关特征;其次通过连接层对不同层的特征进行耦合以保留区别信息;第三提出了一种基于动态特征选择的自适应加权选择方法用于多层次特征融合。在两个轴承试验台上验证了MLFNet在机械故障诊断中的有效性。实验结果表明MLFNet对振动信号具有良好的特征提取性能。对于案例1(单一条件)和案例2(变化条件)MLFNet的识别准确率达到99.75%。与这些典型的深度神经网络和现有的故障诊断方法相比该方法在轴承故障诊断方面具有更好的性能。MLFNet面向旋转机械故障诊断的多层级特征融合网络详解一、研究背景与动机滚动轴承是旋转机械中最关键的支撑部件之一具有可替换性强、成本低、易于批量生产等优点被广泛应用于各类工业装备。然而在恶劣的工作条件下轴承极易产生各类缺陷内圈缺陷、滚珠缺陷、保持架缺陷等一旦发生故障将导致整机非计划停机甚至引发安全事故。因此及时、准确地识别轴承的故障类型是工业健康监测领域长期以来的核心课题。振动信号分析是轴承故障诊断最主流的技术路线因为振动信号中包含与轴承缺陷直接对应的冲击信息。早期方法依赖信号处理如小波包分解和浅层机器学习如SVM、ANN但这些方法存在明显的局限严重依赖人工特征工程需要大量领域专家知识对强背景噪声的鲁棒性差浅层结构难以建模海量数据与机器健康状态之间的复杂非线性关系。近年来以卷积神经网络CNN为代表的深度学习方法在故障诊断领域取得了突破性进展。然而现有的CNN方案仍存在两个核心缺陷问题一单尺度卷积核无法全面捕获振动信号的多频率特征。振动信号本质上是多尺度、非平稳的。大尺度核适合过滤高频噪声、提取全局趋势小尺度核则擅长捕获信号局部细节。使用单一尺寸的卷积核意味着只能从某一个视角观察信号必然造成信息损失。问题二CNN中间层的多层级特征未被充分利用且融合时缺乏筛选。CNN的层级结构天然地产生了从低层通用到高层判别的多层级特征表示。ResNet和DenseNet虽然通过跳跃连接引入了跨层特征但这些特征在拼接后没有任何筛选机制冗余通道与有效通道一并保留对最终分类性能形成干扰。基于以上两个核心问题本文提出了MLFNetMulti-Level Features Fusion Network一个专门针对振动信号的端到端一维CNN模型。二、MLFNet 模型结构与关键创新MLFNet 的整体结构包含四个核心模块多尺度卷积、多层级特征生成、动态特征选择和分类器。下面逐一详细介绍。配图图4MLFNet的网络结构图2.1 多尺度卷积Multi-scale Convolution配图图1多尺度核特征学习示意图传统CNN在每一层只使用一种固定尺寸的卷积核而MLFNet在每个卷积层中同时部署三种不同宽度的卷积核kernel size 4, 16, 64形成三条并行的特征提取分支。小核k4感受野小专注于捕获信号的局部细节和高频冲击特征中核k16介于两者之间捕获中等尺度的周期性特征大核k64感受野大负责滤除高频噪声、提取全局趋势和低频包络。三条分支的特征图通过逐元素求和融合为统一的多尺度特征图其中f为ReLU激活函数。这种设计使得网络能够同时从多个时间尺度观察振动信号显著增强了对复杂、非平稳信号的特征表达能力。2.2 多层级特征生成Multi-level Feature GenerationMLFNet设置了三个级别Level 1 / Level 2 / Level 3的多尺度卷积层每一层输出尺寸均为[16512×1]16个通道每通道512个特征点。CNN的层级结构具有天然的层次性底层特征Level 1通用的、与具体故障类型弱相关的特征如信号的基本波形模式高层特征Level 3高度抽象的、具有强判别能力的故障特异性特征。为了同时保留来自不同层级的信息MLFNet通过一个逐通道拼接层channel-wise concatenation将三个层级的特征图直接拼接拼接后的特征图维度从[16512×1]扩展为[48512×1]同时包含了低层通用特征和高层判别特征为后续的自适应筛选提供了丰富的信息来源。配图图3多层级加权融合示意图配图图12球缺陷样本在三个层级的特征输出对比2.3 动态特征选择Dynamic Feature Selection配图图2动态特征选择模块示意图简单拼接三层特征必然引入大量冗余通道因此MLFNet提出了一种基于双路通道注意力的动态特征选择机制其设计思路来源于SENet和CBAM但进行了融合改进。具体流程如下第一步双路全局信息聚合Squeeze对拼接后的特征图同时通过平均池化avg-pooling和最大池化max-pooling生成两组通道描述符avg-pooling 捕获通道的整体平均响应max-pooling 捕获通道中最显著的激活值。第二步通道权重生成Excitation两路描述符分别送入由两个全连接层构成的共享网络生成各自的通道权重向量第三步权重融合与特征重标定两路权重逐元素相加得到最终的融合权重 Ws再与拼接特征图进行逐通道相乘完成特征的自适应重标定这一机制的物理意义在于有效通道被增强冗余通道被抑制从而在多层级特征中保留最具判别力的信息子集。配图图13多层级特征融合权重可视化2.4 网络参数配置配表表2MLFNet参数设置表MLFNet的完整网络结构参数如表2所示输入长度2048的一维振动信号Level 1三种核K4,16,64步长S4输出[16512×1]Level 2/3三种核K4,16,64步长S1输出[16512×1]加权融合层通道拼接后[48512×1]最大池化层步长S4输出[48128×1]FC16144→1024FC21024→4类别数损失函数交叉熵优化器Adam学习率0.001三、故障诊断应用框架配图图5MLFNet故障诊断应用流程图MLFNet的实际应用分为离线训练和在线测试两个阶段离线训练阶段在轴承测试台上安装加速度传感器采集各类故障状态的振动信号构建训练数据集利用多尺度卷积对原始一维信号进行特征学习通过通道拼接层生成多层级特征并利用动态特征选择进行加权融合将最终特征送入Softmax分类器计算交叉熵损失利用Adam算法完成反向传播训练。在线测试阶段传感器实时采集振动信号将原始信号输入已训练好的MLFNet模型提取多层级加权特征分类器直接输出故障类别实现实时在线诊断。整个流程端到端无需人工特征提取从原始振动信号直接映射到故障标签。四、实验验证4.1 Case 1单工况轴承故障诊断实验设置配图图6轴承测试台实物图配图图7不同缺陷类型的轴承实物图配表表1数据集详细信息表实验在自建轴承测试台上进行测试台由驱动电机、传动轴、磁力制动器和轴承组成。加速度传感器YD84D-V安装于齿轮箱上采样频率为30 kHz。共考察4种健康状态正常C1、内圈缺陷C2、滚珠缺陷C3、保持架缺陷C4。每类500个样本每样本2048个采样点共2000个样本采用5折交叉验证评估性能。训练过程分析配图图9MLFNet训练过程曲线MLFNet学习率设置为0.001训练过程收敛极为迅速仅需100个epoch准确率即可达到99%最终在2000个epoch后收敛至稳定高精度水平。单次实验结果配图图10识别率混淆矩阵从混淆矩阵来看C2内圈缺陷、C3滚珠缺陷和C4保持架缺陷的识别率均达到100%仅C1正常有极少量误分误分率约1%。与其他DNN的对比配图图18Case 1各方法对比柱状图配图图19各CNN训练损失与验证精度曲线MLFNet不仅准确率最高收敛速度也明显优于其他方法相比之下1-D CNN和CNN的训练曲线抖动更大稳定性较差。与最新方法的对比配图图20与SOTA方法对比柱状图本文还与多个领域前沿方法进行了比较包括MSCNN多尺度CNN、IMSN改进残差网络、1-D RCAE一维残差卷积自编码器、SCNet自校准卷积网络和ECANet高效通道注意力网络。MLFNet在5折平均准确率上均优于上述所有方法。4.2 Case 2变工况轴承故障诊断配表表5变工况数据集详细信息表配表表6Case 2各方法对比结果表为验证MLFNet在更复杂、更贴近工业实际的变转速、变载荷条件下的泛化性能论文进一步采用东南大学公开轴承数据集进行验证。数据集设置两种工况20 Hz–0 V 和 30 Hz–2 V五种健康状态健康H、滚球故障BF、内圈故障IF、外圈故障OF、内外圈复合故障IOF传感器安装于行星齿轮箱的x、y、z三个方向每样本 2048×3 通道共10000个样本。实验结果在变工况这一更具挑战性的任务上MLFNet仍然取得了99.75% 的平均准确率且在所有5折中均保持99.70%以上。相比之下ResNet为99.52%DenseNet为99.24%1-D CNN仅94.53%基于2D图像输入的CNN仅84.88%。与SOTA方法相比MLFNet同样名列第一MSCNN为99.16%IMSN为98.55%。这一结果说明MLFNet对工况变化具有良好的鲁棒性能够在不同转速和负载条件下稳定提取判别性特征。五、可视化分析MLFNet 黑箱的内部机制深度神经网络通常被视为黑箱但本文通过多维可视化深入揭示了MLFNet的内部工作机制。5.1 多尺度卷积核的形态分析配图图11Level 1多尺度卷积核可视化Level 1中三种尺度卷积核的波形呈现出显著差异k4的小核波形简单聚焦于高频局部模式k64的大核波形复杂感受野更宽捕获更丰富的全局信息。大多数卷积核具有不同的波形特征这意味着它们扮演着不同的滤波器角色从不同视角提取振动信号的特征信息。5.2 不同层级特征的判别能力配图图15各层特征的t-SNE二维可视化利用t-SNE将各层特征映射到二维空间进行可视化可以清晰观察到Level 1图15b四类故障已有一定分离但仍有交叠Level 2/3图15c/d分离程度逐渐增大高层特征的判别能力更强拼接层图15e分布与Level 3相近说明高层特征在多级拼接中占主导多级加权融合后图15f相比单纯拼接类间分离进一步改善说明加权筛选有效地保留了有用信息、滤除了冗余全连接层图15h四类故障完全分离分类效果极佳。5.3 注意力权重的分布特性配图图13多层级融合权重可视化对注意力权重的分析揭示了以下规律大多数通道具有不同的权重值说明注意力机制确实在自适应地区分有效通道和冗余通道max-pooling分支Weights #2产生的权重普遍大于avg-pooling分支Weights #1说明最大响应对通道重要性判断更为敏感低层级特征的融合权重大于高层级表明低层特征在融合过程中被有意增强弥补了其天然判别性较弱的不足。六、消融实验各模块的贡献分析6.1 单尺度 vs. 多尺度卷积核配图图16不同核尺寸的MLFNet对比结果论文对比了单独使用k4、k16、k64以及多尺度组合四种配置下的识别性能。结果表明单尺度MLFNet尤其是在第3次测试中存在明显性能抖动稳定性较差多尺度MLFNet在所有折次中均保持稳定5折平均准确率达到99.75%高于任意单尺度配置k4: 98.97%k16: 99.55%k64: 99.17%。6.2 有/无多层级加权融合的对比配图图17有/无多层级融合的对比雷达图对比有无多层级加权融合的两个版本无融合版本5折平均准确率为98.66%有融合版本提升至99.75%提升幅度约1.1%。这一结果直接验证了多层级加权融合模块的有效性。七、总结与展望核心贡献总结创新模块解决的问题实现方式多尺度卷积单尺度核无法全面感知振动信号并行k4/16/64三路卷积后求和融合多层级特征融合中间层特征信息被丢弃channel-wise concatenation拼接三层输出动态特征选择冗余特征干扰分类双路avgmax通道注意力加权重标定局限性与未来工作作者也坦诚地指出了本研究的局限性仅考虑了振动信号未融合声发射、热成像等其他类型的故障信号未充分探索跨工况迁移能力尽管Case 2已涉及变工况但不同设备间的域适应问题仍未解决。未来工作方向包括多源异质数据融合将振动、声发射、温度等多类传感器信号整合入MLFNet框架迁移学习利用MLFNet提取的特征在不同但相关的工况间进行知识迁移提升跨域诊断性能。

更多文章