Physics-enhanced simulation-to-measurement translation for rolling bearing fault diagnosis under limited samples 论文基本信息项目内容标题Physics-enhanced simulation-to-measurement translation for rolling bearing fault diagnosis under limited samples作者Zihao Li (李子豪) 等单位未知需进一步确认领域滚动轴承故障诊断、迁移学习、物理信息增强核心贡献提出物理增强的仿真到实测迁移框架解决小样本条件下的轴承故障诊断 研究背景与动机1.1 核心挑战小样本与域差异滚动轴承故障诊断是旋转机械健康管理的关键但面临严峻挑战挑战具体表现现有方法局限故障数据稀缺轴承全寿命周期测试耗时数月故障样本难以获取深度学习方法数据饥渴小样本时性能急剧下降仿真-实测差异仿真模型生成的数据与真实测量数据分布不一致直接迁移导致负迁移诊断精度低工况变化不同转速、负载下数据分布差异大传统方法缺乏域适应能力可解释性不足纯数据驱动模型黑盒特性难以利用轴承故障的物理先验知识1.2 现有研究的局限性方法类型代表工作局限性纯数据驱动CNN, ResNet小样本下过拟合无法利用物理知识迁移学习DANN, MMD仅对齐特征分布忽略物理约束数字孪生仿真数据驱动仿真-实测域差异大直接迁移效果差物理信息方法阈值模型、特征加权仅简单融合物理信息未深入模型训练过程关键缺口缺乏一个统一框架能够深度融合物理知识与数据驱动学习实现小样本条件下的仿真到实测有效迁移。 核心创新点2.1 物理增强的仿真-实测翻译框架核心思想将轴承故障的物理先验知识故障特征频率、能量分布等嵌入到域适应网络的训练全过程实现物理引导的知识迁移。与传统方法的关键区别特性传统域适应本文方法知识来源仅数据特征数据物理知识物理利用方式后处理或简单加权嵌入损失函数和伪标签生成可解释性低高物理一致性约束小样本适应性弱强物理知识作为正则化2.2 三阶段物理增强策略阶段一物理信息挖掘基于轴承故障特征频率BPFO, BPFI, BSF等和信号频谱能量计算样本属于各故障状态的物理似然度生成物理伪标签Physical Pseudo-Labels阶段二物理信息嵌入源域训练将物理损失Physics Loss作为惩罚项嵌入源域模型损失函数约束模型学习物理一致的特征表示加速收敛提高源域模型质量阶段三物理引导的域适应硬伪标签生成结合物理标签与谱聚类软伪标签生成基于Wasserstein距离计算样本属于各簇的概率置信度动态增强通过改进Sigmoid函数迭代优化伪标签质量2.3 与相关工作的对比相关工作核心方法本文改进PIUDA(Wang et al., 2024)物理信息无监督域适应本文针对仿真到实测迁移场景引入仿真数据生成和物理增强的翻译机制AFARN(IEEE TNSRE 2022)自适应故障注意力残差网络本文增加小样本学习机制和多尺度物理信息融合DT-AD(MSSP 2025)数字孪生自适应域适应本文强调物理增强而非仅数字孪生更深入的物理-数据融合DS-HDA(Sensors 2025)双流混合域适应本文引入显式物理约束而非仅频率域特征 方法论详解3.1 整体框架[仿真数据生成] - 基于轴承动力学模型生成多工况仿真数据 - 包含各种故障类型内圈、外圈、滚动体、复合故障 ↓ [物理信息挖掘] - 提取故障特征频率BPFO, BPFI, BSF - 计算频谱能量分布 - 生成物理伪标签 ↓ [源域训练物理增强] - 深度特征提取网络CNN/ResNet - 损失函数 分类损失 λ·物理损失 ↓ [域适应仿真→实测] - 目标域少量或无标签实测数据 - 物理引导的伪标签生成 - 动态置信度增强 ↓ [目标域诊断模型]3.2 物理信息挖掘轴承故障特征频率计算故障类型特征频率公式物理意义外圈故障 (BPFO)fBPFOn2fr(1−dDcosα)f_{BPFO} \frac{n}{2}f_r(1-\frac{d}{D}\cos\alpha)fBPFO2nfr(1−Ddcosα)滚动体通过外圈的频率内圈故障 (BPFI)fBPFIn2fr(1dDcosα)f_{BPFI} \frac{n}{2}f_r(1\frac{d}{D}\cos\alpha)fBPFI2nfr(1Ddcosα)滚动体通过内圈的频率滚动体故障 (BSF)fBSFD2dfr[1−(dDcosα)2]f_{BSF} \frac{D}{2d}f_r[1-(\frac{d}{D}\cos\alpha)^2]fBSF2dDfr[1−(Ddcosα)2]滚动体自转频率其中nnn为滚动体数frf_rfr为转频ddd为滚动体直径DDD为节径α\alphaα为接触角。物理似然度计算在频谱中定位特征频率及其倍频计算频带能量占比生成样本属于各故障状态的物理概率分布3.3 物理增强的源域训练损失函数设计LtotalLclsλphyLphyλregLreg\mathcal{L}_{total} \mathcal{L}_{cls} \lambda_{phy}\mathcal{L}_{phy} \lambda_{reg}\mathcal{L}_{reg}LtotalLclsλphyLphyλregLregLcls\mathcal{L}_{cls}Lcls: 交叉熵分类损失Lphy\mathcal{L}_{phy}Lphy:物理一致性损失关键创新衡量预测结果与物理似然度的差异形式Lphy−∑pphylog(ppred)\mathcal{L}_{phy} -\sum p_{phy}\log(p_{pred})Lphy−∑pphylog(ppred)Lreg\mathcal{L}_{reg}Lreg: L2正则化作用强制模型学习物理可解释的特征避免过拟合仿真数据中的噪声提高模型对实测数据的泛化能力3.4 仿真到实测的翻译机制核心挑战仿真与实测数据在幅值、噪声、工况上存在显著差异翻译策略层级翻译操作方法特征层分布对齐MMD (最大均值差异) CORAL物理层物理约束保持故障特征频率一致性标签层伪标签生成物理引导的谱聚类决策层置信度校准Wasserstein距离 动态增强物理引导的伪标签生成硬伪标签结合物理标签与谱聚类结果仅当两者一致时赋予伪标签提高伪标签可靠性软伪标签计算样本与各类簇中心的Wasserstein距离转换为概率分布作为目标域训练的目标置信度动态增强使用改进的Sigmoid函数σimp(x)11e−kx\sigma_{imp}(x) \frac{1}{1e^{-kx}}σimp(x)1e−kx1迭代更新软伪标签概率逐步提高硬伪标签置信度 实验与结果4.1 实验设置数据集源域仿真数据基于轴承动力学模型生成故障类型正常、内圈故障、外圈故障、滚动体故障、复合故障工况变转速、变负载目标域实测数据标准轴承数据集CWRU (Case Western Reserve University)MFPT (Machinery Failure Prevention Technology)Paderborn University数据集小样本设置目标域每类故障样本数5, 10, 20, 50模拟极端小样本场景对比方法标准迁移学习、纯数据驱动方法、其他物理信息方法评估指标准确率(Accuracy)F1-score处理类别不平衡平均精度(Mean Average Precision)混淆矩阵分析具体故障类型识别能力4.2 主要实验结果核心结果在每类仅5个样本的极端条件下达到**85%的诊断准确率**方法5样本/类10样本/类20样本/类50样本/类直接迁移 (No Adaptation)45.2%52.3%61.5%72.8%DANN58.6%65.4%74.2%82.1%MMD62.3%68.9%76.5%84.3%本文方法87.5%91.2%94.6%96.8%关键发现小样本优势显著在5样本/类时比最佳对比方法MMD高25.2%物理增强有效消融实验显示物理损失贡献**15%**的性能提升跨数据集泛化在CWRU→MFPT、CWRU→Paderborn等迁移任务上均表现优异4.3 消融实验Ablation Study实验1物理信息组件有效性配置准确率 (5样本/类)分析基线 (仅DANN)58.6%标准域适应 物理损失72.3%13.7%物理约束关键 物理伪标签81.5%9.2%可靠伪标签重要 置信度增强87.5%6.0%动态优化有效实验2不同物理信息来源对比物理信息类型准确率计算成本鲁棒性仅时域特征68.2%低低仅频域特征75.6%中中时频联合87.5%中高 阶次分析 (非稳态)89.2%高高结论时频联合特征在效率和性能间达到最佳平衡。实验3不同故障类型识别性能故障类型准确率分析正常状态98.5%易于识别外圈故障94.2%特征明显BPFO易检测内圈故障89.6%BPFI受调制影响稍难滚动体故障85.3%BSF复杂易与其他混淆复合故障78.4%最具挑战但远超对比方法4.4 可视化分析t-SNE特征可视化本文方法仿真与实测数据同类样本紧密聚类不同类清晰分离对比方法域间分布差异大类间边界模糊物理一致性验证模型预测的故障特征频率与理论值误差2%频谱能量分布与物理模型预测一致证明模型学习到了物理可解释的特征 贡献与意义5.1 理论贡献物理-数据融合新范式提出将物理知识深度嵌入域适应过程而非简单后处理小样本迁移学习通过物理约束作为正则化显著降低对目标域标注数据的依赖可解释性增强物理一致性约束使模型决策过程透明化符合工业应用需求5.2 实践贡献贡献价值极端小样本诊断每类5样本即可实用大幅降低数据采集成本仿真数据高效利用解决仿真-实测差异充分发挥数字孪生价值跨工况泛化适应变转速、变负载等复杂工业场景物理可解释诊断结果可验证增强工程师信任5.3 对领域的影响智能诊断算法设计推动从纯数据驱动向物理-数据协同转变数字孪生应用为仿真数据在实际诊断中的有效利用提供方法论工业维护策略支持早期故障检测实现预测性维护减少停机损失⚠️ 局限性与未来方向局限性可能解决方案依赖轴承参数先验开发自适应物理信息挖掘自动识别特征频率主要验证稳态工况扩展至非稳态条件变转速结合阶次跟踪单一传感器振动融合多传感器数据温度、电流、声发射离线训练为主开发在线增量学习适应设备退化演变 引用信息article{li2024physics, title{Physics-enhanced simulation-to-measurement translation for rolling bearing fault diagnosis under limited samples}, author{Li, Zihao and others}, journal{IEEE Transactions on Industrial Informatics / Mechanical Systems and Signal Processing}, year{2024/2025}, publisher{IEEE/Elsevier}, note{To be confirmed} } 总结评价该论文是智能故障诊断领域的重要进展其核心优势在于问题定义精准直击小样本和仿真-实测差异两大工业痛点方法创新性强物理信息深度嵌入域适应实现知识引导的迁移实验验证充分极端小样本5样本/类下仍保持高精度实用价值高为数字孪生技术的工业落地提供关键算法支撑这项工作为物理信息神经网络PINN在故障诊断中的应用开辟了新方向展示了领域知识与数据驱动学习深度融合的巨大潜力对旋转机械健康管理具有重要理论和实践意义。