卷积神经网络在轴承故障识别的应用
Application of convolutional neural network in fault identification of rolling bearing
颉潭成,陈孟会,徐彦伟,李先锋
XIE Tan-cheng, CHEN Meng-hui, XU Yan-wei, LI Xian-feng
(河南科技大学 机电工程学院,洛阳 471003)
摘 要:针对传统故障诊断方法在轴承故障诊断识别率低、人为干预多等问题,提出一种基于卷积神经
网络的故障识别方法。通过对轴承各类故障信号进行数据处理,提取出故障信号的特征,构建故障类型数据集,建立卷积神经网络图像识别模型,将故障数据集送入模型训练获得较优识别模型,最后将待识别故障信号特征图送入模型进行故障类型识别。经实验验证,该方法满足多类轴承故障识别的要求,具有较高的故障识别率。该方法无需人为参与,只需将待测信号进行数据处理送入模型进行识别,符合智能故障诊断的发展趋势,在机械故障领域具有一定的应用价值。
关键词:卷积神经网络;轴承故障识别;深度学习;智能故障诊断中图分类号:TP16 文献标识码:A 文章编号:1009-0134(2020)01-0078-05
0 引言
滚动轴承在旋转机械设备中大量应用,其发生故障是很多机械故障和人员事故发生的主要原因。若能准确快速对故障进行诊断识别,并制定相应的解决方案,将大大减少机械故障和人员事故的发生,在提高机械设备的寿命和保障工人安全方面有着重要的作用。
轴承故障诊断原理为采集振动信号,对信号进行处理与分析,从中提取出特征参数,通过特征参数判定故障类型。信号特征的分类识别算法的优劣将影响着最终的故障识别结果。众多学者对其进行了相关研究
[1~5]
神经网络识别模型即能实现对轴承故障的诊断,识别速度快,识别率高。
1 卷积神经网络概述
卷积神经网络属于深度学习的一种模型,能够从数据中学习并提取深度特征信息,其强大的泛化能力使其在图像识别方面尤为突出。卷积神经网络采用多层网络结构,由输出层、卷积层、池化层、全连接层和分类层组成。卷积神经网络主要分为特征提取和模式识别两个部分。特征提取部分是由若干个卷积和池化层交替组成,提出更深层次的特征信息。模式识别部分是全连接层和分类层组成,通过全连接层将图像转化为一维向量,通过分类层输出图像所属类别。卷积神经网络降低计算量的方式有两种。第一种为局部连接,在低层对局部的边缘等特征进行学习,在深层对信息进行整合,减少计算量的同时保留了图像特征信息。第二种为权值共享,图像各个位置采用相同的卷积核进行特征学习,减少了训练参数,加快了学习速率;通过多卷积核学习,
。研
究中多采用传统的特征识别方法,方法具有局限性和单一识别性,普遍性不高。随着计算机技术的发展,基于深度学习的物体分类方法成为了研究趋势和热点,其中卷积神经网络在图像识别领域具有突出表现
[6~14]
。为了
解决传统故障诊断方法在轴承故障诊断识别率低、人为干预多等问题,本文提出一种基于卷积神经网络的轴承故障识别方法,该方法无需人为干预,对采集的故障信号进行数据处理,将处理后的故障信号特征图送入卷积
收稿日期:2018-10-23
基金项目:国家自然科学基金资助项目(51305127);河南省高校青年骨干教师项目(2016GGJS-057)
作者简介:颉潭成(1966 -),男,甘肃人,教授,硕士,主要从事机电控制、智能检测等方面的研究工作。【78】 第42卷 第1期 2020-01
〟Ṩ〟↕䮯⊐䗃䘎6RIWPD[㊫䗃㊫图1 卷积神经网络结构图
避免特征流失[15]。卷积神经网络模型结构如图1所示。1.1 卷积层
卷积操作是在保全输入的空间结构基础上,通过局部连接和权值共享的方法,减少了图像的维度和模型的权重参数,提取图像更深层的特征信息。卷积核在整张图像上移动,遍历输入量的各个空间位置,计算出对应空间位置上的点积结果,最后生成特征映射图。经卷积操作的低层特征图表征了一些低阶的图像特征,如边缘特征;中间层得到了更加复杂的图像特征,如边角和斑点等;高阶层则获得了更加丰富的图像特征。其数学表达式为:
式中,f(x,y)为图像函数;c(x,y)为卷积操作后的图像函数;k(u,v)为卷积核。
假若输入大小为N×N×m,卷积核为F×F×m,卷积核的个数为a,移动步长为S,则输出特征图大小为C×C×a,其中C=(N-F)/S+1。
㲹䎘㵝䊎㬝㵝㼒㉎〞⼬最大池化为下采样处理常用的方法之一,在不影响图像质量的情况下,压缩图片尺寸,减少图像特征向量的维度,提高网络训练的速度。其数学表达式如下:
式中,c(x,y)为上层卷积结果;s(x,y)为下采样结果;max为最大池化操作。
运算如图3所示,池化核以一定步长在图像矩阵移动,取出各个区域中的最大值构造新的特征图。
1541162729814335⤞⧅㸋
6798图3 池化运算
1.3 全连接层
经过若干卷积层和降采样层的处理,从原始图像中提取出更深层的特征,引入全连接层的目的是将该层的所有特征与前一层卷积层学习到的局部特征信息相互连接形成全局特征,最后通过分类层进行分类。数学表达式为:
11100101101001101-1-1110011-10-10220-2212111120
式中,ali为第l层神经元第i个节点;wlji为第l层第i个节点,第l+1层第j个节点的权重值;b(l)为第l层的偏置项;f为激活函数。1.4 分类层
卷积神经网络分类器有Sigmoid和Softmax两种。其中Sigmoid分类器是以伯努利分布为模型建模,它可以用来分两种类别;而Softmax分类器以多项式分布为模型建模,它可以对分多种类别进行分类。
第42卷 第1期 2020-01 【79】
图2 卷积运算
1.2 下采样层
将卷积层提取的特征映射图输入全连接层,通过分类层实现分类的目的。但巨大的计算量使得训练速率低,可能会导致过拟合,需要对图像进行降维处理。采用下采样来对图像不同位置的特征进行聚合,降低空间维度,减少数据量,避免过拟合。
针对输入样本xi,计算出属于第k类的概率,即:
求出各类概率的log值并取负值,即可得出分类 结果。
2 实验及分析
本文实验数据来源于美国西储大学轴承数据。实验轴承型号为6205-2RS SKF,采样频率为12kHz。选取轴承内圈故障、外圈故障、滚动体故障和正常四种类型用于故障识别实验。卷积神经网络轴承故障识别流程如图4所示。
䑂⧱䎒Ⱀ㾦⼦㋋㬝MATLAB㭞㈾⪇㏎䑂⧱䎒Ⱀ㾦⼦CNN䊅䁖㑘MATLAB⪇㏎㭞㈾ⷝ㾣㦉䐹CNN㸃⮘䁖㑘CNN㶙㕈ㆂ⹚ⴒ㬨ⴒ㕛䔄㬗⢑䄋㤔䑂⧱䓕㲍㬨ㆂ㭙CNN㶙㕈ㆂ⹚䁖㑘ㅸⰯ⥃㬵ㅸⰯ图4 CNN轴承故障识别流程图
2.1 数据预处理与数据提升
通过加速度传感器采集的原始信号,由于各种因素的影响,加入了各种干扰信号。通过MATLAB对信号进行滤波处理并提取特征,获得故障信号图(如图5所示),作为网络的输入。
⟝㕈䐖ⴚ㠖㔫图5 故障信号图
【80】 第42卷 第1期 2020-01
将预处理后的故障图按故障类型进行分类,每类训练样本数为100个,随机抽取20个作为验证样本。样本类型如表1所示。
表1 实验样本
训练样本
验证样本
故障类别
数量故障类别数量正常
100正常20滚动体100滚动体20内圈100内圈20外圈
100
外圈
20
为了尽量利用有限的训练数据,通过一系列随机变换对图像数据进行提升,这样模型不存在两张完全相同的图片,有利于抑制过拟合,使得模型的泛化能力 更好。
通过Keras下的ImageGenerator图像变换函数实现数据提升。旋转角度rθ:0°~180°,随机指定图片旋转的角度;水平方向随机移动程度hm:0~1,随机指定图片水平移动的程度;竖直方向随机移动程度vm:0~1,随机指定图片竖直移动的程度;重新缩放r:随机将图片进行缩放操作;剪切变换程度s:随机对图片进行剪切变换的程度;随机放大z:随机对图片进行放大;水平翻转hf:随机对图片进行水平翻转;填充模式fm:随机对图片进行像素填充。2.2 模型建立与优化
实验中采用Keras框架搭建卷积神经网络轴承故障识别模型,卷积神经网络最常见的形式为堆叠几个卷积层和激活层,后接池化层,重复此操作,直到图像在空间上合并到小尺寸位置,过渡到全连接层,最后接分类层输出分类结果。模型结构为:输入层、[[卷积层、激活层]*N、池化层]*M、[全连接层、激活层]*K、分类
层。其中*表示重复,N>=0(通常N<=3,M>=0,K>=0且K<3)。
实验采用如下模型进行对比分析:
1)输入层、全连接层、分类层。输入层直接展开为一维向量,后接分类层实现线性分类。
2)输入层、卷积层、激活层、全连接层、分类层。此模型在线性分类的基础上加入了卷积层。
3)输入层、[卷积层、激活层、池化层]*3、全连接层、激活层、弃权技术、分类层。此模型加入了多个
卷积层,在破坏性汇集操作之前开发更复杂的输入卷的特征,使得我们能够表达更强大的输入特征,并且具有
更少的参数。
模型训练样本数每类100个,验证样本数每类20个,分类数量4,学习速率为0.001,迭代次数200次。分别利用上述模型对轴承数据集进行训练,训练结果如图6所示。
10.90.80.7〟а〟й〟 基本没有学习到各类图像的特征,故无法用此模型进行分类识别。加入了一层卷积层之后,模型的准确率大幅度提高,而损失率很低,说明模型从图像中学习了大量有用的信息;在使用三层卷积层和弃权技术后,模型的收敛速度提高,准确率也有所提高。在这三种模型中,三层卷积层和弃权的模型最好,因此运用此模型进行识别。模型结构图如图7所示[16]。2.3 结果评价
运用上诉模型对训练集和验证集进行了训练学习。模型训练后,运用该模型对待测图片进行识别实验。运用混合矩阵对实验结果进行对比分析,结果如图8 所示。
⺞⦷0.60.50.40.30.2 020406080100120Epoch/ḟ1401601802001412〟а〟й〟 10⦷86420 0图8 测试结果混合矩阵
20406080100120Epoch/ḟ140160180200实验结果显示,每类测试数据100组,正常轴承正
图6 模型对比图
确率95%,其中5个误判为滚动体故障;内圈故障识别率为93%,其中5个误判为正常轴承,2误判为滚动体故障;外圈故障识别率为92%,其中8个误判为内圈故障;滚动体故障识别率为91%,8个误判为正常,1个误
模型对比显示,简单的将图像进行线性分类,出现了严重的过拟合现象,其准确率极低、损失率很高,
图7 模型结构
第42卷 第1期 2020-01 【81】
判为外圈故障。总体来说,识别效果良好。
3 识别系统
针对卷积神经网络复杂的识别流程,开发了一套针对卷积神经网络图像识别的识别系统。该系统基于Python语言和Tkinter图像化包开发,精简了卷积神经网络识别过程,该系统包括用户管理、图像采集、数据集构建、模型搭建、模型训练、模型评估、图像识别功能。系统架构如图9所示。
䇤⿈㏎㵝㼒⤪ゐ㼁〛㵝㼒㭞㈾ゐ⹚ㅉ䁖㑘㭞㈾ゐ㬗⢑㻖㵔䂊䐅㭞㈾ゐ㚄㾮䁖㑘㚄㾮㠡㵝㼒㬗⢑图9 系统架构
整个系统的组成模块如图10所示。用户管理模块基于Pymysql后端信息管理数据库,用户信息保存在后端Pymysql数据库,便于统一管理。图像采集模块用于CNN模型训练图像数据的采集,主要分为相机采集模式和屏幕图像采集模式。在机械分拣领域,图像数据多来自于工业相机,采用相机采集模式。对于需经计算机处理显示的图像,采用屏幕取图模式。数据集构建模块,对采集的图像集进行处理,使其分为训练集与验证集。模型训练模块为整个系统的核心模块,该模块分为原始模型与迁移模型两个部分。其中原始模型即建立一个新的模型,包括数据集导入、模型层的添加、模型层的删除、模型保存、模型训练和模型评估六个部分;而迁移模型即在已有模型的基础上替换分类层,重新训练权重。图像识别模型,经过模型评估,识别效果良好的模型,可以用于图像识别。通过带入模型及训练权重,载入待识别图像即可完成对图像的识别。
4 结束语
针对某类轴承的四种故障类型运用卷积神经网络方法对其进行故障识别,该方法的识别速度快、准确率高,智能化程度高。此外,通过在线采集信号、实时处理信号,并实时对故障图进行识别,可以实现更加智能化的故障在线识别。随着故障样本类别及数量的增加,基于卷积神经网络的故障识别方法具有良好的应用优势
【82】 第42卷 第1期 2020-01
(a) 用户管理 (b) 数据采集
(c) 数据集制作 (d) 原始模型训练 (e) 迁移模型训练 (f) 图像识别
图10 系统组成模块
和发展前景。
参考文献:
[1] 宫玮丽,梁波,王晓兰.基于小波包和Hilbert包络分析的隧道
掘进机主轴承故障诊断方法研究[J].工业仪表与自动化装置,2018,(2):15-18.
[2] 姜久亮,刘文艺,侯玉洁,等.基于内积延拓LMD及SVM的轴承故
障诊断方法研究[J].振动与冲击,2016,(6):104-108.
[3] 王建国,陈肖洁,张文兴.多核的LSSVM的轴承故障诊断算法研
究[J].组合机床与自动化加工技术,2017,(6):74-77.
[4] 陈晓平,王禄,于雯.基于EEMD的农机轴承故障诊断[J].中国农
机化,2012,(3):137-140.
[5] 张全德,陈果,林桐,等.基于自组织神经网络的滚动轴承状态评
估方法[J].中国机械工程,2017,(5):550-558.
[6] 吴魁,王仙勇,孙洁,等.基于深度学习的故障检测方法[J].计算机
测量与控制,2017,(10):43-47.
[7] 张雪英,栾忠权,刘秀丽.基于深度学习的滚动轴承故障诊断研
究综述[J].设备管理与维修,2017,(18):130-133.
[8] 刘叶鹏,孙孝君,庄新颖,等.基于深度神经网络的轴承状态监测
研究[J].制造技术与机床,2017,(8):76-80.
【下转第125页】
拼接误差,建模时人为因素的加入等的影响,Revit模型与游标卡尺测量所得的数据之间存在一定的偏差,边长的绝对误差最大为6.66mm,最小为2.25mm,边长相对误差最大为4.78%,最小为1.55%。
相对误差小于5%,可以满足古建筑三维建模的精度要求,测量结果证明了此建模方法的可行性。4.3 BIM构件族库建立
如今逆向建立古建筑BIM模型,一、部分古建筑不符合明清古建筑形制规律;二、虽符合形制规律但需要通过查阅大量资料,核对构件尺寸来获得数据,建模过程较繁琐[6];三、由于没有数据源,因此必须采用全站仪、皮尺等传统测绘手段获取原始数据,这种方法耗时费力。本文方法则可以解决以上三种情况出现的问题。通过此方法,理论上可以完成整座余氏宗祠BIM模型的构建,但是基于反复利用3ds Max模型与Revit模型进行转换,无疑工作量巨大。通过查阅文献资料发现,明清古代单体建筑按一定形制由基本构件组装而成,而预先建立古建筑标准构件库,可加快古建筑的三维模型重建速度。
鉴于此,作者利用三维激光扫描采集数据建立古建筑构件的BIM模型,为古建筑构件BIM族库的建立提出新的创建思路。即利用三维激光扫描仪对具有代表性的构件进行扫描,将采集到的点云数据作为数据源,逆向建立古建筑构件MAX模型,在转换格式后通过添加属性信息及驱动参数,构建古建筑主要构件BIM族库。通过对古建筑细部构造特点的研究与系统化整理
[1,6]
图7 古建筑BIM模型创建流程
县余氏宗祠为研究对象,使用Trimble TX8三维激光扫描仪对该古建筑进行实地测量,获取了其建筑物内外的三维数字信息,并使用Trimble RealWorks、3ds Max、Revit等相关专业软件构建了BIM模型,对古建筑构件BIM族库的构建提出了思考。为余氏宗祠的信息化提供了依据,也为三维激光扫描技术在其他领域的应用提供了科学参考。
参考文献:
[1] 索俊锋,刘勇,蒋志勇,等.基于三维激光扫描点云数据的古建筑
建模[J].测绘科学,2017,42(3):179-185.
[2] 孙文潇,王健,刘春晓.三维激光扫描在古建筑测绘中的应用[J].
测绘科学,2016,41(12):297-301.
[3] 张远翼,张鹰,陈晓娟.三维激光扫描仪在古建筑测绘中的应用
研究[J].实验技术与管理,2014,31(1):79-82.
[4] 张会霞.基于3维激光扫描技术建筑物建模研究[J].激光技
术,2014,38(03):431-434.
[5] 王丹婷,蒋友燏.古建筑三维虚拟建模与虚实交互软件实现[J].
计算机应用,2017,37(S2):186-189.
[6] 高岱,王宏扬,杜嘉赫,等.中国古典建筑构件BIM参数化建模方
法研究[J].图学学报,2018,39(2):333-338.
,将古建筑构件进
行分类编码,然后调用各类构件族搭建各式形制的古建筑BIM模型,减少重复性建模的次数,从而实现古建筑信息数字化模型的快速重建。流程如图7所示。
5 结束语
在古建筑模型重建方面,三维激光扫描技术作为一项新兴的数据获取手段,效率优势明显。本文以绍兴
【上接第82页】
[9] 朱振文,周莉,刘建,等.基于卷积神经网络的道路检测方法[J].计
算机工程与设计,2017,(8):2287-2290.
[10] 公赛.基于卷积神经网络的交通物体识别系统的设计与实现
[D].山东大学,2017.
[11] 刘阗宇,冯全.基于卷积神经网络的葡萄叶片检测[J].西北大学
学报(自然科学版),2017,(4):505-512.
[12] 梁万杰,曹宏鑫.基于卷积神经网络的水稻虫害识别[J].江苏农
业科学,2017,(20):241-243,253.
[13] 高震宇,王安,刘勇,等.基于卷积神经网络的鲜茶叶智能分选系
统研究[J].农业机械学报,2017,(7):53-58.
[14] 王卫星,孙守迁,李超,唐智川.基于卷积神经网络的脑电信号上
肢运动意图识别[J].浙江大学学报(工学版),2017,51(07):1381-1389.
[15] Alex Krizhevsky, llya Sutskever, Geoffrey E Hinton.Imagenet
classification with deep convolutional neural networks.2012.[16] Matthew D Zeiler,Rob Fergus.Visualizing and Understanding
Convolutional Networks.Computer Vision and Pattern Recognition. 2013.
第42卷 第1期 2020-01 【125】
因篇幅问题不能全部显示,请点此查看更多更全内容