维修与管理
文章编号:1671-0711(2009)05-0020-03
基于Logistic 回归模型的
机械状态健康评估研究
李锋锋
(北京化工大学诊断与自愈工程研究中心,北京100029)
摘
要:在设备运行过程中,旋转机械的状态会由于零件老化、磨损而逐渐退化,降低了设备运行的可
靠性,增加了设备故障发生的可能。应用Logistic 回归模型算法分析设备运行状态与历史数据概率分布之间的关系,用设备当前数据与设备历史状态数据之间的差异相似性来评估旋转机械设备状态的健康程度。实验结果表明,Logistic 回归模型作为机械状态健康评估的方法简单,效果直观,并且故障区分明显。关键词:Logistic 回归;旋转机械;轴承故障;状态健康评估中图分类号:TH86一、Logistic 回归模型
设备状态健康评估是一种对设备运行健康状况的简单评估方法,具有二值性,即正常运行状态和非正常运行状态。用状态评估算法对n 个同类型目标数据进行识别,第i 次识别结果可用一个取值为0、1的二值变量Y i (i =1, 2, …, n ) 来表示(例如以1表示正常运行状态,0表示非正常运行状态) 。设P i 为第i 次评估所处的测试条件下Y i =1的概率(即P {Y i =1}=P i ) ,显然,P i 就是评估算法在此条件下对这类目标的条件概率。
用普通的线性回归模型来分析Y i 这种只取0和1两种值的应变量和自变量之间的关系是不适合的, 因为普通的线性回归分析会碰到非正态误差项、非常数误差方差和回归函数的限制等问题, 而Logistic 回归则可以克服上述困难。设x 为自变量, Y 为应变量,第i 次训练时影响因素x =X i ,则对应的应变量Y i =1发生的条件概率P i 可表示为P {Y i =1|x i }=P i 。对具体的一组观测值(x i , Y i ) 模型的形式如式(1)所示
(α+βx +βx +…+βx )
P i =e 文献标识码:B
log (P i ) =α+β1x 1+β2x 2+…βk x k
i
(2)
式(2)中,log (P i ) 为对数发生比,被称为Logit 函
i
数,记为g (x ) ,其函数形状如图1所示。即Logistic 回归模型的数学表达式为
log (P ) =g (x ) =α+β1x 1+β2x 2+…βk x k
i
(3)
(i =1,2, …, n ) ,Logistic 回归
图1Logit 函数
二、基于Logistic 回归算法的设备状态健康评估
(1)
1. 设备状态健康评估Logistic 回归模型的建立
用Logistic 回归算法在对设备状态进行健康评估时,先根据具体设备可能失效的原因选取在时域和频域中提取关键零件对应的特征参数作为Logistic 回归模型中的自变量,选取先前的设备运行的历史数据对Logistic 回归模型进行训练,通常采用极大似然估计法或牛顿下山法来求解参数α和β1, …, βk 的数值解,从而建立起用于评价设备状态健康与否
式(1)中,α和β1,…,βk 分别为回归截距和回归系数。
对式(1)中的Logistic 回归模型进行推导后可以得到如下重要性质
月
维修与管理
的Logistic 回归模型。那么对于现有的每一时刻的信号都可以求出与之对应的故障发生概率值P ,如果将这些P 值在坐标轴中以时间序列连起来,就可以得到每一时刻设备发生故障的概率。应用Logistic 回归模型的设备状态健康评估的具体过程如图2所示。
反之将有过多的参数需要求解,降低回归模型的效率和可靠度。
三、状态评估实例
本文利用从北京化工大学化工安全教育部工程研究中心的轴承转子实验台上采集的轴承振动信号数据对Logistic 回归模型进行训练并测试。图3所示实验台的测试轴承是型号为N205EM 的圆柱滚子轴承,轴承参数如表1所示。
图3轴承故障实验台
表1实验轴承参数
轴承参数
内径/外径/滚动体外圈故障(通槽内圈故障(通槽类mm 25
mm 52
个数12
类型) /mm宽0.2、深0.2
型) /mm宽0.2、深0.2
图2应用Logistic 回归模型的设备状态健康评估
然而,将设备发生故障的概率作为对机械状态健康的评估标准显然是不形象的,因此,设备状态的健康程度与设备发生故障的概率之间需要建立一个明确的联系。设备发生故障的概率与设备的健康程度显然不可能是线性关系。因此,只能将设备的状态设置为正常和非正常两个状态。为了较好地描述某台设备的健康状态,引入归一化参数CV (ConfidenceValue) 作为最终描述设备状态健康程度的指标,其中CV 值等于1~0值,即CV =1表示数据样本对应的设备处于健康状态,CV =0表示数据样本对应的设备状态较差。
2. Logistic 回归模型参数的选择
在设备状态健康评估中,特征参数的选取是非常关键的。在Logistic 回归模型中,选择什么样的特征参数训练模型,将直接影响Logistic 回归模型对设备状态评估的优劣。在机械设备状态监测与故障诊断的工程信号中,振动信号是表征机器运行状态最敏感的征兆参数,能够从时域和频域反映机器的故障信息。目前,在机械设备故障诊断领域振动信号特征提取的方法主要包括:时域分析(波形分析、相关分析、统计分析等)、时序分析、基于FFT 变换的频域分析(幅值谱、功率谱、高精度内插谱、包络谱、倒谱等)、时频分析(短时Fourier 变换、Wigner 时频谱等)、小波分析、瞬时分析(波德图、Nyquist 图、瀑布图、阶次图等)。然而针对不同的设备进行设备健康评估时,要根据设备本身的固有性质来选择最佳的特征参数作为Logistic 回归模型的自变量。值得注意的是,应用于设备性健康评估中的Logistic 回归模型,其特征参数的选择以小于5个为最佳,
N205EM
为模拟轴承内外圈故障,分别在两个轴承的外圈和内圈刻了一个宽0.2mm 、深0.2mm 的通槽。在实验过程中,滚动轴承的外圈与实验台架固定,内圈随工作轴同步转动。工作轴的转速为1200r/min(即n =1200r/min)。采样时,采用加速度传感器以采样频率为40960Hz ,采样长度为40960个点,分别对正常和内外圈故障轴承采集振动信号10次,分别得到表征轴承正常和内外圈故障时的采样点409600个。用每种状态的前204800个点训练Logistic 回归模型,后204800个点作为测试数据。以1024个点分别提取正常、外圈故障和内圈故障三个状态数据的时域和频域的特征参数,每个状态有200组样本,即每个状态有200组训练数据。
本文在提取特征参数时,在时域中选择方差、有效值、峭度作为特征值,在频域中,采用帕萨维尔理论求解频域若干个频带的能量值。频带的选取以公式k =log2n -1位标准,其中k 为频带数量,n 为每组数据的个数。按此公式,本文求解9个频带上的能量值作为回归模型的特征值。比较三种状态求解的12个特征值发现,对于该轴承,频带为5、8、9的频带上能量的差异较大,区分较明显。于是选择这三组特征向量作为逻辑回归的训练样本,根据Logistic 回归公式,采用牛顿下山法求解,得出4个逻辑回归系数见表2。
本文采用后204800个点作为测试数据,以1024个点为一组共200组数据来验证该模型。同样要先对这些数据用帕萨维尔理论求解频域9个频带的能量值,取5、8、9三个频带的能量值作为特征值输入已训练好的Logistic 回归模型,
年月21
维修与管理
表2
系数轴承外圈故障轴承内圈故障
α1.7694-0.2974
逻辑回归系数
β1-0.13120.0845
β2-0.0069-0.1066
β30.0393-0.0252
根据图4、图5所示,正常轴承经评估后得到的CV 值在1附近,而有故障的轴承的CV 值在0附近,设备故障区分较明显且直观,这充分证明了该方法的可行性。
四、小结
本文应用Logistic 回归模型算法分析设备运行状态与历史数据概率分布之间的关系,用设备当前数据与设备历史状态数据之间的差异相似性来评估设备状态的健康程度,提供了一种简单实用的设备状态健康评估的方法。应用轴承数据作为设备状态健康评估的简单案例,实证分析表明,Logistic 回归模型作为旋转机械状态健康评估的方法简单、效果直观,并且故障区分明显。
在下一步工作中,可以考虑针对设备几种故障进行Logistic 回归模型的状态评估,将几种故障的评估结果同时表示在饼型或雷达型的图中,使结果显示更加直观。同时,将该方法融入到设备监测、管理、维修体系当中,使其成为设备综合管理系统中判别设备状态的一个指标,达到装备系统的信息化、智能化。参考文献:
[1]高金吉. 装备系统故障自愈原理研究[J].中国工程科学, 2005(7).
[2]John Neter. 应用线性回归模型[M].北京:中国统计出版社,
1988.
[3]王济川,郭志刚. Logistic 回归模型———方法与应用[M].北京:高
等教育出版社,2001.
[4]Dragan Djurdjanovic, Jay Lee, Jun Ni. WatchdogAgent —an infotronics-based prognostics approach for product performance degradation assessment and prediction [J].Advanced Engineering Informatics 17, 2003,109125.
前200组数据为正常数据,后200组数据分别为轴承外圈和内圈的故障数据,经过logistic 回归运算,得出轴承健康评估的CV 图,如图4和图5所示。
图4轴承外圈故障CV 图
图5轴承内圈故障CV 图
收稿日期:2009-03-05
修旧利废节能降耗
在确保设备安全运行的前提下,以旧代新,再次投入使用。电修车间修理了大量的报废电机,利用废旧电缆制作检修临时照明灯具的引出线。维护班组还自制了废油回收桶,把检修清洗设备零部件用过的污油经过过滤、沉淀后再次利用,全年车间能够节约煤油20余t 。修旧利废不仅使职工在日常工作中养成了勤俭节约的好作风,而且可以挖潜增效,有效地降低了检修能耗和成本。据不完全统计,仅2008年该车间“修旧利废”节约检修经费超过30万元。
(九江石化总厂检安公司汪学峰供稿)
为降低检修能耗和维护成本,九江石化总厂检安公司积极开展节能降耗班组小指标劳动竞赛,建立健全了公司、车间和班组成本核算台帐及检修原材料消耗台帐,将检修易耗材料分别建档,检修可控费用指标细化、量化到个人,每月进行考核评比。
该公司电修车间实行“以修代换,以旧代新”的节能降耗新举措,努力降低检修能耗和物耗,做到能修理的电气设备决不更新,对检修更换下来的开关、接触器、继电器、电机轴承、废旧电缆等及时进行综合回收利用,
月
维修与管理
文章编号:1671-0711(2009)05-0020-03
基于Logistic 回归模型的
机械状态健康评估研究
李锋锋
(北京化工大学诊断与自愈工程研究中心,北京100029)
摘
要:在设备运行过程中,旋转机械的状态会由于零件老化、磨损而逐渐退化,降低了设备运行的可
靠性,增加了设备故障发生的可能。应用Logistic 回归模型算法分析设备运行状态与历史数据概率分布之间的关系,用设备当前数据与设备历史状态数据之间的差异相似性来评估旋转机械设备状态的健康程度。实验结果表明,Logistic 回归模型作为机械状态健康评估的方法简单,效果直观,并且故障区分明显。关键词:Logistic 回归;旋转机械;轴承故障;状态健康评估中图分类号:TH86一、Logistic 回归模型
设备状态健康评估是一种对设备运行健康状况的简单评估方法,具有二值性,即正常运行状态和非正常运行状态。用状态评估算法对n 个同类型目标数据进行识别,第i 次识别结果可用一个取值为0、1的二值变量Y i (i =1, 2, …, n ) 来表示(例如以1表示正常运行状态,0表示非正常运行状态) 。设P i 为第i 次评估所处的测试条件下Y i =1的概率(即P {Y i =1}=P i ) ,显然,P i 就是评估算法在此条件下对这类目标的条件概率。
用普通的线性回归模型来分析Y i 这种只取0和1两种值的应变量和自变量之间的关系是不适合的, 因为普通的线性回归分析会碰到非正态误差项、非常数误差方差和回归函数的限制等问题, 而Logistic 回归则可以克服上述困难。设x 为自变量, Y 为应变量,第i 次训练时影响因素x =X i ,则对应的应变量Y i =1发生的条件概率P i 可表示为P {Y i =1|x i }=P i 。对具体的一组观测值(x i , Y i ) 模型的形式如式(1)所示
(α+βx +βx +…+βx )
P i =e 文献标识码:B
log (P i ) =α+β1x 1+β2x 2+…βk x k
i
(2)
式(2)中,log (P i ) 为对数发生比,被称为Logit 函
i
数,记为g (x ) ,其函数形状如图1所示。即Logistic 回归模型的数学表达式为
log (P ) =g (x ) =α+β1x 1+β2x 2+…βk x k
i
(3)
(i =1,2, …, n ) ,Logistic 回归
图1Logit 函数
二、基于Logistic 回归算法的设备状态健康评估
(1)
1. 设备状态健康评估Logistic 回归模型的建立
用Logistic 回归算法在对设备状态进行健康评估时,先根据具体设备可能失效的原因选取在时域和频域中提取关键零件对应的特征参数作为Logistic 回归模型中的自变量,选取先前的设备运行的历史数据对Logistic 回归模型进行训练,通常采用极大似然估计法或牛顿下山法来求解参数α和β1, …, βk 的数值解,从而建立起用于评价设备状态健康与否
式(1)中,α和β1,…,βk 分别为回归截距和回归系数。
对式(1)中的Logistic 回归模型进行推导后可以得到如下重要性质
月
维修与管理
的Logistic 回归模型。那么对于现有的每一时刻的信号都可以求出与之对应的故障发生概率值P ,如果将这些P 值在坐标轴中以时间序列连起来,就可以得到每一时刻设备发生故障的概率。应用Logistic 回归模型的设备状态健康评估的具体过程如图2所示。
反之将有过多的参数需要求解,降低回归模型的效率和可靠度。
三、状态评估实例
本文利用从北京化工大学化工安全教育部工程研究中心的轴承转子实验台上采集的轴承振动信号数据对Logistic 回归模型进行训练并测试。图3所示实验台的测试轴承是型号为N205EM 的圆柱滚子轴承,轴承参数如表1所示。
图3轴承故障实验台
表1实验轴承参数
轴承参数
内径/外径/滚动体外圈故障(通槽内圈故障(通槽类mm 25
mm 52
个数12
类型) /mm宽0.2、深0.2
型) /mm宽0.2、深0.2
图2应用Logistic 回归模型的设备状态健康评估
然而,将设备发生故障的概率作为对机械状态健康的评估标准显然是不形象的,因此,设备状态的健康程度与设备发生故障的概率之间需要建立一个明确的联系。设备发生故障的概率与设备的健康程度显然不可能是线性关系。因此,只能将设备的状态设置为正常和非正常两个状态。为了较好地描述某台设备的健康状态,引入归一化参数CV (ConfidenceValue) 作为最终描述设备状态健康程度的指标,其中CV 值等于1~0值,即CV =1表示数据样本对应的设备处于健康状态,CV =0表示数据样本对应的设备状态较差。
2. Logistic 回归模型参数的选择
在设备状态健康评估中,特征参数的选取是非常关键的。在Logistic 回归模型中,选择什么样的特征参数训练模型,将直接影响Logistic 回归模型对设备状态评估的优劣。在机械设备状态监测与故障诊断的工程信号中,振动信号是表征机器运行状态最敏感的征兆参数,能够从时域和频域反映机器的故障信息。目前,在机械设备故障诊断领域振动信号特征提取的方法主要包括:时域分析(波形分析、相关分析、统计分析等)、时序分析、基于FFT 变换的频域分析(幅值谱、功率谱、高精度内插谱、包络谱、倒谱等)、时频分析(短时Fourier 变换、Wigner 时频谱等)、小波分析、瞬时分析(波德图、Nyquist 图、瀑布图、阶次图等)。然而针对不同的设备进行设备健康评估时,要根据设备本身的固有性质来选择最佳的特征参数作为Logistic 回归模型的自变量。值得注意的是,应用于设备性健康评估中的Logistic 回归模型,其特征参数的选择以小于5个为最佳,
N205EM
为模拟轴承内外圈故障,分别在两个轴承的外圈和内圈刻了一个宽0.2mm 、深0.2mm 的通槽。在实验过程中,滚动轴承的外圈与实验台架固定,内圈随工作轴同步转动。工作轴的转速为1200r/min(即n =1200r/min)。采样时,采用加速度传感器以采样频率为40960Hz ,采样长度为40960个点,分别对正常和内外圈故障轴承采集振动信号10次,分别得到表征轴承正常和内外圈故障时的采样点409600个。用每种状态的前204800个点训练Logistic 回归模型,后204800个点作为测试数据。以1024个点分别提取正常、外圈故障和内圈故障三个状态数据的时域和频域的特征参数,每个状态有200组样本,即每个状态有200组训练数据。
本文在提取特征参数时,在时域中选择方差、有效值、峭度作为特征值,在频域中,采用帕萨维尔理论求解频域若干个频带的能量值。频带的选取以公式k =log2n -1位标准,其中k 为频带数量,n 为每组数据的个数。按此公式,本文求解9个频带上的能量值作为回归模型的特征值。比较三种状态求解的12个特征值发现,对于该轴承,频带为5、8、9的频带上能量的差异较大,区分较明显。于是选择这三组特征向量作为逻辑回归的训练样本,根据Logistic 回归公式,采用牛顿下山法求解,得出4个逻辑回归系数见表2。
本文采用后204800个点作为测试数据,以1024个点为一组共200组数据来验证该模型。同样要先对这些数据用帕萨维尔理论求解频域9个频带的能量值,取5、8、9三个频带的能量值作为特征值输入已训练好的Logistic 回归模型,
年月21
维修与管理
表2
系数轴承外圈故障轴承内圈故障
α1.7694-0.2974
逻辑回归系数
β1-0.13120.0845
β2-0.0069-0.1066
β30.0393-0.0252
根据图4、图5所示,正常轴承经评估后得到的CV 值在1附近,而有故障的轴承的CV 值在0附近,设备故障区分较明显且直观,这充分证明了该方法的可行性。
四、小结
本文应用Logistic 回归模型算法分析设备运行状态与历史数据概率分布之间的关系,用设备当前数据与设备历史状态数据之间的差异相似性来评估设备状态的健康程度,提供了一种简单实用的设备状态健康评估的方法。应用轴承数据作为设备状态健康评估的简单案例,实证分析表明,Logistic 回归模型作为旋转机械状态健康评估的方法简单、效果直观,并且故障区分明显。
在下一步工作中,可以考虑针对设备几种故障进行Logistic 回归模型的状态评估,将几种故障的评估结果同时表示在饼型或雷达型的图中,使结果显示更加直观。同时,将该方法融入到设备监测、管理、维修体系当中,使其成为设备综合管理系统中判别设备状态的一个指标,达到装备系统的信息化、智能化。参考文献:
[1]高金吉. 装备系统故障自愈原理研究[J].中国工程科学, 2005(7).
[2]John Neter. 应用线性回归模型[M].北京:中国统计出版社,
1988.
[3]王济川,郭志刚. Logistic 回归模型———方法与应用[M].北京:高
等教育出版社,2001.
[4]Dragan Djurdjanovic, Jay Lee, Jun Ni. WatchdogAgent —an infotronics-based prognostics approach for product performance degradation assessment and prediction [J].Advanced Engineering Informatics 17, 2003,109125.
前200组数据为正常数据,后200组数据分别为轴承外圈和内圈的故障数据,经过logistic 回归运算,得出轴承健康评估的CV 图,如图4和图5所示。
图4轴承外圈故障CV 图
图5轴承内圈故障CV 图
收稿日期:2009-03-05
修旧利废节能降耗
在确保设备安全运行的前提下,以旧代新,再次投入使用。电修车间修理了大量的报废电机,利用废旧电缆制作检修临时照明灯具的引出线。维护班组还自制了废油回收桶,把检修清洗设备零部件用过的污油经过过滤、沉淀后再次利用,全年车间能够节约煤油20余t 。修旧利废不仅使职工在日常工作中养成了勤俭节约的好作风,而且可以挖潜增效,有效地降低了检修能耗和成本。据不完全统计,仅2008年该车间“修旧利废”节约检修经费超过30万元。
(九江石化总厂检安公司汪学峰供稿)
为降低检修能耗和维护成本,九江石化总厂检安公司积极开展节能降耗班组小指标劳动竞赛,建立健全了公司、车间和班组成本核算台帐及检修原材料消耗台帐,将检修易耗材料分别建档,检修可控费用指标细化、量化到个人,每月进行考核评比。
该公司电修车间实行“以修代换,以旧代新”的节能降耗新举措,努力降低检修能耗和物耗,做到能修理的电气设备决不更新,对检修更换下来的开关、接触器、继电器、电机轴承、废旧电缆等及时进行综合回收利用,
月