基于特征优化k1体育和支持向量机的航空发动机气路故障诊断
k1体育十年品牌针对现有数据驱动的航空发动机故障诊断算法易受飞行监控数据中冗余特征及噪声的干扰,不能及时修正监测数据中不平衡样本分布对模型泛化性能影响等问题,通过在支持向量机模型中引入特征增维和采用提取算法,提出基于特征优化和支持向量机的航空发动机气路故障诊断方法,并建立相应模型。将涡桨发动机及CFM56-7B发动机航后数据输入模型,分析与预测实际故障发生时刻,并将预测结果与真实结果进行比较,同时将其结果与采用随机森林等4种故障诊断方法所得结果进行对比验证。结果表明:特征优化算法的应用能显著缩短各类故障诊断方法运行时间20%以上;基于特征优化和支持向量机的故障诊断方法使预测准确率达99.8%;针对非平衡实测数据,特征优化算法和回归预测思想的引入能显著提高算法在不平衡数据集上的性能,与非回归算法相比故障检测率提高到91.67%。
航空发动机是为飞机飞行提供推进动力的一种复杂的热力机械,在工作过程中,很多部件长期处于高转速、高应力、高温、高压状态,使得发动机发生故障的时间具有不确定性。作为飞行器的重要组成部分,发动机的运行状态直接影响其安全服役。因此,及时且准确地进行发动机的故障诊断与管理不仅能实现视情维护和减少维修成本,而且能提高飞行安全性。总之,通过研究和发展准确而可靠的发动机故障诊断技术,能有效地增强飞行器运行过程的安全性及经济性[1]。
20世纪80年代,人工神经网络的发展为航空发动机的气路故障诊断提供了可靠的分析工具。通过充分利用发动机专业领域的知识、经验以及历史数据,主要包括基于神经网络、支持向量机、模糊逻辑、专家知识系统及深度核极限学习机[2]等算法,使基于数据驱动的发动机气路故障诊断方法得已长足发展。Kyriazis等[3]通过概率神经网络与模糊逻辑相结合以增强对气路故障的识别能力;Sarkar等[4]认识到发动机的突发故障和衰退性故障存在不同的特性,提出了基于符号动态过滤模型的预测方法,并通过分析时间序列数据以区分2类故障;Lin等[5]将原始故障信号转化为谱熵图像并输入卷积神经网络,提高了故障诊断算法的实时性;崔建国等[6]利用无标签数据样本集对深度自编码网络进行预训练以辅助Softmax分类器进行诊断决策;曹惠玲等[7]将高斯核函数支持向量机作为AdaBoost算法的弱分类器,实现了多分类气路故障诊断,有效解决了非线性和学习样本不足的问题;田静等[8]引入了遗传算法并应用于正则化参数和核参数的调优,可自适应地选取最小二乘支持向量机参数,提高故障诊断模型的抗噪能力。但现存的问题限制了基于数据驱动的发动机气路故障诊断方法的推广与应用。一方面,受传感器精度及环境干扰的影响,飞行监控数据中常包含较多冗余特征及噪声,这类数据在增加模型训练负担的同时降低了故障诊断精度;另一方面,发动机实际运行时所采集的监测数据中的正常样本数量远大于故障样本数量,极不均衡的样本分布对故障诊断方法的学习过程造成影响,弱化模型的泛化能力。
本文提出了一种基于特征优化与支持向量机的航空发动机气路故障诊断方法,采取故障概率估计增加故障数据的方法,结合回归预测的思想,进行发动机航后数据的气路故障诊断预测。
结合特征优化和支持向量机(Support Vector Machine,SVM)的气路故障诊断模型结构如图1所示。
由于直接利用原始数据集作为模型输入存在如下问题:原始特征之间的冗余性和相关性不利于机器学习模型的训练;在数据集中重要特征所构成的特征子集对故障问题的诊断起主导作用。因此对原始样本空间中的特征子集进行增维与最优子集选择,能优化模型运算效率并提升诊断精度。
本文提出的方法对经预处理后的发动机航后数据采用指数、对数、组合等多种方式进行特征增维。为从增维后的数据中选取具有区分度的特征组合,引入了近邻成分分析(Near Component Analysis,NCA)算法和深度自编码器(Auto Encoder,AE)等特征分析与提取方法,利用主成分分析法(Principal Component Analysis,PCA)对基于NCA和AE特征优化算法得到的结果进行比较,选择更具有可分性的故障特征进行故障诊断。
本文采用特征优化算法对特征增维后的发动机状态特征进行评估分析,为后续特征选取提供依据。特征优化的基本任务是利用特征选择和特征提取算法对现有特征进行评估并找出最有效的特征。特征选择是从已有的M个特征中选出N个(N
在特征空间中引入距离度量的学习能够极大地提高分类器的性能,有较高的实际应用价值。作为典型的距离测度学习算法,近邻成分分析法已在医疗检测[9],语音识别[10]和人脸识别[11]等领域得到实际应用。NCA算法在数据样本中随机选择近邻,并通过优化留一法(Leave-One-Out,LOO)来搜索变换矩阵,并利用该矩阵获得原始数据的低维嵌入表示。
深度自编码器[12]是神经网络的一种,是直接使用单层或多层神经网络对输入数据进行映射,得到转换后的输出向量作为从输入数据提取出的特征。传统的自动编码器一般应用于数据降维[13]、文本提取[14]、语音识别[15]等任务,能同时表征线性和非线性变换,相对其他的降维方法具有更高的适应性。
深度自编码器特征压缩模型如图2所示。从图中可见,典型的自编码器模型是由1个简单的3层神经网络结构组成,包括1个输入层、1个隐藏层和1个输出层。输入层和隐藏层构成编码网络h=f(x),
支持向量机(SupportVectorMachines,SVM)是在分类与回归分析中常用的监督式学习模型,目前已应用于蛋白质结构预测[16]、故障诊断[17]等领域。SVM将实例表示为空间中的点,并在空间中搜索1个能够将某个值最大化的超平面,使得单独类别的实例被尽可能宽的间隔分割开。若存在新的实例,将其映射到同一空间并基于所在间隔的位置预测所属类别。超平面和所有实例间的最小距离被称为间隔。SVM算法在空间中搜索分离超平面如图3所示。w·x+b=0即为分离超平面,对于线性可分的数据集,此类超平面有无穷个,但是几何间隔最大的分离超平面却是唯一的。
本文涉及的航空发动机气路性能测量参数来自涡桨发动机气路性能模型生成的仿线B发动机航后数据以及维修记录[18-19]。气路性能仿真模型模拟了涡桨发动机处在正常状态、单部件故障、放气活门故障以及组合故障等多种故障情境下的运行状况,并在不同故障模式下获取的数据样本与健康基线]的对比,以记录发动机状态的异常波动。本文涉及的各气路测量参数及相关变量见表1、2。单独故障(部件故障或放气活门故障)及其相应的单一性能参数量变化量(其他性能参数保持不变)见表3。组合故障及其相应的性能参数变化量见表4。为使仿真数据更接近真实飞行数据,模型仿真过程中加入了一定数量级的噪声。
由于发动机实际故障种类较多,且对不同测量参数具有不同程度的影响,直接利用现有的测量参数作为故障特征建模可能无法进行准确的故障诊断。因此采取特征增维方式增加故障特征,进而优选故障特征以挖掘故障的隐藏信息,从而提升发动机故障诊断的精度,提升算法的有效性。
特征增维一般是在已有特征的基础上,通过线性组合、对数变换和指数变换等形式增加故障特征的数量。本文对已有的故障特征做多种类型的特征增维,包括指数增维、对数增维、差分增维和组合增维。2类航空发动机具体的特征增维方式分别见表5、6。组合增维一般要选择具有相关关系的参数进行组合。
特征增维方法在增强原始特征的表达能力的同时,也为数据集引入了较多的冗余特征。为了消除冗余特征的影响、减少数据的存储空间、提升模型性能,利用特征选择方法和特征降维方法对所获得的特征进行优化选择。
首先使用NCA算法对特征增维后的2类航空发动机数据集进行特征选择,该算法利用机器学习为每个特征打分,避免特征选择结果与实际模型结果脱节。在利用NCA算法获得权重向量前,需要对正则化项λ进行寻优并选定平均损失的最小参数。通过选取目标函数在极小值点时的λ值,求取此时对应的权重向量w作为特征排序结果。在涡桨发动机和CFM56-7B发动机上利用NCA算法获得的部分特征的重要性评分(评分0.1)分别如图4、5所示。
此外,与特征选择中的过程类似,选用了深度自编码器模型作为特征降维工具,同样以特征增维后的2类航发特征作为输入。通过建立1个典型的3层神经网络,自编码器能够利用模型的隐层结构进行特征降维与特征提取,将输入的特征映射成低维特征。
为了在各类特征选择和特征降维方法中选择最适合所选数据集进行特征优化,通过在模型中引入PCA法[20]对各类特征优化方法的结果进行评估。PCA是针对模式分类的特征提取的最典型工具。作为经典的特征提取方法,PCA在不减少原始数据所包含的信息前提下,将原始数据集转化为由维数较少的“有效”特征成分来表示,使其在统计均方意义下达到方差最优的目的。同时,借助PCA易于可视化的优势,在2维平面上分别展示NCA算法和深度自编码器处理后的数据集进而评估故障样本的分类能力及其优劣。
利用2种特征优化方法对在不同发动机气路性能仿真数据集上的结果进行分析。以涡桨发动机数据集为例,原始数据集和经过2种方法分别优化后的2类数据集的PCA可视化结果如图6~8所示。
对比3类数据集中的样本分布状况,发现相较于原始涡桨发动机的仿真数据集,利用NCA算法和深度自编码器优化后的特征子集均能实现故障样本与正常样本的较好分离。由于NCA算法所得特征子集对不同种类的气路故障具有更好的分离性,因此更适合于气路故障诊断。
基于上述特征优化后的航发数据集,构建支持向量机模型,开展气路故障诊断,并通过与其他常见分类器的对比,验证了所提出的故障诊断方法的有效性。
使用NCA算法获得的重要性评分0.1的增维后,在特征输入SVM分类器中进行故障诊断。对于涡桨发动机,其输入特征为△PCNC、△T8M、△WFB-1、△PCNC2和△PCNC/△T8M,5种特征(表7)。模型中的SVM分类器使用径向基函数核(RadialBasisFunc‐tion,RBF),数据集按照7∶3的比例划分训练集和测试集。
为了验证基于特征优化和支持向量机的故障诊断算法的有效性,本节在涡桨发动机仿真数据集上,将所提算法与几种常见的故障诊断算法进行比较。
随机森林(Random Forest,RF)[21]、感知机模型(Perceptron Model,PM)[22]、决策树(Decision Tree,DT)和支持向量机4种故障诊断算法在涡桨发动机数据集上的统计分析结果见表8。根据本文的特征优化算法,设计了上述模型的4种变体共同进行试验。其中,ORIG表示该算法使用原始特征来训练模型;FO表示算法使用了特征优化算法筛选后的特征子集训练模型。
从表中的试验结果可见,特征优化方法可显著减少各类方法的运行时间,且提高了除感知机以外的所有故障诊断算法的准确性。其中,从故障诊断性能分析:基于特征优化和支持向量机的故障诊断算法,其结果得出了99.80%的最高故障检测率(Falsediscoveryrate,FDR)。在试验中,各方法对非故障样本的诊断精度均较高,预测过程中均只有1个正常样本被错分,因此虚警率(Falsealarmrate,FAR)均为0.658%。此外,试验中感知机模型发生了较明显的欠拟合现象。ORIGPC算法在涡桨发动机数据集中的训练集和测试集准确率均小于65%,表明算法陷入欠拟合状态,难以学习到数据信息;而在FOPC中,特征选择算法对输入数据的特征项做了简化,使得其欠拟合现象更为严重,导致了FDR指标的进一步下降。
从模型运行效率分析,与采用原始特征的诊断模型相比,基于特征优化的各类方法运行时间均有缩短。在特征优化后的模型中,支持向量机模型的运行效率仅低于决策树算法的。由于决策树算法是一种基于树形分支的方法,是不需要计算特征之间的相似性等。本文选用的支持向量机算法是RBF函数核将输入的低维样本特征映射到高维空间,通过衡量样本之间的相似度做出分类决策,其训练过程中参数较多,需略长的训练时间。综合模型准确率和运行效率,本文提出的算法具有较好的故障诊断性能。
为了评价PCA算法评估结果的可靠性,本文探究了特征优化算法的选择对评估结果产生的影响。对比模型分别使用基于NCA和AE算法优化后的特征子集进行训练后的分类结果见表9。其中,AE表示使用自编码算法优化后的特征来训练模型;NCA表示算法使用了近邻成分分析算法筛选后的5维特征训练模型。相较于NCA算法,基于自编码AE算法优化后的各故障诊断模型需要更长的运行时间,且4种模型中的3种的准确率都很低。因此,PCA算法评估的各特征优化算法的优化质量与实际故障诊断中的表现是一致的。
由于现实中获取的数据集中故障与正常2个类别的样本数目相差巨大,正常样本的数量远大于故障样本的数量,即为典型的不平衡数据集。以CFM56-7B型涡扇发动机数据为例,在1055条有效样本中,仅包含13条单一气路故障样本,即发动机流路因污垢积累导致了其总体性能指标(排气温度裕度)下降而进行水洗。水洗故障标签的设定即发动机故障概率与维修记录的关系如图9所示,从图中可见,在发动机水洗前的一段时间内认为发动机已产生故障征兆,将其设定为故障状态。而更之前的状态和水洗之后的状态则视为健康状态。设定水洗前N个飞行循环为故障状态,作为后续的故障诊断算法所需样本。一般该循环数是通过反复测试确定的,并以该循环数为变量,测试每个循环数下的故障诊断精度,最后选择精度较高的循环数。
本文考虑不平衡数据集的特性,同时发动机气路故障一般可视为发动机气路性能退化到一定程度的结果,即发动机的故障产生过程视为不同的衰退状态[24]。在前述故障诊断算法中,根据发动机故障维修记录对故障样本数据进行了扩展生成,对于发动机气路故障,除了外来物击伤外,在实际飞行过程中,离故障维修点越近的时刻发生故障的可能性越大。因此在对原始数据进行特征优化后,将故障点及故障点前的部分数据,设置一定的置信区间,用正态分布进行拟合,以起到扩充故障样本数据的作用。然后将NCA算法抽取的4维特征数据包括Diff(△EGT)、Diff(△N2)、Diff(△EGT)和Diff(△N2)4种特征,利用支持向量回归机(SupportVectorRegression,SVR)进行故障诊断,并依照故障诊断模型在训练集中的结果设置合适的分类阈值。
基于特征优化和SVM的诊断算法及结合回归预测的诊断算法在CFM56发动机数据集上的故障诊断结果见表10。从试验数据可知,结合回归预测的故障诊断算法能显著提高不平衡数据集上的故障检测准确率。
为进一步论证结合回归预测的故障诊断算法对样本故障率的分析准确度,选取测试数据中1个故障点以及故障点前的80个点进行观察,并绘制故障概率变化曲线所示。从图中可见,当时间离故障点越近时,SVR模型所预测的故障概率随之增大。该可视化故障概率曲线表明结合回归预测的诊断算法对故障概率的预测有较好的拟合效果。
(1)相比其他的故障诊断算法,本文建立的基于特征优化和SVM的故障诊断模型,具有最佳的准确性及较短的运行时间。
(2)针对常见的2类不平衡数据集,本文结合维修记录,扩展故障数据样本,并同回归预测思想相结合,提高了此类情况下诊断算法的准确性。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
苹果 iOS 18.1 开放 NFC 芯片 API 使用权限,全球受益
《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律
消息称苹果 iPhone 17系列四款机型将采用更易于拆卸的电池粘合剂
传iPhone 17 Pro和Pro Max将带来更简易的电池拆卸方式