基于深度学习的MSTGCN-A热误差建模预测方法和系统
未命名
10-18
阅读:67
评论:0
基于深度学习的mstgcn-a热误差建模预测方法和系统
技术领域
1.本发明涉及机床热误差建模技术领域,具体地,涉及一种基于深度学习的mstgcn-a热误差建模预测方法和系统。
背景技术:
2.在制造业领域,数控机床是一种关键的工具,用于加工和制造各种零件及产品。数控机床的准确性对于确保最终产品的质量至关重要。然而,在机床运行过程中,由于热效应的存在,机床的精度会受到影响,热误差最高可占加工误差的75%。为了保证加工精度和表面质量要求,需要一种有效的热误差建模预测方法。热误差复杂的热传导特性、温度分布不均匀性、多物理场耦合、非线性特性以及实时性要求是导致热误差难以建模的主要原因。一些传统建模方法如多元线性回归被广泛用于机床的热误差建模,然而由于无法捕捉热误差的滞后性及短时波动,建模精度和鲁棒性较差。因此为了提高建模精度和模型鲁棒性,需要提出一种可以捕捉热误差时滞性及长短时波动的热误差模型。
3.专利文献cn112433507a(申请号:cn201910788657.1)公开了一种基于lso-lssvm的五轴数控机床综合热误差建模方法,包括以下步骤:s1、采集样本数据并对其进行归一化处理;s2、采用灰色关联度与偏相关分析法从样本数据中选出热误差建模的输入变量;s3、采用狮群算法获得最优的lso-lssvm组合模型参数和最优的热误差预测模型;s4、评价该方法的正确性。
4.现有的基于深度学习的热误差建模方法,如长短时记忆网络(lstm)和门控循环网络(gru),均需要筛选温度敏感点。而针对运动轴的热误差建模时,仅能一次预测单个位置的热误差,不仅模型繁多且实时性较差。另一方面,现有模型仅针对热定位误差建模,然而热直线度误差及热角度误差也十分显著,故有必要一同考虑并建模预测。因此,需要设计并建立一种基于深度学习的热误差预测模型,需要能一次性预测行程上多个位置的热误差,且不必筛选温度敏感点,并能够使用同一种模型结构对热定位误差、热直线度误差和热角度误差同时建模预测。
5.故本发明拟针对现有的热误差建模方法仅能对单个位置预测、需要筛选温度敏感点,且无热误差建模方法可对热定位误差、热直线度误差、热角度误差建模的突出问题,提出一种基于深度学习的自适应时空图卷积与注意力机制融合(mstgcn-a)的神经网络模型建模方法。
技术实现要素:
6.针对现有技术中的缺陷,本发明的目的是提供一种基于深度学习的mstgcn-a热误差建模预测方法和系统。
7.根据本发明提供的基于深度学习的mstgcn-a热误差建模预测方法,包括:
8.步骤1:构造图邻接矩阵的自学习模块,包括正则化过程及激活层;
9.步骤2:构造gcn图卷积模块,用于捕捉并融合温度数据的空间信息;
10.步骤3:构造tcn时间卷积模块,包括卷积核自适应调整拼接层和两个并行的扩张因果卷积层,用于捕捉热误差的时滞性和多通道的周期差别;
11.步骤4:gcn模块与tcn模块交替重复构成深度学习的层深;
12.步骤5:应用自注意力模块,用于分配输出信息间的权重,捕捉序列各部分的依赖关系,并采用线性层输出;
13.步骤6:采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证,采用不同工况下的温度和热误差数据进行预测。
14.优选的,所述步骤1包括:
15.步骤1.1:随机初始化节点信息,将随机初始化的节点信息分别通过线性层和激活函数tanh,并根据选择的激活函数设置饱和率α,表达式为:
16.m1=tanh(αl1(e1))
17.m2=tanh(αl2(e2))
18.其中,e表示随机初始化的节点信息,l表示线性层过程;
19.步骤1.2:通过节点间交叉相乘并相减正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵adj,表达式为:
[0020][0021]
其中,减法过程为正则化过程。
[0022]
优选的,所述gcn图卷积模块由多个层组成,表达式为:
[0023][0024]
其中,x
t
表示随时间变化的输入特征序列;为随时间变化的邻接矩阵;k为传播层的深度;为第k层的隐藏状态;wk为第k层的权重系数;i为层数;
[0025]
所述tcn时间卷积模块由多个卷积过程构成,并被拼接在一起,表达式为:
[0026]
x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)
[0027][0028]
其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向;f1×j表示滤波器;tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。
[0029]
优选的,所述自注意力模块的表达式为:
[0030]
att=softmax(ωutanh(ω
wht
))
[0031]
m=att
·h[0032]
其中,h为时空图卷积输出的隐藏向量;ωw和ωu为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1;注意力评分函数att与h相乘实现自注意力过程,经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。
[0033]
优选的,所述步骤6包括:
[0034]
搭建mstgcn-a深度学习框架,在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;
[0035]
在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化性,采用皮尔森相关系数pcc、平均绝对误差mae和均方误差rmse作为评价指标;
[0036]
验证部分的pcc计算公式为:
[0037][0038]
mae的计算公式为:
[0039][0040]
rmse的计算公式为:
[0041][0042]
其中,n为样本数;为回归模型输出;yi为实际样本值。
[0043]
根据本发明提供的基于深度学习的mstgcn-a热误差建模预测系统,包括:
[0044]
模块m1:构造图邻接矩阵的自学习模块,包括正则化过程及激活层;
[0045]
模块m2:构造gcn图卷积模块,用于捕捉并融合温度数据的空间信息;
[0046]
模块m3:构造tcn时间卷积模块,包括卷积核自适应调整拼接层和两个并行的扩张因果卷积层,用于捕捉热误差的时滞性和多通道的周期差别;
[0047]
模块m4:gcn模块与tcn模块交替重复构成深度学习的层深;
[0048]
模块m5:应用自注意力模块,用于分配输出信息间的权重,捕捉序列各部分的依赖关系,并采用线性层输出;
[0049]
模块m6:采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证,采用不同工况下的温度和热误差数据进行预测。
[0050]
优选的,所述模块m1包括:
[0051]
模块m1.1:随机初始化节点信息,将随机初始化的节点信息分别通过线性层和激活函数tanh,并根据选择的激活函数设置饱和率α,表达式为:
[0052]
m1=tanh(αl1(e1))
[0053]
m2=tanh(αl2(e2))
[0054]
其中,e表示随机初始化的节点信息,l表示线性层过程;
[0055]
模块m1.2:通过节点间交叉相乘并相减正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵adj,表达式为:
[0056]
[0057]
其中,减法过程为正则化过程。
[0058]
优选的,所述gcn图卷积模块由多个层组成,表达式为:
[0059][0060]
其中,x
t
表示随时间变化的输入特征序列;为随时间变化的邻接矩阵;k为传播层的深度;为第k层的隐藏状态;wk为第k层的权重系数;i为层数;
[0061]
所述tcn时间卷积模块由多个卷积过程构成,并被拼接在一起,表达式为:
[0062]
x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)
[0063][0064]
其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向;f1×j表示滤波器;tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。
[0065]
优选的,所述自注意力模块的表达式为:
[0066]
att=softmax(ωutanh(ω
wht
))
[0067]
m=att
·h[0068]
其中,h为时空图卷积输出的隐藏向量;ωw和ωu为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1;注意力评分函数att与h相乘实现自注意力过程,经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。
[0069]
优选的,所述模块m6包括:
[0070]
搭建mstgcn-a深度学习框架,在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;
[0071]
在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化性,采用皮尔森相关系数pcc、平均绝对误差mae和均方误差rmse作为评价指标;
[0072]
验证部分的pcc计算公式为:
[0073][0074]
mae的计算公式为:
[0075][0076]
rmse的计算公式为:
[0077]
[0078]
其中,n为样本数;为回归模型输出;yi为实际样本值。
[0079]
与现有技术相比,本发明具有如下的有益效果:
[0080]
(1)本发明的mstgcn-a算法相比于传统神经网络方法如lstm、gru、bilstm-cnn等具有鲁棒性强、泛化性好、非线性拟合能力强预测精度高的优点,可以更好的适应复杂的工况环境;
[0081]
(2)本发明的gcn算法模块采用了自适应邻接矩阵学习及图信息融合的结构,可以捕捉温度数据间的微小变化,且消除了温度数据共线性的影响,可以在不筛选温度敏感点的情况下取得很高的预测精度;
[0082]
(3)本发明的mstgcn-a算法可以单次输出数控机床多个位置的热误差,提高了预测模型的实时性,减少了预测过程的计算量。并采用了自注意力机制模块可以分配权重捕捉序列各部分的依赖关系;
[0083]
(4)本发明的mstgcn-a算法不仅可以对热定位误差进行建模预测,对于误差形式与热定位误差不同的热直线度误差和热转角误差也可以很好的建模预测,说明模型具有较强的泛化能力。
附图说明
[0084]
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0085]
图1为模型流程框图;
[0086]
图2为模型网络框架图;
[0087]
图3中的(a)~(f)为6dof热误差数据;
[0088]
图4中的(a)和(b)为不同温度下的传感器数据;
[0089]
图5中的(a)和(b)为不同工况下热定位误差拟合图;
[0090]
图6中的(a)和(b)为不同工况下热直线度误差拟合图;
[0091]
图7中的(a)和(b)为不同工况下热转角误差拟合图;
[0092]
图8中的(a)~(c)为使用mstgcn-a模型在不同工况下热定位误差、直线度误差、转角误差预测图;
[0093]
图9中的(a)~(c)为使用bilstm-cnn模型在不同工况下热定位误差、直线度误差、转角误差预测图。
具体实施方式
[0094]
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明的保护范围。
[0095]
实施例1:
[0096]
本发明所涉及的基于深度学习的mstgcn-a数控机床线性轴热误差建模方法,主要用于对机床加工过程中产生的热误差进行预测,提高加工精度和补偿的实时性。
[0097]
如图1,具体步骤包括:a、构造图邻接矩阵的自学习模块;b、构造gcn图卷积模块;
c、构造tcn时间卷积模块;d、gcn模块与tcn模块交替重复构成深度学习的层深;e、应用自注意力模块,并采用线性层输出;f、采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证。
[0098]
a、构造图邻接矩阵的自学习模块,邻接矩阵的维度取决于输入,如采用16个温度传感器,则矩阵维度为[16,16]。将随机初始化的节点信息分别通过线性层和激活函数tanh,并根据选择的激活函数设置饱和率α,正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵。通过对温度数据间的自学习构成邻接矩阵,计算公式为:
[0099]
m1=tanh(αl1(e1))
[0100]
m2=tanh(αl2(e2))
[0101][0102]
其中,e表示随机初始化的节点信息,l表示线性层过程,减法过程为正则化过程,adj即为节点间的邻接矩阵。
[0103]
b、邻接矩阵的学习是为了gcn图卷积过程提供必要的参数支持,gcn模块由多个层组成,所述gcn模块的原理公式为:
[0104][0105]
其中,x
t
表示随时间变化的输入特征序列,其输入的维度为温度传感器的数目,即为16;a
t
为随时间变化的邻接矩阵,即为步骤a所求得的adj;k为传播层的深度;为第k层的隐藏状态。信息先横向传播k层,之后纵向按权重w进行选择。在本例中,传播的k层数设计为2。
[0106]
该过程用于融合温度点的空间信息,可以消除温度数据间的共线性,并构建温度测量点间的内在关系,由于不用筛选敏感点,所以可以尽可能地保留测温信息细节,可以替代先前模型的筛选温度敏感点过程并有更优的效果。
[0107]
c、tcn模块由多个卷积过程构成,并被拼接在一起。卷积核的选择由训练过程学习到的参数决定。tcn模块的原理如公式为:
[0108]
x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)
[0109][0110]
其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向。tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。
[0111]
该过程用于捕捉温度数据与热误差数据的不一致周期,由于实际工作环境下受冷却系统的影响,机床的温度波动周期并不一致,幅值上也有差别,使用tcn可以捕捉其时滞性,并根据扩张卷积可记忆长短周期信息。
[0112]
d、gcn与tcn的按所述的方式交替重复,每重复一次,深度学习的层数相应增加。以
层数3为例,此时扩张因果卷积的扩张因子为23,感受野最大为43,若层数为5,则感受野最大为187。层数增加感受野会几何倍增加,且可训练参数增多,拟合精度更高,但过深的层深会使训练时间增加,用于深度学习的模型设计为3层即可有较好的效果。此时的模型已经可以较好的映射温度与热误差的关系,为了进一步增加模型的泛化性,采用后续的自注意力策略。
[0113]
e、自注意力模块用于分配输出信息间的权重,捕捉序列各部分的依赖关系,所述自注意力模块的原理为:
[0114]
att=softmax(ωutanh(ω
wht
))
[0115]
m=att
·h[0116]
其中,h为时空图卷积输出的隐藏向量;ωw和ωu为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1。注意力评分函数att与h相乘实现自注意力过程。经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。
[0117]
f、首先根据上述步骤搭建mstgcn-a深度学习框架;在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化性,采用皮尔森相关系数(pcc)、平均绝对误差(mae)和均方误差(rmse)作为评价指标;验证部分的pcc计算公式为:
[0118][0119]
mae的计算公式为:
[0120][0121]
rmse的计算公式为:
[0122][0123]
其中,n为样本数,为回归模型输出,yi为实际样本值。
[0124]
为直观说明神经网络结构,完整的mstgcn-a模型结构如图2所示。
[0125]
实施例2:
[0126]
本发明以五轴机床的z轴为研究对象,通过激光干涉仪测量了线性轴的6项热误差,热误差测量结果如图3中(a)~(f)所示。根据实验结果,热定位误差δ
zz
的变化为[0,24.35],热直线度误差δ
zx
的变化为[0,14.8],热直线度误差δ
zy
的变化为[0,49.70],热偏航角误差ε
zx
的变化为[0,85.35],热俯仰角误差ε
zy
的变化为[0,15.85],热滚转角误差ε
zz
的变化为[0,20.40]。并对误差变化较大的δ
zz
、δ
zy
及ε
zx
进行热误差建模,这些误差项分别为线性轴的热定位误差、热直线度误差和热角度误差,也就是包含了热误差的全部误差类别。并在z轴和主轴箱上布设共计16个温度传感器,温度测量结果如图4中(a)和(b)所示。
[0127]
测量4次完整的热机过程,分别为9000mm/min(测量共两次,#1及#2)、10000mm/min
(#3)和12000mm/min(#4)。建模时使用3个工况,并在预测时使用不同于建模时的工况数据,以验证模型的泛化能力。根据上述步骤建立网络模型,并使用python语言和pytorch框架搭建上述模型。模型的输入为16通道的热误差数据,输出为12个位置的热误差数据。采用树搜索算法确定超参数范围,优化器选择adam,学习率设置为0.0004,采用mse作为损失函数。图卷积深度为2,卷积核大小设置为[2,3,5,7],时间卷积与残差连接通道数均为64。跳过层通道数为32,末端卷积层大小为128,批大小被设置为64,模型深度层数为3,训练轮次(epoch)设置为25。
[0128]
使用热机速度为#1、#3及#4的实验数据对δ
zz
进行建模。单次输入序列长度为15,对应时间为60s。即输入维度为[64,16,15]。图5中的(a)和(b)分别为工况#1和#3的拟合情况。工况#1下的拟合皮尔森相关系数为99.38%,残差最大值为1.61μm,平均绝对误差为0.44μm。工况#3下的拟合相关系数为99.45%,残差最大值为1.14μm,平均绝对误差为0.31μm。
[0129]
使用工况#1、#2、#3的实验数据对δ
zy
进行建模。其余参数不变。图6中的(a)和(b)分别为工况#1和#3的拟合情况。工况#1下的拟合相关系数为99.07%,残差最大值为2.16μm,平均绝对误差为0.47μm。工况#3下的拟合相关系数为99.39%,残差最大值为2.49μm,平均绝对误差为0.43μm。
[0130]
使用工况#1、#2、#3的实验数据对ε
zx
进行建模。学习率设置为0.00035。图7中的(a)和(b)分别为工况#2和#3的拟合情况。工况#2下的拟合皮尔森相关系数为99.65%,残差最大值为5.02μrad,平均绝对误差为1.28μrad。工况#3下的拟合相关系数为99.58%,残差最大值为6.42μrad,平均绝对误差为0.97μrad。
[0131]
根据建模结果预测不同于建模工况下的热误差数据,以下是预测结果展示:工况#2的热定位误差δ
zz
预测结果如图8中(a)所示。预测结果的相关系数为99.53%,残差最大值为2.11μm,平均绝对误差为0.71μm。工况#4的热直线度误差δ
zy
预测结果如图8中(b)所示。预测结果的相关系数为99.47%,残差最大值为3.50μm,平均绝对误差为1.11μm。工况#4的热偏航角误差ε
zx
预测结果如图8中(c)所示。预测结果的相关系数为99.52%,残差最大值为7.58μrad,平均绝对误差为1.92μrad。实验结果表明,在工况变化的情况下仍可以有良好的预测精度。
[0132]
并采用bilstm-cnn作为对比算法,值得注意的是多元线性回归模型无法多输出,lstm、gru等模型在筛选温度敏感点后建模效果仍不佳故并未列出。建模超参数选择与上述过程一致,仍使用树搜索算法确定超参数,由于对比算法使用16个温度数据建模的效果较差,所以进行了温度敏感点的选取。使用k均值聚类和皮尔森相关分析筛选了8个簇并选择各簇中相关系数最大的数据作为温度敏感点。结果如图9所示。工况#2的热定位误差δ
zz
预测结果如图9中(a)所示。预测结果的相关系数为99.56%,残差最大值为2.52μm,平均绝对误差为0.85μm。工况#4的热直线度误差δ
zy
预测结果如图9中(b)所示。预测结果的相关系数为98.97%,残差最大值为7.49μm,平均绝对误差为1.67μm。工况#4的热偏航角误差ε
zx
预测结果如图9中(c)所示。预测结果的相关系数为99.43%,残差最大值为12.94μrad,平均绝对误差为3.54μrad。不同工况下mstgcn-a和bilstm-cnn网络性能参数对比如表1所示:
[0133]
表1mstgcn-a和bilstm-cnn网络性能对比表
[0134][0135]
通过对比mstgcn-a神经网络多个误差项的预测曲线图和bilstm-cnn神经网络预测曲线图,分析表1可得,mstgcn-a模型具有较高的pcc和较小的最大残杀及mae,所以mstgcn-a与bilstm-cnn相比具有较高的预测精度和泛化能力。
[0136]
本发明针对机床线性轴的全项热误差提出了一种基于深度学习的数控机床平动轴6项热误差预测综合建模方法。之后提出了图自学习与图卷积融合温度测量点之间的空间信息。使用不同卷积核的扩张因果卷积捕捉温度序列的时间信息。两种卷积网络交替构成深度学习模块。最后通过自注意力机制强化结果的依赖关系。利用多个工况下的实验数据建模并在不同工况下预测线性轴的全项热误差,包括热定位误差、热直线度误差、热偏航角误差。通过预测结果并与对比算法对比验证了模型的精度和泛化能力。主要结论如下:
[0137]
(1)在图卷积中引入邻接矩阵自学习模块。构建的模型可以自适应构建温度测量点的空间关系,而不是筛选温度敏感点。在时间卷积中应用扩张卷积并使用不同大小的卷积核用于捕捉长短时信息。结果表明模型泛化能力强,采用相同模型结构即可对热定位误差、热直线度误差、热转角误差进行建模。
[0138]
(2)利用多个工况下的温度-热误差数据建模。构建了多温度输入多误差输出的mstgcn-a深度学习模型。通过单个模型可以同时预测线性轴不同位置的热误差。本研究采用16通道温度数据作为输入,并通过单个模型同时输出12个位置的热误差。
[0139]
(3)预测不同于建模工况下线性轴各个位置的热误差。本研究提出的方法预测热定位误差、热直线度误差、热转角误差的最大残差分别为2.11μm、3.50μm和7.58μrad。对比算法在筛选温度敏感点后的预测结果最大残差分别为2.52μm、7.49μm和12.95μrad。根据结果,提出模型的预测精度在所有误差项中均优于需要筛选温度敏感点的bilstm-cnn模型。
[0140]
实施例3:
[0141]
本发明还提供一种基于深度学习的mstgcn-a热误差建模预测系统,所述基于深度学习的mstgcn-a热误差建模预测系统可以通过执行所述基于深度学习的mstgcn-a热误差建模预测方法的流程步骤予以实现,即本领域技术人员可以将所述基于深度学习的mstgcn-a热误差建模预测方法理解为所述基于深度学习的mstgcn-a热误差建模预测系统的优选实施方式。
[0142]
根据本发明提供的基于深度学习的mstgcn-a热误差建模预测系统,包括:模块m1:构造图邻接矩阵的自学习模块,包括正则化过程及激活层;模块m2:构造gcn图卷积模块,用于捕捉并融合温度数据的空间信息;模块m3:构造tcn时间卷积模块,包括卷积核自适应调整拼接层和两个并行的扩张因果卷积层,用于捕捉热误差的时滞性和多通道的周期差别;模块m4:gcn模块与tcn模块交替重复构成深度学习的层深;模块m5:应用自注意力模块,用于分配输出信息间的权重,捕捉序列各部分的依赖关系,并采用线性层输出;模块m6:采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证,采用不同工况下的温度
和热误差数据进行预测。
[0143]
所述模块m1包括:
[0144]
模块m1.1:随机初始化节点信息,将随机初始化的节点信息分别通过线性层和激活函数tanh,并根据选择的激活函数设置饱和率α,表达式为:
[0145]
m1=tanh(αl1(e1))
[0146]
m2=tanh(αl2(e2))
[0147]
其中,e表示随机初始化的节点信息,l表示线性层过程;
[0148]
模块m1.2:通过节点间交叉相乘并相减正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵adj,表达式为:
[0149][0150]
其中,减法过程为正则化过程。
[0151]
所述gcn图卷积模块由多个层组成,表达式为:
[0152][0153]
其中,x
t
表示随时间变化的输入特征序列;为随时间变化的邻接矩阵;k为传播层的深度;为第k层的隐藏状态;wk为第k层的权重系数;i为层数;
[0154]
所述tcn时间卷积模块由多个卷积过程构成,并被拼接在一起,表达式为:
[0155]
x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)
[0156][0157]
其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向;f1×j表示滤波器;tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。
[0158]
所述自注意力模块的表达式为:
[0159]
att=softmax(ωutanh(ω
wht
))
[0160]
m=att
·h[0161]
其中,h为时空图卷积输出的隐藏向量;ωw和ωu为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1;注意力评分函数att与h相乘实现自注意力过程,经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。
[0162]
所述模块m6包括:
[0163]
搭建mstgcn-a深度学习框架,在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;
[0164]
在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化
性,采用皮尔森相关系数pcc、平均绝对误差mae和均方误差rmse作为评价指标;
[0165]
验证部分的pcc计算公式为:
[0166][0167]
mae的计算公式为:
[0168][0169]
rmse的计算公式为:
[0170][0171]
其中,n为样本数;为回归模型输出;yi为实际样本值。
[0172]
本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统、装置及其各个模块以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供的系统、装置及其各个模块以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌入式微控制器等的形式来实现相同程序。所以,本发明提供的系统、装置及其各个模块可以被认为是一种硬件部件,而对其内包括的用于实现各种程序的模块也可以视为硬件部件内的结构;也可以将用于实现各种功能的模块视为既可以是实现方法的软件程序又可以是硬件部件内的结构。
[0173]
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本技术的实施例和实施例中的特征可以任意相互组合。
技术特征:
1.一种基于深度学习的mstgcn-a热误差建模预测方法,其特征在于,包括:步骤1:构造图邻接矩阵的自学习模块,包括正则化过程及激活层;步骤2:构造gcn图卷积模块,用于捕捉并融合温度数据的空间信息;步骤3:构造tcn时间卷积模块,包括卷积核自适应调整拼接层和两个并行的扩张因果卷积层,用于捕捉热误差的时滞性和多通道的周期差别;步骤4:gcn模块与tcn模块交替重复构成深度学习的层深;步骤5:应用自注意力模块,用于分配输出信息间的权重,捕捉序列各部分的依赖关系,并采用线性层输出;步骤6:采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证,采用不同工况下的温度和热误差数据进行预测。2.根据权利要求1所述的基于深度学习的mstgcn-a热误差建模预测方法,其特征在于,所述步骤1包括:步骤1.1:随机初始化节点信息,将随机初始化的节点信息分别通过线性层和激活函数tanh,并根据选择的激活函数设置饱和率α,表达式为:m1=tanh(αl1(e1))m2=tanh(αl2(e2))其中,e表示随机初始化的节点信息,l表示线性层过程;步骤1.2:通过节点间交叉相乘并相减正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵adj,表达式为:其中,减法过程为正则化过程。3.根据权利要求1所述的基于深度学习的mstgcn-a热误差建模预测方法,其特征在于,所述gcn图卷积模块由多个层组成,表达式为:其中,x
t
表示随时间变化的输入特征序列;为随时间变化的邻接矩阵;k为传播层的深度;为第k层的隐藏状态;w
k
为第k层的权重系数;i为层数;所述tcn时间卷积模块由多个卷积过程构成,并被拼接在一起,表达式为:x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向;f1×
j
表示滤波器;tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。4.根据权利要求1所述的基于深度学习的mstgcn-a热误差建模预测方法,其特征在于,
所述自注意力模块的表达式为:att=softmax(ω
u
tanh(ω
w
h
t
))m=att
·
h其中,h为时空图卷积输出的隐藏向量;ω
w
和ω
u
为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1;注意力评分函数att与h相乘实现自注意力过程,经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。5.根据权利要求1所述的基于深度学习的mstgcn-a热误差建模预测方法,其特征在于,所述步骤6包括:搭建mstgcn-a深度学习框架,在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化性,采用皮尔森相关系数pcc、平均绝对误差mae和均方误差rmse作为评价指标;验证部分的pcc计算公式为:mae的计算公式为:rmse的计算公式为:其中,n为样本数;为回归模型输出;y
i
为实际样本值。6.一种基于深度学习的mstgcn-a热误差建模预测系统,其特征在于,包括:模块m1:构造图邻接矩阵的自学习模块,包括正则化过程及激活层;模块m2:构造gcn图卷积模块,用于捕捉并融合温度数据的空间信息;模块m3:构造tcn时间卷积模块,包括卷积核自适应调整拼接层和两个并行的扩张因果卷积层,用于捕捉热误差的时滞性和多通道的周期差别;模块m4:gcn模块与tcn模块交替重复构成深度学习的层深;模块m5:应用自注意力模块,用于分配输出信息间的权重,捕捉序列各部分的依赖关系,并采用线性层输出;模块m6:采用python实现mstgcn-a模型,包括mstgcn-a模型的建立、训练和验证,采用不同工况下的温度和热误差数据进行预测。7.根据权利要求6所述的基于深度学习的mstgcn-a热误差建模预测系统,其特征在于,所述模块m1包括:模块m1.1:随机初始化节点信息,将随机初始化的节点信息分别通过线性层和激活函
数tanh,并根据选择的激活函数设置饱和率α,表达式为:m1=tanh(αl1(e1))m2=tanh(αl2(e2))其中,e表示随机初始化的节点信息,l表示线性层过程;模块m1.2:通过节点间交叉相乘并相减正则化处理两个节点间的信息,通过激活函数softsign处理正则化后的信息,将输出通过激活函数relu,输出区间为[0,1]的邻接矩阵adj,表达式为:其中,减法过程为正则化过程。8.根据权利要求6所述的基于深度学习的mstgcn-a热误差建模预测系统,其特征在于,所述gcn图卷积模块由多个层组成,表达式为:其中,x
t
表示随时间变化的输入特征序列;为随时间变化的邻接矩阵;k为传播层的深度;为第k层的隐藏状态;w
k
为第k层的权重系数;i为层数;所述tcn时间卷积模块由多个卷积过程构成,并被拼接在一起,表达式为:x
t
=concat(x
t
*f1×2,x
t
*f1×3,x
t
*f1×4,x
t
*f1×7)其中,concat为拼接过程;*表示卷积过程,多个可变卷积核用以动态调整感受野,可变卷积核的大小为卷积核[2,3,4,7];d表示扩张因子,扩张因子随着神经网络层数的加深指数增加;j表示卷积核大小;t-d
·
i表示时序数据的输入方向;f1×
j
表示滤波器;tcn模块采用1-d扩张因果卷积以避免未来信息在卷积过程中泄露并扩大感受野。9.根据权利要求6所述的基于深度学习的mstgcn-a热误差建模预测系统,其特征在于,所述自注意力模块的表达式为:att=softmax(ω
u
tanh(ω
w
h
t
))m=att
·
h其中,h为时空图卷积输出的隐藏向量;ω
w
和ω
u
为随机初始化的权重矩阵;softmax激活函数用于确保输出的权重和为1;注意力评分函数att与h相乘实现自注意力过程,经自注意力机制输出的矩阵m通过线性层完成与热误差的映射关系。10.根据权利要求6所述的基于深度学习的mstgcn-a热误差建模预测系统,其特征在于,所述模块m6包括:搭建mstgcn-a深度学习框架,在模型训练部分,采用多个不同工况下的温度数据作为输入,热误差数据作为标签,温度数据经自学习的图邻接矩阵与gcn模块进行温度数据的空间融合,并通过多层gcn-tcn交替训练,经自注意力机制与线性层构造与热误差数据的映射关系;在模型验证部分,采用不同于训练工况的进给速度以验证mstgcn-a模型的泛化性,采
用皮尔森相关系数pcc、平均绝对误差mae和均方误差rmse作为评价指标;验证部分的pcc计算公式为:mae的计算公式为:rmse的计算公式为:其中,n为样本数;为回归模型输出;y
i
为实际样本值。
技术总结
本发明提供了一种基于深度学习的MSTGCN-A热误差建模预测方法和系统,该方法同时对运动轴多个位置的全项热误差建模,并通过空间数据融合避免筛选温度敏感点;模型包括依次构造设置的图邻接矩阵的自学习模块、GCN图卷积模块、TCN时间卷积模块、应用自注意力模块、线性输出层;采用不同工况下的温度和热误差数据进行建模并预测,通过与筛选温度敏感点后的BiLSTM-CNN模型对比,说明了模型的建模预测精度及泛化能力均优于传统方法。度及泛化能力均优于传统方法。度及泛化能力均优于传统方法。
技术研发人员:黄诺帝 赵致暘 陈炜 杜正春 朱利民
受保护的技术使用者:上海交通大学
技术研发日:2023.07.14
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
