影响金属-金属胶接性能的多因素的分析方法及装置
未命名
09-17
阅读:150
评论:0
1.本发明属于金属-金属胶接技术领域,具体涉及一种影响金属-金属胶接性能的多因素的分析方法及装置。
背景技术:
2.应用于航天空间技术的高压气瓶按应用和结构可分为两大类:金属气瓶和复合材料气瓶。复合材料气瓶相较于金属气瓶,由于其重量轻、耗能低、承压能力强以及可靠性高等优异性能是作为人造卫星、航天飞机、运载火箭以及空间站用以储存各类液体或气体维持分系统正常工作理想的压力容器。但由于复合材料气瓶服役环境较为苛刻,复合材料气瓶被广泛应用还面临诸多问题,主要表现在以下两个方面:对于液氢气瓶而言需要克服超低温力学性能和氢分子渗透,而对于液氧气瓶而言需克服材料与液氧相容性问题。基于在复合材料气瓶本体上进行金属覆层,形成金属内胆-复合材料层-金属包覆层复合结构的高压气瓶,充分发挥金属与复合材料的各自优势,满足其抗冲击、防渗漏的需求。其中,复合材料层受金属内衬及金属包覆层双层保护,能有效避免与液氧相容性及渗透率问题。
3.考虑到复合材料气瓶是个不规则的旋转体,需要根据复合材料气瓶的型面尺寸分别设计模具经多道次冲压、拉深等工艺成型瓶嘴金属包覆层、瓶嘴收口处金属包覆层、瓶底金属包覆层以及筒身金属包覆层,复合材料气瓶进行金属覆层时,为了使得金属包覆层能够完全包覆复合材料气瓶本体,筒身金属包覆层与瓶嘴金属包覆层以及瓶底金属包覆层之间涉及一个搭接工艺,需要开展金属-金属间的胶接工艺实验。
4.现有技术主要通过正交实验法来进行工艺参数优化,正交实验法只能基于少量数据样本进行工艺参数优化,由于数据量样本较少,可能其优化的工艺参数并非最佳;且对于数据量较多的样本,正交试验无法对其做出合理的实验设计以及工艺参数优化,同时,还具有工艺实验耗时较长,耗材成本较高等缺点。
技术实现要素:
5.本发明的目的在于提供一种基于机器学习技术预测影响金属-金属的胶接性能的多因素的重要性的分析方法,具有实验成本小,预测准确率高的优点。
6.为实现上述目的,本发明提供一种影响金属-金属胶接性能的多因素的分析方法,包括以下步骤:
7.(1)获取数据集,所述数据集包括多个数据包,每个所述数据包包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;
8.(2)构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;
9.(3)基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围内进
行优化更新;其中,
10.每次迭代训练包括:将所述数据集按照预设比例随机分割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预测值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;
11.(4)基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;
12.(5)将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。
13.在一种具体的实施方式中,所述多因素包括搭接长度、胶层厚度和表面处理方式,所述解释结果还包括多因素对拉剪强度的影响的重要性排序,所述重要性排序从高到低依次为表面处理方式、胶层厚度和搭接长度。
14.在一种具体的实施方式中,所述预测结果包括对应最佳金属-金属胶接性能的搭接长度、胶层厚度和表面处理方式。
15.在一种具体的实施方式中,对应最佳金属-金属胶接性能的搭接长度为26mm、胶层厚度为0.1mm、以及表面处理方式为800#砂纸打磨+阳极化。
16.在一种具体的实施方式中,所述获取数据集的步骤包括:
17.采用abaqus软件建立金属搭接的几何模型,所述几何模型由两层铝板和夹设于两个铝板中间的胶层组成,且一层铝板部分搭接于另一层铝板上;
18.对所述几何模型的铝板与胶层间设置内聚力接触,并进行网格划分和边界条件设置,构建得到金属-金属胶接的有限元模型;
19.对所述有限元模型的准确性进行验证,得到误差小于预设误差的目标有限元模型;
20.根据影响金属-金属胶接性能的多因素多水平确定n个仿真方案,所述因素水平包括搭接长度、胶层厚度和表面处理方式,n为大于等于500小于等于1000的整数;
21.将所述n个仿真方案作为输入,利用所述目标有限元模型进行仿真,获取每个仿真方案对应的最大拉剪载荷;
22.基于每个仿真方案对应的最大拉剪载荷,获取每个仿真方案对应的拉剪强度;
23.将每个仿真方案及与每个仿真方案对应的拉剪强度进行组合得到n个仿真数据,每个仿真数据对应一个数据包,其中,所述仿真方案为x数据,所述拉剪强度为y数据。
24.在一种具体的实施方式中,所述验证有限元模型的准确性的步骤包括:
25.步骤a、根据影响金属-金属胶接性能的多因素多水平建立正交表格,所述多因素包括搭接长度、胶层厚度和表面处理方式;
26.步骤b、依据所述正交表格确定的m个胶接方案进行金属-金属胶接试验,获取每个胶接方案对应的最大实验拉剪载荷,m为大于8小于等15的整数;
27.步骤c、将所述m个胶接方案作为输入,利用所述有限元模型进行仿真,获取每个胶接方案对应的最大仿真拉剪载荷;
28.步骤d、基于每个所述胶接方案对应的最大实验拉剪载荷和最大仿真拉剪载荷,计算误差;
29.步骤e、将所述误差的绝对值与预设误差进行比较,在所述误差的绝对值小于预设误差,则所述有限元模型为目标有限元模型。
30.在一种具体的实施方式中,所述验证有限元模型的准确性的步骤还包括:
31.在所述误差的绝对值大于预设误差,更新设置内聚力接触时输入的参数得到新的金属-金属胶接的有限元模型,并重复步骤c至步骤e,所述输入的参数包括对应胶层的初始刚度、临界牵引力以及断裂能。
32.在一种具体的实施方式中,所述步骤(4)包括:
33.将基于多次迭代训练获取的每组训练结果中的均方根误差和回归系数建立一一对应的关系;
34.对所有组训练结果中的均方根误差进行排序,并确定最小均方根误差;
35.在所述最小均方根误差对应的回归系数大于或等于预设回归系数时,确定与最小均方根误差对应的xgboost算法模型为最优模型。
36.在一种具体的实施方式中,步骤(3)多次迭代训练的迭代终止条件为迭代次数为80~150次。
37.本发明还提供一种影响金属-金属胶接性能的多因素的分析装置,所述分析装置包括:
38.获取模块,用于获取数据集,所述数据集包括多个数据包,每个所述数据包包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;
39.构建模块,用于构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;
40.训练模块,用于基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围内进行优化更新;其中,
41.每次迭代训练包括:将所述数据集按照预设比例切割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预设值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;
42.确定模块,用于基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;
43.输出模块,用于将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。
44.本发明的有益效果至少包括:
45.本发明提供一种影响金属-金属胶接性能的多因素的分析方法,该分析方法通过
随机分割的训练集和每次迭代优化更新的xgboost算法模型对模型进行训练,用测试集计算判断xgboost算法模型的可靠性的训练结果,每次迭代训练得到一组训练结果,迭代的次数达到预设次数后,将所有的训练结果进行比较,确定对应最好训练结果的模型为最优模型,再将模型可解释工具shap导入最优模型,输出解释结果和预测结果;这样,通过机器学习能够预测各因素对金属-金属胶接性能影响的规律及主次,指导胶接工艺方案的制定,并为复合材料气瓶进行金属覆层提供理论支持;相比于正交工艺试验,大大减少试验次数和耗材成本,且优化工的工艺参数更加准确。
46.除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
47.图1为本发明一实施例提供的影响金属-金属胶接性能的多因素的分析方法的步骤流程图;
48.图2为本发明一实施例构建的有限元模型的结构图;
49.图3为本发明一实施例提供的10个胶接方案对应的最大实验拉剪载荷和最大仿真拉剪载荷的对比图;
50.图4为本发明提供的拉剪强度真实值与拉剪强度预测值的对比图;
51.图5为本发明提供的最优模型输出的各因素重要性排序图;
52.图6为本发明提供的最优模型预测的最佳工艺参数图;
53.图7为本发明一实施例提供的影响金属-金属胶接性能的多因素的分析方法的模块图。
具体实施方式
54.以下结合附图对本发明实施例进行详细说明,但是本发明可以根据权利要求限定和覆盖多种不同实施方式。
55.正交实验法是进行工艺实验优化常用的方法,但相对而言,其只能基于少量数据样本进行工艺参数优化,由于数据量样本较少,可能其优化的工艺参数并非最佳。且对于数据量较多的样本,正交试验无法对其做出合理的实验设计以及工艺参数优化,同时还具有实验耗时较长,耗材成本较高的缺点。
56.本发明为了获得更多的样本数据,结合有限元法能够弥补这一缺失。随着人工智能与大数据技术的爆炸式发展,机器学习是一种很有前途的技术,在数据模型拟合和数据挖掘方面的优势越来越明显,可以利用大量积累的实验数据来提高新材料设计和研发效率,大大降低时间和成本的消耗,已成功应用于材料科学和工程制造等领域,与此同时,机器学习技术也是揭示和描述材料性能与各特征之间复杂关系的有力工具,可以将各特征与目标输出之间的复杂关系进行可视化展示。
57.xgboost算法模型作为机器学习boosting模型的其中一种,通过将许多树模型集成在一起,形成一个很强的分类器,其优势在于可以给预测模型带来预测能力的提升,在代价函数里加入了正则项,用于控制模型的复杂度,降低了模型的方差,使学习出来的模型更加简单,降低了模型的过拟合风险。
58.本发明结合通过有限元仿真获取数据集,大大减少试验次数和耗材成本,基于机器学习技术预测金属-金属的胶接性能与评估各个特征(搭接长度、胶层厚度、表面处理方式)对模型输出(胶接拉剪强度)的重要性排序,并优化出一组较为合理的工艺参数,为复合材料气瓶进行金属覆层提供理论支持。
59.请结合参阅图1,本发明提供一种影响金属-金属胶接性能的多因素的分析方法,所述分析方法包括以下步骤:
60.步骤s10、获取数据集,所述数据集包括多个数据包,每个所述数据包均包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;
61.在本实施例中,所述多因素包括搭接长度、胶层厚度和表面处理方式。
62.每个数据包包括由搭接长度的水平、胶层厚度的水平、表面处理方式的水平组成的x数据和由拉剪强度真实值组成的y数据,所述拉剪强度真实值与搭接长度的水平、胶层厚度的水平、表面处理方式的水平相对应。可以将x数据理解为变量,而y数据是由变量确定的结果。
63.在本实施例中,所述数据集为基于有限元仿真获取的仿真数据组成,拉剪强度真实值为以x数据为输入数据,利用有限元仿真获取的仿真结果。
64.在本实施例中,所述数据集可以包括500组数据、600组数据、800组数据等其他数量的数据,在此不做限定,可以理解的是,数据集的数据数量越多,相应的,运算量会增大,且预测结果更为准确。
65.优选地,所述获取数据集的步骤包括:
66.步骤(1)采用abaqus软件建立金属搭接的几何模型,所述几何模型由两层铝板和夹设于两个铝板中间的胶层组成,且一层铝板部分搭接于另一层铝板上;
67.步骤(2)对所述几何模型的铝板与胶层间设置内聚力接触,并进行网格划分和边界条件设置,构建得到金属-金属胶接的有限元模型;
68.设置内聚力接触输入的参数包括对应胶层的初始刚度、临界牵引力以及断裂能。
69.网格划分和边界条件设置具体为:请结合参阅图2,铝板与胶层全局网格尺寸为1,其中每块铝板单元总数为6250,网格类型为c3d8r线性六面体单元,胶层单元总数需根据胶层胶接区域搭接长度而定(在胶层长度为15mm,宽度为25mm时,对应的胶层单元总数为375),网格类型coh3d8型线性六面体单元,厚度方向采用扫掠方式划分网格。参考点rp-2与固定端进行耦合,边界条件为encastre,参考点rp-1与加载端进行耦合,施加位移约束。
70.步骤(3)对所述有限元模型的准确性进行验证,得到误差小于预设误差的目标有限元模型;
71.通过对建立的有限元模型的准确性进行验证,可以保证训练集和测试集数据的准确性,以提高预测精度。
72.优选地,所述对所述有限元模型的准确性进行验证的步骤包括:
73.步骤a、根据影响金属-金属胶接性能的多因素多水平建立正交表格,所述多因素包括搭接长度、胶层厚度和表面处理方式;
74.在本实施例中,多因素包括搭接长度、胶层厚度和表面处理方式,其中因素搭接长度对应的水平包括15mm、20mm、25mm,因素胶层厚度对应的水平包括0.1 mm、0.2mm、0.3 mm,
表面处理方式对应的水平包括800#砂纸打磨+阳极化处理、400#砂纸打磨+阳极化处理、1200#砂纸打磨+阳极化处理。
75.基于预先确定的多因素和多因素的水平,利用正交试验设计方法进行试验设计,建立的正交表格如表1所示。
76.表1多因素和多水平对应的正交表格
[0077][0078]
备注:表面处理方式中的值表示砂纸的目数打磨+阳极化处理。
[0079]
从表1可以看出,正交表格共对应10个胶接方案,分别为序号1对应的第一胶接方案,搭接长度25mm、胶层厚度0.3mm和表面处理方式800#砂纸打磨;序号2对应的第二胶接方案,搭接长度20mm、胶层厚度0.1mm和表面处理方式1200#砂纸打磨;序号3对应的第三胶接方案,搭接长度15mm、胶层厚度0.1mm和表面处理方式800#砂纸打磨;
……
每一行均对应一个胶接方案,在此不再进行一一说明。
[0080]
步骤b、依据所述正交表格确定的m个胶接方案进行金属-金属胶接试验,获取每个胶接方案对应的最大实验拉剪载荷,m为大于8小于等15的整数;
[0081]
为了方便理解,通过举例的方式对正交表格的序号1对应的胶接方案进行的金属-金属胶接试验进行介绍,具体如下:
[0082]
提供第一铝板和第二铝板,分别对所述第一铝板和所述第二铝板进行预处理,所述预处理包括对所述第一金属板的搭接区域和所述第二金属板的搭接区域依次进行的砂纸打磨处理和磷酸阳极化处理,砂纸的目数为800;
[0083]
此处所述第一铝板的搭接区域和所述第二铝板的搭接区域是指第一铝板和第二铝板相连接的区域。
[0084]
使用刮胶工具分别在所述第一铝板的搭接区域和所述第一铝板的搭接区域涂覆预设厚度的dw-3低温胶,所述预设厚度为0.15mm,且所述搭接区域的长度(搭接长度)为25mm;
[0085]
将所述第一铝板和所述第二铝板通过dw-3低温胶进行连接得到待固化的搭接结
构,再将所述待固化的搭接结构置于热压罐中进行固化,得到固化的搭接结构;
[0086]
固化工艺可以为:按照1.5℃/min的升温速率升温至60℃,并在60℃保温480min,然后随炉冷却,且整个固化过程所述真空袋内抽0.1mpa真空,所述热压罐内加压0.05mpa。
[0087]
对所述搭接结构的最大拉剪载荷进行测量,得到的最大拉剪载荷为10717.1n;
[0088]
按照预设公式计算拉剪强度,得到的拉剪强度为17.1/mpa,其中,预设公式为:
[0089][0090]
τ为粘结剂的拉剪强度,mpa;p为拉剪破坏所需的最大载荷,n;b与l分别为试样搭接区域的宽度和长度,mm。
[0091]
所有胶接试验的步骤相同,其区别仅在于搭接长度不同或者胶层厚度不同或者打磨处理时的砂纸目数不相同。
[0092]
各个胶接方案及其对应的实验结果如表2所示:
[0093]
表2 10组胶接方案及其力学性能
[0094][0095]
备注:表面处理方式中的值表示砂纸的目数打磨+阳极化处理。
[0096]
步骤c、将所述m个胶接方案作为输入,利用所述有限元模型进行仿真,获取每个胶接方案对应的最大仿真拉剪载荷;
[0097]
步骤d、基于每个所述胶接方案对应的最大实验拉剪载荷和最大仿真拉剪载荷,计算误差;
[0098]
步骤e、将所述误差与预设误差进行比较,在所述误差小于预设误差,则所述有限元模型为目标有限元模型。
[0099]
为了方便说明,将所述胶接方案对应的最大仿真拉剪载荷标记为p
si
,将与所述胶接方案对应的最大实验拉剪载荷标记为p
vi
,则误差e的计算公式为:
[0100]
e=(p
vi-p
si
)/p
vi
*100%
[0101]
在所述误差的绝对值小于预设误差,则该有限元模型准确度高,该有限元模型为目标有限元模型,步骤(4)利用该目标有限元模型进行仿真,以获取与n个仿真方案一一对应的最大拉剪载荷。
[0102]
在所述误差的绝对值大于预设误差,更新设置内聚力接触时输入的参数得到新的金属-金属胶接的有限元模型,并对新的金属-金属胶接的有限元模型的准确性进行验证,包括利用新的金属-金属胶接的有限元模型进行仿真,重新获取10个胶接方案对应的最大仿真拉剪载荷,以及重新计算误差等,即再次重复步骤步骤c至步骤e;直至所述误差的绝对值小于预设误差,其中,所述输入的参数包括对应胶层的初始刚度、临界牵引力以及断裂能。
[0103]
在本实施例中,所述预设误差为6%,若计算得到的误差e位于【-6%6%】之间,则所述误差的绝对值小于预设误差,可以将利用所述有限元模型计算得到的各个仿真方案的拉剪强度。
[0104]
在本实施例中,所述初始刚度、所述临界牵引力和所述断裂能如表3和表4所示。
[0105]
表3胶层法向拉伸力学性能
[0106][0107]
表4不同表面处理方式下胶层剪切测试的力学性能
[0108][0109]
请结合参阅图3,图3为10个胶接方案对应的最大实验拉剪载荷和最大仿真拉剪载荷的对比图,从图3可以看出,仿真数据和实验数据相差较小,误差在预设误差范围内。
[0110]
步骤(4)根据影响金属-金属胶接性能的多因素多水平确定n个仿真方案,所述因素水平包括搭接长度、胶层厚度和表面处理方式,n为大于等于500小于等于1000的整数;
[0111]
在本实施例中,多因素包括搭接长度、胶层厚度和表面处理方式,其中因素搭接长度对应的水平的取值范围为10~30mm,增量为1mm,即搭接长度对应的水平包括10mm、11mm、12mm、13mm
……
28mm、29mm、30mm,此处没有穷举,即起始值为10mm,然后按照1mm的增量确定下一个搭接长度;因素胶层厚度对应的水平的取值范围为0.1~1mm,增量为0.1mm,即胶层厚度对应的水平包括0.1mm、0.2mm、0.3mm、0.4mm、0.5mm、0.6mm、0.7mm、0.8mm、0.9mm和1.0mm;表面处理方式为400#+磷酸阳极化、800#+磷酸阳极化和1200#+磷酸阳极化中的一种。
[0112]
将搭接长度的水平、胶层厚度的水平和表面处理方式的水平进行组合即可得到n个仿真方案,每个仿真方案包括搭接长度的水平、胶层厚度的水平和表面处理方式的水平。
[0113]
步骤(5)将所述n个仿真方案作为输入,利用所述目标有限元模型进行仿真,获取每个仿真方案对应的最大拉剪载荷;
[0114]
步骤(6)基于每个仿真方案对应的最大拉剪载荷,获取每个仿真方案对应的拉剪强度;
[0115]
基于最大拉剪载荷,按照预设公式计算拉剪强度,其中,预设公式为:
[0116][0117]
τ为粘结剂的拉剪强度,mpa;p为拉剪破坏所需的最大载荷,n;b与l分别为试样搭接区域的宽度和长度,mm。
[0118]
步骤(7)将每个仿真方案及与每个仿真方案对应的拉剪强度进行组合得到n个仿真数据,每个仿真数据对应一个数据包,其中,所述仿真方案为x数据,所述拉剪强度为y数据。
[0119]
在本实施例中,仿真数据的数量为630个,即所述数据集包括630个数据包。可以理解的是,每个仿真数据就是一个数据包,每个仿真数据对应的仿真方案即为所述数据包中的x数据,每个仿真数据对应的拉剪强度即为所述数据包中的y数据,即,仿真得到的拉剪强度为所述数据包中的拉剪强度真实值。
[0120]
在本发明中,通过胶接实验数据来判断有限元仿真的准确性,并利用准确性高的有限元仿真获取数据集,一方面,仿真数据准确率高,能够有效提高预测精度,另一方面,基于有限元仿真获取数据集可以降低人工实验的成本和降低人工实验的误差。
[0121]
在本实施例中,将有限元法仿真获取的n组数据整合到一个excel文件中,在jupyter notebook中读取所有组数据。
[0122]
步骤s20、构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;
[0123]
xgboost算法模型的建立,导入xgboost算法模型,设置模型的超参数范围,具体地:booster=【“gbtree”,“dart”】,eta=【0.1,0.2,0.3,0.4,0.5】,gamma=【0,1】,max_depth=【2,4,6,8】,min_child_weight=【0,1】,reg_lamda=【0.1,0.5,1,2】,objective=“reg:squarederror”。
[0124]
在本实施例中,xgboost算法模型超参数的初始值为:booster=“gbtree”,eta=0.3,gamma=0,max_depth=6,min_child_weight=1,reg_lamda=1,objective=“reg:squarederror”,其中:booster=’gbtree’表示使用基于树的模型进行每次迭代运行;eta为学习率,默认值为0.3,在更新中使用步长收缩防止过拟合;gamma为指定分裂所需损失函数减少的最小值,默认值为0,分裂节点时,损失函数减小值只有大于等于gamma节点才分裂,gamma值越大算法越保守,越不容易过拟合,但性能不一定能保证,需要平衡;max_depth表示一棵树的最大深度,默认值为6,增加此值将使模型更复杂,从而产生过拟合;min_child_weight用于控制过度拟合,默认值为1,值若太高,易导致拟合不足。reg_lambda表示l2正则化权重项,默认值为1,增加此值将使模型更保守;objective=”reg:squarederror”表示定义了最小平方误差损失函数。
[0125]
步骤s30、基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围
内进行优化更新;其中,
[0126]
每次迭代训练包括:将所述数据集按照预设比例随机分割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预测值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;
[0127]
可以理解的是,计算训练结果是基于测试集中与x数据对应的y数据和通过xgboost算法模型预测与x数据对应的拉剪强度预测值进行计算。
[0128]
在本发明中,通过所述训练集的随机获取和xgboost算法模型的超参数的组合,以最小化均方根误差为目标,来对xgboost算法模型进行训练,并通过测试集对xgboost算法模型进行测试,每次测试会获取一组训练结果。
[0129]
在本实施例中,所述预设比例为4:1,即所述训练集占所述数据集的80%,所述测试集占所述数据集的20%。
[0130]
每次迭代训练时,均会重新随机分割数据集以得到不同的训练集和测试集。
[0131]
在本实施例中,所述训练集共包括630*0.8=504个数据包,所述测试集共包括630*0.2=128个数据包。
[0132]
优选地,迭代训练的次数为80~150次,在本实施例中,迭代训练的次数为100次。
[0133]
为了方便理解,进行举例说明,第一次迭代训练的过程为,将630个数据包组成的训练集进行随机分割得到第一次迭代的训练集和第一次迭代的测试集,利用第一次迭代的训练集对初始的xgboost算法模型进行训练,得到第一次迭代训练好的xgboost算法模型,然后以第一次迭代的测试集作为输入,利用第一次迭代训练好的xgboost算法模型计算测试集中128个数据包中的x数据对应的拉剪强度预测值,基于与x数据对应的y数据(拉剪强度真实值)和与x数据对应的拉剪强度预测值,按照均方差的计算公式和回归系数的公式分别进行计算,得到包括均方根误差和回归系数的训练结果;由于迭代次数小于100次,不满足迭代终止的条件,继续进行第二次迭代训练;基于设置的超参数范围,调整超参数的值,得到第二次迭代对应的第二次xgboost算法模型,再次将630个数据包组成的训练集进行随机分割得到第二次迭代的训练集和第二次迭代的测试集,利用第二次迭代的训练集对第二次xgboost算法模型进行训练,得到第二次迭代训练好的xgboost算法模型,然后以第二次迭代的测试集作为输入,利用第二次迭代训练好的xgboost算法模型计算测试集中128个数据包中的x数据对应的拉剪强度预测值,基于与x数据对应的y数据(拉剪强度真实值)和与x数据对应的拉剪强度预测值,按照均方差的计算公式和回归系数的公式分别进行计算,得到包括均方根误差和回归系数的训练结果;由于迭代次数小于100次,不满足迭代终止的条件,继续进行第三次迭代训练;
……
,在此不再穷举,每次迭代训练其区别主要在于xgboost算法模型不相同、以及训练集和测试集不相同。完成100次迭代训练后,共得到100组训练结果,每组训练结果包括均方根误差和回归系数,且两者是相对应的。
[0134]
均方根误差(rmse)的计算公式为:
[0135][0136]
其中,n为样本总数,y
ai
为拉剪强度真实值,y
pi
为拉剪强度预测值
[0137]
回归系数(r2)的计算公式为:
[0138][0139]
其中,n为样本总数,y
ai
为拉剪强度真实值,y
pi
为拉剪强度预测值,为拉剪强度真实值的所有值的平均值。
[0140]
具体地,拉剪强度真实值来源于测试集,拉剪强度预测值为通过xgboost算法模型计算得到。
[0141]
步骤s40、基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;
[0142]
该步骤包括:
[0143]
将基于多次迭代训练获取的每组训练结果中的均方根误差和回归系数建立一一对应的关系;
[0144]
将所有组训练结果中的均方根误差进行排序,并确定最小均方根误差;
[0145]
在所述最小均方根误差对应的回归系数大于或等于预设回归系数时,确定与最小均方根误差对应的xgboost算法模型为最优模型。
[0146]
正常来说,均方根误差最小,其对应的回归系数也最大,所以通过均方根误差可以确定最优模型;增加回归系数进一步判断,是为了筛除非正常数据。
[0147]
在本实例中,所述预设回归系数为0.95。
[0148]
与最小均方根误差对应的xgboost算法模型可以理解:若第82次迭代训练获取的均方根误差为最小均方根误差,那么82次迭代训练对应的xgboost算法模型为最优模型。
[0149]
在本实施例中,最优模型对应的超参数为:booster=’gbtree’,eta=0.2,gamma=0,max_depth=2,min_child_weight=0,reg_lambda=0.2,objective=”reg:squarederror”。
[0150]
请结合参阅图4,图4中的identity表示实验测得的拉剪强度值与预测的拉剪强度值完全相等,作为一条参考线,regression line显示与参考线存在一定偏差,其中根据回归系数r2为0.995表明模型预测可靠性较好。
[0151]
步骤s50、将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。
[0152]
导入模型可解释工具shap(shapley additive explanations),评估各个特征对拉剪强度的影响。请结合参阅图5,从5可以看出,表面处理方式的影响值为+0.55、搭接长度的影响值为+0.24、胶层厚度的影响值为+0.26;所述多因素对金属-金属胶接性能影响的重要性排序从高到低依次为表面处理方式、胶层厚度和搭接长度。
[0153]
需要说明的是,“+”代表起正向影响,
“‑”
代表起负向影响。
[0154]
优选地,所述预测结果包括对应最佳金属-金属胶接性能的搭接长度、胶层厚度和
表面处理方式。请结合参阅图6,从图6可以看出模型输出预测的拉剪强度平均值为15.82mpa,当搭接长度为26mm、胶层厚度为0.1mm以及表面处理方式为800#砂纸打磨+磷酸阳极化时模型预测的拉剪强度为16.27mpa,具有最佳的金属-金属胶接性能。可以将搭接长度26mm、胶层厚度0.1mm,表面处理方式为800#砂纸打磨+阳极化处理确定为最佳的工艺参数。
[0155]
将上述预测结果应用于对复合材料气瓶进行金属覆层时,各个参数值不可能控制十分精确,肯定存在一些误差,结合实际操作,建议:搭接长度值控制26mm
±
2mm以内,胶层厚度尽可能薄一些,接近0.1mm即可,覆层的金属板料表面处理方式为800#砂纸打磨+阳极化处理。
[0156]
本发明还提供一种影响金属-金属胶接性能的多因素的分析装置,所述分析装置100包括:
[0157]
获取模块10,用于获取数据集,所述数据集包括多个数据包,每个所述数据包包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;
[0158]
构建模块20,用于构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;
[0159]
训练模块30,用于基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围内进行优化更新;其中,
[0160]
每次迭代训练包括:将所述数据集按照预设比例切割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预测值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;
[0161]
确定模块40,用于基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;
[0162]
输出模块50,用于将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。
[0163]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的内容,在此不再赘述。
[0164]
以上内容是结合具体的优选实施方式对本发明作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和替换,都应当视为属于本发明的保护范围。
技术特征:
1.一种影响金属-金属胶接性能的多因素的分析方法,其特征在于,包括以下步骤:(1)获取数据集,所述数据集包括多个数据包,每个所述数据包包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;(2)构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;(3)基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围内进行优化更新;其中,每次迭代训练包括:将所述数据集按照预设比例随机分割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预测值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;(4)基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;(5)将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。2.根据权利要求1所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述多因素包括搭接长度、胶层厚度和表面处理方式,所述解释结果还包括多因素对拉剪强度的影响的重要性排序,所述重要性排序从高到低依次为表面处理方式、胶层厚度和搭接长度。3.根据权利要求2所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述预测结果包括对应最佳金属-金属胶接性能的搭接长度、胶层厚度和表面处理方式。4.根据权利要求3所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,对应最佳金属-金属胶接性能的搭接长度为26mm、胶层厚度为0.1mm、以及表面处理方式为800#砂纸打磨+阳极化。5.根据权利要求1所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述获取数据集的步骤包括:采用abaqus软件建立金属搭接的几何模型,所述几何模型由两层铝板和夹设于两个铝板中间的胶层组成,且一层铝板部分搭接于另一层铝板上;对所述几何模型的铝板与胶层间设置内聚力接触,并进行网格划分和边界条件设置,构建得到金属-金属胶接的有限元模型;对所述有限元模型的准确性进行验证,得到误差小于预设误差的目标有限元模型;根据影响金属-金属胶接性能的多因素多水平确定n个仿真方案,所述因素水平包括搭接长度、胶层厚度和表面处理方式,n为大于等于500小于等于1000的整数;将所述n个仿真方案作为输入,利用所述目标有限元模型进行仿真,获取每个仿真方案对应的最大拉剪载荷;
基于每个仿真方案对应的最大拉剪载荷,获取每个仿真方案对应的拉剪强度;将每个仿真方案及与每个仿真方案对应的拉剪强度进行组合得到n个仿真数据,每个仿真数据对应一个数据包,其中,所述仿真方案为x数据,所述拉剪强度为y数据。6.根据权利要求5所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述验证有限元模型的准确性的步骤包括:步骤a、根据影响金属-金属胶接性能的多因素多水平建立正交表格,所述多因素包括搭接长度、胶层厚度和表面处理方式;步骤b、依据所述正交表格确定的m个胶接方案进行金属-金属胶接试验,获取每个胶接方案对应的最大实验拉剪载荷,m为大于8小于等15的整数;步骤c、将所述m个胶接方案作为输入,利用所述有限元模型进行仿真,获取每个胶接方案对应的最大仿真拉剪载荷;步骤d、基于每个所述胶接方案对应的最大实验拉剪载荷和最大仿真拉剪载荷,计算误差;步骤e、将所述误差的绝对值与预设误差进行比较,在所述误差的绝对值小于预设误差,则所述有限元模型为目标有限元模型。7.根据权利要求6所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述验证有限元模型的准确性的步骤还包括:在所述误差的绝对值大于预设误差,更新设置内聚力接触时输入的参数得到新的金属-金属胶接的有限元模型,并重复步骤c至步骤e,所述输入的参数包括对应胶层的初始刚度、临界牵引力以及断裂能。8.根据权利要求1至7任一项所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,所述步骤(4)包括:将基于多次迭代训练获取的每组训练结果中的均方根误差和回归系数建立一一对应的关系;对所有组训练结果中的均方根误差进行排序,并确定最小均方根误差;在所述最小均方根误差对应的回归系数大于或等于预设回归系数时,确定与最小均方根误差对应的xgboost算法模型为最优模型。9.根据权利要求1所述的影响金属-金属胶接性能的多因素的分析方法,其特征在于,步骤(3)多次迭代训练的迭代终止条件为迭代次数为80~150次。10.一种影响金属-金属胶接性能的多因素的分析装置,其特征在于,所述分析装置包括:获取模块,用于获取数据集,所述数据集包括多个数据包,每个所述数据包包括由影响金属-金属胶接性能的多因素的水平组成的x数据和由拉剪强度真实值组成的y数据,每个所述数据包中的x数据和y数据具有一一对应的关系;构建模块,用于构建xgboost算法模型,并定义所述xgboost算法模型的超参数范围;训练模块,用于基于所述数据集和xgboost算法模型进行多次迭代训练,得到多组用于判断xgboost算法模型的可靠性的训练结果,所述训练结果包括均方根误差和回归系数,且每次迭代训练对应的xgboost算法模型的超参数在设置的xgboost算法模型的超参数范围内进行优化更新;其中,
每次迭代训练包括:将所述数据集按照预设比例切割为训练集和测试集,以所述训练集为输入数据,对xgboost算法模型进行训练得到训练后的xgboost算法模型;将所述测试集作为输入数据输入到训练后的xgboost算法模型,基于所述测试集中所有数据包的x数据获取与所述测试集中每个所述数据包的x数据对应的拉剪强度预测值;基于与所述测试集中每个所述数据包的x数据对应的拉剪强度真实值和拉剪强度预设值,获取与此次迭代训练对应的训练结果,所述拉剪强度真实值为x数据对应的y数据;确定模块,用于基于多次迭代训练所获取的多组训练结果,确定最优模型,所述最优模型对应的训练结果中的均方根误差最小且回归系数大于或等于预设回归系数;输出模块,用于将模型可解释工具shap导入最优模型,输出解释结果和预测结果,所述解释结果包括影响金属-金属胶接性能的多因素分别对拉剪强度的影响值。
技术总结
本发明提供一种影响金属-金属胶接性能的多因素的分析方法。所述分析方法包括以下步骤:获取数据集;构建Xgboost算法模型,并定义所述Xgboost算法模型的超参数范围;基于所述数据集和Xgboost算法模型进行多次迭代训练,得到多组用于判断Xgboost算法模型的可靠性的训练结果;基于多次迭代训练所获取的多组训练结果,确定最优模型;将模型可解释工具SHAP导入最优模型,输出解释结果和预测结果。本发明提供的分析方法通过机器学习能够预测各因素对金属-金属胶接性能影响的规律及主次,指导胶接工艺方案的制定,并为复合材料气瓶进行金属覆层提供理论支持。属覆层提供理论支持。属覆层提供理论支持。
技术研发人员:湛利华 冯景鹏 丁晟 马博林 夏云霓 周昊
受保护的技术使用者:中南大学
技术研发日:2023.06.15
技术公布日:2023/9/16
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种辊压成片装置的制作方法 下一篇:用于电池的箱体组件及电池的制作方法
