一种基于飞行器多源数据融合方法、电子设备及存储介质与流程

未命名 08-14 阅读：321 评论：0

1.本技术涉及多源数据融合方法，尤其涉及多源数据融合方法、电子设备及存储介质，属于多源数据融合技术领域。

背景技术：

2.在飞行器的初步研制阶段，根据飞行器的气动外形需要开展相对应的气动数值计算和气动特性评估，以规划进一步的优化设计方案，因此对于飞行器气动外形进行精准且高效分析是必要的。目前风洞试验和cfd数值模拟是面向飞行器的气动特性分析的主要技术方法。风洞试验能够对于飞行器的气动外形开展精准度较高的气动特性分析，但是存在成本高，试验周期过长等问题。cfd方法采用数值计算对于流体力学中的离散方程进行求解，与风洞试验相比，cfd方法在成本上有所下降，但是在精度上却略低于风洞试验结果。针对风洞试验和cfd数值模拟存在的弊端，需要合理发挥自身优势的基础上，进一步研发出一种既满足低试验成本又能够获取高精度数据分析结果的方法。为满足此需求，一种基于多源气动数据融合的理念被广泛研究与应用，其本质是采用了一种能够映射出低精度数据与高精度数据之间关系的代理模型，并实现对于高精度数据的精准预测。但目前所涉及的方法皆使用固定训练集与测试集的单次建模得到单一的高低精度数据之间的映射关系，容易发生模型过拟合的情况，严重影响了模型精准度与拟和度。

技术实现要素：

3.在下文中给出了关于本发明的简要概述，以便提供关于本发明的某些方面的基本理解。应当理解，这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分，也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序。
4.鉴于此，为解决现有技术中存在的由于模型过拟合导致的模型精准度与拟和度差的技术问题，本发明提供一种基于飞行器多源数据融合方法、电子设备及存储介质。
5.方案一、一种基于飞行器多源数据融合方法，包括以下步骤：s1.获取cfd数据与风洞试验数据，cfd数据为特征变量，风洞试验数据为目标变量；利用机器学习模型建立特征变量与目标变量之间的映射关系；s2.通过重复抽样法对cfd数据与风洞试验数据进行抽取，建立多个训练集和对应的验证集，基于不同的训练集分别建立模型，形成多模型机器学习模型；s3.通过验证集分别求解多模型机器学习模型预测结果的均方误差；s4.记录不同训练集输出的预测结果和不同预测结果获得的均方误差；s5.将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合。
6.优选的，获取cfd数据与风洞试验数据的方式如下：步骤a、对于风洞试验数据进行归纳整理，包括试验信息表和车次表；
步骤b、对于不同风洞数据存储方式整理常规测力试验的标准模板；步骤c、创建数据程序的输出接口，将风洞试验中的原始数据进行转化；步骤d、从转化好的风洞试验数据和cfd数值仿真数据中获取几何外形参数与来流条件参数；步骤e、获取目标变量的力和力矩系数，包括升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；步骤f、将特征变量与目标变量的数据进行数据预处理，包括数据清洗、数据异常处理、数据缺失值填补和数据特征工程。
7.优选的，cfd数据为通过飞行器在不同马赫数、攻角、侧滑角和cfd计算得到的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；风洞试验数据为通过风洞试验分别得出的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数。
8.优选的，机器学习模型使用基于正则化的多种线性回归模型或基于决策树拟合的多种非线性回归模型。
9.优选的，通过验证集分别求解多模型机器学习模型预测结果的均方误差的方法是：设为检验集中的目标真实值、为检验集中的目标预测值、n为检验集中的样本总数，均方误差(mse)简称为m，则m可以表示为：。
10.优选的，将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合的方法是：基于不同预测结果获得的均方误差，求解代理模型权重信息，其表达式为：
11.其中，为模型的均方误差，p为模型的总数，q为调节指数，q值需要根据模型与数据集的差异进行选取；当q值为正数时，分配的权重与其均方误差成反比；当q值为0时，各模型分配的权重相同；当q值为负数时，分配的权重与其均方误差成正比；设为重复抽样法下形成的模型，则基于重抽样加权法下的结果表达式为：。
12.方案二、一种电子设备，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现方案一所述的一种基于飞行器多源数据融合方法的步骤。
13.方案三、一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现方案一所述的一种基于飞行器多源数据融合方法。
14.本发明的有益效果如下：本发明通过重复抽样法形成多个模型结果，从而获取低精度数据与高精度数据之间的多映射关系，进一步使用均方误差的加权方法将多模型的映射关系进行融合，从而有效减轻了模拟过度拟合带来的影响，进而提升代理模型对于气动力系数预测的精准度与拟合度。本发明还可以有效减少传统风洞试验与cfd数值仿真计算
的次数，既满足低试验成本又能够获取高精度数据分析结果，为飞行器的气动特性分析与设计提供了一种方案。
附图说明
15.此处所说明的附图用来提供对本技术的进一步理解，构成本技术的一部分，本技术的示意性实施例及其说明用于解释本技术，并不构成对本技术的不当限定。在附图中：图1为一种基于飞行器多源数据融合方法流程示意图；图2为代理模型选取流程示意图。
具体实施方式
16.为了使本技术实施例中的技术方案及优点更加清楚明白，以下结合附图对本技术的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本技术的一部分实施例，而不是所有实施例的穷举。需要说明的是，在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互组合。
17.实施例1、参照图1-图2说明本实施方式，一种基于飞行器多源数据融合方法，包括以下步骤：s1.获取cfd数据与风洞试验数据，cfd数据为特征变量，风洞试验数据为目标变量；利用机器学习模型建立特征变量与目标变量之间的映射关系；具体的，通过将cfd计算数据（低精度数据）设定为特征变量用以辅助分析风洞试验数据（高精度数据），从而获取cfd计算数据（低精度数据）与风洞试验数据（高精度数据）之间的映射关系；具体的，获取cfd数据与风洞试验数据的方式如下：步骤a、对于风洞试验数据进行归纳整理，包括试验信息表和车次表；步骤b、对于不同风洞数据存储方式整理常规测力试验的标准模板；步骤c、创建数据程序的输出接口，将风洞试验中的原始数据进行转化；步骤d、从转化好的风洞试验数据和cfd数值仿真数据中获取几何外形参数与来流条件参数；步骤e、获取目标变量的力和力矩系数，包括升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；步骤f、将特征变量与目标变量的数据进行数据预处理，包括数据清洗、数据异常处理、数据缺失值填补和数据特征工程等；cfd数据为通过飞行器在不同马赫数、攻角、侧滑角和cfd计算得到的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；风洞试验数据为通过风洞试验分别得出的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；机器学习模型使用基于正则化的多种线性回归模型；在训练集较少时，线性回归方法会面临模型过度拟合的问题。为了避免这种情况发生，对于线性回归模型采取必要的正则化处理。正则化具备增强模型泛化能力的特征。正则化通过在损失函数的基础上加入惩罚项使得权重系数(回归系数)下降以降低模型复杂程度，在一定程度上避免过度拟合并
减少模型的方差。正则化通过在损失函数的基础上加入惩罚项使得权重系数(回归系数)下降以降低模型复杂程度，基于正则化的线性回归方法有lasso回归法，ridge回归法和elasticnet回归法，三种方法通过不同的惩罚项表达方式进行正则化处理。
18.正则化的表达有l1和l2两种形式，通过使用均方误差的线性回归损失函数与惩罚项进行结合，得到最新的损失函数。设为特征变量的真实值、为目标变量的真实值、为目标变量的预测值、为总样本数量、为特征变量的总数量、为正则化的强度、为权重系数(回归系数)；则：基于l1正则化的表达式为：
19.基于l2正则化的表达式为：
20.lasso回归法引入的是上述l1正则化，而ridge回归法则引入了l2正则化。elasticnet回归法介于lasso和ridge之间，在损失函数中同时应用l1和l2正则化。
21.机器学习模型使用基于决策树拟合的多种非线性回归模型；包括random forest方法和adaboost方法。random forest(随机森林)方法通过有放回的随机抽样方式提取多个训练集从而形成多个决策树模型，对于每个决策树模型分别根据信息增益或基尼系数进行有效分裂，最终将多个决策树组合成为随机森林。adaboost(自适应提升)方法原理是将多个决策树形成一种依赖关系，通过分析之前决策树的学习误差率，将更多的权重分配给学习误差率高的样本，从而使权重高的样本在之后的决策树中更受重视。通过迭代的方式不断训练决策树与更新样本权重值，这样的迭代过程直到到达最大的迭代次数或者满足指定的错误率才会终止。
22.s2.对s1选取的机器学习模型（代理模型）通过重复抽样法对cfd数据与风洞试验数据进行抽取，建立多个训练集和对应的验证集，基于不同的训练集分别建立模型，形成多模型机器学习模型；具体的，重复抽样法是指将样本数据进行多次无放回的随机抽样，并将抽样到的样本组成训练集、将未抽样到的样本组成验证集。
23.具体的，训练集为80%到90%数据集中的状态点；具体的，训练集与验证集分配比例为9:1或者8:2，其中，训练集中通过重抽样加权法再次将训练集分为新的训练集与验证集，新的训练集与新的验证集分配比例为9:1或者8:2。验证集用于对经过训练的模型进行超参数调整以达到模型效果最优及进行均方误差求解；测试集则用于最终判断重抽样加权法下的调参整后的模型的预测精度及泛化能力。
24.具体的，本步骤将样本数据进行多次无放回的随机抽样，并将抽样到的样本组成训练集、将未抽样到的样本组成检验集，并基于不同的训练集分别建立模型从而形成多模型。
25.s3.对s2使用重复抽样法后的代理模型，通过重复抽样法建立多个训练集和对应
的验证集，通过验证集分别求解多模型机器学习模型预测结果的均方误差；设为检验集中的目标真实值、为检验集中的目标预测值、n为检验集中的样本总数，均方误差m，表示为
26.s4.记录不同训练集输出的预测结果和不同预测结果获得的均方误差；具体的，将重复抽样法得到的多个新的训练集进行建模训练并记录模型信息，进一步与对应的验证集进行均方误差的评估验证，并记录均方误差的值。
27.s5.将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合。
28.具体的，多模型机器学习模型是多次建模后得到的；具体的，加权法是基于求解出的代理模型中不同训练集下的均方误差，即：基于不同预测结果获得的均方误差，求解代理模型权重信息，其表达式为：
29.其中，为模型的均方误差，p为模型的总数，q为调节指数，q值需要根据模型与数据集的差异进行选取；当q值为正数时，分配的权重与其均方误差成反比；当q值为0时，各模型分配的权重相同；当q值为负数时，分配的权重与其均方误差成正比；设为重复抽样法下形成的模型，则基于重抽样加权法下的结果表达式为：。
30.例如，通过步骤s4形成n个模型，各模型获取到的均方误差合并记录为mse={}。其次，通过上述代理模型权重信息表达式可以求解出各模型的权值w={}。再次，将形成特征变量与目标变量映射关系的代理模型的预测值分别乘以其对应的权值，最终得到融合后的预测结果。
31.实施例2、本发明的计算机装置可以是包括有处理器以及存储器等装置，例如包含中央处理器的单片机等。并且，处理器用于执行存储器中存储的计算机程序时实现上述的一种基于飞行器多源数据融合方法的步骤。
32.所称处理器可以是中央处理单元(central processing unit，cpu)，还可以是其他通用处理器、数字信号处理器 (digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现成可编程门阵列 (field-programmable gate array，fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
33.所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器可以包括
高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡（smart media card, smc），安全数字（secure digital, sd）卡，闪存卡（flash card）、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
34.实施例3、计算机可读存储介质实施例本发明的计算机可读存储介质可以是被计算机装置的处理器所读取的任何形式的存储介质，包括但不限于非易失性存储器、易失性存储器、铁电存储器等，计算机可读存储介质上存储有计算机程序，当计算机装置的处理器读取并执行存储器中所存储的计算机程序时，可以实现上述的一种基于飞行器多源数据融合方法的步骤。
35.所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器（rom，read-only memory）、随机存取存储器（ram，random access memory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。
36.尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

技术特征：
1.一种基于飞行器多源数据融合方法，其特征在于，包括以下步骤：s1.获取cfd数据与风洞试验数据，cfd数据为特征变量，风洞试验数据为目标变量，利用机器学习模型建立特征变量与目标变量之间的映射关系；s2.通过重复抽样法对cfd数据与风洞试验数据进行抽取，建立多个训练集和对应的验证集，基于不同的训练集分别建立模型，形成多模型机器学习模型；s3.通过验证集分别求解多模型机器学习模型预测结果的均方误差；s4.记录不同训练集输出的预测结果和不同预测结果获得的均方误差；s5.将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合。2.根据权利要求1所述一种基于飞行器多源数据融合方法，其特征在于，获取cfd数据与风洞试验数据的方式如下：步骤a、对于风洞试验数据进行归纳整理，包括试验信息表和车次表；步骤b、对于不同风洞数据存储方式整理常规测力试验的标准模板；步骤c、创建数据程序的输出接口，将风洞试验中的原始数据进行转化；步骤d、从转化好的风洞试验数据和cfd数值仿真数据中获取几何外形参数与来流条件参数；步骤e、获取目标变量的力和力矩系数，包括升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；步骤f、将特征变量与目标变量的数据进行数据预处理，包括数据清洗、数据异常处理、数据缺失值填补和数据特征工程。3.根据权利要求2所述一种基于飞行器多源数据融合方法，其特征在于，cfd数据为通过飞行器在不同马赫数、攻角、侧滑角和cfd计算得到的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数；风洞试验数据为通过风洞试验分别得出的升力系数、阻力系数、侧力系数、俯仰力矩系数、偏航力矩系数和滚转力矩系数。4.根据权利要求3所述一种基于飞行器多源数据融合方法，其特征在于，机器学习模型使用基于正则化的多种线性回归模型或基于决策树拟合的多种非线性回归模型。5.根据权利要求4所述一种基于飞行器多源数据融合方法，其特征在于，通过验证集分别求解多模型机器学习模型预测结果的均方误差的方法是：设为检验集中的目标真实值、为检验集中的目标预测值、n为检验集中的样本总数，均方误差m表示为：。6.根据权利要求5所述一种基于飞行器多源数据融合方法，其特征在于，将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合的方法是：基于不同预测结果获得的均方误差，求解代理模型权重信息，其表达式为：；
其中，为模型的均方误差，p为模型的总数，q为调节指数，q值需要根据模型与数据集的差异进行选取；当q值为正数时，分配的权重与其均方误差成反比；当q值为0时，各模型分配的权重相同；当q值为负数时，分配的权重与其均方误差成正比；设为重复抽样法下形成的模型，则基于重抽样加权法下的结果表达式为：。7.一种电子设备，其特征在于，包括存储器和处理器，存储器存储有计算机程序，所述的处理器执行所述计算机程序时实现权利要求1-6任一项所述的一种基于飞行器多源数据融合方法的步骤。8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-6任一项所述的一种基于飞行器多源数据融合方法。

技术总结
本发明提出多源数据融合方法、电子设备及存储介质，属于多源数据融合技术领域。包括以下步骤：S1.获取CFD数据与风洞试验数据，利用机器学习模型建立特征变量与目标变量之间的映射关系；S2.通过重复抽样法对CFD数据与风洞试验数据进行抽取，建立多个训练集和对应的验证集，基于不同的训练集分别建立模型，形成多模型机器学习模型；S3.通过验证集分别求解多模型机器学习模型预测结果的均方误差；S4.记录不同训练集输出的预测结果和不同预测结果获得的均方误差；S5.将训练集输入至多模型机器学习模型中，基于均方误差的加权方法将多模型的预测结果进行结合。解决由于模型过拟合导致的模型精准度与拟和度差的问题。致的模型精准度与拟和度差的问题。致的模型精准度与拟和度差的问题。

技术研发人员：崔榕峰马海刘哲王祥云李鸿岩郭承鹏曹晓峰
受保护的技术使用者：中国航空工业集团公司沈阳空气动力研究所
技术研发日：2023.05.24
技术公布日：2023/8/13

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种风电齿轮箱的跨域故障诊断方法、系统、介质及设备 下一篇：一种基于距离场的神经网络边缘检测算法的制作方法

一种基于飞行器多源数据融合方法、电子设备及存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于飞行器多源数据融合方法、电子设备及存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表