一种航天器的应急规避机动控制方法及装置与流程

未命名 08-14 阅读：117 评论：0

1.本发明涉及航天器技术领域，特别涉及一种航天器的应急规避机动控制方法及装置。

背景技术：

2.密集的空间碎片已对航天器的安全造成严重威胁，因此航天器必须具备对碎片的自主感知、决策和规避机动能力。受限于星载探测设备性能和空间中复杂多变的光照条件，航天器可能存在对部分微小碎片的漏检情况，当重新检测到此类碎片时，双方距离可能已相当接近，此时必须立即进行应急规避机动。
3.相关技术中，可以采用基于配点法的规避轨迹规划方法(例如高斯伪谱法等)输出航天器的优化轨迹，以指导航天器对空间碎片进行规避。然而，航天器在机动过程中面临着多种复杂非线性的约束条件(例如角速度有界约束、姿态禁止指向约束以及考虑航天器外形的精细化碰撞约束等)和业务连续性需求，上述方法难以快速解算出优化的控制指令，从而无法满足应急规避过程中的快速反应需求。
4.基于此，目前亟待需要一种航天器的应急规避机动控制方法及装置来解决相关技术中难以快速解算出优化的控制指令的技术问题。

技术实现要素：

5.为了解决相关技术中难以快速解算出优化的控制指令的技术问题，本发明实施例提供了一种航天器的应急规避机动控制方法及装置。
6.第一方面，本发明实施例提供了一种航天器的应急规避机动控制方法，包括：
7.获取航天器相对目标空间碎片的状态信息；其中，所述目标空间碎片被看作为球形包络体，所述状态信息包括相对位置、相对速度、所述航天器的姿态和光源指向；
8.将所述状态信息输入到预先训练好的推力输出模型，得到与所述状态信息对应的所述航天器在本体系下的推力，以将所述航天器在本体系下的推力作为所述航天器的规避机动控制指令；其中，所述推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；
9.将所述状态信息输入到预先训练好的姿控力矩输出模型，得到与所述状态信息对应的所述航天器在本体系下的姿控力矩，以将所述航天器在本体系下的姿控力矩作为所述航天器的规避机动控制指令；其中，所述姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。
10.第二方面，本发明实施例还提供了一种航天器的应急规避机动控制装置，包括：
11.获取模块，用于获取航天器相对目标空间碎片的状态信息；其中，所述目标空间碎片被看作为球形包络体，所述状态信息包括相对位置、相对速度、所述航天器的姿态和光源指向；
12.第一输出模块，用于将所述状态信息输入到预先训练好的推力输出模型，得到与
所述状态信息对应的所述航天器在本体系下的推力，以将所述航天器在本体系下的推力作为所述航天器的规避机动控制指令；其中，所述推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；
13.第二输出模块，用于将所述状态信息输入到预先训练好的姿控力矩输出模型，得到与所述状态信息对应的所述航天器在本体系下的姿控力矩，以将所述航天器在本体系下的姿控力矩作为所述航天器的规避机动控制指令；其中，所述姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。
14.第三方面，本发明实施例还提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现本发明任一实施例所述的方法。
15.第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行本发明任一实施例所述的方法。
16.本发明实施例提供了一种航天器的应急规避机动控制方法及装置，通过获取航天器相对目标空间碎片的状态信息，然后将该状态信息分别输入到预先训练好的推力输出模型和姿控力矩输出模型，就可以得到与该状态信息对应的航天器在本体系下的推力和姿控力矩，即得到了与该状态信息对应的航天器的规避机动控制指令。因此，上述技术方案可以解决相关技术中难以快速解算出优化的控制指令的技术问题。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
18.图1是本发明一实施例提供的一种航天器的应急规避机动控制方法流程图；
19.图2是本发明一实施例提供的一种电子设备的硬件架构图；
20.图3是本发明一实施例提供的一种航天器的应急规避机动控制装置结构图；
21.图4是本发明一实施例提供的航天器的整体规避机动控制方法的流程示意图；
22.图5是本发明一实施例提供的“状态-力矩”深度神经网络结构示意图；
23.图6是本发明一实施例提供的“状态-推力”深度神经网络结构示意图；
24.图7是本发明一实施例提供的仿真测试中航天器的外形；
25.图8是本发明一实施例提供的仿真测试中航天器与碎片包络间的最近距离；
26.图9是本发明一实施例提供的仿真测试中航天器在本体系的推力；
27.图10是本发明一实施例提供的仿真测试中航天器在本体系x轴的姿控力矩；
28.图11是本发明一实施例提供的仿真测试中航天器在本体系y轴的姿控力矩；
29.图12是本发明一实施例提供的仿真测试中航天器在本体系z轴的姿控力矩；
30.图13是本发明一实施例提供的仿真测试中航天器在本体系x轴的姿态角速度；
31.图14是本发明一实施例提供的仿真测试中航天器在本体系y轴的姿态角速度；
32.图15是本发明一实施例提供的仿真测试中航天器在本体系z轴的姿态角速度；
33.图16是本发明一实施例提供的仿真测试中航天器在本体系的滚转角；
34.图17是本发明一实施例提供的仿真测试中航天器在本体系的俯仰角；
35.图18是本发明一实施例提供的仿真测试中航天器在本体系的偏航角；
36.图19是本发明一实施例提供的仿真测试中航天器姿态指向约束情况。
具体实施方式
37.为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
38.请参考图1，本发明实施例提供了一种航天器的应急规避机动控制方法，该方法包括：
39.步骤100：获取航天器相对目标空间碎片的状态信息；其中，目标空间碎片被看作为球形包络体，状态信息包括相对位置、相对速度、航天器的姿态和光源指向；
40.步骤102：将状态信息输入到预先训练好的推力输出模型，得到与状态信息对应的航天器在本体系下的推力，以将航天器在本体系下的推力作为航天器的规避机动控制指令；其中，推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；
41.步骤104：将状态信息输入到预先训练好的姿控力矩输出模型，得到与状态信息对应的航天器在本体系下的姿控力矩，以将航天器在本体系下的姿控力矩作为航天器的规避机动控制指令；其中，姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。
42.在本实施例中，通过获取航天器相对目标空间碎片的状态信息，然后将该状态信息分别输入到预先训练好的推力输出模型和姿控力矩输出模型，就可以得到与该状态信息对应的航天器在本体系下的推力和姿控力矩，即得到了与该状态信息对应的航天器的规避机动控制指令。因此，上述技术方案可以解决相关技术中难以快速解算出优化的控制指令的技术问题。
43.下面描述图1所示的各个步骤的执行方式。
44.针对步骤100：
45.在轨应用时，航天器首先基于感知算法对碎片形心定位，然后从形心生成球体安全包络，最后将航天器与包络的相对状态、航天器自身状态、光源指向等输入深度神经网络，即可快速解算出当前的最优姿轨机动控制指令，实现对近距离空间碎片的实时反应和安全规避。上述过程中存在的细节如下：
46.(1)球体安全包络的半径为rs＝r
cover
+δr，其中，r
cover
表示在现有感知测量结果下使包络刚好完全覆盖碎片表面的半径，δr＞0表示考虑感知测量误差条件下确保包络完全覆盖碎片的保险距离。
47.(2)“状态-推力”网络在在轨应用时的输出规则如下式所示：
[0048][0049]
针对步骤102和104：
[0050]
在描述本发明实施例提供的方法前，首先需要对以下几点做出约定：
[0051]
(1)本发明实施例提供的方法的适用环境限定为：空间碎片与航天器(后面简称为“双方”)相距数百至一千米，双方预期交会时间仅数十秒；空间碎片建模为等效安全半径rs的动态球体包络(即要求航天器外形与碎片形心的最近相对距离大于rs)。
[0052]
(2)本发明实施例提供的方法以刚体航天器为研究对象，假设航天器轨道为近圆轨道，主推力器安装在航天器质心，指向本体系-x轴。以航天器探测到碎片时的初始状态为参考航天器的初始状态，在vvlh坐标系下建立航天器六自由度非线性姿轨动力学模型用于轨迹规划：
[0053][0054]
式中，r＝[x,y,z]
t
为航天器相对参考航天器的位置；n为参考航天器的轨道角速度；q＝[q0,q1,q2,q3]
t
为姿态四元数；ω＝[ω
x
,ωy,ωz]
t
为本体系下的姿态角速度；fb＝[f,0,0]
t
和τc＝[m
x
,my,mz]
t
作为航天器姿轨机动的控制输入，分别为本体系下的推力和姿控力矩矢量；m为航天器质量，由于规避过程时间较短，可假设质量恒定；c
ob
为本体系到vvlh坐标系的转换矩阵；j为转动惯量矩阵；ω
×
表示ω的反对称矩阵。
[0055]
(3)在本发明实施例提供的方法中，航天器推力模型选取工程中常见的bang-bang型推力模型，即f的取值仅包括0和最大值f
max
两个离散的值，而姿控力矩τc具有连续取值空间。
[0056]
(4)为确保对地天线、相机等任务载荷的业务连续性，本发明实施例提供的方法将航天器规避过程中的业务连续需求定义为航天器能在最短时间内恢复规避前的姿态指向并保持姿态稳定，如下式所示，这要求航天器对碎片的反应要适度：
[0057]
[0058]
式中，tf和t0分别为末端时刻和初始时刻。
[0059]
在此基础上，本发明实施例提供的方法提出了一种基于学习的航天器应急规避多约束轨迹快速规划方法，其示意图如图4所示，包括如下步骤：
[0060]
步骤1：设定规避机动的末端和路径约束条件以及优化指标，初始化应急规避场景，采用基于配点法的轨迹规划方法(例如高斯伪谱法等)生成相应的最优轨迹。具体分以下几步：
[0061]
·
步骤1-1：设定航天器的各类约束指标、成功规避条件以及优化指标，具体如下：
[0062]
(1)状态/输入有界约束
[0063]
航天器的姿态角速度和控制输入需满足相应的有界约束条件，如下式所示：
[0064][0065]
式中，ωi为所述航天器在本体系下的角速度；ω
i,max
为所述航天器在本体系下的最大角速度；f为所述航天器在本体系下的推力；f
max
为所述航天器在本体系下的最大推力；mi为所述航天器在本体系下的姿控力矩；m
i,max
为所述航天器在本体系下的最大姿控力矩。
[0066]
(2)姿态指向约束
[0067]
航天器装备有多种光学敏感器，其在姿轨机动过程中必须避免太阳等光源进入敏感器视场，即光源方向矢量和敏感器的视线轴方向夹角不低于敏感器安全视场角，以保证敏感器的正常工作，因此需对航天器的姿态指向进行限制，如下式所示：
[0068][0069]
式中，g为装备的敏感器数量，r
b,i
和σi分别为敏感器i在本体系下的指向和安全视场角；ro为光源在vvlh坐标系下的指向。
[0070]
此外，需要设定航天器的初始和末端姿态指向约束，如下式所示：
[0071][0072]
式中，q(t0)和q(tf)分别为所述航天器在初始时刻和末端时刻的姿态指向。
[0073]
(3)考虑航天器外形的精细化碰撞约束
[0074]
不同于一般的轨道规避机动，近距离危险交会时，由于航天器除主体结构外一般还安装有太阳帆板或天线等附属结构，如果简单将航天器的碰撞约束建模为规则形状包络，例如球体、椭球体及其组合体，则会严重压缩航天器的姿轨规避机动空间，导致轨迹规划方法难以计算可行解，因此还需要结合航天器的实际外形，构建精细化的碰撞约束。具体来说，以航天器质心r为基准点，以d为间距，将其外形离散化为n个坐标点，各点在本体系下相对于基准点的坐标为r
s,i
(i＝1,2,
…
,n)，则碰撞约束定义如下式所示：
[0075][0076]
式中，r
t
为目标空间碎片的实时位置；c
ob
为航天器由本体系到vvlh坐标系的转换矩阵；r
s,i
为航天器各坐标点相对于质心的坐标；r为航天器的质心；rs为球形包络体的半
径；n为将航天器的外形离散化后的坐标点数量。
[0077]
(4)成功规避条件
[0078]
在航天器始终满足上述约束条件的前提下，当航天器处于其相对于威胁的位置矢量与威胁速度矢量的夹角大于等于90
°
时的区域，且双方最近距离大于距离阈值l
t
(l
t
＞rs)时，可判定航天器规避成功，该条件可建模为如下式的形式：
[0079][0080]
||r(t
′
)-r
t
(t
′
)||＞l
t
＞rs[0081]
式中，r
t
(t
′
)为目标空间碎片在t
′
时刻时的位置；r(t
′
)为航天器在t
′
时刻时的位置；为航天器在t
′
时刻时的速度；l
t
为预设距离阈值；rs为球形包络体的半径。
[0082]
(5)优化指标
[0083]
基于业务连续性需求，设定优化指标为mintf。
[0084]
·
步骤1-2：初始化应急规避场景，并生成轨迹规划的初始解，具体如下：
[0085]
(1)航天器初始状态设置
[0086]
设定航天器的初始位置、速度和角速度分别为r(0)＝[0,0,0]
t m、和ω(0)＝[0,0,0]
t
°
/s，并生成随机的姿态四元数q(0)和光线指向ro，二者(姿态四元数和光线指向)需满足姿态指向约束，如不满足则重新随机生成上述值。
[0087]
(2)碎片初始状态设置
[0088]
基于如下碎片初始状态设置方法，可确保若航天器不进行规避机动，则必然与碎片发生交会。首先，设定航天器自探测到威胁至双方发生预期交会的时间tr。在此基础上，定义并随机初始化威胁相对航天器的速度幅值δv∈[δv
min
,δv
max
]、方位夹角α∈[-π,π]和β∈[-0.5π,0.5π]，则碎片的位置方程设定如下式所示：
[0089]rt
(t)＝(t
r-t)
·
δv
·
[cosαcosβ,sinαcosβ,sinβ]
t
[0090]
(3)轨迹规划初始解设置
[0091]
该初始解包括初始值和末端值。对于时间，设定初始值为0，末端值为预期交会时间tr；对于状态量，设定初始值和末端值均为相应初始状态；对于控制量，设定初始值和末端值均为0。
[0092]
·
步骤1-3：将上述约束条件、优化指标、规避场景和初始解代入典型基于配点法的轨迹规划方法(例如高斯伪谱法等)中，并选定相应非线性规划问题求解算法(例如序列二次规划算法)，生成由多个配点组成的最优轨迹。
[0093]
步骤2：对各配点对应的状态/控制量进行插值处理，获取各状态/控制量的时变函数，并对上述时变函数进行复核，如不满足约束条件，则适当调整航天器和轨道威胁的相对距离或相对速度的参数重新生成轨迹，直至复核结果满足约束条件。具体分以下几步：
[0094]
·
步骤2-1：对生成的各状态/控制量进行线性插值处理，获取各状态/控制量的时变函数，其中，由于推力幅值具有离散特性，因此可设定当f的时变函数大于0.5f
max
时，令f＝f
max
，否则令f＝0。
[0095]
·
步骤2-2：基于步骤2-1得到的各控制量(f和τc)时变函数驱动航天器动力学模型，对模型输出的各状态进行复核，判断其是否满足相应上述约束条件，其中，姿态指向约
束条件可放宽至如下式所示。如果各状态均满足相应约束条件，则跳转至步骤3，否则跳转至步骤2-3。
[0096][0097]
式中，q
ε
＞0和ω
ε
＞0分别为趋近于0的阈值。
[0098]
·
步骤2-3：通过提升tr或降低δv的方式重新初始化碎片状态，继而重新生成轨迹并进行状态复核。如果各状态均满足相应约束条件，则跳转至步骤3，否则增加轨迹规划算法的迭代次数，重新生成轨迹并进行状态复核。如果各状态均满足相应约束条件，则跳转至步骤3，而如果迭代次数增至上限时仍无法满足相应约束条件，跳转至步骤1-2，重新进行场景的初始化。
[0099]
步骤3：设定一个数据集，将复核后的时变函数在各个控制器采样时刻下产生的状态/控制量存入数据集中。
[0100]
步骤4：微调碎片的状态，然后以通过复核的最优轨迹作为基于配点法的轨迹规划方法的初始解，重复上述规划/复核/微调循环过程，扩充状态/控制量数据集。具体分以下几步：
[0101]
·
步骤4-1：按下式的方式微调碎片的初始位置和速度：
[0102][0103]
式中，r
′
t
(0)和r
t
(0)分别表示微调后和原有的碎片初始位置；rand∈[0,1]为随机数；α
′
∈[-π,π]和β
′
∈[-0.5π,0.5π]为随机方位夹角。
[0104]
·
步骤4-2：复核微调后碎片是否会与航天器发生交会，如果发生交会，则跳转至步骤4-3，否则跳转至步骤4-1重新微调碎片状态。
[0105]
·
步骤4-3：将步骤2通过复核的配点作为基于配点法的轨迹规划算法的初始解，重复上述规划/复核/微调循环过程，扩充状态/控制量数据集。
[0106]
步骤5：在收集一定数据后，跳转至步骤1-2，重新初始化应急规避场景，然后重复上述过程，进一步将不同的规避场景下的状态/控制量数据扩充至数据集中，直至达到设定的场景迭代次数，跳转至步骤6。
[0107]
步骤6：基于航天器执行机构特性针对性地设计“状态-控制量”深度神经网络，基于所建立的数据集，采用监督式学习方法训练网络，训练完成后提取网络用于在轨应急规避。具体分以下几步：
[0108]
·
步骤6-1：设计面向轨迹规划控制量(推力和姿控力矩)解算的深度神经网络，实现“状态-控制量”的直接快速映射。考虑到航天器推力和控制力矩分别具有离散和连续动
作特性，因此可将“状态-力矩”和“状态-推力”的映射问题分别建模为基于深度神经网络的数据拟合和数据分类问题，并设计不同的全连接映射网络(分别称为“状态-力矩”和“状态-推力”网络)，如图5和6所示。
[0109]
图5中，“状态-力矩”网络由一层输入层、多层隐含层和一层输出层组成，最终输出的是不同连续参数的拟合值，其中，隐含层的激活函数均为指数线性单元(elu)，如下式所示：
[0110][0111]
则网络的前向传播过程如下式所示：
[0112]fk
＝f
elu
(f
k-1wk-1
+b
k-1
),2≤k≤u+2
[0113]
式中，fk(1≤k≤u)表示深度神经网络第k层的变量；u为隐含层层数；w
k-1
表示f
k-1
和fk之间的权重矩阵；b
k-1
表示fk的偏置向量。
[0114]
图6中，“状态-推力”网络在“状态-力矩”网络的基础上增加了一层softmax层，最终输出的是不同离散事件发生的概率，概率计算公式如下：
[0115][0116]
式中，yi为softmax层第i个节点输出的概率值；zi为输出层对应节点的输出值；c为输出层节点数(同softmax层节点数)。
[0117]
注1：如果发动机为连续型推力模型，则可将“状态-力矩”和“状态-推力”两类网络合并，合并后网络结构(称为“状态-控制量”网络)与“状态-力矩”网络相同，由一层输入层、多层隐含层和一层输出层组成。
[0118]
·
步骤6-2：将“状态-控制量”数据集中的数据整理为两类网络需要的输入输出形式，并设置网络的超参数。
[0119]
两类网络的输入向量input完全相同，由归一化的相对位置速度、航天器姿态以及光照指向矢量组成，如下式所示：
[0120][0121]“状态-力矩”网络的输出向量outputm由姿控力矩组成，如下式所示：
[0122]
outputm＝τc[0123]“状态-推力”网络的输出向量outputf由发动机执行开机和关机动作的概率组成(分别表示为p
open
和p
close
)，如下式所示：
[0124][0125]
注2：如果发动机为连续型推力模型，则“状态-控制量”网络的输出output由经过标准化的姿控力矩和推力组成，如下式所示：
[0126][0127]
最后，设置隐含层层数、各层节点数、初始权值等网络超参数。
[0128]
步骤6-3：设置损失函数形式、优化器类型等监督式学习参数，基于上述数据集训练神经网络，训练结束后提取两类深度神经网络用于在轨应急规避。
[0129]
对于多个碎片同时从不同方向与航天器发生近距离交会的极特殊情况，假设航天器最多可同时应对的碎片数量为w，需要对上述步骤进行如下修正：
[0130]
(1)在碎片数量为1的场景下执行步骤1至步骤6，然后在碎片数量为2的场景下重复上述步骤，直至处于碎片数量为w的场景且执行完步骤6，然后再跳转至步骤7；
[0131]
(2)步骤1-1中，将成功规避条件修正为所有碎片均满足上述约束条件；
[0132]
(3)步骤1-2中，需要初始化所有碎片状态；
[0133]
(4)步骤4-1中，将状态微调扩大至所有碎片；
[0134]
(5)设计w套“状态-力矩”网络和w套“状态-推力”网络，各网络的输入向量如下式所示，其中，r
t,i
表示第i个碎片的位置，当在轨检测到j(1≤j≤w)个同时出现的碎片需要应急规避时，调用第j套“状态-力矩”和“状态-推力”网络，输入令i＝j时的下式，即可生成相应规避动作：
[0135][0136]
即，上述方法包括如下步骤：
[0137]
步骤1：设定规避机动的末端和路径约束条件以及优化指标，初始化应急规避场景，采用基于配点法的轨迹规划方法生成相应的最优轨迹；
[0138]
步骤2：对生成的各状态/控制量进行插值处理，获取各状态/控制量的时变函数，并对上述时变函数进行复核，如不满足约束条件，则适当调整航天器和轨道威胁的相对距离或数值逼近规划方法的参数重新生成轨迹，直至复核结果满足约束条件；
[0139]
步骤3：设定一个数据集，将复核后的时变函数在各个控制器采样时刻下产生的状态/控制量存入数据集中；
[0140]
步骤4：微调碎片的状态，然后以通过复核的最优轨迹作为基于配点法的轨迹规划方法的初始解，重复上述规划/复核/微调循环过程，扩充状态/控制量数据集；
[0141]
步骤5：在收集一定数据后，重新初始化应急规避场景，然后重复上述过程，进一步将不同场景下的状态/控制量数据扩充至数据集中，直至达到设定的场景迭代次数；
[0142]
步骤6：基于航天器执行机构特性针对性地设计“状态-控制量”深度神经网络，基于所建立的数据集，采用监督式学习方法训练网络，训练完成后提取网络用于在轨应急规避；
[0143]
步骤7：在轨应用时，航天器首先基于感知算法对碎片形心定位，然后从形心生成球体安全包络，最后将航天器与包络的相对状态、航天器自身状态、光源指向等输入深度神经网络，即可快速解算出当前的最优姿轨机动控制指令。
[0144]
本发明方法没有复杂的数值计算过程，能在满足多种约束条件和尽量确保航天器业务连续的前提下快速规划应急规避机动的姿轨动作指令，规划速度显著强于基于配点法的传统轨迹规划方案。
[0145]
综上，本发明针对近距离交会的空间碎片，提出一种能够适应多种复杂约束条件、满足业务连续性和规划实时性需求的航天器应急规避轨迹快速规划方法：首先，初始化航天器的应急规避场景，并依托基于配点法的轨迹规划方法生成最优多约束规避轨迹，并进行轨迹的可行性复核；然后，以生成的轨迹配点作为初始解，通过微调场景重新生成新的轨迹，收集一定数据后重置场景，并通过上述“规划-复核-微调-重置”循环建立和扩充轨迹规划状态/控制量数据集；在此基础上，基于航天器执行机构特性针对性地设计“状态-控制量”深度神经网络，基于所建立的数据集，采用监督式学习方法训练网络；最后，提取“状态-控制量”网络用于在轨应急规避，基于航天器对碎片的感知信息实时解算姿轨动作指令。
[0146]
下面结合图7至图19介绍航天器对近距离交会空间碎片执行应急规避动作的仿真测试情况。
[0147]
航天器仿真参数如下：有界约束参数为m
x,max
＝m
y,max
＝m
z,max
＝5n/m和ω
x,max
＝ω
y,max
＝ω
z,max
＝3
°
/s；姿态指向约束参数为r
b,1
＝[0,0,1]
t
、r
b,2
＝[0,0,-1]
t
、σ1＝σ2＝30
°
和ro＝[-0.5774,-0.5774,-0.5774]
t
；发动机最大推力为f
max
＝25n；质量为m＝500kg；转动惯量矩阵为j＝100
·
i3×3kg
·
m2。空间碎片仿真参数如下：预期交会时间为tr＝20s；相对方位和速度参数为α＝-30
°
、β＝-25
°
和δv＝30m/s；安全半径为rs＝2m。
[0148]
航天器外形由一个2
×2×
2m3的主体结构和对称分布于其两侧的两块5
×
2m2太阳帆板组成，离散点间距为d＝0.5m，见图7。仿真计算机配置为：cpu amd ryzen 7-5800 3.40ghz，ram 16gb。
[0149]
仿真结果如下：航天器与碎片包络的最近距离见图8；航天器的推力、姿控力矩、姿态角速度、姿态角以及姿态指向约束情况分别见图9-图19。
[0150]
结果可见，基于本发明方法规划相应姿轨机动轨迹，能使航天器在满足多种复杂约束条件的前提下，对近距离交会的空间碎片进行应急安全规避，且姿态指向能够在航天器脱离危险状态后快速恢复至初始状态，尽量确保航天器的业务连续性。在计算时间方面，本发明方法的单步运行时间约在7-8ms范围内，达到准实时，能够满足相应的快速反应需求。
[0151]
如图2、图3所示，本发明实施例提供了一种航天器的应急规避机动控制装置。装置实施例可以通过软件实现，也可以通过硬件或者软硬件结合的方式实现。从硬件层面而言，如图2所示，为本发明实施例提供的一种航天器的规避机动控制装置所在电子设备的一种硬件架构图，除了图2所示的处理器、内存、网络接口、以及非易失性存储器之外，实施例中装置所在的电子设备通常还可以包括其他硬件，如负责处理报文的转发芯片等等。以软件实现为例，如图3所示，作为一个逻辑意义上的装置，是通过其所在电子设备的cpu将非易失性存储器中对应的计算机程序读取到内存中运行形成的。
[0152]
如图3所示，本实施例提供的一种航天器的应急规避机动控制装置，包括：
[0153]
获取模块300，用于获取航天器相对目标空间碎片的状态信息；其中，所述目标空间碎片被看作为球形包络体，所述状态信息包括相对位置、相对速度、所述航天器的姿态和光源指向；
[0154]
第一输出模块302，用于将所述状态信息输入到预先训练好的推力输出模型，得到与所述状态信息对应的所述航天器在本体系下的推力，以将所述航天器在本体系下的推力作为所述航天器的规避机动控制指令；其中，所述推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；
[0155]
第二输出模块304，用于将所述状态信息输入到预先训练好的姿控力矩输出模型，得到与所述状态信息对应的所述航天器在本体系下的姿控力矩，以将所述航天器在本体系下的姿控力矩作为所述航天器的规避机动控制指令；其中，所述姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。
[0156]
在本发明实施例中，获取模块300可用于执行上述方法实施例中的步骤100，第一输出模块302可用于执行上述方法实施例中的步骤102，第二输出模块304可用于执行上述方法实施例中的步骤104。
[0157]
在本发明的一个实施例中，所述样本状态信息、所述样本推力和所述样本姿控力矩是通过如下方式得到的：
[0158]
将预设约束条件、预设优化目标、预设初始场景和预设初始解输入到基于配点法的轨迹规划模型中，并选定预设的非线性规划问题求解算法，生成由多个配点组成的最优规划轨迹；其中，每个所述配点均对应有各自的样本状态信息、样本推力和样本姿控力矩；
[0159]
对各所述配点的样本状态信息、样本推力和样本姿控力矩进行复核，如果满足所述预设约束条件，则将当前配点的样本状态信息、样本推力和样本姿控力矩作为最终的训练样本，否则调整所述航天器相对所述目标空间碎片的相对距离或相对速度来重新生成由多个配点组成的最优规划轨迹，直至所有所述配点的复核结果均满足所述预设约束条件。
[0160]
在本发明的一个实施例中，所述预设约束条件包括有界约束、姿态指向约束、碰撞约束和规避条件约束；
[0161]
所述预设优化目标为mintf；其中，tf为所述航天器机动的末端时刻；
[0162]
所述预设初始场景包括所述航天器和所述目标空间碎片的初始状态；其中，所述航天器和所述目标空间碎片的初始状态满足所述姿态指向约束；
[0163]
所述预设初始解包括：所述航天器在初始时刻和末端时刻的状态信息相等，所述航天器在初始时刻和末端时刻的推力和姿控力矩均为零。
[0164]
在本发明的一个实施例中，所述有界约束为：
[0165][0166]
式中，ωi为所述航天器在本体系下的角速度；ω
i,max
为所述航天器在本体系下的最大角速度；f为所述航天器在本体系下的推力；f
max
为所述航天器在本体系下的最大推力；mi为所述航天器在本体系下的姿控力矩；m
i,max
为所述航天器在本体系下的最大姿控力矩；
[0167]
所述姿态指向约束为：
[0168]
[0169][0170]
式中，和σi分别为敏感器i在本体系下的指向和安全视场角；为所述航天器由本体系到vvlh坐标系的转换矩阵的转置；ro为光源在vvlh坐标系下的指向；g为所述航天器的敏感器数量；q(t0)和q(tf)分别为所述航天器在初始时刻和末端时刻的姿态指向；
[0171]
所述碰撞约束为：
[0172][0173]
式中，r
t
为所述目标空间碎片的实时位置；c
ob
为所述航天器由本体系到vvlh坐标系的转换矩阵；r
s,i
为所述航天器各坐标点相对于质心的坐标；r为所述航天器的质心；rs为所述球形包络体的半径；n为将所述航天器的外形离散化后的坐标点数量；
[0174]
所述规避条件约束为：
[0175][0176]
||r(t
′
)-r
t
(t
′
)||＞l
t
＞rs[0177]
式中，r
t
(t
′
)为所述目标空间碎片在t
′
时刻时的位置；r(t
′
)为所述航天器在t
′
时刻时的位置；为所述航天器在t
′
时刻时的速度；l
t
为预设距离阈值；rs为所述球形包络体的半径。
[0178]
在本发明的一个实施例中，所述对各所述配点的样本状态信息、样本推力和样本姿控力矩进行复核，包括：
[0179]
对各所述配点的样本状态信息、样本推力和样本姿控力矩分别进行插值处理，得到各所述配点的样本状态信息、样本推力和样本姿控力矩的时变函数；
[0180]
对各所述配点的样本状态信息、样本推力和样本姿控力矩的时变函数进行复核。
[0181]
在本发明的一个实施例中，所述预设初始场景用于通过微调后继续执行所述将预设约束条件、预设优化目标、预设初始场景和预设初始解输入到基于配点法的轨迹规划模型中；
[0182]
所述预设初始场景是通过如下公式进行微调的：
[0183][0184]
式中，r
′
t
(0)和r
t
(0)分别表示微调后和原有的所述目标空间碎片的初始位置；rs为所述球形包络体的半径；rand∈[0,1]为随机数；α
′
∈[-π,π]和β
′
∈[-0.5π,0.5π]分别为随机方位夹角；为所述目标空间碎片的初始速度；δv为所述航天器相对所述目标空
间碎片的速度幅值；α∈[-π,π]和β∈[-0.5π,0.5π]分别为初始方位夹角。
[0185]
在本发明的一个实施例中，所述推力输出模型和所述姿控力矩输出模型均有w套，假设w个空间碎片同时从不同方向与所述航天器发生交会；
[0186]
当所述航天器检测到j(1≤j≤w)个同时出现的空间碎片需要规避机动时，调用第j套所述推力输出模型和所述姿控力矩输出模型，得到对应的所述航天器在本体系下的推力和姿控力矩。
[0187]
可以理解的是，本发明实施例示意的结构并不构成对一种航天器的应急规避机动控制装置的具体限定。在本发明的另一些实施例中，一种航天器的应急规避机动控制装置可以包括比图示更多或者更少的部件，或者组合某些部件，或者拆分某些部件，或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。
[0188]
上述装置内的各模块之间的信息交互、执行过程等内容，由于与本发明实施例提供的方法实施例基于同一构思，具体内容可参见本发明实施例提供的方法实施例中的叙述，此处不再赘述。
[0189]
本发明实施例还提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现本发明任一实施例中的一种航天器的应急规避机动控制方法。
[0190]
本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序在被处理器执行时，使所述处理器执行本发明任一实施例中的一种航天器的应急规避机动控制方法。
[0191]
具体地，可以提供配有存储介质的系统或者装置，在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该系统或者装置的计算机(或cpu或mpu)读出并执行存储在存储介质中的程序代码。
[0192]
在这种情况下，从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此程序代码和存储程序代码的存储介质构成了本发明的一部分。
[0193]
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如cd-rom、cd-r、cd-rw、dvd-rom、dvd-ram、dvd-rw、dvd+rw)、磁带、非易失性存储卡和rom。可选择地，可以由通信网络从服务器计算机上下载程序代码。
[0194]
此外，应该清楚的是，不仅可以通过执行计算机所读出的程序代码，而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作，从而实现上述实施例中任意一项实施例的功能。
[0195]
此外，可以理解的是，将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展模块中设置的存储器中，随后基于程序代码的指令使安装在扩展板或者扩展模块上的cpu等来执行部分和全部实际操作，从而实现上述实施例中任一实施例的功能。
[0196]
需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固
有的要素。
[0197]
本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。
[0198]
最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

技术特征：
1.一种航天器的应急规避机动控制方法，其特征在于，包括：获取航天器相对目标空间碎片的状态信息；其中，所述目标空间碎片被看作为球形包络体，所述状态信息包括相对位置、相对速度、所述航天器的姿态和光源指向；将所述状态信息输入到预先训练好的推力输出模型，得到与所述状态信息对应的所述航天器在本体系下的推力，以将所述航天器在本体系下的推力作为所述航天器的规避机动控制指令；其中，所述推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；将所述状态信息输入到预先训练好的姿控力矩输出模型，得到与所述状态信息对应的所述航天器在本体系下的姿控力矩，以将所述航天器在本体系下的姿控力矩作为所述航天器的规避机动控制指令；其中，所述姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。2.根据权利要求1所述的方法，其特征在于，所述样本状态信息、所述样本推力和所述样本姿控力矩是通过如下方式得到的：将预设约束条件、预设优化目标、预设初始场景和预设初始解输入到基于配点法的轨迹规划模型中，并选定预设的非线性规划问题求解算法，生成由多个配点组成的最优规划轨迹；其中，每个所述配点均对应有各自的样本状态信息、样本推力和样本姿控力矩；对各所述配点的样本状态信息、样本推力和样本姿控力矩进行复核，如果满足所述预设约束条件，则将当前配点的样本状态信息、样本推力和样本姿控力矩作为最终的训练样本，否则调整所述航天器相对所述目标空间碎片的相对距离或相对速度来重新生成由多个配点组成的最优规划轨迹，直至所有所述配点的复核结果均满足所述预设约束条件。3.根据权利要求2所述的方法，其特征在于，所述预设约束条件包括有界约束、姿态指向约束、碰撞约束和规避条件约束；所述预设优化目标为min t
f
；其中，t
f
为所述航天器机动的末端时刻；所述预设初始场景包括所述航天器和所述目标空间碎片的初始状态；其中，所述航天器和所述目标空间碎片的初始状态满足所述姿态指向约束；所述预设初始解包括：所述航天器在初始时刻和末端时刻的状态信息相等，所述航天器在初始时刻和末端时刻的推力和姿控力矩均为零。4.根据权利要求3所述的方法，其特征在于，所述有界约束为：式中，ω
i
为所述航天器在本体系下的角速度；ω
i,max
为所述航天器在本体系下的最大角速度；f为所述航天器在本体系下的推力；f
max
为所述航天器在本体系下的最大推力；m
i
为所述航天器在本体系下的姿控力矩；m
i,max
为所述航天器在本体系下的最大姿控力矩；所述姿态指向约束为：
式中，和σ
i
分别为敏感器i在本体系下的指向和安全视场角；为所述航天器由本体系到vvlh坐标系的转换矩阵的转置；r
o
为光源在vvlh坐标系下的指向；g为所述航天器的敏感器数量；q(t0)和q(t
f
)分别为所述航天器在初始时刻和末端时刻的姿态指向；所述碰撞约束为：式中，r
t
为所述目标空间碎片的实时位置；c
ob
为所述航天器由本体系到vvlh坐标系的转换矩阵；r
s,i
为所述航天器各坐标点相对于质心的坐标；r为所述航天器的质心；r
s
为所述球形包络体的半径；n为将所述航天器的外形离散化后的坐标点数量；所述规避条件约束为：||r(t
′
)-r
t
(t
′
)||＞l
t
＞r
s
式中，r
t
(t
′
)为所述目标空间碎片在t
′
时刻时的位置；r(t
′
)为所述航天器在t
′
时刻时的位置；为所述航天器在t
′
时刻时的速度；l
t
为预设距离阈值；r
s
为所述球形包络体的半径。5.根据权利要求2所述的方法，其特征在于，所述对各所述配点的样本状态信息、样本推力和样本姿控力矩进行复核，包括：对各所述配点的样本状态信息、样本推力和样本姿控力矩分别进行插值处理，得到各所述配点的样本状态信息、样本推力和样本姿控力矩的时变函数；对各所述配点的样本状态信息、样本推力和样本姿控力矩的时变函数进行复核。6.根据权利要求2所述的方法，其特征在于，所述预设初始场景用于通过微调后继续执行所述将预设约束条件、预设优化目标、预设初始场景和预设初始解输入到基于配点法的轨迹规划模型中；所述预设初始场景是通过如下公式进行微调的：式中，r
′
t
(0)和r
t
(0)分别表示微调后和原有的所述目标空间碎片的初始位置；r
s
为所述球形包络体的半径；rand∈[0,1]为随机数；α
′
∈[-π,π]和β
′
∈[-0.5π,0.5π]分别为随机方位夹角；为所述目标空间碎片的初始速度；δv为所述航天器相对所述目标空间碎
片的速度幅值；α∈[-π,π]和β∈[-0.5π,0.5π]分别为初始方位夹角。7.根据权利要求1-6中任一项所述的方法，其特征在于，所述推力输出模型和所述姿控力矩输出模型均有w套，假设w个空间碎片同时从不同方向与所述航天器发生交会；当所述航天器检测到j(1≤j≤w)个同时出现的空间碎片需要规避机动时，调用第j套所述推力输出模型和所述姿控力矩输出模型，得到对应的所述航天器在本体系下的推力和姿控力矩。8.一种航天器的应急规避机动控制装置，其特征在于，包括：获取模块，用于获取航天器相对目标空间碎片的状态信息；其中，所述目标空间碎片被看作为球形包络体，所述状态信息包括相对位置、相对速度、所述航天器的姿态和光源指向；第一输出模块，用于将所述状态信息输入到预先训练好的推力输出模型，得到与所述状态信息对应的所述航天器在本体系下的推力，以将所述航天器在本体系下的推力作为所述航天器的规避机动控制指令；其中，所述推力输出模型是通过将仿真产生的样本状态信息和样本推力作为训练样本对预设的神经网络模型进行训练得到的；第二输出模块，用于将所述状态信息输入到预先训练好的姿控力矩输出模型，得到与所述状态信息对应的所述航天器在本体系下的姿控力矩，以将所述航天器在本体系下的姿控力矩作为所述航天器的规避机动控制指令；其中，所述姿控力矩输出模型是通过将仿真产生的样本状态信息和样本姿控力矩作为训练样本对预设的神经网络模型进行训练得到的。9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-7中任一项所述的方法。

技术总结
本发明涉及航天器技术领域，特别涉及一种航天器的应急规避机动控制方法及装置。其中，该方法包括：获取航天器相对目标空间碎片的状态信息；其中，目标空间碎片被看作为球形包络体，状态信息包括相对位置、相对速度、航天器的姿态和光源指向；将状态信息输入到预先训练好的推力输出模型，得到与状态信息对应的航天器在本体系下的推力，以将航天器在本体系下的推力作为航天器的规避机动控制指令；将状态信息输入到预先训练好的姿控力矩输出模型，得到与状态信息对应的航天器在本体系下的姿控力矩，以将航天器在本体系下的姿控力矩作为航天器的规避机动控制指令。本发明能够解决相关技术中难以快速解算出优化的控制指令的技术问题。中难以快速解算出优化的控制指令的技术问题。中难以快速解算出优化的控制指令的技术问题。

技术研发人员：吴健发袁利魏春岭张海博李克行黄盘兴郝仁剑姜甜甜高婉莹
受保护的技术使用者：北京控制工程研究所
技术研发日：2023.06.05
技术公布日：2023/8/13

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种钻孔内三向应变原位监测系统 下一篇：一种实现尿沉渣分离的尿样检测试验离心机处理系统的制作方法

一种航天器的应急规避机动控制方法及装置与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种航天器的应急规避机动控制方法及装置与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表