一种用于近距离航天器轨道脉冲博弈的航天器控制方法与流程

未命名 07-04 阅读：154 评论：0

1.本发明涉及航天器轨道博弈领域，特别涉及一种用于近距离航天器轨道脉冲博弈的航天器控制方法。

背景技术：

2.随着人类文明的不断发展进步，人类的探索范围变得越来越大。迄今为止，30多个国家相继研制和发射了各种运载火箭、气象卫星、通信卫星、科学试验卫星、航天飞机和空间站，承担了运输、通信、指挥、预警、实时监测、测绘、导航和定位等多项任务。近地卫星具有观测范围广、信息传播速度快的特点，其军事价值日益突出。军事卫星承担着敌情侦察、通信联络、气象预报、监测预警等诸多任务，是现代联合作战体系的重要组成部分。
3.由于军事战略上的需要，美国兰德公司isaacs博士带领的研究小组开展了对抗双方都能自由决策行动的追逃问题研究。微分对策理论的形成有两个根源:对策论和控制论。starr和ho研究了多人非零和微分对策的3种不同类型的解的概念:极大值极小值、nash均衡和非劣势组策略。随后leitmann，melman和friedman等在这方面也做出了大量研究。elliot，bensoussan等众多学者采用变分法和鞅理论给出了随机微分对策解存在性和唯一性的严格数学证明。stackelberg主从微分对策成为新的研究热点lasry和lions研究了具有大量局中人的非零和微分对策，称之为平均场博弈。aumann和maschler，harsanyi研究了静态的不完全信息微分对策，其中harsanyi将不完全信息下的博弈转化为完全但不完美的博弈，然后用处理完全信息的方法对其进行了求解。kreps和wilson研究了动态的不完全信息微分对策，将完美贝叶斯均衡、序贯均衡等求解思想引入了离散的动态博弈。但对于不完全信息连续动态博弈的研究，目前关注较少。沙基昌针对各种军事对抗，基于微分对策理论，深入研究了多兵种作战的火力分配问题，李登峰系统研究了微分对策。近年来，越来越多的学者参与到微分对策的研究中来。
4.现有的航天器轨道博弈，以连续推力进行追击逃逸为主。使用最优控制理论的控制策略，寻找追逃博弈的界栅的构造和鞍点的最优控制律的求解。传统的线性二次型微分对策是一种很被广泛使用的微分对策，形式简单，在hill坐标系下描述航天器的相对运动，将hjb方程转换为ricaati方程来求解闭环的最优反馈控制率，但是求解出来的推力是一个连续变换的量，而实际航天器推力是一个脉冲推力，因此目前的航天器控制方法并不符合实际的工作环境要求，因此航天器发动机无法在现有的航天器轨道博弈对策下正常工作。

技术实现要素：

5.本发明目的是为了解决现有的航天器控制方法不符合实际的工作环境要求，导致航天器发动机无法在航天器轨道博弈对策下正常工作的问题，而提出了一种用于近距离航天器轨道脉冲博弈的航天器控制方法。
6.一种用于近距离航天器轨道脉冲博弈的航天器控制方法具体过程为：
7.步骤一、获取航天器的状态信息，建立惯性坐标系和轨道坐标系，利用航天器的状
态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息；
8.所述航天器包括：追击航天器和逃逸航天器；
9.步骤二、利用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率；
10.步骤三、利用步骤二获得的最优闭环反馈控制率获取航天器所受的推力，将航天器所受的推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息；
11.步骤四、根据步骤三获得的航天器实时位置信息计算lambert轨道转移的脉冲推力微分对策，获取交会过程追击航天器所需速度增量。
12.进一步地，所述步骤一中的获取航天器的状态信息，建立惯性坐标系和轨道坐标系，利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息，包括以下步骤：
13.步骤一一、获取航天器的状态信息
14.其中，ri、ξi、γi、vi、ζi分别是航天器到地星的距离，地理经度，地理纬度、飞行路径角、飞行速度和方位角，i＝p表示追击航天器、i＝e表示逃逸航天器；
15.步骤一二、建立惯性坐标系和轨道坐标系；
16.所述惯性坐标系以地球质心o为原点，ox指向春分点，oz指向北极点，oy指向根据右手螺旋定则确定；
17.所述轨道坐标系以航天器交会目标质心o为原点，ox轴为地心指向航天器质心的方向，oy轴为航天器运动方向，oz轴根据右手螺旋定则确定；
18.步骤一三、利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息。
19.进一步地，所述步骤一三中的利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息，包括以下步骤：
20.步骤一三一、获取航天器在惯性坐标系下的位置、速度信息并利用获取追击航天器和逃逸航天器之间的位置和速度差值：
21.首先，获取航天器在惯性坐标系下的位置信息：
[0022][0023]
其中，(xi，yi，zi)是航天器在惯性坐标系下的坐标；
[0024]
然后，利用公式(2)对xi，yi，zi求导，获得航天器在惯性坐标系下的速度信息即公式(3)；
[0025][0026][0027]
其中，是航天器在惯性坐标系x、y、z方向上的速度；
[0028]
最后，利用获取追击航天器和逃逸航天器之间的位置和速度差值
[0029]
其中，δx、δy、δz是追击航天器和逃逸航天器之间的x、y、z方向的位置差值，其中，δx、δy、δz是追击航天器和逃逸航天器之间的x、y、z方向的位置差值，是追击航天器和逃逸航天器之间的x、y、z方向的速度差值；
[0030]
步骤一三二、根据追击航天器在惯性坐标系下的位置和速度信息获得追击航天器从轨道坐标系到惯性坐标系的转换矩阵；
[0031]
步骤一三三、利用追击航天器和逃逸航天器之间的位置和速度差值、追击航天器从轨道坐标系到惯性坐标系的转换矩阵获取逃逸航天器在轨道坐标系中的位置和速度矢量。
[0032]
进一步地，所述步骤一三二中的根据追击航天器在惯性坐标系下的位置和速度信息获得追击航天器从轨道坐标系到惯性坐标系的转换矩阵，如下式：
[0033]
me＝[i
x i
y iz](4)
[0034][0035]
其中，i
x
、iy、iz是转换矩阵me中的参数，r
p
是追击航天器在惯性坐标系下的位置矢量，v
p
是追击航天器飞行速度矢量。
[0036]
进一步地，所述步骤一三三中的利用追击航天器和逃逸航天器之间的位置和速度差值、追击航天器从轨道坐标系到惯性坐标系的转换矩阵获取逃逸航天在轨道坐标系中的位置和速度矢量，如下式：
[0037][0038]
其中，r
pe
＝[δx δy δz],分别是逃逸航天器在轨道坐标系中的位置矢量、速度矢量。
[0039]
进一步地，所述步骤二中的利用步骤一获得的航天器在轨道坐标系和惯性坐标下
的位置和速度信息建立c-w方程，将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率，包括以下步骤：
[0040]
步骤二一、用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，如下式：
[0041][0042][0043][0044][0045]
其中，表示追击航天器相对逃逸航天器的位置、速度，u＝[u
x u
y uz]
t
是逃逸航天器和追击航天器所受力的加速度差，r＝[δx δy δz]表示追击航天器相对逃逸航天器的位置矢量，表示追击航天器相对逃逸航天器的速度矢量，a和b是中间矩阵，是x的导数，b
p
、be是中间变量，ue是逃逸航天器所受力的加速度、u
p
是追击航天器所受力的加速度；是航天器在惯性坐标系下的角速度，μ为万有引力常数；
[0046]
步骤二二、将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率。
[0047]
进一步地，所述步骤二二中的将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率，包括以下步骤：
[0048]
步骤二二一、将c-w方程通过最优控制策略转换为ricaati方程，如下式：
[0049][0050]
其中，r
p
、re、q是半正定矩阵，p(t)是ricatti矩阵，是p(t)的导数，t是时间；
[0051]
步骤二二二、将步骤二二一获得的ricaati方程中的时间t趋于无穷，获得最优闭环反馈控制率：
[0052][0053]
其中，ui(t)是航天器的最优推力大小和方向，ri、bi是半正定矩阵，当时间t趋向于无穷时p(t)＝p'。
[0054]
进一步地，所述步骤步骤三中的利用步骤二获得最优闭环反馈控制率获取航天器所受的推力，将航天器所受的推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息，包括以下步骤：
[0055]
步骤三一、获取航天器所受引力：
[0056][0057][0058]
其中，u
ri
是惯性坐标系下ri方向上的单位矢量，ri是ri的模长，m、m是追击航天器和逃逸航天器的质量，g是重力，ri是航天器的位置矢量；
[0059]
步骤三二、利用航天器受到的引力获得航天器的加速度
[0060][0061]
步骤三三、利用步骤三二获得的航天器的加速度获取二体系统相对运动公式：
[0062][0063]
μ＝g(m+m)
ꢀꢀ
(14)
[0064]
其中，μ表示万有引力常量；
[0065]
步骤三四、根据二体系统的相对运用公式对追击航天器的受力进行分析，建立追击航天器动力学方程：
[0066][0067][0068][0069]
式中，u'
x
,u'y,u'z表示在惯性坐标系下追击航天器受到x、y、z方向的推力，r表示追击航天器距离地心的位置；
[0070]
步骤三五、实时改变推力的u'
x
、u'y、u'z大小和r的大小，获得追击航天器实时位置信息，并根据追击航天器和逃逸航天器的相对位置关系获取逃逸航天器实时位置信息。
[0071]
进一步地，所述步骤四中的根据步骤三获得航天器实时位置信息计算lambert轨道转移的脉冲推力微分对策，获取航天器交会过程所需速度增量，如下式：
[0072][0073][0074]
其中，vc为交会起始时刻航天器在原运行轨道上起始点的速度矢量；v
t
为交会终点时刻航天器在交会相遇点的速度矢量，δv1是交会过程中航天器从0圈次到n
max
圈次所有顺行轨道对应的速度增量，δv2是交会过程中航天器从0圈次到n
max
圈次所有逆行轨道对应的速度增量，v1、v2是追击航天器和逃逸航天器在转移轨道上的速度矢量，r1、r2是航天器交会起始点和终止点的位置矢量，f、g是拉格朗日系数，是拉格朗日系数的导数，是最大圈次，tm是服务航天器轨道周期；
[0075]
其中，f、g、满足如下表达式:
[0076][0077]
式中，r1、r2表示航天器起始点和终止点的位置矢量模值，δθ表示航天器在转移轨道上经过的真近点角，h表示轨道角动量的模值。
[0078]
进一步地，(δv1,δv2)满足以下兰伯特策略：
[0079]
(δv1,δv2)＝lambert(x1,x2,t')
ꢀꢀ
(21)
[0080]
其中，x1是追击航天器在初始位置上的速度矢量，x2是逃逸航天器在交会点位置上的速度矢量，t'是转移时间。
[0081]
有益效果：
[0082]
本发明以惯性坐标系为基础，通过变量之间的转换获得航天器在轨道坐标系和惯性坐标系下的位置速度信息。本发明利用航天器的位置速度信息建立c-w动力学方程，使用最优控制策略转化为ricaati方程，用微分递推算出相对距离变化。对追击航天器使用最优控制策略之后建立航天器的动力学方程，得到惯性坐标系下的位置信息；本发明利用c-w方程获得追击航天器和逃逸航天器之间的距离，从而得到逃逸航天器位置信息；对追击航天器和逃逸航天器位置使用lambert变轨公式，得到脉冲推力微分对策。本发明解决了传统的连续推力微分对策的缺陷，提出了一种开环的脉冲推力的微分对策，对闭环的微分博弈离散化，之后使用lambert变轨，使得这种策略可以被实际的应用在航天器的轨道博弈上，更符合实际的工作环境要求，使航天器发动机可以在航天器轨道博弈对策下正常工作。
附图说明
[0083]
图1为本发明流程图；
[0084]
图2为地心惯性系的示意图；
[0085]
图3为惯性系的示意图图；
[0086]
图4为lambert变轨的示意图；
[0087]
图5为路径角和方位角示意图；
[0088]
图6为推力加速度矢量示意图；
[0089]
图7为lambert共面转移示意图；
[0090]
图8为200s的时候追击和逃逸卫星之间的距离；
[0091]
图9为追击航天器使用闭环连续微分对策和开环脉冲微分对策的运动轨迹；
[0092]
图10为逃逸航天器使用闭环连续微分对策和开环脉冲微分对策的运动轨迹；
[0093]
图11为追击和逃逸航天器使用闭环连续微分对策和开环脉冲微分对策的运动轨迹。
具体实施方式
[0094]
具体实施方式一：如图1所示，本实施方式一种用于近距离航天器轨道脉冲博弈的航天器控制方法具体过程为：
[0095]
步骤一、获取航天器的状态信息，建立惯性坐标系和轨道坐标系，利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息，包括以下步骤：
[0096]
步骤一一、获取航天器的状态信息
[0097]
其中，ri、ξi、γi、vi、ζi分别是航天器到地星的距离，地理经度，地理纬度、飞行路径角、飞行速度和方位角，i表示航天器，i＝p表示追击航天器、i＝e表示逃逸航天器，如图5-6所示；
[0098]
步骤一二、建立惯性坐标系和轨道坐标系：
[0099]
如图2所示，本发明基于惯性坐标系及交会目标的轨道坐标(lvlh)描述整个交会过程。
[0100]
惯性坐标系以地球质心o为原点，ox指向春分点，oz指向北极点，oy指向根据右手螺旋定则确定。如图3所示，轨道坐标系(lvlh)以航天器交会目标质心o为原点，ox轴为地心指向航天器质心的方向，oy轴为航天器运动方向(位于轨道面内且垂直于ox轴)，oz轴根据右手螺旋定则确定。
[0101]
步骤一三、利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息：
[0102]
步骤一三一、获取航天器在惯性坐标系下的位置、速度信息并利用获取追击航天器和逃逸航天器之间的位置和速度差值：
[0103]
首先，获取航天器在惯性坐标系下的位置、速度信息
[0104][0105][0106]
其中,是航天器到地星的距离变化量，是地理纬度变化量，是地理经度变化量。利用公式(2)对xi，yi，zi求导，得到：
[0107][0108]
简化的形式为：
[0109][0110]
其中，(xi，yi，zi)是航天器在惯性坐标系下的坐标，是航天器在惯性坐标系x、y、z方向上的速度；
[0111]
然后，利用获取追击航天器和逃逸航天器之间的位置和速度差值
[0112]
步骤一三二、根据追击航天器在惯性坐标系下的位置和速度信息获得追击航天器从轨道坐标系到惯性坐标系的转换矩阵：
[0113]
me＝[i
x i
y iz]
ꢀꢀ
(5)
[0114][0115]
其中，i
x
、iy、iz是转换矩阵me中的参数，r
p
是追击航天器在惯性坐标系下的位置矢量，v
p
是追击航天器飞行速度矢量；
[0116]
步骤一三三、利用追击航天器和逃逸航天器之间的位置和速度差值和追击航天器从轨道坐标系到惯性坐标系的转换矩阵获取逃逸航天器在追击航天器轨道坐标系(以追击航天器为参照的轨道坐标系)中的位置速度矢量如下式所示：
[0117][0118]
其中，r
pe
＝[δx δy δz],分别是逃逸航天器在追击航天器
轨道坐标系中的位置和速度矢量(逃逸航天器相对于追击航天器的位置速度)。
[0119]
步骤二、利用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率：
[0120]
c-w方程是轨道坐标系下的描述两个航天器的动力学方程，可以得到不同时刻追击和逃逸航天器的位置速度状态信息，如果博弈时间是无限的，引入支付函数，转化为ricaati方程进行求解，得到闭环最优的反馈控制律，求解该方程可以得到最优的闭环反馈控制律。
[0121]
步骤二一、用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程：
[0122]
可令逃逸航天器在惯性坐标系下的位置矢量为re＝[x
e y
e ze]
t
，追击航天器在惯性坐标系下的位置矢量为r
p
＝[x
p y
p z
p
]
t
，获取追击航天器和逃逸航天器的加速度：
[0123][0124][0125]
其中，表示追击航天器和逃逸航天器的加速度，ae和a
p
分别表示逃逸航天器和追击航天器所受力的加速度，μ为万有引力常量；
[0126]
则追击航天器相对于逃逸航天器的位置矢量r可以表示为：
[0127]
r＝r
p-re＝[x
p y
p z
p
]
t-[x
e y
e ze]
t
＝[δx δy δz]
ꢀꢀ
(10)
[0128]
其中，δx、δy、δz分别是追击航天器相对于逃逸航天器位置的x，y，z方向的值；
[0129]
假设u表示如下
[0130]ap-ae＝u
p-ue＝[u
x u
y uz]
ꢀꢀ
(11)
[0131]
其中，u
x
、uy、uz分别是逃逸航天器和追击航天器所受力的x、y、z方向上的加速度的差；
[0132]
对上式进行二次求导可得：
[0133][0134]
其中，t是时间；
[0135]
根据矢量求导运算，有：
[0136][0137]
其中，ω和分别表示航天器在惯性坐标系下的角速度矢量和角加速度矢量，δ是偏导符号；
[0138]
假设航天器运行的轨迹是近似的圆形，可以得到：
[0139][0140]
上式可以化简为：
[0141][0142]
通过数学中叉乘的运算法则可以进一步化简为：
[0143][0144]
将公式(12)代入公式(15)可得：
[0145][0146]
由于假设航天器的轨道是圆轨道，根据万有引力公式：
[0147][0148]
通过推导可以得到：
[0149][0150][0151][0152]
其中，是对δx的二阶偏导，是对δz二阶偏导；
[0153]
假设中间变量u＝[u
x u
y uz]
t
进行系统建模可以得到：
[0154][0155]
其中，是x的导数，b
p
、be是中间变量；
[0156][0157]
[0158][0159]
式中，表示追击航天器相对逃逸航天器的位置速度，通常是一个6维的矢量，u＝[u
x u
y uz]
t
是逃逸航天器和追击航天器所受力的加速度差，r表示追击航天器相对逃逸航天器的位置矢量，v表示追击航天器相对逃逸航天器的速度矢量，r＝[δxδyδz]是追击航天器相对逃逸航天器的位置，是追击航天器相对逃逸航天器的位置速度，a和b是中间矩阵，是航天器在惯性坐标系下的角速度标量；
[0160]
步骤二二、将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率：
[0161]
考虑一般的两个航天器的追逃博弈问题，双方追求各自的最优的控制量和最小化各自的支付函数(通常和时间，距离，能量参数有关，使用bolza性能指标)：
[0162][0163]
如果存在一组最优机动策略和对于追逃的双方任意的机动策略u
p
和ue都有下面的式子成立
[0164]
je(u
*p
,ue)≥je(u
*p
,u
*e
)(24)
[0165]jp
(u
*p
,u
*e
)≤j
p
(u
*p
,ue)(25)
[0166]
那么说和构成博弈的纳什均衡。
[0167]
如果博弈是时间给定的，根据最优控制原理，在均衡点处的航天器支付函数j可以表示为
[0168][0169]
式中q
pf
,q
p
是半正定矩阵，表示相对距离的权重，r
p
,re是半正定矩阵，表示能量的权重。
[0170]
如果博弈函数时间是无限的情况，支付函数形式可以是
[0171][0172]
构造固定逗留微分对策，公式(27)转化为ricaati方程来求解闭环最优反馈控制律，构造的ricatti方程如下：
[0173][0174]
其中，是p(t)的导数，p(t)是ricatti矩阵；
[0175]
上式中的p(t)是ricatti矩阵，有：
[0176]
q＝q
p
[0177]
当时间趋向无穷的时候，这种对策变成了无限时域的微分对策：
[0178][0179]
其中，当时间趋向于无穷，p(t)即为公式(29)中的p'；
[0180]
可以求出最优的闭环反馈控制率为：
[0181][0182]
其中，ui(t)是航天器在满足支付函数最优条件下的推力大小和方向，x(t)是轨道坐标系中逃逸航天器和追击航天器之间的相对距离，ri是半正定矩阵；
[0183]
步骤三、利用步骤二获得最优闭环反馈控制率获取航天器所受的推力，将航天器所受的推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息：
[0184]
通过步骤二得到的推力通过轨道系之间的转换，转换到惯性系下，对卫星建立惯性系下的动力学方程，按照推力变化和坐标系转换矩阵变换，可以计算得到卫星实时的位置速度信息。
[0185]
步骤三一、获得航天器所受引力：
[0186]
在只考虑引力的理想二体系统情况中，在惯性坐标系下，令航天器位置矢量ri，模长为ri；追击航天器的质量和逃逸航天器的质量分别为m，m，航天器受到的引力为：
[0187][0188][0189]
其中，u
ri
是ri方向上的单位矢量，g表示重力大小；
[0190]
步骤三二、利用航天器受到的引力获得航天器的加速度：
[0191][0192]
步骤三三、利用步骤三二获得的航天器的加速度获取二体系统相对运动公式：
[0193][0194]
μ＝g(m+m)
ꢀꢀ
(35)
[0195]
但是此时航天器会受到发动机的推力的影响；
[0196]
步骤三四、对航天器受力分析，可以得到航天器受到万有引力，和发动机的推力的作用，建立航天器动力学方程：
[0197][0198]
[0199][0200]
式中，μ表示万有引力常量，u'
x
,u'y,u'z表示在惯性坐标系下追击航天器受到x、y、z方向的推力，r表示追击航天器距离地心的位置；
[0201]
步骤三五、通过实时改变推力的u'
x
、u'y、u'z大小和r的大小，得到追击航天器实时位置信息，并根据追击航天器和逃逸航天器的相对位置获取逃逸航天器的实时位置信息。
[0202]
步骤四、根据步骤三获得航天器实时位置信息计算lambert轨道转移的脉冲推力微分对策，获取交会过程航天器所需速度增量：
[0203]
以200秒钟为一个时间间隔，计算开始和200秒钟之后航天位置的变化，进而使用lambert变轨的方法，计算出的结果是发动机推力的大小和方向信息，这样就得到了开环的脉冲推力微分对策。
[0204]
追击航天器初始的位置速度x1、逃逸在交会点的位置速度x2以及转移时间t’后，可能存在多个兰伯特转移策略。取所需速度增量最小(燃料最优)的策略作为交会的机动方案。假设服务航天器轨道周期为tm，将定为最大圈次。遍历从圈次0到圈次n
max
的所有顺行及逆行轨道对应的速度增量，取最小的一组为兰伯特转移的输出量。由此得出固定时间下最优两脉冲兰伯特转移。如图7，上述过程表示为：
[0205]
(δv1,δv2)＝lambert(x1,x2,t')
ꢀꢀ
(39)
[0206]
其中，x1是追击航天器在初始位置上的速度矢量，x2是逃逸航天器在交会点位置上的速度矢量，t’是转移时间，δv1从圈次0到圈次n
max
的所有顺行轨道对应的速度增量，δv2是圈次0到圈次n
max
的所有逆行轨道对应的速度增量；
[0207]
如图4所示，lambert变轨的计算公式如下：
[0208][0209]
其中，vc为航天器在交会起始时刻在原运行轨道上处于p1点的速度矢量；v
t
为目标轨道上交会终点时刻在交会相遇点p2的速度矢量。
[0210]
利用拉格朗日系数f、g及其导数可以表示出航天器转移轨道上的速度v1、v2：
[0211][0212]
其中，v1、v2是追击航天器和逃逸航天器在转移轨道上的速度矢量；
[0213]
根据轨道力学理论，f、g、满足如下表达式:
[0214]
[0215]
式中，r1、r2表示航天器起始点p1和终止点p2的位置矢量模值，δθ表示在转移轨道上经过的真近点角，h表示轨道角动量的模值(当计算追击航天器的速度增量时，p1、p2是追击航天器的起始点和终止点；当计算逃逸航天器的速度增量时，p1、p2是逃逸航天器的起始点和终止点)。
[0216]
实施例：为验证本发明有益效果，进行了如下试验：
[0217]
初始航天器位置姿态信息如表1所示：
[0218]
表1初始航天器位置姿态信息
[0219][0220]
通过计算得到在3500s左右，追击和逃逸的航天器交会。图8是200s内的航天器之间的绝对的距离，我们控制了航天器的每个方向上最大的推力不超过5/2,200s之后追击航天器的位置移动和使用离散化微分决策的航天器位置变化如图9所示，200s之后逃逸航天器的位置移动和使用离散化微分决策的航天器位置变化如图10所示，200s之后追击和逃逸航天器的使用连续微分对策位置移动和使用离散化微分对策的航天器位置变化如图11所示。可以看出使用离散化有很好的控制效果。
[0221]
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动，这里无法对所有的实施方式予以穷举，凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

技术特征：
1.一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于所述方法具体过程为：步骤一、获取航天器的状态信息，建立惯性坐标系和轨道坐标系，利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息；所述航天器包括：追击航天器和逃逸航天器；步骤二、利用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率；步骤三、利用步骤二获得的最优闭环反馈控制率获取航天器所受的推力，将航天器所受的推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息；步骤四、根据步骤三获得的航天器实时位置信息计算lambert轨道转移的脉冲推力微分对策，获取交会过程追击航天器所需速度增量。2.根据权利要求1所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤一中的获取航天器的状态信息，建立惯性坐标系和轨道坐标系，利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息，包括以下步骤：步骤一一、获取航天器的状态信息其中，r
i
、ξ
i
、γ
i
、v
i
、ζ
i
分别是航天器到地星的距离，地理经度，地理纬度、飞行路径角、飞行速度和方位角，i＝p表示追击航天器、i＝e表示逃逸航天器；步骤一二、建立惯性坐标系和轨道坐标系；所述惯性坐标系以地球质心o为原点，ox指向春分点，oz指向北极点，oy指向根据右手螺旋定则确定；所述轨道坐标系以航天器交会目标质心o为原点，ox轴为地心指向航天器质心的方向，oy轴为航天器运动方向，oz轴根据右手螺旋定则确定；步骤一三、利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息。3.根据权利要求2所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤一三中的利用航天器的状态信息获得航天器在惯性坐标系和轨道坐标系下的位置和速度信息，包括以下步骤：步骤一三一、获取航天器在惯性坐标系下的位置、速度信息并利用获取追击航天器和逃逸航天器之间的位置和速度差值：首先，获取航天器在惯性坐标系下的位置信息：其中，(x
i
，y
i
，z
i
)是航天器在惯性坐标系下的坐标；然后，利用公式(2)对x
i
，y
i
，z
i
求导，获得航天器在惯性坐标系下的速度信息即公式(3)；
其中，是航天器在惯性坐标系x、y、z方向上的速度；最后，利用获取追击航天器和逃逸航天器之间的位置和速度差值其中，δx、δy、δz是追击航天器和逃逸航天器之间的x、y、z方向的位置差值，其中，δx、δy、δz是追击航天器和逃逸航天器之间的x、y、z方向的位置差值，是追击航天器和逃逸航天器之间的x、y、z方向的速度差值；步骤一三二、根据追击航天器在惯性坐标系下的位置和速度信息获得追击航天器从轨道坐标系到惯性坐标系的转换矩阵；步骤一三三、利用追击航天器和逃逸航天器之间的位置和速度差值、追击航天器从轨道坐标系到惯性坐标系的转换矩阵获取逃逸航天器在轨道坐标系中的位置和速度矢量。4.根据权利要求3所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤一三二中的根据追击航天器在惯性坐标系下的位置和速度信息获得追击航天器从轨道坐标系到惯性坐标系的转换矩阵，如下式：击航天器从轨道坐标系到惯性坐标系的转换矩阵，如下式：其中，i
x
、i
y
、i
z
是转换矩阵m
e
中的参数，r
p
是追击航天器在惯性坐标系下的位置矢量，v
p
是追击航天器飞行速度矢量。5.根据权利要求4所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤一三三中的利用追击航天器和逃逸航天器之间的位置和速度差值、追击航天器从轨道坐标系到惯性坐标系的转换矩阵获取逃逸航天在轨道坐标系中的位置和速度矢量，如下式：其中，r
pe
＝[δx δy δz],分别是逃逸航天器在轨道坐标系中的位置矢量、速度矢量。
6.根据权利要求5所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤二中的利用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率，包括以下步骤：步骤二一、用步骤一获得的航天器在轨道坐标系和惯性坐标下的位置和速度信息建立c-w方程，如下式：w方程，如下式：w方程，如下式：w方程，如下式：其中，表示追击航天器相对逃逸航天器的位置、速度，u＝[u
x u
y u
z
]
t
是逃逸航天器和追击航天器所受力的加速度差，r＝[δx δy δz]表示追击航天器相对逃逸航天器的位置矢量，表示追击航天器相对逃逸航天器的速度矢量，a和b是中间矩阵，是x的导数，b
p
、b
e
是中间变量，u
e
是逃逸航天器所受力的加速度、u
p
是追击航天器所受力的加速度；是航天器在惯性坐标系下的角速度，μ为万有引力常数；步骤二二、将c-w方程通过最优控制策略转换为ricaati方程，获得最优闭环反馈控制率。7.根据权利要求6所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤二二中的将c-w方程通过最优控制策略转换为ricaati方程，获得最优
闭环反馈控制率，包括以下步骤：步骤二二一、将c-w方程通过最优控制策略转换为ricaati方程，如下式：其中，r
p
、r
e
、q是半正定矩阵，p(t)是ricatti矩阵，是p(t)的导数，t是时间；步骤二二二、将步骤二二一获得的ricaati方程中的时间t趋于无穷，获得最优闭环反馈控制率：其中，u
i
(t)是航天器的最优推力大小和方向，r
i
、b
i
是半正定矩阵，当时间t趋向于无穷时p(t)＝p'。8.根据权利要求7所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤步骤三中的利用步骤二获得最优闭环反馈控制率获取航天器所受的推力，将航天器所受的推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息，包括以下步骤：步骤三一、获取航天器所受引力：步骤三一、获取航天器所受引力：其中，u
ri
是惯性坐标系下r
i
方向上的单位矢量，r
i
是r
i
的模长，m、m是追击航天器和逃逸航天器的质量，g是重力，r
i
是航天器的位置矢量；步骤三二、利用航天器受到的引力获得航天器的加速度步骤三二、利用航天器受到的引力获得航天器的加速度步骤三三、利用步骤三二获得的航天器的加速度获取二体系统相对运动公式：μ＝g(m+m)
ꢀꢀꢀꢀ
(14)其中，μ表示万有引力常量；步骤三四、根据二体系统的相对运用公式对追击航天器的受力进行分析，建立追击航天器动力学方程：天器动力学方程：天器动力学方程：式中，u'
x
,u'
y
,u'
z
表示在惯性坐标系下追击航天器受到x、y、z方向的推力，r表示追击
航天器距离地心的位置；步骤三五、实时改变推力的u'
x
、u'
y
、u'
z
大小和r的大小，获得追击航天器实时位置信息，并根据追击航天器和逃逸航天器的相对位置关系获取逃逸航天器实时位置信息。9.根据权利要求8所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：所述步骤四中的根据步骤三获得航天器实时位置信息计算lambert轨道转移的脉冲推力微分对策，获取航天器交会过程所需速度增量，如下式：脉冲推力微分对策，获取航天器交会过程所需速度增量，如下式：其中，v
c
为交会起始时刻航天器在原运行轨道上起始点的速度矢量；v
t
为交会终点时刻航天器在交会相遇点的速度矢量，δv1是交会过程中航天器从0圈次到n
max
圈次所有顺行轨道对应的速度增量，δv2是交会过程中航天器从0圈次到n
max
圈次所有逆行轨道对应的速度增量，v1、v2是追击航天器和逃逸航天器在转移轨道上的速度矢量，r1、r2是航天器交会起始点和终止点的位置矢量，f、g是拉格朗日系数，是拉格朗日系数的导数，是最大圈次，t
m
是服务航天器轨道周期；其中，f、g、满足如下表达式:式中，r1、r2表示航天器起始点和终止点的位置矢量模值，δθ表示航天器在转移轨道上经过的真近点角，h表示轨道角动量的模值。10.根据权利要求9所述的一种用于近距离航天器轨道脉冲博弈的航天器控制方法，其特征在于：(δv1,δv2)满足以下兰伯特策略：(δv1,δv2)＝lambert(x1,x2,t') (21)其中，x1是追击航天器在初始位置上的速度矢量，x2是逃逸航天器在交会点位置上的速度矢量，t'是转移时间。

技术总结
一种用于近距离航天器轨道脉冲博弈的航天器控制方法，涉及航天器轨道博弈领域。本发明是为了解决现有的航天器控制方法不符合实际的工作环境要求，导致航天器发动机无法在航天器轨道博弈对策下正常工作的问题。本发明包括：获取航天器状态信息，建立惯性坐标系和轨道坐标系，获取航天器在惯性坐标系和轨道坐标系下位置和速度信息；利用位置和速度信息建立C-W方程，将C-W方程转换为Ricaati方程，获得最优闭环反馈控制率；获取航天器所受推力，将航天器所受推力转换到惯性坐标系下，利用惯性坐标系下的推力变化获得航天器实时位置信息；根据航天器实时位置信息计算Lambert轨道转移的脉冲推力微分对策，获取交会过程所需速度增量。本发明用于实现航天器轨道博弈。本发明用于实现航天器轨道博弈。本发明用于实现航天器轨道博弈。

技术研发人员：郭延宁叶睿卿梁维奎宋斌李兴龙李传江
受保护的技术使用者：上海宇航系统工程研究所
技术研发日：2023.02.23
技术公布日：2023/4/5

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：用于降落在竖直结构上的混合动力无人机的制作方法 下一篇：具有光伏储能模组的物业管理用无人巡视监控装置的制作方法

一种用于近距离航天器轨道脉冲博弈的航天器控制方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种用于近距离航天器轨道脉冲博弈的航天器控制方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表