塔吊实时避障的路径规划方法、存储介质及塔吊控制器与流程

未命名 08-25 阅读：283 评论：0

1.本发明涉及机械控制技术领域，具体地涉及一种塔吊实时避障的路径规划方法、存储介质及塔吊控制器。

背景技术：

2.在传统塔吊作业中，至少需要两名工人进行操作，一名工人在地面观察，通过对讲机指挥另一名工人在高空操作室驾驶。现有技术中为实现无人驾驶塔吊，运用多维度塔吊可视化监控系统获取实时信息，并运用无线射频电波传送数据，从而实现地面远程遥控驾驶，取代具有风险的高空作业风险。然而，实质上整个操作过程的主题仍然是人，并没有完全实现无人驾驶。

技术实现要素：

3.本发明实施例的目的是提供一种塔吊实时避障的路径规划方法，该方法通过设置多个奖惩函数及相应的多个约束条件参数能够精确、自动控制塔吊的操作，操作工人只需要作为监督保障。
4.为了实现上述目的，本发明实施例提供一种塔吊实时避障的路径规划方法，该方法包括：
5.获取塔吊当前工作环境中障碍物和所运送的物品的位置数据，及所述物品的摆动角度和相对于塔吊的角速度；
6.根据当前的路径规划，获取所述物品预期达到的下一个目标位置，并据此确定当前要对塔吊进行的操作；
7.将所述位置数据、所述摆动角度、所述角速度及所述操作输入塔吊避障模型，并根据该塔吊避障模型输出的结果，判定所述操作是否符合多个约束条件参数；以及
8.若判定结果为不符合，则修改当前要对塔吊进行的操作，并修正所述物品预期达到的下一个目标位置，直至所述判定结果为符合，从而修正所述物品从当前位置到下一个目标位置的规划路径，直至达到规划路径的最终目标点，
9.其中，所述塔吊避障模型为神经网络模型，且通过预定义的奖惩函数和相应的多个约束条件参数进行训练而得到；
10.所述预定义的奖惩函数包括多个奖惩函数中的至少两者：精确度奖惩函数、避障奖惩函数和摆动奖惩函数。
11.优选的，所述预定义的奖惩函数为所述多个奖惩函数的权重和；所述多个奖惩函数相应于所述多个约束条件参数而被设置；及所述多个奖惩函数的不同权重根据施工现场的安全重要性而被设置。
12.优选的，所述精确度奖惩函数用于根据所述物品到达所述下一个目标位置的精确度，确定所述操作的奖惩值；所述精确度奖惩函数为当前时刻下所述操作的精确度状态奖惩值与精确度行为奖惩值之和；所述精确度状态奖惩值通过所述物品的位置与所述下一个
目标位置的距离、第一阈值、及第二阈值而被计算，所述第一阈值与所述第二阈值为所述精确度奖惩函数相应的约束条件参数。
13.进一步的，所述物品与所述下一个目标位置的距离小于所述第一阈值时的精确度状态奖惩值，大于所述物品与所述下一个目标位置的距离小于所述第二阈值时的精确度状态奖惩值；
14.所述物品在靠近目标点时的精确度行为奖惩值大于物品在远离目标点时的精确度行为奖惩值。
15.优选的，所述避障奖惩函数用于根据塔吊运送物品过程中物品远离障碍物的程度，确定所述操作的奖惩值；所述避障奖惩函数为当前时刻下所述操作的避障状态奖惩值和避障行为奖惩值之和；所述避障状态奖惩值通过所述物品的位置与障碍物的距离、第三阈值、及第四阈值而被计算，且所述第三阈值与所述第四阈值为所述避障奖惩函数相应的约束条件参数。
16.进一步的，所述物品与障碍物的距离小于所述第三阈值时的避障状态奖惩值，大于所述物品与所述障碍物的距离小于所述第四阈值时的避障状态奖惩值；
17.所述物品在逐渐远离障碍物时的避障度行为奖惩值，大于所述物品在逐渐靠近障碍物时的避障度行为奖惩值。
18.优选的，所述摆动奖惩函数用于根据塔吊运送物品过程中所述物品相对于塔吊的摆动程度确定所述操作的摆动奖惩值；所述摆动奖惩值通过所述物品相对于塔吊的角速度、摆动角度、第五阈值、及第六阈值而被计算，且所述第五阈值与所述第六阈值为所述摆动奖惩函数相应的约束条件参数。
19.进一步的，所述物品的摆动角度在要求的摆动范围内且所述物品相对于塔吊的角速度在要求的范围内时的摆动奖惩值，大于所述物品的摆动角度在要求的摆动范围内但所述物品相对于塔吊的角速度不在要求的范围内时的摆动奖惩值。
20.另一方面，本发明提供一种机器可读存储介质，该机器可读存储介质上存储有指令，该指令用于使得机器执行：本技术的塔吊避障模型训练方法，或者塔吊实时避障的路径规划方法。
21.另一方面，本发明提供一种塔吊控制器，该塔吊控制器包括：至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行：本技术的塔吊避障模型训练方法，或者塔吊实时避障的路径规划方法。
22.通过上述技术方案，在控制塔吊时，对于当前位置到下一目标位置的操作，同时也是当前的路径规划步骤，将塔吊当前工作环境中障碍物和所运送的物品的位置数据、物品的摆动角度、物品相对于塔吊的角速度、当前要对塔吊进行的操作输入塔吊避障训练模型，根据塔吊避障训练模型输出的该操作的精确度奖惩值和/或避障奖惩值和/或摆动奖惩值，判定总的奖惩值是否符合现场操作的安全要求标准，从而确定是否需要修正当前的路径规划，直到达到规划路径的最终目标点。在此过程中，能够使得塔吊运送物品的操作符合精确度要求，物品被运送过程中摆动角度符合操作安全避障要求，以及物品相对塔吊的角速度符合操作摆动幅度要求，进而能够控制塔吊自动进行避障操作，免除人工操作强度。
23.本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
24.附图是用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本发明实施例，但并不构成对本发明实施例的限制。在附图中：
25.图1是本技术的塔吊实时避障的路径规划方法一实施例的流程图；及
26.图2是本技术的塔吊避障模型训练方法一实施例的流程图。
具体实施方式
27.以下结合附图对本发明实施例的具体实施方式进行详细说明。应当理解的是，此处所描述的具体实施方式仅用于说明和解释本发明实施例，并不用于限制本发明实施例。
28.本发明实施例提供了一种塔吊实时避障的路径规划方法，用于解决塔吊在运送物品时进行精准的自动控制以实时避开障碍物的算法，需要说明的是，本技术还将提供一实施例说明一种塔吊避障模型的获得方法，但本技术不以此为限，技术人员可以采用其他可用的塔吊避障模型。在本实施例中，可以直接采用本技术的塔吊避障模型获取的实施例得到的塔吊避障模型，将所运送的物品的当前状态输入到该塔吊避障模型，即可根据该塔吊避障模型的输出结果，确定/修正所运送的物品从当前位置到下一目标点的规划路径。以下结合图1说明其实施流程。
29.步骤s1：获取塔吊当前工作环境中障碍物和所运送的物品的位置数据，及所述物品的摆动角度和相对于塔吊的角速度；
30.在本实施例中，可以是通过获取塔吊工作环境全局的实时图像，并从该实时图像中提取塔吊、障碍物和所运送的物品的位置数据。具体的，可以是在塔吊工作环境中装载的全局相机为深度相机，且能够将整个工作空间和塔吊纳入该全局相机的取景范围，以确保障碍物和塔吊运送的物品处于该取景范围内；同时，在塔吊上装载的相机可以是深度相机也可以是普通相机，用于拍摄塔吊运送的物品相对塔吊的摆动角度、摆动角速度。通过全局相机和塔吊上装载的相机取得的不同图像确定塔吊运送的物品所处的状态。
31.在本实施例中，通过在塔吊上装载的相机获取吊钩当前情况的多幅实时图像，并从对比不同时间点获取的实时图像中所运送的物品的状态变化，提取所运送的物品的摆动角度和所述物品相对于塔吊角速度。
32.步骤s2：根据当前的路径规划，获取所述物品预期达到的下一个目标位置，并据此确定当前要对塔吊进行的操作；
33.需要说明的是，每当进行下一步操作的时候，都需要重新获取塔吊当前工作环境中的数据，以确定环境是否变化，从而决定是否需要重新规划路线。在这里规划路线可以是全局路线，也可以是局部规划路线。
34.步骤s3：将所述位置数据、所述摆动角度、所述角速度及所述操作输入塔吊避障模型，并得到该塔吊避障模型输出的结果；
35.在本实施例中，将所运送物品的状态数据和当前要对塔吊进行的操作输入塔吊避障模型后，输出结果为在当前状态下进行指定的操作后所运送物品的达到目标位置、动态避开障碍物和摆动幅度的评价指数，以判定当前欲进行的操作是否符合操作安全要求。
36.步骤s4：根据步骤s3的输出结果判定所述操作是否符合多个约束条件参数。若判
定结果为否，则修改当前要对塔吊进行的操作以修正所述物品预期达到的下一个目标位置，并返回执行步骤s2；若判定结果为是，则执行步骤s5；
37.在本步骤中，在塔吊避障模型输出的结果判定当前要对塔吊进行的操作符合操作安全要求的情况下，可以直接确定基于当前路径规划步骤确定的操作可以执行，也即当前路径规划步骤不需要修正。与之相反的，在塔吊避障模型输出的结果判定当前要对塔吊进行的操作不符合操作安全要求的情况下，修改当前要对塔吊进行的操作，并基于修改后的操作修正物品预期达到的下一个目标位置，直到修改后的操作符合操作安全要求，也同时得到了基于符合要求的操作使得物品预期达到的下一个目标位置，从而能够修正物品从当前节点到下一个目标位置的规划路径
38.步骤s5：确定/修正所述物品从当前位置到下一个目标位置的规划路径。
39.在本步骤中，根据步骤4的判定结果，确定/修正所述物品从当前位置到下一个目标位置的规划路径，然后塔吊执行当前路径规划步骤所确定的操作，或者执行修正后的当前路径规划步骤所确定的操作。
40.需要说明的是，在本实施例中，塔吊避障模型为神经网络模型，且通过预定义的奖惩函数和相应的多个约束条件参数进行训练而得到；所述预定义的奖惩函数包括多个奖惩函数中的至少两者：精确度奖惩函数、避障奖惩函数和摆动奖惩函数。
41.与现有技术相比，本技术的技术优势在于：
42.(1)通过多个奖惩函数分别从操作的精确度、避障效果、摆动幅度评判塔吊运送的物品的操作是否符合要求，因此，据此进行塔吊避障能够自动控制塔吊操作，做到真正的无人驾驶塔吊；
43.(2)该实时避障的路径规划方法能够同时满足多个约束条件参数(相应于多个奖惩函数)，能使得多个约束条件参数同时达到预期的效果。
44.在上述实施例中，精确度奖惩函数r1(t)用于评价在当前状态下进行指定的操作后所运送物品是否达到目标点。
45.优选的，r1(t)可以进行如下设置：
[0046][0047][0048]
r1(t)＝γ
11
(t)+γ
12
(t)
[0049]
其中：
[0050]
γ
11
(t)为当前时刻下当前动作的精确度状态奖惩值；
[0051]
γ
12
(t)为当前时刻下当前动作的精确度行为奖惩值；
[0052]
r1(t)为当前时刻下当前动作的总精确度奖惩值；d(t)：此刻所运送的物品所在的位置与目标点的距离；
[0053]
d(t-1)：上一时刻所运送的物品所在的位置与目标点的距离；
[0054]
d0：若距离目标点的距离小于d0，则认为物品到达目标点；
[0055]
d1：若距离目标点的距离小于d1，则认为物品到达目标点范围(物品放置所在位置与目标点距离在d1以内不影响工程使用，只是精确度比d0范围低)。
[0056]
需要说明的是，距离目标点的距离小于d0时，运送效果最好，且d
0-d(t)越小，效果越好；
[0057]
距离目标点的距离小于d1时，运送成功但精确度不够高，且d
1-d(t)越小，精确度越高；
[0058]
d(t)＜d(t-1)时，说明物品在逐渐靠近目标点，给予奖励1；
[0059]
d(t)＝d(t-1)，d(t)≠0时，说明物品并未到达目标点就停止，给予奖励-1(实则为惩罚，表示此类行为不可取)；
[0060]
d(t)＞d(t-1)时，说明物品在逐渐远离目标点，此行为为错误行为，给予奖励-10，训练网络避开此行为。
[0061]
也就是说，所述物品与所述下一个目标位置的距离小于所述第一阈值d0时的精确度状态奖惩值，大于所述物品与所述下一个目标位置的距离小于所述第二阈值d1时的精确度状态奖惩值；所述物品在靠近目标点时的精确度行为奖惩值大于物品在远离目标点时的精确度行为奖惩值；
[0062]
在上述实施例中，避障度奖惩函数r2(t)用于评价在当前状态下进行指定的操作后所运送物品是否动态避开障碍物，优选的，可以进行如下设置：
[0063][0064][0065]
r2(t)＝γ
21
(t)+γ
22
(t)
[0066]
其中：
[0067]
γ
21
(t)为当前时刻下当前动作的避障状态奖惩值；
[0068]
γ
22
(t)为当前时刻下当前动作的避障度行为奖惩值；
[0069]
l(t)：此刻所运送的物品所在的位置与障碍物的距离；
[0070]
l(t-1)：上一时刻所运送的物品所在的位置与障碍物的距离；
[0071]
l0：若距离障碍物的距离小于l0，则认为物品碰到障碍物；
[0072]
l1：若距离障碍物的距离小于l1大于l0，则认为物品虽未碰到障碍物，但是该范围仍存在触碰到障碍物的风险。
[0073]
需要说明的是，距离障碍物的距离小于l0时，触碰到障碍物，应避免，且l
0-l(t)越小，触碰越严重；
[0074]
距离障碍物的距离小于l1大于l0时，物品虽未触碰到障碍物，但是存在触碰到障碍物的风险，应避免，且l
1-l(t)越小，触碰的风险越大；
[0075]
l(t)≥l(t-1)时，物品在逐渐远离障碍物，给予奖励值1；
[0076]
l(t)＜l(t-1)时，物品在逐渐靠近障碍物，此行为为错误行为，给予奖励-1，训练网络避开此行为。
[0077]
也就是说，所述物品与障碍物的距离小于l0时的避障状态奖惩值，大于所述物品与所述障碍物的距离小于l1值时的避障状态奖惩值，即所述物品触碰到所述障碍物时的避障状态奖惩值，小于所述物品有触碰到所述障碍物风险时的避障状态奖惩值。物品在逐渐远离障碍物时的避障度行为奖惩值，大于物品在逐渐靠近障碍物时的避障度行为奖惩值。在上述实施例中，摆动奖惩函数r3(t)用于评价在当前状态下进行指定的操作后所运送物品的摆动幅度是否符合要求，优选的，可以进行如下设置：
[0078][0079]
其中：
[0080]
ω(t)：此刻物品相对于塔吊的角速度；
[0081]
ω0：若物品相对于塔吊的角速度ω(t)小于第六阈值ω0，且在摆动范围内，则可认为此时物品没有摆动；
[0082]
θ(t)：此刻物品的摆动角度；
[0083]
θ0：若物品的摆动角度θ(t)小于第五阈值θ0，则在要求的摆动范围内，符合要求。
[0084]
需要说明的是，θ(t)＜θ0，ω(t)≤ω0时，说明物品几乎没有摆动，接近理想效果，设置奖励值100；
[0085]
θ(t)＜θ0，ω(t)＞ω0时，说明物品虽然有摆动，但是在要求范围内，效果与θ
0-θ(t)成正比，与ω(t)-ω0成反比；
[0086]
其他时候表明物品不在要求范围内，设置奖励值-10，训练网络避开此行为。
[0087]
也就是，物品的摆动角度在要求的摆动范围内且物品相对于塔吊的角速度在要求的范围内时的摆动奖惩值，大于物品的摆动角度在要求的摆动范围内但所述物品相对于塔吊的角速度不在要求的范围内时的摆动奖惩值。
[0088]
本发明还提供一种塔吊避障模型训练方法的实施例，该训练方法基于塔吊的操作数据作为学习样本集，进行深度神经网络模型的训练，在训练过程中，综合考虑塔吊运送的物品与目的地和障碍物的相对位置是否符合操作精确度要求，物品运送过程中摆动角度是否符合操作安全避障要求，以及物品相对塔吊的角速度是否符合操作摆动幅度要求，设置了精确度奖惩函数、避障奖惩函数和摆动奖惩函数，以得到符合上述多个约束条件参数的塔吊避障模型，从而能够通过塔吊避障训练模型精确、自动控制塔吊进行避障操作。具体实施流程以下结合图2进行说明。
[0089]
步骤1：创建初始化的深度神经网络模型，并初始化经验池和噪声分布；
[0090]
在本实施例中，深度神经网络模型采用异策略学习方法(off-policy)，行动策略与评估策略分开，行动策略actor为随机策略，保证可以进行足够的探索，评估策略critic为确定性策略，减少需要采样的数据，提高算法效率。同时，采用当前网络和目标网络的双网络和经验池来计算目标值，同时，使用经验池来计算目标q值，有效打破数据之间的相关
性，避免利用深度神经网络进行函数逼近时造成强化学习算法的不稳定。
[0091]
需要说明的是，结合行动策略与评估策略、当前网络与目标网络，还需要创建四个网络：actor当前网络、critic当前网络、actor目标网络、critic目标网络。
[0092]
在本实施例中，初始化经验池的数据来源于实际操作数据，具体的，通过在三维坐标系中对塔吊以及周围环境建模，在塔吊上和塔吊工作环境中分别装载(深度)相机，将进入的工作空间的事物的坐标，例如不可预期的障碍，实时传递给处理器，以得到实际操作数据。
[0093]
在本实施例中，还可以采用上一实施例中通过全局深度相机获取塔吊工作环境全局的实时图像的方式，并从该实时图像中提取障碍物和所运送的物品的位置数据，此处不再赘述。
[0094]
步骤2：获取塔吊的操作数据作为学习样本集，所述学习样本集中的学习样本数据包括：塔吊运送的物品所处的状态s
t
、在所述状态s
t
下加入噪声后的动作a
t
、执行所述动作a
t
后得到的奖惩值r
t
、和下一步的状态s
t+1
；
[0095]
具体的，根据塔吊的实际操作，在状态s
t
下执行加入噪声后的动作a
t
，执行该动作后所得奖励r
t
、下一步状态s
t+1
，将这些数据存入经验池作为学习样本，其中，所述动作是对塔吊进行的操作，所述状态包括所述物品分别与目的地和障碍物的相对位置、所述物品摆动角度、及所述物品相对塔吊的角速度，所述下一步的状态是执行所述动作a
t
的状态。
[0096]
需要说明的是，学习样本可以是人为定义的操作样本，具体的可以是：根据已知的当前状态s
t
，人为定义一个已知的动作a
t
，达到下一步状态s
t+1
(实际测得的状态)，从而根据此动作效果给与奖惩值r
t
。重复上述操作，直到获得足够的一组样本数据。
[0097]
步骤3：从步骤2得到的学习样本集中随机采样预设数量的学习样本，根据预定义的奖惩函数进行训练，以得到符合多个约束条件参数的塔吊避障模型；
[0098]
其中，所述多个奖惩函数包括以下中的至少两者：精确度奖惩函数、避障奖惩函数和摆动奖惩函数，且所述奖惩函数相应于所述多个约束条件参数而被设置。
[0099]
具体的，当样本数量达到神经网络进行训练需要的采样数n时，随机采样n条样本，根据计算的损失函数(loss)更新critic当前网络，根据策略梯度更新actor当前网络，并用软更新方式更新两个目标网络，经过预先设定(episode)训练轮数后保存模型。其中针对操作精确度要求、物品安全避障要求、物品摆动幅度要求分别设置精确度奖惩函数、避障奖惩函数和摆动奖惩函数，从而能够全面、自动的评判塔吊运送的物品的操作是否符合要求，并据此控制塔吊操作，而无需人工干预。
[0100]
本发明实施例提供了一种存储介质，其上存储有程序，该程序被处理器执行时实现所述塔吊避障模型训练方法或者所述塔吊实时避障的路径规划方法。
[0101]
本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行所述塔吊避障模型训练方法或者所述塔吊实时避障的路径规划方法。
[0102]
本发明实施例提供了一种塔吊控制器，该塔吊控制器包括：至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行所述塔吊避障模型训练方法或者所述塔吊实时避障的路径规划方法。
[0103]
处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个
或以上，通过调整内核参数来自动控制塔吊的操作，安全平稳的将运送物品到目的地。
[0104]
存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)，存储器包括至少一个存储芯片。
[0105]
本发明实施例提供了一种设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，处理器执行所述塔吊避障模型训练方法或者所述塔吊实时避障的路径规划方法。本文中的设备可以是服务器、pc、pad、手机等。
[0106]
本技术还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行所述塔吊避障模型训练方法或者所述塔吊实时避障的路径规划方法。
[0107]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0108]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0109]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0110]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0111]
在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0112]
存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
[0113]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备
或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。
[0114]
还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个
……”
限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0115]
以上仅为本技术的实施例而已，并不用于限制本技术。对于本领域技术人员来说，本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本技术的权利要求范围之内。

技术特征：
1.一种塔吊实时避障的路径规划方法，包括：获取塔吊当前工作环境中障碍物和所运送的物品的位置数据，及所述物品的摆动角度和相对于塔吊的角速度；根据当前的路径规划，获取所述物品预期达到的下一个目标位置，并据此确定当前要对塔吊进行的操作；将所述位置数据、所述摆动角度、所述角速度及所述操作输入塔吊避障模型，并根据该塔吊避障模型输出的结果，判定所述操作是否符合多个约束条件参数；以及若判定结果为不符合，则修改当前要对塔吊进行的操作，并修正所述物品预期达到的下一个目标位置，直至所述判定结果为符合，从而修正所述物品从当前位置到下一个目标位置的规划路径，直至达到规划路径的最终目标点，其中，所述塔吊避障模型为神经网络模型，且通过预定义的奖惩函数和相应的多个约束条件参数进行训练而得到；所述预定义的奖惩函数包括多个奖惩函数中的至少两者：精确度奖惩函数、避障奖惩函数和摆动奖惩函数。2.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述预定义的奖惩函数为所述多个奖惩函数的权重和；所述多个奖惩函数相应于所述多个约束条件参数而被设置；及所述多个奖惩函数的不同权重根据施工现场的安全重要性而被设置。3.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述精确度奖惩函数用于根据所述物品到达所述下一个目标位置的精确度，确定所述操作的奖惩值；所述精确度奖惩函数为当前时刻下所述操作的精确度状态奖惩值与精确度行为奖惩值之和；所述精确度状态奖惩值通过所述物品的位置与所述下一个目标位置的距离、第一阈值、及第二阈值而被计算，所述第一阈值与所述第二阈值为所述精确度奖惩函数相应的约束条件参数。4.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述物品与所述下一个目标位置的距离小于所述第一阈值时的精确度状态奖惩值，大于所述物品与所述下一个目标位置的距离小于所述第二阈值时的精确度状态奖惩值；所述物品在靠近目标点时的精确度行为奖惩值大于物品在远离目标点时的精确度行为奖惩值。5.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述避障奖惩函数用于根据塔吊运送物品过程中物品远离障碍物的程度，确定所述操作的奖惩值；所述避障奖惩函数为当前时刻下所述操作的避障状态奖惩值和避障行为奖惩值之和；所述避障状态奖惩值通过所述物品的位置与障碍物的距离、第三阈值、及第四阈值而被计算，且所述第三阈值与所述第四阈值为所述避障奖惩函数相应的约束条件参数。6.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述物品与障碍物的距离小于所述第三阈值时的避障状态奖惩值，大于所述物品与所
述障碍物的距离小于所述第四阈值时的避障状态奖惩值；所述物品在逐渐远离障碍物时的避障度行为奖惩值，大于所述物品在逐渐靠近障碍物时的避障度行为奖惩值。7.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述摆动奖惩函数用于根据塔吊运送物品过程中所述物品相对于塔吊的摆动程度确定所述操作的摆动奖惩值；所述摆动奖惩值通过所述物品相对于塔吊的角速度、摆动角度、第五阈值、及第六阈值而被计算，且所述第五阈值与所述第六阈值为所述摆动奖惩函数相应的约束条件参数。8.根据权利要求1所述的塔吊实时避障的路径规划方法，其特征在于，所述物品的摆动角度在要求的摆动范围内且所述物品相对于塔吊的角速度在要求的范围内时的摆动奖惩值，大于所述物品的摆动角度在要求的摆动范围内但所述物品相对于塔吊的角速度不在要求的范围内时的摆动奖惩值。9.一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，在所述程序运行时控制所述存储介质所在设备执行：如权利要求1-8中任一项所述的塔吊实时避障的路径规划方法。10.一种塔吊控制器，其特征在于，包括：至少一个处理器、以及与处理器连接的至少一个存储器、总线；其中，所述处理器、所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行：如权利要求1-8中任一项所述的塔吊实时避障的路径规划方法。

技术总结
本发明实施例提供一种塔吊实时避障的路径规划方法、存储介质及塔吊，属于机械控制技术领域。该方法包括：获取塔吊当前工作环境中障碍物和所运送的物品的位置数据及物品摆动角度和相对于塔吊的角速度；根据当前的路径规划，获取物品预期达到的下一个目标位置，并据此确定当前要对塔吊进行的操作；将位置数据、摆动角度、角速度及操作输入塔吊避障模型，并根据模型输出结果判定该操作是否符合多个约束条件参数；若判定结果为不符合则修改当前操作并修正物品预期达到的下一个目标位置，直至所述判定结果为符合，从而修正物品当前的规划路径，直至达到规划路径的最终目标点。该方法能够实时自动避障，实现真正的“无人驾驶塔吊”。。。

技术研发人员：刘嘉雯
受保护的技术使用者：北京东土科技股份有限公司
技术研发日：2023.04.14
技术公布日：2023/8/22

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种浒苔基多孔碳/ZIF-67复合材料及其制备方法和应用 下一篇：女性压力性尿失禁射频消融电极的制作方法

塔吊实时避障的路径规划方法、存储介质及塔吊控制器与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

塔吊实时避障的路径规划方法、存储介质及塔吊控制器与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表