基于LPA的拟人化自动驾驶车辆交叉口转向训练方法及装置
未命名
07-23
阅读:118
评论:0
基于lpa的拟人化自动驾驶车辆交叉口转向训练方法及装置
技术领域
1.本发明涉及自动驾驶技术领域,尤其是涉及一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法及装置。
背景技术:
2.自动驾驶技术是全球汽车和交通工程领域的重点发展方向。当前,自动驾驶处于大规模公共道路开放测试阶段。然而,交叉口因其道路结构、交通组成的复杂性,仍然对自动驾驶测试提出了巨大的挑战,如自动驾驶车辆与其他非自动驾驶车辆的交互等问题,必须在自动驾驶商业化应用前得到解决。因此,控制和优化自动车辆在交叉口的转向轨迹是自动驾驶发展的重要技术难题,传统的转向轨迹规划方法在应用于自动驾驶交叉口转向时存在诸多局限性,如精度低、泛化能力差及自适应更新能力不足等。
3.格点规划算法(lattice planner algorithm,lpa)已在百度阿波罗(apollo)自动驾驶规划模块中扮演重要角色,其基本原理是一种局部轨迹规划器,输出轨迹将直接输入到控制器,由控制器完成对局部轨迹的跟踪控制。lpa可以同时生成符合车辆动力学的路径与速度曲线,参数较少、计算消耗低、轨迹形状固定。因此,如何将lpa算法应用到转向轨迹规划中以提高规划性能是当前急需解决的问题。
技术实现要素:
4.本发明的目的就是为了提供一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法及装置,优化自动驾驶车辆在交叉口转向的安全、舒适和效率,解决自动驾驶轨迹规划层面的技术难题。
5.本发明的目的可以通过以下技术方案来实现:
6.一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,包括以下步骤:
7.步骤1:基于sh-nds数据,通过gps信息匹配,提取左转汇入和右转汇入两类潜在的交叉口转向事故前场景,采集校核后的有效事件构建自动驾驶车辆交叉口转向数据集;
8.步骤2:针对每类转向场景,将数据集随机划分为训练集和测试集;
9.步骤3:确定反映汽车转向控制相关目标的特征量指标,建立综合代价函数,其中,所述相关目标包括安全性目标、舒适性目标和效率目标;
10.步骤4:基于lpa算法训练车辆转向轨迹,每次训练时,按顺序训练训练集中的转向事件,重复多次,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出;
11.步骤5:在carla仿真环境中复现两类交叉口转向场景,基于训练得到的最佳轨迹控制自动驾驶车辆的转向,采集转向过程中自动驾驶车辆的运动数据,进行自动驾驶交叉口转向测试;
12.步骤6:基于相关目标的特征量指标综合分析测试集人类驾驶车辆和自动驾驶车辆的转向轨迹特征差异,评价lpa算法训练后的拟人化效果。
13.所述安全性目标的特征量指标为碰撞时间ttc,当两车接近时的ttc值越低,碰撞的风险就越高,安全性越低;若最小ttc值小于预配置的时间阈值,则ttc特征量指标为负值。
14.所述舒适性目标的特征量指标为:
[0015][0016]
其中,jerk为加加速度,表征加速度的变化率。
[0017]
所述效率目标的特征量指标为平均速度。
[0018]
所述综合代价函数为:
[0019]
r=-w1ttc+w2f
jerk-w3v
ave
[0020]
其中,w1、w2、w3是特征系数,ttc表示安全性目标的特征量指标,f
jerk
表示舒适性目标的特征量指标,v
ave
表示效率目标的特征量指标。
[0021]
一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,包括:
[0022]
数据集获取模块,用于基于sh-nds数据,通过gps信息匹配,提取左转汇入和右转汇入两类潜在的交叉口转向事故前场景,采集校核后的有效事件构建自动驾驶车辆交叉口转向数据集,并针对每类转向场景,将数据集随机划分为训练集和测试集;
[0023]
综合代价函数建立模块,通过确定反映汽车转向控制相关目标的特征量指标,建立综合代价函数,其中,所述相关目标包括安全性目标、舒适性目标和效率目标;
[0024]
lpa算法训练模块,用于基于lpa算法训练车辆转向轨迹,每次训练时,按顺序训练训练集中的转向事件,重复多次,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出;
[0025]
场景仿真模块,用于在carla仿真环境中复现两类交叉口转向场景,基于训练得到的最佳轨迹控制自动驾驶车辆的转向,采集转向过程中自动驾驶车辆的运动数据,进行自动驾驶交叉口转向测试;
[0026]
评价模块,用于基于相关目标的特征量指标综合分析测试集人类驾驶车辆和自动驾驶车辆的转向轨迹特征差异,评价lpa算法训练后的拟人化效果。
[0027]
所述安全性目标的特征量指标为碰撞时间ttc,当两车接近时的ttc值越低,碰撞的风险就越高,安全性越低;若最小ttc值小于预配置的时间阈值,则ttc特征量指标为负值。
[0028]
所述舒适性目标的特征量指标为:
[0029][0030]
其中,jerk为加加速度,表征加速度的变化率。
[0031]
所述效率目标的特征量指标为平均速度。
[0032]
所述综合代价函数为:
[0033]
r=-w1ttc+w2f
jerk-w3v
ave
[0034]
其中,w1、w2、w3是特征系数,ttc表示安全性目标的特征量指标,f
jerk
表示舒适性目标的特征量指标,v
ave
表示效率目标的特征量指标。
[0035]
与现有技术相比,本发明具有以下有益效果:
[0036]
(1)本发明基于自然驾驶数据对自动驾驶车辆在交叉口的转向轨迹进行了训练,使自动驾驶车辆能更好地学习人类驾驶的优点,并摒弃相应不足,提升了自动驾驶的安全性、舒适性和效率。
[0037]
(2)本发明结合格点规划算法与carla仿真测试,实现了自动驾驶车辆的轨迹规划,有效解决了自动驾驶车辆规划模块的技术难题,可促进自动驾驶车辆的开发与应用。
附图说明
[0038]
图1为本发明的方法流程图;
[0039]
图2是本发明自然驾驶交叉口转向事故前场景提取示意图;
[0040]
图3是本发明自动驾驶车辆与人类驾驶车辆转向轨迹对比图;
[0041]
图4是本发明自动驾驶车辆与人类驾驶车辆转向效率与舒适性对比图。
具体实施方式
[0042]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0043]
本实施例提供一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,基于自然驾驶实验数据,提取典型交叉口转向事故前场景构建训练集和测试集。采用格点规划算法,综合安全、舒适、效率评估指标建立代价函数,计算训练集中最佳轨迹作为输出进而控制仿真环境中自动驾驶车辆的运动,通过对比测试集中的轨迹评价拟人化训练效果,如图1所示,具体包括以下步骤:
[0044]
步骤1:基于上海自然驾驶实验数据(shanghai naturalistic driving study,sh-nds),通过gps信息匹配,提取左转汇入和右转汇入两类潜在的交叉口转向事故前场景,采集校核后的有效事件(每类场景至少包括各1000起事件)构建自动驾驶车辆交叉口转向数据集。
[0045]
步骤2:针对每类转向场景,随机选取其中的80%(各800起事件)作为训练数据,剩余的各20%作为测试数据,用于和训练后的自动驾驶仿真结果进行对比。
[0046]
训练集的构建过程如图2所示。
[0047]
步骤3:确定反映汽车转向控制相关目标(安全性目标、舒适性目标和效率目标)的特征量指标,建立综合代价函数。
[0048]
本实施例选取碰撞时间(time-to-collision,ttc)反映安全性目标;ttc表示两辆车相撞之前剩余的时间量,可以作为衡量冲突或碰撞风险的指标之一。当两车接近时的ttc值越低,碰撞的风险就越高。根据已有研究数据,3秒的ttc值可以视作最小安全阈值,基于此安全标准进行ttc特征构建:若最小ttc值(ttc
min
)小于3秒,则ttc特征量指标为负值。
[0049]
本实施例选取加加速度jerk来衡量驾驶舒适性,其特征构建为:
[0050][0051]
本实施例选取平均速度(average speed)来衡量驾驶效率,即目标车辆从车辆停止线前启动到通过交叉口整个过程中的平均速度。平均速度越大,驾驶效率就越高。
[0052]
根据上述特征量指标,构建综合代价函数:
[0053]
r=-w1ttc+w2f
jerk-w3v
ave
[0054]
其中,w1、w2、w3是特征系数,仿真开始前均预设为1。
[0055]
步骤4:基于格点规划算法(lpa)训练车辆转向轨迹。
[0056]
格点规划算法属于本领域的常规技术手段,该算法将车辆当前位置信息转换到参考线(frenet)坐标系下,分别对横向位移和纵向位移进行规划,形成frenet坐标系下的轨迹点,并将轨迹点从frenet坐标系再转换到笛卡尔(cartesian)坐标系,获得物理世界采样轨迹。对所采样轨迹进行约束和碰撞检测,确定一条最优的满足约束条件的无碰撞光滑轨迹,作为输出给控制器用于自动驾驶车辆的轨迹控制。
[0057]
本实施例对格点规划算法进行改进,每次训练时,按顺序训练训练集中的转向事件,重复多次,对特征系数进行优化,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出。
[0058]
步骤5:在carla仿真环境中复现两类交叉口转向场景,基于训练得到的最佳轨迹控制自动驾驶车辆的转向,采集转向过程中自动驾驶车辆的运动数据,进行自动驾驶交叉口转向测试。
[0059]
步骤6:基于ttc
min
,jerk及average speed指标综合分析测试集人类驾驶车辆和自动驾驶车辆的转向轨迹特征差异,评价lpa算法训练后的拟人化效果。
[0060]
本实施例中,将步骤5得到的自动驾驶轨迹分别与随机选择的一个人类驾驶车辆的交叉口左转和右转事件进行轨迹对比(如图3所示)和指标特征对比(如图4所示)。通过轨迹对比发现,训练后自动驾驶车辆在交叉口的右转轨迹比sh-nds数据中人类驾驶车辆的右转轨迹更加平滑,左转轨迹与人类驾驶车辆接近保持一致。从舒适性及效率评估指标对比发现,尽管有相似的初始速度,但人类驾驶员转向过程中产生了频繁的加速度变化,通过训练后的自动驾驶车辆可以保持更加稳定的转向加速度。此外,自动驾驶车辆和人类驾驶车辆的左转和右转均有相似的jerk值。
[0061]
综上,本发明所提出的自动驾驶车辆交叉口转向轨迹训练方法显示出安全、舒适和高效的特征,并兼具人类驾驶员的驾驶优点。
[0062]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依据本发明的构思在现有技术的基础上通过逻辑分析、推理、或者有限的实验可以得到的技术方案,皆应在权利要求书所确定的保护范围内。
技术特征:
1.一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,其特征在于,包括以下步骤:步骤1:基于sh-nds数据,通过gps信息匹配,提取左转汇入和右转汇入两类潜在的交叉口转向事故前场景,采集校核后的有效事件构建自动驾驶车辆交叉口转向数据集;步骤2:针对每类转向场景,将数据集随机划分为训练集和测试集;步骤3:确定反映汽车转向控制相关目标的特征量指标,建立综合代价函数,其中,所述相关目标包括安全性目标、舒适性目标和效率目标;步骤4:基于lpa算法训练车辆转向轨迹,每次训练时,按顺序训练训练集中的转向事件,重复多次,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出;步骤5:在carla仿真环境中复现两类交叉口转向场景,基于训练得到的最佳轨迹控制自动驾驶车辆的转向,采集转向过程中自动驾驶车辆的运动数据,进行自动驾驶交叉口转向测试;步骤6:基于相关目标的特征量指标综合分析测试集人类驾驶车辆和自动驾驶车辆的转向轨迹特征差异,评价lpa算法训练后的拟人化效果。2.根据权利要求1所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,其特征在于,所述安全性目标的特征量指标为碰撞时间ttc,当两车接近时的ttc值越低,碰撞的风险就越高,安全性越低;若最小ttc值小于预配置的时间阈值,则ttc特征量指标为负值。3.根据权利要求1所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,其特征在于,所述舒适性目标的特征量指标为:其中,jerk为加加速度,表征加速度的变化率。4.根据权利要求1所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,其特征在于,所述效率目标的特征量指标为平均速度。5.根据权利要求1所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练方法,其特征在于,所述综合代价函数为:r=-w1ttc+w2f
jerk-w3v
ave
其中,w1、w2、w3是特征系数,ttc表示安全性目标的特征量指标,f
jerk
表示舒适性目标的特征量指标,v
ave
表示效率目标的特征量指标。6.一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,其特征在于,包括:数据集获取模块,用于基于sh-nds数据,通过gps信息匹配,提取左转汇入和右转汇入两类潜在的交叉口转向事故前场景,采集校核后的有效事件构建自动驾驶车辆交叉口转向数据集,并针对每类转向场景,将数据集随机划分为训练集和测试集;综合代价函数建立模块,通过确定反映汽车转向控制相关目标的特征量指标,建立综合代价函数,其中,所述相关目标包括安全性目标、舒适性目标和效率目标;lpa算法训练模块,用于基于lpa算法训练车辆转向轨迹,每次训练时,按顺序训练训练
集中的转向事件,重复多次,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出;场景仿真模块,用于在carla仿真环境中复现两类交叉口转向场景,基于训练得到的最佳轨迹控制自动驾驶车辆的转向,采集转向过程中自动驾驶车辆的运动数据,进行自动驾驶交叉口转向测试;评价模块,用于基于相关目标的特征量指标综合分析测试集人类驾驶车辆和自动驾驶车辆的转向轨迹特征差异,评价lpa算法训练后的拟人化效果。7.根据权利要求6所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,其特征在于,所述安全性目标的特征量指标为碰撞时间ttc,当两车接近时的ttc值越低,碰撞的风险就越高,安全性越低;若最小ttc值小于预配置的时间阈值,则ttc特征量指标为负值。8.根据权利要求6所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,其特征在于,所述舒适性目标的特征量指标为:其中,jerk为加加速度,表征加速度的变化率。9.根据权利要求6所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,其特征在于,所述效率目标的特征量指标为平均速度。10.根据权利要求6所述的一种基于lpa的拟人化自动驾驶车辆交叉口转向训练装置,其特征在于,所述综合代价函数为:r=-w1ttc+w2f
jerk-w3v
ave
其中,w1、w2、w3是特征系数,ttc表示安全性目标的特征量指标,f
jerk
表示舒适性目标的特征量指标,v
ave
表示效率目标的特征量指标。
技术总结
本发明涉及一种基于LPA的拟人化自动驾驶车辆交叉口转向训练方法及装置,其中方法包括:构建自动驾驶车辆交叉口转向数据集,并针对每类转向场景,将数据集随机划分为训练集和测试集;确定反映汽车转向控制相关目标的特征量指标,建立综合代价函数;基于LPA算法训练车辆转向轨迹,每次训练时,按顺序训练训练集中的转向事件,重复多次,选择综合代价最小的轨迹进行约束和碰撞检查,循环检测后,确定最佳轨迹作为输出;在CARLA仿真环境中开展自动驾驶交叉口转向测试;对比仿真结果和测试集轨迹,评价LPA算法训练后的拟人化效果。与现有技术相比,本发明在处理自动驾驶车辆的交叉口转向方面显示出安全、舒适和高效的特征,并兼具人类驾驶员的驾驶优点。人类驾驶员的驾驶优点。人类驾驶员的驾驶优点。
技术研发人员:王雪松 何林佳
受保护的技术使用者:同济大学
技术研发日:2023.03.21
技术公布日:2023/7/21
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
