一种基于机器视觉的停留车识别与定位方法及系统

未命名 07-13 阅读:125 评论:0


1.本发明涉及铁路自动化技术领域,特别是涉及铁路编组场站货车识别与定位方法,可用于货运编组站场中货车自动编组过程中的初始溜放速度控制。


背景技术:

2.货运编组站线路情况复杂,其中连挂车作业是货运站场运输的重要环节。为确保安全平稳地实现推进车辆与作业股道停留车的连挂,推进车辆连挂前必须准确知道停留车的位置,通过推进车与停留车之间的距离精确控制初始溜放速度,确保作业过程中推进车辆在距离停留车十、五、三车距离时不超过规定限速。目前停留车位置以及停留车与推进车辆之间的距离主要依靠连接员人工方式确定,效率较低并且存在安全隐患;无线调车系统也需要专人在推进车辆端头安装测距或摄像设备,该方法的自动化程度和效率仍然较低,同时也存在安全隐患。实现停留车智能检测和自动测距对于站场安全运行和高效调车具有重要意义。
3.随着科学技术的发展,视觉目标检测经历了从图像处理到深度学习的转变,基于深度学习的目标检测可以达到更高的准确度,但目前深度学习尚未被应用于货运站场的车辆检测与识别。基于机器视觉的测距通常分为双目视觉测距方法和单目视觉测距方法。虽然双目视觉测距法精度较高,但应用该系统的成本也较高,并且特征点匹配精度和速度限制了双目测距的精度和实时性。为了解决上述问题,本发明通过建立停留车图像数据集训练深度学习识别模型实现对图像中站场停留车的自动识别与检测,通过设计单目视觉定位模型实现基于车辆检测框底部中心点坐标计算车辆到图像采集器距离,从而实现车辆定位。并基于上述方法发明了基于机器视觉的停留车识别定位系统,该系统也可推广应用于铁路线路车辆定位。
4.现有的目标检测算法按照检测步骤可分为:基于候选区域的目标检测算法和基于回归的目标检测算法。两种检测网络在检测准确率和检测速度上各有优劣,考虑到站场工作人员需要根据检测结果进行车辆实时调度,本发明选用速度更快的一阶段检测模型作为基础检测网络,其具有检测速度快、识别精度高的优点。训练数据集的好坏直接影响到检测模型的训练效果,目前公开的铁路数据集较少,针对货运列车的数据集更是空白,为解决这一问题,本发明采集并标注了不同时间段、不同光照、不同天气条件下的铁路线路和货运站场图像,并且采用旋转、平移、翻转、缩放、调节对比度、调节亮度和添加噪声等数据增强方式对训练集进行扩充作为深度学习识别模型的数据集。
5.单目视觉测距也分为多类,主要以摄像机内参几何标定模型、逆透视投影变换、数据回归建模这三种方法为主:沈志熙等人用不同基准距离与图像中位置对应关系做大量数据回归,拟合成像模型及镜头畸变误差,提出了基于数据回归建模的测距算法,但这种方法需要收集数据、分析、数学建模和训练等大量前期工作;郭磊利用车辆所处位置和图像采集器内参成像几何模型关系,二维坐标系转换到三维坐标系,计算车辆在世界坐标与成像坐标系的映射关系,确定车辆在世界坐标系中的位置,获取物体的距离信息,实现了测距。这
种方法对图像采集器的姿态角需要准确判定,否则产生较大的距离测量误差。因此,本发明通过构建三次多项式实现像素坐标与实际距离值的关系拟合,并给出了多项式系数求解的坐标点拟合标定方法。


技术实现要素:

6.本发明的目的在于克服现有技术的缺点,提供一种基于机器视觉的停留车识别与定位方法及系统。
7.本发明的目的通过以下技术方案来实现:一种基于机器视觉的停留车识别与定位方法,所述方法基于停留车网络检测模型,能够被一个或多个处理器执行,其特征在于:配置具有固定焦距和固定姿态的图像采集器,以获取铁路线路或站场的图像数据;构建基于深度学习的停留车识别模型,用于压缩并提取所述图像数据的特征,并且对所述特征进行缩放以适应目标移动造成的尺度变化,其中,通过检测头完成对目标的检测;所述基于机器视觉的停留车识别与定位方法构建沿轨道方向距离与目标的纵坐标之间的函数关系式,并基于所述函数关系式确定沿轨道方向距离y的估算值。
8.优选的,基于深度学习的停留车识别模型能够通过所述图像采集器获得铁路线路或站场的图像数据,通过主干网络压缩并提取图像特征,其中的cbam模块能够调节主干网络中参数以忽略图像中的背景部分,并将模型的检测中心转移到检测目标上,其中的siou函数能够提高模型收敛速度,通过颈部网络对所述特征进行进一步压缩或扩展以适应目标在大范围场景内移动造成的尺度变化,通过三个不同大小检测头对相应尺度的目标进行检测。
9.优选的,所述基于深度学习的停留车识别模型能够在所述图像数据中车辆尾部端面周围生成包含车辆种类信息的检测框,并获取所述检测框底部中心在所述图像数据中的像素坐标。
10.优选的,所述一个或多个处理器能够基于所述像素坐标确定车辆尾部与图像采集器之间沿轨道方向距离y的理论计算值,沿轨道方向距离y的理论计算值能够通过但不限于n次多项式的函数关系式y=knxn+k
n-1
x
n-1
+
……
+k2x2+k1x+k0表示,其中,x为检测框底部中心在所述图像数据中的纵坐标,kn……
k2,k1,k0为多项式系数。
11.优选的,所述多项式系数按照如下方式确定:记录多组在不同位置的车辆尾部端面的检测框底部中心在所述图像数据中的纵坐标x以及所述沿轨道方向距离y的实测值;将坐标(x,y)代入公式y=knxn+k
n-1
x
n-1
+
……
+k2x2+k1x+k0中后,基于最小二乘法进行拟合以获取所述多项式系数,其中,所述实测值能够基于激光测距离或激光雷达或手动测量的方式获取。
12.优选的,所述图像采集器能够采集不同时间段、不同光照条件下铁路线路或站场的图像数据,所述一个或多个处理器能够按照如下方式对所述图像数据进行处理以形成数据集:对所述图像数据中的货运车辆的类型和检测框进行标注;基于数据增强的方式对所述图像数据进行处理,其中,所述数据增强方式包括但不限于:旋转、平移、翻转、缩放、调节对比度、调节亮度和添加噪声。
13.优选的,所述数据增强方式还包括:对m张图像数据进行随机裁剪和缩放后混合形成1张图像数据。
14.优选的,所述图像采集器的数量能够基于站场内股道长度或横向上的股道数量进行增加或减少,其中,在所述图像采集器的数量为若干个的情况下,所述若干个图像采集器配置为:不同的图像采集器所采集的图像范围彼此不同,其中,相邻的两个图像采集器所采集的图像范围能够具有重叠;单个图像采集器能够对其自身精确定位范围内的用于实现停留车识别和定位的图像数据进行采集,其中,对所述若干个图像采集器各自采集的图像数据进行汇总处理后能够实现全股道范围内停留车的识别和定位。例如,设一个相机纵向上可以实现100米范围内停留车的准确定位,横向上可以实现3条股道的覆盖,设某编组场有15条股道,每条股道长1000米,则可以在每条股道纵向布置10台相机,横向上每3条股道布置1台相机,共需布置50台相机实现站场的全覆盖,由软件系统按照上述定位模型实现各相机监测范围内的停留车定位,并结合各个相机的位置实现所有停留车在整个编组站内的全局定位。
15.本技术还提供一种基于机器视觉的停留车识别与定位系统,其特征在于,包括:图像采集器,其具有固定焦距和固定姿态,用于获取铁路线路或站场的图像数据;能够构建基于深度学习的停留车检测网络模型,用于压缩并提取所述图像数据的特征,并且对所述特征进行缩放以适应目标移动造成的尺度变化,其中,通过检测头完成对目标的检测;能够构建沿轨道方向距离与目标的纵坐标之间的函数关系式,并基于所述函数关系式确定沿轨道方向距离y的估算值。
16.本技术还提供一种计算机可读存储介质,包括计算机可执行指令,所述计算机可执行指令在由一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1至8中的任一项所述的方法。
17.本发明具有以下优点:
18.(1)本发明通过使用基于深度学习的目标检测方法实现了快速、准确地铁路停留车辆检测与识别。
19.(2)本发明不仅能够实现对目标列车种类的检测,同时还能够完成对目标车辆的测距。
20.(3)与现有测距手段不同,本发明仅依靠标定的单目相机即可通过图像中车辆像素坐标计算铁路车辆的准确距离。
附图说明
21.图1为基于机器视觉的停留车识别与定位方法的流程示意图;
22.图2为传统单目视觉几何测距模型的示意图;
23.图3为车辆检测网络训练结果的示意图。
24.图4为停留车检测网络模型的网络结构示意图;
25.图5为混合注意力模块的结构示意图;
26.图6为cbam-yolov5的网络结构示意图。
具体实施方式
27.下面结合附图对本发明做进一步的描述,本发明的保护范围不局限于以下所述:
28.实施例1
29.如图所示,本技术提供一种基于机器视觉的停留车识别与定位方法,所述方法能够被一个或多个处理器执行,包括如下步骤:配置具有固定焦距和固定姿态的图像采集器,以获取铁路线路或站场的图像数据;所述一个或多个处理器对所述图像数据进行识别,以对图像数据中不同铁路车辆的类型进行确定,并获取获取车辆尾部在所述图像数据中的坐标位置;所述一个或多个处理器构建所述沿轨道方向距离与图像数据的纵坐标之间的n次多项式,并基于所述n次多项式确定沿轨道方向距离y的理论计算值。所述一个或多个处理器在获取所述坐标位置的情况下,能够在所述图像数据中生成铁路车辆尾部端面的检测框,并获取检测框底部中心在所述图像数据中的像素坐标。
30.具体的,本技术提供一种基于机器视觉的停留车识别与定位模型,其过程包括:首先利用事先标定的,具有固定焦距、固定姿态的图像采集器获取一幅铁路线路或站场图像,然后利用深度学习方法检测铁路线路或站场图像中的铁路车辆并识别其类型,再基于检测到的车辆在图像中的坐标位置计算车辆在轨道方向的纵向距离,从而实现停留车辆的精确定位。本技术还提出一种基于深度学习的停留车检测网络模型,用于货运站场中停驻的棚车、敞车、罐车、平车等不同类型货运列车的识别,并能在图像中准确地标出车辆尾部的位置,利用机器代替人工进行车辆种类识别,该模型可借助识别的不同车型对检测框位置进行精确回归,能够准确检测货车尾部端面检测框在图像中的坐标位置,进而获取面向图像采集器的车辆端部检测框底部线中心在图像中的像素坐标。
31.优选的,如图4所示,停留车的检测可以通过停留车检测网络模型实现。停留车检测网络模型主要由三部分构成:主干网络(backbone)、颈部网络(neck)和检测头(head)。主干网络采用darknet53,其作用是特征提取,主要由cbs模块、c3模块和sppf模块构成。其中最基础的模块是cbs模块,由卷积(conv)、批归一化(bn)和激活函数(silu)组成;c3模块则由resunit模块和外侧的cbs模块拼接操作组成;sppf模块将输入串行通过多个5x5大小的maxpool层,再将各结果拼接后通过cbs模块。颈部网络的作用是实现特征融合,将主干网络不同阶段生成的具有不同感受野的中间特征图拼接融合后输入到检测头中。检测头的作用是输出预测结果。
32.进一步的,在停留车检测网络模型中引入siou损失函数和cbam混合注意力模块提高对车辆的检测准确率。
33.具体的,传统的目标检测损失函数依赖于边界框回归指标的聚合,例如预测框和真实框(即giou、ciou、iciou等)的距离、重叠区域和纵横比,但迄今为止提出和使用的方法都没有考虑到所需真实框与预测框之间不匹配的方向。这种不足导致收敛速度较慢且效率较低,因为预测框可能在训练过程中“四处游荡”并最终产生更差的模型。因此本技术提出了一种新的损失函数siou,其中考虑到所需回归之间的向量角度,重新定义了惩罚指标。损失函数siou由角度成本函数、距离成本函数、形状成本函数以及iou成本函数构成。
34.具体的,注意力机制通常可以分为通道注意力机制和空间注意力机制,而本技术中使用的混合注意力模块cbam则是将两者结合到一起,从而更有效的改善对于兴趣目标的检测。cbam(convolutionalblockattentionmodule)对给定的输入特征图可以先后沿着空间维度和通道维度两个维度计算出注意力权重,然后用运算得出的权重系数与输入的特征图相乘来对输入特征进行自适应调整,其结构如图5所示。由图中可以看出,混合注意力模块其实是由通道注意力模块和空间注意力模块拼接组成,两个模块分别对应两种不同注意
力机制的计算。输入通道注意力模块的特征f的维度是h
×w×
c,算法首先利用并联的全局平均池化和最大池化操作得到两个1
×1×
c维度的通道特征。然后再把得到的通道信息依次输入到两层共享的卷积层,首层网络具有c/r个神经元,采用的激活函数是relu函数,另一层网络有c个神经元。然后把两层网络输出的特征进行加和,最后经过sigmoid激活函数运算获取权重系数mc,将权重系数和原来的特征f相乘即可得到缩放后的新特征,获取通道注意力权重系数的表达式为:其中:σ表示sigmoid函数,mlp的权重w0和w1对两个输入都是共享的,
35.空间注意力的输入特征f的尺度为h
×w×
c,算法通过通道层级上的平均池化和最大池化得到两个h
×w×
1维度的通道描述。然后经过sigmoid激活函数得到权重系数ms。最后将权重系数和特征f相乘即可得到具有空间注意力的特征。获取空间注意力权重系数的表达式为:其中:σ表示sigmoid函数,f7×7表示滤波器大小为7
×
7的卷积操作。本技术采用的cbam-yolov5的网络结构如图6所示:在原始yolov5网络结构的基础上,将主干网络中的csp1_1、csp1_2、csp1_3和颈部网络中的csp2_1和cbl模块替换成混合注意力模块。混合注意力模块使用特征的通道关系来输出通道注意力图:首先,算法对输入特征图的空间尺寸进行压缩以有效地计算通道注意力;其次,为了汇聚空间信息,模块对输入特征图进行平均池化和最大池化操作;然后将获取到的平均特征和空间特征发送到由多层感知器组成的权值共享网络以产生通道注意图;空间注意力是对通道注意力的补充:算法首先沿通道轴进行平均集合和最大集合操作,并将其串联起来生成特征描述,在串联的特征描述应用卷积层来补充生成空间注意力图。在获得两个注意力图后,模型通过池化操作对特征图的通道信息进行汇总,然后将获得的特征进行串联和卷积以产生最终的输出注意力图像。
36.优选的,所述一个或多个处理器能够基于所述像素坐标确定铁路车辆尾部与图像采集器之间的沿轨道方向距离y的理论计算值,沿轨道方向距离y的理论计算值能够通过公式y=knxn+k
n-1
x
n-1
+
……
+k2x2+k1x+k0表示,其中,x为检测框底部中心在所述图像数据中的纵坐标,kn……
k2,k1,k0为多项式系数。所述多项式系数按照如下方式确定:记录多组在不同位置的铁路车辆尾部端面的检测框底部中心在所述图像数据中的纵坐标x以及所述沿轨道方向距离y的实测值;将坐标(x,y)代入公式y=knxn+k
n-1
x
n-1
+
……
+k2x2+k1x+k0中后,基于最小二乘法进行拟合以获取所述多项式系数,其中,所述实测值能够基于激光测距离或激光雷达的测量获取。
37.具体的,传统单目视觉几何测距模型如图2所示,其中,o'(x0,y
x
)作为像素平面中心,是成像平面和光轴的交点;p作为选取停留车测距参考,是车辆底部中点在地面的投影点;p(x,y)是参考点在成像上的像素坐标;图像采集器焦距f,单位为图像采集器像素;h是图像采集器光心位置垂直于地面的最短实际距离,作为图像采集器的高度;h是像平面的成像高度,为p到o'的距离。由于小孔成像的相似性,世界坐标系中的点p与成像平面的距离d和像素坐标系p的纵坐标y存在一定的函数关系,但根据相关研究,测距的两个关键因素,其一是图像采集器高度准确,当图像采集器的高度测量变化范围在20cm时,距离变化为4.323m,由于本发明中图像采集器是被固定在横梁上,不易发生明显的高度变化;其二是图像采集器俯仰角是否准确,当图像采集器的俯仰角变化0.4
°
时,距离变化为5.4445m。因此在本方案中,图像采集器高度变化对距离求解影响不大,但是图像采集器俯仰角和偏航角
的变化,很大程度影响测距准确性。本技术中图像采集器的工作环境包含货运编组站,大吨位的重载列车行驶带来的震动可能会引起图像采集器姿态的变化,导致目标距离和其成像总坐标的关系有时并不严格遵循形似三角形关系。因此本发明通过预先对关键位置进行标记,采集多组距离和像素点坐标,在获得足够多的距离和像素坐标之后,使用n次多项式对二者关系进行拟合。
38.优选的,所述图像采集器能够采集不同时间段、不同光照条件下铁路线路或站场的图像数据,所述一个或多个处理器能够按照如下方式对所述图像数据进行处理以形成数据集:对所述图像数据中的铁路车辆的类型和检测框进行标注;基于数据增强的方式对所述图像数据进行处理,其中,所述数据增强方式包括但不限于:旋转、平移、翻转、缩放、调节对比度、调节亮度和添加噪声。所述数据增强方式还包括:对9张图像数据进行随机裁剪和缩放后混合形成1张图像数据。在所述图像采集器的数量为若干个的情况下,相邻的两个图像采集器所采集的图像范围能够具有重叠。
39.具体的,数据集用于为车辆检测模型提供数据支持。构建的数据集如表1所示,这些图片以3:1:1的比例随机划分为训练集、验证集和测试集。
40.表1数据集组成
[0041][0042]
为了确保对较长轨道上各位置的车辆都能进行定位,需要在轨道沿线依据无缝覆盖原则按照单图像采集器可精确定位范围(布置多台图像采集器,相邻图像采集器间要实现定位范围的重叠覆盖,例如单台图像采集器可精确定位范围为100米,股道长度1000米,则需要布置至少10台图像采集器。该系统需要包含前端图像采集器、边缘识别与定位处理单元(可选)、全局定位服务器等部分,相互之间通过有线或无线网络相连,通过每台图像采集器在自己可精确定位范围内进行车辆识别与精准定位,某一股道内多台图像采集器基于图像采集器各自位置以及车辆相对于该图像采集器的距离实现全股道范围内的全局精确定位,识别与定位处理可以在边缘识别与定位处理单元实现,也可以在后端的全局定位服务器实现。
[0043]
实施例2
[0044]
本实例可用于对铁路场景下停留车的种类进行识别,对测试场景下行人的距离进行测算。通过站场获取的图像建立了停留车数据集,如表1所示,白天和夜晚场景各有5000余个样本。根据深度学习算法的训练方式,本文将在公共数据集上预训练得到的模型权重作为初始权重,然后使用停留车数据集进行训练。其中在停留车数据集上进行训练的实验参数设置如下。首先将本文选用的深度学习算法搭建在windows上的pytorch平台上,模型选用wormup优化算法对模型参数进行更新,初始学习率为0.001,在wormup阶段采用一维线性插值对学习率进行更新,在wormup阶段后采用余弦退火算法对学习率进行更新,上述设置只是为了说明过程,其中的参数不作为对本发明的约束。车辆检测网络训练结果如图3所示,经过400个epoch的迭代后,分类损失、预测框置信度损失和预测框定位损失都降低到接
近0,而准确率和召回率趋近于1,达到了较好的效果。测试集测试结果如表2所示,准确率(precision)、召回率(recall)和map都接近1,满足准确性要求,检测速度达到65fps,满足实时性要求。
[0045]
表2目标检测网络测试结果
[0046][0047]
为了测试基于单目视觉的模型的测距效果,在停车站场采集了如表3所示的车辆实际距离与车辆框底线中点像素纵坐标之间的图像对,其中实际距离采用与相机安装在一起的激光雷达获取,纵坐标是图像中识别出的货车尾部识别框底线中点位置的像素纵坐标。
[0048]
表3关键距离节点与纵坐标值
[0049][0050]
获得多组距离值和坐标值后,利用三阶多项式拟合获得公式中的系数,拟合后的公式为:y=0.000010212675x
3-0.012589329377x2+5.296757296644x-722.389018
[0051]
上述方程中,各次幂的系数根据相机焦距、安装姿态以及安装高度不同会存在差异,因此,每个相机安装完毕后需要通过上述标定过程获得各系数的值。
[0052]
在获得距离方程后,利用另外多组数据进行验证,获得的误差如表4所示,误差均不超过1m,表明距离方程较为准确。
[0053]
表4预测距离与实际距离的误差
[0054][0055]
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。
凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于机器视觉的停留车识别与定位方法,所述方法基于停留车网络检测模型,能够被一个或多个处理器执行,其特征在于:配置具有固定焦距和固定姿态的图像采集器,以获取铁路线路或站场的图像数据;构建基于深度学习的停留车检测网络模型,用于压缩并提取所述图像数据的特征,并且对所述特征进行缩放以适应目标移动造成的尺度变化,其中,通过检测头完成对目标的检测;所述基于机器视觉的停留车识别与定位方法构建沿轨道方向距离与目标的纵坐标之间的函数关系式,并基于所述函数关系式确定沿轨道方向距离y的估算值。2.根据权利要求1所述的基于机器视觉的停留车识别与定位方法,其特征在于,基于深度学习的停留车检测网络模型能够通过所述图像采集器获得铁路线路或站场的图像数据,通过主干网络压缩并提取图像特征,其中的cbam模块能够调节主干网络中参数以忽略图像中的背景部分,并将模型的检测中心转移到检测目标上,其中的siou函数能够提高模型收敛速度,通过颈部网络对所述特征进行进一步压缩或扩展以适应目标在大范围场景内移动造成的尺度变化,通过三个不同大小检测头对相应尺度的目标进行检测。3.根据权利要求2所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述基于深度学习的停留车检测网络模型能够在所述图像数据中车辆尾部端面周围生成包含车辆种类信息的检测框,并获取所述检测框底部中心在所述图像数据中的像素坐标。4.根据权利要求1所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述一个或多个处理器能够基于所述像素坐标确定车辆尾部与图像采集器之间沿轨道方向距离y的理论计算值,沿轨道方向距离y的理论计算值能够通过但不限于n次多项式的函数关系式y=k
n
x
n
+k
n-1
x
n-1
+
……
+k2x2+k1x+k0表示,其中,x为检测框底部中心在所述图像数据中的纵坐标,k
n
……
k2,k1,k0为多项式系数。5.根据权利要求4所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述多项式系数按照如下方式确定:记录多组在不同位置的车辆尾部端面的检测框底部中心在所述图像数据中的纵坐标x以及所述沿轨道方向距离y的实测值;将坐标(x,y)代入公式y=k
n
x
n
+k
n-1
x
n-1
+
……
+k2x2+k1x+k0中后,基于最小二乘法进行拟合以获取所述多项式系数,其中,所述实测值能够基于激光测距离或激光雷达或手动测量的方式获取。6.根据权利要求2所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述图像采集器能够采集不同时间段、不同光照条件下铁路线路或站场的图像数据,所述一个或多个处理器能够按照如下方式对所述图像数据进行处理以形成数据集:对所述图像数据中的货运车辆的类型和检测框进行标注;基于数据增强的方式对所述图像数据进行处理,其中,所述数据增强方式包括但不限于:旋转、平移、翻转、缩放、调节对比度、调节亮度和添加噪声。7.根据权利要求6所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述数据增强方式还包括:对m张图像数据进行随机裁剪和缩放后混合形成1张图像数据。8.根据权利要求5所述的基于机器视觉的停留车识别与定位方法,其特征在于,所述图像采集器的数量能够基于站场内纵向股道长度或横向股道数量进行增加或减少,其中,在
所述图像采集器的数量为若干个的情况下,所述若干个图像采集器配置为:不同的图像采集器所采集的图像范围彼此不同,其中,相邻的两个图像采集器所采集的图像范围能够具有重叠;单个图像采集器能够对其自身精确定位范围内的用于实现停留车识别和定位的图像数据进行采集,其中,对所述若干个图像采集器各自采集的图像数据进行汇总处理后能够实现全股道范围内停留车的识别和定位。9.一种基于机器视觉的停留车识别与定位系统,其特征在于,包括:图像采集器,其具有固定焦距和固定姿态,用于获取铁路线路或站场的图像数据;能够构建基于深度学习的停留车检测网络模型,用于压缩并提取所述图像数据的特征,并且对所述特征进行缩放以适应目标移动造成的尺度变化,其中,通过检测头完成对目标的检测;能够构建沿轨道方向距离与目标的纵坐标之间的函数关系式,并基于所述函数关系式确定沿轨道方向距离y的估算值。10.一种计算机可读存储介质,包括计算机可执行指令,所述计算机可执行指令在由一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1至8中的任一项所述的方法。

技术总结
本发明公开了一种基于机器视觉的停留车识别与定位方法及系统,所述方法基于停留车网络检测模型,能够被一个或多个处理器执行,包括如下步骤:配置具有固定焦距和固定姿态的图像采集器,以获取铁路线路或站场的图像数据;构建基于深度学习的停留车识别模型,用于压缩并提取所述图像数据的特征,并且对所述特征进行缩放以适应目标移动造成的尺度变化,其中,通过检测头完成对目标的检测;所述基于机器视觉的停留车识别与定位方法构建沿轨道方向距离与目标的纵坐标之间的函数关系式,并基于所述函数关系式确定沿轨道方向距离y的估算值。述函数关系式确定沿轨道方向距离y的估算值。述函数关系式确定沿轨道方向距离y的估算值。


技术研发人员:郭保青 陈锋华 余祖俊 刘中田 杜林
受保护的技术使用者:北京交通大学 北京北交信通科技有限公司
技术研发日:2023.01.28
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐