一种线性目标检测方法、装置、终端设备及介质与流程
未命名
07-15
阅读:153
评论:0
1.本技术属于人工智能技术领域,尤其涉及一种线性目标检测方法、装置、终端设备及计算机可读存储介质。
背景技术:
2.线性目标对象是指在数字图像中可以利用几何线段表示的目标,例如交通图像中的车道线,建筑图像中的建筑轮廓线,以及工业图像中一些元器件的轮廓线等。在图像中检测这些线性目标对象通常具有重要的意义,示例性的,通过实时检测图像中的车道线及其他目标,可以实时判断视野中是否存在车辆违章情况。
3.现有技术通常是利用深度神经网络的方法直接回归线性目标对象的中点、角度以及线段的长度等信息,考虑不够全面,导致现有技术存在检测准确率低下的问题。
技术实现要素:
4.本技术实施例提供了一种线性目标检测方法、装置、终端设备及计算机可读存储介质,可以提高对线性目标对象的检测准确率。
5.第一方面,本技术实施例提供了一种线性目标检测方法,包括:
6.获取待检测图像;
7.将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。
8.可选的,所述线性目标检测模型包括特征提取网络和线性目标检测网络;所述将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果,包括:
9.将所述待检测图像输入至所述特征提取网络进行特征提取,得到特征图;
10.将所述特征图输入至所述线性目标检测网络进行检测,得到所述线性目标对象的预测值和所述线性特征;所述预测值用于表征所述线性目标对象是否存在;
11.若所述预测值大于设定阈值,则根据所述线性特征输出所述线性目标检测结果。
12.可选的,所述根据所述线性特征输出所述线性目标检测结果,包括:
13.根据所述方向信息,确定所述线性目标对象的偏移方向以及偏移程度;
14.根据所述线性目标对象的所述中心坐标、所述长度、所述角度、所述偏移程度以及所述偏移方向,输出所述线性目标检测结果。
15.可选的,在将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果之前,还包括:
16.获取样本图像集;所述样本图像集包括多张样本图像,每张样本图像中包含至少一个样本线性对象;
17.将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型;
18.所述神经网络模型包括特征提取网络和初始检测网络;相应的,所述将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型,包括:
19.将所述样本图像集输入至所述特征提取网络进行特征提取,得到所述每张样本图像对应的样本特征图;
20.确定每张所述样本特征图各自对应的样本线性特征;所述样本线性特征包括对应样本线性对象的样本中心坐标、样本长度、样本角度以及所述样本角度对应的样本方向信息;
21.以所述样本线性特征作为训练集对所述初始检测网络进行优化训练,并将优化训练后的所述初始检测网络确定为线性目标检测网络;
22.根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数;
23.根据所述总损失函数和所述线性目标检测网络,构建得到所述线性目标检测模型。
24.可选的,所述确定每张所述样本特征图各自对应的样本线性特征,包括:
25.针对任意一张所述样本特征图,获取所述样本特征图中任意一个目标样本线性对象的端点坐标;
26.根据所述端点坐标,确定所述目标样本线性对象的目标样本中心坐标和目标样本长度;
27.根据所述目标样本长度和所述端点坐标,计算得到所述目标样本线性对象的目标样本角度;
28.计算所述目标样本角度对应的样本方向信息。
29.可选的,所述预测特征包括样本预测值、预测中心坐标、预测长度、预测角度及预测方向信息;所述根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数,包括:
30.根据所述样本中心坐标、所述端点坐标以及所述预测中心坐标,计算得到位置损失函数;
31.根据所述样本长度、所述预测长度以及所述样本线性对象对应的聚类中心,计算得到长度损失函数;所述聚类中心由所述样本图像集中所有样本线性对象的样本长度聚类得到;
32.根据所述样本角度和所述预测角度,计算得到角度损失函数;
33.根据所述样本预测值,计算得到预测损失函数;
34.根据所述样本方向信息和所述预测方向信息,计算得到方向损失函数;
35.根据所述位置损失函数、所述长度损失函数、所述角度损失函数、所述预测损失函数以及所述方向损失函数,计算得到所述总损失函数。
36.可选的,所述方向信息包括第一方向信息和第二方向信息,所述第一方向信息用于描述所述线性目标对象沿第一方向的偏移程度,所述第二方向信息用于描述所述线性目
标对象沿第二方向的偏移程度,所述第一方向与所述第二方向相反;所述方向信息根据以下公式计算得到:
[0037][0038]
其中,c1表示所述第一方向信息;dc1表示所述第二方向信息;β表示所述角度,abs(
·
)表示绝对值函数。
[0039]
第二方面,本技术实施例提供了一种线性目标检测装置,包括:
[0040]
第一获取单元,用于获取待检测图像;
[0041]
第一处理单元,用于将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。
[0042]
第三方面,本技术实施例提供了一种终端设备,包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,上述处理器执行所述计算机程序时实现如上述第一方面中任一项所述的线性目标检测方法。
[0043]
第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面中任一项所述的线性目标检测方法。
[0044]
第五方面,本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备可执行上述第一方面中任一项所述的线性目标检测方法。
[0045]
本技术实施例与现有技术相比存在的有益效果是:
[0046]
本技术实施例提供的一种线性目标检测方法,通过获取待检测图像;将待检测图像输入至已训练的线性目标检测模型进行处理,得到待检测图像的线性目标检测结果;其中,线性目标检测模型用于确定待检测图像中的线性目标对象的线性特征,并根据线性特征输出线性目标检测结果;线性特征包括线性目标对象的中心坐标、长度、角度以及角度对应的方向信息。与现有技术相比,本技术通过线性目标检测模型,不仅可以确定待检测图像中的线性目标对象的中心坐标、长度及角度,还能确定该角度对应的方向信息,从而可以准确确定出线性目标对象所处位置、长短及方位,故提高了对线性目标对象的检测准确率。
附图说明
[0047]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0048]
图1是本技术一实施例提供的线性目标检测方法的实现流程图;
[0049]
图2是本技术另一实施例提供的线性目标检测方法的实现流程图;
[0050]
图3是本技术一实施例提供的方向信息的原理示意图;
[0051]
图4是本技术再一实施例提供的线性目标检测方法的实现流程图;
[0052]
图5是本技术又一实施例提供的线性目标检测方法的实现流程图;
[0053]
图6是本技术一实施例提供的线性目标检测装置的结构示意图;
[0054]
图7是本技术一实施例提供的终端设备的结构示意图。
具体实施方式
[0055]
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
[0056]
应当理解,当在本技术说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0057]
还应当理解,在本技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0058]
如在本技术说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
[0059]
另外,在本技术说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0060]
在本技术说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
[0061]
请参阅图1,图1是本技术一实施例提供的一种线性目标检测方法的实现流程图。本技术实施例中,该线性目标检测方法的执行主体为终端设备。
[0062]
如图1所示,本技术一实施例提供的线性目标检测方法可以包括s101~s102,详述如下:
[0063]
在s101中,获取待检测图像。
[0064]
在实际应用中,当用于需要检测出图像中的线性目标对象时,可以向终端设备发送线性目标检测请求。
[0065]
本技术实施例中,终端设备检测到用户发送的线性目标检测请求可以是:检测到针对终端设备的预设操作。其中,预设操作可以根据实际需要设置,此处不作限制。示例性的,预设操作可以是点击终端设备上的预设控件。基于此,终端设备在检测到上述预设控件被点击时,说明检测到预设操作,即检测到用户发送的线性目标检测请求。
[0066]
终端设备在检测到上述线性目标检测请求后,可以获取需要进行线性目标检测的待检测图像。
[0067]
在本技术实施例的一种实现方式中,终端设备可以预先从其它设备中获取到待检测图像,并将该待检测图像存储至自身存储器中,当终端设备检测到上述线性目标检测请求后,可以从自身存储器中获取到待检测图像。其中,其它设备可以是服务器。
[0068]
在本技术实施例的另一种实现方式种,终端设备可以实时从与其无线/有线通信连接的摄像设备中实时获取到待检测图像。
[0069]
在s102中,将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。
[0070]
本技术实施例中,终端设备在得到待检测图像后,将该待检测图像输入至已训练的线性目标检测模型进行处理,以得到待检测图像的线性目标检测结果。
[0071]
需要说明的是,在实际应用中,线性目标对象可以是交通图像中的车道线,建筑图像中的建筑轮廓线,以及工业图像中的元器件的轮廓线等。
[0072]
线性目标对象的角度指线性目标对象与水平线之间的夹角。
[0073]
在一些可能的实施例中,线性目标对象的线性特征包括但不限于:中心坐标、长度、角度、角度对应的方向信息、颜色、粗细及线的类别等。其中,线的类别包括但不限于实线和虚线。
[0074]
具体地,线性目标检测模型在接收到待检测图像后,可以对该待检测图像中的线性目标对象进行预测,以确定该线性目标对象的线性特征,之后,可以根据该线性特征输出线性目标检测结果。
[0075]
在本技术的一个实施例中,线性目标检测模型包括特征提取网络和线性目标检测网络,因此,终端设备具体可以根据如图2所示的s201~s203输出线性目标检测结果,详述如下:
[0076]
在s201中,将所述待检测图像输入至所述特征提取网络进行特征提取,得到特征图。
[0077]
在本技术的一个实施例中,为了提高对线性目标对象的长度的检测精度和检测准确率,特征提取网络可以设置有多个不同尺度的输出,即用于输出不同尺度的特征图,从而用于对不同长度的线性目标对象进行检测。
[0078]
在s202中,将所述特征图输入至所述线性目标检测网络进行检测,得到所述线性目标对象的预测值和所述线性特征;所述预测值用于表征所述线性目标对象是否存在。
[0079]
本实施例中,终端设备在检测到线性目标对象的预测值后,可以将该预测值与设定阈值进行比较。其中,设定阈值可以根据实际需要设置,此处不作限制,示例性的,设定阈值可以设置为1。
[0080]
在本技术的一个实施例中,终端设备在检测到线性目标对象的预测值大于设定阈值时,可以执行步骤s203。
[0081]
在本技术的另一个实施例中,终端设备在检测到线性目标对象的预测值小于或等于设定阈值时,说明待检测图像中不存在线性目标对象,也就是说,待检测图像中并不存在线性特征,因此,终端设备输出的线性目标检测结果为0。
[0082]
可以理解的是,当线性目标检测结果为检测框时,终端设备可以输出不存在任何
检测框的待检测图像。
[0083]
在s203中,若所述预测值大于设定阈值,则根据所述线性特征输出所述线性目标检测结果。
[0084]
本实施例中,终端设备在检测到线性目标对象的预测值大于设定阈值时,说明待检测图像中存在线性目标对象,因此,终端设备可以根据线性特征输出线性目标检测结果。
[0085]
在实际应用中,线性目标对象的角度具有周期性问题,靠近0度和180度的线性目标具有高度接近的图像特征,同时,线性目标对象的角度在接近竖直或者水平的时候,也会存在跳变。
[0086]
示例性的,如图3所示,实线c1和实线dc1与水平线的夹角(及线性目标对象的角度)均为β,在现有技术中,终端设备仅能确定线性目标对象的角度,因此,容易出现将实线c1确定为实线dc1的情况。
[0087]
基于此,在本技术的一个实施例中,为了提高对线性目标对象的检测准确率,终端设备具体可以根据以下步骤输出线性目标检测结果,详述如下:
[0088]
根据所述方向信息,确定所述线性目标对象的偏移方向以及偏移程度;
[0089]
根据所述线性目标对象的所述中心坐标、所述长度、所述角度、所述偏移程度以及所述偏移方向,输出所述线性目标检测结果。
[0090]
本实施例中,终端设备在确定线性目标对象的角度对应的方向信息后,可以根据该方向信息确定线性目标对象的偏移方向以及偏移程度。
[0091]
需要说明的是,偏移方向用于表征线性目标对象相对于垂直于水平线的竖线,所偏移的方向。
[0092]
偏移程度用于表征线性目标对象相对于垂直于水平线的竖线,所偏移的程度。
[0093]
示例性的,请参阅图3,实线c1的偏移方向为左边,偏移程度为90-β;实线dc1的偏移方向为右边,偏移程度为90-β。
[0094]
在本技术的另一个实施例中,方向信息包括第一方向信息和第二方向信息。其中,第一方向信息用于描述线性目标对象沿第一方向的偏移程度,第二方向信息用于描述线性目标对象沿第二方向的偏移程度。第一方向与第二方向相反。
[0095]
基于此,终端设备可以根据以下公式计算得到角度对应的方向信息:
[0096][0097]
其中,c1表示第一方向信息;dc1表示第二方向信息;β表示线性目标对象的角度,abs(
·
)表示绝对值函数。
[0098]
需要说明的是,第一方向用于表征垂直于水平线的竖线的左边,第二方向用于表征垂直于水平线的竖线的右边。
[0099]
以上可以看出,本技术实施例提供的一种线性目标检测方法,通过获取待检测图像;将待检测图像输入至已训练的线性目标检测模型进行处理,得到待检测图像的线性目标检测结果;其中,线性目标检测模型用于确定待检测图像中的线性目标对象的线性特征,并根据线性特征输出线性目标检测结果;线性特征包括线性目标对象的中心坐标、长度、角度以及角度对应的方向信息。与现有技术相比,本技术通过线性目标检测模型,不仅可以确定待检测图像中的线性目标对象的中心坐标、长度及角度,还能确定该角度对应的方向信
息,从而可以准确确定出线性目标对象所处位置、长短及方位,故提高了对线性目标对象的检测准确率。
[0100]
请参阅图4,图4是本技术另一实施例提供的线性目标检测方法。相对于图1对应的实施例,本实施例在s102之前,还可以包括s301~s302,详述如下:
[0101]
在s301中,获取样本图像集;所述样本图像集包括多张样本图像,每张样本图像中包含至少一个样本线性对象。
[0102]
在本实施例的一种实现方式中,终端设备可以通过与其无线通信连接的采集设备实时获取到样本图像集。其中,采集设备可以是摄像设备。
[0103]
在s302中,将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型。
[0104]
本实施例中,预构建的神经网络模型包括特征提取网络和初始检测网络。
[0105]
基于此,终端设备具体可以根据如图5所示的s401~s405对神经网络模型进行优化训练,详述如下:
[0106]
在s401中,将所述样本图像集输入至所述特征提取网络进行特征提取,得到所述每张样本图像对应的样本特征图。
[0107]
在s402中,确定每张所述样本特征图各自对应的样本线性特征;所述样本线性特征包括对应样本线性对象的样本中心坐标、样本长度、样本角度以及所述样本角度对应的样本方向信息。
[0108]
本实施例中,终端设备得到样本特征图后,可以确定样本特征图中的样本线性对象的端点坐标,并根据该端点坐标确定该样本线性对象的样本线性特征。其中,端点坐标包括第一端点坐标和第二端点坐标。
[0109]
在本技术的一个实施例中,终端设备具体可以根据以下步骤实现步骤s402,详述如下:
[0110]
针对任意一张所述样本特征图,获取所述样本特征图中任意一个目标样本线性对象的端点坐标;
[0111]
根据所述端点坐标,确定所述目标样本线性对象的目标样本中心坐标和目标样本长度;
[0112]
根据所述目标样本长度和所述端点坐标,计算得到所述目标样本线性对象的目标样本角度;
[0113]
计算所述目标样本角度对应的样本方向信息。
[0114]
本实施例中,终端设备可以根据以下公式确定目标样本线性对象的样本线性特征:
[0115]
[0116]
其中,表示目标样本中心坐标,(x1,y1)表示第一端点坐标,(x2,y2)表示第二端点坐标,l表示目标样本长度,β表示目标样本角度,c1、dc1表示目标样本角度对应的样本方向信息。
[0117]
在s403中,以所述样本线性特征作为训练集对所述初始检测网络进行优化训练,并将优化训练后的所述初始检测网络确定为线性目标检测网络。
[0118]
本实施例中,终端设备在确定各个样本线性对象各自对应的样本线性特征后,可以根据所有样本线性对象各自对应的样本长度对所有样本线性对象进行聚类,得到所有长度值的聚类中心(l1,l1,
…
,lm),然后以样本线性特征作为训练集对初始检测网络进行优化训练时,将聚类的中心作为锚点的设置依据。
[0119]
需要说明的是,聚类中心的个数(m)可以根据具体的数据分布差异情况进行选择,数据分布比较集中则聚类中心的数目可以设置小一点,反之则可以设置大一点。
[0120]
本实施例中,以样本线性特征作为训练集对初始检测网络进行优化训练的过程中,假设输出的样本特征图的宽高是s*s,则将样本特征图中的每一个样本线性对象和所有的m*s*s个锚点进行匹配,利用匹配度最高的锚点来学习该样本线性对象。
[0121]
在一些可能的实施例中,将样本特征图中的每一个样本线性对象和所有的m*s*s个锚点进行匹配的方式如下:先将样本线性对象的尺寸缩放到特征图的大小,然后计算该样本线性对象的样本中心坐标、样本长度、样本角度及样本角度对应的样本方向信息,缩放变换后的样本线性对象对应的样本线性特征表示为(g
cx
,g
cy
,g
length
,g
theta
,g
c1
,g
dc1
)。其中,(g
cx
,g
cy
)表示目标中心坐标,g
length
表示样本长度,g
theta
表示样本角度,(g
c1
,g
dc1
)表示样本方向信息。之后,从锚点长度(l1,l1,...,lm)中找到最接近样本线性对象的长度lj,从而确定在(lj)尺寸的锚点中对该样本线性对象进行学习。
[0122]
在s404中,根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数。
[0123]
本实施例中,结合s403,针对任意样本线性对象,终端设备可以根据该样本线性对象的样本中心坐标(g
cx
,g
cy
)的端点坐标(g
cxi
,g
cyj
)(整数坐标)负责预测该样本线性对象。因此,在最后尺寸为m*s*s*c大小的特征图上,位置(j,g
cyj
,g
cyj
)处的c维向量负责预测该样本线性对象(g
cx
,g
cy
,g
length
,g
theta
,g
c1
,g
dc1
)。通道数c的大小为5+2k。其中,k代表线性目标的类别数,我们用以下向量来表示初始检测网络在(j,g
cyj
,g
cyj
)处的输出的预测特征:(p
x
,py,p
length
,p
theta
,p
obj
,p
c1
,
…
,p
ck
,p
dc1
,...,p
dck
)。
[0124]
本实施例中,终端设备在得到上述样本线性对象的预测特征后,可以根据该样本线性对象的样本线性特征和预测特征计算得到神经网络模型的总损失函数。
[0125]
由于预测特征包括样本预测值、预测中心坐标、预测长度、预测角度及预测方向信息,因此,在本技术的一个实施例中,终端设备具体可以根据以下步骤计算得到神经网络模型的总损失函数,详述如下:
[0126]
根据所述样本中心坐标、所述端点坐标以及所述预测中心坐标,计算得到位置损失函数;
[0127]
根据所述样本长度、所述预测长度以及所述样本线性对象对应的聚类中心,计算得到长度损失函数;所述聚类中心由所述样本图像集中所有样本线性对象的样本长度聚类得到;
[0128]
根据所述样本角度和所述预测角度,计算得到角度损失函数;
[0129]
根据所述样本预测值,计算得到预测损失函数;
[0130]
根据所述样本方向信息和所述预测方向信息,计算得到方向损失函数;
[0131]
根据所述位置损失函数、所述长度损失函数、所述角度损失函数、所述预测损失函数以及所述方向损失函数,计算得到所述总损失函数。
[0132]
本实施例中,终端设备可以根据以下公式计算得到位置损失函数:
[0133]
l
xy
=smoothl1((px,py),(g
cx-g
cxi
,g
cy-g
cyj
));
[0134]
其中,l
xy
表示位置损失函数,(px,py)表示预测中心坐标,(g
cxi
,g
cyj
)表示端点坐标,(g
cx
,g
cy
)表示样本中心坐标。
[0135]
终端设备可以根据以下公式计算得到长度损失函数:
[0136][0137]
其中,l
length
表示长度损失函数,p
length
表示预测长度,g
length
表示样本长度,lj表示样本线性对象对应的聚类中心。
[0138]
终端设备可以根据以下公式计算得到角度损失函数:
[0139]
l
theta
=smoothl1(p
theta
,g
theta
);
[0140]
其中,l
theta
表示角度损失函数,p
theta
表示预测角度,g
theta
表示样本角度。
[0141]
终端设备可以根据以下公式计算得到预测损失函数:
[0142]
l
obj
=bce(p
obj
,1);
[0143]
其中,l
obj
表示预测损失函数,p
obj
表示样本预测值。
[0144]
需要说明的是,对于没有和任何样本线性对象匹配上的预测点,需要计算不存在线性目标对象的预测损失函数。
[0145]
具体地,终端设备可以根据以下公式计算不存在线性目标对象的损失函数:
[0146]
l
nobj
=bce(p
obj
,0);
[0147]
其中,l
nobj
表示不存在线性目标对象的损失函数,p
obj
表示样本预测值。终端设备可以根据以下公式计算得到方向损失函数:
[0148]
l
cls
=bce((p
c1
,
…
,p
ck
),g
c1
)+bce((p
dc1
,
…
,p
dck
),g
dc1
);
[0149]
其中,l
cls
表示方向损失函数,(p
c1
,
…
,p
ck
)和(p
dc1
,
…
,p
dck
)均表示预测方向信息,g
c1
、g
dc1
表示样本方向信息。
[0150]
基于此,终端设备具体可以根据以下公式计算的神经网络模型的总损失函数:
[0151]
l=γ1l
xv
+γ2l
length
+γ3l
theta
+γ4l
obj
+γ5l
cls
+γ6l
nobj
;
[0152]
其中,l表示总损失函数,l
xy
表示位置损失函数,l
length
表示长度损失函数,l
theta
表示角度损失函数,l
obj
表示预测损失函数,l
cls
表示方向损失函数,γ1表示位置损失函数对应的第一权重系数,γ2表示长度损失函数对应的第二权重系数,γ3表示角度损失函数对应的第三权重系数,γ4表示存在样本线性对象的预测损失函数对应的第四权重系数,γ5表示方向损失函数对应的第五权重系数,γ6表示不存在样本线性对象的预测损失函数对应的第六权重系数。
[0153]
在s405中,根据所述总损失函数和所述线性目标检测网络,构建得到所述线性目标检测模型。
[0154]
本实施例中,终端设备在得到总损失函数后,可以利用反向传播算法和该总损失函数更新线性目标检测网络的参数,从而得到线性目标检测模型。
[0155]
以上可以看出,本实施例提供的线性目标检测方法,通过对预构建的神经网络模型的优化训练,提高了线性目标检测模型的检测精度。
[0156]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0157]
对应于上文实施例所述的一种线性目标检测方法,图6示出了本技术实施例提供的一种线性目标检测装置的结构示意图,为了便于说明,仅示出了与本技术实施例相关的部分。参照图6,该线性目标检测装置600包括:第一获取单元61和第一处理单元62。其中:
[0158]
第一获取单元61用于获取待检测图像。
[0159]
第一处理单元62用于将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。
[0160]
在本技术的一个实施例中,所述线性目标检测模型包括特征提取网络和线性目标检测网络;第一处理单元62具体包括:第一提取单元、检测单元及第一输出单元。其中:
[0161]
第一提取单元用于将所述待检测图像输入至所述特征提取网络进行特征提取,得到特征图。
[0162]
检测单元用于将所述特征图输入至所述线性目标检测网络进行检测,得到所述线性目标对象的预测值和所述线性特征;所述预测值用于表征所述线性目标对象是否存在。
[0163]
第一输出单元用于若所述预测值大于设定阈值,则根据所述线性特征输出所述线性目标检测结果。
[0164]
在本技术的一个实施例中,所述输出单元具体包括:第一确定单元和第二输出单元。其中:
[0165]
第一确定单元用于根据所述方向信息,确定所述线性目标对象的偏移方向以及偏移程度。
[0166]
第二输出单元用于根据所述线性目标对象的所述中心坐标、所述长度、所述角度、所述偏移程度以及所述偏移方向,输出所述线性目标检测结果。
[0167]
在本技术的一个实施例中,第二计算单元具体包括:第七概率确定单元、第八概率确定单元、第九概率确定单元及第十概率确定单元。其中:
[0168]
在本技术的一个实施例中,线性目标检测装置600还包括:第二获取单元和第一训练单元。其中:
[0169]
第二获取单元用于获取样本图像集;所述样本图像集包括多张样本图像,每张样本图像中包含至少一个样本线性对象。
[0170]
第一训练单元用于将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型。
[0171]
所述神经网络模型包括特征提取网络和初始检测网络;相应的,所述第一训练单
元具体包括:第二提取单元、第二确定单元、第二训练单元、单元计算单元及构建单元。其中:
[0172]
第二提取单元用于将所述样本图像集输入至所述特征提取网络进行特征提取,得到所述每张样本图像对应的样本特征图。
[0173]
第二确定单元用于确定每张所述样本特征图各自对应的样本线性特征;所述样本线性特征包括对应样本线性对象的样本中心坐标、样本长度、样本角度以及所述样本角度对应的样本方向信息。
[0174]
第二训练单元用于以所述样本线性特征作为训练集对所述初始检测网络进行优化训练,并将优化训练后的所述初始检测网络确定为线性目标检测网络。
[0175]
第一计算单元用于根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数。
[0176]
构建单元用于根据所述总损失函数和所述线性目标检测网络,构建得到所述线性目标检测模型。
[0177]
在本技术的一个实施例中,所述第二确定单元具体包括:第三获取单元、第三确定单元、第二计算单元及第三计算单元。其中:
[0178]
第三获取单元用于针对任意一张所述样本特征图,获取所述样本特征图中任意一个目标样本线性对象的端点坐标。
[0179]
第三确定单元用于根据所述端点坐标,确定所述目标样本线性对象的目标样本中心坐标和目标样本长度。
[0180]
第二计算单元用于根据所述目标样本长度和所述端点坐标,计算得到所述目标样本线性对象的目标样本角度。
[0181]
第三计算单元用于计算所述目标样本角度对应的样本方向信息。
[0182]
在本技术的一个实施例中,所述预测特征包括样本预测值、预测中心坐标、预测长度、预测角度及预测方向信息;所述第一计算单元具体包括:第四计算单元、第五计算单元、第六计算单元、第七计算单元、第八计算单元及第九计算单元。其中:
[0183]
第四计算单元用于根据所述样本中心坐标、所述端点坐标以及所述预测中心坐标,计算得到位置损失函数。
[0184]
第五计算单元用于根据所述样本长度、所述预测长度以及所述样本线性对象对应的聚类中心,计算得到长度损失函数;所述聚类中心由所述样本图像集中所有样本线性对象的样本长度聚类得到。
[0185]
第六计算单元用于根据所述样本角度和所述预测角度,计算得到角度损失函数。
[0186]
第七计算单元用于根据所述样本预测值,计算得到预测损失函数。
[0187]
第八计算单元用于根据所述样本方向信息和所述预测方向信息,计算得到方向损失函数。
[0188]
第九计算单元用于根据所述位置损失函数、所述长度损失函数、所述角度损失函数、所述预测损失函数以及所述方向损失函数,计算得到所述总损失函数。
[0189]
在本技术的一个实施例中,所述方向信息包括第一方向信息和第二方向信息,所述第一方向信息用于描述所述线性目标对象沿第一方向的偏移程度,所述第二方向信息用于描述所述线性目标对象沿第二方向的偏移程度,所述第一方向与所述第二方向相反;所
述方向信息根据以下公式计算得到:
[0190][0191]
其中,c1表示所述第一方向信息;dc1表示所述第二方向信息;β表示所述角度,abs(
·
)表示绝对值函数。
[0192]
需要说明的是,上述装置/单元之间的信息交互、执行过程等内容,由于与本技术方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0193]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0194]
图7为本技术一实施例提供的终端设备的结构示意图。如图7所示,该实施例的终端设备7包括:至少一个处理器70(图7中仅示出一个)处理器、存储器71以及存储在所述存储器71中并可在所述至少一个处理器70上运行的计算机程序72,所述处理器70执行所述计算机程序72时实现上述任意各个线性目标检测方法实施例中的步骤。
[0195]
该终端设备可包括,但不仅限于,处理器70、存储器71。本领域技术人员可以理解,图7仅仅是终端设备7的举例,并不构成对终端设备7的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
[0196]
所称处理器70可以是中央处理单元(central processing unit,cpu),该处理器70还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0197]
所述存储器71在一些实施例中可以是所述终端设备7的内部存储单元,例如终端设备7的内存。所述存储器71在另一些实施例中也可以是所述终端设备7的外部存储设备,例如所述终端设备7上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器71还可以既包括所述终端设备7的内部存储单元也包括外部存储设备。所述存储器71用于存储操作系统、应用程序、引导装载程序(bootloader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器71还可以用于暂时地存储已经输出或者将要输出的数据。
[0198]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现可实现上述各个方法实施例中的步
骤。
[0199]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述各个方法实施例中的步骤。
[0200]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质。例如u盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
[0201]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0202]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
技术特征:
1.一种线性目标检测方法,其特征在于,包括:获取待检测图像;将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。2.如权利要求1所述的线性目标检测方法,其特征在于,所述线性目标检测模型包括特征提取网络和线性目标检测网络;所述将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果,包括:将所述待检测图像输入至所述特征提取网络进行特征提取,得到特征图;将所述特征图输入至所述线性目标检测网络进行检测,得到所述线性目标对象的预测值和所述线性特征;所述预测值用于表征所述线性目标对象是否存在;若所述预测值大于设定阈值,则根据所述线性特征输出所述线性目标检测结果。3.如权利要求2所述的线性目标检测方法,其特征在于,所述根据所述线性特征输出所述线性目标检测结果,包括:根据所述方向信息,确定所述线性目标对象的偏移方向以及偏移程度;根据所述线性目标对象的所述中心坐标、所述长度、所述角度、所述偏移程度以及所述偏移方向,输出所述线性目标检测结果。4.如权利要求1所述的线性目标检测方法,其特征在于,在将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果之前,还包括:获取样本图像集;所述样本图像集包括多张样本图像,每张样本图像中包含至少一个样本线性对象;将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型;所述神经网络模型包括特征提取网络和初始检测网络;相应的,所述将所述样本图像集输入至预构建的神经网络模型进行优化训练,并将优化训练后的所述神经网络模型确定为所述线性目标检测模型,包括:将所述样本图像集输入至所述特征提取网络进行特征提取,得到所述每张样本图像对应的样本特征图;确定每张所述样本特征图各自对应的样本线性特征;所述样本线性特征包括对应样本线性对象的样本中心坐标、样本长度、样本角度以及所述样本角度对应的样本方向信息;以所述样本线性特征作为训练集对所述初始检测网络进行优化训练,并将优化训练后的所述初始检测网络确定为线性目标检测网络;根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数;根据所述总损失函数和所述线性目标检测网络,构建得到所述线性目标检测模型。5.如权利要求4所述的线性目标检测方法,其特征在于,所述确定每张所述样本特征图各自对应的样本线性特征,包括:
针对任意一张所述样本特征图,获取所述样本特征图中任意一个目标样本线性对象的端点坐标;根据所述端点坐标,确定所述目标样本线性对象的目标样本中心坐标和目标样本长度;根据所述目标样本长度和所述端点坐标,计算得到所述目标样本线性对象的目标样本角度;计算所述目标样本角度对应的样本方向信息。6.如权利要求5所述的线性目标检测方法,其特征在于,所述预测特征包括样本预测值、预测中心坐标、预测长度、预测角度及预测方向信息;所述根据所述样本线性特征和所述初始检测网络输出的预测特征,计算得到所述神经网络模型的总损失函数,包括:根据所述样本中心坐标、所述端点坐标以及所述预测中心坐标,计算得到位置损失函数;根据所述样本长度、所述预测长度以及所述样本线性对象对应的聚类中心,计算得到长度损失函数;所述聚类中心由所述样本图像集中所有样本线性对象的样本长度聚类得到;根据所述样本角度和所述预测角度,计算得到角度损失函数;根据所述样本预测值,计算得到预测损失函数;根据所述样本方向信息和所述预测方向信息,计算得到方向损失函数;根据所述位置损失函数、所述长度损失函数、所述角度损失函数、所述预测损失函数以及所述方向损失函数,计算得到所述总损失函数。7.如权利要求1-6任一项所述的线性目标检测方法,其特征在于,所述方向信息包括第一方向信息和第二方向信息,所述第一方向信息用于描述所述线性目标对象沿第一方向的偏移程度,所述第二方向信息用于描述所述线性目标对象沿第二方向的偏移程度,所述第一方向与所述第二方向相反;所述方向信息根据以下公式计算得到:其中,c1表示所述第一方向信息;dc1表示所述第二方向信息;β表示所述角度,abs(
·
)表示绝对值函数。8.一种线性目标检测装置,其特征在于,包括:第一获取单元,用于获取待检测图像;第一处理单元,用于将所述待检测图像输入至已训练的线性目标检测模型进行处理,得到所述待检测图像的线性目标检测结果;其中,所述线性目标检测模型用于确定所述待检测图像中的线性目标对象的线性特征,并根据所述线性特征输出所述线性目标检测结果;所述线性特征包括所述线性目标对象的中心坐标、长度、角度以及所述角度对应的方向信息。9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的线性目标检测方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在
于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的线性目标检测方法。
技术总结
本申请适用于人工智能技术领域,提供了一种线性目标检测方法、装置、终端设备及计算机可读存储介质,所述方法包括:获取待检测图像;将待检测图像输入至已训练的线性目标检测模型进行处理,得到待检测图像的线性目标检测结果;其中,线性目标检测模型用于确定待检测图像中的线性目标对象的线性特征,并根据线性特征输出线性目标检测结果;线性特征包括线性目标对象的中心坐标、长度、角度以及角度对应的方向信息。与现有技术相比,本申请通过线性目标检测模型,不仅可以确定待检测图像中的线性目标对象的中心坐标、长度及角度,还能确定该角度对应的方向信息,从而提高了对线性目标对象的检测准确率。象的检测准确率。象的检测准确率。
技术研发人员:何超 邓富城 罗韵 陈振杰
受保护的技术使用者:山东极视角科技有限公司
技术研发日:2023.03.31
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
