监控视频的检索方法、装置、设备及存储介质与流程

未命名 07-14 阅读:126 评论:0


1.本发明涉及视频数据处理技术领域,特别涉及一种监控视频的检索方法、装置、设备及存储介质。


背景技术:

2.随着互联网的高速发展和网络宽带速度的大幅提高,近年来,由互联网用户产生的以视频和图像为主的多媒体信息呈现井喷式的增长。从用户手中移动终端的各个视频软件到存储海量视频的各大视频网站,如何能快速的对大规模的视频进行处理成为了目前多媒体及大数据分析的一个重点研究方向。对于用户来说,能否从海量视频中快速的检索出自己感兴趣的内容是十分重要的;而对于互联网企业来说,有效的视频检索能够对用户进行精准的内容推荐和广告投放。
3.现有技术中的视频检索方法,包括基于深度学习的方式提取视频特征,结合度量函数进行端到端的训练,结合度量函数进行端到端的训练的方式虽然可以通过损失函数,隐式的控制排序列表的顺序,但是它本质是基于距离的优化,这样会导致在相同的距离损失下,排在排序列表前面和排序列表后面的两项,他们产生的损失是一样的,但是在视频检索时,我们要尽可能保证前面的k项都是正确的,而排在后边的优先级则没有那么高。因此,现有技术训练的模型准确率较低。


技术实现要素:

4.本技术实施例提供了一种监控视频的检索方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
5.第一方面,本技术实施例提供了一种监控视频的检索方法,包括:
6.获取用户输入的待查询视频文件,以及待搜索的视频文件集合;
7.构建相似视频检索模型以及排序损失函数,根据所述排序损失函数对所述相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;
8.将所述待查询视频文件和所述视频文件集合输入所述训练好的相似视频检索模型,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件。
9.在一个可选地实施例中,构建所述排序损失函数,包括:
10.根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标;
11.通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数。
12.在一个可选地实施例中,根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标,包括:
13.根据视频相似度从大到小的排序规则以及indicator函数确定所述排序函数;
14.采用sigmoid函数近似替代所述indicator函数,得到基于sigmoid函数定义的排序函数;
15.根据所述sigmoid函数定义的排序函数确定所述平均准确率指标。
16.在一个可选地实施例中,通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数,包括:
17.所述排序损失函数如下公式所示:
[0018][0019]
其中,loss
ap
表示所述排序损失函数,apq表示待查询的视频文件q的平均准确率,n表示待搜索的视频文件集合的视频个数。
[0020]
在一个可选地实施例中,构建所述相似视频检索模型,包括:
[0021]
基于预设的神经网络构建所述相似视频检索模型,所述相似视频检索模型包括特征提取模块、相似度计算模块以及排序模块。
[0022]
在一个可选地实施例中,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件之后,还包括:
[0023]
获取输出的预设数量个视频文件的视频类别;
[0024]
统计每个类别对应的视频文件的个数,根据对应视频文件的个数最多的类别得到所述待查询视频文件的类别。
[0025]
第二方面,本技术实施例提供了一种监控视频的检索装置,包括:
[0026]
获取模块,用于获取用户输入的待查询视频文件,以及待搜索的视频文件集合;
[0027]
模型优化模块,用于构建相似视频检索模型以及排序损失函数,根据所述排序损失函数对所述相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;
[0028]
检索模块,用于将所述待查询视频文件和所述视频文件集合输入所述训练好的相似视频检索模型,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件。
[0029]
在一个可选地实施例中,所述模型优化模块,具体用于根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标;
[0030]
通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数。
[0031]
第三方面,本技术实施例提供了一种电子设备,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行上述实施例提供的监控视频的检索方法。
[0032]
第四方面,本技术实施例提供了一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令被处理器执行以实现上述实施例提供的一种监控视频的检索方法。
[0033]
本技术实施例提供的技术方案可以包括以下有益效果:
[0034]
根据本技术实施例提供的一种监控视频的检索方法,通过直接优化搜索排序,而不是优化基于距离的损失函数,有效克服基于距离的损失函数仅仅关注特征之间的相似度,而不考虑对排序列表前列错误的结果进行加大惩罚的缺陷,可以显著提高视频检索的准确率。且该方法模块化,结构清晰,可以配合不同的网络结构使用,便于实现和推广应用。
[0035]
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
[0036]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
[0037]
图1是根据一示例性实施例示出的一种监控视频的检索方法的流程示意图;
[0038]
图2是根据一示例性实施例示出的一种监控视频的检索方法示意图;
[0039]
图3是根据一示例性实施例示出的一种indicator函数示意图;
[0040]
图4是根据一示例性实施例示出的一种sigmoid函数逼近indicator函数的示意图;
[0041]
图5是根据一示例性实施例示出的一种监控视频的检索装置的结构示意图;
[0042]
图6是根据一示例性实施例示出的一种电子设备的结构示意图;
[0043]
图7是根据一示例性实施例示出的一种计算机存储介质的示意图。
具体实施方式
[0044]
以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。
[0045]
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0046]
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本发明的一些方面相一致的系统和方法的例子。
[0047]
目前,现有的视频检索系统从技术角度可以分为两大类。一是基于传统计算机监控视频提取的特征,可以是全局特征或者是局部特征。例如全局特征包括:颜色直方图、纹理特征等;局部特征包括:sift、surf、orb等。二是基于深度学习的方式。包括直接提取特定层(如卷积层,或者全连接层)作为特征向量,进行搜索;包括结合度量函数进行端到端的训练。
[0048]
监控视频检索的目标是与待查询的监控视频实体是同一个类别(或者是同一个实体,或者同一个语义等,比如是同一个行人的一段短视频,或者是一个小汽车的形势轨迹视频,或者是园区内一个特定场所发生火灾的监控视频),应该尽可能的在排序列表的前列,尤其是要保证排在最前面的k个的准确率。现有的技术一个致命的缺点是没有明确的通过优化上述的排序损失进行优化,例如基于传统计算机园区监控视频提取的特征。根本就没考虑更不可能保证上述性质。二是基于深度学习的方式。其中提取特定层(如卷积层,或者全连接层)作为特征向量,进行搜索,也没有显示的进行排序列表的优化;另一方面虽说基于深度学习的方式,结合度量函数进行端到端的训练的方式可以通过损失函数,隐式的控制排序列表的顺序,但是它本质是基于距离的优化,而不是明确的采用基于排序的损失进
行优化,这样会导致在相同的距离损失下,排在排序列表前面和排序列表后面的两项,他们产生的损失是一样的,但是根据视频检索的目标,我们要尽可能保证前面的k项都是正确的,而排在后边的优先级则没有那么高。
[0049]
基于此,本技术的视频检索方法,通过提出一种新的优化目标,从而能进行端到端的优化,显著提高园区内监控视频检索系统的准确率。
[0050]
下面将结合附图对本技术实施例提供的监控视频的检索方法进行详细介绍。参见图1,该方法具体包括以下步骤。
[0051]
s101获取用户输入的待查询视频文件,以及待搜索的视频文件集合。
[0052]
在一个示例性场景中,对某园区的监控视频进行检索,给定一段待查询监控视频,对待查询监控视频和待搜索集合中的监控视频进行特征提取,并按照待检索视频特征和数据库中每一个监控视频特征之间的相似性进行排序,排序的先后是按照待查询监控视特征和数据库中每一个监控视频特征相似度大小。
[0053]
因此,首先获取用户输入的待查询视频文件,以及待搜索的视频文件集合。用户输入的待查询视频文件包括校园监控视频、园区监控视频、高速道路视频等任意场景下的视频文件,本技术实施例不做具体限制。
[0054]
s102构建相似视频检索模型以及排序损失函数,根据排序损失函数对相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型。
[0055]
首先构建相似视频检索模型,在一种实施方式中,可以基于预设的神经网络构建相似视频检索模型,相似视频检索模型包括特征提取模块、相似度计算模块以及排序模块。
[0056]
在一个实施例中,将待检索视频和视频集合发送到相似视频检索模型,通过特征提取模块,对视频进行解析,得到特征向量,可以采用卷积神经网络进行特征提取。还可以根据相似度计算模块,分别计算待检索视频特征向量与其他视频特征向量之间的相似度。最后根据相似度进行排序,将与待查询视频相似度较高的视频排在前列。
[0057]
在一个实施例中,相似视频检索模型还可以包括编码模块,将待检索视频的哈希码与视频库中视频哈希码进行比较,根据相似度进行排序返回,确定与待检索视频内容最相近的视频。
[0058]
本技术实施例对具体的网络结构不做限制,可以是现有的任何进行视频相似度计算的神经网络,例如卷积神经网络、长短时记忆神经网络模型等。
[0059]
目前,监控视频检索的目标是与待查询的监控视频实体是同一个类别(或者是同一个实体,或者同一个语义等,比如是同一个行人的一段短视频,或者是一个小汽车的形势轨迹视频,或者是园区内一个特定场所发生火灾的监控视频),应该尽可能的在排序列表的前列,尤其是要保证排在最前面的k个的准确率。通常衡量检索系统的准确率采用平均准确率指标average precision(ap),如下公式所示:
[0060][0061]
其中,其中apq表示查询监控视频q的平均准确率,数据库中待查询的数据集s={ii,i=1,2,...,n},q根据查询和查询视频是否属于相同的类别,被分为s+和s-,其中集合s=s+u s-,rank(i,s)表示视频i和视频集合s的排序顺序数。
[0062]
现有的技术的缺点是没有明确的通过优化上述的排序损失进行优化,虽说基于深
度学习的方式,结合度量函数进行端到端的训练的方式可以通过损失函数,隐式的控制排序列表的顺序,但是它本质是基于距离的优化,而不是明确的采用基于排序的损失进行优化,这样会导致在相同的距离损失下,排在排序列表前面和排序列表后面的两项,他们产生的损失是一样的,但是在根据园区监控视频检索的目标,要尽可能保证前面的k项都是正确的,而排在后边的优先级则没有那么高。
[0063]
因此,本技术优化的目标是平均准确率指标ap。
[0064]
具体地,构建排序损失函数,包括:根据视频相似度从大到小的排序规则确定排序函数,根据排序函数确定平均准确率指标;通过优化平均准确率指标,得到相似视频检索模型的排序损失函数。
[0065]
采用如下的排序函数:
[0066][0067]
其中
[0068]
其中,si和sj分别代表了监控视频i和监控视频j和待查询监控视频q之间的相似度。
[0069]
图3是根据一示例性实施例示出的一种indicator函数示意图;如图3所示,indicator函数在x=0附近是不连续的,由于indicator不连续,导致损失函数ap也是不连续的,导致无法采用基于梯度下降等优化方法进行端到端的训练。鉴于此,并观察指示函数的表现形式,采用sigmoid函数来近似表示指示函数。其中x是自变量,τ是温度(temperature)参数,sigmoid函数可如下。
[0070][0071]
图4是根据一示例性实施例示出的一种sigmoid函数逼近indicator函数的示意图;可以看到sigmoid函数当自变量在实数域的取值都是处处连续的,并且较好的拟合了indicator函数,本技术采用sigmoid函数近似替代indicator函数,由于sigmoid连续并且存在导数,可以通过梯度下降等优化方法进行端到端的优化,直接优化排序目标函数,而不是通过优化基于距离的损失函数。由于优化目标和希望取得的目标一致,较好的解决了检索问题中,相似视频在排序列表靠前的问题。
[0072]
采用sigmoid函数近似替代indicator函数,得到基于sigmoid函数定义的排序函数:
[0073][0074]
根据sigmoid函数定义的排序函数确定平均准确率指标:
[0075][0076]
最终apq的近似表示如下所示:
[0077][0078]
其中,当τ趋近于零时,公式的等号右侧趋近公式的等号左侧。对于集合s中的n个视频,每张视频作为搜索视频,最终构建的损失函数如下所示:
[0079][0080]
其中,loss
ap
表示排序损失函数,apq表示查询的视频文件q的平均准确率,n表示待搜索的视频文件集合的视频个数。
[0081]
根据本技术提出的排序损失函数对神经网络模型进行端到端的优化,得到训练好的相似视频检索模型。
[0082]
该方法采用优化的方式进行园区监控视频搜索,并指出基于度量的损失函数导致搜索结果不准确,采用直接优化平均准确率作为损失函数的优化方法。
[0083]
该方法首先通过指示函数的形式,从数学上明确地建立排序列表中排序位数与查询特征和待查询特征相似性之间的关系,通过分析指示函数不可导,无法采用基于梯度下降等优化方法进行优化,通过观察指数函数的形式,设计sigmoid函数族对指示函数进行逼近,sigmoid函数族连续并且可导,可以通过采用基于梯度下降等优化方法进行优化。可以显著提高园区监控视频检索准确率。
[0084]
s103将待查询视频文件和视频文件集合输入训练好的相似视频检索模型,输出排序后的与待查询视频文件相似度较高的预设数量个视频文件。
[0085]
在一个实施例中,得到优化后的检索模型之后,将待查询视频文件和视频文件集合输入训练好的相似视频检索模型,输出排序后的与待查询视频文件相似度较高的预设数量个视频文件。其中,输出的相似视频的个数本技术实施例不做限制,可以根据需求自行设定。
[0086]
例如,设置预设数量为5,模型进行相似度计算后,将与待检索视频相似度较高的前5个视频输出,并按照相似度大小从高到低排序。
[0087]
在一个可选地实施例中,输出排序后的与待查询视频文件相似度较高的预设数量个视频文件之后,还包括:获取输出的预设数量个视频文件的视频类别,统计每个类别对应的视频文件的个数,根据对应视频文件的个数最多的类别得到待查询视频文件的类别。实现视频类别识别的下游任务。
[0088]
具体地,预先标注视频文件集合中视频的类别,例如有读书类别、车辆通行类别、行人监控类别等等。获取到输出的与待查询视频文件相似度较高的预设数量个视频文件之
后,获取输出的这些文件对应的类别,采用投票机制,统计每个类别对应的视频文件的个数,例如车辆通行类别的有4个,行人监控类别的有一个,根据对应视频文件的个数最多的类别得到待查询视频文件的类别。因此,确定待查询视频文件的类别为车辆通行类视频。
[0089]
本技术实施例提供的检索方法构建的优化后的检索模型,还可以作为特征提取器,提取到相类似的视频后,可以应用到园区监控视频聚类等下游任务中。
[0090]
为了便于理解本技术实施例提供的监控视频的检索方法,下面结合附图2进行说明。如图2所示,该方法包括如下步骤。
[0091]
获取用户输入的待查询视频文件,以及待搜索的视频文件集合,构建相似视频检索模型,在一种实施方式中,可以基于预设的神经网络构建相似视频检索模型,相似视频检索模型包括特征提取模块、相似度计算模块以及排序模块。将待检索视频和视频集合发送到相似视频检索模型,通过特征提取模块,对视频进行解析,得到特征向量,可以采用卷积神经网络进行特征提取。还可以根据相似度计算模块,分别计算待检索视频特征向量与其他视频特征向量之间的相似度。最后根据相似度进行排序,将与待查询视频相似度较高的视频排在前列。
[0092]
进一步地,构建排序损失函数,根据排序损失函数对相似视频检索模型进行端到端的优化,得到优化后的模型。基于优化后的模型进行视频检索,最后输出排序后的与待查询视频文件相似度较高的预设数量个视频文件。
[0093]
根据本技术实施例提供的一种监控视频的检索方法,通过直接优化搜索排序,而不是优化基于距离的损失函数,可以有效克服基于距离的损失函数仅仅关注特征之间的相似度,而不考虑对排序列表前列错误的结果进行加大惩罚的缺陷,可以显著提高视频检索的准确率。且该方法采用模块化结构,结构清晰,可以配合不同的网络结构使用,易于维护和升级,便于实现和推广应用。
[0094]
本技术实施例还提供一种监控视频的检索装置,该装置用于执行上述实施例的监控视频的检索方法,如图5所示,该装置包括:获取模块501、模型优化模块502以及检索模块503。
[0095]
获取模块501,用于获取用户输入的待查询视频文件,以及待搜索的视频文件集合;
[0096]
模型优化模块502,用于构建相似视频检索模型以及排序损失函数,根据排序损失函数对相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;
[0097]
检索模块503,用于将待查询视频文件和视频文件集合输入训练好的相似视频检索模型,输出排序后的与待查询视频文件相似度较高的预设数量个视频文件。
[0098]
需要说明的是,上述实施例提供的监控视频的检索装置在执行监控视频的检索方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的监控视频的检索装置与监控视频的检索方法实施例属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
[0099]
本技术实施例还提供一种与前述实施例所提供的监控视频的检索方法对应的电子设备,以执行上述监控视频的检索方法。
[0100]
请参考图6,其示出了本技术的一些实施例所提供的一种电子设备的示意图。如图
6所示,电子设备包括:处理器600,存储器601,总线602和通信接口603,处理器600、通信接口603和存储器601通过总线602连接;存储器601中存储有可在处理器600上运行的计算机程序,处理器600运行计算机程序时执行本技术前述任一实施例所提供的监控视频的检索方法。
[0101]
其中,存储器601可能包含高速随机存取存储器(ram:random access memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口603(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网、广域网、本地网、城域网等。
[0102]
总线602可以是isa总线、pci总线或eisa总线等。总线可以分为地址总线、数据总线、控制总线等。其中,存储器601用于存储程序,处理器600在接收到执行指令后,执行程序,前述本技术实施例任一实施方式揭示的监控视频的检索方法可以应用于处理器600中,或者由处理器600实现。
[0103]
处理器600可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器600中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器600可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器601,处理器600读取存储器601中的信息,结合其硬件完成上述方法的步骤。
[0104]
本技术实施例提供的电子设备与本技术实施例提供的监控视频的检索方法出于相同的发明构思,具有与其采用、运行或实现的方法相同的有益效果。
[0105]
本技术实施例还提供一种与前述实施例所提供的监控视频的检索方法对应的计算机可读存储介质,请参考图7,其示出的计算机可读存储介质为光盘700,其上存储有计算机程序(即程序产品),计算机程序在被处理器运行时,会执行前述任意实施例所提供的监控视频的检索方法。
[0106]
需要说明的是,计算机可读存储介质的例子还可以包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他光学、磁性存储介质,在此不再一一赘述。
[0107]
本技术的上述实施例提供的计算机可读存储介质与本技术实施例提供的监控视频的检索方法出于相同的发明构思,具有与其存储的应用程序所采用、运行或实现的方法相同的有益效果。
[0108]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛
盾,都应当认为是本说明书记载的范围。
[0109]
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

技术特征:
1.一种监控视频的检索方法,其特征在于,包括:获取用户输入的待查询视频文件,以及待搜索的视频文件集合;构建相似视频检索模型以及排序损失函数,根据所述排序损失函数对所述相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;将所述待查询视频文件和所述视频文件集合输入所述训练好的相似视频检索模型,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件。2.根据权利要求1所述的方法,其特征在于,构建所述排序损失函数,包括:根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标;通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数。3.根据权利要求2所述的方法,其特征在于,根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标,包括:根据视频相似度从大到小的排序规则以及indicator函数确定所述排序函数;采用sigmoid函数近似替代所述indicator函数,得到基于sigmoid函数定义的排序函数;根据所述sigmoid函数定义的排序函数确定所述平均准确率指标。4.根据权利要求1至3任一项所述的方法,其特征在于,通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数,包括:所述排序损失函数如下公式所示:其中,loss
ap
表示所述排序损失函数,ap
q
表示待查询的视频文件q的平均准确率,n表示待搜索的视频文件集合的视频个数。5.根据权利要求1所述的方法,其特征在于,构建所述相似视频检索模型,包括:基于预设的神经网络构建所述相似视频检索模型,所述相似视频检索模型包括特征提取模块、相似度计算模块以及排序模块。6.根据权利要求1所述的方法,其特征在于,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件之后,还包括:获取输出的预设数量个视频文件的视频类别;统计每个类别对应的视频文件的个数,根据对应视频文件的个数最多的类别得到所述待查询视频文件的类别。7.一种监控视频的检索装置,其特征在于,包括:获取模块,用于获取用户输入的待查询视频文件,以及待搜索的视频文件集合;模型优化模块,用于构建相似视频检索模型以及排序损失函数,根据所述排序损失函数对所述相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;检索模块,用于将所述待查询视频文件和所述视频文件集合输入所述训练好的相似视频检索模型,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件。8.根据权利要求7所述的装置,其特征在于,所述模型优化模块,具体用于根据视频相似度从大到小的排序规则确定排序函数,根据所述排序函数确定平均准确率指标;
通过优化所述平均准确率指标,得到所述相似视频检索模型的排序损失函数。9.一种电子设备,其特征在于,包括处理器和存储有程序指令的存储器,所述处理器被配置为在执行所述程序指令时,执行如权利要求1至7任一项所述的监控视频的检索方法。10.一种计算机可读介质,其特征在于,其上存储有计算机可读指令,所述计算机可读指令被处理器执行以实现如权利要求1至7任一项所述的一种监控视频的检索方法。

技术总结
本申请公开了一种监控视频的检索方法、装置、设备及存储介质,所述方法包括:获取用户输入的待查询视频文件,以及待搜索的视频文件集合;构建相似视频检索模型以及排序损失函数,根据所述排序损失函数对所述相似视频检索模型进行端到端的优化,得到训练好的相似视频检索模型;将所述待查询视频文件和所述视频文件集合输入所述训练好的相似视频检索模型,输出排序后的与所述待查询视频文件相似度较高的预设数量个视频文件。根据本申请的视频检索方法,采用基于排序的损失进行优化,有效克服基于距离的损失函数仅仅关注特征之间的相似度,而不考虑对排序列表前列错误的结果进行加大惩罚,显著提高了监控视频检索系统的准确率。显著提高了监控视频检索系统的准确率。显著提高了监控视频检索系统的准确率。


技术研发人员:王海
受保护的技术使用者:特斯联科技集团有限公司
技术研发日:2023.03.07
技术公布日:2023/7/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐