双录视频质量检测方法和装置、电子设备及存储介质与流程

未命名 09-19 阅读：208 评论：0

1.本技术涉及人工智能技术领域，尤其涉及一种双录视频质量检测方法和装置、电子设备及存储介质。

背景技术：

2.双录视频是通过录音录像的方式以记录用户投保过程的文件，是客户保单承保环节中的重要文件，利用双录视频记录用户交易意愿的确认过程，能够规范业务人员的保险业务处理行为，维护客户的合法权益。目前，相关技术中的音视频文件需要在录制完成后进行质检，质检录制的音视频质量能否达到规定要求，若达到规定要求，将录制的音视频保存下来；若发现视频有异常时，需要重新开始录制整个视频。而且目前在保险业务的双录视频质检过程中结合人工智能技术，仅能够进行人脸识别和语音识别，对文件质量的异常检测均需要人工执行，导致双录视频质检的效率普遍低下，且十分浪费人力，人工质检的强主观性也导致检测结果存在较大偏差。因此，如何提高双录视频的质量检测效率，成为了亟待解决的技术问题。

技术实现要素：

3.以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
4.本技术实施例的主要目的在于提出一种双录视频质量检测方法和装置、电子设备及存储介质，旨在实现对保险业务中的双录视频进行自动质量检测，从而提高双录视频的质量检测效率。
5.为实现上述目的，本技术实施例的第一方面提出了一种双录视频质量检测方法，所述方法包括：
6.响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；
7.当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；
8.在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理并进行画质检测，得到画质检测结果；
9.在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；
10.对所述音频文件、所述语音播报文件和所述音视频录制文件进行时长检测，得到时长检测结果；
11.当所述时长检测结果满足预设时长同步条件，确定所述音视频录制文件质量达标。
12.在一些实施例中，所述响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件之后，所述方法还包括：
13.当所述语音播报文件请求播放失败，将所述音视频录制文件进行异常标记，并对所述音视频录制文件实时进行音量检测，得到分贝检测结果。
14.在一些实施例中，所述当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果之后，所述方法还包括：
15.在所述分贝检测结果满足预设音量异常条件的情况下，将所述音视频录制文件进行异常标记，并从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；
16.预设音量异常条件为在预设收音时长内所述音视频录制文件的实时分贝低于预设音量阈值。
17.在一些实施例中，所述音视频录制文件包括客户端录制文件、代理人端录制文件，以及与所述客户端文件和所述代理人端文件相匹配的标准时间戳，所述从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果，包括：
18.根据所述标准时间戳，分别对所述客户端录制文件和所述代理人端录制文件进行同步画面截取处理，得到来自于所述客户端录制文件的多个客户端画面和来自于所述代理人端录制文件的多个代理人端画面；
19.将各个所述客户端画面和各个所述代理人端画面一一对应进行合并处理，得到多个待检测视频画面；
20.根据所述标准时间戳，对多个所述待检测视频画面依次进行画质检测，得到画质检测结果。
21.在一些实施例中，所述根据所述标准时间戳，对多个所述待检测视频画面依次进行画质检测，得到画质检测结果之后，所述方法还包括：
22.当所述画质检测结果为满足预设画质异常条件，将所述音视频录制文件确定为质量不达标；
23.其中，预设画质异常条件为相邻两个所述待检测视频画面未通过画质检测。
24.在一些实施例中，所述将各个所述客户端画面和各个所述代理人端画面一一对应进行合并处理，得到多个待检测视频画面之前，所述方法还包括：
25.根据所述标准时间戳，对各个所述客户端画面和各个所述代理人端画面进行匹配检测；
26.当所述标准时间戳中的预设检测时长内缺少所述客户端画面或所述代理人画面，将所述音视频录制文件确定为质量不达标。
27.在一些实施例中，所述当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标，包括：
28.当所述音频时长与所述播报时长之间的播报时间差小于预设第一阈值，且所述音频时长与所述录制时长之间的音画时长差小于预设第二阈值，确定所述音视频录制文件质量达标。
29.为实现上述目的，本技术实施例的第二方面提出了一种双录视频质量检测装置，所述装置包括：
30.文件录制模块，用于响应于视频录制指令，请求播放预设的语音播报文件，实时采
集音视频录制文件；
31.音量检测模块，用于当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；
32.画质检测模块，用于在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理并进行画质检测，得到画质检测结果；
33.语音提取模块，用于在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；
34.时长检测模块，用于对所述音频文件、所述语音播报文件和所述音视频录制文件进行时长检测，得到时长检测结果；
35.文件检测模块，用于当所述时长检测结果满足预设时长同步条件，确定所述音视频录制文件质量达标。
36.为实现上述目的，本技术实施例的第三方面提出了一种电子设备，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的双录视频质量检测方法。
37.为实现上述目的，本技术实施例的第四方面提出了一种存储介质，所述存储介质为计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的双录视频质量检测方法。
38.本技术提供了一种双录视频质量检测方法和装置、电子设备及存储介质，方法包括：响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；对所述音频文件、所述语音播报文件和所述音视频录制文件分别进行时长检测，得到所述音频文件的音频时长、所述语音播报文件的播报时长以及所述音视频录制文件的录制时长；当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标。根据本技术的技术方案，通过结合语音播报文件、音视频录制文件的分贝检测结果和画质检测结果，以及预设的质量判断规则对音视频录制文件进行自动质量检测，相较于现有通过人工质检的技术方案，有效提高双录视频的质量检测效率。
附图说明
39.图1是本技术一个实施例提供的双录视频质量检测方法的步骤流程图；
40.图2是本技术另一个实施例提供的得到分贝检测结果的步骤流程图；
41.图3是本技术另一个实施例提供的得到画质检测结果的步骤流程图；
42.图4是本技术另一个实施例提供的得到画质检测结果的步骤流程图；
43.图5是本技术另一个实施例提供的双录视频质量检测方法的步骤流程图；
44.图6是本技术另一个实施例提供的双录视频质量检测方法的步骤流程图；
45.图7是本技术另一个实施例提供的双录视频质量检测方法的步骤流程图；
46.图8是本技术实施例提供的双录视频质量检测装置的模块示意图；
47.图9是本技术实施例提供的电子设备的硬件结构示意图。
具体实施方式
48.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本技术，并不用于限定本技术。
49.需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。
50.除非另有定义，本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的，不是旨在限制本技术。
51.首先，对本技术中涉及的若干名词进行解析：
52.人工智能(artificial intelligence，ai)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
53.自然语言处理(natural language processing，nlp)：nlp用计算机来处理、理解以及运用人类语言，如中文、英文等，nlp属于人工智能的一个分支，是计算机科学与语言学的交叉学科，又常被称为计算语言学。自然语言处理包括语法分析、语义分析、篇章理解等。自然语言处理常用于机器翻译、手写体和印刷体字符识别、语音识别及文语转换、信息意图识别、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等技术领域，它涉及与语言处理相关的数据挖掘、机器学习、知识获取、知识工程、人工智能研究和与语言计算相关的语言学研究等。
54.双录视频是通过录音录像的方式以记录用户投保过程的文件，是客户保单承保环节中的重要文件，利用双录视频记录用户交易意愿的确认过程，能够规范业务人员的业务处理行为，维护客户的合法权益。目前，用于进行保险业务的音视频文件需要在录制完成后进行质检，质检录制的音视频质量能否达到规定要求，若达到规定要求，将录制的音视频保存下来；若发现视频有异常时，需要重新开始录制整个视频。而且目前双录视频质检过程中结合人工智能技术，仅能够进行人脸识别和语音识别，对文件质量的异常检测均需要人工执行，导致双录视频质检的效率普遍低下，且十分浪费人力，人工质检的强主观性也导致检测结果存在较大偏差。因此，如何提高在保险业务中双录视频的质量检测效率，成为了亟待解决的技术问题。
55.基于此，本技术实施例提供了一种双录视频质量检测方法和装置、电子设备及存
储介质，旨在实现对双录视频进行自动质量检测，从而提高双录视频的质量检测效率。
56.本技术实施例提供的双录视频质量检测方法和装置、电子设备及存储介质，具体通过如下实施例进行说明，首先描述本技术实施例中的双录视频质量检测方法。
57.本技术实施例提供的双录视频质量检测方法，涉及人工智能技术领域，该双录视频质量检测方法包括：响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；对所述音频文件、所述语音播报文件和所述音视频录制文件分别进行时长检测，得到所述音频文件的音频时长、所述语音播报文件的播报时长以及所述音视频录制文件的录制时长；当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标。根据本技术的技术方案，通过结合语音播报文件、音视频录制文件的分贝检测结果和画质检测结果，以及预设的质量判断规则对音视频录制文件进行自动质量检测，相较于目前保险业务中通过人工质检的技术方案，有效提高双录视频的质量检测效率。
58.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，ai是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
59.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
60.本技术实施例提供的双录视频质量检测方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等；服务器端可以配置成独立的物理服务器，也可以配置成多个物理服务器构成的服务器集群或者分布式系统，还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network，cdn)以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现双录视频质量检测方法的应用等，但并不局限于以上形式。
61.本技术可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
62.下面结合附图对本技术实施例进行介绍。
63.第一方面，图1是本技术实施例提供的双录视频质量检测方法的一个可选的流程图，图1中双录视频质量检测方法可以包括但不限于包括步骤s110至步骤s160：
64.步骤s110，响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；
65.步骤s120，当语音播报文件播放成功，对音视频录制文件实时进行音量检测，得到分贝检测结果；
66.步骤s130，在分贝检测结果不满足预设音量异常条件的情况下，从音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果；
67.步骤s140，在画质检测结果不满足预设画质异常条件的情况下，从音视频录制文件中进行语音提取处理，得到音频文件；
68.步骤s150，对音频文件、语音播报文件和音视频录制文件分别进行时长检测，得到音频文件的音频时长、语音播报文件的播报时长以及音视频录制文件的录制时长；
69.步骤s160，当音频时长、播报时长和录制时长满足预设时长同步条件，确定音视频录制文件质量达标。
70.可以理解的是，当接收到视频录制指令，播放预设的语音播报文件，并实时采集音视频录制文件，当语音播报文件播放成功，实时对音视频录制文件进行音量检测，得到分贝检测结果，在分贝检测结果不满足预设音量异常条件的情况下，即分贝检测结果表征当前音视频录制文件的音量播放正常，从音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，在分贝检测结果不满足预设音量异常条件的情况下，对当前的音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，在画质检测结果不满足预设画质异常条件的情况下，对音视频录制文件进行语音提取处理，得到音频文件；由于在保险业务中需要确认客户本人的购买保险的意向，保证保险销售的真实性，因此通过录音录像的方式以记录用户投保过程的双录视频文件是客户保单承保环节中的重要文件，因此，双录视频中的声音大小和画面清晰度成为分辨客户意向的重要因素。接着，分别对音频文件、语音播报文件和音视频录制文件进行时长检测，得到音频文件对应的音频时长、语音播报文件对应的播报时长以及音视频录制文件的对应的录制时长，当音频时长、播报时长和录制时长满足预设时长同步条件，确定音视频录制文件质量达标。根据本技术的技术方案，基于语音播报文件的播放状态，从音视频录制文件的音频音量、录制时长、视频画面质量等多个维度进行递进式的层层检测，相较于现有通过人工质检的技术方案，有效提高双录视频的质量检测效率以及准确率，以及确保留存的音视频录制文件的有效性，为规范保险销售行为、维护保险消费者合法权益提供有效的数据基础。
71.需要说明的是，本技术实施例的视频录制指令可以包括请求播报的语音播报文件对应的播报链接地址，或者是包括请求播报的语音播报文件，在此不多做限制，同时，本技术实施例并不限制语音播报文件的具体内容，本领域技术人员可以根据实际需求进行确定即可。
72.需要说明的是，本技术实施例并不限制确定语音播报文件播放成功的具体方式，可以是在通过判断接收到视频录制指令中是否存在有语音播报文件对应的播报链接地址或者存在有语音播报文件，在确定视频录制指令中存在播报链接地址或语音播报文件，进
一步确定该语音播报文件的播放状态，可以通过以下两种方式确定：例如，获取该语音播报文件通过预设的解码器传输至声卡的传输速率确定，当传输速率在预设时间内的延时小于或等于预设的传输速率阈值，则说明该语音播报文件的传输速率的延时较短，即该语音播报文件的播放流畅度满足预设条件，确定该语音播报文件播放成功；或者实时判断该语音播报文件的播放音量，当语音播报文件的播放音量达到预设的音量阈值，确定该语音播报文件播放成功。
73.需要说明的是，对音视频录制文件实时进行音量检测、对音视频录制文件的视频画面进行画质检测以及对音频文件、语音播报文件和音视频录制文件分别进行时长检测的具体方式为本领域技术人员熟知，本技术实施例在次不多做限制。
74.需要说明的是，在本技术的各个具体实施方式中，当涉及到需要根据用户信息、用户行为数据，用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时，都会先获得用户的许可或者同意，而且，对这些数据的收集、使用和处理等，都会遵守相关国家和地区的相关法律法规和标准。此外，当本技术实施例需要获取用户的敏感个人信息时，会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意，在明确获得用户的单独许可或者单独同意之后，再获取用于使本技术实施例能够正常运行的必要的用户相关数据。
75.请参阅图2，在一些实施例中，在执行图1步骤s110之后，本技术实施例提供的双录视频质量检测方法还可以包括但不限于包括步骤s210：
76.步骤s210，当语音播报文件请求播放失败，将音视频录制文件进行异常标记，并对音视频录制文件实时进行音量检测，得到分贝检测结果。
77.可以理解的是，若在保险业务中双录视频出现异常如无法清晰分辨客户与业务之间的沟通对话内容或者保证沟通对话中客户与业务的身份，则容易产生误解和误导，难以保证双方利益，即异常的双录视频无法作为保险业务中的证明文件，因此，在语音播报文件请求播放失败的情况下，对音视频录制文件进行异常标记，以便后续对携带有异常标记的音视频录制文件进行人工质检，继续对携带有异常标记的音视频录制文件进行实时的音量检测，得到分贝检测结果，为后续对该携带有异常标记的音视频录制文件进行质量检测提供有效的数据基础，在获取携带有异常标记的音视频录制文件的质量检测结果后，该质量检测结果能够有效降低人工质检的工作量以及工作成本，进而有效提高双录视频的质量检测效率以及准确率。
78.需要说明的是，本技术实施例并不限制确定语音播报文件请求播放失败的具体方式，可以根据以下三种方式确定：参考上述实施例的描述，例如，当视频录制指令包括所请求播报的语音播报文件对应的播报链接地址，根据该播报链接地址请求获取对应的目标语音播报文件，当请求获取文件失败，根据预设的请求次数阈值重新根据该播报链接地址请求获取目标语音播报文件，当请求次数超过预设的请求次数阈值，确定语音播报文件请求播放失败；或者，在请求获取语音播报文件成功的情况下，获取该语音播报文件通过预设的解码器传输至声卡的传输速率，当传输速率在预设时间内的延时大于预设传输速率阈值，则说明该语音播报文件的传输速率的延时较长，即该语音播报文件的播放流畅度不满足预设条件，确定该语音播报文件播放失败；或者，在请求获取语音播报文件成功的情况下，实时判断该语音播报文件的播放音量，当语音播报文件的播放音量小于预设的音量阈值，确
定该语音播报文件播放失败。
79.需要说明的是，本技术实施例并不限制对音视频录制文件进行异常标记的具体方法，可以是当确定语音播报文件请求播放失败，对该语音播报文件的播放状态信息和音视频录制文件进行重新封装得到新的音视频录制文件；还可以是通过确定该音视频录制文件的标识信息，根据该语音播报文件的播放状态信息和标识信息生成新的标识信息，该新的标识信息携带有语音播报文件请求播放失败对应的异常标记信息，以便后续人工质检过程可以通过获取各个音视频录制文件的标识信息进行筛选目标待质检文件。
80.请参阅图3，在一些实施例中，在执行图1步骤s120之后，本技术实施例提供的双录视频质量检测方法还可以包括但不限于有步骤s310：
81.步骤s310，在分贝检测结果满足预设音量异常条件的情况下，将音视频录制文件进行异常标记，并从音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，预设音量异常条件为在预设收音时长内音视频录制文件的实时分贝低于预设音量阈值。
82.可以理解的是，由于预设音量异常条件为在预设收音时长内音视频录制文件的实时分贝低于预设音量阈值，在分贝检测结果满足预设音量异常条件的情况下，即表示该音视频录制文件对应的音量过小，无法清晰分辨客户与业务之间的沟通对话内容或者保证沟通对话中客户与业务的身份，则该音视频无法作为保险业务中的证明文件，因此，对该音视频录制文件进行异常标记，以便后续对携带有异常标记的音视频录制文件进行人工质检，继续对携带有异常标记的音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，为后续对该携带有异常标记的音视频录制文件进行质量检测提供有效的数据基础，在获取携带有异常标记的音视频录制文件的质量检测结果后，该质量检测结果能够有效降低人工质检的工作量以及工作成本，进而有效提高双录视频的质量检测效率以及准确率。
83.请参阅图4，在一些实施例中，音视频录制文件包括客户端录制文件、代理人端录制文件，以及与客户端文件和代理人端文件相匹配的标准时间戳，图1步骤s130可以包括但不限于有步骤s410至步骤s430：
84.步骤s410，根据标准时间戳，分别对客户端录制文件和代理人端录制文件进行同步画面截取处理，得到来自于客户端录制文件的多个客户端画面和来自于代理人端录制文件的多个代理人端画面；
85.步骤s420，将各个客户端画面和各个代理人端画面一一对应进行合并处理，得到多个待检测视频画面；
86.步骤s430，根据标准时间戳，对多个待检测视频画面依次进行画质检测，得到画质检测结果。
87.可以理解的是，由于音视频录制文件为双录视频，即存在多端远程双录的场景，音视频录制文件可以包括客户端录制文件、代理人端录制文件，以及与客户端文件和代理人端文件相匹配的标准时间戳，本技术实施例并不限制客户端录制文件、以及代理人端录制文件的具体数量，根据实际情况进行确定即可；根据标准时间戳，分别对客户端录制文件和代理人端录制文件进行同步画面截取处理，得到来自于客户端录制文件的多个客户端画面和来自于代理人端录制文件的多个代理人端画面，将各个客户端画面和各个代理人端画面
一一对应进行合并处理，得到多个待检测视频画面，各个待检测视频画面呈现同一标准时间戳，多路会话的参与对象(包括客户端对象以及代理人端对象)对应的画面合并在同一张图像的场景；根据标准时间戳，对多个待检测视频画面依次进行画质检测，得到画质检测结果，能够为确定音视频录制文件的质量是否达标提供有效的数据基础。
88.需要说明的是，本技术实施例并不对待检测视频画面中代理人端画面以及客户端画面的呈现方式，例如画面的排列顺序进行具体限制，本领域技术人员根据实际情况进行调整即可。
89.请参阅图5，在一些实施例中，在执行图4步骤s430之后，本技术实施例提供的双录视频质量检测方法还可以包括但不限于包括步骤s510：
90.步骤s510，当画质检测结果为满足预设画质异常条件，将音视频录制文件确定为质量不达标，其中，预设画质异常条件为相邻两个待检测视频画面未通过画质检测。
91.请参阅图6，在一些实施例，图4步骤s420可以包括但不限于有步骤s610至步骤s620：
92.步骤s610，根据标准时间戳，对各个客户端画面和各个代理人端画面进行匹配检测；
93.步骤s620，当标准时间戳中的预设检测时长内缺少客户端画面或代理人画面，将音视频录制文件确定为质量不达标。
94.可以理解的是，由于待检测视频画面根据各个客户端画面和各个代理人端画面一一对应进行合并处理得到，待检测视频画面中不同参与对象(客户端对象或代理人端对象)对应的会话图像框在待检测视频画面中的坐标位置互不相同，因此，在对待检测视频画面进行逐帧画质检测的情况下，需要根据不同路的会话图像框的坐标信息，对待检测视频画面的每帧图像的每个会话图像框进行单独的画质检测，具体的检测方式可以是：例如，根据会话图像框的坐标信息，将待检测视频画面的每帧图像进行图像分割处理，得到多个子待检测图像，不同的子待检测图像对应每帧待检测视频画面中不同的会话图像框范围内的图像，将多个子待检测图像输入至预先训练好的图像识别模型进行图像识别，当图像识别结果表征相邻两帧待检测视频画面中的至少一个会话图像框对应的图像存在黑屏或花屏现象，确定画质检测结果满足预设画质异常条件，并将音视频录制文件确定为质量不达标；或者，根据标准时间戳，对各个客户端画面和各个代理人端画面进行匹配检测，当匹配检测结果表征标准时间戳中的预设检测时长内音视频录制文件的视频画面中缺少客户端画面或代理人画面，则无法保证沟通对话中客户与业务的身份，容易产生误解和误导，难以保证双方利益，因此将音视频录制文件确定为质量不达标。
95.需要说明的是，本技术实施例并不涉及图像识别模型的具体改进，图像识别模型可以是alexnet模型，vgg19模型或inceptionv4模型，本领域技术人员根据实际需求进行选用即可。
96.需要说明的是，本技术实施例并不限制从音视频录制文件中获取相邻两个待检测视频画面之间间隔的具体时间周期，可以是相隔2秒从音视频录制文件中截取待检测视频画面，本领域技术人员根据实际情况进行调整即可。
97.需要说明的是，本技术实施例并不限制具体的预设检测时长，可以是5秒或10秒，本领域技术人员根据实际需求进行调整即可。
98.请参阅图7，在一些实施例中，图1步骤s160可以包括但不限于包括步骤s710：
99.步骤s710，当音频时长与播报时长之间的播报时间差小于预设第一阈值，且音频时长与录制时长之间的音画时长差小于预设第二阈值，确定音视频录制文件质量达标。
100.可以理解的是，在对音频文件、语音播报文件和音视频录制文件分别进行时长检测，得到音频文件的音频时长、语音播报文件的播报时长以及音视频录制文件的录制时长之后，根据音频时长、播报时长以及录制时长进行音画同步检测，当音频时长与播报时长之间的播报时间差小于预设第一阈值，且音频时长与录制时长之间的音画时长差小于预设第二阈值，则确定音频时长、播报时长和录制时长满足预设时长同步条件，确定该音视频录制文件质量达标，基于语音播报文件的播放状态，从音视频录制文件的音频音量、录制时长、视频画面质量等多个维度进行递进式的层层检测，有效提高双录视频的质量检测效率以及准确率，以及确保留存的音视频录制文件的有效性，避免出现对音画不同步而无法分清客户与业务在保险承保业务中的沟通内容，从而能够为规范保险销售行为、维护保险消费者合法权益提供有效的数据基础。
101.第二方面，请参阅图8，图8是本技术实施例提供的双录视频质量检测装置的模块示意图，本技术实施例还提供一种双录视频质量检测装置800，可以实现上述双录视频质量检测方法，该装置包括：
102.文件录制模块810，用于响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；
103.音量检测模块820，用于当语音播报文件播放成功，对音视频录制文件实时进行音量检测，得到分贝检测结果；
104.画质检测模块830，用于在分贝检测结果不满足预设音量异常条件的情况下，从音视频录制文件进行画面截取处理并进行画质检测，得到画质检测结果；
105.语音提取模块840，用于在画质检测结果不满足预设画质异常条件的情况下，从音视频录制文件中进行语音提取处理，得到音频文件；
106.时长检测模块850，用于对音频文件、语音播报文件和音视频录制文件进行时长检测，得到时长检测结果；
107.文件检测模块860，用于当时长检测结果满足预设时长同步条件，确定音视频录制文件质量达标。
108.可以理解的是，当接收到视频录制指令，播放预设的语音播报文件，并控制文件录制模块810实时采集音视频录制文件，当语音播报文件播放成功，通过音量检测模块820实时对音视频录制文件进行音量检测，得到分贝检测结果，在分贝检测结果不满足预设音量异常条件的情况下，即分贝检测结果表征当前音视频录制文件的音量播放正常的情况下，通过画质检测模块830从音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，在分贝检测结果不满足预设音量异常条件的情况下，对当前的音视频录制文件进行画面截取处理，得到视频画面，并对视频画面进行画质检测，得到画质检测结果，在画质检测结果不满足预设画质异常条件的情况下，通过语音提取模块840对音视频录制文件进行语音提取处理，得到音频文件；通过时长检测模块850分别对音频文件、语音播报文件和音视频录制文件进行时长检测，得到音频文件对应的音频时长、语音播报文件对应的播报时长以及音视频录制文件的对应的录制时长，接着通过文件检测模
块860基于音频时长、播报时长和录制时长对音视频录制文件进行质量检测，当音频时长、播报时长和录制时长满足预设时长同步条件，确定音视频录制文件质量达标。根据本技术的技术方案，基于语音播报文件的播放状态，从音视频录制文件的音频音量、录制时长、视频画面质量等多个维度进行递进式的层层检测，相较于现有保险业务中通过人工质检的技术方案，有效提高双录视频的质量检测效率以及准确率，以及确保留存的音视频录制文件的有效性，为规范保险销售行为、维护保险消费者合法权益提供有效的数据基础。
109.需要说明的是，该双录视频质量检测装置800的具体实施方式与上述双录视频质量检测方法的具体实施例基本相同，在此不再赘述。
110.第三方面，本技术实施例还提供了一种电子设备，电子设备包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现上述双录视频质量检测方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
111.请参阅图9，图9示意了另一实施例的电子设备的硬件结构，电子设备包括：
112.处理器910，可以采用通用的cpu(centralprocessingunit，中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit，asic)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本技术实施例所提供的技术方案；
113.存储器920，可以采用只读存储器(readonlymemory，rom)、静态存储设备、动态存储设备或者随机存取存储器(randomaccessmemory，ram)等形式实现。存储器920可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器920中，并由处理器910来调用执行本技术实施例的双录视频质量检测方法，例如，执行以上描述的图1中的方法步骤s110至步骤s160、图2中的方法步骤s210、图3中的方法步骤s310、图4中的方法步骤s410至步骤s430、图5中的方法步骤s510、图6中的方法步骤s610至步骤s620以及图7中的方法步骤s710；
114.输入/输出接口930，用于实现信息输入及输出；
115.通信接口940，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如usb、网线等)实现通信，也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信；
116.总线950，在设备的各个组件(例如处理器910、存储器920、输入/输出接口930和通信接口940)之间传输信息；
117.其中处理器910、存储器920、输入/输出接口930和通信接口940通过总线950实现彼此之间在设备内部的通信连接。
118.第四方面，本技术实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机程序，该计算机程序被处理器执行时实现上述双录视频质量检测方法。
119.存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
120.实现上述实施例中的双录视频质量检测方法所需的非暂态软件程序以及指令存储在存储器中，当被一个或者多个处理器执行时，执行上述实施例中的双录视频质量检测
方法，例如，执行以上描述的图1中的方法步骤s110至步骤s160、图2中的方法步骤s210、图3中的方法步骤s310、图4中的方法步骤s410至步骤s430、图5中的方法步骤s510、图6中的方法步骤s610至步骤s620以及图7中的方法步骤s710。
121.本技术实施例提供的双录视频质量检测方法、双录视频质量检测装置、电子设备及存储介质，该双录视频质量检测方法包括：响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；对所述音频文件、所述语音播报文件和所述音视频录制文件分别进行时长检测，得到所述音频文件的音频时长、所述语音播报文件的播报时长以及所述音视频录制文件的录制时长；当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标。根据本技术的技术方案，通过结合语音播报文件、音视频录制文件的分贝检测结果和画质检测结果，以及预设的质量判断规则对音视频录制文件进行自动质量检测，相较于现有通过人工质检的技术方案，有效提高双录视频的质量检测效率。
122.本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案，并不构成对于本技术实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本技术实施例提供的技术方案对于类似的技术问题，同样适用。
123.本领域技术人员可以理解的是，图中示出的技术方案并不构成对本技术实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。
124.以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
125.本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
126.本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
127.应当理解，在本技术中，“多个”是指两个或两个以上。字符“/”一般表示前后关联对象是一种“或”的关系。
128.在本技术所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的
相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。
129.上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
130.另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
131.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例的方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-only memory，简称rom)、随机存取存储器(random access memory，简称ram)、磁碟或者光盘等各种可以存储程序的介质。
132.以上参照附图说明了本技术实施例的优选实施例，并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本技术实施例的权利范围之内。

技术特征：
1.一种双录视频质量检测方法，其特征在于，所述方法包括：响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；对所述音频文件、所述语音播报文件和所述音视频录制文件分别进行时长检测，得到所述音频文件的音频时长、所述语音播报文件的播报时长以及所述音视频录制文件的录制时长；当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标。2.根据权利要求1所述的方法，其特征在于，所述响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件之后，所述方法还包括：当所述语音播报文件请求播放失败，将所述音视频录制文件进行异常标记，并对所述音视频录制文件实时进行音量检测，得到分贝检测结果。3.根据权利要求1所述的方法，其特征在于，所述当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果之后，所述方法还包括：在所述分贝检测结果满足预设音量异常条件的情况下，将所述音视频录制文件进行异常标记，并从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果；预设音量异常条件为在预设收音时长内所述音视频录制文件的实时分贝低于预设音量阈值。4.根据权利要求1或3所述的方法，其特征在于，所述音视频录制文件包括客户端录制文件、代理人端录制文件，以及与所述客户端文件和所述代理人端文件相匹配的标准时间戳，所述从所述音视频录制文件进行画面截取处理，得到视频画面，并对所述视频画面进行画质检测，得到画质检测结果，包括：根据所述标准时间戳，分别对所述客户端录制文件和所述代理人端录制文件进行同步画面截取处理，得到来自于所述客户端录制文件的多个客户端画面和来自于所述代理人端录制文件的多个代理人端画面；将各个所述客户端画面和各个所述代理人端画面一一对应进行合并处理，得到多个待检测视频画面；根据所述标准时间戳，对多个所述待检测视频画面依次进行画质检测，得到画质检测结果。5.根据权利要求4所述的方法，其特征在于，所述根据所述标准时间戳，对多个所述待检测视频画面依次进行画质检测，得到画质检测结果之后，所述方法还包括：当所述画质检测结果为满足预设画质异常条件，将所述音视频录制文件确定为质量不达标；
其中，预设画质异常条件为相邻两个所述待检测视频画面未通过画质检测。6.根据权利要求4所述的方法，其特征在于，所述将各个所述客户端画面和各个所述代理人端画面一一对应进行合并处理，得到多个待检测视频画面之前，所述方法还包括：根据所述标准时间戳，对各个所述客户端画面和各个所述代理人端画面进行匹配检测；当所述标准时间戳中的预设检测时长内缺少所述客户端画面或所述代理人画面，将所述音视频录制文件确定为质量不达标。7.根据权利要求1所述的方法，其特征在于，所述当所述音频时长、所述播报时长和所述录制时长满足预设时长同步条件，确定所述音视频录制文件质量达标，包括：当所述音频时长与所述播报时长之间的播报时间差小于预设第一阈值，且所述音频时长与所述录制时长之间的音画时长差小于预设第二阈值，确定所述音视频录制文件质量达标。8.一种双录视频质量检测装置，其特征在于，所述装置包括：文件录制模块，用于响应于视频录制指令，请求播放预设的语音播报文件，实时采集音视频录制文件；音量检测模块，用于当所述语音播报文件播放成功，对所述音视频录制文件实时进行音量检测，得到分贝检测结果；画质检测模块，用于在所述分贝检测结果不满足预设音量异常条件的情况下，从所述音视频录制文件进行画面截取处理并进行画质检测，得到画质检测结果；语音提取模块，用于在所述画质检测结果不满足预设画质异常条件的情况下，从所述音视频录制文件中进行语音提取处理，得到音频文件；时长检测模块，用于对所述音频文件、所述语音播报文件和所述音视频录制文件进行时长检测，得到时长检测结果；文件检测模块，用于当所述时长检测结果满足预设时长同步条件，确定所述音视频录制文件质量达标。9.一种电子设备，其特征在于，所述电子设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的双录视频质量检测方法。10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的双录视频质量检测方法。

技术总结
本申请提供一种双录视频质量检测方法和装置、电子设备及存储介质，属于人工智能技术领域，方法包括：当语音播报文件播放成功，获取音视频录制文件的实时分贝检测结果；当分贝检测结果不满足预设音量异常条件，对音视频录制文件对应的视频画面进行画质检测，得到画质检测结果；当画质检测结果不满足预设画质异常条件，获取音视频录制文件对应的音频文件；当音频文件的音频时长、语音播报文件的播报时长和音视频录制文件的录制时长满足预设时长同步条件，确定音视频录制文件质量达标。本申请利用在保险业务相关的语音播报文件、音视频录制文件的分贝检测结果和画质检测结果对音视频录制文件进行自动质量检测，提高在保险业务中双录视频的质检效率。双录视频的质检效率。双录视频的质检效率。

技术研发人员：黄良斌
受保护的技术使用者：中国平安人寿保险股份有限公司
技术研发日：2023.07.07
技术公布日：2023/9/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种基于刚性折纸的可折展多边形承载结构 下一篇：基于信息交互的业务培训方法和系统、终端、服务器与流程

双录视频质量检测方法和装置、电子设备及存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

双录视频质量检测方法和装置、电子设备及存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表