一种活体检测方法、装置、存储介质、产品及电子设备与流程

未命名 10-19 阅读：105 评论：0

1.本技术涉及计算机技术领域，尤其涉及一种活体检测方法、装置、存储介质、产品及电子设备。

背景技术：

2.人脸识别功能在信息安全领域的使用频率越来越高，人脸识别也成为了现在人们生活中重要的身份识别手段，现有技术中可以通过采集人脸图像判断是真实的人进行人脸识别，还是恶意的活体攻击操作，现有技术中往往利用移动终端设备或摄像机获取人脸图像然后再进行人脸识别处理前对人脸图像进行活体检测处理，但是仅仅通过人脸图像的图像信息进行活体检测处理以及对活体检测相关模型的训练，所得到的活体检测装置的泛化能力较差，对不同场景的适应能力较差，需要提供一种泛化能力强、能适应多种场景的活体检测方法。

技术实现要素：

3.本技术实施例提供了一种活体检测方法、装置、存储介质及电子设备，可以通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高活体攻击检测的泛化能力，能够适应更多场景，从而提高活体攻击的准确性。所述技术方案如下：
4.第一方面，本技术实施例提供了一种活体检测方法，所述方法包括：
5.获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；
6.对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；
7.若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。
8.第二方面，本技术实施例提供了一种跨模态模型训练方法，所述方法包括：
9.创建初始跨模态模型，获取至少一个样本人脸图像；
10.基于所述至少一个样本人脸图像对所述初始跨模态模型进行至少一轮模型训练，得到所述至少一个样本人脸图像中各样本人脸图像对应的样本文本数据；
11.基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。
12.第三方面，本技术实施例提供了一种语言检测模型训练方法，所述方法包括：
13.创建初始语言检测模型，获取至少一个样本语境组合，以及所述至少一个样本语境组合中各样本文本数据所对应的样本检测标签，所述样本语境组合中包括一个样本文本数据，与所述样本文本数据相同语境场景的预设个数的样本语境文本数据，以及所述预设个数的样本语境文本数据对应的样本语境检测标签；
14.基于所述至少一个样本语境组合对所述初始语言检测模型进行至少一轮模型训
练，得到所述至少一个样本语境组合中各样本文本数据对应的训练检测标签；
15.基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。
16.第四方面，本技术实施例提供了一种语境选择模型训练方法，所述方法包括：
17.创建初始语境选择模型，获取样本文本数据对应的样本攻击概率和训练攻击概率；
18.基于所述样本文本数据、所述样本攻击概率和所述训练攻击概率对所述初始语境选择模型进行至少一轮模型训练，得到所述样本文本数据对应的样本采样概率分布，基于所述概率采样分布获取所述样本文本数据的预测攻击概率；
19.基于所述预测攻击概率和所述样本攻击概率对所述初始语境选择模型进行参数调整，直至所述初始语境选择模型完成模型训练，得到语境选择模型。
20.第五方面，本技术实施例提供了一种活体检测装置，所述装置包括：
21.跨模态生成模块，用于获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；
22.活体检测模块，用于对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；
23.若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。
24.第六方面，本技术实施例提供了一种跨模态模型训练装置，所述装置包括：
25.初始模型创建模块，用于创建初始跨模态模型，获取至少一个样本人脸图像；
26.初始模型训练模块，用于基于所述至少一个样本人脸图像对所述初始跨模态模型进行至少一轮模型训练，得到所述至少一个样本人脸图像中各样本人脸图像对应的样本文本数据；
27.初始模型调整模块，用于基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。
28.第七方面，本技术实施例提供了一种语言检测模型训练装置，所述装置包括：
29.检测模型创建模块，用于创建初始语言检测模型，获取至少一个样本语境组合，以及所述至少一个样本语境组合中各样本文本数据所对应的样本检测标签，所述样本语境组合中包括一个样本文本数据，与所述样本文本数据相同语境场景的预设个数的样本语境文本数据，以及所述预设个数的样本语境文本数据对应的样本语境检测标签；
30.检测模型训练模块，用于基于所述至少一个样本语境组合对所述初始语言检测模型进行至少一轮模型训练，得到所述至少一个样本语境组合中各样本文本数据对应的训练检测标签；
31.检测模型调整模块，用于基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。
32.第八方面，本技术实施例提供了一种语境选择模型训练装置，所述装置包括：
33.选择模型创建模块，用于创建初始语境选择模型，获取样本文本数据对应的样本攻击概率和训练攻击概率；
34.选择模型训练模块，用于基于所述样本文本数据、所述样本攻击概率和所述训练攻击概率对所述初始语境选择模型进行至少一轮模型训练，得到所述样本文本数据对应的样本采样概率分布，基于所述概率采样分布获取所述样本文本数据的预测攻击概率；
35.选择模型调整模块，用于基于所述预测攻击概率和所述样本攻击概率对所述初始语境选择模型进行参数调整，直至所述初始语境选择模型完成模型训练，得到语境选择模型。
36.第九方面，本技术实施例提供一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行上述的方法步骤。
37.第十方面，本说明书提供一种计算机程序产品，所述计算机程序产品存储有至少一条指令，所述指令适于由处理器加载并执行本说明书一个或多个实施例的方法步骤。
38.第十一方面，本技术实施例提供一种电子设备，可包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
39.在本技术一个或多个实施例中，获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
附图说明
40.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
41.图1是本技术实施例提供的一种活体检测处理的举例示意图；
42.图2是本技术实施例提供的一种活体检测方法的流程示意图；
43.图3是本技术实施例提供的一种活体检测方法的流程示意图；
44.图4是本技术实施例提供的一种跨模态模型训练方法的流程示意图；
45.图5是本技术实施例提供的一种语言检测模型训练方法的流程示意图；
46.图6是本技术实施例提供的一种语境选择模型训练方法的流程示意图；
47.图7是本技术实施例提供的一种活体检测装置的结构示意图；
48.图8是本技术实施例提供的一种活体检测装置的结构示意图；
49.图9是本技术实施例提供的一种跨模态模型训练装置的结构示意图；
50.图10是本技术实施例提供的一种语言检测模型训练装置的结构示意图；
51.图11是本技术实施例提供的一种语境选择模型训练装置的结构示意图；
52.图12是本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
53.下面将结合本技术实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
54.用户可以使用终端设备进行人脸识别处理，人脸识别处理可以用于获取用户的身份信息，终端设备可以通过摄像功能采集包含用户面部的人脸图像，从而根据人脸图像进行人脸识别处理，但是在此之前活体检测装置需要对人脸图像进行活体检测处理，判断所采集到的人脸图像是用户的真实人脸图像，还是活体攻击操作，终端设备可以为手机、平板电脑、可穿戴设备，也可以为有摄像功能的门禁设备等，活体检测装置可以为终端设备，也可以为终端设备中用于实现活体检测方法的模块，活体检测装置还可以为与终端设备相连接的电子设备，例如云端服务器、服务器终端等，即终端设备可以将采集到的人脸图像发送至活体检测装置，活体检测装置可以对人脸图像进行活体检测处理，然后将获得活体检测结果发送至终端设备。
55.当终端设备需要进行人脸识别处理时可以通过摄像功能采集包含用户面部的人脸图像，当活体检测装置检测到终端设备针对人脸识别处理采集到了人脸图像，可以对所采集的人脸图像进行活体检测处理，若活体检测装置所得到的活体检测结果显示人脸图像为真实人脸图像，则可以指示终端设备继续对人脸图像进行人脸识别处理，若活体检测结果显示人脸图像为活体攻击，则终端设备不进行人脸识别处理，活体检测装置还可以向终端设备发送活体攻击提示信息。活体攻击提示信息用于向相关工作人员或用户提示存在对人脸识别处理的活体攻击，提示相关工作人员和用户对活体攻击的情况进行处理。可以理解的是，活体检测结果可以为人脸图像为活体攻击的活体攻击概率，若活体攻击概率大于概率阈值则人脸图像为活体攻击，若活体攻击概率小于或等于概率阈值则人脸图像为真实人脸图像，其中，概率阈值可以为活体检测装置的初始设置，也可以由用户或相关工作人员进行设置，例如可以为50％。其中活体检测结果除了可以为活体攻击概率，还可以为活体检测标签，活体检测标签为可以描述人脸图像为活体攻击可能性的文本信息，例如活体检测标签可以为“有一点可能”、“有很大可能”以及“有一点点可能”等，可以理解的是，活体检测装置可以将活体检测标签转换为活体攻击概率，对活体检测标签进行翻译处理获得对应的活体攻击概率，例如活体检测标签若为“有一点点可能”，则进行翻译处理可以得到活体攻击概率10％。
56.请一并参见图1，为本技术实施例提供了一种活体检测处理的举例示意图，活体检测装置可以获取人脸图像，对人脸图像进行活体检测处理后得到人脸图像对应的活体检测结果。活体检测装置可以包括跨模态模型、语境选择模型和语言检测模型，活体检测装置可以将人脸图像输入跨模态模型中进行跨模态处理，从而得到人脸图像对应的文本数据，其中，文本数据用于描述人脸图像的图像内容，跨模态模型用于对图像进行跨模态处理，从而得到描述图像的图像内容的文本数据，例如若采集到一个女人拿着矿泉水瓶的图像，则对应的文本数据可以为“在广场上，一个女人，右手拿着矿泉水瓶，看着摄像头”，即文本数据可以采用文字来描述图像内容。
57.活体检测装置可以创建样本数据库，样本数据库中可以包含至少一个人脸图像，
至少一个人脸图像中各人脸图像对应的文本数据，以及至少一个人脸图像中各人脸图像对应的活体检测结果，样本数据库可以用于活体检测装置对跨模态模型、语境选择模型和语言检测模型进行模型训练，还可以帮助活体检测装置进行活体检测处理，样本数据库中的人脸图像、文本数据和活体检测结果可以为相关工作人员采用人工处理所得到的，也可以为活体检测装置在进行活体检测处理的工作过程中获取并保存的。可以理解的是，文本数据是有对应的语境场景的，语境场景即为文本数据的语言环境，例如若文本数据为“在广场上，一个女人，右手拿着矿泉水瓶，看着摄像头”，则该文本数据对应的语境场景可以为“户外拍摄的图像”，可以表示活体检测装置在为户外的人的人脸图像进行活体检测处理。
58.活体检测装置需要学习对不同语境场景的文本数据进行活体检测处理，从而使得活体检测处理可能适用于更多的场景，并且活体检测装置在对文本数据进行活体检测处理时结合文本数据对应的语境场景，可以提高活体检测处理的准确性。所以样本数据库中还可以包括至少一个语境场景以及至少一个语境场景中各语境场景对应的语境文本集合，语境文本集合中可以包含语境场景对应的至少预设个数的语境文本数据，以及至少预设个数的语境文本数据中各语境文本数据对应的活体检测结果，其中，语境文本数据为样本数据库中的与语境场景相匹配文本数据，语境场景即为语境文本数据的语言环境，例如，目标语境场景为样本数据库中的一个语境场景，样本数据库中还可以包括目标语境场景对应的语境文本集合，目标语境场景对应的语境文本集合中可以包括至少预设个数的语境文本数据，目标语境场景对应的语境文本集合中的语境文本数据，即为与目标语境场景相匹配的文本数据。
59.为了提高活体检测装置的活体检测处理的泛化能力、提高活体检测处理的准确性，活体检测装置可以将跨模态模型所输出的文本数据输入语境选择模型中，语境选择模型可以输出文本数据对应的语境组合，语境选择模型用于帮助活体检测装置在样本数据库中获取语境场景对应的预设个数的语境文本数据，以及预设个数的语境文本数据对应的活体检测结果，结合文本数据生成文本数据对应的语境组合。其中，预设个数可以为活体检测装置的初始设置，也可以由用户或者相关工作人员进行设置，例如可以为10。然后活体检测装置可以将语境组合输入语言检测模型，语言检测模型结合相同语境场景的语境文本数据以及对应的活体检测结果，对文本数据进行活体检测处理，得到人脸图像对应的活体检测结果，使得活体检测结果更符合语境场景、准确性更高，从而使得活体检测装置适用于更多的场景、提高了活体检测装置的泛化能力。
60.可以理解的是，跨模态模型训练装置可以对初始跨模态模型进行模型训练得到跨模态模型，语言检测模型训练装置可以对初始语言检测模型进行模型训练得到语言检测模型，语境选择模型训练装置可以对初始语境选择模型进行模型训练得到语境选择模型。跨模态模型训练装置、语言检测模型训练装置以及语境选择模型训练装置可以为活体检测装置中用于实现模型训练方法的模块，也可以为与活体检测装置为同一终端设备。
61.下面结合具体的实施例对本技术提供的活体检测方法进行详细说明。
62.请参见图2，为本技术实施例提供了一种活体检测方法的流程示意图。如图2所示，本技术实施例的所述方法可以包括以下步骤s102-s106。
63.s102，获取针对人脸识别处理所采集到的人脸图像，对人脸图像进行跨模态处理，生成人脸图像对应的文本数据。
64.具体的，当终端设备需要进行人脸识别处理时可以通过摄像功能采集包含用户面部的人脸图像，当检测到终端设备采集到了人脸图像，则活体检测装置可以获取针对人脸识别处理所采集到的人脸图像，然后对人脸图像进行跨模态处理，生成人脸图像对应的文本数据，文本数据用于描述人脸图像的图像内容。
65.s104，对文本数据进行活体检测处理，获取文本数据的活体攻击概率。
66.具体的，活体检测装置可以对文本数据进行活体检测处理，从而获取文本数据的活体攻击概率。比如活体检测装置对人脸图像进行跨模态处理后得到了文本数据“在广场上，一个女人，右手拿着矿泉水瓶，短发，面部正对前方，眼睛没有看摄像头”，则活体检测装置可以根据该文本数据获得文本数据的活体攻击概率，也就是人脸图像的活体攻击概率。例如活体检测装置可以在样本数据库中获取，与文本数据在相同语境场景下的预设个数的语境文本数据，以及预设个数的语境文本数据中各语境文本数据对应的活体检测结果，比如文本数据“在广场上，一个女人，右手拿着矿泉水瓶，短发，面部正对前方，眼睛没有看摄像头”的语境场景可以为“户外拍摄的图像”，活体检测装置可以在样本数据库中获取语境场景“户外拍摄的图像”下的预设个数的语境文本数据，并结合预设个数的语境文本数据以及预设个数的语境文本中各语境文本数据对应的活体检测结果，对文本数据进行活体检测处理从而获取文本数据的活体攻击概率，例如语境文本数据对应的活体检测结果可以为语境检测标签，活体检测装置可以结合预设个数的语境文本数据以及各语境文本数据对应的语境检测标签，采用语言检测模型对文本数据进行活体检测处理，其中语言检测模型可以基于预设个数的语境文本数据、预设个数的语境文本数据中各语境文本书对应的语境检测标签以及文本数据，生成文本数据对应的语境组合，然后将语境组合输入语言检测模型，语言检测模型可以输出文本数据对应的检测标签，然后对检测标签进行翻译处理得到标签对应的活体概率。使得活体检测结果更符合语境场景、准确性更高。
67.s106，若活体攻击概率大于概率阈值，则确认人脸图像为活体攻击。
68.具体的，若活体攻击概率大于概率阈值，则活体检测装置可以确认人脸图像为活体攻击，活体检测装置可以指示终端设备不对人脸图像进行人脸识别处理，活体检测装置还可以向终端设备发送活体攻击提示信息，活体攻击提示信息用于向相关工作人员或用户提示存在对人脸识别处理的活体攻击，提示相关工作人员和用户对活体攻击的情况进行处理。可以理解的是，若活体攻击概率小于或等于概率阈值，则人脸图像为真实人脸图像，活体检测装置可以指示终端设备继续对人脸图像进行活体检测处理。
69.在本技术实施例中，获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
70.请参见图3，为本技术实施例提供了一种活体检测方法的流程示意图。如图3所示，本技术实施例的所述方法可以包括以下步骤s202-s216。
71.s202，获取针对人脸识别处理所采集到的人脸图像，采用跨模态模型对人脸图像进行跨模态处理，生成人脸图像对应的文本数据。
72.具体的，当终端设备需要进行人脸识别处理时可以通过摄像功能采集包含用户面部的人脸图像，当检测到终端设备采集到了人脸图像，则活体检测装置可以获取针对人脸识别处理所采集到的人脸图像，然后对人脸图像进行跨模态处理，生成人脸图像对应的文本数据，文本数据用于描述人脸图像的图像内容。
73.活体检测装置可以采用跨模态模型对人脸图像进行跨模态处理，跨模态模型用于对图像进行跨模态处理，从而得到描述图像的图像内容的文本数据，活体检测装置可以将人脸图像输入跨模态模型，跨模态模型可以输出人脸图像对应的文本数据。
74.s204，获取文本数据对应的语境场景，获取语境场景对应的语境文本集合。
75.具体的，活体检测装置可以获取文本数据对应的语境场景，然后在样本数据库中获取语境场景所对应的语境文本集合。语境文本集合中可以包含语境场景对应的至少预设个数的语境文本数据，以及至少预设个数的语境文本数据中各语境文本数据对应的语境检测标签，语境检测标签即为语境文本对应的活体检测标签。比如文本数据“在广场上，一个女人，右手拿着矿泉水瓶，短发，面部正对前方，眼睛没有看摄像头”的语境场景可以为“户外拍摄的图像”，活体检测装置可以在样本数据库中获取语境场景“户外拍摄的图像”所对应的语境文本集合，语境文本集合中可以包括语境场景“户外拍摄的图像”对应的至少预设个数的语境文本数据，以及各语境文本数据对应的语境检测标签，例如，语境场景“户外拍摄的图像”对应的语境文本数据可以为“在广场上，一个男人，戴着墨镜，面朝前方”等。
76.s206，在语境文本集合中获取预设个数的语境文本数据，以及预设个数的语境文本数据中各语境文本数据对应的语境检测标签。
77.具体的，活体检测装置并不需要结合语境文本集合中所有的语境文本对文本数据进行活体检测，可以在语境文本集合中获取预设个数的语境文本数据，以及预设个数的语境文本数据中各语境文本书对应的语境检测标签。
78.可选的，活体检测装置可以随机在语境文本集合中会预设个数的语境文本数据，但是随机获取的语境文本数据并不一定适合文本数据，所以活体检测装置可以基于语境选择模型获取文本数据针对语境场景的采样概率分布，采样概率分布包含语境文本集合中各语境文本数据对应的采样概率，可以理解的是，采样概率越高则语境文本数据越适合被用于与文本数据结合进行活体检测。活体检测装置可以将文本数据输入语境选择模型，语境选择模型可以输出文本数据针对语境场景的采样概率分布。然后活体检测装置可以基于采样概率分布，在语境文本集合中获取预设个数的语境文本数据，并且获取预设个数的语境文本数据中各语境文本数据对应的语境检测标签。
79.可选的，活体检测装置可以将语境文本集合中的语境文本数据按照采样概率从大到小进行排列，获得语境采样队列，然后获取语境采样队列中前预设个数的语境文本数据，从而获取了预设个数的语境文本。
80.s208，结合预设个数的语境文本数据以及各语境文本数据对应的语境检测标签，采用语言检测模型对文本数据进行活体检测处理，获得文本数据对应的检测标签。
81.具体的，活体检测装置可以结合预设个数的语境文本数据，以及各语境文本数据对应的语境检测标签，采用语言检测模型对文本数据进行活体检测处理，从而获得文本数据对应的检测标签，检测标签即为文本数据对应的活体检测标签。活体检测装置可以基于预设个数的语境文本数据、预设个数的语境文本数据中各语境文本书对应的语境检测标签
以及文本数据，生成文本数据对应的语境组合，然后将语境组合输入语言检测模型，语言检测模型可以输出文本数据对应的检测标签。
82.s210，对检测标签进行翻译处理，获得检测标签对应的活体攻击概率。
83.具体的，活体检测装置可以对检测标签进行翻译处理，从而获得检测标签对应的活体攻击概率。
84.s212，判断活体攻击概率是否大于概率阈值。
85.具体的，活体检测装置可以判断活体攻击概率是否大于概率阈值，概率阈值用于判断人脸图像是否为活体攻击，概率阈值可以为活体检测装置的初始设置，也可以由用户或相关工作人员进行设置，例如为50％。若活体攻击概率大于概率阈值，则执行s214；若活体攻击概率小于或等于概率阈值，则执行s216。
86.s214，确认人脸图像为活体攻击。
87.具体的，若活体攻击概率大于概率阈值，则活体检测装置确认人脸图像为活体攻击，活体检测装置可以指示终端设备不对人脸图像进行人脸识别处理，活体检测装置还可以向终端设备发送活体攻击提示信息，活体攻击提示信息用于向相关工作人员或用户提示存在对人脸识别处理的活体攻击，提示相关工作人员和用户对活体攻击的情况进行处理。
88.s216，确认人脸图像为真实人像，针对人脸图像进行人脸识别处理。
89.具体的，若活体攻击概率小于或等于概率阈值，则活体检测装置确认人脸图像为真实人像，不是活体攻击，活体检测装置可以指示终端设备针对人脸图像进行人脸识别处理。
90.在本技术实施例中，获取针对人脸识别处理所采集到的人脸图像，采用跨模态模型对人脸图像进行跨模态处理，生成人脸图像对应的文本数据，采用跨模态模型进行跨模态处理，提高了跨模态处理的准确性，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，获取文本数据对应的语境场景，获取语境场景对应的语境文本集合，基于语境选择模型获取文本数据针对语境场景的采样概率分布，然后基于采样概率分布在语境文本集合中获取预设个数的语境文本数据，以及预设个数的语境文本数据中各语境文本数据对应的语境检测标签，结合预设个数的语境文本数据以及各语境文本数据对应的语境检测标签，采用语言检测模型对文本数据进行活体检测处理，获得文本数据对应的检测标签，结合相同语境场景的文本数据进行活体检测处理，可以提高与语境场景的贴合程度，从而提高活体检测处理的准确性，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
91.请参见图4，为本技术实施例提供了一种跨模态模型训练方法的流程示意图。如图4所示，本技术实施例的跨模态模型训练方法可以包括以下步骤s302-s306。
92.s302，创建初始跨模态模型，获取至少一个样本人脸图像。
93.具体的，跨模态模型训练装置可以创建初始跨模态模型，通过对初始跨模态模型进行模型训练从而获得跨模态模型，活体检测装置可以使用跨模态模型参与对人脸图像进行活体检测处理的过程。跨模态模型训练装置可以从样本数据库中获取至少一个样本人脸图像，用于对初始跨模态模型进行模型训练。
94.s304，基于至少一个样本人脸图像对初始跨模态模型进行至少一轮模型训练，得到至少一个样本人脸图像中各样本人脸图像对应的样本文本数据。
95.具体的，跨模态模型训练装置可以基于至少一个样本人脸图像对初始跨模态模型进行至少一轮模型训练，在每轮模型训练中都可以得到至少一个样本人脸图像中各人脸图像对应的样本文本数据，即将样本人脸图像输入初始跨模态模型，初始跨模态模型可以输出样本人脸图像对应的样本文本数据。
96.s306，基于至少一个样本人脸图像，以及各样本人脸图像对应的样本文本数据对初始跨模态模型进行模型参数调整，直至初始跨模态模型完成模型训练，得到跨模态模型。
97.具体的，跨模态模型训练装置可以基于至少一个样本人脸图像，以及各样本人脸图像对应的样本文本数据计算初始跨模态模型的活体特征损失，基于活体特征损失来在反向传播训练过程中对初始跨模态模型进行模型参数调整，直至初始跨模态模型完成模型训练，从而得到跨模态模型。
98.可选的，跨模态模型训练装置可以对至少一个样本人脸图像进行图像编码处理，获得至少一个样本人脸图像中各样本人脸图像对应的图像特征，图像特征即为表示样本人脸图像的图像信息的特征向量；跨模态模型训练装置还可以对各样本人脸图像对应的样本文本数据进行文本编码处理，获得各样本人脸图像对应的文本特征，文本特征即为表示样本文本数据的文本信息的特征向量。跨模态模型训练装置可以基于各样本人脸图像对应的图像特征，以及各样本人脸图像对应的文本特征计算初始跨模态模型的活体特征损失，即活体特征损失可以为文本特征与图像特征之间的特征差异值，例如，特征差异值可以为文本特征与图像特征之间的欧氏距离。然后基于活体特征损失来在反向传播训练过程中对初始跨模态模型进行模型参数调整，直至初始跨模态模型完成模型训练，从而得到跨模态模型。
99.在本技术实施例中，提出了一种跨模态模型训练方法，采用样本人脸图像进行训练，并基于图像特征和文本特征差异值进行模型参数调整从而获得跨模态模型，并且跨模态模型可部署于活体检测装置中用于将人脸图像转换为文本数据，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
100.请参见图5，为本技术实施例提供了一种语言检测模型训练方法的流程示意图。如图5所示，本技术实施例的语言检测模型训练方法可以包括以下步骤s402-s406。
101.s402，创建初始语言检测模型，获取至少一个样本语境组合，以及至少一个样本语境组合中各样本文本数据所对应的样本检测标签。
102.具体的，语言检测模型训练装置可以创建初始语言检测模型，通过对初始语言检测模型进行模型训练从而获得语言检测模型，活体检测装置可以采用语言检测模型对参与对人脸图像进行活体检测的过程，采用语言检测模型对人脸图像对应的文本数据进行活体检测处理，获得人脸图像对应的检测标签。
103.语言检测模型训练装置可以从样本数据库中获取至少一个样本语境组合，每个样本语境组合中包括一个样本文本数据、与样本文本数据相同语境场景的预设个数的样本语境文本数据，以及预设个数的样本语境文本数据中各样本语境文本数据对应的样本语境检测标签，样本语境检测标签即为样本语境文本数据对应的活体检测标签，语言检测模型训练装置还可以从样本数据库中获取至少一个样本语境组合中各样本文本数据所对应的样
本检测标签，样本检测标签即为样本文本数据对应的活体检测标签。
104.s404，基于至少一个样本语境组合对初始语言检测模型进行至少一轮模型训练，得到至少一个样本语境组合中各样本文本数据对应的训练检测标签。
105.具体的，语言检测模型训练装置可以基于至少一个样本语境组合对初始语言检测模型进行至少一轮模型训练，在每轮模型训练中都可以得到至少一个样本语境组合中各样本文本数据对应的训练检测标签，即将样本语境组合输入初始语言检测模型，初始语言检测模型可以输出样本语境组合中样本文本数据对应的训练检测标签。
106.s406，基于各样本文本数据对应的样本检测标签，以及各样本文本数据对应的训练检测标签对初始语言检测模型进行模型参数调整，直至初始语言检测模型完成模型训练，得到语言检测模型。
107.具体的，语言检测模型训练装置可以基于各样本文本数据对应的样本检测标签，以及各样本文本数据对应的训练检测标签计算初始语言检测模型的活体检测损失，基于活体检测损失来在反向传播训练过程中对初始语言检测模型进行模型参数调整，直至初始语言检测模型完成模型训练，从而得到语言检测模型。
108.可选的，样本检测标签为样本数据库中经由人工处理针对样本文本数据进行标注所得活体检测标签，训练检测标签为在模型训练过程中，即还未完成模型训练的初始语言检测模型所输出的，语言检测模型训练装置对初始语言检测模型进行模型参数调整是为了使得样本检测标签与训练检测标签更加相似，从而提高初始语言检测模型的准确性，可以将样本检测标签与训练检测标签转换为活体攻击概率，便于语言检测模型训练装置计算活体检测损失。
109.语言检测模型训练装置可以对各样本文本数据对应的样本检测标签进行翻译处理，获得各样本文本数据对应的样本攻击概率，还可以各样本文本数据对应的训练检测标签进行翻译处理，获得各样本文本数据对应的训练攻击概率，语言检测模型训练装置可以基于各样本文本数据对应的样本攻击概率，以及各样本文本数据对应的训练攻击概率计算初始语言检测模型的活体检测损失，即活体检测损失可以为训练攻击概率和样本攻击概率之间的概率差异值，例如概率差异值可以为训练攻击概率与样本攻击概率之差的绝对值。然后基于活体检测损失来在反向传播训练过程中对初始语言检测模型进行模型参数调整，直至初始语言检测模型完成模型训练，从而得到语言检测模型。
110.在本技术实施例中，提出了一种语言检测模型训练方法，采用样本语境组合进行训练，并基于样本攻击概率和训练攻击概率的差异值进行模型参数调整从而获得语言检测模型，并且语言检测模型可部署于活体检测装置中用于对文本数据进行活体检测处理，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
111.请参见图6，为本技术实施例提供了一种语境选择模型训练方法的流程示意图。如图6所示，本技术实施例的语境选择模型训练方法可以包括以下步骤s502-s506。
112.s502，创建初始语境选择模型，获取样本文本数据对应的样本攻击概率和训练攻击概率。
113.具体的，语境选择模型训练装置可以创建初始语境选择模型，通过对初始语境选择模型进行模型训练从而获得语境选择模型，活体检测装置可以使用语境选择模型参与对人脸图像进行活体检测处理的过程，采用语境选择模型基于文本数据获取预设个数的语境
文本数据以及预设个数的语境文本数据中各语境文本数据对应的语境检测标签，从而生成文本数据对应的语境组合。
114.语境选择模型训练装置可以从样本数据库中获取样本文本数据，以及样本文本数据对应的样本攻击概率，然后基于语言检测模型获取样本文本数据对应的训练攻击概率。可以理解的是，样本文本数据可以为多个。
115.s504，基于样本文本数据、样本攻击概率和训练攻击概率对初始语境选择模型进行至少一轮模型训练，得到样本文本数据对应的样本采样概率分布，基于概率采样分布获取样本文本数据的预测攻击概率。
116.具体的，语境选择模型训练装置可以基于样本文本数据，样本攻击概率和训练攻击概率低初始语境选择模型进行只至少一轮模型训练，在每轮模型训练中都可以得到样本文本数据对应的语境场景的样本采样概率分布，然后基于样本概率采样分布获取与样本文本数据相同语境场景下，预设个数的采样语境文本数据，基于样本文本数据、预设个数的采样语境文本数据以及预设个数的采样语境文本数据中各采样语境文本数据对应的采样语境检测标签生成样本语境组合，然后采用语言检测模型基于样本语境组合获得样本文本数据对应的预测检测标签，然后对预测检测标签进行翻译处理，获得样本文本数据对应的预测攻击概率。
117.s506，基于预测攻击概率和样本攻击概率对初始语境选择模型进行参数调整，直至初始语境选择模型完成模型训练，得到语境选择模型。
118.具体的，语境选择模型训练装置可以基于预测攻击概率、样本攻击概率和训练攻击概率计算初始语境选择模型的活体概率损失，基于活体概率损失在反向传播训练过程中对初始语境选择模型进行模型参数调整，直至初始语境选择模型完成模型训练，从而得到语境选择模型。
119.可选的，样本攻击概率为针对样本文本数据进行人工处理所得到的活体攻击概率，训练攻击概率为通过训练好的语言检测模型得到的针对样本文本数据得到的活体攻击概率，可以理解的是，语境选择模型训练装置可以随机选择预设个数的样本文本数据在相同语境场景下的语境文本数据与样本文本数据组成语境组合，输入语境选择模型从而得到训练检测标签，对训练检测标签进行翻译处理得到训练攻击概率，而预测攻击概率是采用语言检测装置，针对模型训练过程中的初始语境选择模型输出的样本语境组合，所得到活体攻击概率。语境选择模型训练装置对初始语境选择模型进行参数调整就是为了使得预测攻击概率与样本攻击概率更加接近，从而提高语境选择模型的准确性。
120.语境选择模型训练装置可以基于样本攻击概率和预测攻击概率计算初始语境选择模型的活体概率损失，即活体概率损失可以为预测攻击概率和样本攻击概率之前的概率差异值，例如概率差异值可以为预测攻击概率与样本攻击概率之差的绝对值，然后基于活体概率损失来在反向传播训练过程中对初始语境选择模型进行模型参数调整，直至初始语境选择模型完成模型训练，从而得到语境选择模型。
121.在本技术实施例中，提出了一种语境选择模型训练方法，采用样本攻击概率和训练攻击概率之间的差异进行训练，并基于样本攻击概率和预测攻击概率的差异值进行模型参数调整从而获得语境选择模型，并且语境选择模型可部署于活体检测装置中获取文本数据对应的语境组合，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体
攻击的准确性。
122.下面将结合附图7-附图8，对本技术实施例提供的活体检测装置进行详细介绍。需要说明的是，附图7-附图8中的活体检测装置，用于执行本技术图2和图3所示实施例的方法，为了便于说明，仅示出了与本技术实施例相关的部分，具体技术细节未揭示的，请参照本技术图2和图3所示的实施例。
123.请参见图7，其示出了本技术一个示例性实施例提供的活体检测装置的结构示意图。该活体检测装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置1包括跨模态生成模块11、活体检测模块12和判断模块13。
124.跨模态生成模块11，用于获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；
125.活体检测模块12，用于对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；
126.判断模块13，用于若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。
127.在本实施例中，获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
128.请参见图8，其示出了本技术一个示例性实施例提供的活体检测装置的结构示意图。该活体检测装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置1包括跨模态生成模块11、活体检测模块12、判断模块13和识别处理模块14。
129.跨模态生成模块11，用于获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；
130.可选的，所述跨模态生成模块11具体用于采用跨模态模型对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据。
131.活体检测模块12，用于对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；
132.可选的，所述活体检测模块12具体用于对所述文本数据进行活体检测处理，获得所述文本数据对应的检测标签；
133.对所述检测标签进行翻译处理，获得所述检测标签对应的活体攻击概率。
134.可选的，所述活体检测模块12具体用于获取所述文本数据对应的语境场景，获取所述语境场景对应的语境文本集合，所述语境文本集合中包含所述语境场景对应的至少预设个数的语境文本数据，以及所述至少预设个数的语境文本数据中各语境文本数据对应的语境检测标签；
135.在所述语境文本集合中获取预设个数的语境文本数据，以及所述预设个数的语境
文本数据中各语境文本数据对应的语境检测标签；
136.结合所述预设个数的语境文本数据以及所述各语境文本数据对应的语境检测标签，采用语言检测模型对所述文本数据进行活体检测处理，获得所述文本数据对应的检测标签。
137.可选的，所述活体检测模块12具体用于基于语境选择模型获取所述文本数据针对所述语境场景的采样概率分布，采样概率分布包含所述语境文本集合中各语境文本数据对应的采样概率；
138.基于所述采样概率分布，在所述语境文本集合中获取预设个数的语境文本数据；
139.在所述语境文本集合中获取所述预设个数的语境文本数据中各语境文本数据对应的语境检测标签。
140.判断模块13，用于若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。
141.识别处理模块14，用于若所述活体攻击概率小于或等于概率阈值，则确认所述人脸图像为真实人像；
142.针对所述人脸图像进行人脸识别处理。
143.在本实施例中，获取针对人脸识别处理所采集到的人脸图像，采用跨模态模型对人脸图像进行跨模态处理，生成人脸图像对应的文本数据，采用跨模态模型进行跨模态处理，提高了跨模态处理的准确性，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，获取文本数据对应的语境场景，获取语境场景对应的语境文本集合，基于语境选择模型获取文本数据针对语境场景的采样概率分布，然后基于采样概率分布在语境文本集合中获取预设个数的语境文本数据，以及预设个数的语境文本数据中各语境文本数据对应的语境检测标签，结合预设个数的语境文本数据以及各语境文本数据对应的语境检测标签，采用语言检测模型对文本数据进行活体检测处理，获得文本数据对应的检测标签，结合相同语境场景的文本数据进行活体检测处理，可以提高与语境场景的贴合程度，从而提高活体检测处理的准确性，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。通过将人脸图像转换为描述人脸图像图像内容的文本数据，再基于文本数据进行活体攻击检测，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
144.请参见图9，其示出了本技术一个示例性实施例提供的跨模态模型训练装置的结构示意图。该跨模态模型训练装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置2包括初始模型创建模块21、初始模型训练模块22和初始模型调整模块23。
145.初始模型创建模块21，用于创建初始跨模态模型，获取至少一个样本人脸图像；
146.初始模型训练模块22，用于基于所述至少一个样本人脸图像对所述初始跨模态模型进行至少一轮模型训练，得到所述至少一个样本人脸图像中各样本人脸图像对应的样本文本数据；
147.初始模型调整模块23，用于基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。
148.可选的，所述初始模型调整模块23具体用于对所述至少一个样本人脸图像进行图像编码处理，获得所述至少一个样本人脸图像中各样本人脸图像对应的图像特征；
149.对所述各样本人脸图像对应的样本文本数据进行文本编码处理，获得所述各样本人脸图像对应的文本特征；
150.基于所述各样本人脸图像对应的图像特征，以及所述各样本人脸图像对应的文本特征对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。
151.在本技术实施例中，采用样本人脸图像进行训练，并基于图像特征和文本特征差异值进行模型参数调整从而获得跨模态模型，并且跨模态模型可部署于活体检测装置中用于将人脸图像转换为文本数据，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
152.请参见图10，其示出了本技术一个示例性实施例提供的语言检测模型训练装置的结构示意图。该语言检测模型训练装置可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置3包括检测模型创建模块31、检测模型训练模块32和检测模型调整模块33。
153.检测模型创建模块31，用于创建初始语言检测模型，获取至少一个样本语境组合，以及所述至少一个样本语境组合中各样本文本数据所对应的样本检测标签，所述样本语境组合中包括一个样本文本数据，与所述样本文本数据相同语境场景的预设个数的样本语境文本数据，以及所述预设个数的样本语境文本数据对应的样本语境检测标签；
154.检测模型训练模块32，用于基于所述至少一个样本语境组合对所述初始语言检测模型进行至少一轮模型训练，得到所述至少一个样本语境组合中各样本文本数据对应的训练检测标签；
155.检测模型调整模块33，用于基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。
156.可选的，所述检测模型调整模块33具体用于对所述各样本文本数据对应的样本检测标签进行翻译处理，获得所述各样本文本数据对应的样本攻击概率；
157.对所述各样本文本数据对应的训练检测标签进行翻译处理，获得所述各样本文本数据对应的训练攻击概率；
158.基于所述各样本文本数据对应的样本攻击概率，以及所述各样本文本数据对应的训练攻击概率对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。
159.在本技术实施例中，采用样本语境组合进行训练，并基于样本攻击概率和训练攻击概率的差异值进行模型参数调整从而获得语言检测模型，并且语言检测模型可部署于活体检测装置中用于对文本数据进行活体检测处理，提高了活体攻击检测的泛化能力，能够适应更多场景，从而提高了活体攻击的准确性。
160.请参见图11，其示出了本技术一个示例性实施例提供的语境选择模型训练的结构示意图。该语境选择模型训练模型可以通过软件、硬件或者两者的结合实现成为装置的全部或一部分。该装置4包括选择模型创建模块41、选择模型训练模块42和选择模型调整模块
processing unit，cpu)、图像处理器(graphics processing unit，gpu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户页面和应用程序等；gpu用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。
173.存储器120可以包括随机存储器(random access memory，ram)，也可以包括只读存储器(read-only memory，rom)。可选地，该存储器120包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等，该操作系统可以是安卓(android)系统，包括基于android系统深度开发的系统、苹果公司开发的ios系统，包括基于ios系统深度开发的系统或其它系统。
174.存储器120可分为操作系统空间和用户空间，操作系统即运行于操作系统空间，原生及第三方应用程序即运行于用户空间。为了保证不同第三方应用程序均能够达到较好的运行效果，操作系统针对不同第三方应用程序为其分配相应的系统资源。然而，同一第三方应用程序中不同应用场景对系统资源的需求也存在差异，比如，在本地资源加载场景下，第三方应用程序对磁盘读取速度的要求较高；在动画渲染场景下，第三方应用程序则对gpu性能的要求较高。而操作系统与第三方应用程序之间相互独立，操作系统往往不能及时感知第三方应用程序当前的应用场景，导致操作系统无法根据第三方应用程序的具体应用场景进行针对性的系统资源适配。
175.为了使操作系统能够区分第三方应用程序的具体应用场景，需要打通第三方应用程序与操作系统之间的数据通信，使得操作系统能够随时获取第三方应用程序当前的场景信息，进而基于当前场景进行针对性的系统资源适配。
176.其中，输入装置130用于接收输入的指令或数据，输入装置130包括但不限于键盘、鼠标、摄像头、麦克风或触控设备。输出装置140用于输出指令或数据，输出装置140包括但不限于显示设备和扬声器等。在一个示例中，输入装置130和输出装置140可以合设，输入装置130和输出装置140为触摸显示屏。
177.所述触摸显示屏可被设计成为全面屏、曲面屏或异型屏。触摸显示屏还可被设计成为全面屏与曲面屏的结合，异型屏与曲面屏的结合，本技术实施例对此不加以限定。
178.除此之外，本领域技术人员可以理解，上述附图所示出的电子设备的结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。比如，电子设备中还包括射频电路、输入单元、传感器、音频电路、无线保真(wireless fidelity，wifi)模块、电源、蓝牙模块等部件，在此不再赘述。
179.在图12所示的电子设备中，处理器110可以用于调用存储器120中存储的活体检测应用程序，并执行以实现如本说明书各个方法实施例所述的活体检测方法和/或模型训练方法。
180.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁
碟、光盘、只读存储记忆体或随机存储记忆体等。
181.以上所揭露的仅为本技术较佳实施例而已，当然不能以此来限定本技术之权利范围，因此依本技术权利要求所作的等同变化，仍属本技术所涵盖的范围。
182.需要说明的是，本说明书实施例所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号，均为经用户授权或者经过各方充分授权的，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如，本说明书中涉及的人脸图像、人脸图像的文本数据等都是在充分授权的情况下获取的。

技术特征：
1.一种活体检测方法，所述方法包括：获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。2.根据权利要求1所述的方法，所述对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，包括：采用跨模态模型对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据。3.根据权利要求1所述的方法，所述对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，包括：对所述文本数据进行活体检测处理，获得所述文本数据对应的检测标签；对所述检测标签进行翻译处理，获得所述检测标签对应的活体攻击概率。4.根据权利要求3所述的方法，所述对所述文本数据进行活体检测处理，获得所述文本数据对应的检测标签，包括：获取所述文本数据对应的语境场景，获取所述语境场景对应的语境文本集合，所述语境文本集合中包含所述语境场景对应的至少预设个数的语境文本数据，以及所述至少预设个数的语境文本数据中各语境文本数据对应的语境检测标签；在所述语境文本集合中获取预设个数的语境文本数据，以及所述预设个数的语境文本数据中各语境文本数据对应的语境检测标签；结合所述预设个数的语境文本数据以及所述各语境文本数据对应的语境检测标签，采用语言检测模型对所述文本数据进行活体检测处理，获得所述文本数据对应的检测标签。5.根据权利要求4所述的方法，所述在所述语境文本集合中获取预设个数的语境文本数据，以及所述预设个数的语境文本数据中各语境文本数据对应的语境检测标签，包括：基于语境选择模型获取所述文本数据针对所述语境场景的采样概率分布，采样概率分布包含所述语境文本集合中各语境文本数据对应的采样概率；基于所述采样概率分布，在所述语境文本集合中获取预设个数的语境文本数据；在所述语境文本集合中获取所述预设个数的语境文本数据中各语境文本数据对应的语境检测标签。6.根据权利要求1所述的方法，所述方法还包括：若所述活体攻击概率小于或等于概率阈值，则确认所述人脸图像为真实人像；针对所述人脸图像进行人脸识别处理。7.一种跨模态模型训练方法，所述方法包括：创建初始跨模态模型，获取至少一个样本人脸图像；基于所述至少一个样本人脸图像对所述初始跨模态模型进行至少一轮模型训练，得到所述至少一个样本人脸图像中各样本人脸图像对应的样本文本数据；基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。
8.根据权利要求7所述的方法，其特征在于，基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型，包括：对所述至少一个样本人脸图像进行图像编码处理，获得所述至少一个样本人脸图像中各样本人脸图像对应的图像特征；对所述各样本人脸图像对应的样本文本数据进行文本编码处理，获得所述各样本人脸图像对应的文本特征；基于所述各样本人脸图像对应的图像特征，以及所述各样本人脸图像对应的文本特征对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。9.一种语言检测模型训练方法，所述方法包括：创建初始语言检测模型，获取至少一个样本语境组合，以及所述至少一个样本语境组合中各样本文本数据所对应的样本检测标签，所述样本语境组合中包括一个样本文本数据，与所述样本文本数据相同语境场景的预设个数的样本语境文本数据，以及所述预设个数的样本语境文本数据对应的样本语境检测标签；基于所述至少一个样本语境组合对所述初始语言检测模型进行至少一轮模型训练，得到所述至少一个样本语境组合中各样本文本数据对应的训练检测标签；基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。10.根据权利要求9所述的方法，所述基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型，包括：对所述各样本文本数据对应的样本检测标签进行翻译处理，获得所述各样本文本数据对应的样本攻击概率；对所述各样本文本数据对应的训练检测标签进行翻译处理，获得所述各样本文本数据对应的训练攻击概率；基于所述各样本文本数据对应的样本攻击概率，以及所述各样本文本数据对应的训练攻击概率对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。11.一种语境选择模型训练方法，所述方法包括：创建初始语境选择模型，获取样本文本数据对应的样本攻击概率和训练攻击概率；基于所述样本文本数据、所述样本攻击概率和所述训练攻击概率对所述初始语境选择模型进行至少一轮模型训练，得到所述样本文本数据对应的样本采样概率分布，基于所述概率采样分布获取所述样本文本数据的预测攻击概率；基于所述预测攻击概率和所述样本攻击概率对所述初始语境选择模型进行参数调整，直至所述初始语境选择模型完成模型训练，得到语境选择模型。12.根据权利要求11所述的方法，所述基于所述概率采样分布获取所述样本文本数据的预测攻击概率，包括：
基于所述样本采样概率分布获取与所述样本文本数据相同语境场景下，预设个数的采样语境文本数据；基于所述样本文本数据以及所述预设个数的采样语境文本数据生成样本语境组合；采用语言检测模型，基于所述样本语境组合获得所述样本文本数据对应的预测检测标签；对所述预测检测标签进行翻译处理，获得所述样本文本数据对应的预测攻击概率。13.一种活体检测装置，所述装置包括：跨模态生成模块，用于获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容；活体检测模块，用于对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率；判断模块，用于若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。14.一种跨模态模型训练装置，所述装置包括：初始模型创建模块，用于创建初始跨模态模型，获取至少一个样本人脸图像；初始模型训练模块，用于基于所述至少一个样本人脸图像对所述初始跨模态模型进行至少一轮模型训练，得到所述至少一个样本人脸图像中各样本人脸图像对应的样本文本数据；初始模型调整模块，用于基于所述至少一个样本人脸图像，以及所述各样本人脸图像对应的样本文本数据对所述初始跨模态模型进行模型参数调整，直至所述初始跨模态模型完成模型训练，得到跨模态模型。15.一种语言检测模型训练装置，所述装置包括：检测模型创建模块，用于创建初始语言检测模型，获取至少一个样本语境组合，以及所述至少一个样本语境组合中各样本文本数据所对应的样本检测标签，所述样本语境组合中包括一个样本文本数据，与所述样本文本数据相同语境场景的预设个数的样本语境文本数据，以及所述预设个数的样本语境文本数据对应的样本语境检测标签；检测模型训练模块，用于基于所述至少一个样本语境组合对所述初始语言检测模型进行至少一轮模型训练，得到所述至少一个样本语境组合中各样本文本数据对应的训练检测标签；检测模型调整模块，用于基于所述各样本文本数据对应的样本检测标签，以及所述各样本文本数据对应的训练检测标签对所述初始语言检测模型进行模型参数调整，直至所述初始语言检测模型完成模型训练，得到语言检测模型。16.一种语境选择模型训练装置，所述装置包括：选择模型创建模块，用于创建初始语境选择模型，获取样本文本数据对应的样本攻击概率和训练攻击概率；选择模型训练模块，用于基于所述样本文本数据、所述样本攻击概率和所述训练攻击概率对所述初始语境选择模型进行至少一轮模型训练，得到所述样本文本数据对应的样本采样概率分布，基于所述概率采样分布获取所述样本文本数据的预测攻击概率；选择模型调整模块，用于基于所述预测攻击概率和所述样本攻击概率对所述初始语境
选择模型进行参数调整，直至所述初始语境选择模型完成模型训练，得到语境选择模型。17.一种计算机存储介质，所述计算机存储介质存储有多条指令，所述指令适于由处理器加载并执行如权利要求1～6、7～8、9～10或11～12任意一项的方法步骤。18.一种计算机程序产品，该计算机程序产品存储有至少一条指令，所述至少一条指令由处理器加载并执行如权利要求1～6、7～8、9～10或11～12任意一项的方法步骤。19.一种电子设备，包括：处理器和存储器；其中，所述存储器存储有计算机程序，所述计算机程序适于由所述处理器加载并执行如权利要求1～6、7～8、9～10或11～12任意一项的方法步骤。

技术总结
本申请公开了一种活体检测方法、装置、存储介质及电子设备，其中，方法包括：获取针对人脸识别处理所采集到的人脸图像，对所述人脸图像进行跨模态处理，生成所述人脸图像对应的文本数据，所述文本数据用于描述所述人脸图像的图像内容，对所述文本数据进行活体检测处理，获取所述文本数据的活体攻击概率，若所述活体攻击概率大于概率阈值，则确认所述人脸图像为活体攻击。活体攻击。活体攻击。

技术研发人员：曹佳炯
受保护的技术使用者：支付宝（杭州）信息技术有限公司
技术研发日：2023.06.02
技术公布日：2023/10/15

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种安全便捷式胰岛素注射笔 下一篇：经三唑基-甲基取代的α-D-吡喃半乳糖苷衍生物的制作方法

一种活体检测方法、装置、存储介质、产品及电子设备与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种活体检测方法、装置、存储介质、产品及电子设备与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表