对表格数据和序列数据融合处理的方法和装置与流程
未命名
08-15
阅读:79
评论:0
1.本说明书一个或多个实施例涉及计算机领域,尤其涉及对表格数据和序列数据融合处理的方法和装置。
背景技术:
2.当前,常常基于目标对象的特征数据,采用神经网络模型对目标对象进行检索或分类。目标对象的特征数据通常为表格数据,随着基于序列数据的神经网络的算法与工程方案都逐渐成熟,在表格数据的基础上,添加序列数据进行联合建模就成了一种优选的建模方案。其中,目标对象的特征数据可能属于隐私数据,需要保护其不被泄露。
3.现有技术中,对表格数据和序列数据融合处理的方案,无法使得对目标对象进行检索或分类取得良好的效果。
技术实现要素:
4.本说明书一个或多个实施例描述了一种对表格数据和序列数据融合处理的方法和装置,能够使得对目标对象进行检索或分类取得良好的效果。
5.第一方面,提供了一种对表格数据和序列数据融合处理的方法,方法包括:
6.将目标对象的表格数据输入表格编码器,得到表格嵌入向量;
7.将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
8.将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;
9.将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。
10.在一种可能的实施方式中,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。
11.在一种可能的实施方式中,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。
12.在一种可能的实施方式中,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。
13.进一步地,所述方法还包括:
14.将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;
15.将所述二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类
的结果。
16.进一步地,所述二次融合处理,包括:
17.将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。
18.在一种可能的实施方式中,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代训练得到,在各轮迭代中,所述表格编码器基于第一学习率进行调参,所述序列编码器基于第二学习率进行调参,使得所述表格编码器收敛的轮次和使所述序列编码器收敛的轮次之间的差别在预设范围内。
19.进一步地,所述第一学习率大于所述第二学习率。
20.在一种可能的实施方式中,所述融合事件嵌入向量基于自注意力机制得到,包括:
21.针对m个事件中的第一事件,确定其与其他事件之间分别对应的注意力分数;
22.基于各注意力分数,对m个事件分别对应的拼接事件嵌入向量进行加权求和,得到所述第一事件对应的融合事件嵌入向量。
23.第二方面,提供了一种对表格数据和序列数据融合处理的装置,包括:
24.表格嵌入单元,用于将目标对象的表格数据输入表格编码器,得到表格嵌入向量;
25.序列嵌入单元,用于将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
26.拼接单元,用于将所述表格嵌入单元得到的表格嵌入向量和所述序列嵌入单元得到的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;
27.自注意力单元,用于将所述拼接单元得到的拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。
28.第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。
29.第四方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。
30.通过本说明书实施例提供的方法和装置,首先将目标对象的表格数据输入表格编码器,得到表格嵌入向量;然后将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;接着将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;最后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。由上可见,本说明书实施例,先对表格数据对应的表格嵌入向量和序列数据对应的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵,然后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵,该融合嵌
入矩阵用于对所述目标对象进行检索或分类。该方案利用了神经网络模型的自注意力层来进行表格数据和序列数据的融合处理,能够使得对目标对象进行检索或分类取得良好的效果。
附图说明
31.为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
32.图1为本说明书披露的一个实施例的实施场景示意图;
33.图2示出根据一个实施例的对表格数据和序列数据融合处理的方法流程图;
34.图3示出根据一个实施例的事件内融合示意图;
35.图4示出根据一个实施例的序列内融合示意图;
36.图5示出根据一个实施例的二次融合处理示意图;
37.图6示出根据一个实施例的对表格数据和序列数据融合处理的装置的示意性框图。
具体实施方式
38.下面结合附图,对本说明书提供的方案进行描述。
39.图1为本说明书披露的一个实施例的实施场景示意图。该实施场景涉及对表格数据和序列数据融合处理。本说明书实施例,表格数据可以为专家经验总结的目标对象的若干特征数据,这些特征数据之间通常不具有时序关系。参照图1,表格数据可以但不限于包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。例如,目标对象代表用户甲,该用户甲的职业、所在城市、点赞文章数和关注人数构成表格数据,其中,职业和所在城市可以视为前述属性特征数据,点赞文章数和关注人数可以视为前述统计特征数据。
40.本说明书实施例,序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据。参照图1,序列数据中每行具有一个时间索引,每个时间索引对应一个事件,每个事件具有分别对应于若干属性的属性值,这些属性值构成了事件数据,不同事件对应于同一属性的属性值可以相同,也可以不同。例如,时间索引1对应于事件1,事件1对应于属性a的属性值为a1;时间索引2对应于事件2,事件2对应于属性a的属性值为a2。若事件1和事件2均代表点击事件,属性a代表点击的页面,则两次点击事件中点击的页面可以相同,也可以不同。可以理解的是,时间索引标识了各个事件发生的时间先后关系,从而各事件之间具有一定的时序关系,相应地,各事件的事件数据之间也具有一定的时序关系。
41.表格数据和序列数据可以视为两种不同模态的数据。本说明书实施例,针对表格数据和序列数据融合处理提出解决方案,以期使得对目标对象进行检索或分类取得良好的效果。
42.图2示出根据一个实施例的对表格数据和序列数据融合处理的方法流程图,该方法可以基于图1所示的实施场景。如图2所示,该实施例中对表格数据和序列数据融合处理
的方法包括以下步骤:步骤21,将目标对象的表格数据输入表格编码器,得到表格嵌入向量;步骤22,将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;步骤23,将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;步骤24,将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。下面描述以上各个步骤的具体执行方式。
43.首先在步骤21,将目标对象的表格数据输入表格编码器,得到表格嵌入向量。可以理解的是,表格嵌入向量可以具有预设的维度,例如k维。
44.在一个示例中,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。
45.可以理解的是,表格数据是相互之间无时序关系的若干项特征数据,本说明书实施例,并不限定表格数据包含的特征数据的含义。
46.然后在步骤22,将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成。可以理解的是,每个事件具有分别对应于若干属性的属性值,这些属性值构成了事件数据。初始事件嵌入向量可以具有预设的维度,例如q维。
47.本说明书实施例,初始事件嵌入向量可以设置为与表格嵌入向量具有相同的维度,此时q=k;初始事件嵌入向量也可以设置为与表格嵌入向量具有不同的维度,此时q≠k。
48.举例来说,将t个事件分别对应的初始事件嵌入向量作为列向量,按照所述时序依次从左到右排列得到所述初始嵌入矩阵。
49.接着在步骤23,将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成。可以理解的是,上述目标拼接处理的方式可以影响m的取值。
50.在一个示例中,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。
51.该示例对应的目标拼接处理的方式可以称为事件内融合。图3示出根据一个实施例的事件内融合示意图。参照图3,表格嵌入向量为q维的列向量,或者说为q行1列的向量,初始嵌入矩阵为k行t列的矩阵,初始事件嵌入向量为k维的列向量。事件内融合,用于将每个事件对应的初始事件嵌入向量与表格嵌入向量进行拼接,得到该事件对应的拼接事件嵌入向量,拼接事件嵌入向量为(q+k)维的列向量,事件数量没有增加。其中,表格嵌入向量的维度q可以等于k,也可以不等于k。
52.在另一个示例中,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。
53.该示例对应的目标拼接处理的方式可以称为序列内融合。图4示出根据一个实施例的序列内融合示意图。参照图4,表格嵌入向量为k维的列向量,或者说为k行1列的向量,也就是说,前述q=k,初始嵌入矩阵为k行t列的矩阵,初始事件嵌入向量为k维的列向量。序列内融合,用于将表格嵌入向量作为新增事件对应的拼接事件嵌入向量,将该拼接事件嵌入向量作为初始嵌入矩阵新增的一列,得到拼接嵌入矩阵。
54.最后在步骤24,将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。可以理解的是,拼接嵌入矩阵中既包含表格数据的信息,又包含序列数据的信息,将所述拼接嵌入矩阵输入自注意力层,通过注意力层可以实现对表格数据和序列数据的融合处理。
55.在一个示例中,在前述序列内融合基础上,所述方法还可以包括:
56.将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;
57.将所述二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类的结果。
58.该示例中,在得到融合嵌入矩阵之后,将所述表格嵌入向量和所述融合嵌入矩阵进行再次的融合处理,得到二次融合矩阵,能够实现对表格数据和序列数据更好的融合,以进一步提升对所述目标对象进行检索或分类的结果的准确性。
59.图5示出根据一个实施例的二次融合处理示意图。参照图5,首先将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵,注意力层实现了对表格数据和序列数据的初始的融合处理;然后将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵,二次融合处理实现了对表格数据和序列数据的进一步的融合处理。通过在神经网络模型的不同网络层进行的多次融合处理,可以实现对表格数据和序列数据的充分融合。
60.进一步地,所述二次融合处理,包括:
61.将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。
62.可以理解的是,所述目标拼接处理的方式可以但不限于包括前述事件内融合或序列内融合。
63.在一个示例中,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代训练得到,在各轮迭代中,所述表格编码器基于第一学习率进行调参,所述序列编码器基于第二学习率进行调参,使得所述表格编码器收敛的轮次和使所述序列编码器收敛的轮次之间的差别在预设范围内。
64.该示例中,在对神经网络模型进行多轮迭代训练时,可以基于不同的学习率对表格编码器和序列编码器进行调参,从而避免出现序列编码器已经过拟合了,而表格编码器还欠拟合。通过调节学习率,来使得表格编码器和序列编码器可以同时收敛。
65.进一步地,所述第一学习率大于所述第二学习率。
66.经研究发现,在相同的学习率下,序列编码器的收敛速度可以达到表格编码器的收敛速度的几十倍,因此通过设置第一学习率大于第二学习率,来使得表格编码器和序列
编码器可以同时收敛。
67.在一个示例中,所述融合事件嵌入向量基于自注意力机制得到,包括:
68.针对m个事件中的第一事件,确定其与其他事件之间分别对应的注意力分数;
69.基于各注意力分数,对m个事件分别对应的拼接事件嵌入向量进行加权求和,得到所述第一事件对应的融合事件嵌入向量。
70.该示例中,通过自注意力机制对拼接事件嵌入向量的处理,可以实现对表格数据和序列数据的融合处理。
71.通过本说明书实施例提供的方法,首先将目标对象的表格数据输入表格编码器,得到表格嵌入向量;然后将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;接着将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;最后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。由上可见,本说明书实施例,先对表格数据对应的表格嵌入向量和序列数据对应的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵,然后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵,该融合嵌入矩阵用于对所述目标对象进行检索或分类。该方案利用了神经网络模型的自注意力层来进行表格数据和序列数据的融合处理,能够使得对目标对象进行检索或分类取得良好的效果。
72.根据另一方面的实施例,还提供一种对表格数据和序列数据融合处理的装置,该装置用于执行本说明书实施例提供的图2所示的方法。图6示出根据一个实施例的对表格数据和序列数据融合处理的装置的示意性框图。如图6所示,该装置600包括:
73.表格嵌入单元61,用于将目标对象的表格数据输入表格编码器,得到表格嵌入向量;
74.序列嵌入单元62,用于将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
75.拼接单元63,用于将所述表格嵌入单元61得到的表格嵌入向量和所述序列嵌入单元62得到的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;
76.自注意力单元64,用于将所述拼接单元63得到的拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。
77.可选地,作为一个实施例,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。
78.可选地,作为一个实施例,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。
79.可选地,作为一个实施例,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。
80.进一步地,所述装置还包括:
81.二次融合单元,用于将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;
82.输入单元,用于将所述二次融合单元得到的二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类的结果。
83.进一步地,所述二次融合单元,具体用于将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。
84.可选地,作为一个实施例,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代训练得到,在各轮迭代中,所述表格编码器基于第一学习率进行调参,所述序列编码器基于第二学习率进行调参,使得所述表格编码器收敛的轮次和使所述序列编码器收敛的轮次之间的差别在预设范围内。
85.进一步地,所述第一学习率大于所述第二学习率。
86.可选地,作为一个实施例,所述自注意力单元64包括:
87.确定子单元,用于针对m个事件中的第一事件,确定其与其他事件之间分别对应的注意力分数;
88.求和子单元,用于基于确定子单元得到的各注意力分数,对m个事件分别对应的拼接事件嵌入向量进行加权求和,得到所述第一事件对应的融合事件嵌入向量。
89.通过本说明书实施例提供的装置,首先表格嵌入单元61将目标对象的表格数据输入表格编码器,得到表格嵌入向量;然后序列嵌入单元62将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;接着拼接单元63将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;最后自注意力单元64将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。由上可见,本说明书实施例,先对表格数据对应的表格嵌入向量和序列数据对应的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵,然后将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵,该融合嵌入矩阵用于对所述目标对象进行检索或分类。该方案利用了神经网络模型的自注意力层来进行表格数据和序列数据的融合处理,能够使得对目标对象进行检索或分类取得良好的效果。
90.根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图2所描述的方法。
91.根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图2所描述的方法。
92.本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。
93.以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。
技术特征:
1.一种对表格数据和序列数据融合处理的方法,所述方法包括:将目标对象的表格数据输入表格编码器,得到表格嵌入向量;将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;将所述表格嵌入向量和所述初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;将所述拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。2.如权利要求1所述的方法,其中,所述表格数据包括目标对象本身的属性特征数据和/或目标对象的历史行为数据所反映的统计特征数据。3.如权利要求1所述的方法,其中,m等于t;所述拼接事件嵌入向量为将所述表格嵌入向量和所述初始事件嵌入向量进行拼接处理得到的。4.如权利要求1所述的方法,其中,m等于t+1;m个事件包括所述t个事件和新增事件;所述t个事件中任一事件对应的拼接事件嵌入向量与该事件的初始事件嵌入向量相同;所述新增事件对应的拼接事件嵌入向量为所述表格嵌入向量。5.如权利要求4所述的方法,其中,所述方法还包括:将所述表格嵌入向量和所述融合嵌入矩阵进行二次融合处理,得到二次融合矩阵;所述二次融合矩阵由n个事件分别对应的二次融合嵌入向量按照所述时序排列而成;将所述二次融合矩阵输入多层感知器,其输出为对所述目标对象进行检索或分类的结果。6.如权利要求5所述的方法,其中,所述二次融合处理,包括:将所述表格嵌入向量和所述融合嵌入矩阵进行所述目标拼接处理。7.如权利要求1所述的方法,其中,所述表格编码器、所述序列编码器和所述自注意力层共同构成神经网络模型;所述神经网络模型通过多轮迭代训练得到,在各轮迭代中,所述表格编码器基于第一学习率进行调参,所述序列编码器基于第二学习率进行调参,使得所述表格编码器收敛的轮次和使所述序列编码器收敛的轮次之间的差别在预设范围内。8.如权利要求7所述的方法,其中,所述第一学习率大于所述第二学习率。9.如权利要求1所述的方法,其中,所述融合事件嵌入向量基于自注意力机制得到,包括:针对m个事件中的第一事件,确定其与其他事件之间分别对应的注意力分数;基于各注意力分数,对m个事件分别对应的拼接事件嵌入向量进行加权求和,得到所述第一事件对应的融合事件嵌入向量。10.一种对表格数据和序列数据融合处理的装置,所述装置包括:表格嵌入单元,用于将目标对象的表格数据输入表格编码器,得到表格嵌入向量;序列嵌入单元,用于将所述目标对象的序列数据输入序列编码器,得到初始嵌入矩阵,所述序列数据包括与所述目标对象相关、按照时序排列的t个事件的事件数据,所述初始嵌入矩阵由所述t个事件分别对应的初始事件嵌入向量按照所述时序排列而成;
拼接单元,用于将所述表格嵌入单元得到的表格嵌入向量和所述序列嵌入单元得到的初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;所述拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照所述时序排列而成;自注意力单元,用于将所述拼接单元得到的拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;所述融合嵌入矩阵由m个事件分别对应的融合事件嵌入向量按照所述时序排列而成;所述融合事件嵌入向量基于自注意力机制得到;所述融合嵌入矩阵用于对所述目标对象进行检索或分类。11.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-9中任一项的所述的方法。12.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-9中任一项的所述的方法。
技术总结
本说明书实施例提供一种对表格数据和序列数据融合处理的方法和装置。方法包括:将表格数据输入表格编码器,得到表格嵌入向量;将序列数据输入序列编码器,得到初始嵌入矩阵,序列数据包括与目标对象相关、按照时序排列的t个事件的事件数据,初始嵌入矩阵由t个事件分别对应的初始事件嵌入向量按照时序排列而成;将表格嵌入向量和初始嵌入矩阵进行目标拼接处理,得到拼接嵌入矩阵;拼接嵌入矩阵由m个事件分别对应的拼接事件嵌入向量按照时序排列而成;将拼接嵌入矩阵输入自注意力层,得到融合嵌入矩阵;融合嵌入矩阵用于对目标对象进行检索或分类。能够使得对目标对象进行检索或分类取得良好的效果。类取得良好的效果。类取得良好的效果。
技术研发人员:王宁涛 傅幸 王维强
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:2023.05.04
技术公布日:2023/8/13
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
