点击率预测方法、装置及设备与流程

未命名 07-15 阅读:82 评论:0


1.本技术涉及互联网技术领域,尤其是涉及到一种点击率预测方法、装置及设备。


背景技术:

2.随着互联网行业的不断发展,在电子商务的服务网站中,用户会浏览服务网站中各式各样的候选物品,并从候选物品中找到自己感兴趣的物品,而对于服务方来说,为用户提供更符合用户兴趣的物品可获取到更多的用户资源。
3.通常情况下,候选物品在页面中的位置通常是由用户的兴趣行为决定的,通过点击率预测可向服务网站提供用户动态的兴趣,提升物品推荐的准确性。相关技术中,可针对用户在不同服务场景进行行为序列划分,进而精确刻画不同服务场景下用户的兴趣,但是根据服务场景进行序列划分的方式严重依赖用户行为的丰富度,如果收集到的用户行为不够丰富,使得行为序列中包含的信息不充分,影响点击率预测的准确性。


技术实现要素:

4.有鉴于此,本技术提供了一种点击率预测方法、装置及设备,主要目的在于解决现有技术中如果收集到的用户行为不够丰富,使得行为序列中包含的信息不充分,影响点击率预测的准确性的问题。
5.根据本技术的第一个方面,提供了一种点击率预测方法,应用于网络平台对应的服务端,该方法包括:
6.获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,所述第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,所述第二输入特征包括时空图谱特征和时空趋势特征;
7.从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征;
8.从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征;
9.根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。
10.进一步地,所述获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,包括:
11.接收表征用户兴趣行为的特征数据,从所述特征数据中分别获取用户特征、资源特征、上下文特征以及用户行为序列对应的输入数据,将所述输入数据经过嵌入式特征向量处理,生成表征用户兴趣行为的第一输入特征;
12.统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征。
13.进一步地,所述统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征,包括:
14.统计相同时空内用户群体的兴趣行为数据,根据所述兴趣行为数据确定相同时空内历史点击的资源信息;
15.使用所述相同时空内历史点击的资源信息,预测相同时空内未来点击的资源信息;
16.将所述相同时空内历史点击的资源信息和所述相同时空内未来点击的资源信息经过嵌入式特征向量处理,得到表征时空共现的第二输入特征。
17.进一步地,所述从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,包括:
18.利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征;
19.将所述低频用户的输入特征作为待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活后的输入特征;
20.结合所述低频用户的输入特征和高频用户的输入特征、所述经过时空共现激活后的输入特征,针对第一输入特征中的每个特征得到经过时空共现激活的语义表征;
21.将所述第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到经过时空共现激活的用户语义表征。
22.进一步地,在所述利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征之前,所述方法还包括:
23.根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子。
24.进一步地,所述根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子,包括:
25.根据用户序列长度对所述第一输入特征中的用户群体进行划分,针对所述第一输入特征中的每个用户,判断用户序列长度是否大于预设阈值;
26.若所述用户序列长度大于预设阈值,则将所述第一输入特征中的用户划分为高频用户,否则,将所述第一输入特征中的用户划分为低频用户;
27.根据所述高频用户与低频用户在用户群体中的分布,生成矩阵形式的过滤因子,所述矩阵中高频用户使用第一特征值表征,所述矩阵中低频用户使用第二特征值表征。
28.进一步地,所述从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,包括:
29.利用具有用户划分效果的过滤因子从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征;
30.在所述高频用户的语义特征中确定高频用户的兴趣点,以所述高频用户的兴趣点为核心,使用经过时空共现激活后得到的特征参数对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。
31.进一步地,所述根据所述经过时空共现调制的用户语义表征,确定点击率预测结果,包括:
32.将用户语义表征的样本数据输入至多层感知机的网络模型进行训练,并在训练网络模型的过程中,利用交叉熵函数对所述多感知的网络模型输出的点击率预测结果进行判定,当所述点击率预测结果符合设定要求时,得到预测模型;
33.利用多层感知机训练得到的预测模型,对所述经过时空共现调制的用户语义表征进行预测,在所述预测模型中激活函数的全连接层输出点击率预测结果。
34.根据本技术的第二个方面,提供了一种点击率预测方法,应用于客户端,该方法包括:
35.收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据;
36.将所述特征数据上传至网络平台对应的服务端,以使得服务端根据所述特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用所述第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据所述经过时空共现调制的用户语义表征,确定点击率预测结果;
37.接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。
38.进一步地,所述接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引,包括:
39.接收点击率预测结果,根据所述点击率预测结果确定预判用户感兴趣的网页链接;
40.将所述预判用户感兴趣的网页标识在网页中设定位置进行展示,通过设定位置的网页标识对对网页中未来的用户行为数据进行跳转预指引。
41.根据本技术的第三个方面,提供了一种点击率预测装置,该装置包括:
42.获取单元,用于获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,所述第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,所述第二输入特征包括时空图谱特征和时空趋势特征;
43.激活处理单元,用于从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征;
44.调制处理单元,用于从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征;
45.确定单元,用于根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。
46.进一步地,所述获取单元包括:
47.获取模块,用于接收表征用户兴趣行为的特征数据,从所述特征数据中分别获取用户特征、资源特征、上下文特征以及用户行为序列对应的输入数据,将所述输入数据经过嵌入式特征向量处理,生成表征用户兴趣行为的第一输入特征;
48.统计模块,用于统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征。
49.进一步地,所述统计模块,具体用于统计相同时空内用户群体的兴趣行为数据,根据所述兴趣行为数据确定相同时空内历史点击的资源信息;使用所述相同时空内历史点击的资源信息,预测相同时空内未来点击的资源信息;将所述相同时空内历史点击的资源信息和所述相同时空内未来点击的资源信息经过嵌入式特征向量处理,得到表征时空共现的第二输入特征。
50.进一步地,所述激活处理单元包括:
51.过滤模块,用于利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征;
52.激活处理模块,用于将所述低频用户的输入特征作为待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活后的输入特征;
53.确定模块,用于结合所述低频用户的输入特征和高频用户的输入特征、所述经过时空共现激活后的输入特征,针对第一输入特征中的每个特征得到经过时空共现激活的语义表征;
54.拼接模块,用于将所述第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到经过时空共现激活的用户语义表征。
55.进一步地,所述激活处理单元还包括:
56.划分模块,用于在所述利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征之前,根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子。
57.进一步地,所述划分模块,具体用于根据用户序列长度对所述第一输入特征中的用户群体进行划分,针对所述第一输入特征中的每个用户,判断用户序列长度是否大于预设阈值;若所述用户序列长度大于预设阈值,则将所述第一输入特征中的用户划分为高频用户,否则,将所述第一输入特征中的用户划分为低频用户;根据所述高频用户与低频用户在用户群体中的分布,生成矩阵形式的过滤因子,所述矩阵中高频用户使用第一特征值表征,所述矩阵中低频用户使用第二特征值表征。
58.进一步地,所述调制处理单元,具体用于利用具有用户划分效果的过滤因子从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征;在所述高频用户的语义特征中确定高频用户的兴趣点,以所述高频用户的兴趣点为核心,使用经过时空共现激活后得到的特征参数对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。
59.进一步地,所述确定单元,具体用于将用户语义表征的样本数据输入至多层感知机的网络模型进行训练,并在训练网络模型的过程中,利用交叉熵函数对所述多感知的网络模型输出的点击率预测结果进行判定,当所述点击率预测结果符合设定要求时,得到预测模型;利用多层感知机训练得到的预测模型,对所述经过时空共现调制的用户语义表征进行预测,在所述预测模型中激活函数的全连接层输出点击率预测结果。
60.根据本技术的第四个方面,提供了一种点击率预测装置,该装置包括:
61.提取单元,用于收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据;
62.上传单元,用于将所述特征数据上传至网络平台对应的服务端,以使得服务端根据所述特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用所述第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据所述经过时空共现调制的用户语义表征,确定点击率预测结果;
63.接收单元,用于接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。
64.进一步地,所述接收单元,具体用于接收点击率预测结果,根据所述点击率预测结果确定预判用户感兴趣的网页链接;将所述预判用户感兴趣的网页标识在网页中设定位置进行展示,通过设定位置的网页标识对对网页中未来的用户行为数据进行跳转预指引。
65.根据本技术的第五个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述点击率预测方法。
66.根据本技术的第六方面,提供了一种点击率预测设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述点击率预测方法。
67.借由上述技术方案,本技术提供的一种点击率预测方法、装置及设备,与目前现有技术中针对用户在不同服务场景划分的行为序列来进行点击率预测的方式方式相比,本技术通过获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果。该过程使用时空共现特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
68.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
69.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
70.图1示出了本技术实施例提供的一种点击率预测方法的流程示意图;
71.图2示出了本技术实施例提供的点击率预测框架图;
72.图3示出了本技术实施例提供的在时空共现激活处理过程的框架图;
73.图4示出了本技术实施例提供的在时空共现调制处理过程的框架图;
74.图5示出了本技术实施例提供的另一种点击率预测方法的流程示意图;
75.图6示出了本技术实施例提供的点击率预测过程形成的交互链路图
76.图7示出了本技术实施例提供的一种点击率预测装置的结构示意图;
77.图8示出了本技术实施例提供的另一种点击率预测装置的结构示意图。
具体实施方式
78.下文中将参考附图并结合实施例来详细说明本技术。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
79.相关技术中,可针对用户在不同服务场景进行行为序列划分,进而精确刻画不同服务场景下用户的兴趣,但是根据服务场景进行序列划分的方式严重依赖用户行为的丰富度,如果收集到的用户行为不够丰富,使得行为序列中包含的信息不充分,影响点击率预测的准确性。
80.为了解决该问题,本实施例提供了一种点击率预测系统,包括网络平台对应的服务端和客户端,这里网络平台对应的服务端可以获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果。在实际应用场景中,客户端会收集网页中产生的用户行为数据,从用户行为数据中提取表征用户兴趣行为的特征数据,将特征数据上传至网络平台对应的服务端,接收点击率预测结果,根据点击率预测结果对网页中未来的用户行为数据进行跳转预指引,能够充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
81.具体地,本实施例提供了一种点击率预测方法,应用于网络平台对应的服务端,如图1所示,包括如下步骤:
82.101、获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征。
83.其中,表征用户兴趣行为的第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,用户特征包括用户的属性特征,例如,用户年龄、职业、性别、用户设备信息等,还包括用户的行为统计特征,例如,用户点击次数的统计、用户浏览次数的统计、用户浏览时长的统计等,资源特征包括物品的属性特征,例如,物品类型、物品尺寸规格、物品价格等,还包括物品的统计特征,例如,物品对应的点击量、收藏量、购买量等,上下文特征为用户所处的时空信息,包括用户行为触发的时间信息以及用户行为对应的位置信息,用户行为序列为用户在页面中一系列历史操作形成的行为序列。表征时空共现的第二输入特征包括时空图谱特征和时空趋势特征,时空图谱特征为在当前时空下用户群体对页面中物品产生的历史统计量,例如,用户群体历史选中物品的数量,用户群体历史选中物品的占比等,时空趋势特征为在当前时空下用户群体对页面中物品产生的未来预测量,该未来预测量可使用模型进行预测,例如,用户群体未来选中物品的数量,用户群体未来选中物品的占
比。
84.应说明的是,本发明实施例所涉及的用户特征中的数据,均为经用户授权或者经过各方充分授权的信息和数据,并且数据的收集、使用和处理遵守相关规定和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
85.对于本发明实施例的执行主体可以为点击率预测装置,可以应用于网络平台对应的服务端,通常情况下,用户兴趣行为表现为页面中物品的点击、浏览、比价、收藏等,时空共现为表现用户兴趣行为的时间信息和位置信息是相同的,通过获取表征用户兴趣行为的第一输入特征作为反映用户兴趣行为的基础数据,获取表征时空共现的第二输入特征作为用户兴趣行为的辅助数据,使用辅助数据对基础数据中反映用户兴趣行为弱的部分数据进行扶持,同时对基础数据中反映用户兴趣行为强的部分数据进行扩展,促进用户兴趣行为的发展,使得用户兴趣行为包含有更丰富的语义表征,有利于点击率预测结果的准确性。
86.102、从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征。
87.可以理解的是,时空共现为用户所处时空和其他用户群体所处的时空一致,并且用户所做出的选择受用户群体影响的现象,能够从一定程度上反映出处于相同时间信息和位置信息的用户兴趣,对于兴趣表征不明显的低频用户,时空共现的第二输入特征能够给低频用户在一定程度上提供参考价值,这里待激活特征即为第一输入特征中低频用户的输入特征,进一步使用时空共现的第二输入特征作为时空激活特征对低频用户的输入特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征。
88.在具体实施过程中,考虑到第一输入特征可能会覆盖大量用户以及用户兴趣行为,一个用户对应一个用户兴趣行为,例如,点击物品详情的用户兴趣行为,收藏物品的用户兴趣行为,且每个用户在用户兴趣行为上可能具有不同的统计频率,例如,新用户在用户兴趣行为上通常具有较低的统计频率,而老用户在用户兴趣行为上具有较高的频率统计,具体地,可以按照用户兴趣行为的统计频率将第一输入特征划分为高频用户的输入特征和低频用户的输入特征,这里将每个用户作为一个维度,得到多维度用户的输入特征作为第一输入特征,每个维度的输入特征可能对应低频用户,也可能对应高频用户,然后使用第二输入特征构建第一修正线性单元,利用修正线性单元作为激活函数对低频用户的输入特征进行时空共现激活处理,以将低频用户的输入特征映射到群体时空共现特征所处的特征空间,得到低频用户的兴趣扶持特征,将低频用户的兴趣扶持特征加入到第一输入特征中,也就是说,对于低频用户的输入特征,才可得到时空共现激活,而高频用户的输入特征保持不变,汇总第一输入特征中低频用户经过时空共现激活的兴趣扶持特征,得到经过时空共现激活的用户语义表征。
89.103、从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。
90.可以理解的是,对于兴趣表征明显的高频用户,用户兴趣行为的语义表征已经无需进行兴趣扶持,而是需要兴趣突破,避免兴趣行为的单一推送,这里可以将时空共现的用户特征作为参考,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现激活
的用户语义表征,从而使得高频用户的语义特征中包含有更丰富的兴趣行为特征,
91.在具体实施过程中,经过时空共现激活的用户语义特征中通常包括低频用户的语义特征和/或高频用户的语义特征,而兴趣突破为针对高频用户的语义特征而言,具体地,可以从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,然后使用上述时空共现激活中构建的第二修正线性单元作为激活函数对高频用户的语义表征进行时空共现调制,得到高频用户的兴趣调制特征,根据调制层数将高频用户的兴趣调制特征加入至经过时空共现激活的用户语义特征中,得到经过时空共现调制的用户语义表征。
92.应说明的是,第一输入特征是针对一个用户产生的多个用户兴趣行为,该用户可能是高频用户或低频用户,如果该用户为低频用户,那么第一输入特征中仅包含低频用户的输入特征,在使用第二输入特征作为时空激活特征进行时空共现激活处理后,得到经过时空共现激活的用户语义表征中也仅包含低频用户的语义特征,而低频用户的语义特征中无法筛选得到高频用户的语义表征,无需经过时空共现调制处理,即可得到的用户语义表征,相应的,如果该用户为高频用户,那么第一输入特征中仅包含高频用户的输入特征,无法提取出待激活特征,无需进行时空共现激活处理,即可得到仅包含高频用户的语义表征,针对高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义特征。
93.104、根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。
94.由于经过时空共现激活后的用户语义特征,在原有的用户语义表征基础上加入了低频扶持特征,使得使用时空共现特征对具有贫乏行为序列的低频用户进行兴趣扶持,起到兴趣行为的扶持效果,同理,经过时空共现调制后的用户语义表征,在原有的用户语义表征基础上加入了高频调制特征,使得使用时空共现特征对具有丰富行为序列的高频用户进行兴趣引导,以保证最终的用户语义表征可以准确表征用户的兴趣行为,进而使用经过时空共现调制的用户语义特征,确定点击率预测结果。
95.具体地,可以将经过时空共现调制的用户语义表征输入至预先构建的预测模型中,使用预测模型对用户语义表征在兴趣行为上的点击概率进行预测,得到用户在兴趣行为上的点击率预测结果,该点击率预测结果可以表示为概率数值[0,1],概率数值越大,说明用户在兴趣行为上点击的可能行越大,例如,经过时空共现调制的用户语义表征中包含用户a针对物品m分别在点击兴趣行为和收藏兴趣行为上的用户语义表征ma1、ma2,以及用户b针对物品m分别在点击兴趣行为和收藏兴趣行为上的用户语义表征mb1、mb2,将用户语义表征ma1、ma2输入至预测模型中得到点击率预测结果为0.2、0.8,说明用户a点击物品m的概率较低,收藏物品m的概率较高,将用户语义表征mb1、mb2输入至预测模型中得到点击率预测结果为0.4、0.3,说明用户b点击物品m和收藏物品m的概率都较低。
[0096]
本技术实施例提供的点击率预测方法,与目前现有技术中针对用户在不同服务场景划分的行为序列来进行点击率预测的方式方式相比,本技术通过获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果。该过程使用时空共现
特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
[0097]
进一步地,为了准确获取表征用户兴趣行为的第一输入特征和表征时空共现的第二输入特征,具体地,可以接收表征用户兴趣行为的特征数据,从特征数据中分别获取用户特征、资源特征、上下文特征以及用户行为序列对应的输入数据,将输入数据经过嵌入式特征向量处理,生成表征用户兴趣行为的第一输入特征,统计相同时空内用户群体的兴趣行为数据,根据用户群体的兴趣行为数据确定表征时空共现的第二输入特征。这里嵌入式特征向量处理为将特征映射到向量空间中,在深度学习网络中使用embedding层,实现从高维稀疏特征向量到低维稠密特征向量的转换,以保证第一输入特征中每个特征的向量维度相统一。
[0098]
应说明的是,考虑到嵌入式特征向量处理后,物品资源与用户行为之间的语义关系复杂,很难有效去捕获到长距离关系,可以在将输入数据经过嵌入式特征向量处理之后,对资源特征和用户行为序列进行多头目标注意抽取,得到用户行为序列特征,进一步结合用户行为序列特征、资源特征、用户特征、上下文特征,生成表征用户兴趣行为的第一输入特征。
[0099]
考虑到用户的选择会受到时空共现中历史资源信息和未来资源信息的影响,具体在确定表征时空共现的第二输入特征过程中,通过统计相同时空内用户群体的兴趣行为数据,根据兴趣行为数据确定相同时空内历史点击的资源信息,使用相同时空内历史点击的资源信息,预测相同时空内未来点击的资源信息,将相同时空内历史点击的资源信息和相同时空内未来点击的资源信息经过嵌入式特征向量处理,得到表征时空共现的第二输入特征。这里时空共现的第二输入特征主要包括两部分拼接得到的特征,一部分是统计的时空类目交叉特征,该部分相当于使用历史数据统计得到的时空图谱特征,具体由用户群体统计出来时空内历史热门物品类目,以及每个热门物品类目对应的兴趣分数,这里兴趣分数与每个热门物品类目的点击量占比相关联,兴趣分数可通过时空内用户群体在热门物品上的点击量与热门物品总体点击量的比值得到,例如,热门物品总点击量为1000次,在时空a内a物品的点击量为100次,时空a内b物品的点击量为300次,时空a内c物品的点击量为500次,可计算热门物品a在时空a的兴趣分数为0.1,热门物品b在时空a的兴趣分数0.3,热门物品c在时空a的兴趣分数0.5,另一部分是预测的时空类目交叉特征,该部分相当于使用历史数据预测得到的时空趋势特征,可通过将时空内历史热门物品类目,以及每个热门物品类目对应的兴趣分数输入至预先训练的预测模型中,预测未来时空内热门物品类目,以及每个热门物品类目对应的兴趣分数,例如,可以使用历史时间统计得到的数据预测今天或者未来某一天的数据。
[0100]
具体在实际应用场景中,参见图2所示的点击率预测框架,在点击率预测框架中,包括时空共现激活部分和时空共现调制部分,在获取到第一输入特征(包括上下文特征、用户特征、资源特征、用户序列长度)以及第二输入特征(包括时空图谱特征、时空趋势特征)之后,将第一输入特征进行嵌入式向量处理,在处理过程中使用资源特征对用户行为序列
进行多头目标注意,得到用户序列特征,进一步在时空共现激活部分,使用第二输入特征对嵌入向量处理后的第一输入特征进行时空共现激活处理,然后对经过时空共现激活的用户语义表征进行时空共现调制处理,最终使用多层感知机训练的预测模型,预测得到点击率预测结果。
[0101]
在时空共现激活处理的应用场景中,参见图3,首先使用用户序列长度从第一输入特征中过滤出高频用户特征和低频用户特征,然后使用时空图谱/趋势特征进行加权后形成的特征参数对低频用户特征进行时空共现激活处理,最后在高频用户特征和低频用户特征的基础上,加入经过激活后的低频用户特征,得到经过时空共现激活后的用户语义表征。具体地,可以利用具有用户划分效果的过滤因子对第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征,然后将低频用户的输入特征作为待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活后的输入特征,结合低频用户的输入特征和高频用户的输入特征、经过时空共现激活后的输入特征,针对第一输入特征中的每个特征得到经过时空共现激活的语义表征,将第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到经过时空共现激活的用户语义表征。由于第一输入特征覆盖的用户群体包括各种使用频率的用户,这里在筛选之前,根据用户序列长度对第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子,使用过滤因子将第一输入特征划分为高频用户的输入特征和低频用户的输入特征,为了对低频用户进行兴趣扶持,针对每一个低频用户的输入特征,使用时空激活特征进行时空共现激活。
[0102]
具体在对第一输入特征中的用户群体进行划分过程中,可以根据用户序列长度对第一输入特征中的用户群体进行划分,针对第一输入特征中的每个用户,判断用户序列长度是否大于预设阈值,若用户序列长度大于预设阈值,则将第一输入特征中的用户划分为高频用户,否则,将第一输入特征中的用户划分为低频用户,然后根据高频用户与低频用户在用户群体中的分布,生成矩阵形式的过滤因子,矩阵中高频用户使用第一特征值表征,矩阵中低频用户使用第二特征值表征,例如,高频用户使用1表征,低频用户使用0表征。
[0103]
具体地,可将第一输入特征(包括上下文特征、用户特征、资源特征、用户行为序列特征)标记为x,针对第一输入特征中的每个特征都进行使用共现激活,首先将第二输入特征v=concat(ts
share
,ts
trend
),其中,ts
share
为时空图谱特征,ts
trend
为时空趋势特征,然后使用用户序列长度s,对第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子mask,可表示为如下公式:
[0104][0105]
其中,mask(s)∈r
b*l
,b为训练批次的大小,l为人为控制的超参数,可设置为5。
[0106]
然后,针对第一输入特征进行过滤,筛选出低频用户的输入特征x
lf
mask(s《l)*x,高频用户的输入特征x
hf
mask(s《l)*x,利用上文的第二输入特征v对低频用户进行时空共现激活处理,具体为:
[0107]wparam
=lrelu(fcw(v))
[0108]bparam
=lrelu(fcb(v))
[0109]
[0110]
其中,x
lf
,w
param
∈r
b*d
,v∈r
b*k
,b
param
∈r
b*l
,b为训练批次的大小,d为第一输入特征的维度,k为第二输入特征的维度,lrelu为修正线性单元,主要来作为激活函数,通过上述公式,可将低频用户的特征表征映射到群体时空共现特征所处的特征空间,增强了对低频用户的兴趣扶持。
[0111]
同时,为了而减少引入第二输入特征带来的噪声干扰,这里可使用残差的结构进行修正,最终将第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到的经过时空共现激活的用户语义表征如下所示:
[0112][0113]
在时空共现调制处理的应用场景中,参见图4,首先过滤出高频用户特征,然后使用时空图谱/趋势特征进行加权后形成的特征参数对高频用户特征进行时空共现调制处理,最后在经过时空共现激活后的用户语义表征的基础上,加入经过调制后的高频用户特征,得到经过时空共现调制后的用户语义表征。具体地,可以利用具有用户划分效果的过滤因子从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,在高频用户的语义特征中确定高频用户的兴趣点,以高频用户的兴趣点为核心,使用经过时空共现激活后得到的特征参数对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。
[0114]
具体地,首先使用过滤因子mask从经过时空共现激活处理的用户语义表征xa中过滤出高频用户的语义表征,然后针对高频用户的语义表征进行时空共现调制处理,具体为:
[0115]w′
i,param
=lrelu(fc

i,w
(v))
[0116]b′
i,param
=lrelu(fc

i,b
(v))
[0117][0118]
其中,i∈z
+
,表示调制的层数,xa,w

i,param
∈r
b*a
,a为经过时空共现调制的用户语义表征的维度。
[0119]
同时,为了而减少引入第二输入特征带来的噪声干扰,这里可使用残差的结构进行修正,最终得到的经过时空共现调制的用户语义表征如下所示:
[0120][0121]
可以理解的是,经过时空共现调制的用户语义表征能够准确反映出不同使用频率用户的兴趣行为,保证用户兴趣行为语义表征更符合实际场景,后续可直接应用到点击率预测。具体在根据经过时空共现调制的用户语义表征,确定点击率预测结果的过程中,可以将用户语义表征的样本数据输入至多层感知机的网络模型进行训练,并在训练网络模型的过程中,利用交叉熵函数对多感知的网络模型输出的点击率预测结果进行判定,当点击率预测结果符合设定要求时,得到预测模型,利用多层感知机训练得到的预测模型,对经过时空共现调制的用户语义表征进行预测,在预测模型中激活函数的全连接层输出点击率预测结果。这里可以将经过时空调制处理的用户语义表征输入多层感知机,具体表现为:
[0122][0123]
然后通过sigmoid激活函数得到最终的点击率预测结果,具体表现为:
[0124][0125]
其中,fc
δ
为使用了sigmoid激活函数的全连接层,δ为sigmoid激活函数。
[0126]
在网络模型的训练过程中,使用交叉熵损失函数(crossentropy loss)对整个网络模型进行优化训练,从而获得更加鲁棒的点击率预测结果,具体表现为:
[0127][0128]
其中,yi为标签样本,i为样本下标。
[0129]
具体地,本实施例提供了一种点击率预测方法,应用于客户端,如图5所示,包括如下步骤:
[0130]
501、收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据。
[0131]
其中,网页中产生的用户行为数据的存在形式为日志,例如,用户在网络平台中的网页浏览、网页购买、点击、评论等活动,而表征用户兴趣行为的特征数据通常是用户针对物品触发的点击、收藏、加购等兴趣行为的特征数据,至少包括用户基本信息、用户行为信息、用户行为对应的资源信息以及用户所处的时空信息。
[0132]
502、将所述特征数据上传至网络平台对应的服务端。
[0133]
这里特征数据被发送至网络平台对应的服务端,具体服务端可根据特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果,具体实施细节可参见上述实施例中的流程。
[0134]
503、接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。
[0135]
其中,点击率预测结果可以表示为用户针对某一物品的点击概率值,该点击率预测额结果能够反映用户对物品的感兴趣情况,具体地,可以接收点击率预测结果,根据点击率预测结果确定预判用户感兴趣的网页链接,将预判用户感兴趣的网页标识在网页中设定位置进行展示,通过设定位置的网页标识对对网页中未来的用户行为数据进行跳转预指引。这里网页标识可以是网页图片、链接、视频等,具体跳转预指引的方式可以使用滑动浏览进行指引,可以使用弹窗方式进行指引,例如,点击率预测结果预判用户对物品a感兴趣,此时可将物品a相关的网页标识嵌入在待浏览页面中,以使得用户在未来可通过滑动浏览的行为可优先查看到物品a相关的信息,也可以将物品a相关的网页标识弹窗至当前页面中,以使得用户在未来可通过弹窗点击的行为可优先查看到物品a相关的信息。
[0136]
本发明实施例提供的点击率预测方法,与目前现有技术中针对用户在不同服务场景划分的行为序列来进行点击率预测的方式方式相比,本技术通过收集网页中产生的用户行为数据,从用户行为数据中提取表征用户兴趣行为的特征数据,将特征数据上传至网络平台对应的服务端,以使得服务端根据特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果,接收点击率预测结果,根据点击率预测结果对网页中未来的用户行为数据进行跳转预指引。该过
程使用时空共现特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
[0137]
在实际应用场景中,图6示出了本发明实施例提供点击率预测过程中形成的交互链路图,首先客户端收集网页中产生的用户行为数据,从用户行为数据中提取表征用户兴趣行为的特征数据,将特征数据上传至网络平台对应的服务端,网络平台对应的服务端获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果,将点击率预测结果传输至客户端,客户端接收点击率预测结果,根据点击率预测结果对网页中未来的用户行为数据进行跳转预指引。
[0138]
进一步的,作为图1方法的具体实现,本技术实施例提供了一种可应用于网络平台对应服务端的点击率预测装置,如图7所示,该装置包括:获取单元71、激活处理单元72、调制处理单元73、确定单元74。
[0139]
获取单元71,用于获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,所述第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,所述第二输入特征包括时空图谱特征和时空趋势特征;
[0140]
激活处理单元72,用于从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征;
[0141]
调制处理单元73,用于从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征;
[0142]
确定单元74,用于根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。
[0143]
本发明实施例提供的点击率预测装置,与目前现有技术中针对用户在不同服务场景划分的行为序列来进行点击率预测的方式方式相比,本技术通过获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果。该过程使用时空共现特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利
用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
[0144]
在实际应用场景中,所述获取单元71包括:
[0145]
获取模块,用于接收表征用户兴趣行为的特征数据,从所述特征数据中分别获取用户特征、资源特征、上下文特征以及用户行为序列对应的输入数据,将所述输入数据经过嵌入式特征向量处理,生成表征用户兴趣行为的第一输入特征;
[0146]
统计模块,用于统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征。
[0147]
在实际应用场景中,所述统计模块,具体用于统计相同时空内用户群体的兴趣行为数据,根据所述兴趣行为数据确定相同时空内历史点击的资源信息;使用所述相同时空内历史点击的资源信息,预测相同时空内未来点击的资源信息;将所述相同时空内历史点击的资源信息和所述相同时空内未来点击的资源信息经过嵌入式特征向量处理,得到表征时空共现的第二输入特征。
[0148]
在实际应用场景中,所述激活处理单元72包括:
[0149]
过滤模块,用于利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征;
[0150]
激活处理模块,用于将所述低频用户的输入特征作为待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活后的输入特征;
[0151]
确定模块,用于结合所述低频用户的输入特征和高频用户的输入特征、所述经过时空共现激活后的输入特征,针对第一输入特征中的每个特征得到经过时空共现激活的语义表征;
[0152]
拼接模块,用于将所述第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到经过时空共现激活的用户语义表征。
[0153]
在实际应用场景中,激活处理单元72还包括:
[0154]
划分模块,用于在所述利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征之前,根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子。
[0155]
在实际应用场景中,所述划分模块,具体用于根据用户序列长度对所述第一输入特征中的用户群体进行划分,针对所述第一输入特征中的每个用户,判断用户序列长度是否大于预设阈值;若所述用户序列长度大于预设阈值,则将所述第一输入特征中的用户划分为高频用户,否则,将所述第一输入特征中的用户划分为低频用户;根据所述高频用户与低频用户在用户群体中的分布,生成矩阵形式的过滤因子,所述矩阵中高频用户使用第一特征值表征,所述矩阵中低频用户使用第二特征值表征。
[0156]
在实际应用场景中,所述调制处理单元73,具体用于利用具有用户划分效果的过滤因子从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征;在所述高频用户的语义特征中确定高频用户的兴趣点,以所述高频用户的兴趣点为核心,使用经过时空共现激活后得到的特征参数对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。
[0157]
在实际应用场景中,所述确定单元74,具体用于将用户语义表征的样本数据输入至多层感知机的网络模型进行训练,并在训练网络模型的过程中,利用交叉熵函数对所述多感知的网络模型输出的点击率预测结果进行判定,当所述点击率预测结果符合设定要求时,得到预测模型;利用多层感知机训练得到的预测模型,对所述经过时空共现调制的用户语义表征进行预测,在所述预测模型中激活函数的全连接层输出点击率预测结果。
[0158]
需要说明的是,本实施例提供的一种可应用于网络平台对应的服务端侧的点击率预测装置所涉及各功能单元的其它相应描述,可以参考图1中的对应描述,在此不再赘述。
[0159]
进一步地,作为图2方法的具体实现,本技术实施例提供了一种应用于客户端的点击率预测装置,如图8所示,该装置包括:提取单元81、上传单元82、接收单元83。
[0160]
提取单元81,用于收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据;
[0161]
上传单元82,用于将所述特征数据上传至网络平台对应的服务端,以使得服务端根据所述特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用所述第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据所述经过时空共现调制的用户语义表征,确定点击率预测结果;
[0162]
接收单元83,用于接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。
[0163]
本发明实施例提供的点击率预测装置,与目前现有技术中针对用户在不同服务场景划分的行为序列来进行点击率预测的方式方式相比,本技术通过收集网页中产生的用户行为数据,从用户行为数据中提取表征用户兴趣行为的特征数据,将特征数据上传至网络平台对应的服务端,以使得服务端根据特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果,接收点击率预测结果,根据点击率预测结果对网页中未来的用户行为数据进行跳转预指引。该过程使用时空共现特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
[0164]
在实际应用场景中,所述接收单元83,具体用于接收点击率预测结果,根据所述点击率预测结果确定预判用户感兴趣的网页链接;将所述预判用户感兴趣的网页标识在网页中设定位置进行展示,通过设定位置的网页标识对对网页中未来的用户行为数据进行跳转预指引。
[0165]
需要说明的是,本实施例提供的一种可应用于客户端的点击率预测装置所涉及各功能单元的其它相应描述,可以参考图2中的对应描述,在此不再赘述。
[0166]
基于上述如图1所示方法,相应的,本技术实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1所示的点击率预测方法;基于上述如图2所示方法,相应的,本技术实施例还提供了另一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图2所示的点击率预测方法。
[0167]
基于这样的理解,本技术的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施场景所述的方法。
[0168]
基于上述如图1所示的方法,以及图7所示的虚拟装置实施例,为了实现上述目的,本技术实施例还提供了一种客户端实体设备,具体可以为计算机,智能手机,平板电脑,智能手表,或者网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1所示的点击率预测方法。
[0169]
基于上述如图5所示的方法,以及图8所示的虚拟装置实施例,为了实现上述目的,本技术实施例还提供了一种服务器的实体设备,具体可以为计算机,智能手机,平板电脑,智能手表,服务器,或者网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1所示的点击率预测方法。
[0170]
可选的,上述两种实体设备都还可以包括用户接口、网络接口、摄像头、射频(radio frequency,rf)电路,传感器、音频电路、wi-fi模块等等。用户接口可以包括显示屏(display)、输入单元比如键盘(keyboard)等,可选用户接口还可以包括usb接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)等。
[0171]
本领域技术人员可以理解,本实施例提供的一种点击率预测的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0172]
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述店铺搜索信息处理的实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
[0173]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本技术可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本技术的技术方案,与目前现有方式相比,本技术使用时空共现特征对用户兴趣行为的特征进行时空共现激活处理,针对低频用户赋予增强兴趣的用户语义表征,起到对低频用户进行兴趣扶持的效果,通过对高频用户进行时空共现调制处理,针对高频用户赋予丰富兴趣的用户语义表征,起到对高频用户进行兴趣破圈的效果,充分利用时空激励和调制的兴趣来丰富不同用户行为序列中包含的信息,进而有效挖掘出用户的兴趣所在,提高点击率预测的准确性。
[0174]
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本技术所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一
步拆分成多个子模块。
[0175]
上述本技术序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本技术的几个具体实施场景,但是,本技术并非局限于此,任何本领域的技术人员能思之的变化都应落入本技术的保护范围。

技术特征:
1.一种点击率预测方法,其特征在于,包括:获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,所述第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,所述第二输入特征包括时空图谱特征和时空趋势特征;从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征;从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征;根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。2.根据权利要求1所述的方法,其特征在于,所述获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,包括:接收表征用户兴趣行为的特征数据,从所述特征数据中分别获取用户特征、资源特征、上下文特征以及用户行为序列对应的输入数据,将所述输入数据经过嵌入式特征向量处理,生成表征用户兴趣行为的第一输入特征;统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征。3.根据权利要求2所述的方法,其特征在于,所述统计相同时空内用户群体的兴趣行为数据,根据所述用户群体的兴趣行为数据确定表征时空共现的第二输入特征,包括:统计相同时空内用户群体的兴趣行为数据,根据所述兴趣行为数据确定相同时空内历史点击的资源信息;使用所述相同时空内历史点击的资源信息,预测相同时空内未来点击的资源信息;将所述相同时空内历史点击的资源信息和所述相同时空内未来点击的资源信息经过嵌入式特征向量处理,得到表征时空共现的第二输入特征。4.根据权利要求1所述的方法,其特征在于,所述从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,包括:利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征;将所述低频用户的输入特征作为待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活后的输入特征;结合所述低频用户的输入特征和高频用户的输入特征、所述经过时空共现激活后的输入特征,针对第一输入特征中的每个特征得到经过时空共现激活的语义表征;将所述第一输入特征中的每个特征得到经过时空共现激活的语义表征进行拼接,得到经过时空共现激活的用户语义表征。5.根据权利要求4所述的方法,其特征在于,在所述利用具有用户划分效果的过滤因子对所述第一输入特征进行过滤,筛选得到低频用户的输入特征和高频用户的输入特征之前,所述方法还包括:根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子。
6.根据权利要求5所述的方法,其特征在于,所述根据用户序列长度对所述第一输入特征中的用户群体进行划分,根据用户群体的划分结果得到过滤因子,包括:根据用户序列长度对所述第一输入特征中的用户群体进行划分,针对所述第一输入特征中的每个用户,判断用户序列长度是否大于预设阈值;若所述用户序列长度大于预设阈值,则将所述第一输入特征中的用户划分为高频用户,否则,将所述第一输入特征中的用户划分为低频用户;根据所述高频用户与低频用户在用户群体中的分布,生成矩阵形式的过滤因子,所述矩阵中高频用户使用第一特征值表征,所述矩阵中低频用户使用第二特征值表征。7.根据权利要求1-6中任一项所述的方法,其特征在于,所述从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,包括:利用具有用户划分效果的过滤因子从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征;在所述高频用户的语义特征中确定高频用户的兴趣点,以所述高频用户的兴趣点为核心,使用经过时空共现激活后得到的特征参数对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征。8.一种点击率预测方法,其特征在于,包括:收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据;将所述特征数据上传至网络平台对应的服务端,以使得服务端根据所述特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用所述第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据所述经过时空共现调制的用户语义表征,确定点击率预测结果;接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。9.一种点击率预测装置,其特征在于,包括:获取单元,用于获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,所述第一输入特征包括用户特征、资源特征、上下文特征以及用户行为序列,所述第二输入特征包括时空图谱特征和时空趋势特征;激活处理单元,用于从所述第一输入特征中提取待激活特征,使用所述第二输入特征作为时空激活特征对所述待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征;调制处理单元,用于从所述经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对所述高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征;确定单元,用于根据所述经过时空共现调制的用户语义表征,确定点击率预测结果。10.一种点击率预测装置,其特征在于,包括:
提取单元,用于收集网页中产生的用户行为数据,从所述用户行为数据中提取表征用户兴趣行为的特征数据;上传单元,用于将所述特征数据上传至网络平台对应的服务端,以使得服务端根据所述特征数据,获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,使用所述第二输入特征对所述第一输入特征中提取的待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,对经过时空共现激活的用户语义表征中高频用户的语义特征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据所述经过时空共现调制的用户语义表征,确定点击率预测结果;接收单元,用于接收点击率预测结果,根据所述点击率预测结果对网页中未来的用户行为数据进行跳转预指引。

技术总结
本申请公开了一种点击率预测方法、装置及设备,涉及互联网技术领域,能够有效挖掘出用户的兴趣所在,提高点击率预测的准确性。其中方法包括:获取表征用户兴趣行为的第一输入特征以及表征时空共现的第二输入特征,从第一输入特征中提取待激活特征,使用第二输入特征作为时空激活特征对待激活特征进行时空共现激活处理,得到经过时空共现激活的用户语义表征,从经过时空共现激活的用户语义表征中筛选出高频用户的语义表征,对高频用户的语义表征进行时空共现调制处理,得到经过时空共现调制的用户语义表征,根据经过时空共现调制的用户语义表征,确定点击率预测结果。确定点击率预测结果。确定点击率预测结果。


技术研发人员:林少川
受保护的技术使用者:拉扎斯网络科技(上海)有限公司
技术研发日:2023.04.13
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐