用于推荐候选种子用户的方法和装置与流程
未命名
08-15
阅读:128
评论:0
1.本公开涉及计算机技术领域,特别涉及用于推荐候选种子用户的方法和装置。
背景技术:
2.目前在推荐系统中已有常规的推荐方法,诸如基于圈人算法或者lookalike算法的推荐方法,这种推荐方法通常以诸如能够产生优质创作的用户之类的目标用户作为种子用户,从而在候选用户中选择与该种子用户相似的用户。然而,受限于推荐方法的先验条件,推荐出的用户数可能少于预期。
3.因此,存在对于能够推荐更多候选用户的推荐方法的需求。
技术实现要素:
4.本公开提供了用于推荐候选种子用户的方法和装置。
5.根据本公开的第一方面,提供了一种用于推荐候选种子用户的方法,包括:获取包括用户的个人信息、用户的分享内容和关于用户之间的互动行为的数据,所述用户包括至少一个种子用户和至少一个候选用户;将所述数据输入到神经网络模型中,以得到用于表征所述用户的生产侧特征的生产侧向量和用于表征所述用户的消费侧特征的消费侧向量;针对所述至少一个候选用户中每个候选用户的生产侧向量构建向量检索服务;利用所述至少一个种子用户的生产侧向量,通过构建的向量检索服务,获得满足第一预定条件的候选用户作为第一候选种子用户;利用所述至少一个种子用户的消费侧向量,通过构建的向量检索服务,获得满足第二预定条件的候选用户作为第二候选种子用户;和推荐第一候选种子用户和第二候选种子用户作为结果候选种子用户。
6.根据本公开的第二方面,提供了一种用于推荐候选种子用户的装置,包括:存储器,其上存储有指令;和处理器,被配置为基于所述存储器上存储的指令,执行根据本公开所述的方法。
7.根据本公开的第三方面,提供了一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令在由处理器运行时,使所述处理器执行根据本公开所述的方法。
8.所述至少一个候选用户可以是每月发布分享内容的次数为4次以上的用户;以及所述至少一个种子用户可以是经人工选择的目标用户。
9.根据本公开的方法还可以利用获取的数据构建图网络作为用于所述神经网络模型的数据,包括:基于所述数据,获得所述用户作为第一节点,获得分享内容作为第二节点,以及获得互动行为作为边;利用获得的第一节点、第二节点和边来构建图网络;以及将构建的图网络作为数据输入到所述神经网络模型中,以得到所述用户的生产侧向量和消费侧向量,所述神经网络模型包括gcn(graph neural network,图卷积神经网络)模型。
10.关于用户之间的互动行为包括用户与其他用户之间的关于互动的直接行为和基于分享内容的间接行为;以及所述直接行为对应于单向边,而所述间接行为对应于双向边。
11.所述gcn模型可以包括graphsage(graph sample and aggregate,图采样和聚合)模型。
12.根据本公开的方法还包括对神经网络模型进行改进,在所述神经网络模型中,根据发布分享内容的行为更新生产侧向量,并且根据除发布分享内容以外的其他行为更新消费侧向量。
13.根据本公开的方法可以对所述数据进行数据预处理,并将预处理后的数据用于所述神经网络模型,所述数据预处理包括:针对所述用户,删除其中用户的互动行为次数小于预定最小次数和大于预定最大次数的所述用户;针对分享内容,根据关于除发布分享内容以外的其他行为的次数的排序,删除其中排序结果不满足预定排序条件的分享内容;和针对互动行为,在互动行为次数大于预定次数的情况下,对互动行为进行随机删除处理,使得随机删除处理后的互动行为次数达预定次数。
14.根据本公开的方法还可以包括:存储所述用户的生产侧向量和消费侧向量;和以天级别为单位地更新所述用户的生产侧向量和消费侧向量。
15.在前述用于获得推荐候选种子用户的步骤中,所述第一预定条件是在利用所述至少一个种子用户的生产侧向量执行所述向量检索服务之后检索结果位于前5%的向量所对应的候选用户;以及所述第二预定条件是在利用所述至少一个种子用户的消费侧向量执行所述向量检索服务之后检索结果位于前5%的向量所对应的候选用户。
16.根据本公开的方法还可以对第一用候选种子户和第二候选种子用户进行数据处理,并且将处理后的用户作为结果候选种子用户,所述数据处理包括删除在第一候选种子用户和第二候选种子用户中满足以下特定条件的用户,所述特定条件包括:所述用户被其他用户举报达预定频率;所述用户的异常分享内容占比达预定比例;和所述用户被识别为虚假用户。
17.通过以下参照附图对本公开的示例性实施例的详细描述,本技术的其他特征及其优点将会变得更为清楚。
附图说明
18.构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本技术的原理。
19.参照附图,根据下面的详细描述,可以更加清楚地理解本技术,其中:
20.图1示出了根据本公开的一个示例性实施例的候选种子用户推荐方法的流程图。
21.图2示出了根据本公开的一个示例性实施例的候选种子用户推荐装置的框图。
22.图3示出了根据本公开的一个示例性实施例的模型训练单元的框图。
23.图4示出了根据本公开的一个示例性实施例的推荐处理单元的框图。
24.图5示出了graphsage模型的聚合过程的示意图。
25.图6示出了可以实现根据本公开的实施例的计算设备的示例性配置。
具体实施方式
26.下面将参考附图来详细描述本技术的优选的实施例。不是本技术必需的细节和功能被省略,以便不会混淆本技术的理解。
27.以下对至少一个示例性实施例的描述实际上仅是说明性的,而不作为对本公开及其应用或使用的任何限制。
28.请注意,类似的参考数字和字母指的是图中的类似的项目,因而一旦在一幅图中定义了一个项目,就不需要在之后的图中讨论了。
29.在本公开中,术语“第一”、“第二”等仅被用来在元件或步骤之间进行区分,而并不意图表示时间顺序、优先级或重要性。
30.图1示出了根据本公开的一个示例性实施例的候选种子用户推荐方法的流程图。如图1所示,根据本公开的候选种子用户推荐方法可以包括步骤s101~s106,并且可以由候选种子用户推荐装置执行。
31.在步骤s101,获取包括用户的个人信息、用户的分享内容和关于用户之间的互动行为的数据,其中,用户可以包括至少一个种子用户和至少一个候选用户。
32.种子用户可以是经过人工选择的目标用户,而候选用户可以是每月发布分享内容的次数为4次以上的用户。注意,经验参数4有利于有效筛选候选用户并且能够显著节约计算性能。
33.用户的分享内容可以包括关于文本、图片、声音和视频中的至少一种。
34.关于用户之间的互动行为可以包括用户与其他用户之间的关于互动的直接行为和基于分享内容的间接行为,其中,直接行为可以包括例如私聊、关注和资料点击等中的至少一项,而间接行为包括例如发布分享内容、点赞、评论、分享、收藏和分享图像点击等中的至少一项。
35.另外,在进一步的实施例中,根据本公开的候选种子用户推荐方法还可以对获取的数据进行数据预处理,并将预处理后的数据用于根据本公开的改进的神经网络模型(在下文中,将结合图5详细描述),其中,数据预处理可以包括:针对用户,删除其中用户的互动行为次数小于预定最小次数(例如,一个月内互动行为次数为5次)和大于预定最大次数(例如,一个月内互动行为次数为5000次)的用户;针对分享内容,根据关于除发布分享内容以外的其他行为的次数的排序,删除其中排序结果不满足预定排序条件(例如,除发布以外其他行为次数的排序不能达到排序结果的80%)的分享内容;和针对互动行为,在互动行为次数大于预定次数(例如,5000次)的情况下,对互动行为进行随机删除处理,使得随机删除处理后的互动行为次数达预定次数。注意,预处理中的经验参数有利于进一步有效筛选候选用户并且能够显著节约计算性能。
36.另外,可进一步的实施例中,根据本公开的候选种子用户推荐方法还可以利用获取的数据构建网络图,并将构建的网络图作为数据用于改进的神经网络模型。具体而言,基于上述获取的数据,获得用户作为第一节点,获得分享内容作为第二节点,以及获得互动行为作为边,其中,直接行为对应于单向边,而间接行为对应于双向边;利用获得的第一节点、第二节点和边来构建图网络;以及将构建的图网络作为数据以用于改进的神经网络模型。此外,第一节点也称为用户节点,用户节点使用用户基础信息特征、用户发布特征和用户互动行为特征作为节点的特征;第二节点也称为帖子节点,帖子节点使用帖子类目信息作为节点特征。
37.此外,可选地,可以对获取的数据进行上述数据预处理,然后利用预处理后的数据构建网络图作为数据用于改进的神经网络模型。
38.在步骤102,将数据输入到改进的神经网络模型中,以得到用于表征用户的生产侧特征的生产侧向量和用于表征用户的消费侧特征的消费侧向量。在改进的神经网络模型中,可以根据发布分享内容的行为更新生产侧向量,并且根据除发布分享内容以外的其他行为更新消费侧向量。此外,改进的神经网络模型可以包括改进的gcn模型。此外,改进的gcn模型包括改进的graphsage模型。在下文中,将结合图5以graphsage模型为例进一步详细描述根据本公开的改进的神经网络模型。
39.另外,在进一步的实施例中,根据本公开的候选种子用户推荐方法还可以包括将通过上述方法得到的用户的生产侧向量和消费侧向量存储在记录介质中,优选地,存储在redis存储系统。
40.另外,在进一步的实施例中,根据本公开的候选种子用户推荐方法还可以包括以天级别为单位地更新(存储的)用户的生产侧向量和消费侧向量。
41.在步骤103,针对至少一个候选用户中的每个候选用户的生产侧向量构建向量检索服务。优选地,构建向量检索服务可以包括例如构建用于至少一个候选用户的生产侧向量的加权向量。
42.在步骤104,利用至少一个种子用户的生产侧向量,通过构建的向量检索服务,获得满足第一预定条件的候选用户作为第一候选种子用户。第一预定条件可以是在利用至少一个种子用户的生产侧向量执行向量检索服务之后检索结果位于前5%的向量所对应的候选用户。注意,此处设定的阈值越高,检索精度越高;设定的阈值越低,覆盖范围越大,阈值为5%时有利于获得高精度且大范围的检索结果。步骤104有利于利用种子用户的生产侧向量获得候选用户中与种子用户生产特征相似的候选用户。
43.在步骤105,利用所述至少一个种子用户的消费侧向量,通过构建的向量检索服务,获得满足第二预定条件的候选用户作为第二候选种子用户。第二预定条件可以是在利用至少一个种子用户的消费侧向量执行向量检索服务之后检索结果位于前5%的向量所对应的候选用户。注意,此处设定的阈值越高,检索精度越高;设定的阈值越低,覆盖范围越大,阈值为5%时有利于获得高精度且大范围的检索结果。步骤105有利于利用种子用户的消费侧向量获得候选用户中种子用户喜欢对其进行消费的候选用户。
44.在步骤106,推荐在步骤104获得的第一候选种子用户和在步骤105获得的第二候选种子用户作为结果候选种子用户。
45.另外,在进一步的实施例中,根据本公开的候选种子用户推荐方法还可以包括对通过上述步骤获得的第一候选种子用户和第二候选种子用户进行数据处理,并且将处理后的用户作为结果候选种子用户。其中,数据处理可以包括删除在通过上述步骤获得的第一候选种子用户和第二候选种子用户中满足以下特定条件的用户,特定条件包括:用户被其他用户举报达预定频率(例如,1个月内被举报30次以上);用户的异常分享内容占比达预定比例(例如,人工审核不通过比例超过30%);和用户被识别为虚假用户(例如,盗图或虚假人设用户)。
46.注意,在目前的推荐广场中,优质创作者是打造内容生态的最重要的基础,然而通过现有的推荐方法推荐出的创作者数量较少,因此缺乏有效推荐创作者的方法,针对这一问题,根据本公开的技术可以进一步考虑用户在生产和消费分享内容方面所表现出的差异性,从而有效识别出更多的优质创作者,以便对这些创作者提供流量供给,可以帮助提升这
些创作者的留存,也能提升其他用户的浏览体验,最终促进广场的内容生态发展。
47.图2示出了根据本公开的一个示例性实施例的候选种子用户推荐装置的框图。
48.如图2所示,根据本公开的候选种子用户推荐装置20可以包括模型训练单元201和推荐处理单元202,可以执行上述结合图1描述的候选种子用户推荐方法。以下,将结合图3对模型训练单元201进行详细说明,并结合图4对推荐处理单元202进行详细说明。
49.另外,根据本公开的候选种子用户推荐装置20可以包括存储器和处理器,用于执行结合图1描述的候选种子用户推荐方法。
50.图3示出了根据本公开的一个示例性实施例的模型训练单元201的框图。
51.如图3所示,模型训练单元201可以包括训练数据获取模块301、模型训练模块302和结果输出模块303。
52.训练数据获取模块301可以包括数据获取模块3011,并且可选地还可以包括数据预处理模块3012和数据构图模块3013中的至少一个。
53.通过数据获取模块3011,训练数据获取模块301可以获取包括用户的个人信息、用户的分享内容和关于用户之间的互动行为的数据,并将获取的数据以及预先得到的生产侧向量和消费侧向量作为训练数据。
54.用户可以包括至少一个种子用户和至少一个候选用户。种子用户可以是经过人工选择的目标用户,而候选用户可以是每月发布分享内容的次数为4次以上的用户。注意,经验参数4有利于有效筛选候选用户并且能够显著节约计算性能。
55.用户的分享内容可以包括关于文本、图片、声音和视频中的至少一种。
56.关于用户之间的互动行为可以包括用户与其他用户之间的关于互动的直接行为和基于分享内容的间接行为,其中,直接行为可以包括例如私聊、关注和资料点击等中的至少一项,而间接行为包括例如发布分享内容、点赞、评论、分享、收藏和分享图像点击等中的至少一项。
57.另外,在进一步的实施例中,通过数据预处理模块3012,训练数据获取模块301还可以对获取的数据进行数据预处理,并将预处理后的数据作为训练数据用于根据本公开的改进的神经网络模型,其中,数据预处理可以包括:针对用户,删除其中用户的互动行为次数小于预定最小次数(例如,一个月内互动行为次数为5次)和大于预定最大次数(例如,一个月内互动行为次数为5000次)的用户;针对分享内容,根据关于除发布分享内容以外的其他行为的次数的排序,删除其中排序结果不满足预定排序条件(例如,除发布以外其他行为次数的排序不能达到排序结果的80%)的分享内容;和针对互动行为,在互动行为次数大于预定次数(例如,5000次)的情况下,对互动行为进行随机删除处理,使得随机删除处理后的互动行为次数达预定次数。注意,预处理中的经验参数有利于进一步有效筛选候选用户并且能够显著节约计算性能。
58.另外,在进一步的实施例中,通过数据构图模块3013,训练数据获取模块301还可以利用获取的数据构建网络图,并将构建的网络图作为训练数据用于改进的神经网络模型。具体而言,基于上述获取的数据,获得用户作为第一节点,获得分享内容作为第二节点,以及获得互动行为作为边,其中,直接行为对应于单向边,而间接行为对应于双向边;利用获得的第一节点、第二节点和边来构建图网络;以及将构建的图网络作为数据以用于改进的神经网络模型。此外,第一节点也称为用户节点,用户节点使用用户基础信息特征、用户
发布特征和用户互动行为特征作为节点的特征;第二节点也称为帖子节点,帖子节点使用帖子类目信息作为节点特征。
59.此外,可选地,可以对获取的数据进行上述数据预处理,然后利用预处理后的数据构建网络图作为数据用于改进的神经网络模型。改进的神经网络模型可以包括改进的gcn模型(例如,graphsage模型)。
60.通过模型训练模块302,可以利用训练数据对改进的神经网络进行训练,优选地,进行模型离线训练。具体而言,模型训练单元201可以将从训练数据获取模块301得到的训练数据输入到改进的神经网络模型中进行训练,以获得用于表征用户的生产侧特征的生产侧向量和用于表征用户的消费侧特征的消费侧向量。在改进的神经网络模型中,可以根据发布分享内容的行为更新生产侧向量,并且根据除发布分享内容以外的其他行为更新消费侧向量。此外,改进的神经网络模型可以包括改进的gcn模型。此外,改进的gcn模型包括改进的graphsage模型。在下文中,将结合图5以graphsage模型为例进一步详细描述根据本公开的改进的神经网络模型。
61.结果输出模块303可以诸如向接下来将结合图3描述的推荐处理单元202,输出从模型训练模块302得到的结果,包括用户的生产侧向量3031和消费侧向量3032。
62.另外,在进一步的实施例中,模型训练单元201还可以包括数据存储模块(未示出),通过该数据存储模块可以将通过上述方法生成的生产侧向量和消费侧向量存储在记录介质中,优选地,存储在redis存储系统。
63.另外,在进一步的实施例中,模型训练单元201还可以包括数据更新模块(未示出),通过该数据更新模块可以以天级别为单位地更新(存储的)用户的生产侧向量和消费侧向量。
64.图4示出了根据本公开的一个示例性实施例的推荐处理单元202的框图。
65.如图4所示,推荐处理单元202可以包括结果获取模块401、向量检索模块402和结果推荐模块403。
66.结果获取模块401可以为推荐处理单元202从模型训练单元201获取例如至少一个种子用户的生产侧向量和消费侧向量以及至少一个候选用户的生产侧向量和消费侧向量。
67.其中,种子用户可以是经过人工选择的目标用户,而候选用户可以是每月发布分享内容的次数为4次以上的用户。注意,经验参数4有利于有效筛选候选用户并且能够显著节约计算性能。
68.向量检索模块402可以针对至少一个候选用户中的每个候选用户的生产侧向量构建向量检索服务,然后利用获取的至少一个种子用户的生产侧向量和消费侧向量,通过构建的检索服务,获得满足预定条件的候选用户。
69.优选地,构建向量检索服务可以包括例如构建用于至少一个候选用户中的每个候选用户的生产侧向量的加权向量。
70.具体而言,向量检索模块402可以利用至少一个种子用户的生产侧向量,通过构建的向量检索服务,获得满足第一预定条件的候选用户作为第一候选种子用户。第一预定条件可以是在利用至少一个种子用户的生产侧向量执行向量检索服务之后检索结果位于前5%的向量所对应的候选用户。注意,此处设定的阈值越高,检索精度越高;设定的阈值越低,覆盖范围越大,阈值为5%时有利于获得高精度且大范围的检索结果。这有利于利用种
子用户的生产侧向量获得候选用户中与种子用户生产特征相似的候选用户。
71.此外,向量检索模块402可以利用所述至少一个种子用户的消费侧向量,通过构建的向量检索服务,获得满足第二预定条件的候选用户作为第二候选种子用户。第二预定条件可以是在利用至少一个种子用户的消费侧向量执行向量检索服务之后检索结果位于前5%的向量所对应的候选用户。注意,此处设定的阈值越高,检索精度越高;设定的阈值越低,覆盖范围越大,阈值为5%时有利于获得高精度且大范围的检索结果。这有利于利用种子用户的消费侧向量获得候选用户中种子用户喜欢对其进行消费的候选用户。
72.结果推荐模块403可以推荐从向量检索模块402获得的第一候选种子用户和第二候选种子用户(检索结果)作为结果候选种子用户。
73.另外,在进一步的实施例中,结果推荐模块403还可以对上述检索结果进行数据处理,并且将处理后的用户作为结果候选种子用户。其中,数据处理可以包括删除在通过上述向量检索模块402获得的第一候选种子用户和第二候选种子用户中满足以下特定条件的用户,特定条件包括:用户被其他用户举报达预定频率(例如,1个月内被举报30次以上);用户的异常分享内容占比达预定比例(例如,人工审核不通过比例超过30%);和用户被识别为虚假用户(例如,盗图或虚假人设用户)。
74.图5示出了graphsage模型的聚合过程的示意图。
75.首先,参考图5中的(a),对邻居进行随机采样,每一跳抽样的邻居数不多于sk个。第一跳(k=1)采集了3个邻居,第二跳(k=2)采集了5个邻居。例如,图5中的邻居节点包含用户节点和分享内容节点。
76.然后,参考图3中的(b),生成目标节点的向量(embedding),先聚合二跳邻居的特征,生成一跳邻居的向量,再聚合一跳邻居的向量,生成目标节点的向量。在根据本公开的改进的神经网络模型(例如,graphsage模型)中,对于用户节点保留2个向量(即生产侧向量和消费侧向量),在采样聚合用户节点向量时,从发布行为对应的邻居节点(例如,分享内容节点)的向量更新该用户节点的生产侧向量,从除发布以外的其他行为对应的邻居节点(例如,分享内容节点和用户节点)的向量更新该用户节点的消费侧向量。
77.最后,参考图5中的(c),将目标节点的向量输入全连接网络得到目标节点的预测值。注意,与现有的神经网络模型相比,根据本公开的改进的神经网络模型可以提供生产侧向量和消费侧向量两者,以便更好地挖掘目标用户。
78.图6示出了可以实现根据本技术的实施例的计算设备的示例性配置。计算设备是可以应用本技术的上述方面的硬件设备的实例。计算设备可以是被配置为执行处理和/或计算的任何机器。计算设备可以是但不限制于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数据助手(pda)、智能电话、车载计算机或以上组合。
79.如图6所示,计算设备可以包括可能经由一个或多个接口与总线601连接或通信的一个或多个元件。总线601可以包括但不限于,工业标准架构(industry standard architecture,isa)总线、微通道架构(micro channel architecture,mca)总线、增强isa(eisa)总线、视频电子标准协会(vesa)局部总线、以及外设组件互连(pci)总线等。计算设备可以包括例如一个或多个处理器602、一个或多个输入设备603、以及一个或多个输出设备604。一个或多个处理器602可以是任何种类的处理器,并且可以包括但不限于一个或多个通用处理器或专用处理器(诸如专用处理芯片)。输入设备603可以是能够向计算设备输
入信息的任何类型的输入设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或远程控制器。输出设备604可以是能够呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。
80.计算设备还可以包括或被连接至非暂态存储设备607,该非暂态存储设备607可以是任何非暂态的并且可以实现数据存储的存储设备,并且可以包括但不限于盘驱动器、光存储设备、固态存储器、软盘、柔性盘、硬盘、磁带或任何其他磁性介质、压缩盘或任何其他光学介质、缓存存储器和/或任何其他存储芯片或模块、和/或计算机可以从其中读取数据、指令和/或代码的其他任何介质。计算设备还可以包括随机存取存储器(ram)605和只读存储器(rom)606。rom 606可以以非易失性方式存储待执行的程序、实用程序或进程。ram 605可提供易失性数据存储,并存储与计算设备的操作相关的指令。计算设备还可包括耦接至数据链路609的网络/总线接口608。网络/总线接口608可以是能够启用与外部装置和/或网络通信的任何种类的设备或系统,并且可以包括但不限于调制解调器、网络卡、红外线通信设备、无线通信设备和/或芯片集(诸如蓝牙
tm
设备、1302.11设备、wifi设备、wimax设备、蜂窝通信设施等)。
81.可单独地或以任何组合方式来使用前述实施方案的各个方面、实施方案、具体实施或特征。可由软件、硬件或硬件与软件的组合来实现前述实施方案的各个方面。
82.例如,前述实施方案可体现为记录介质(例如,计算机可读存储介质)上记录的计算机可读指令。记录介质为可存储数据的任何数据存储设备,所述数据其后可由计算机系统读取。记录介质的示例包括只读存储器、随机存取存储器、cd-rom、dvd、磁带、硬盘驱动器、固态驱动器和光学数据存储设备。记录介质还可分布在网络耦接的计算机系统中使得计算机可读指令以分布式方式来存储和执行。
83.例如,前述实施方案可采用硬件电路的形式。硬件电路可以包括组合式逻辑电路、时钟存储设备(诸如软盘、触发器、锁存器等)、有限状态机、诸如静态随机存取存储器或嵌入式动态随机存取存储器的存储器、定制设计电路、可编程逻辑阵列等的任意组合。
84.在一个实施方案中,可以通过用诸如verilog或vhdl的硬件描述语言(hdl)编码电路描述来实现根据本公开的硬件电路。可以针对给定集成电路制造技术设计的单元库合成hdl描述,并可以出于定时、功率和其他原因修改,以获得最终的设计数据库,可以将最终的设计数据库传输到工厂以通过半导体制造系统生产集成电路。半导体制造系统可通过(例如在可包括掩膜的晶片上)沉积半导体材料、移除材料、改变所沉积材料的形状、(例如通过掺杂材料或利用紫外处理修改介电常数)对材料改性等等来生产集成电路。集成电路可以包括晶体管并还可以包括其他电路元件(例如,诸如电容器、电阻器、电感器等无源元件)以及晶体管和电路元件之间的互连。一些实施方案可以实现耦接在一起的多个集成电路,以实现硬件电路,和/或可以在一些实施方案中使用离散元件。
85.虽然已通过示例详细展示了本技术的一些具体实施例,但是本领域技术人员应当理解,上述示例仅意图是说明性的而不限制本技术的范围。应该认识到的是,前述方法中的一些步骤不一定按照图示的顺序执行,而是它们可以被同时、以不同顺序或以重叠方式执行。此外,本领域技术人员可以根据需要增加一些步骤或省略一些步骤。前述系统中的一些部件不是必须按照图示的布置,本领域技术人员可以根据需要增加一些部件或省略一些部件。本领域技术人员应该理解,上述实施例可以在不脱离本公开的范围和实质的情况下被
修改。本公开的范围是通过所附的权利要求限定的。
技术特征:
1.一种用于推荐候选种子用户的方法,包括:获取包括用户的个人信息、用户的分享内容和关于用户之间的互动行为的数据,所述用户包括至少一个种子用户和至少一个候选用户;将所述数据输入到神经网络模型中,以得到用于表征所述用户的生产侧特征的生产侧向量和用于表征所述用户的消费侧特征的消费侧向量;针对所述至少一个候选用户中每个候选用户的生产侧向量构建向量检索服务;利用所述至少一个种子用户的生产侧向量,通过构建的向量检索服务,获得满足第一预定条件的候选用户作为第一候选种子用户;利用所述至少一个种子用户的消费侧向量,通过构建的向量检索服务,获得满足第二预定条件的候选用户作为第二候选种子用户;和推荐第一候选种子用户和第二候选种子用户作为结果候选种子用户。2.根据权利要求1所述的方法,其中,所述至少一个候选用户是每月发布分享内容的次数为4次以上的用户;以及所述至少一个种子用户是经人工选择的目标用户。3.根据权利要求1所述的方法,其中,基于所述数据,获得所述用户作为第一节点,获得分享内容作为第二节点,以及获得互动行为作为边;利用获得的第一节点、第二节点和边来构建图网络;以及将构建的图网络作为数据输入到所述神经网络模型中,以得到所述用户的生产侧向量和消费侧向量,所述神经网络模型包括图卷积神经网络gcn模型。4.根据权利要求3所述的方法,其中,关于用户之间的互动行为包括用户与其他用户之间的关于互动的直接行为和基于分享内容的间接行为;以及所述直接行为对应于单向边,而所述间接行为对应于双向边。5.根据权利要求1或3所述的方法,其中,在所述神经网络模型中,根据发布分享内容的行为更新生产侧向量,并且根据除发布分享内容以外的其他行为更新消费侧向量。6.根据权利要求1或3所述的方法,其中,对所述数据进行数据预处理,并将预处理后的数据用于所述神经网络模型,所述数据预处理包括:针对所述用户,删除其中用户的互动行为次数小于预定最小次数和大于预定最大次数的所述用户;针对分享内容,根据关于除发布分享内容以外的其他行为的次数的排序,删除其中排序结果不满足预定排序条件的分享内容;和针对互动行为,在互动行为次数大于预定次数的情况下,对互动行为进行随机删除处理,使得随机删除处理后的互动行为次数达预定次数。7.根据权利要求1或3所述的方法,其中,所述第一预定条件是在利用所述至少一个种子用户的生产侧向量执行所述向量检索服务之后检索结果位于前5%的向量所对应的候选用户;以及
所述第二预定条件是在利用所述至少一个种子用户的消费侧向量执行所述向量检索服务之后检索结果位于前5%的向量所对应的候选用户。8.根据权利要求1或3所述的方法,还包括:对第一候选种子用户和第二候选种子用户进行数据处理,并且将处理后的用户作为结果候选种子用户,所述数据处理包括删除在第一候选种子用户和第二候选种子用户中满足以下特定条件的用户,所述特定条件包括:所述用户被其他用户举报达预定频率;所述用户的异常分享内容占比达预定比例;和所述用户被识别为虚假用户。9.一种用于推荐候选种子用户的装置,包括:存储器,其上存储有指令;和处理器,被配置为基于所述存储器上存储的指令,执行根据权利要求1至8中的任意一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令在由处理器运行时,使所述处理器执行根据权利要求1至8中的任意一项所述的方法。
技术总结
本申请涉及用于推荐候选种子用户的方法和装置。一种用于推荐候选种子用户的方法,包括:获取包括用户的个人信息、用户的分享内容和关于用户之间的互动行为的数据,所述用户包括至少一个种子用户和至少一个候选用户;将数据输入到神经网络模型中,以得到用于表征所述用户的生产侧特征的生产侧向量和消费侧特征的消费侧向量;针对候选用户的生产侧向量构建向量检索服务;利用种子用户的生产侧向量,通过构建的向量检索服务,获得满足第一预定条件的候选用户作为第一候选种子用户;利用种子用户的消费侧向量,通过构建的向量检索服务,获得满足第二预定条件的候选用户作为第二候选种子用户;和推荐第一和第二候选种子用户作为结果候选种子用户。结果候选种子用户。结果候选种子用户。
技术研发人员:顾茂杰 张璐 陶明
受保护的技术使用者:上海任意门科技有限公司
技术研发日:2023.05.17
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
