帖子推荐方法及系统与流程
未命名
07-20
阅读:131
评论:0
1.本发明涉及人工智能技术领域,尤其涉及一种帖子推荐方法及系统。
背景技术:
2.随着互联网时代到来,已逐步进入信息爆炸的时代。如何将海量的帖子推荐给合适的对象,是企业面临的重大难题。同时,对于个体而言,如何从庞大的互联网数据中选择自己需要的信息,也是用户面临的问题。在这样的背景下,推荐系统得以迅速发展。
3.现有技术中,推荐系统中帖子的推荐方式往往是将新生成的帖子或热门度高的帖子推荐给用户,从而忽视用户的实际使用体验及用户的主观能动性,导致推荐结果精度低。
技术实现要素:
4.本发明提供一种帖子推荐方法及系统,用以解决现有技术中推荐结果精度低的缺陷,实现自动精准地进行帖子推荐。
5.本发明提供一种帖子推荐方法,包括:
6.在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
7.基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
8.基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子
9.根据本发明提供的一种帖子推荐方法,所述基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,包括:
10.基于所述用户群体中第一用户对第一目标帖子的行为数据,确定所述第一用户对所述第一目标帖子的推荐分数;
11.基于所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定各所述第二用户对所述第一目标帖子的推荐分数;
12.基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与所述第一用户相似度最大的第二用户。
13.根据本发明提供的一种帖子推荐方法,所述基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与
所述第一用户相似度最大的第二用户,包括:
14.基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述第一用户与各所述第二用户之间的欧几里得距离;
15.确定所述用户群体中最小的所述欧几里得距离对应的所述第二用户为与所述第一用户相似度最大的第二用户。
16.根据本发明提供的一种帖子推荐方法,所述行为数据中包括评价文本信息及顶踩标识;
17.所述推荐分数是通过以下步骤确定的:
18.提取所述评价文本信息中的程度副词及情感分词,基于所述程度副词及所述情感分词对所述评价文本信息进行打分,得到第一分数;
19.确定所述顶踩标识匹配的第二分数;
20.基于所述第一分数及所述第二分数,得到推荐分数。
21.根据本发明提供的一种帖子推荐方法,所述基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,包括:
22.基于用户对各所述类别标签下的帖子的行为数据,确定用户对各所述类别标签下的帖子的感兴趣程度;
23.基于用户对所述类别标签下的帖子的感兴趣程度,对所述推荐系统中的用户进行群体划分,得到至少一个用户群体。
24.根据本发明提供的一种帖子推荐方法,还包括:
25.在所述推荐系统中的用户数量不大于所述预设阈值的情况下,基于所述推荐系统中第三用户对第三目标帖子的行为数据及所述推荐系统中各第四用户对所述第三目标帖子的行为数据,确定所述推荐系统中与所述第三用户相似度最大的第四用户,所述第四用户为所述用户群体中除所述第三用户之外的用户,所述第三目标帖子为所述第三用户及所述第四用户共同浏览过的帖子;
26.基于所述相似度最大的第四用户对至少一篇第四目标帖子的行为数据,从所述至少一篇第四目标帖子中选取出第二推荐帖子,并将所述第二推荐帖子推荐给所述第三用户,所述第四目标帖子为所述第四用户浏览过,但所述第三用户未浏览过的帖子。
27.本发明还提供一种帖子推荐系统,包括:
28.划分模块,用于在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
29.第一确定模块,用于基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
30.第一推荐模块,用于基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览
过的帖子。
31.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述帖子推荐方法。
32.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述帖子推荐方法。
33.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述帖子推荐方法。
34.本发明提供的帖子推荐方法及系统,通过一方面对推荐系统中的帖子打上类别标签,使得用户可以根据类别标签快速定位到其感兴趣的帖子上,另一方面,在用户数量过多时,先通过用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据将海量的用户划分成至少一个用户群体,接着再分别根据各用户群体中的第一用户及第二用户对共同浏览过的帖子的行为数据,从用户群体中选出与第一用户相似度最大的第二用户,最后再根据相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从至少一篇第二目标帖子中选取出第一推荐帖子,并将第一推荐帖子推荐给第一用户,由此提高了推荐结果的精度。
附图说明
35.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
36.图1是本发明提供的帖子推荐方法的流程示意图;
37.图2是本发明提供的帖子推荐系统的结构示意图;
38.图3是本发明提供的电子设备的结构示意图。
具体实施方式
39.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
40.图1是本发明提供的帖子推荐方法的流程示意图。下面结合图1描述本发明的帖子推荐方法。如图1所示,该方法包括:步骤101、步骤102及步骤103。
41.步骤101,在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
42.其中,用户数量指代在推荐系统中注册了的用户账号的数量,推荐系统在接收到用户的注册请求时,会为该用户分配一个相应的用户账号,通过所统计的用户账号的数量既可以确定推荐系统的用户数量。
43.预设阈值是预先根据经验值设置好的,可以理解地,为了提高推荐系统的帖子推送效率,本实施例中预先根据推荐系统中的用户数量确定推送策略,即当用户数量大于预设阈值时,则先对推荐系统中的用户进行群体划分,将海量的用户划分成若干个用户特征相似的用户群体,接着再根据用户群体内各用户的行为数据对该用户群体内的用户进行帖子推荐。
44.进一步地,当用户数量小于或等于预设阈值时,则直接以推荐系统中各用户的行为数据对该推荐系统内的用户进行帖子推荐。
45.其中,类别标签可以包括两个维度的子标签,一个是话题子标签,也即该帖子所描述的话题类别,例如电影、书籍、旅游景点、生活琐事、职场生活等等,另一个是该话题子标签下的类别子标签,例如:类别标签“最热电影”中包括了话题子标签“电影”和类别子标签“最热”、类别标签“最新书籍”中包括了话题子标签“书籍”和类别子标签“最新”、类别标签“情侣生活琐事”中包括了话题子标签“生活琐事”和类别子标签“情侣
”…
46.在一个示例中,获取标记了话题子标签和类别子标签的测试帖子数据集,使用该测试帖子数据集中的测试帖子对lda(latent dirichlet allocation,文档主题生成模型)进行训练,得到训练好的lda,如此将帖子中的文本数据输入至训练好的lda中,即可得到该帖子匹配的类别标签。
47.本实施例中,通过用户所浏览的帖子的行为数据及该帖子的类别标签,可以生成多个预设维度的用户画像标签,通过该用户画像标签即可分析出该用户的偏好,其中,可选地,行为数据包括但不限于:浏览时长、浏览次数、评论文本信息、顶踩标识、分享标识、收藏标识等,对此不作限制。
48.进一步地,在一个示例中,为了提高推荐结果的丰富性,将用户划分至该用户所具备的用户画像标签对应的用户群体内,例如:用户1具备用户画像标签a、b及c,用户2具备用户画像标签b及e,则用户1被划分至用户画像标签a对应的用户群体a内、用户画像标签b对应的用户群体b内、用户画像标签c对应的用户群体c内,用户2被划分至用户画像标签b对应的用户群体b内、用户画像标签e对应的用户群体e内。
49.步骤102,基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
50.在一个示例中,可以通过行为数据确定出第一用户和第二用户之间的皮尔逊相关系数,将最大的皮尔逊相关系数对应的第二用户作为与第一用户相似度最大的第二用户。
51.在另一个示例中,还可以通过行为数据确定出第一用户和第二用户之间的欧几里得距离,将欧几里得距离最小对应的第二用户作为与第一用户相似度最大的第二用户。
52.进一步地,为了确保推荐结果的精准性,需要确定第一用户及所述第二用户共同浏览过的帖子的数量是否小于预设的最低数据阈值,若小于,则从第一用户所浏览的帖子及第二用户所浏览的帖子中选取出若干个帖子对,其中,帖子对中包括属于用一个类别标签,且帖子的文本数据之间的相似度达到预设相似度阈值的第一帖子及第二帖子,第一帖子为第一用户所浏览的除第一目标帖子之外的帖子,第二帖子为第二用户所浏览的除第一目标帖子之外的帖子。
53.需要说明的是,本实施例中的确定两个文本数据之间的相似度采用现有技术,例如采用“基于语义的中文文本关键词提取(ske)算法”提取出文件数据中的候选关键词,或者通过“基于朴素贝叶斯模型的中文关键词提取算法”提取出文件数据中的候选关键词,之后再通过每个文本中的候选关键词计算出文本之间的相似度。
54.步骤103,基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。
55.其中,行为数据包括但不限于:浏览时长、浏览次数、评论文本信息、顶踩标识、分享标识、收藏标识等,对此不作限制。
56.本实施例中,第一推荐帖子可以是基于所有的行为数据选取出的,还可以仅是根据行为数据中的部分数据选取出的。
57.例如,在一个示例中,根据行为数据中的顶踩标识、分享标识及收藏标识对该第二目标帖子进行打分,比如在第二目标帖子的行为数据中存在顶踩标识时,根据顶踩标识的类别为其赋分(顶踩标识为点赞时,为其赋值+a分,在顶踩标识为点踩时,为其赋值-b分),在第二目标帖子的行为数据中存在分享标识时,根据其分享的次数i为其赋值+i分,在第二目标帖子的行为数据中存在收藏标识时,为其赋值+c分,最后根据以上几个维度的打分,确定该第二目标帖子的总分值,最后选取总分值最高的第二目标帖子作为第一推荐帖子,或者选取总分值排名前预设名次的第二目标帖子作为第一推荐帖子。
58.本实施例提出的帖子推荐方法,一方面对推荐系统中的帖子打上类别标签,使得用户可以根据类别标签快速定位到其感兴趣的帖子上,另一方面,在用户数量过多时,先通过用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据将海量的用户划分成至少一个用户群体,接着再分别根据各用户群体中的第一用户及第二用户对共同浏览过的帖子的行为数据,从用户群体中选出与第一用户相似度最大的第二用户,最后再根据相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从至少一篇第二目标帖子中选取出第一推荐帖子,并将第一推荐帖子推荐给第一用户,由此本发明先通过用户的浏览数据将海量用户划分到不同的用户群体内,再通过帖子的行为数据从该用户群体内选取出与第一用户最相似的第二用户,最后再通过帖子的行为数据从第二用户浏览过,但第一用户未浏览过的帖子中选取出第一推荐帖子,如此使用用户对帖子的行为数据进行层层筛选,提高了推荐结果的精度。
59.在一些实施例中,所述基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,包括:
60.基于用户对各所述类别标签下的帖子的行为数据,确定用户对各所述类别标签下的帖子的感兴趣程度;
61.基于用户对所述类别标签下的帖子的感兴趣程度,对所述推荐系统中的用户进行群体划分,得到至少一个用户群体。
62.在一个示例中,行为数据包括6个预设行为维度下的数据:浏览时长、浏览次数、评论文本信息、顶踩标识、分享标识及收藏标识,本实施例中,预先设定好各行为维度下的兴趣分数的评分规则,比如:
63.针对浏览时长,预先划分好多个时长区间及各时长区间对应的预设兴趣分数,例
如1分:(0,t1],2分:(t1,t2]
…
64.针对浏览次数,规定每浏览一次加1分。
65.针对评论文本信息,提取评价文本信息中的程度副词及情感分词,基于程度副词及情感分词对评价文本信息进行打分。
66.针对顶踩标识,规定顶踩标识为点赞时,为其赋值+1分,在顶踩标识为点踩时,为其赋值-1分。
67.针对分享标识,规定每分享一次加1分。
68.针对收藏标识,规定该帖子被收藏时,加1分。
69.在一个示例中,预先将感兴趣程度划分为第一程度等级、第二程度等级及第三程度等级,且每个等级所对应的兴趣分数不同,则可以先通过累加各预设行为维度下的兴趣分数,来确定用户对该帖子的总兴趣分数,之后通过各类别标签下的每一篇帖子的总兴趣分数,来确定用户对该类别标签的帖子的加权平均兴趣分数,最后通过用户对每个类别标签下的帖子的加权平均兴趣分数,来确定出用户对该类别标签的帖子的感兴趣程度,进而根据用户对各类别标签的帖子的感兴趣程度来确定用户的用户画像标签。
70.可选地,处于用一个用户群体中的用户的用户画像标签可以都相同,也可以仅具备至少一个相同的用户画像标签,对此不作限制。
71.例如,预先设置好的类别标签包括a、b、c,用户1的用户画像标签:a-第一程度等级、b-第一程度等级、c-第三程度等级,用户2的用户画像标签:a-第二程度等级、b-第一程度等级、c-第三程度等级、用户3的用户画像标签:a-第一程度等级、b-第一程度等级、c-第三程度等级,用户4对各类别标签下的帖子的感兴趣程度依次为:a-第二程度等级、b-第一程度等级、c-第三程度等级,则可以将用户1及用户3划分至同一个用户群体,将用户2及用户4划分至同一个用户群体。
72.进一步地,在一些应用场景中,为了提高帖子推荐的精准度,所预设的类别标签的数量也较多,则为了提高用户群体的划分效率,规定使用感兴趣程度达到最低预设程度等级对应的类别标签来作为用户的用户画像标签,比如规定最低预设程度为第二程度等级,则针对以上4个用户,用户1的用户画像标签:c-第三程度等级,用户2的用户画像标签:a-第二程度等级、c-第三程度等级,用户3的用户画像标签:c-第三程度等级,用户4的用户画像标签:a-第二程度等级、c-第三程度等级.
73.本实施例提出的帖子推荐方法,通过基于用户对各类别标签下的帖子的行为数据,将用户划分成若干个用户群体,由于同一个用户群体中的用户之间存在相似的用户画像标签,因此用户所感兴趣的帖子也比较相似,由此一方面减少了后续帖子推荐的计算量,另一方面又提高了后续帖子推荐结果的精准度。
74.在一些实施例中,所述基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,包括:
75.基于所述用户群体中第一用户对第一目标帖子的行为数据,确定所述第一用户对所述第一目标帖子的推荐分数;
76.基于所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定各所述第二用户对所述第一目标帖子的推荐分数;
77.基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与所述第一用户相似度最大的第二用户。
78.本实施例中,推荐分数可以是根据行为数据中的全部数据确定的,还可以是根据行为数据中的部分数据确定的。
79.例如,在一个示例中,行为数据中包括评价文本信息及顶踩标识;则推荐分数是通过以下步骤确定的:
80.提取所述评价文本信息中的程度副词及情感分词,基于所述程度副词及所述情感分词对所述评价文本信息进行打分,得到第一分数;
81.确定所述顶踩标识匹配的第二分数;
82.基于所述第一分数及所述第二分数,得到推荐分数。
83.具体地,对评价文本信息进行分词,得到若干个词组,接着将词组依次与预先的词典中设置的词汇进行匹配,根据匹配结果提取出该评价文本信息中的程度副词及情感分词,最后再根据预设的打分规则得到第一分数。
84.在一个示例中,当顶踩标识为点赞时,为其赋值+a分,在顶踩标识为点踩时,为其赋值-b分,如此得到第二分数。
85.本实施中在得到第一用户及第二用户对第一目标帖子的推荐分数后,可以通过欧几里得距离来确定两个用户之间的相似度,还可以通过余弦相似度来确定两个用户之间的相似度,对此不作限制。
86.在一个示例中,基于第一用户对第一目标帖子的推荐分数与各第二用户对第一目标帖子的推荐分数,确定第一用户与各第二用户之间的欧几里得距离;确定用户群体中最小的欧几里得距离对应的第二用户为与第一用户相似度最大的第二用户。
87.进一步地,为了确保用户匹配结果的准确性,本实施例中,可以先计算出第一用户和第二用户对每一个第一目标帖子的推荐分数之间的分差,之后确定若干个分差之间的波动趋势,由于余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异,而欧几里得距离的正是数值上的差异性,因此当波动趋势比较平稳的情况下,采用余弦相似度来确定用户之间的相似度,当波动趋势比较大的情况下,采用欧式距离来确定用户之间的相似度。
88.在一些实施例中,所述方法还包括:
89.在所述推荐系统中的用户数量不大于所述预设阈值的情况下,基于所述推荐系统中第三用户对第三目标帖子的行为数据及所述推荐系统中各第四用户对所述第三目标帖子的行为数据,确定所述推荐系统中与所述第三用户相似度最大的第四用户,所述第四用户为所述用户群体中除所述第三用户之外的用户,所述第三目标帖子为所述第三用户及所述第四用户共同浏览过的帖子;
90.基于所述相似度最大的第四用户对至少一篇第四目标帖子的行为数据,从所述至少一篇第四目标帖子中选取出第二推荐帖子,并将所述第二推荐帖子推荐给所述第三用户,所述第四目标帖子为所述第四用户浏览过,但所述第三用户未浏览过的帖子。
91.本实施例中,当推荐系统的用户数量比较少时,为了确保推荐结果的全面性,将直接以推荐系统中各用户的行为数据对该推荐系统内的用户进行帖子推荐。
92.需要说明的是,本实施例中的第二推荐帖子的选取步骤与上述实施例中的第一推
荐帖子的选取步骤一致,在此不再赘述。
93.下面对本发明提供的帖子推荐系统进行描述,下文描述的帖子推荐系统与上文描述的帖子推荐方法可相互对应参照。
94.如图2所示,本技术实施例提供一种帖子推荐系统,该系统包括:划分模块210,用于在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;第一确定模块220,用于基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;第一推荐模块230,用于基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。
95.本实施例中一方面对推荐系统中的帖子打上类别标签,使得用户可以根据类别标签快速定位到其感兴趣的帖子上,另一方面,在用户数量过多时,先通过用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据将海量的用户划分成至少一个用户群体,接着再分别根据各用户群体中的第一用户及第二用户对共同浏览过的帖子的行为数据,从用户群体中选出与第一用户相似度最大的第二用户,最后再根据相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从至少一篇第二目标帖子中选取出第一推荐帖子,并将第一推荐帖子推荐给第一用户,由此本发明先通过用户的浏览数据将海量用户划分到不同的用户群体内,再通过帖子的行为数据从该用户群体内选取出与第一用户最相似的第二用户,最后再通过帖子的行为数据从第二用户浏览过,但第一用户未浏览过的帖子中选取出第一推荐帖子,如此使用用户对帖子的行为数据进行层层筛选,提高了推荐结果的精度。
96.在一些实施例中,第一确定模块,还用于基于所述用户群体中第一用户对第一目标帖子的行为数据,确定所述第一用户对所述第一目标帖子的推荐分数;基于所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定各所述第二用户对所述第一目标帖子的推荐分数;基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与所述第一用户相似度最大的第二用户。
97.在一些实施例中,第一确定模块,还用于基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述第一用户与各所述第二用户之间的欧几里得距离;确定所述用户群体中最小的所述欧几里得距离对应的所述第二用户为与所述第一用户相似度最大的第二用户。
98.在一些实施例中,所述行为数据中包括评价文本信息及顶踩标识;第一确定模块,还用于提取所述评价文本信息中的程度副词及情感分词,基于所述程度副词及所述情感分词对所述评价文本信息进行打分,得到第一分数;确定所述顶踩标识匹配的第二分数;基于所述第一分数及所述第二分数,得到推荐分数。
99.在一些实施例中,划分模块,还用于基于用户对各所述类别标签下的帖子的行为数据,确定用户对各所述类别标签下的帖子的感兴趣程度;基于用户对所述类别标签下的帖子的感兴趣程度,对所述推荐系统中的用户进行群体划分,得到至少一个用户群体。
100.在一些实施例中,所述装置还包括:第二确定模块,用于在所述推荐系统中的用户数量不大于所述预设阈值的情况下,基于所述推荐系统中第三用户对第三目标帖子的行为数据及所述推荐系统中各第四用户对所述第三目标帖子的行为数据,确定所述推荐系统中与所述第三用户相似度最大的第四用户,所述第四用户为所述用户群体中除所述第三用户之外的用户,所述第三目标帖子为所述第三用户及所述第四用户共同浏览过的帖子;第二推荐模块,用于基于所述相似度最大的第四用户对至少一篇第四目标帖子的行为数据,从所述至少一篇第四目标帖子中选取出第二推荐帖子,并将所述第二推荐帖子推荐给所述第三用户,所述第四目标帖子为所述第四用户浏览过,但所述第三用户未浏览过的帖子。
101.图3示例了一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(communications interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行帖子推荐方法,该方法包括:
102.在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
103.基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
104.基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。
105.此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
106.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的帖子推荐方法,该方法包括:
107.在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的
帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
108.基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
109.基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。
110.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的帖子推荐方法,该方法包括:
111.在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;
112.基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;
113.基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。
114.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
115.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
116.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种帖子推荐方法,其特征在于,包括:在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。2.根据权利要求1所述的帖子推荐方法,其特征在于,所述基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,包括:基于所述用户群体中第一用户对第一目标帖子的行为数据,确定所述第一用户对所述第一目标帖子的推荐分数;基于所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定各所述第二用户对所述第一目标帖子的推荐分数;基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与所述第一用户相似度最大的第二用户。3.根据权利要求2所述的帖子推荐方法,其特征在于,所述基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述用户群体中与所述第一用户相似度最大的第二用户,包括:基于所述第一用户对所述第一目标帖子的推荐分数与各所述第二用户对所述第一目标帖子的推荐分数,确定所述第一用户与各所述第二用户之间的欧几里得距离;确定所述用户群体中最小的所述欧几里得距离对应的所述第二用户为与所述第一用户相似度最大的第二用户。4.根据权利要求2所述的帖子推荐方法,其特征在于,所述行为数据中包括评价文本信息及顶踩标识;所述推荐分数是通过以下步骤确定的:提取所述评价文本信息中的程度副词及情感分词,基于所述程度副词及所述情感分词对所述评价文本信息进行打分,得到第一分数;确定所述顶踩标识匹配的第二分数;基于所述第一分数及所述第二分数,得到推荐分数。5.根据权利要求1所述的帖子推荐方法,其特征在于,所述基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,包括:基于用户对各所述类别标签下的帖子的行为数据,确定用户对各所述类别标签下的帖子的感兴趣程度;
基于用户对所述类别标签下的帖子的感兴趣程度,对所述推荐系统中的用户进行群体划分,得到至少一个用户群体。6.根据权利要求1所述的帖子推荐方法,其特征在于,还包括:在所述推荐系统中的用户数量不大于所述预设阈值的情况下,基于所述推荐系统中第三用户对第三目标帖子的行为数据及所述推荐系统中各第四用户对所述第三目标帖子的行为数据,确定所述推荐系统中与所述第三用户相似度最大的第四用户,所述第四用户为所述用户群体中除所述第三用户之外的用户,所述第三目标帖子为所述第三用户及所述第四用户共同浏览过的帖子;基于所述相似度最大的第四用户对至少一篇第四目标帖子的行为数据,从所述至少一篇第四目标帖子中选取出第二推荐帖子,并将所述第二推荐帖子推荐给所述第三用户,所述第四目标帖子为所述第四用户浏览过,但所述第三用户未浏览过的帖子。7.一种帖子推荐系统,其特征在于,包括:划分模块,用于在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对所述推荐系统中的用户进行群体划分,得到至少一个用户群体,所述浏览数据包括用户所浏览的帖子的类别标签及用户对所浏览的帖子的行为数据,所述类别标签是基于所述帖子中的文本数据对所述帖子进行分类得到的,所述类别标签为预先设置好的标签;第一确定模块,用于基于所述用户群体中第一用户对第一目标帖子的行为数据及所述用户群体中各第二用户对所述第一目标帖子的行为数据,确定所述用户群体中与所述第一用户相似度最大的第二用户,所述第二用户为所述用户群体中除所述第一用户之外的用户,所述第一目标帖子为所述第一用户及所述第二用户共同浏览过的帖子;第一推荐模块,用于基于所述相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从所述至少一篇第二目标帖子中选取出第一推荐帖子,并将所述第一推荐帖子推荐给所述第一用户,所述第二目标帖子为所述第二用户浏览过,但所述第一用户未浏览过的帖子。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述帖子推荐方法。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述帖子推荐方法。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述帖子推荐方法。
技术总结
本发明提供一种帖子推荐方法及系统,包括:在推荐系统中的用户数量大于预设阈值的情况下,基于用户的浏览数据对推荐系统中的用户进行群体划分,得到至少一个用户群体;基于用户群体中第一用户对第一目标帖子的行为数据及用户群体中各第二用户对第一目标帖子的行为数据,确定用户群体中与第一用户相似度最大的第二用户,第二用户为用户群体中除第一用户之外的用户,第一目标帖子为第一用户及第二用户共同浏览过的帖子;基于相似度最大的第二用户对至少一篇第二目标帖子的行为数据,从至少一篇第二目标帖子中选取出第一推荐帖子,并将第一推荐帖子推荐给第一用户,第二目标帖子为第二用户浏览过,但第一用户未浏览过的帖子,由此提高推荐结果精度。由此提高推荐结果精度。由此提高推荐结果精度。
技术研发人员:王梓欣
受保护的技术使用者:中银金融科技有限公司
技术研发日:2023.03.14
技术公布日:2023/7/18
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
