推荐内容处理方法、装置、设备和存储介质与流程

未命名 08-14 阅读:113 评论:0


1.本公开涉及计算机技术领域,尤其涉及一种推荐内容处理方法、装置、设备和存储介质。


背景技术:

2.目前,为了节省用户的输入成本,提高输入效率,从而提高后续业务效率,一些应用程序提供了根据用户已有输入内容来预测用户将要输入的内容,并将其推荐给用户的功能。
3.但是,因为用户已有输入内容很可能存在输入错误的情况,使得推荐给用户的内容与用户想要输入的内容之间的相关性差。并且,在用户错误输入内容较长的情况下,除了相关性差的问题,还会使得推荐给用户的内容不足,最终导致推荐内容的准确率低。


技术实现要素:

4.为了解决上述技术问题,本公开提供了一种推荐内容处理方法、装置、设备和存储介质。
5.第一方面,本公开提供了一种推荐内容处理方法,该方法包括:
6.接收输入框对应的输入内容;
7.若确定所述输入内容存在错误,则将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;
8.基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容。
9.第二方面,本公开提供了一种推荐内容处理装置,该装置包括:
10.输入内容接收模块,用于接收输入框对应的输入内容;
11.候选内容确定模块,用于若确定所述输入内容存在错误,则将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;
12.推荐内容确定模块,用于基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容。
13.第三方面,本公开提供了一种电子设备,该电子设备包括:
14.处理器;
15.存储器,用于存储可执行指令;
16.其中,处理器用于从存储器中读取可执行指令,并执行可执行指令以实现本公开任意实施例所说明的推荐内容处理方法。
17.第四方面,本公开提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开任意实施例所说明的推荐内容处理方法。
18.本公开实施例的推荐内容处理方法、装置、设备和存储介质,能够接收输入框对应的输入内容;在确定所述输入内容存在错误的情况下,将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容;扩展了针对纠错内容的内容匹配维度,从而在推荐内容中增加了基于纠错内容预测的第二候选内容,不仅提高了推荐内容的召回数量,并且提高了推荐内容与用户想要输入的内容之间的相关性,进而提高了推荐内容的准确性和推荐效率。
附图说明
19.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
20.图1为本公开实施例提供的一种推荐内容处理方法的流程图;
21.图2为图1示出的推荐内容处理方法中s130的细化流程图;
22.图3为本公开实施例提供的一种推荐内容处理装置的结构示意图;
23.图4为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
24.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
25.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
26.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一示例”表示“至少一个示例”;术语“另一示例”表示“至少一个另外的示例”;术语“一些实施例”表示“至少一些实施例”;术语“另一些实施例”表示“至少一些另外的实施例”。其他术语的相关定义将在下文描述中给出。
27.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
28.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
29.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
30.相关技术中,可以根据用户在输入过程中的已有输入内容来预测一些推荐内容呈现给用户,其主要是利用前缀匹配的方式对已有输入内容进行内容匹配与推荐。在已有输入内容出现错误时,会采用前缀匹配的方式对已有输入内容对应的纠错后的内容(称为纠
错内容)进行内容匹配与推荐。但是,在错误输入内容较长的情况下,上述实现方式会导致基于输入内容的推荐内容与用户想要输入的内容的相关性差,而基于纠错内容的推荐内容数量不足,最终导致推荐内容的准确性低、推荐效果差。
31.例如,搜索场景中,可以在用户输入搜索内容的过程中,通过下拉框或其他形式来展示推荐内容,既能方便用户快速键入其想要输入的内容,提升搜索效率,又能引导用户进行其他内容的搜索,扩展搜索宽度。但是,当用户输入的搜索内容为错误内容时,很可能出现推荐内容数量不足,且展示的推荐内容与用户想要输入的内容之间的相关较差的情况。可以理解的是,搜索场景仅仅是本公开技术方案的一种可选的应用场景,但并非唯一的应用场景。
32.基于上述情况,本公开实施例提供一种推荐内容处理方案,以实现利用输入内容及其对应的纠错内容分别进行多维度内容匹配,以获得基于输入内容预测的第一候选内容和基于纠错内容预测的第二候选内容,并由此生成推荐内容,一方面提高了推荐内容的召回数量,另一方面因扩展了基于纠错内容的候选召回而提升了推荐内容与用户输入意图之间的相关性,从而提高了推荐内容的准确性和推荐效果。
33.本公开实施例提供的推荐内容处理方法,可适用于在用户输入过程中向用户推荐预测的输入内容的场景中,例如可以适用于搜索过程中向用户推荐搜索词的场景,也可以适用于社交通信输入内容的过程中推荐候选输入词的场景等。该方法可以由推荐内容处理装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在具有一定计算能力的电子设备中,该电子设备例如可以是笔记本电脑、台式计算机、服务器等。
34.图1示出了本公开实施例提供的一种推荐内容处理方法的流程示意图。如图1所示,该推荐内容处理方法可以包括如下步骤:
35.s110、接收输入框对应的输入内容。
36.具体地,用户可以通过诸如搜索类应用程序或社交通信类应用程序等的输入框输入其想要执行的操作(如搜索、社交通信等)对应的内容。例如,用户可以通过输入框输入文本内容作为输入内容。这样,电子设备接收到该输入内容。
37.在一些实施例中,输入内容为向输入框中输入信息的过程中获得的内容。为了提高内容推荐的实时性和高效性,可以在用户键入输入内容的过程中,实时地获取输入框对应的输入内容,并执行后续推荐内容的生成流程。
38.s120、若确定输入内容存在错误,则将输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将输入内容对应的纠错内容与内容库中的数据进行多维度内容匹配,确定第二候选内容。
39.具体地,电子设备可以利用文本错误检测的相关模型(如语言模型、基于深度学习的模型等)对输入内容是否存在错误进行检测计算,以判断输入内容是否存在错误。
40.如果输入内容存在错误,那么相关技术中的推荐内容处理方式,因其是与错误的输入内容进行内容匹配的,故很容易导致召回的推荐内容相关性差、数量不足的问题。所以,电子设备可按照相关技术中的前缀匹配、语义匹配、真实前缀匹配、社交信息匹配等多种匹配维度中的至少两个维度的内容匹配方式,将输入内容与预先生成的、包含诸多候选内容的内容库中的数据(即上述各候选内容)进行匹配,以筛选出内容库中匹配成功的候选内容,作为输入内容对应的第一候选内容。
41.并且,电子设备可利用相关技术中的输入内容纠错方式,对输入内容进行纠错处理,得到输入内容对应的、大概率符合用户输入意图的、正确的纠错内容。电子设备再利用前缀匹配、语义匹配、真实前缀匹配、社交信息匹配等多种匹配维度中的至少两个维度的内容匹配方式,将纠错内容和内容库中的数据进行内容匹配,得到纠错内容对应的候选内容(即第二候选内容)。
42.上述前缀维度的内容匹配方式是按照输入内容的前缀进行内容匹配,以筛选出内容库中所有包含该同一前缀的候选内容,并由这些候选内容基于权重构建得到有序序列。在输入过程中获取输入内容的示例中,上述前缀可以理解为输入内容。例如,对于输入内容“香”,可匹配到候选内容“香蕉”、“香肠”和“香水”;若以一周内的搜索次数为权重,那么,在“香蕉”近一周搜索x次、“香肠”近一周搜索y次、“香水”近一周搜索z次,且假设x》y》z的情况下,上述前缀维度的内容匹配会在“香”前缀下顺序返回候选内容“香蕉”、“香肠”和“香水”。
43.上述语义维度的内容匹配方式是预先训练文本语义向量构建的相关模型和语义向量匹配的相关模型,利用文本语义向量构建的相关模型将输入内容转换为对应的文本向量,再利用语义向量匹配的相关模型,对输入内容的文本向量和候选内容的文本向量进行语义匹配,得到召回的候选内容。
44.上述真实前缀维度的内容匹配方式是将历史操作过程中输入过的前缀与最终的完整输入内容关联起来,在当前获得新的输入内容时,将该输入内容的前缀与上述关联关系中的前缀进行匹配,以召回对应的完整输入内容。例如,历史搜索过程中输入过如下前缀的序列:[x,xh,xha,xhat,chat,chaty,chat,chatg,chatgp,chatgpt],其最终的完整搜索内容为chatgpt,那么,上述序列中的每个前缀都会和完整搜索内容chatgpt关联起来。在当前获得新的搜索内容前缀为x或xha或chaty等时,均可召回chatgpt。
[0045]
上述社交信息维度的内容匹配方式是将输入内容与用户相关的社交信息进行内容匹配,以召回与输入内容匹配的社交信息。这里用户相关的社交信息可以是在用户授权同意获取其信息的前提下,获得的用户在站内/站外的好友、关注者、粉丝等社交关系的信息,如社交账号。例如:a用户关注了“周*伦”、“林*杰”、“蔡*坤”、“周*”,当输入内容为“周”时可召回“周*伦”、“周*”;当输入内容为“*伦”可召回“周*伦”等。
[0046]
在一些实施例中,对于输入内容为用户键入输入内容的过程中实时获得的内容的示例,上述多维度内容匹配至少包括前缀维度内容匹配、真实前缀内容匹配和语义维度内容匹配。这是因为用户实时输入的内容并非完整的输入内容,而是其前面部分的内容,故前缀维度的内容匹配方式所召回的候选内容与已有输入内容的适配程度更高。而语义维度能反映出已有输入内容在语义上的输入意图,从而可以召回在语义上更加符合用户意图的候选内容。这样,可以利用较少的内容匹配维度来召回准确性相对较高的候选内容,从而更好地均衡内容匹配速度、召回的候选内容的数量和内容匹配准确性。
[0047]
需要说明的是,如果输入内容不存在错误,则利用相关技术中的候选内容召回方式进行推荐内容的生成。例如,电子设备可以利用前缀匹配、语义匹配、真实前缀匹配、社交信息匹配等多种匹配维度的内容匹配方式,将输入内容与预先生成的、包含诸多候选内容的内容库中的数据(即上述各候选内容)进行匹配,以筛选出内容库中匹配成功的候选内容,作为推荐内容。
[0048]
s130、基于第一候选内容和第二候选内容,确定至少一个推荐内容。
[0049]
其中,推荐内容是推荐给用户的、预测的输入内容,其由候选内容确定。
[0050]
具体地,电子设备可以将第一候选内容和第二候选内容均作为推荐内容,以扩充基于纠错内容而召回的候选内容的数量,从而提高推荐内容与用户输入意图之间的相关性。电子设备也可以先对第一候选内容和第二候选内容进行一定的过滤处理,以尽量滤除其中相关性较差的候选内容,以在提升召回的推荐内容的数量的基础上,进一步提升推荐内容的相关性和准确性。
[0051]
在获得推荐内容之后,可直接将其推送至客户端,以显示在输入框周边的区域(即设定区域)中。例如,推荐内容以下拉列表或者悬浮窗口等形式显示在输入框的周边区域中,以供用户从中选择其想要输入的内容。
[0052]
本公开上述实施例提供的推荐内容处理方法,能够接收输入框对应的输入内容;在确定输入内容存在错误的情况下,将输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将输入内容对应的纠错内容与内容库中的数据进行多维度内容匹配,确定第二候选内容;基于第一候选内容和第二候选内容,确定至少一个推荐内容;扩展了针对纠错内容的内容匹配维度,从而在推荐内容中增加了基于纠错内容预测的第二候选内容,不仅提高了推荐内容的召回数量,并且提高了推荐内容与用户想要输入的内容之间的相关性,进而提高了推荐内容的准确性和推荐效率。
[0053]
在一些实施例中,在s130之后,推荐内容处理方法还包括:对各推荐内容进行去重和排序处理,确定处理后的推荐内容,处理后的推荐内容用于显示在输入框对应的设定区域。
[0054]
具体地,电子设备获得各推荐内容之后,为了提高推荐内容被选中的概率,从而提升推荐效果,可以对推荐内容进行去重和排序的处理。电子设备可以对各推荐内容中相似的内容进行去重处理,获得去重后的推荐内容。然后,根据去重后的推荐内容是否为历史操作中的输入内容、是否符合相关内容发布规范、是否对应有社交信息、是否输入当前时段的热搜词等中的至少一项,预测各去重后的推荐内容被选中的预估点击率,并用该预估点击率对各去重后的推荐内容进行排序处理,得到排序后的推荐内容。最后,电子设备可根据内容推荐业务中规定的推荐数量或设定区域的可显示数量,将排序后的推荐内容中排序靠前的相应数量的推荐内容推送至客户端,以显示在客户端的输入框的设定区域中。
[0055]
在一些实施例中,可以在生成第一候选内容和第二候选内容的基础上,增加对其进行过滤的相关内容,以过滤掉其中与输入内容的相关性较差、用户输入概率较小的候选内容,从而进一步提高推荐内容的准确性和推荐效果。如图2,为图1示出的推荐内容处理方法中s130的细化流程图。参见图2,s130“基于第一候选内容和第二候选内容,确定至少一个推荐内容”具体包括如下步骤:
[0056]
s231、将第一候选内容划分为第三候选内容和第四候选内容,并基于历史操作数据,分别确定第三候选内容和第四候选内容对应的操作总次数。
[0057]
其中,第三候选内容为第一候选内容中基于前缀维度内容匹配而得到的候选内容。第四候选内容为第一候选内容中除第三候选内容之外的候选内容。操作总次数是指各操作的次数的累加。这里的操作例如可以是搜索或者社交通信等。
[0058]
具体地,根据前述说明,对于输入内容预测,效率和准确性较高的召回方式是前缀维度的内容匹配。所以,本实施例中进行候选内容过滤时,将保留所有基于前缀维度的内容
匹配方式而召回的候选内容,而对非前缀维度的其他维度的内容匹配方式召回的候选内容进行过滤处理。基于此,电子设备可以将第一候选内容拆分为两部分,一部分是基于前缀维度的内容匹配方式而召回的第三候选内容,另一部分是基于非前缀维度的其他维度的内容匹配方式而召回的第四候选内容。
[0059]
另外,候选内容在操作中被选择与使用的次数越多,表明该候选内容的正确性更高。但是,考虑到单个候选内容的操作次数存在一定的波动性,其无法更好地反映出相应候选内容对应的参与匹配内容(如输入内容或纠错内容)的操作价值,故可采用某一内容匹配维度下的候选内容的操作总次数,以反映相应参与匹配内容的操作价值。基于此,电子设备可以利用一段时间内的历史操作数据,对第三候选内容中的每个候选内容的操作次数进行统计,以计算得到第三候选内容对应的操作总次数。同样方式,可计算获得第四候选内容对应的操作总次数。
[0060]
对于搜索场景,第三候选内容的操作总次数可以理解为基于输入内容进行前缀维度的召回而获得的候选内容的总搜索次数,第四候选内容的操作总次数可以理解为基于输入内容进行非前缀维度的召回而获得的候选内容的总搜索次数。
[0061]
s232、将第二候选内容划分为第五候选内容和第六候选内容,并基于历史操作数据,分别确定第五候选内容和第六候选内容对应的操作总次数。
[0062]
其中,第五候选内容为第二候选内容中基于前缀维度内容匹配而得到的候选内容,第六候选内容为第二候选内容中除第五候选内容之外的候选内容。
[0063]
具体地,参见上述s231的说明,电子设备可以将第二候选内容拆分为两部分,一部分是基于前缀维度的内容匹配方式而召回的第五候选内容,另一部分是基于非前缀维度的其他维度的内容匹配方式而召回的第六候选内容。
[0064]
对于搜索场景,第五候选内容的操作总次数可以理解为基于纠错内容进行前缀维度的召回而获得的候选内容的总搜索次数,第六候选内容的操作总次数可以理解为基于纠错内容进行非前缀维度的召回而获得的候选内容的总搜索次数。
[0065]
s233、基于第三候选内容对应的操作总次数、第四候选内容对应的操作总次数、第五候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,对第一候选内容和第二候选内容进行过滤处理,确定推荐内容。
[0066]
具体地,根据上述说明,操作总次数可以反映其候选内容对应的参与匹配内容的操作价值,从而反映该参与匹配内容的正确性。并且,输入内容和纠错内容存在互斥关系,如果输入内容正确,其对应的候选内容的操作总次数就较多,那么纠错内容便是错误的,其对应的候选内容的操作总次数就较少,反之亦然。所以,本实施例中可以第三候选内容对应的操作总次数和第四候选内容对应的操作总次数之间的数量关系,或者第五候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,或者第三候选内容对应的操作总次数、第四候选内容对应的操作总次数、第五候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,来进一步判断输入内容和纠错内容的正确性,以修正文本错误检测的相关模型的模型误差而导致的内容错误性误检测的问题,进而对第四候选内容和第六候选内容进行过滤。
[0067]
在一些实施例中,s323包括:若第三候选内容对应的操作总次数达到预设次数阈值,且第五候选内容对应的操作总次数未达到预设次数阈值,则剔除第四候选内容,将第三
候选内容和第二候选内容确定为推荐内容。
[0068]
其中,预设次数阈值是预先设置的操作次数的一个临界值,其用于表征不正确的内容的操作次数。例如,预设次数阈值可以设置为0或者其他较小的数值。
[0069]
具体地,如果第三候选内容对应的操作总次数达到预设次数阈值,而第五候选内容对应的操作总次数未达到预设次数阈值,则有较高的置信度说明输入内容是错误的、纠错内容是正确的,那么基于输入内容进行非前缀维度的召回而获得的第四候选内容为错误的推荐内容的概率也较大。所以,在该实施例的情况下,可以剔除第四候选内容,而将第三候选内容、第五候选内容和第六候选内容确定为推荐内容。
[0070]
在另一些实施例中,s232包括:若第三候选内容对应的操作总次数未达到预设次数阈值,且第五候选内容对应的操作总次数达到预设次数阈值,则剔除第六候选内容,将第一候选内容和第五候选内容确定为推荐内容。
[0071]
具体地,如果第三候选内容对应的操作总次数未达到预设次数阈值,而第五候选内容对应的操作总次数达到预设次数阈值,则有较高的置信度说明纠错内容是错误的、输入内容是正确的,那么基于纠错内容进行非前缀维度的召回而获得的第六候选内容为错误的推荐内容的概率也较大。所以,在该实施例的情况下,可以剔除第六候选内容,而将第三候选内容、第四候选内容和第五候选内容确定为推荐内容。
[0072]
在又一些实施例中,s232包括:若第三候选内容对应的操作总次数和第五候选内容对应的操作总次数均达到预设次数阈值或均未达到预设次数阈值,则基于第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,确定推荐内容。
[0073]
具体地,如果第三候选内容对应的操作总次数和第五候选内容对应的操作总次数均达到了预设次数阈值,则无法进一步确定输入内容和纠错内容正确与否。例如,基于输入的搜索词进行前缀召回的所有候选词的搜索总次数为0,基于纠错的搜索词进行前缀召回的所有候选词的搜索总次数也为0,说明历史时间段中针对这些候选词均未执行过搜索操作,无法反映出用户搜索意图是针对输入内容还是纠错内容,则无法判断两者的对错。同样地,如果第三候选内容对应的操作总次数和第五候选内容对应的操作总次数均未达到预设次数阈值,也无法进一步判断输入内容和纠错内容正确与否。在该情况下,电子设备可以进一步计算(如相减、相比等)输入内容和纠错内容分别对应的第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,以确定哪个参与匹配内容对应的操作总次数更多一些,并根据比较结果来确定对各候选内容的过滤规则,从而确定推荐内容。
[0074]
可选地,上述基于第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,确定推荐内容,包括:确定第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的较大者和较小者;若较大者与较小者的比值超过预设比值阈值,则从第一候选内容和第二候选内容中剔除较小者对应的候选内容,确定推荐内容。
[0075]
其中,预设比值阈值是预先设置的一个比值,其用于表征正确内容的操作次数和不正确内容的操作次数之间的数量关系。例如,预设比值阈值可以设置为大于1的数值。预设比值阈值设置的数值越大,后续过滤程度更大,召回的推荐内容的数量相对更少。
[0076]
具体地,因为第四候选内容和第六候选内容是利用非前缀维度的多个其他维度进行内容匹配而获得的候选内容,其数据量相对较大。如果采样相减的比较方式,那么操作总次数的差值可能在一个较大的取值范围内,将难以对其设置合适的阈值进行判断。所以,电
子设备可以比较第四候选内容对应的操作总次数和第六候选内容对应的操作总次数,确定出两者中的数值较大者和数值较小者。然后,计算数值较大者和数值较小者之间的比值,以将两者的数量关系限定在一个较小的数值范围内。然后,将该比值与预设比值阈值比较。
[0077]
如果该比值小于或等于预设比值阈值,说明数值较大者对应的候选内容的操作量和数值较小者对应的候选内容的操作量基本相当,无法判断输入内容和纠错内容的正确与否。那么可保留所有候选内容,即将第一候选内容和第二候选内容均作为推荐内容。
[0078]
如果该比值大于预设比值阈值,说明数值较大者对应的候选内容的操作量远大于数值较小者对应的候选内容的操作量,那么有较高的置信度说明数值较小者对应的参与匹配内容(输入内容或纠错内容)是错误的、数值较大者对应的另一参与匹配内容是正确的。如此,可从第四候选内容和第六候选内容中剔除数值较小者对应的候选内容,第一候选内容和第二候选内容中剩余的候选内容则均作为推荐内容。
[0079]
通过上述对候选内容进行过滤的各实施例的设置,可以利用各匹配维度对应的用户操作行为的统计数据关系,对非前缀维度召回的候选内容进行过滤,以保留前缀维度召回的候选内容的基础上,进一步滤除相关性较差的候选内容的透出,从而更进一步地提高推荐内容的准确性。
[0080]
以下是本发明实施例提供的推荐内容处理装置的实施例,该装置与上述各实施例的推荐内容处理方法属于同一个发明构思,在推荐内容处理装置的实施例中未详尽描述的细节内容,可以参考上述推荐内容处理方法的实施例。
[0081]
图3示出了本公开实施例提供的一种推荐内容处理装置的结构示意图。如图3所示,该推荐内容处理装置300可以包括:
[0082]
输入内容接收模块310,用于接收输入框对应的输入内容;
[0083]
候选内容确定模块320,用于若确定输入内容存在错误,则将输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将输入内容对应的纠错内容与内容库中的数据进行多维度内容匹配,确定第二候选内容;
[0084]
推荐内容确定模块330,用于基于第一候选内容和第二候选内容,确定至少一个推荐内容。
[0085]
本公开上述实施例提供的推荐内容处理装置,能够接收输入框对应的输入内容;在确定输入内容存在错误的情况下,将输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将输入内容对应的纠错内容与内容库中的数据进行多维度内容匹配,确定第二候选内容;基于第一候选内容和第二候选内容,确定至少一个推荐内容;扩展了针对纠错内容的内容匹配维度,从而在推荐内容中增加了基于纠错内容预测的第二候选内容,不仅提高了推荐内容的召回数量,并且提高了推荐内容与用户想要输入的内容之间的相关性,进而提高了推荐内容的准确性和推荐效率。
[0086]
在一些实施例中,推荐内容确定模块330包括:
[0087]
第一操作总次数确定子模块,用于将第一候选内容划分为第三候选内容和第四候选内容,并基于历史操作数据,分别确定第三候选内容和第四候选内容对应的操作总次数;其中,第三候选内容为第一候选内容中基于前缀维度内容匹配而得到的候选内容,第四候选内容为第一候选内容中除第三候选内容之外的候选内容;
[0088]
第二操作总次数确定子模块,用于将第二候选内容划分为第五候选内容和第六候
选内容,并基于历史操作数据,分别确定第五候选内容和第六候选内容对应的操作总次数;其中,第五候选内容为第二候选内容中基于前缀维度内容匹配而得到的候选内容,第六候选内容为第二候选内容中除第五候选内容之外的候选内容;
[0089]
推荐内容确定子模块,用于基于第三候选内容对应的操作总次数、第四候选内容对应的操作总次数、第五候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,对第一候选内容和第二候选内容进行过滤处理,确定推荐内容。
[0090]
在一些实施例中,推荐内容确定子模块具体用于:
[0091]
若第三候选内容对应的操作总次数达到预设次数阈值,且第五候选内容对应的操作总次数未达到预设次数阈值,则剔除第四候选内容,将第三候选内容和第二候选内容确定为推荐内容;
[0092]
或者,若第三候选内容对应的操作总次数未达到预设次数阈值,且第五候选内容对应的操作总次数达到预设次数阈值,则剔除第六候选内容,将第一候选内容和第五候选内容确定为推荐内容。
[0093]
在另一些实施例中,推荐内容确定子模块还具体用于:
[0094]
若第三候选内容对应的操作总次数和第五候选内容对应的操作总次数均达到预设次数阈值或均未达到预设次数阈值,则基于第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的数量关系,确定推荐内容。
[0095]
进一步地,推荐内容确定子模块具体用于:
[0096]
确定第四候选内容对应的操作总次数和第六候选内容对应的操作总次数之间的较大者和较小者;
[0097]
若较大者与较小者的比值超过预设比值阈值,则从第一候选内容和第二候选内容中剔除较小者对应的候选内容,确定推荐内容。
[0098]
在一些实施例中,输入内容为向输入框中输入信息的过程中获得的内容。
[0099]
在一些实施例中,推荐内容处理装置300还包括后处理模块,用于:
[0100]
在基于第一候选内容和第二候选内容,确定至少一个推荐内容之后,对各推荐内容进行去重和排序处理,确定处理后的推荐内容,处理后的推荐内容用于显示在输入框对应的设定区域。
[0101]
本发明实施例所提供的推荐内容处理装置可执行本发明任意实施例所提供的推荐内容处理方法,具备执行方法相应的功能模块和有益效果。
[0102]
值得注意的是,上述推荐内容处理装置的实施例中,所包括的各个模块和子模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块/子模块的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。
[0103]
本公开实施例还提供了一种电子设备,该电子设备可以包括处理器和存储器,存储器可以用于存储可执行指令。其中,处理器可以用于从存储器中读取可执行指令,并执行可执行指令以实现上述实施例中的推荐内容处理方法。
[0104]
图4示出了本公开实施例提供的一种电子设备的结构示意图。
[0105]
如图4所示,该电子设备400可以包括处理装置401(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(rom)402中的程序或者从存储装置408加载到随机访问
存储器(ram)403中的程序而执行各种适当的动作和处理。在ram 403中,还存储有电子设备400操作所需的各种程序和数据。处理装置401、rom 402以及ram 403通过总线404彼此相连。输入/输出接口(i/o接口)405也连接至总线404。
[0106]
通常,以下装置可以连接至i/o接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。
[0107]
需要说明的是,图4示出的电子设备400仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。即虽然图4示出了具有各种装置的电子设备400,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
[0108]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从rom 402被安装。在该计算机程序被处理装置401执行时,执行本公开任意实施例的推荐内容处理方法中限定的上述功能。
[0109]
本公开实施例还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开任意实施例中的推荐内容处理方法。
[0110]
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
[0111]
在一些实施方式中,客户端、服务器可以利用诸如http之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
[0112]
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未
装配入该电子设备中。
[0113]
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行本公开任意实施例所说明的推荐内容处理方法的步骤。
[0114]
在本公开实施例中,可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0115]
附图中的流程图和框图,图示了按照本公开各种实施例的设备、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0116]
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
[0117]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0118]
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
[0119]
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所
示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
[0120]
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

技术特征:
1.一种推荐内容处理方法,其特征在于,包括:接收输入框对应的输入内容;若确定所述输入内容存在错误,则将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容,包括:将所述第一候选内容划分为第三候选内容和第四候选内容,并基于历史操作数据,分别确定所述第三候选内容和所述第四候选内容对应的操作总次数;其中,所述第三候选内容为所述第一候选内容中基于前缀维度内容匹配而得到的候选内容,所述第四候选内容为所述第一候选内容中除所述第三候选内容之外的候选内容;将所述第二候选内容划分为第五候选内容和第六候选内容,并基于所述历史操作数据,分别确定所述第五候选内容和所述第六候选内容对应的操作总次数;其中,所述第五候选内容为所述第二候选内容中基于前缀维度内容匹配而得到的候选内容,所述第六候选内容为所述第二候选内容中除所述第五候选内容之外的候选内容;基于所述第三候选内容对应的操作总次数、所述第四候选内容对应的操作总次数、所述第五候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之间的数量关系,对所述第一候选内容和所述第二候选内容进行过滤处理,确定所述推荐内容。3.根据权利要求2所述的方法,其特征在于,所述基于所述第三候选内容对应的操作总次数、所述第四候选内容对应的操作总次数、所述第五候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之间的数量关系,对所述第一候选内容和所述第二候选内容进行过滤处理,确定所述推荐内容,包括:若所述第三候选内容对应的操作总次数达到预设次数阈值,且所述第五候选内容对应的操作总次数未达到所述预设次数阈值,则剔除所述第四候选内容,将所述第三候选内容和所述第二候选内容确定为所述推荐内容;或者,若所述第三候选内容对应的操作总次数未达到所述预设次数阈值,且所述第五候选内容对应的操作总次数达到所述预设次数阈值,则剔除所述第六候选内容,将所述第一候选内容和所述第五候选内容确定为所述推荐内容。4.根据权利要求2或3所述的方法,其特征在于,所述基于所述第三候选内容对应的操作总次数、所述第四候选内容对应的操作总次数、所述第五候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之间的数量关系,对所述第一候选内容和所述第二候选内容进行过滤处理,确定所述推荐内容,包括:若所述第三候选内容对应的操作总次数和所述第五候选内容对应的操作总次数均达到所述预设次数阈值或均未达到所述预设次数阈值,则基于所述第四候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之间的数量关系,确定所述推荐内容。5.根据权利要求4所述的方法,其特征在于,所述基于所述第四候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之间的数量关系,确定所述推荐内容,包括:确定所述第四候选内容对应的操作总次数和所述第六候选内容对应的操作总次数之
间的较大者和较小者;若所述较大者与所述较小者的比值超过预设比值阈值,则从所述第一候选内容和所述第二候选内容中剔除所述较小者对应的候选内容,确定所述推荐内容。6.根据权利要求1所述的方法,其特征在于,所述输入内容为向输入框中输入信息的过程中获得的内容。7.根据权利要求1所述的方法,其特征在于,在所述基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容之后,所述方法还包括:对各所述推荐内容进行去重和排序处理,确定处理后的推荐内容,所述处理后的推荐内容用于显示在所述输入框对应的设定区域。8.一种推荐内容处理装置,其特征在于,包括:输入内容接收模块,用于接收输入框对应的输入内容;候选内容确定模块,用于若确定所述输入内容存在错误,则将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;推荐内容确定模块,用于基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容。9.一种电子设备,其特征在于,包括:处理器;存储器,用于存储可执行指令;其中,所述处理器用于从所述存储器中读取所述可执行指令,并执行所述可执行指令以实现上述权利要求1-7中任一项所述的推荐内容处理方法。10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,当所述计算机程序被处理器执行时,使得处理器实现上述权利要求1-7中任一项所述的推荐内容处理方法。

技术总结
本公开涉及一种推荐内容处理方法、装置、设备和存储介质。其中,推荐内容处理方法包括:接收输入框对应的输入内容;若确定所述输入内容存在错误,则将所述输入内容和内容库中的数据进行多维度内容匹配,确定第一候选内容,并将所述输入内容对应的纠错内容与所述内容库中的数据进行多维度内容匹配,确定第二候选内容;基于所述第一候选内容和所述第二候选内容,确定至少一个推荐内容。如此,扩展了针对纠错内容的内容匹配维度,从而在推荐内容中增加了基于纠错内容预测的第二候选内容,不仅提高了推荐内容的召回数量,并且提高了推荐内容与用户想要输入的内容之间的相关性,进而提高了推荐内容的准确性和推荐效率。推荐内容的准确性和推荐效率。推荐内容的准确性和推荐效率。


技术研发人员:薛博凡
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:2023.05.23
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐