用于使用自然语言搜索生成广告弹性模型的系统和方法与流程

未命名 08-15 阅读:100 评论:0

用于使用自然语言搜索生成广告弹性模型的系统和方法
1.相关申请的交叉引用
2.本技术要求基恩决策系统公司(keen decision systems,inc.)于2020年10月12日提交的、题为“systems and methods for generating an advertising-elasticity model using natural-language search”的美国临时专利申请63/090,361的优先权,其通过引用整体并入本文。
技术领域
3.本发明涉及用于使用自然语言搜索生成广告弹性模型的系统和方法。更具体地,本发明涉及生成映射函数,该映射函数将用户提供的搜索词映射到现有的规范数据,以根据用户提供的搜索词提供广告弹性的估计。


背景技术:

4.在市场营销中,有许多不同的方式来投资营销资金,并且在可供广告商和广告活动使用的营销媒体类型上有持续快速发展的创新。随着这些营销媒体类型的新创新不断发展,由于缺乏与其有效性相关的先验数据,很难预测这些新创新的有效性。
5.广告弹性的概念是指衡量特定广告投资的有效性。建议的广告策略的广告弹性估计可以使用贝叶斯(bayesian)统计模型来确定,该模型包含了广告弹性的先前估计。建议的行动过程的广告弹性可以计算为基于先前广告弹性估计的概率分布。然而,这种方法的一个问题是,对广告弹性的先前估计不一定考虑到未来营销策略和目前估计广告弹性的已知营销策略之间的差异。
6.因此,需要一种方法来对给定的未知策略产生广告弹性的预先估计,该方法要考虑到当前策略的已知情况。


技术实现要素:

7.目前公开的主题通过提供用于使用自然语言搜索生成广告弹性模型的系统和方法来解决上述问题。
8.本文描述的系统和方法允许用户使用自然语言术语描述广告活动,然后确定用户广告活动的概率分配并将用户广告活动的概率分配提供给与广告弹性相关的现有规范数据。基于用户广告活动的这种确定的概率分配,本文所述的系统和方法向用户提供了代表广告活动总体预期效益的广告弹性估计。
9.公开了一种使用自然语言搜索确定广告弹性估计的方法。该方法包括接收用户提供的自然语言搜索词以用于查询规范数据库。规范数据库包括规范数据。规范数据包括平均值、标准差值以及存储在规范数据库中的一个或多个广告变量的多个现有标签。该方法还包括通过分析规范数据中的多个现有标签来基于规范数据推导映射函数,以确定将多个现有标签映射到与规范数据相关联的规范主题集的函数,使得规范主题集表示规范数据库中多个现有标签的变化。该方法还包括将推导的映射函数应用于用户提供的自然语言搜索
词。用户提供的自然语言搜索词作为推导的映射函数的输入。该方法还包括基于推导的映射函数从用户提供的自然语言搜索词生成映射的用户主题集。该方法还包括使用相似度函数确定一个或多个广告变量中至少一个的相似度值。广告变量的相似度值表示映射的用户主题集和与广告变量相关的规范主题集之间的相似度。该方法还包括基于确定的广告变量的相似值、平均值和标准差值,推导用户提供的自然语言搜索词的广告弹性估计。
10.在本文公开的方法的一个实施例中,用户提供的自然语言搜索词表示广告活动。
11.在本文公开的方法的一个实施例中,用户提供的自然语言搜索词通过网络接收。
12.在本文公开的方法的一个实施例中,用户提供的自然语言搜索词由用户通过图形用户界面提供。
13.在本文公开的方法的一个实施例中,规范数据库包括关系数据库。
14.在本文公开的方法的一个实施例中,映射函数通过使用奇异值分解分析规范数据中的标签而推导。
15.在本文公开的方法的一个实施例中,映射函数通过使用非负矩阵分解分析规范数据中的标签而推导。
16.在本文公开的方法的一个实施例中,映射函数通过使用潜在的狄利克雷分析分析规范数据中的标签而推导。
17.在本文公开的方法的一个实施例中,映射的用户主题集对应于与规范数据相关联的规范主题集。在其他实施例中,映射的用户主题集与和规范数据相关联的规范主题集不匹配。
18.在本文公开的方法的一个实施例中,相似度函数将映射的用户主题集和规范主题集作为输入,并将相似度值作为输出返回,相似度值测量映射的用户主题集和规范主题集之间的相似度。
19.在本文公开的方法的一个实施例中,相似度函数对输入执行余弦相似度分析。
20.在本文公开的方法的一个实施例中,相似度函数对输入执行反转的欧氏距离分析。
21.在本文公开的方法的一个实施例中,广告弹性的估计使用规范数据库中广告变量的平均值和标准差值推导,根据确定的广告变量相似度值对广告变量的平均值和标准差值进行加权。
22.在本文公开的方法的一个实施例中,广告弹性的估计计算为加权平均,加权平均使用多个广告变量中的每个的平均值和标准差值对规范数据库中的多个广告变量进行。
23.在本文公开的方法的一个实施例中,广告弹性的估计通过合计多个平均值和标准偏差值计算。
24.在本文公开的方法的一个实施例中,广告弹性的推导估计表示基于用户提供的自然语言搜索词的广告活动的广告弹性。
附图说明
25.图1描述了规范数据库的示例性配置。
26.图2描述了使用自然语言搜索生成广告弹性模型的方法的示例性数据流。
27.图3描述了图2的搜索引擎过程如何将规范数据映射到规范主题的示例。
28.图4a描述了图2的元分析过程如何使用图3所示的搜索引擎过程生成的映射的用户主题的缩减集来生成基于用户主题的广告弹性估计的示例。
29.图4b描述了图2的元分析过程如何使用图3所示的搜索引擎过程生成的映射的用户主题的缩减集来生成基于用户主题的广告弹性估计的示例。
30.图5a描述了使用自然语言搜索确定广告弹性估计的方法的示例性过程流。
31.图5b描述了使用自然语言搜索确定广告弹性估计的方法的示例性过程流。
32.图6描述了框图,框图说明了计算设备的一个实施例,该计算设备实现了用于使用本文所述的自然语言搜索生成广告弹性模型的方法和系统。
具体实施方式
33.下面的描述和图表是说明性的,不应被解释为限制。描述了许多具体细节,以提供对公开的透彻理解。然而,在某些情况下,为了避免模糊描述,不描述众所周知的或常规的细节。在本发明中对“一个(one)实施例”或“一个(an)实施例”的引用可以是(但不一定是)对相同实施例的引用,并且这种引用意味着至少一个实施例。
34.在本说明书中对“一个实施例”或“一个实施例”的引用是指与实施例相关的特定特征、结构或特点包含在本发明的至少一个实施例中。短语“在一个实施例中”在说明书的不同地方的多次出现并不一定都是指同一个实施例,也不是单独的或替代的实施例相互排斥于其他实施例。此外,还描述了可由一些实施例展示而不由其他实施例展示的各种特征。类似地,描述了各种要求,这些要求可以是一些实施例的要求,但不是其他实施例的要求。
35.在本说明书中使用的术语在本领域、在公开的上下文中以及在使用每个术语的具体上下文中通常具有其普通含义。用于描述公开的某些术语将在下面讨论,或在说明书的其他地方讨论,以就公开的描述向实践者提供额外的指导。为了方便起见,某些术语可能会被高亮显示,例如使用斜体和/或引号。使用高亮符号对术语的范围和含义没有影响;在相同的上下文中,无论是否突出显示,术语的范围和含义都是相同的。可以理解的是,同样的事物可以用不止一种方式来表达。
36.因此,替代语言和同义词可以用于本文讨论的任何一个或多个术语,也没有任何特殊意义,无论一个术语是否在本文阐述或讨论。提供了某些术语的同义词。引用一个或多个同义词并不排除使用其他同义词。本说明书中任何地方使用的示例,包括本文讨论的任何术语的示例,仅是说明性的,并不是为了进一步限制公开或任何示例术语的范围和含义。同样,本公开不限于本说明书中给出的各种实施例。
37.在没有意图限制本公开的范围的情况下,下面给出了根据本公开的实施例的仪器、装置、方法及其相关结果的示例。注意,为了方便读者,示例中可以使用标题或副标题,这绝不应限制本公开的范围。除非另有定义,本文使用的所有技术和科学术语具有与本公开所涉及的领域的普通技术人员通常理解的相同含义。在冲突的情况下,以包括定义的本文件为准。
38.本文公开了用于使用自然语言搜索生成广告弹性模型的系统和方法。所公开的系统和方法包括规范数据库,规范数据库存储与广告弹性相关的规范数据,规范数据可用于围绕广告支出进行决策。所公开的系统和方法基于规范数据库的元分析使用规范数据库以向用户提供根据用户对广告活动或广告活动的描述量身定制的广告弹性估计。
39.图1描述了规范数据库的示例性配置。
40.参照图1,示例性规范数据库102存储多个记录104a-104e,其中包括广告弹性的估计以及与广告弹性估计相关的附加数据。数据库102中的每条记录或行104表示广告弹性的概率估计,由特定变量的平均值和标准差描述。每个记录或行104还包含与变量相关的文本标签数据。每个变量(即,记录或行)可以是广告或营销策略的任何特定方面,例如“社交视频”、“视频网站”、“网络电视”或“无品牌搜索”。
41.示例性规范数据库102中的每一行104都包含一个“变量id”字段。变量id是行的唯一键。每个行104表示由来自任意数量的来源的行表示的变量的广告弹性的估计,来源包括但不限于用户输入的模型、用户生成的模型或作为学术文献的一部分生成的模型。
42.示例性规范数据库中的每一行104都包含“平均值(mean)”字段。平均值是对那一行所表示的特定变量的广告弹性的估计。换句话说,对于“社交视频”变量的行,平均值表示“社交视频”的广告弹性的点估计,该点估计基于之前对社交视频策略广告弹性的估计。
43.示例性规范数据库102中的每一行104都包括一个“标准偏差(std dev)”字段,它指的是广告弹性的平均值(即“平均值”字段)周围的标准偏差。
44.示例性规范数据库102包括许多标签,它们为数据库中的每个变量提供额外的数据点。示例性规范数据库102中的每一行104包括一个或多个“标签(tag)”字段,例如,其可以表示为tag1…
tagk。“tag
1”到“tag
k”字段包含了标准数据库中包含的每个标签。标签描述或以其他方式与由特定行表示的变量的各个特定方面相关。标签可以是单词、名称、短语或其他描述符,用于描述行所表示的特定广告活动。标签可以是文本描述符,例如:“交易”、“电视”、“在线”、“搜索”、“付费”、“视频网站”、“沃尔玛”、“程序化”等等。这些标签可以在系统管理员和系统用户之间协同管理。除了文本描述符之外,每条记录中的每个标签都可以分配指示器,例如,1(或true)表示标签出现在用户的描述中,0(或false)表示相反(例如,标签不出现在用户的描述中)。
45.此外,示例性规范数据库102可包括用于跟踪与变量相关的数据的一个或多个数据记录。这些数据记录可能包括可跟踪的数据,如点赞、观看次数、印象、点击、消费等等。
46.规范数据库102可以用各种方式填充数据。将数据输入到规范数据库的一种方法是用户通过图形用户界面将数据(例如文本数据)输入到规范数据库。例如,用户可以输入用于分析的变量的名称(例如,“社交视频”),变量的文本描述(例如,“在社交媒体网站上分享的增强视频广告”),以及与变量相关的任何数据记录(例如,“点赞”,“印象”或“付费”)。
47.为了从用户输入的数据生成标签,系统根据用户对变量的输入生成关键字。例如,系统可以解析变量名称的文本、变量的描述以及与变量相关的数据记录。此文本解析生成一个或多个表示已解析值的标签。生成的标签可以用一个或多个二级元标签进一步增强。在这点上,用户可以选择添加、修改或删除系统生成的与变量关联的一个或多个标签。
48.将数据输入规范数据库102的另一种方式是通过数据管理器。现有数据可由系统管理员用户手动输入规范数据库102。这些可能是主要标签或二级元标签。现有数据可以手动输入,也可以从另一个电子文件导入,例如数据表、.csv文件、电子表格文件、另一个数据库等。现有数据可能来自发表与广告弹性相关研究的学术期刊,如弹性表。例如,学术期刊可能会发表研究以及用于该研究的相应研究数据。研究数据可以以表格或元分析数据库的形式发表。这样的研究数据可以导入到规范数据库102中,以提供额外的数据点。
49.将现有数据添加到规范数据库102的管理过程是一个持续的过程,其可能在每次发布或收集新数据时发生。
50.规范数据库102可以使用任何已知的数据库结构来实现,例如关系数据库、sql数据库或类似的数据库。规范数据库102可以通过图形用户界面访问,并且可以使用已知的数据库查询进行查询,以访问存储在数据库中的数据。标准数据库可以实现为一个或多个服务器,其或者位于本地,或者作为一个或多个逻辑服务器在云中。服务器可以与执行本文所述操作的一个或多个处理器一起运行。
51.示例性规范数据库102可用于向用户提供给定广告活动的广告弹性估计。例如,假设用户想要确定一项拟议中的新广告活动的广告弹性,该广告活动将使用将在众多社交媒体渠道上部署的视频。在这样的示例中,用户可以使用标签“视频”和“社交媒体”查询规范数据库。规范数据库确定特定查询的广告弹性。这是通过基于规范数据库中包含用户提供标签的现有记录计算广告弹性的概率分布来实现的。概率分布可以通过使用平均弹性的平均值和标准差或百分位数,或使用用户提供的标签作为协变量的回归分析来估计。因此,规范数据库102返回代表预期广告弹性的计算平均值和标准偏差值,这是基于规范数据库中的记录104确定的,其中包括标签“视频”和“社交媒体”。
52.然而,这种方法的一个问题是,用户使用的标签需要与规范数据库中的标签相匹配,以计算出广告弹性的最准确估计。换句话说,参考上面的示例,如果规范数据库中的一条记录使用了“社交”标签而不是“社交媒体”,那么该记录要么可能没有被包括在内,要么可能包括在内,但在计算的广告弹性中被错误地加权。因此,由于用户可能不了解规范数据库中使用的现有标签,并且如果没有标准化的标签系统,那么问题就会进一步夸大,因为规范数据库中的许多记录可能包含略有不同的标签,以引用本质上相同的概念。此外,随着广告趋势的发展,可能会有新的概念或广告途径无法被现有标签集准确捕获或表示。因此,当用户使用与这种新技术或广告途径相关的术语进行搜索时,这些关键字搜索可能与任何现有标签不一致,从而导致不完整或不正确的加权计算。
53.图2描述了使用自然语言搜索生成广告弹性模型的方法的示例性数据流。
54.参照图2,本文描述的系统和方法包括规范数据库,例如图1中描述的示例性规范数据库102。规范数据库102通信连接到搜索引擎过程202和元分析过程204,使得元分析204和搜索引擎202中的每一个都可以向规范数据库102发送数据以(例如,在其中存储数据)并从规范数据库102接收数据(例如,查询数据)。搜索引擎过程202和元分析过程204彼此通信连接,使得将来自搜索引擎过程202的数据馈送到元分析过程204。搜索引擎过程202和元分析过程204可以运行在与规范数据库102相同的服务器上,或者它们可以运行在与规范数据库102通信的一个或多个独立的计算设备上(例如,通过互联网或其他类型的连接)。
55.如图2所示,可以使用模型系数数据206、变量文本数据208、已发表学术论文210和品牌分类数据212来填充规范数据库102。模型系数数据206为广告弹性的平均值和标准差。变量文本数据208包括描述广告活动或其他感兴趣的数据的用户输入或策划标签。如上图1所述,学术论文210可能包括已发表的广告弹性数据。品牌分类数据212是品牌级标签,其描述关于品牌、产品或分销、销售或购买产品的方式的任何数量的非特定识别信息。所有这些数据可以由数据库系统的用户214或与数据库系统相关联的管理员216使用图形用户界面输入到规范数据库102,该图形用户界面提供对数据库中数据记录的读、写和/或修改访问。
用户214可以提供与变量相关的主题并运行模型。管理员216可以审查、清理和添加来自学术期刊的数据,并对品牌进行分类,并定期调整算法。
56.本文描述的使用自然语言搜索生成广告弹性模型的系统和方法的一个创新方面是,它们为规范数据库102、搜索引擎过程202和元分析过程204之间的交互提供了一个结构,使得用户就可以使用自然语言搜索存储在规范数据库中的数据,而元分析将返回基于自然语言搜索词的广告弹性的元分析模型。为了实现这一创新方面,本文所描述的系统和方法提供或生成可能与规范数据库中的每个记录相关联的附加数据。该附加数据包括“主题”数据和“相似度”数据,如图3和图4a所示。主题是与标签组或组合相关联的数值。例如,一个特定的主题号可能对应于一个“社交媒体”组,该组包括“脸书(facebook)”、“推特(twitter)”、“照片墙(instagram)”和“色拉布(snapchat)”标签。相似度是本文所述的系统和方法所使用的数值,它表示由特定行表示的变量与用户提供的特定项集之间关系的强度。
57.图2所示的搜索引擎过程202从用户214(例如,通过图形用户界面)接收自然语言文本输入(例如,自然语言搜索词),并查询规范数据库102的标签字段,并根据所查询的标签生成将用于元分析过程204的缩减的主题列表。搜索引擎过程202向元分析过程提供了缩减的主题列表。
58.在一些实施例中,同义词库可用于将作为用户提供的自然语言文本输入的一部分接收到的术语和通用错误拼写协调到公共标签集。这有助于将用户提供的信息转换为系统能够解释的有用数据。同义词库中使用的同义词是特定于广告的,不一定是英语语言的一般同义词。例如,用户提供的术语“亚马逊(amazon)”映射到标签“亚马逊(amazon)”,其表示在线零售商此外,同义词库可能包括“ams”和“amg”作为“amazon”的同义词,以使得用户提供的搜索“ams”或“amg”同样会映射到标签“amazon”。同义词库可以在训练期间使用,将训练数据映射到标签,也可以在运行时使用,将用户提供的自然语言文本输入映射到标签。
59.在一些实施例中,使用标签和元标签集之间的映射,该映射在逻辑上将关于媒体的标签映射到传播方式或媒体的心理诉求。如上所述,每个标签都可以包括元标签,其提供关于标签的信息。在创建主题时,标签和元标签集之间的映射允许标签之间的连接,这可能不一定基于自然语言。
60.调整元分析过程以将本文所述的搜索引擎过程的输出作为输入的优势包括:随着新案例(例如,记录)添加到规范数据库中,搜索引擎过程动态适应的能力,以及在语义上连接在传统元分析中可能被视为独立的案例的能力,以及推广到数据库中未明确定义的变量的能力。
61.图3描述了图2的搜索引擎过程如何将规范数据映射到规范主题的示例。
62.图3所示的搜索引擎过程202将标签映射到主题。如上所述,本文所描述的系统和方法提供了与存储在规范数据库中的数据相关联的附加主题数据。因此,如图3所示,规范数据库中的数据可以进一步与“主题(topic)”字段相关联,该字段可以表示为topic1…
topicm,用于每个行或记录。主题字段为每行存储一个值,该值为特定主题和变量之间的关联提供一个数值。函数m()是一个从规范数据库推导的映射函数,当应用它时,将产生一个由标签集生成的缩减主题集。例如,映射函数m()可以通过找到规范数据库中现有标签的
加权线性组合来推导,其最好地解释了标签集之间的变化。标签集提供了关于变量的语义含义,但也包括与特定用户对变量的描述相关的特殊信息。通过找到标签的加权线性组合,映射函数m()能够根据特定标签与数据库中其他标签的关系,从它们的使用中推导出语义。通过查找标签组合的缩减的主题集,该方法能够将含义从特殊的垃圾信息中分离出来。可以使用例如奇异值分解、非负矩阵分解、潜在的狄利克雷分析、其他降维方法或聚类方法来推导映射函数m()。
63.因此,当一个现有的标签(即,在规范数据库中已经存在的标签)被输入到推导的映射函数m()中,映射函数m()返回现有的主题集(即,已经存在的与规范数据库相关联的主题),如下式所示:
64.mapped_normative_topics=m(tag)
65.类似地,当用户提供的标签被输入到推导的映射函数m()时,映射函数m()返回映射的用户主题集,如下式所示:
66.mapped_user_topics=m(user_tags)
67.为清楚起见,将用户提供的标签映射到映射的用户主题的映射函数m()可以与推导自规范数据库中的规范数据的映射函数m()相同。
68.每当向规范数据库添加新数据时,可以对新数据进行回顾性分析,以更新现有的主题,并根据需要生成额外的新主题,以及重新生成新的或更新的映射函数m()。通过这种方式,搜索引擎过程随着新的案例(例如,记录)被添加到规范数据库中而动态地适应。
69.函数g()用于生成广告弹性的估计。在一个实施例中,如图4a所示,函数g()是用于生成广告弹性估计的相似度函数g()。在另一个实施例中,如图4b所示,函数g()是用于生成广告弹性估计的回归模型。
70.图4a描述了图2的元分析过程如何使用图3所示的搜索引擎过程生成的映射用户缩减的主题集来生成基于用户主题的广告弹性估计的示例。
71.参考图4a,图4a右侧所示的映射的规范主题304是使用图3中描述的映射函数m()推导的映射的规范主题。类似地,图4右侧显示的映射的用户主题308是使用图3上下文中描述的映射函数m()返回的映射的用户主题。
72.相似度函数g()是一个使用诸如余弦相似度或反转欧氏距离的方法来度量用户主题(user_topic)和规范主题(normative_topic)之间相似度的函数。相似度函数g()由下式表示:
73.user_topic_similarity=g(user_topic,normative topic)
74.估计函数f()是一个将来自规范数据库的所有信息与user_topic_similarity结合起来,以获得平均值_用户(mean_user)、标准差_用户(stdev_user)的先前估计的函数。这些先前的估计表示基于用户提供的标签产生的广告弹性。估计函数f()由下式表示:
75.mean_user,std_user=f(mean,stdev,user_similarity,user topics)
76.图4b描述了图2的元分析过程如何使用图3所示的搜索引擎过程生成的映射用户缩减的主题集来生成基于用户主题的广告弹性估计的示例。
77.参考图4b,使用回归模型来估计函数g(),而不是使用相似度函数g()来生成基于用户主题的广告弹性估计。
78.函数g()被估计。估计g()的过程包括在给定的百分位数上执行分位数回归,以生
成映射的规范主题304与表示规范弹性402的平均值和标准差(或变异系数)值之间的线性映射函数。根据映射的规范主题304生成一个分位数值和相应的百分位数数组。广告弹性的全概率分布是使用元数据分布估计的。然后在运行时使用估计函数g(),根据映射的用户主题308生成广告弹性404的概率。
79.根据以主题分数的数组为自变量,用回归模型来推断弹性的分布。分布的特征是平均值和变异系数。变异系数的计算方法是用标准偏差除以平均值。这两个度量的估计是使用分位数回归来执行的,其为每个平均值和变异系数产生一个百分位数。因此,弹性分布的测量本身的特征是基于分位数回归中对应的百分位数的分位数的分布。
80.平均值和变异系数的全概率分布是根据自然语言标签条件下的百分位数和分位数之间的关系,使用元数据分布来估计的。
81.根据任何一个新的自然语言标签集预测新的分布,并返回弹性的先前平均值和方差供系统使用。
82.图5a描述了使用自然语言搜索确定广告弹性估计的方法的示例性过程流。
83.参考图5a,在步骤502,系统接收用户提供的搜索词。如上所述,用户提供的搜索词包括用于查询规范数据库的自然语言搜索词。规范数据库包括规范数据,其中包括平均值、标准偏差值和存储在规范数据库中的广告变量的现有标签。自然语言搜索词描述了广告活动的一个或多个方面,用户试图从中找到广告弹性的估计。用户提供的搜索词的组合可能对应于规范数据库中存在的标签的确切组合,也可能不对应于规范数据库中存在的标签的确切组合。在选择用户提供的搜索词时,提供用户提供的搜索词的用户不需要知道规范数据库中存在哪些标签,也不需要知道哪些主题与规范数据库相关联。
84.在一些实施例中,还提供用户提供的自然语言搜索词的同义词作为推导的映射函数的输入。使用同义词库确定用户提供的自然语言搜索词的同义词。
85.在步骤504中,系统从规范数据推导映射函数。规范数据是指存储在规范数据库中的现有数据。正如在图3的上下文中所解释的,推导的映射函数是一个将文本作为输入并返回主题集作为输出的函数。映射函数是通过使用奇异值分解、非负矩阵分解或潜在的狄利克雷分析分析规范数据中的现有标签来获得的,以确定一个函数,该函数将规范数据中的现有标签与和规范数据相关的规范主题高度相关。规范主题表示规范数据库中现有标签的变化。因此,映射函数将在给定特定文本输入的情况下返回主题集,这些主题最好地以与规范主题一致的方式表示。
86.在步骤506,系统将推导的映射函数应用于用户提供的搜索词。推导的映射函数使用用户提供的搜索词作为输入,然后将这些用户提供的搜索词映射到缩减的现有主题集。
87.换句话说,映射函数是使用已知的标签组合来映射到主题而推导的。一旦使用已知的组合和主题推导了映射函数,就可以使用它将其他标签组合映射到主题。因此,推导的映射函数能够处理任何用户提供的搜索词组合,因为映射函数不需要提前知道该组合才能工作。
88.在步骤508,系统根据用户提供的搜索词生成映射的用户主题集。这个生成的映射的用户主题集是推导的映射函数的输出,用户提供的搜索词作为输入。与用户提供的搜索词一样,映射的用户主题与和规范数据相关的规范主题可能匹配也可能不匹配。
89.在一些实施例中,从用户提供的自然语言搜索词生成映射的用户主题集是进一步
现有标签和元标签集之间的映射。在一个实施例中,现有标签和元标签集之间的映射提供了从媒体类型到通信方式的映射。在一个实施例中,现有标签和元标签集之间的映射提供了从媒体类型到媒体类型的心理诉求的映射。
90.在步骤510,系统确定映射的用户主题集与现有规范主题之间的相似度。现有规范主题是与规范数据库相关联的主题。使用相似度函数确定每个广告变量映射的用户主题集与规范主题之间的相似度,该函数将映射的用户主题和规范主题作为输入,并对输入执行余弦相似度分析或反转的欧几里德距离分析,以返回一个相似度值,其度量每个广告变量映射的用户主题与规范主题之间的相似度。每个广告变量的相似度值表示映射的用户主题集与和广告变量相关的规范主题之间的相似度。
91.在步骤512,系统基于确定的相似度推导出广告弹性的估计。更具体地,系统基于(a)用户提供的变量与数据库中每个记录之间确定的相似度的函数以及(b)每个记录的广告弹性估计的平均值和标准差,推导出用户提供的变量的广告弹性的平均值和标准差。如前所述,每个记录表示规范数据库中的一种广告策略,用户提供的广告策略可能与一个或多个用户提供的搜索词相关联。平均值和标准偏差可以用各种函数来推导以计算值。这种函数的一个示例是加权平均。在这样的示例中,用户提供的变量的平均值可以在计算加权平均弹性时使用规范数据库中所有记录的平均值,根据主题相似度的度量进行加权(例如,如图4所示的用户-主题相似度字段中所示的变量值)。加权平均值表示基于用户提供的搜索词的策略的平均广告弹性。类似地,在该示例中,标准差可以从规范数据库中记录的每种广告策略的平均广告弹性与上述计算的平均广告弹性之差的平方的加权平均值的平方根,加上规范数据库中记录的每种广告策略的每种弹性方差的加权平均值得出。也可以使用其他函数,这取决于例如所需要的特定类型的权重,所寻求的主题之间的关系等等。
92.图5b描述了使用自然语言搜索确定广告弹性估计的方法的示例性过程流。
93.参考图5b,步骤502至508与图5a上下文中所述相同。
94.在各个实施例中,在步骤514,系统运行回归模型来推断所映射的用户主题集的弹性分布。在一些实施例中,运行回归模型来推断映射的用户主题集的弹性分布包括使用平均广告弹性的记录和关于该平均值的标准偏差来计算每个记录的变异系数,正如将标准偏差除以平均值。系统运行一系列具有不同百分位参数的分位数回归模型,以根据映射的用户主题推断感兴趣的度量的分位数。作为运行回归模型的结果,系统根据映射的用户主题估计与百分比相关联的分位数数组。平均值和变异系数的完整分布是使用基于回归的分位数和百分位数的元组分布来计算的。
95.在各个实施例中,在步骤516,系统基于回归模型推导出广告弹性的估计。系统根据任何一个新的自然语言标签集预测新的分布,并推导出弹性的先前平均值和方差。
96.本文描述的方法,包括在图5a和5b上下文中描述的方法,可以由包含一个或多个处理器的计算机系统执行,用于执行本文所述的方法。计算机系统还可以包括存储本文所述规范数据库的存储器。计算机系统还可以包括图形用户界面,以便用户与规范数据库进行交互。
97.图6描述了框图,其说明了计算设备的一个实施例,该计算设备实现用于使用本文所述的自然语言搜索生成广告弹性模型的方法和系统。
98.参考图6,计算设备600可包括至少一个处理器602、至少一个图形处理单元
(“gpu”)604、至少一个内存606、用户界面(“ui”)608、显示器610和网络接口612。存储器606可以部分地与处理器602和/或gpu 604集成。ui 412可以包括键盘和鼠标。显示器404和ui 412可以提供本公开实施例中的任何gui。
99.如本领域技术人员所理解的那样,本文所述技术的各方面可以体现为系统、方法或计算机程序产品。相应地,技术的各个方面可以采取完全硬件实施例、完全软件实施例(包括固件、常驻软件、微码等)或结合软件和硬件方面的实施例的形式,这些方面在本文中一般都可以被称为“电路”、“模块”或“系统”。此外,技术的各方面可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,该介质上具有计算机可读程序代码。
100.可以利用一种或多种计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质(包括但不限于非暂时性计算机可读存储介质)。计算机可读存储介质可以是,例如但不限于,电子、磁、光学、电磁、红外或半导体系统、装置或设备,或前述的任何适当组合。计算机可读存储介质的更具体示例(非详尽列表)包括以下:有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦可编程只读存储器(eprom或闪存)、光纤、便携式光盘只读存储器(cd-rom)、光存储设备、磁存储设备或上述任何合适的组合。在本文件的上下文中,计算机可读存储介质可以是任何可以包含或存储供指令执行系统、装置或设备使用或与之相连的程序的有形介质。
101.计算机可读信号介质可以包括传播数据信号,其中带有计算机可读程序代码,例如体现为在基带中或作为载波的一部分。这种传播信号可以采取各种形式中的任何一种,包括但不限于电磁、光学或其任何适当组合。计算机可读信号介质可以是任何计算机可读介质,该介质不是计算机可读存储介质,并且可以通信、传播或传输程序以供指令执行系统、装置或设备使用或与之连接。
102.体现在计算机可读介质上的程序代码可以使用任何适当的介质传输,包括但不限于无线、有线、光纤电缆、射频(rf)等,或上述介质的任何适当组合。
103.用于执行本文所述技术方面的操作的计算机程序代码可以用一种或多种编程语言的任何组合编写,包括面向对象的和/或过程式编程语言。编程语言可包括但不限于言的任何组合编写,包括面向对象的和/或过程式编程语言。编程语言可包括但不限于php、c、c++、c#、objective
‑‑
等等。程序代码可以完全在用户的计算机上执行、部分在用户的计算机上作为独立软件包执行、部分在用户的计算机上执行、部分在远程计算机上执行或完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过任何类型的网络连接到用户的计算机,包括局域网(lan)或广域网(wan),或者可以连接到外部计算机(例如,通过使用互联网服务提供商的互联网)。
104.本文所述技术的各方面是指根据各种实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图。应当理解的是,流程图示意图和/或框图的每个块,以及流程图示意图和/或框图中的块的组合,都可以通过计算机程序指令来实现。
105.这些计算机程序指令可以提供给通用计算机、特殊用途计算机或其他可编程数据处理设备的处理器以生产机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令创建用于实现流程图和/或方框图块中指定的功能/动作的手段。
106.这些计算机程序指令还可以存储在计算机可读介质中,该介质可以指导计算机、
其他可编程数据处理设备或其他设备以特定方式运行,使得存储在计算机可读介质中的指令产生包括实现流程图和/或方框图块中指定的功能/动作的指令的制品。
107.还可以将计算机程序指令加载到计算机、其他可编程数据处理设备或其他设备上,以使在该计算机、其他可编程设备或其他设备上执行一系列操作步骤,以产生计算机实现的过程,使得在计算机或其他可编程设备上执行的指令提供用于实现流程图和/或方框图块中指定的功能/动作的过程。
108.图中的流程图和框图说明了根据本文所述技术的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这方面,流程图或框图中的每个块可以表示模块、段或代码部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。还应该注意的是,在一些替代实现方式中,块中记录到的函数可能与图中记录到的顺序不同。例如,连续显示的两个块实际上可能基本上是并发执行的,或者这些块有时可能以相反的顺序执行,这取决于所涉及的功能。还应注意的是,框图和/或流程图插图的每个块,以及框图和/或流程图插图中的块的组合,可以由执行指定功能或动作的基于特殊用途硬件的系统,或特殊用途硬件和计算机指令的组合来实现。
109.本文使用的术语仅用于描述特定实施例的目的,而不打算加以限制。如本文所使用的,单数形式“一个(a)”、“一个(an)”和“所述(the)”也包括复数形式,除非上下文另有明确指示。因此,例如对“用户”的引用可以包括多个这样的用户,等等。需要进一步理解的是,术语“包括(comprises)”和/或“包括(comprising)”,当在本说明书中使用时,指定所述特征、整数、步骤、操作、元件和/或组件的存在,但不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组。
110.下面权利要求中相应的结构、材料、动作和所有手段或步骤加功能要素的等价物意在包括任何结构、材料或动作,用于与具体要求的其他权利要求的元件结合执行功能。本文提供的描述是为了说明和描述的目的而提供的,但并不打算详尽无遗或局限于所公开的特定形式。在不脱离本公开的范围和精神的情况下,对本领域的普通技术人员来说,许多修改和变化将是明显的。选择和描述实施例是为了最好地解释本文所描述的原则和这些原则的实际应用,并使具有本领域普通技能的其他人能够理解用于各种实施例的技术,具有适合于所设想的特定用途的各种修改。
111.本文所公开的技术的各种实施例的描述是为了说明的目的而提出的,但是这些描述并不打算是详尽的或局限于所公开的实施例。在不脱离所述实施例的范围和方案的情况下,对本领域的普通技术人员来说,许多修改和变体将是明显的。本文所使用的术语被选择来最好地解释实施例的原理、市场上发现的技术的实际应用或技术改进,或使具有本领域普通技能的其他人能够理解本文所公开的实施例。

技术特征:
1.一种使用自然语言搜索确定广告弹性估计的方法,所述方法包括:接收用户提供的自然语言搜索词以用于查询规范数据库,其中,所述规范数据库包括规范数据,所述规范数据包括平均值、标准差值和存储在所述规范数据库中的一个或多个广告变量的多个现有标签;通过分析所述规范数据中的所述多个现有标签,基于所述规范数据推导映射函数,以确定将所述多个现有标签映射到与所述规范数据相关联的规范主题集的函数,使得所述规范主题集表示所述规范数据库中所述多个现有标签的变化;将所述推导的映射函数应用于所述用户提供的自然语言搜索词,其中,提供所述用户提供的自然语言搜索词作为所述推导的映射函数的输入;基于所述推导的映射函数,从所述用户提供的自然语言搜索词生成映射的用户主题集;使用相似度函数确定所述一个或多个广告变量中至少一个的相似度值,其中,所述广告变量的相似度值表示所述映射的用户主题集与和所述广告变量相关的规范主题集之间的相似度;以及基于所述广告变量的确定的相似度值、所述平均值和所述标准差值,推导所述用户提供的自然语言搜索词的广告弹性估计。2.根据权利要求1所述的方法,其中所述用户提供的自然语言搜索词表示广告活动。3.根据权利要求1所述的方法,其中所述用户提供的自然语言搜索词通过网络接收。4.根据权利要求1所述的方法,其中所述用户提供的自然语言搜索词由用户通过图形用户界面提供。5.根据权利要求1所述的方法,其中所述规范数据库包括关系数据库。6.根据权利要求1所述的方法,其中所述映射函数通过使用奇异值分解分析所述规范数据中的标签而推导。7.根据权利要求1所述的方法,其中所述映射函数通过使用非负矩阵分解分析所述规范数据中的标签而推导。8.根据权利要求1所述的方法,其中所述映射函数是通过使用潜在的狄利克雷分析法分析所述规范数据中的标签而推导。9.根据权利要求1所述的方法,其中还提供所述用户提供的自然语言搜索词的同义词作为所述推导的映射函数的输入。10.根据权利要求9所述的方法,其中使用同义词库确定所述用户提供的自然语言搜索词的同义词。11.根据权利要求10所述的方法,其中从所述用户提供的自然语言搜索词生成映射的用户主题集是进一步基于所述现有标签和元标签集之间的映射。12.根据权利要求11所述的方法,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到通信方式的映射。13.根据权利要求11所述的方法,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到所述媒体类型的心理诉求的映射。14.根据权利要求1所述的方法,其中所述映射的用户主题集对应于与所述规范数据相关联的规范主题集。
15.根据权利要求1所述的方法,其中所述映射的用户主题集与和所述规范数据相关联的规范主题集不匹配。16.根据权利要求1所述的方法,其中所述相似度函数将所述映射的用户主题集和所述规范主题集作为输入,并将所述相似度值作为输出返回,所述相似度值测量所述映射的用户主题集和所述规范主题集之间的相似度。17.根据权利要求16所述的方法,其中所述相似度函数对所述输入执行余弦相似度分析。18.根据权利要求16所述的方法,其中所述相似度函数对所述输入执行反转的欧氏距离分析。19.根据权利要求1所述的方法,其中所述广告弹性的估计使用所述规范数据库中所述广告变量的平均值和标准差值而推导,并根据所述确定的广告变量的相似度值对所述广告变量的平均值和标准差值进行加权。20.根据权利要求19所述的方法,其中所述广告弹性的估计计算为加权平均,所述加权平均使用所述多个广告变量中的每个的平均值和标准差值对所述规范数据库中的所述多个广告变量进行。21.根据权利要求20所述的方法,其中所述广告弹性的估计通过合计多个平均值和标准偏差值计算。22.根据权利要求21所述的方法,其中所述广告弹性的推导的估计表示基于所述用户提供的自然语言搜索词的广告活动的广告弹性。23.一种使用自然语言搜索确定广告弹性估计的方法,所述方法包括:接收用户提供的自然语言搜索词以用于查询规范数据库,其中,所述规范数据库包括规范数据,所述规范数据包括平均值、标准差值和存储在所述规范数据库中的一个或多个广告变量的多个现有标签;通过分析所述规范数据中的所述多个现有标签,基于所述规范数据推导映射函数,以确定将所述多个现有标签映射到与所述规范数据相关联的规范主题集的函数,使得所述规范主题集表示所述规范数据库中所述多个现有标签的变化;将所述推导的映射函数应用于所述用户提供的自然语言搜索词,其中,提供所述用户提供的自然语言搜索词作为所述推导的映射函数的输入;以及基于所述推导的映射函数,从所述用户提供的自然语言搜索词生成映射的用户主题集。24.根据权利要求23所述的方法,还包括:运行回归模型以推断所述映射的用户主题集的弹性分布;以及基于所述回归模型推导所述用户提供的自然语言搜索词的广告弹性估计。25.根据权利要求24所述的方法,其中运行所述回归模型以推断所述映射的用户主题集的弹性分布包括:将所述标准差除以所述平均值计算每个记录的所述变异系数;运行一系列具有不同百分位参数的分位数回归模型,以基于映射的用户主题推断感兴趣指标的分位数;基于所述映射的用户主题估计与百分比相关联的分位数数组;以及
使用基于来自所述回归的分位数和百分位数的元组分布计算所述平均值和所述变异系数的完整分布。26.根据权利要求23或24所述的方法,其中所述用户提供的自然语言搜索词表示广告活动。27.根据权利要求23或24所述的方法,其中所述用户提供的自然语言搜索词通过网络接收。28.根据权利要求23或24所述的方法,其中所述用户提供的自然语言搜索词由用户通过图形用户界面提供。29.根据权利要求23或24所述的方法,其中所述规范数据库包括关系数据库。30.根据权利要求23或24所述的方法,其中所述映射函数通过使用奇异值分解分析所述规范数据中的标签而推导。31.根据权利要求23或24所述的方法,其中所述映射函数通过使用非负矩阵分解分析所述规范数据中的标签而推导。32.根据权利要求23或24所述的方法,其中所述映射函数通过使用潜在的狄利克雷分析法分析所述规范数据中的标签而推导。33.根据权利要求23或24所述的方法,其中还提供所述用户提供的自然语言搜索词的同义词作为所述推导的映射函数的输入。34.根据权利要求32所述的方法,其中所述用户提供的自然语言搜索词的所述同义词使用同义词库确定。35.根据权利要求23或24所述的方法,其中从所述用户提供的自然语言搜索词生成所述映射的用户主题集是进一步基于所述现有标签和元标签集之间的映射。36.根据权利要求35所述的方法,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到通信方式的映射。37.根据权利要求35所述的方法,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到媒体类型的心理诉求的映射。38.根据权利要求23或24所述的方法,其中所述映射的用户主题集对应于与所述规范数据相关联的所述规范主题集。39.根据权利要求23或24所述的方法,其中所述映射的用户主题集与和所述规范数据相关联的所述规范主题集不匹配。40.根据权利要求24所述的方法,其中所述广告弹性的估计表示基于所述用户提供的自然语言搜索词的广告活动的广告弹性。41.一种使用自然语言搜索确定广告弹性估计的系统,所述系统具有至少一个处理器,所述至少一个处理器配置为:接收用户提供的自然语言搜索词以用于查询规范数据库,其中,所述规范数据库包括规范数据,所述规范数据包括平均值、标准差值和存储在所述规范数据库中的一个或多个广告变量的多个现有标签;通过分析所述规范数据中的多个现有标签,推导基于所述规范数据的映射函数,以确定将所述多个现有标签映射到与所述规范数据相关联的规范主题集的函数,使得所述规范主题集表示所述规范数据库中所述多个现有标签的变化;
将所述推导的映射函数应用于所述用户提供的自然语言搜索词,其中,提供所述用户提供的自然语言搜索词作为所述推导的映射函数的输入;以及基于所述推导的映射函数,从所述用户提供的自然语言搜索词生成映射的用户主题集。42.根据权利要求41所述的系统,其中所述至少一个处理器还配置为:运行回归模型来推断所述映射的用户主题集的弹性分布;以及基于所述回归模型推导所述用户提供的自然语言搜索词的广告弹性的估计。43.根据权利要求42所述的系统,其中运行所述回归模型以推断所述映射的用户主题集的弹性分布包括:将所述标准差值除以所述平均值计算每个记录的变异系数;运行一系列具有不同百分位参数的分位数回归模型,以根据所述映射的用户主题推断感兴趣指标的分位数;基于所述映射的用户主题估计与所述百分比相关联的分位数数组;以及使用基于来自所述回归的分位数和百分位数的元组分布计算所述平均值和所述变异系数的完整分布。44.根据权利要求41或42所述的系统,其中所述用户提供的自然语言搜索词表示广告活动。45.根据权利要求41或42所述的系统,其中所述用户提供的自然语言搜索词通过网络接收。46.根据权利要求41或42所述的系统,其中所述用户提供的自然语言搜索词由用户通过图形用户界面提供。47.根据权利要求41或42所述的系统,其中所述规范数据库包括关系数据库。48.根据权利要求41或42所述的系统,其中所述映射函数通过使用奇异值分解分析所述规范数据中的标签而推导。49.根据权利要求41或42所述的系统,其中所述映射函数通过使用非负矩阵分解分析所述规范数据中的标签而推导。50.根据权利要求41或42所述的系统,其中所述映射函数通过使用潜在的狄利克雷分析法分析所述规范数据中的标签而推导。51.根据权利要求41或42所述的系统,其中所述用户提供的自然语言搜索词的所述同义词还作为所述推导的映射函数的输入提供。52.根据权利要求51所述的系统,其中所述用户提供的自然语言搜索词的所述同义词使用同义词库确定。53.根据权利要求41或42所述的系统,其中从所述用户提供的自然语言搜索词生成所述映射的用户主题集是进一步基于所述现有标签和元标签集之间的映射。54.根据权利要求53所述的系统,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到通信方式的映射。55.根据权利要求53所述的系统,其中所述现有标签和所述元标签集之间的所述映射提供从媒体类型到媒体类型的心理诉求的映射。56.根据权利要求41或42所述的系统,其中所述映射的用户主题集对应于与所述规范
数据相关联的所述规范主题集。57.根据权利要求41或42所述的系统,其中所述映射的用户主题集与和所述规范数据相关联的规范主题集不匹配。58.根据权利要求42所述的系统,其中所述广告弹性的估计计算为加权平均,所述加权平均使用所述多个广告变量中的每个的平均值和标准差值对所述规范数据库中的所述多个广告变量进行。59.根据权利要求42所述的系统,其中所述广告弹性的估计是通过合计所述多个平均值和标准偏差值计算。60.根据权利要求42所述的系统,其中所述广告弹性的估计表示基于所述用户提供的自然语言搜索词的广告活动的广告弹性。

技术总结
公开了用于使用自然语言搜索生成广告弹性模型的系统和方法。该系统和方法生成映射函数,该映射函数基于用户提供的标签生成缩减的用户主题集,并使用用户主题得出给定广告活动的广告弹性估计。的广告弹性估计。的广告弹性估计。


技术研发人员:J
受保护的技术使用者:基恩决策系统公司
技术研发日:2021.09.24
技术公布日:2023/8/13
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐