优惠券定价发放模型训练方法、装置及计算机设备与流程

未命名 07-13 阅读：117 评论：0

1.本技术涉及金融科技领域，尤其涉及一种优惠券定价发放模型训练方法、优惠券定价发放模型训练装置装置及计算机设备。

背景技术：

2.优惠券促销目前是银行营销中的重要工具，在日常营销场景中(如：拉新、促活、防流、销售等)经常使用优惠券吸引客户，给予用户补贴，从而促使用户转化、增大营销效果，实现总效用的提升。金融类app在拉新、促活等场景中经常使用优惠券补贴促使用户下单。
3.但从用户层面来说，从“是否发券补贴”和“是否下单购买”两个维度，可以将用户分为四类人群。自然转化人群：无论是否有优惠券补贴都会下单购买人群；补贴敏感人群：对价格比较敏感，没有优惠就不会下单、有优惠券才会下单人群；反作用人群：没有优惠活动触达时会下单，但有优惠活动触达时反而不会购买，对营销活动比较反感的人群；无动于衷人群：无论是否有优惠券补贴都不会购买的人群
4.即“补贴敏感”客户被优惠券补贴之后产生了正向变化，由不下单转为下单，这部分用户是优惠券营销真正想要进行触达干预的营销敏感用户。但客户对价格的接受程度是不一样的，并且在客户量庞大的情况下，也不可能给所有客户都发放优惠券，但按照以往的经验根据历史活跃情况和历史消费记录来制定发送策略，容易造成资源浪费且也容易触碰到反作用人群造成反向效果。

技术实现要素：

5.有鉴于此，实有必要提供一种更加智能的优惠券定价发放模型训练方法、计算机可读存储介质及计算机设备。
6.第一方面，本技术实施例提供一种优惠券定价发放模型训练方法，所述优惠券定价发放模型训练方法包括下面步骤:
7.获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本；
8.将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况；
9.通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的；
10.根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。
11.第二方面，本技术实施例提供一种优惠券定价发放模型训练装置，所述优惠券定价发放模型训练装置具体包括：
12.获取模块，用于获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本；
13.训练模块，用于将所述训练样本输入至初始训练模型进行训练得到每一训练样本
对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况；
14.计算模块，用于通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的；
15.发放模块，用于根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。
16.第三方面，本技术实施例提供一种计算机设备，所述计算机设备包括：计算机可读存储介质，用于存储程序指令，处理器以及总线执行所述程序指令以实现上述所述的优惠券定价发放模型训练方法。
17.上述种优惠券定价发放模型训练方法、优惠券定价发放模型训练装置装置及计算机设备，通过获得的提升值得到用户因优惠券的转化率结果，利用提升值结果进行不同提升值匹配不同金额的优惠券策略从而可以精准定制优惠券策略实现效用最大化。
附图说明
18.为了更清楚地说明本技术实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图示出的结构获得其他的附图。
19.图1为本技术实施例提供的优惠券定价发放模型训练方法的流程图。
20.图2为本技术实施例提供的优惠券定价发放模型训练方法的第一子流程图。
21.图3为本技术实施例提供的优惠券定价发放模型训练方法的第二子流程图。
22.图4为本技术实施例提供的优惠券定价发放模型训练方法的第三子流程图。
23.图5为本技术实施例提供的优惠券定价发放模型训练方法的第四子流程图。
24.图6为本技术实施例提供的优惠券定价发放模型训练装置示意图。
25.图7为本技术实施例提供的获取模块示意图。
26.图8为本技术实施例提供的发放模块示意图。
27.图9为本技术实施例提供的计算机设备的内部结构示意图。
28.本技术目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。
具体实施方式
29.为了使本技术的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本技术进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本技术，并不用于限定本技术。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
30.本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的规划对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，换句话说，描述的实施例根据除了这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，还可以包含其他内容，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于只清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品
或设备固有的其它步骤或单元。
31.需要说明的是，在本技术中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本技术要求的保护范围之内。
32.请结合参看图1，其为本技术实施例提供的优惠券定价发放模型训练方法的流程图。优惠券定价发放模型训练方法具体包括如下步骤s102-s108。
33.步骤s102，获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本。可以理解地，用户获取分桶实验得到的训练样本，所述分桶实验为利用用户的同一特征进行分组实验，具体将在下文详细描述。
34.步骤s104，将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况。可以理解地，用户在同一情景的情况下将若干已发放优惠券样本和若干未发放优惠券样本都放入初始训练模型进行训练得到目标模型，并将样本输入至目标模型输出对应的每一训练样本对应的预测结果。
35.步骤s106，通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的。可以理解地，所述预设预期算法为：p(yi|xi,ti＝1)-p(yi|xi,ti＝0)(公式一)，其中，y为预期效益结果，x为训练样本，t为干预项，1为有干预，0为没有干预。所述目标模型根据所述预设预期算法对每一预测结果进行计算，即用于判断当前的训练样本是否有使用优惠券，并统计因优惠券而下单的训练样本，并增加因优惠券而下单的训练样本的预设的提升值，所述预设的提升值将在下文详细描述。
36.步骤s108，根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。可以理解地，所述预设匹配算法为用户用于根据不同提升值方法不同金额的优惠券，其中，用户的提升值越大，则对所述用户发放的优惠券金额也就越大。
37.上述实施例中，通过获得的提升值得到用户因优惠券的转化率结果，利用提升值结果进行不同提升值匹配不同金额的优惠券策略从而可以精准定制优惠券策略实现效用最大化。
38.请结合参看图2，其为本技术实施例提供的优惠券定价发放模型训练方法的第一子流程图。步骤s102，具体包括如下步骤s202-s208。
39.步骤s202，获取目标人群得到训练样本。可以理解地，用户根据金融产品app上设置优惠券，获取领域优惠券下单的用户和不领取优惠券下单的用户信息得到训练样本。
40.步骤s204，根据相同的用户特征将目标人群进行划分得到对应的目标群体。可以理解地，所述用户特征为用户性别年龄等用户维度、历史消费行为、历史不同优惠卷的反馈等用户特征，将具有相同的用户特征进行划分在一起得到对应的目标群体。
41.步骤s206，对所述目标群体中的一部分通过预设的干预项分发优惠券得到若干已发放优惠券样本，所述预设的干预项为优惠券额度。可以理解地，对同一用户特征对应的所
述目标群体进行划分得到两部分用户，其中服务器对所述一部分用户进行发放优惠券使其成为发放优惠券样本。
42.步骤s208，对所述目标群里中的另一部分不分发优惠券得到若干未发放优惠券样本。可以理解地，根据步骤s206中的另一部分用户，服务器将对其进行优惠券政策的屏蔽，从而使其无法获取到优惠券得到未发放优惠券样本。
43.请结合参看图3，其为本技术实施例提供的优惠券定价发放模型训练方法的第二子流程图。步骤s108，具体包括如下步骤s302-s306。
44.步骤s302，获取不同场景下的优惠券的预算约束及目标用户的提升值。可以理解地，服务器获取用户在不同应用场景下设置的优惠券总金额，及获取根据所述目标模型对用户进行训练得到的每一用户对应的提升值。
45.步骤s304，将所述优惠券按照预设比例进行不同档位的划分。可以理解地，为了实现效益最大化，服务器将根据总金额、发放人数及用户对应的提升值的统计，按照用户预先设置不多个档位，进行优惠券的划分使其得到每一档位和所需发放优惠券的每一用户均有优惠券。
46.步骤s306，根据提升值越大匹配优惠券金额越大的规则对目标用户进行优惠券的发放。可以理解地，采用贪心分发策略进行优惠券的发放，即用户转化率越大，即提升值就越大，提升值越大则对其发放金额越大的优惠券，促使其下单从而实现效益最大化。
47.请结合参看图4，其为本技术实施例提供的优惠券定价发放模型训练方法的第三子流程图。步骤s106，具体包括如下步骤s402-s406。
48.步骤s402，判断所述预设结果中是否存在获取优惠券。可以理解地，所述目标训练模型对用户训练时，判断用户是否存在领取优惠券的动作，当用户存在优惠券的动作时，对所述用户进行标记。
49.步骤s404，当存在获取优惠券时，判断对应训练样本是否进行下单。可以理解地，所述模型检测到用户领取到优惠券时，则对所述用户进行检测直至优惠券时间失效，在优惠券有效期间内，所述模型检测用户是否存在下单行为。
50.步骤s406，当存在获取优惠券并下单时，根据预设的提升值增加所述训练样本的提升值。可以理解地，预设的提升值为根据不同优惠券金额设置的不同提升度，当用户利用当前金额的优惠券下单时，则对用户提升相对应的提升度，则模型获取优惠券金额对应的预设提升度，并在用户领取优惠券下单时，对所述用户进行提升值的增加，所述用户提升值用公式表示为：arg max∑i∑kδp
ik
x
ik
(公式二)，其中δp
ik
是用户i在红包k作用下的转化率(红包转化率-自然转化率)，x
ik
是用户i是否发放红包k。
51.请结合参看图5，其为本技术实施例提供的优惠券定价发放模型训练方法的第四子流程图。具体包括如下步骤s502-s506。
52.步骤s502，获取初始模型输出的若干未发放优惠券样本和若干已发放优惠券样本对应的输出结果。可以理解地，训练样本在初始模型中训练后会对所述每一样本的输出结果进行统计得到待处理结果。
53.步骤s504，将若干未发放优惠券样本的输出结果与若干已发放优惠券样本的输出结果进行对比得到对比结果。可以理解地，用户将所述模型统计的所述若干未发放优惠券样本的输出结果和若干已发放优惠券样本的输出结果进行效益对比以判断优惠政策是否
存在问题。
54.步骤s506，当所述对比结果与预设结果不一致时，调整训练模型策略。可以理解地，用户预先对每一优惠券发放政策都会设置效益结果，且所述效益结果是结合未发放优惠券时的总收益得到的，当对比结果中发放优惠券样本的输出结果低于预设结果时，则用户将会转变优惠券策略，再次进行训练使之找到最适合的训练策略。
55.请结合参看图6，其为本技术实施例提供的优惠券定价发放模型训练装置的示意图。所述优惠券定价发放模型训练装置1000包括：获取模块100、训练模块200、计算模块300和发放模块400。
56.获取模块100，用于获取训练样本，所述训练样本为同一用户特征下的若干未发放的优惠券样本和若干已发放优惠券样本。
57.训练模块200，用于将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况。
58.计算模块300，用于通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的。
59.发放模块400，用于根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。
60.请结合参看图7，其为本技术实施例提供的获取模块示意图。所述获取模块100包括取得单元101、划分单元102、第一分发单元103和第二分发单元104。
61.取得单元101，用于获取目标人群得到训练样本。
62.划分单元102，用于根据相同的用户特征将目标人群进行划分得到对应的目标群体。
63.第一分发单元103，用于对所述目标群体中的一部分通过预设的干预项分发优惠券得到若干已发放优惠券样本，所述预设的干预项为优惠券额度。
64.第二分发单元104，用于对所述目标群里中的另一部分不分发优惠券得到若干未发放的优惠券样本。
65.请结合参看图8，其为本技术实施例提供的发放模块示意图。所述发放模块400包括获得单元401、和区分单元402。
66.获得单元，用于获取不同场景下的优惠券的预算约束及目标用户的提升值。
67.区分单元，用于将所述优惠券按照预设比例进行不同档位的划分。
68.匹配单元，用于根据提升值越大匹配优惠券金额越大的规则对目标用户进行优惠券的发放。
69.请结合参看图9，其为本技术实施例提供的计算机设备的内部结构示意图。计算机设备10包括计算机可读存储介质11、处理器12以及总线13。其中，计算机可读存储介质11至少包括一种类型的可读存储介质，该可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，sd或dx存储器等)、磁性存储器、磁盘、光盘等。计算机可读存储介质11在一些实施例中可以是计算机设备10的内部存储单元，例如计算机设备10的硬盘。计算机可读存储介质11在另一些实施例中也可以是的外部计算机设备10存储设备，例如计算机设备10上配备的插接式硬盘、智能存储卡(smart media card，smc)、安全数字(secure digital，sd)卡、闪存卡(flash card)等。进一步地，计算机可读存储介质11还可以既包括计算机设备10的内
部存储单元也包括外部存储设备。计算机可读存储介质11不仅可以用于存储安装于计算机设备10的应用软件及各类数据，还可以用于暂时地存储已经输出或者将要输出的数据。
70.总线13可以是外设部件互连标准(peripheral component interconnect，pci)总线或扩展工业标准结构(extended industry standard architecture，eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图9中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
71.进一步地，计算机设备10还可以包括显示组件14。显示组件14可以是发光二极管(light emitting diode，led)显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(organic light-emitting diode，oled)触摸器等。其中，显示组件14也可以适当的称为显示装置或显示单元，用于显示在计算机设备10中处理的信息以及用于显示可视化的用户界面。
72.进一步地，计算机设备10还可以包括通信组件15。通信组件15可选地可以包括有线通信组件和/或无线通信组件，如wi-fi通信组件、蓝牙通信组件等，通常用于在计算机设备10与其他智能控制设备之间建立通信连接。
73.处理器12在一些实施例中可以是一中央处理器(central processing unit，cpu)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行计算机可读存储介质11中存储的程序代码或处理数据。具体地，处理器12执行处理程序以控制计算机设备10实现优惠券定价发放模型训练方法。
74.可以理解地，图9仅示出了具有组件11-15以及优惠券定价发放模型训练方法的计算机设备10，本领域技术人员可以理解的是，图9示出的结构并不构成对计算机设备10的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。
75.显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘且本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。
76.以上所列举的仅为本技术较佳实施例而已，当然不能以此来限定本技术之权利范围，因此依本技术权利要求所作的等同变化，仍属于本技术所涵盖的范围。

技术特征：
1.一种优惠券定价发放模型训练方法，其特征在于，所述优惠券定价发放模型训练方法包括：获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本；将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况；通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的；根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。2.如权利要求1所述的优惠券定价发放模型训练方法，其特征在于，所述获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本具体包括：获取目标人群得到训练样本；根据相同的用户特征将目标人群进行划分得到对应的目标群体；对所述目标群体中的一部分通过预设的干预项分发优惠券得到若干已发放优惠券样本，所述预设的干预项为优惠券额度；对所述目标群里中的另一部分不分发优惠券得到若干未发放优惠券样本。3.如权利要求1所述的优惠券定价发放模型训练方法，其特征在于，所述根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券具体包括：获取不同场景下的优惠券的预算约束及目标用户的提升值；将所述优惠券按照预设比例进行不同档位的划分；根据提升值越大匹配优惠券金额越大的规则对目标用户进行优惠券的发放。4.如权利要求1所述的优惠券定价发放模型训练方法，其特征在于，所述预设的提升值具体包括：判断所述预设结果中是否存在获取优惠券；当存在获取优惠券时，判断对应训练样本是否进行下单；当存在获取优惠券并下单时，根据预设的提升值增加所述训练样本的提升值。5.如权利要求1所述的优惠券定价发放模型训练方法，其特征在于，所述预设预期算法为：，其中，y为预期效益结果，x为训练样本，t为干预项，1为有干预，0为没有干预。6.如权利要求1所述的优惠券定价发放模型训练方法，其特征在于，所述方法还包括：获取初始模型输出的若干未发放优惠券样本和若干已发放优惠券样本对应的输出结果；将若干未发放优惠券样本的输出结果与若干已发放优惠券样本的输出结果进行对比得到对比结果；当所述对比结果与预设结果不一致时，调整训练模型策略。7.一种优惠券定价发放模型训练装置，其特征在于，所述优惠券定价发放模型训练装置具体包括：
获取模块，用于获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本；训练模块，用于将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况；计算模块，用于通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的；发放模块，用于根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。8.如权利要求7所述的优惠券定价发放模型训练装置，其特征在于，所述获取模块具体包括：取得单元，用于获取目标人群得到训练样本；划分单元，用于根据相同的用户特征将目标人群进行划分得到对应的目标群体；第一分发单元，用于对所述目标群体中的一部分通过预设的干预项分发优惠券得到若干已发放优惠券样本，所述预设的干预项为优惠券额度；第二分发单元，用于对所述目标群里中的另一部分不分发优惠券得到若干未发放优惠券样本。9.如权利要求7所述的优惠券定价发放模型训练装置，其特征在于，所述发放模块具体包括：获得单元，用于获取不同场景下的优惠券的预算约束及目标用户的提升值；区分单元，用于将所述优惠券按照预设比例进行不同档位的划分；匹配单元，用于根据提升值越大匹配优惠券金额越大的规则对目标用户进行优惠券的发放。10.一种计算机设备，其特征在于，所述计算机设备具体包括：计算机可读存储介质，用于存储程序指令；以及处理执行所述程序指令以实现如权利要求1至6中任一项的优惠券定价发放模型训练方法。

技术总结
本申请提供了一种优惠券定价发放模型训练方法，包括：获取训练样本，所述训练样本为同一用户特征下的若干未发放优惠券样本和若干已发放优惠券样本；将所述训练样本输入至初始训练模型进行训练得到每一训练样本对应的预测结果，所述预测结果包括是否领取优惠券及对应的下单情况；通过预设预期算法对所述预测结果进行计算得到每一训练样本的预期结果及预设的提升值，所述提升值为领取优惠券下单得到的；根据预设匹配算法对不同提升值的目标用户发放不同金额的优惠券。本申请技术方案能够更加智能的对优惠券进行定价发放。加智能的对优惠券进行定价发放。加智能的对优惠券进行定价发放。

技术研发人员：曹嘉杰贺雪琦
受保护的技术使用者：平安银行股份有限公司
技术研发日：2023.03.29
技术公布日：2023/7/12

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种锚索及锚杆锁具剖切器的制作方法 下一篇：一种便于散热的电视机塑料顶盖的制作方法

优惠券定价发放模型训练方法、装置及计算机设备与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

优惠券定价发放模型训练方法、装置及计算机设备与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表