消息推送、模型训练方法、电子设备和存储介质与流程

未命名 07-15 阅读：176 评论：0

1.本技术涉及计算机技术领域，尤其涉及一种消息推送、模型训练方法、电子设备和存储介质。

背景技术：

2.随着智能眼镜的发展，越来越多的应用场景中，需要把手机上的提醒、消息同步推送到智能眼镜的显示屏上，但是手机上信息、提醒太多，智能眼镜的屏幕上放不下这么多提醒，特别是不重要的提醒，没有必要推送到智能眼镜上，太多的提醒会干扰用户的视线，严重影响体验。
3.现有的方案是基于规则或者神经网络来对所有消息排序，选择优先级高的通知消息推送到智能眼镜上。对选择应用程序(application，app)消息推送的策略，是随着时间变化需要更新的，而且每个用户习惯和爱好不一样，需要根据用户习惯定制个性化推送消息，这都需要经常更新模型。现在模型的训练代价比较大，不能做到即时更新模型。

技术实现要素：

4.本技术提供一种消息推送、模型训练方法、电子设备和存储介质，用以解决如何实时根据用户的喜好将通知消息推送至可穿戴设备的问题。
5.第一方面，本技术提供了一种消息推送方法，包括：
6.接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；
7.在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；
8.基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。
9.在一些实施例中，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备之后，还包括：
10.获取所述可穿戴设备上的埋点数据；
11.将所述可穿戴设备上的埋点数据发送至所述服务器；
12.所述可穿戴设备上的埋点数据用于更新所述第一模型和所述第二模型。
13.在一些实施例中，所述第一模型的更新频率大于所述第二模型的更新频率。
14.在一些实施例中，所述在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级，包括：
15.将所述通知消息关联的目标特征输入所述第一模型，确定所述通知消息的得分；
16.基于所述通知消息的得分，确定所述通知消息的优先级。
17.在一些实施例中，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备，包括：
18.基于所述通知消息的优先级，对所述通知消息进行排序；
19.将排序为前预设数量的通知消息，作为待推送消息；
20.将所述待推送消息推送至所述可穿戴设备。
21.在一些实施例中，所述埋点数据，包括：用户查看通知消息的行为数据。
22.第二方面，本技术提供了一种消息推送模型的训练方法，包括：
23.通过采集到的所有用户的埋点数据训练得到第二模型；
24.将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；
25.通过所述目标用户的埋点数据微调所述第二模型得到第一模型；
26.将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
27.第三方面，本技术提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述的方法。
28.第四方面，本技术提供了一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述的方法。
29.第五方面，本技术提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述的方法。
30.本技术提供的消息推送、模型训练方法、电子设备和存储介质，在服务器上通过采集到的目标用户的埋点数据对第二模型进行训练得到第一模型，第一模型所需的训练数据量小并且训练所需时间短，可以即时训练生成个性化推理模型，并节省了训练开销，从而终端可以根据用户的喜好实时将通知消息推送至可穿戴设备，提高了用户体验。
附图说明
31.为了更清楚地说明本技术或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本技术的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
32.图1为本技术一个实施例提供的消息推送方法的流程示意图之一；
33.图2为本技术一个实施例提供的消息推送方法的流程示意图之二；
34.图3为本技术一个实施例提供的消息推送系统的部署示意图；
35.图4为本技术一个实施例提供的第一模型的结构示意图；
36.图5为本技术一个实施例提供的服务器、手机和智能眼镜之间的交互示意图之一；
37.图6为本技术一个实施例提供的服务器、手机和智能眼镜之间的交互示意图之二；
38.图7为本技术一个实施例提供的消息推送模型的训练方法的流程示意图；
39.图8为本技术一个实施例提供的消息推送装置的结构示意图；
40.图9为本技术一个实施例提供的消息推送模型的训练装置的结构示意图；
41.图10为本技术一个实施例提供的电子设备的结构示意图。
具体实施方式
42.为使本技术的目的、技术方案和优点更加清楚，下面将结合本技术中的附图，对本技术中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
43.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换，以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”所区别的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”一般表示前后关联对象是一种“或”的关系。
44.随着智能眼镜的发展，越来越多的应用场景中，需要把手机上的提醒、消息同步推送到智能眼镜的显示屏上，但是手机上信息、提醒太多，信息爆炸，智能眼镜的屏幕上放不下这么多提醒，特别是不重要的提醒，没有必要推送到智能眼镜上，太多的提醒会干扰用户的视线，严重影响体验。
45.现有的方案是基于规则或者神经网络来对所有消息排序，选择优先级高的通知消息推送到智能眼镜上。对选择app消息推送的策略，随着时间变化需要更新的，而且每个用户习惯和爱好不一样，需要根据用户习惯定制个性化推送消息，这都需要经常更新模型。现在模型的训练代价比较大，所以不能够做到即时更新模型。
46.为此，本技术提供了一种消息推送、模型训练方法、电子设备和存储介质，在服务器上通过采集到的目标用户的埋点数据对第二模型进行训练得到第一模型，第一模型所需的训练数据量小并且训练所需时间短，可以即时训练生成个性化推理模型，并节省了训练开销，从而终端可以根据用户的喜好实时将通知消息推送至可穿戴设备，提高了用户体验。
47.本技术提供的消息推送方法适用于终端设备。
48.在一些实施例中，终端(终端设备)包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其它处理设备，例如，手机、平板、台式笔记本以及可以运行应用程序的智能设备，包括智能汽车的中央控制台等。具体可以指用户设备(user equipment，ue)、接入终端、用户单元、用户站、移动站、移动台、远方站、远程终端、移动设备、用户终端、终端、无线通信设备、用户代理或用户装置。终端设备还可以是卫星电话、蜂窝电话、智能手机、无线数据卡、无线调制解调器、机器类型通信设备、可以是无绳电话、会话启动协议(session initiation protocol，sip)电话、无线本地环路(wireless local loop，wll)站、个人数字处理(personal digital assistant，pda)、具有无线通信功能的手持设备、计算设备或连接到无线调制解调器的其它处理设备、车载设备或可穿戴设备，虚拟现实(virtual reality，vr)终端设备、增强现实(augmented reality，ar)终端设备、工业控制(industrial control)中的无线终端、无人驾驶(self-driving)中的无线终端、远程医疗(remote medical)中的无线终端、智能电网(smart grid)中的无线终端、运输安全(transportation safety)中的无线终端、智慧城市(smart city)中的无线终端、智慧家庭(smart home)中的无线终端、5g网络或者未来通信网络中的终端设备等。终端可以由电池供电，还可以附接到车辆或者船舶的电源系统，并由车辆或者船舶的电源系
统供电。车辆或者船舶的电源系统还可以为终端的电池充电，以延长终端的通信时间。
49.图1为本技术实施例提供的消息推送方法的流程示意图之一。如图1所示，提供了一种消息推送方法，包括以下步骤：步骤101、步骤102和步骤103。该方法流程步骤仅仅作为本技术一个可能的实现方式。
50.步骤101、接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；
51.步骤102、在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；
52.步骤103、基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。
53.可选地，本技术实施例提供的消息推送方法的执行主体为终端，终端可以为手机、平板或电脑等设备。可穿戴设备可以为智能眼镜、智能手环等设备。终端与可穿戴设备之间可以通过蓝牙进行连接。
54.下面以终端为手机，可穿戴设备为智能眼镜为例，来说明本技术实施例提供的消息推送方法。
55.在步骤101中，接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的。
56.服务器与手机之间可以通过无线4g/5g进行通信。第一模型和第二模型都是在服务器上训练得到的，第一模型和第二模型的作用相同，都是用来确定通知消息的优先级，但是二者的训练数据是不同的。
57.第二模型是利用全量数据训练得到的模型，全量数据为采集到的所有用户的埋点数据，数据量大，训练时间比较长。训练数据是针对所有用户或者很大一部分用户。第二模型为通用模型，没有个性化特点。
58.第一模型是在第二模型的基础上，利用目标用户的埋点数据进行微调得到的模型，数据量小，训练时间比较短。训练数据是针对目标用户。第一模型既有通用模型的特点，同时也具有用户特有的特点。
59.其中，埋点数据是在手机上进行埋点采集到的数据，可以是用户查看通知消息的行为数据，包括用户在某些app的特定位置的特定行为，例如出现广告消息推送时，用户清除了这个推送消息，说明用户对该广告消息不感兴趣；推送了抢红包消息，用户点击打开了抢红包界面，说明用户对抢红包消息感兴趣。
60.通常第二模型在系统刚刚部署时还没有特定用户数据，所有用户的手机上都只能部署第二模型。经过一段时间(t1)的使用后，每个手机上都采集到了一些历史数据，包含用户的使用习惯，爱好等。此时，第二模型已经不适合该用户，系统会收集到一些该用户的历史埋点数据，在第二模型的基础上进行微调，得到第一模型，下发到该用户的手机上，作为该用户独有的推理模型。
61.在经过更长一段时间(t2，t2》t1)的使用后，系统收集了更多用户的更多数据，服务器用所有用户的埋点数据进行第二模型的迭代，花很长的时间和更多的算力训练出新的
第二模型，此时可以将新的第二模型部署到所有用户的手机上，也可以对第二模型进行一次单用户的微调再下发到每个用户的手机上。
62.在服务器上对第二模型训练完成后，再对第二模型进行微调得到第一模型，并将第一模型发送至手机。
63.在步骤102中，在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级。
64.通知消息可以是手机上所安装的app推送的消息，例如可以是新闻资讯、广告推送、购物推荐等各类消息。
65.手机接收到app推送的通知消息后，由于通知消息的数量较多，不能将其全部推送至智能眼镜，因为智能眼镜的显示屏较小，不能同时显示所有的通知消息。
66.因此，手机可以通过接收的第一模型，对通知消息进行推理，确定各个通知消息的优先级。优先级越高，表明用户对该通知消息的兴趣越高。
67.在步骤103中，基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。
68.手机在确定各个通知消息的优先级后，将优先级最高的预设数量个通知消息作为待推送消息，并将该预设数量个待推送消息推送至智能眼镜，智能眼镜接收到手机推送的通知消息后，可以将通知消息显示在智能眼镜的显示屏上。从而佩戴智能眼镜的用户实时看到的消息都是自己感兴趣的内容，提高了用户体验。
69.在本技术实施例中，在服务器上通过采集到的目标用户的埋点数据对第二模型进行训练得到第一模型，第一模型所需的训练数据量小并且训练所需时间短，可以即时训练生成个性化推理模型，并节省了训练开销，从而终端可以根据用户的喜好实时将通知消息推送至可穿戴设备，提高了用户体验。
70.需要说明的是，本技术每一个实施方式可以自由组合、调换顺序或者单独执行，并不需要依靠或依赖固定的执行顺序。
71.在一些实施例中，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备之后，还包括：
72.获取所述可穿戴设备上的埋点数据；
73.将所述可穿戴设备上的埋点数据发送至所述服务器；
74.所述可穿戴设备上的埋点数据用于更新所述第一模型和所述第二模型。
75.手机根据通知消息的优先级，将通知消息推送至智能眼镜之后，可以在智能眼镜上也进行埋点，采集智能眼镜上的埋点数据。
76.将智能眼镜上采集的埋点数据，和手机上采集的埋点数据，统一发送到服务器。服务器接收埋点数据后，可以定时对第二模型进行全量数据训练，以及对第一模型进行微调，从而更新第一模型和第二模型。
77.可理解地，第二模型的训练数据为全量数据，即需要采集到足够多的用户的埋点数据后，才能对第二模型进行训练，从而更新第二模型。第二模型的训练量较大，训练所需的时间较长。因此，第二模型训练的周期较长。
78.第一模型只需要根据单个用户的埋点数据就可以进行训练，从而进行更新。第一模型的训练量较小，训练所需的时间较短。因此，第一模型训练的周期较短。
79.通过闭环的更新方式，可以随着用户习惯的改变，将模型更新得更适合用户的兴趣和习惯，提高第一模型和第二模型的准确度。
80.在本技术实施例中，通过在终端和可穿戴设备上采集埋点数据，采集到的埋点数据进一步用于更新第一模型和第二模型，在使用中学习，通过闭环的更新方式，随着用户习惯的改变，可以即时更新模型，将模型训练得更适合用户的兴趣和习惯，从而终端可以根据更新的模型将通知消息准确推送至可穿戴设备，进一步提高了用户体验。
81.在一些实施例中，所述第一模型的更新频率大于所述第二模型的更新频率。
82.手机将智能眼镜上采集的埋点数据以及在手机上采集的埋点数据，统一发送到服务器。服务器接收埋点数据后，可以定时对第二模型进行全量数据训练，以及对第一模型进行微调，从而更新第一模型和第二模型。
83.可理解地，第二模型的训练数据为全量数据，即需要采集到足够多的用户的埋点数据后，才能对第二模型进行训练，并且，第二模型训练量较大，训练所需的时间较长。因此，第二模型训练的周期较长，更新频率较低。
84.第一模型只需要根据单个用户的埋点数据就可以进行训练，因此，第一模型训练量较小，训练所需的时间较短。因此，第一模型训练的周期较短，更新频率较高。
85.通常第二模型在系统刚刚部署时还没有特定用户数据，所有用户的手机上都只能部署第二模型。经过一段时间(t1)的使用后，每个手机上都采集到了一些历史数据，包含用户的使用习惯，爱好等。此时，第二模型已经不适合该用户，系统会收集到一些该用户的历史埋点数据，在第二模型的基础上进行微调，得到第一模型，下发到该用户的手机上，作为该用户独有的推理模型。
86.在经过更长一段时间(t2，t2》t1)的使用后，系统收集了更多用户的更多数据，服务器用所有用户的埋点数据进行第二模型的迭代，花很长的时间和更多的算力训练出新的第二模型，此时可以将新的第二模型部署到所有用户的手机上，也可以对第二模型进行一次单用户的微调再下发到每个用户的手机上。
87.例如，第一模型的更新频率为每周更新一次，第二模型的更新频率为每月更新一次。服务器根据手机发送的目标用户的埋点数据，每隔一周对第一模型更新一次，并将更新后的第一模型发送至手机，从而使得第一模型更符合用户的爱好习惯。并且，服务器根据手机发送的所有用户的埋点数据，每隔一月对第二模型进行更新，在第二模型更新完之后，则将更新后的第二模型发送到手机上，或者使用目标用户的埋点数据对更新后的第二模型再进行微调再下发到手机上。从而手机可以根据更新后的模型进行推理，更准确的确定通知消息的优先级。
88.在本技术实施例中，通过在服务器上采用不同的训练数据和频率来更新第一模型和第二模型，可以达到即时更新个性化推理模型的效果，节省了训练开销。
89.在一些实施例中，所述在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级，包括：
90.将所述通知消息关联的目标特征输入所述第一模型，确定所述通知消息的得分；
91.基于所述通知消息的得分，确定所述通知消息的优先级。
92.手机接收到app推送的通知消息后，将通知消息所关联的目标特征输入至第一模型，第一模型通常是基于卷积神经网络的或者循环神经网络的。
93.手机上神经网络推理通常利用某个推理平台或者神经网络编译器编译，在特定硬件上加速运行，常见的推理平台包含：tflite、onnxruntime、mnn、ncnn、tengine、tvm等。当然也可以开发自己的推理平台或者编译器。
94.目标特征可以包括用户的固有特征，动态特征和历史数据等。
95.其中，用户的固有特征可以是：用户的性别，用户的年龄和用户的职业等特征。
96.动态特征可以是：日期、时间、地点等特征。
97.历史数据可以是：前几次运行的app、历史用户行为等特征。
98.第一模型的输出是各个通知消息的得分，根据得分可以确定通知消息的优先级，得分越高则优先级最高。即通过第一模型可以结合用户的行为特征以及当前的时间、地点特征确定通知消息的优先级。
99.在本技术实施例中，通过第一模型可以准确确定通知消息的优先级，从而可以准确的将通知消息推送给可穿戴设备，符合用户的使用习惯，进一步提高了用户体验度。
100.在一些实施例中，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备，包括：
101.基于所述通知消息的优先级，对所述通知消息进行排序；
102.将排序为前预设数量的通知消息，作为待推送消息；
103.将所述待推送消息推送至所述可穿戴设备。
104.第一模型的输出是各个通知消息的得分，根据得分可以确定通知消息的优先级，得分越高则优先级最高。
105.根据优先级对各个通知消息进行排序，将排序为前预设数量的通知消息，作为待推送消息，并将待推送消息推送至智能眼镜，从而只能智能眼镜可以将接收的通知消息显示在屏幕上，佩戴智能眼镜的用户可以实时看到推送的通知消息。
106.在本技术实施例中，根据通知消息的优先级，将通知消息推送至可穿戴设备，符合用户的使用习惯，进一步提高了用户体验度。
107.图2为本技术实施例提供的消息推送方法的流程示意图之二，如图2所示，提供了一种消息推送方法，包括以下步骤：步骤201至步骤206。该方法流程步骤仅仅作为本技术一个可能的实现方式。
108.图3为本技术实施例提供的消息推送系统的部署示意图，图4为本技术一个实施例提供的第一模型的结构示意图，图5为本技术实施例提供的服务器、手机和智能眼镜之间的交互示意图之一，图6为本技术实施例提供的服务器、手机和智能眼镜之间的交互示意图之二。
109.下面结合图2至图6，对本技术实施例提供的消息推送方法进行详细描述。
110.如图3所示，整个系统部署在3个地方，包括：服务器、手机和智能眼镜。服务器与手机之间通过无线4g/5g通信，手机和智能眼镜之间通过蓝牙通信，第二模型在服务器上训练，第一模型可以在服务器或者手机上训练，推理在手机上。
111.如图2所示，消息推送方法可以包括：
112.步骤201、第二模型训练和第一模型微调；
113.第二模型和第一模型的作用是相同的，第二模型指重新用全量数据训练的模型，数据量大训练时间比较长，数据是针对所有人或者很大一部分人，训练出来的模型是通用
模型，没有个性化特点。第一模型是指在第二模型的基础上利用用户私有数据进行微调得到的模型，既有通用模型的特点，又带有该用户特有的特点。
114.通常第二模型在系统刚刚部署时还没有特定用户数据，所有用户的手机上都只能部署第二模型。经过一段时间(t1)的使用后，每个手机上都采集到了一些历史数据，包含用户的使用习惯，爱好等。此时，第二模型已经不适合该用户，系统会收集到一些该用户的历史埋点数据，在第二模型的基础上进行微调，得到第一模型，下发到该用户的手机上，作为该用户独有的推理模型。
115.在经过更长一段时间(t2，t2》t1)的使用后，系统收集了更多用户的更多数据，服务器用所有用户的埋点数据进行第二模型的迭代，花很长的时间和更多的算力训练出新的第二模型，此时可以将新的第二模型部署到所有用户的手机上，也可以对第二模型进行一次单用户的微调再下发到每个用户的手机上。
116.步骤202、模型下发到手机；
117.经过步骤201训练或者微调的模型，被重新下发到手机或者智能眼镜上。模型通常是基于卷积神经网络的或者循环神经网络的。
118.图4为本技术一个实施例提供的第一模型的结构示意图，第一模型与和第二模型的结构相同。如图4所示，模型包括：嵌入层、卷积层、归一化层(bn)、激活层、全连接层和softmax层。
119.通过将卷积层、归一化层、激活层集成为一个子单元(block)，整个系统可以有1个或者多个block。当系统较复杂，需要拟合的数据比较多时，可以将多个block串联起来。
120.模型的输入特征可以为：用户性别、年龄、职业、日期、时间、地点，用户历史数据等。
121.模型的输出是所有app消息的得分，得分最高的预设数量个作为推送到智能眼镜的候选消息。
122.步骤203、手机上推理；
123.如图5所示，每次手机收到新的app消息，就是用步骤202的模型做一次推理，推理的输入包含：
124.用户的固有特征：性别、年龄、职业等；
125.动态特征：日期、时间、地点等；
126.历史数据：前几次运行的app、历史用户行为等。
127.神经网络推理输出是所有种类消息对应的得分，得分最高的预设数量个消息作为候选消息。
128.手机上神经网络推理通常利用某个推理平台或者神经网络编译器编译，在特定硬件上加速运行，常见的推理平台包含：tflite、onnxruntime、mnn、ncnn、tengine、tvm。当然也可以开发自己的推理平台或者编译器。
129.步骤204、手机消息推送到智能眼镜；
130.经过步骤203获得预设数量个app消息，通过蓝牙推送到智能眼镜上。
131.步骤205、智能眼镜上消息展示；
132.智能眼镜收到手机推送的信息，把它们显示在智能眼镜上。智能眼镜上的信息和手机上不一样，手机上收到的信息可以在标题栏显示图标，然后在下拉菜单中详细展示，智
能眼镜上界面很难折叠，类似手机状态栏看不清楚，只能显示在智能眼镜上部分，所以能同时展示的消息数量有限。而且智能眼镜上展示消息时常常干扰到用户对前方正常观察，所以只能展示部分信息。
133.步骤206、埋点数据收集；
134.埋点数据是指在用户在某些app的特定位置的特定行为，例如手机出现广告推送时用户清除了这个推送，说明用户不感兴趣；手机推送了抢红包消息，用户点击打开了抢红包界面，说明用户对抢红包消息感兴趣。
135.类似的用户行为可作为后续模型训练和微调的数据样本，将模型训练得更适合用户的兴趣和习惯。
136.数据埋点范围比较广，手机和智能眼镜上都需要埋点，收集到的埋点数据集中到手机上，统一发送到服务器。
137.如图6所示，埋点数据由手机采集后发送到服务器，服务器定时的进行全量数据训练和微调。这样形成一个闭环，系统的准确度越来越好。
138.在本技术实施例中，通过使用不同频率和不同数据来训练第一模型和第二模型，实现即时更新个性化推理模型，又节省了训练开销，并且采用闭环的方式进行信息收集、训练、更新循环流程，在使用中学习，使得模型越来越准确。
139.本技术提供的消息推送模型的训练方法适用于服务器。
140.图7为本技术提供的消息推送模型的训练方法的流程示意图，如图7所示，提供了一种消息推送模型的训练方法，包括以下步骤：步骤701、步骤702、步骤703和步骤704。该方法流程步骤仅仅作为本技术一个可能的实现方式。
141.步骤701、通过采集到的所有用户的埋点数据训练得到第二模型；
142.步骤702、将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；
143.步骤703、通过所述目标用户的埋点数据微调所述第二模型得到第一模型；
144.步骤704、将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
145.可选地，本技术实施例提供的消息推送模型的训练方法的执行主体为服务器。目标用户终端可以为手机、平板或电脑等设备。可穿戴设备可以为智能眼镜、智能手环等设备。目标用户终端与可穿戴设备之间可以通过蓝牙进行连接。
146.下面以目标用户终端为手机，可穿戴设备为智能眼镜为例，来说明本技术实施例提供的消息推送模型的训练方法。
147.在步骤701中，通过采集到的所有用户的埋点数据训练得到第二模型。
148.服务器与手机之间可以通过无线4g/5g进行通信。
149.第二模型是利用全量数据训练得到的模型，全量数据为采集到的所有用户的埋点数据，数据量大，训练时间比较长。训练数据是针对所有用户或者很大一部分用户。在服务器上训练得到的第二模型为通用模型，没有个性化特点。
150.埋点数据是在手机上进行埋点采集到的数据，可以是用户查看通知消息的行为数
据，包括用户在某些app的特定位置的特定行为，例如出现广告消息推送时，用户清除了这个推送消息，说明用户对该广告消息不感兴趣；推送了抢红包消息，用户点击打开了抢红包界面，说明用户对抢红包消息感兴趣。
151.步骤702中，将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据。
152.服务器将第二模型发送到手机上，通常第二模型在系统刚刚部署时还没有特定用户数据，所有用户的手机上都只能部署第二模型。
153.经过一段时间(t1)的使用后，每个手机上都采集到了一些目标用户的历史数据，包含用户的使用习惯，爱好等。
154.步骤703中，通过所述目标用户的埋点数据微调所述第二模型得到第一模型。
155.服务器根据收集到的目标用户的埋点数据，在第二模型的基础上进行微调，得到第一模型。
156.即第一模型和第二模型都是在服务器上训练得到的，第一模型和第二模型的作用相同，都是用来确定通知消息的优先级，但是二者的训练数据是不同的。
157.第一模型是在第二模型的基础上，利用目标用户的埋点数据进行微调得到的模型，数据量小，训练时间比较短。训练数据是针对目标用户。第一模型既有通用模型的特点，同时也具有目标用户特有的特点。
158.步骤704中，将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
159.服务器将微调后得到的第一模型，下发到该用户的手机上，作为该用户独有的推理模型。
160.通知消息可以是手机上所安装的app推送的消息，例如可以是新闻资讯、广告推送、购物推荐等各类消息。
161.手机接收到app推送的通知消息后，由于通知消息的数量较多，不能将其全部推送至智能眼镜，因为智能眼镜的显示屏较小，不能同时显示所有的通知消息。
162.因此，手机可以通过接收的第一模型，对通知消息进行推理，确定各个通知消息的优先级。优先级越高，表明用户对该通知消息的兴趣越高。
163.手机在确定各个通知消息的优先级后，将优先级最高的预设数量个通知消息作为待推送消息，并将该预设数量个待推送消息推送至智能眼镜，智能眼镜接收到手机推送的通知消息后，可以将通知消息显示在智能眼镜的显示屏上。从而佩戴智能眼镜的用户实时看到的消息都是自己感兴趣的内容，提高了用户体验。
164.可选地，手机根据通知消息的优先级，将通知消息推送至智能眼镜之后，可以在智能眼镜上也进行埋点，采集智能眼镜上的埋点数据。
165.手机将智能眼镜上采集的埋点数据以及在手机上采集的埋点数据，统一发送到服务器。服务器接收埋点数据后，可以定时对第二模型进行全量数据训练，以及对第一模型进行微调，从而更新第一模型和第二模型。
166.可理解地，第二模型的训练数据为全量数据，即需要采集到足够多的用户的埋点
数据后，才能对第二模型进行训练，并且，第二模型训练量较大，训练所需的时间较长。因此，第二模型训练的周期较长，更新频率较低。
167.第一模型只需要根据单个用户的埋点数据就可以进行训练，因此，第一模型训练量较小，训练所需的时间较短。因此，第一模型训练的周期较短，更新频率较高。
168.例如，第一模型的更新频率为每周更新一次，第二模型的更新频率为每月更新一次。服务器根据手机发送的目标用户的埋点数据，每隔一周对第一模型更新一次，并将更新后的第一模型发送至手机，从而使得第一模型更符合用户的爱好习惯。并且，服务器根据手机发送的所有用户的埋点数据，每隔一月对第二模型进行更新，在第二模型更新完之后，则将更新后的第二模型发送到手机上，或者使用目标用户的埋点数据对更新后的第二模型再进行微调再下发到手机上。从而手机可以根据更新后的模型进行推理，更准确的确定通知消息的优先级。
169.在本技术实施例中，通过在服务器上采用不同的训练数据和频率来更新第一模型和第二模型，可以达到即时更新个性化推理模型的效果，节省了训练开销，并且采用闭环的方式进行信息收集、训练、更新循环流程，在使用中学习，随着用户习惯的改变，将模型训练得更适合用户的兴趣和习惯，提高第一模型和第二模型的准确度，从而终端可以根据用户的喜好实时将通知消息推送至可穿戴设备，提高了用户体验。
170.下面对本技术实施例提供的消息推送装置进行描述，下文描述的消息推送装置与上文描述的消息推送方法可相互对应参照。
171.图8为本技术提供的消息推送装置的结构示意图，如图8所示，该装置包括：
172.接收模块810，用于接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；
173.确定模块820，用于在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；
174.推送模块830，用于基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。
175.在一些实施例中，还包括：更新模块，用于：
176.获取所述可穿戴设备上的埋点数据；
177.将所述可穿戴设备上的埋点数据发送至所述服务器；
178.所述可穿戴设备上的埋点数据用于更新所述第一模型和所述第二模型。
179.在一些实施例中，所述第一模型的更新频率大于所述第二模型的更新频率。
180.在一些实施例中，所述确定模块820，用于：
181.将所述通知消息关联的目标特征输入所述第一模型，确定所述通知消息的得分；
182.基于所述通知消息的得分，确定所述通知消息的优先级。
183.在一些实施例中，所述推送模块830，用于：
184.基于所述通知消息的优先级，对所述通知消息进行排序；
185.将排序为前预设数量的通知消息，作为待推送消息；
186.将所述待推送消息推送至所述可穿戴设备。
187.在一些实施例中，所述埋点数据，包括：用户查看通知消息的行为数据。
188.在此需要说明的是，本技术实施例提供的消息推送装置，能够实现上述消息推送方法实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
189.下面对本技术实施例提供的消息推送模型的训练装置进行描述，下文描述的消息推送模型的训练装置与上文描述的消息推送模型的训练方法可相互对应参照。
190.图9为本技术实施例提供的消息推送模型的训练装置的结构示意图，如图9所示，该装置包括：
191.训练模块910，用于通过采集到的所有用户的埋点数据训练得到第二模型；
192.第一发送模块920，用于将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；
193.微调模块930，用于通过所述目标用户的埋点数据微调所述第二模型得到第一模型；
194.第二发送模块940，用于将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
195.在此需要说明的是，本技术实施例提供的消息推送模型的训练装置，能够实现上述消息推送模型的训练实施例所实现的所有方法步骤，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。
196.图10示例了一种电子设备的实体结构示意图，如图10所示，该电子设备可以包括：处理器(processor)1010、通信接口(communications interface)1020、存储器(memory)1030和通信总线1040，其中，处理器1010，通信接口1020，存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令，以执行消息推送方法或消息推送模型的训练方法，该消息推送方法包括：接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。消息推送模型的训练方法包括：通过采集到的所有用户的埋点数据训练得到第二模型；将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；通过所述目标用户的埋点数据微调所述第二模型得到第一模型；将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
197.此外，上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施
例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
198.另一方面，本技术还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法实施例所提供的消息推送方法或消息推送模型的训练方法，该消息推送方法包括：接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。消息推送模型的训练方法包括：通过采集到的所有用户的埋点数据训练得到第二模型；将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；通过所述目标用户的埋点数据微调所述第二模型得到第一模型；将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
199.又一方面，本技术还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法实施例所提供的消息推送方法或消息推送模型的训练方法，该消息推送方法包括：接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。消息推送模型的训练方法包括：通过采集到的所有用户的埋点数据训练得到第二模型；将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；通过所述目标用户的埋点数据微调所述第二模型得到第一模型；将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。
200.以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
201.通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如rom/ram、磁碟、光盘等，包括若干指
令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
202.最后应说明的是：以上实施例仅用以说明本技术的技术方案，而非对其限制；尽管参照前述实施例对本技术进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围。

技术特征：
1.一种消息推送方法，其特征在于，包括：接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。2.根据权利要求1所述的消息推送方法，其特征在于，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备之后，还包括：获取所述可穿戴设备上的埋点数据；将所述可穿戴设备上的埋点数据发送至所述服务器；所述可穿戴设备上的埋点数据用于更新所述第一模型和所述第二模型。3.根据权利要求2所述的消息推送方法，其特征在于，所述第一模型的更新频率大于所述第二模型的更新频率。4.根据权利要求1所述的消息推送方法，其特征在于，所述在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级，包括：将所述通知消息关联的目标特征输入所述第一模型，确定所述通知消息的得分；基于所述通知消息的得分，确定所述通知消息的优先级。5.根据权利要求1所述的消息推送方法，其特征在于，所述基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备，包括：基于所述通知消息的优先级，对所述通知消息进行排序；将排序为前预设数量的通知消息，作为待推送消息；将所述待推送消息推送至所述可穿戴设备。6.根据权利要求1至5任一项所述的消息推送方法，其特征在于，所述埋点数据，包括：用户查看通知消息的行为数据。7.一种消息推送模型的训练方法，其特征在于，包括：通过采集到的所有用户的埋点数据训练得到第二模型；将所述第二模型发送到目标用户终端并收到所述目标用户终端采集到的目标用户的埋点数据；通过所述目标用户的埋点数据微调所述第二模型得到第一模型；将所述第一模型发送到所述目标用户终端，其中，在接收到通知消息的情况下，所述第一模型确定所述通知消息的优先级并基于所述通知消息的优先级决定是否将所述通知消息推送至所述目标用户佩戴的可穿戴设备，所述第一模型的更新频率大于所述第二模型的更新频率，所述埋点数据包括用户查看通知消息的行为数据。8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至6任一项所述的消息推送方法或权利要求7所述的消息推送模型的训练方法。9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的消息推送方法或权利要求7所述的消息推送模型的训练方法。
10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的消息推送方法或权利要求7所述的消息推送模型的训练方法。

技术总结
本申请公开了一种消息推送、模型训练方法、电子设备和存储介质，属于计算机技术领域，本申请实施例的消息推送方法包括：接收服务器发送的第一模型；所述第一模型是通过采集到的目标用户的埋点数据训练第二模型得到的；所述第二模型是通过采集到的所有用户的埋点数据训练得到的；在接收到通知消息的情况下，基于所述第一模型，确定所述通知消息的优先级；基于所述通知消息的优先级，将所述通知消息推送至所述目标用户佩戴的可穿戴设备。至所述目标用户佩戴的可穿戴设备。至所述目标用户佩戴的可穿戴设备。

技术研发人员：李林峰黄海荣
受保护的技术使用者：湖北星纪魅族科技有限公司
技术研发日：2023.01.18
技术公布日：2023/7/12

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：目标检测模型的训练方法、目标检测方法及相关装置与流程 下一篇：一种型材冲孔裁切一体机的电控系统的制作方法

消息推送、模型训练方法、电子设备和存储介质与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

消息推送、模型训练方法、电子设备和存储介质与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表