一种基于文字识别的直播数据处理方法与流程

未命名 08-15 阅读：149 评论：0

1.本发明属于数据处理技术领域，尤其涉及一种基于文字识别的直播数据处理方法。

背景技术：

2.在网络直播中，观众往往是通过文字的形式与主播进行互动，但是一旦互动的人数较多时，主播无法获取到有效的互动信息，从而有可能导致无法满足观众的互动需求。
3.为了解决上述技术问题，在授权发明专利授权公告号cn115174951b《一种基于多维度特征抓取的无人直播在线分析管理系统》中通过对用户发送的文字信息、语音信息和图片信息进行分析和应答，进而提升了对用户的信息分析和回复的全面性，但是却存在以下技术问题：1、在真人直播间，现有技术未考虑结合直播间的弹幕数量、直播间人数等情况进行自动文字分析模块的检测频率的确定，在直播间的弹幕数量或者直播间人数较少的情况下，此时若采用与直播间的弹幕数量或者直播间人数较多的相同的检测频率，则会导致进行文字分析的服务器的压力增大。
4.2、未考虑结合直播间的文字分析结果确定不同产品的介绍时长以及介绍重点，对于不同的产品，可以通过对直播间的观众的文字分析结果确定观众对不同产品的兴趣度以及观众对产品的关注重点，因此若不能结合上述分析结果，对兴趣度较大的产品提高介绍时长，改进介绍重点，则无法满足观众的互动需要。
5.针对上述技术问题，本发明提供了一种基于文字识别的直播数据处理方法。

技术实现要素：

6.为实现本发明目的，本发明采用如下技术方案：根据本发明的一个方面，提供了一种基于文字识别的直播数据处理方法。
7.一种基于文字识别的直播数据处理方法，其特征在于，具体包括：s11通过直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数确定所述直播间的弹幕的文字识别的基础识别频率；s12利用所述直播间的实时观众人数、在设定时间周期内的实时弹幕数量和实时弹幕字数构建修正量，并基于所述修正量确定是否需要对所述基础识别频率进行修正，若是，则利用所述修正量对所述基础识别频率进行修正得到修正识别频率，若否，则将所述基础识别频率作为修正识别频率；s13基于所述修正识别频率对所述直播间的弹幕进行文字识别得到识别结果，并基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，并基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，并基于所述兴趣度确定是否能够进行所述产品的推荐介绍时长的输出，若是，则进入步骤s14，若否，则基于预设介绍时长进行所述产品的推荐介绍时长的确定；
s14获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，并基于所述识别结果进行所述产品的推荐介绍内容的输出。
8.进一步的技术方案在于，所述设定时间周期取2分钟以下，具体的根据所述直播间所在的直播平台的日平均活跃观众数量进行确定，其中所述直播平台的日平均活跃观众数量越多，则所述设定时间周期越短。
9.进一步的技术方案在于，当所述直播间的历史观众评估值小于观众评估设定值时，则确定所述直播间为低关注度直播间。
10.进一步的技术方案在于，所述第二设定识别频率大于设定识别频率，具体的根据所述直播间的产品数量进行动态确定，其中所述直播间的产品数量越多，则所述第二设定进一步的技术方案在于，基于所述直播间的活跃度和实时活跃度确定是否需要对所述基础识别频率进行修正，具体包括：基于所述直播间的活跃度确定是否需要对所述基础识别频率进行修正，若是，则确定需要对所述基础识别频率进行修正，若否，则进入下一步骤；基于所述直播间的活跃度和实时活跃度进行所述直播间的综合活跃度的构建，并基于所述综合活跃度确定是否需要对所述基础识别频率进行修正。
11.进一步的技术方案在于，基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，具体包括：基于所述识别结果确定所述直播间的弹幕的文字的关键词，并基于所述关键词与所述产品的关联性进行所述产品的感兴趣观众和关联弹幕的筛选，其中所述产品的感兴趣观众为发送的关联弹幕的数量大于预设数量的观众。
12.进一步的技术方案在于，所述推荐介绍时长与获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数、所述兴趣度相关，具体的采用基于神经网络算法的预测模型进行构建，其中当所述产品的关联弹幕的数量越多，所述发送关联弹幕的观众人数越多，兴趣度越高，则所述产品的推荐介绍时长越长。
13.另一方面，本发明提供了一种计算机存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述的一种基于文字识别的直播数据处理方法。
14.本发明的有益效果在于：通过利用直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数进行文字识别的基础识别频率的确定，从而实现了从历史数据的角度实现了对基础识别频率的动态确定，不仅大幅度降低了服务器的压力，同时也保证了解析的及时性。
15.通过利用所述直播间的实时观众人数、在设定时间周期内的实时弹幕数量和实时弹幕字数构建修正量，从而实现了结合实时数据的角度对文字识别的识别频率的确定，实现了对识别频率的动态实时调整，进一步保证了解析的及时性。
16.通过基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，从而实现了从弹幕文字的解析结果实现对不同产品的用户的感兴趣情况的确定，这也为差异化的进行产品的推荐介绍时长的确定以及推荐介绍内容的输出奠定了基础。
17.通过基于产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，从而实现了从多个角度对推荐介绍时长的确定，保证了用户的感兴趣程度较高的产品的推荐时长，提升了观众的直播体验。
18.其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
19.为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。
附图说明
20.通过参照附图详细描述其示例实施方式，本发明的上述和其它特征及优点将变得更加明显；图1是根据实施例1的一种基于文字识别的直播数据处理方法的流程图；图2是根据实施例1的文字识别的基础识别频率的确定的步骤的流程图；图3是根据实施例1的修正量确定的具体步骤的流程图；图4是根据实施例1的兴趣度确定的具体步骤的流程图。
具体实施方式
21.为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。
22.技术问题概括：现有的移动自助售货设备忽视了对移动自助售货设备的电量的实时监测，并根据电量的监测结果进行售货策略的优化，同时未考虑结合对接收人的身份进行验证，例如对于移动自助售货设备而言，若不能对接收人的身份和物品的类型进行验证，则有可能会导致不必要的货损的出现。
实施例1
23.为解决上述问题，根据本发明的一个方面，如图1所示，提供了根据本发明的一个方面，提供了一种基于文字识别的直播数据处理方法，其特征在于，具体包括：s11通过直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数确定所述直播间的弹幕的文字识别的基础识别频率；需要说明的是，所述设定时间周期取2分钟以下，具体的根据所述直播间所在的直播平台的日平均活跃观众数量进行确定，其中所述直播平台的日平均活跃观众数量越多，则所述设定时间周期越短。
24.具体的举例说明，如图2所示，所述文字识别的基础识别频率的确定的步骤为：s21通过直播间的历史观众人数确定所述直播间的历史观众人数的最大值以及历
史观众人数的平均值，并基于所述直播间的历史观众人数的最大值以及历史观众人数的平均值进行所述直播间的历史观众评估值的确定，并基于所述历史观众评估值确定所述直播间是否属于低关注度直播间，若是，则将设定识别频率作为所述直播间的基础识别频率，若否，则进入步骤s22；s22通过所述直播间在设定时间周期内的历史弹幕数量确定所述直播间在设定时间周期内的历史弹幕数量的最大值以及设定时间周期内的历史弹幕数量的平均值，并基于所述直播间在设定时间周期内的历史弹幕数量的最大值以及设定时间周期内的历史弹幕数量的平均值进行所述直播间的历史弹幕数量评估值的确定，并基于所述历史弹幕数量评估值确定所述直播间是否属于高关注度直播间，若是，则进入步骤s23，若否，则进入步骤s24；s23通过所述直播间在设定时间周期内的历史弹幕字数确定所述直播间在设定时间周期内的历史弹幕字数的最大值以及设定时间周期内的历史弹幕字数的平均值，并基于所述直播间在设定时间周期内的历史弹幕字数的最大值以及设定时间周期内的历史弹幕字数的平均值进行所述直播间的历史弹幕字数评估值的确定，并基于所述历史弹幕字数评估值确定所述直播间是否属于高关注度直播间，若是，则将第二设定识别频率作为所述直播间的基础识别频率，若否，则进入步骤s24；s24基于所述直播间的历史观众评估值、历史弹幕数量评估值、历史弹幕字数评估值进行所述直播间的基础识别频率的确定。
25.在本实施例中，通过结合历史观众评估值、历史弹幕数量评估值、历史弹幕字数评估值，从而实现了从更加全面的方式对基础识别频率的判断，从而保证了识别的准确性。
26.另外需要说明的是，所述历史观众人数、历史弹幕字数、历史弹幕数量一般取最近的一个月以内的直播间的历史数据。
27.可以理解的是，当所述直播间的历史观众评估值小于观众评估设定值时，则确定所述直播间为低关注度直播间。
28.需要进一步说明的是，所述第二设定识别频率大于设定识别频率，具体的根据所述直播间的产品数量进行动态确定，其中所述直播间的产品数量越多，则所述第二设定识别频率、所述设定识别频率越大。
29.在本实施例中，通过利用直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数进行文字识别的基础识别频率的确定，从而实现了从历史数据的角度实现了对基础识别频率的动态确定，不仅大幅度降低了服务器的压力，同时也保证了解析的及时性。
30.s12利用所述直播间的实时观众人数、在设定时间周期内的实时弹幕数量和实时弹幕字数构建修正量，并基于所述修正量确定是否需要对所述基础识别频率进行修正，若是，则利用所述修正量对所述基础识别频率进行修正得到修正识别频率，若否，则将所述基础识别频率作为修正识别频率；具体的举例说明，如图3所示，所述修正量确定的具体步骤为：s31获取所述直播间的实时观众人数，并基于所述实时观众人数确定是否需要对所述基础识别频率进行修正，若是，则进入步骤s32，若否，则确定不对所述基础识别频率进行修正；
s32获取所述直播间在设定时间周期内的实时弹幕数量，并判断所述实时弹幕数量确定是否需要对所述基础识别频率进行修正，若是，则进入步骤s33，若否，则确定不对所述基础识别频率进行修正；s33至少在预设时间后再次获取所述直播间的观众人数、在设定时间周期内的弹幕数量和弹幕字数，并基于所述直播间的观众人数、弹幕数量进行所述直播间的活跃度的评估，基于所述直播间的实时观众人数和实时弹幕数量进行所述直播间的实时活跃度的评估，并基于所述直播间的活跃度和实时活跃度确定是否需要对所述基础识别频率进行修正，若是，则进入步骤s34，若否，则确定不对所述基础识别频率进行修正；s34利用所述直播间的活跃度和实时活跃度，并结合所述直播间的实时弹幕字数和所述直播间的弹幕字数进行所述修正量的构建。
31.在本实施例中，通过多次获取数据，避免了由于单次的数据干扰导致的修正量的准确度不高的技术问题，提升了修正量的构建的准确性。
32.可以理解的是，基于所述直播间的活跃度和实时活跃度确定是否需要对所述基础识别频率进行修正，具体包括：基于所述直播间的活跃度确定是否需要对所述基础识别频率进行修正，若是，则确定需要对所述基础识别频率进行修正，若否，则进入下一步骤；基于所述直播间的活跃度和实时活跃度进行所述直播间的综合活跃度的构建，并基于所述综合活跃度确定是否需要对所述基础识别频率进行修正。
33.在本实施例中，通过利用所述直播间的实时观众人数、在设定时间周期内的实时弹幕数量和实时弹幕字数构建修正量，从而实现了结合实时数据的角度对文字识别的识别频率的确定，实现了对识别频率的动态实时调整，进一步保证了解析的及时性。
34.s13基于所述修正识别频率对所述直播间的弹幕进行文字识别得到识别结果，并基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，并基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，并基于所述兴趣度确定是否能够进行所述产品的推荐介绍时长的输出，若是，则进入步骤s14，若否，则基于预设介绍时长进行所述产品的推荐介绍时长的确定；具体的，基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，具体包括：基于所述识别结果确定所述直播间的弹幕的文字的关键词，并基于所述关键词与所述产品的关联性进行所述产品的感兴趣观众和关联弹幕的筛选，其中所述产品的感兴趣观众为发送的关联弹幕的数量大于预设数量的观众。
35.需要进一步说明的是，如图4所示，所述兴趣度确定的具体步骤为：s41获取所述关联弹幕的数量，并基于所述关联弹幕的数量确定所述产品是否为观众感兴趣产品，若是，则进入步骤s42，若否，则基于所述关联弹幕的数量以及设定兴趣度进行所述产品的兴趣度的评估；s42将发送所述关联弹幕的观众数量作为发送观众数量，并基于所述发送观众数量确定所述产品是否为观众感兴趣产品，若是，则进入步骤s43，若否，则基于所述发送观众数量与所述设定兴趣度进行所述产品的兴趣度的评估；s43将发送所述关联弹幕的数量大于预设数量的观众作为感兴趣观众，并基于所述感兴趣观众的数量、感兴趣观众的关联弹幕的数量、感兴趣观众在所述直播间的观众的
比例进行感兴趣观众的兴趣度的评估；s44基于所述关联弹幕的数量、发送观众数量、所述发送观众数量与直播间的观众数量的比值进行发送观众的兴趣度的评估，并基于所述感兴趣观众的兴趣度和所述发送观众的兴趣度进行兴趣度的评估。
36.在本实施例中，通过基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，从而实现了从弹幕文字的解析结果实现对不同产品的用户的感兴趣情况的确定，这也为差异化的进行产品的推荐介绍时长的确定以及推荐介绍内容的输出奠定了基础。
37.s14获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，并基于所述识别结果进行所述产品的推荐介绍内容的输出。
38.所述推荐介绍时长与获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数、所述兴趣度相关，具体的采用基于神经网络算法的预测模型进行构建，其中当所述产品的关联弹幕的数量越多，所述发送关联弹幕的观众人数越多，兴趣度越高，则所述产品的推荐介绍时长越长。
39.在本实施例中，通过基于产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，从而实现了从多个角度对推荐介绍时长的确定，保证了用户的感兴趣程度较高的产品的推荐时长，提升了观众的直播体验。
实施例2
40.另一方面，本发明提供了一种计算机存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行上述的一种基于文字识别的直播数据处理方法。
41.上述的一种基于文字识别的直播数据处理方法，具体包括：通过直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数确定所述直播间的弹幕的文字识别的基础识别频率；获取所述直播间的实时观众人数，并基于所述实时观众人数确定是否需要对所述基础识别频率进行修正时，进入下一步骤；获取所述直播间在设定时间周期内的实时弹幕数量，并判断所述实时弹幕数量确定需要对所述基础识别频率进行修正时，进入下一步骤；至少在预设时间后再次获取所述直播间的观众人数、在设定时间周期内的弹幕数量和弹幕字数，并基于所述直播间的观众人数、弹幕数量进行所述直播间的活跃度的评估，基于所述直播间的实时观众人数和实时弹幕数量进行所述直播间的实时活跃度的评估，并基于所述直播间的活跃度和实时活跃度确定需要对所述基础识别频率进行修正时，进入下一步骤；利用所述直播间的活跃度和实时活跃度，并结合所述直播间的实时弹幕字数和所述直播间的弹幕字数进行所述修正量的构建；基于所述修正量确定需要对所述基础识别频率进行修正时，利用所述修正量对所述基础识别频率进行修正得到修正识别频率；
基于所述修正识别频率对所述直播间的弹幕进行文字识别得到识别结果，并基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，并基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估；获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，并基于所述识别结果进行所述产品的推荐介绍内容的输出。
42.本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、设备、非易失性计算机存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
43.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。
44.以上所述仅为本说明书的一个或多个实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

技术特征：
1.一种基于文字识别的直播数据处理方法，其特征在于，具体包括：通过直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数确定所述直播间的弹幕的文字识别的基础识别频率；利用所述直播间的实时观众人数、在设定时间周期内的实时弹幕数量和实时弹幕字数构建修正量，并基于所述修正量确定是否需要对所述基础识别频率进行修正，若是，则利用所述修正量对所述基础识别频率进行修正得到修正识别频率，若否，则将所述基础识别频率作为修正识别频率；基于所述修正识别频率对所述直播间的弹幕进行文字识别得到识别结果，并基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，并基于所述感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，并基于所述兴趣度确定是否能够进行所述产品的推荐介绍时长的输出，若是，则进入下一步骤，若否，则基于预设介绍时长进行所述产品的推荐介绍时长的确定；获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合所述兴趣度进行所述产品的推荐介绍时长的输出，并基于所述识别结果进行所述产品的推荐介绍内容的输出。2.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，所述设定时间周期取2分钟以下，具体的根据所述直播间所在的直播平台的日平均活跃观众数量进行确定，其中所述直播平台的日平均活跃观众数量越多，则所述设定时间周期越短。3.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，所述文字识别的基础识别频率的确定的步骤为：s21通过直播间的历史观众人数确定所述直播间的历史观众人数的最大值以及历史观众人数的平均值，并基于所述直播间的历史观众人数的最大值以及历史观众人数的平均值进行所述直播间的历史观众评估值的确定，并基于所述历史观众评估值确定所述直播间是否属于低关注度直播间，若是，则将设定识别频率作为所述直播间的基础识别频率，若否，则进入步骤s22；s22通过所述直播间在设定时间周期内的历史弹幕数量确定所述直播间在设定时间周期内的历史弹幕数量的最大值以及设定时间周期内的历史弹幕数量的平均值，并基于所述直播间在设定时间周期内的历史弹幕数量的最大值以及设定时间周期内的历史弹幕数量的平均值进行所述直播间的历史弹幕数量评估值的确定，并基于所述历史弹幕数量评估值确定所述直播间是否属于高关注度直播间，若是，则进入步骤s23，若否，则进入步骤s24；s23通过所述直播间在设定时间周期内的历史弹幕字数确定所述直播间在设定时间周期内的历史弹幕字数的最大值以及设定时间周期内的历史弹幕字数的平均值，并基于所述直播间在设定时间周期内的历史弹幕字数的最大值以及设定时间周期内的历史弹幕字数的平均值进行所述直播间的历史弹幕字数评估值的确定，并基于所述历史弹幕字数评估值确定所述直播间是否属于高关注度直播间，若是，则将第二设定识别频率作为所述直播间的基础识别频率，若否，则进入步骤s24；s24基于所述直播间的历史观众评估值、历史弹幕数量评估值、历史弹幕字数评估值进行所述直播间的基础识别频率的确定。4.如权利要求3所述的一种基于文字识别的直播数据处理方法，其特征在于，当所述直
播间的历史观众评估值小于观众评估设定值时，则确定所述直播间为低关注度直播间。5.如权利要求3所述的一种基于文字识别的直播数据处理方法，其特征在于，所述第二设定识别频率大于设定识别频率，具体的根据所述直播间的产品数量进行动态确定，其中所述直播间的产品数量越多，则所述第二设定识别频率、所述设定识别频率越大。6.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，所述修正量确定的具体步骤为：获取所述直播间的实时观众人数，并基于所述实时观众人数确定是否需要对所述基础识别频率进行修正，若是，则进入下一步骤，若否，则确定不对所述基础识别频率进行修正；获取所述直播间在设定时间周期内的实时弹幕数量，并判断所述实时弹幕数量确定是否需要对所述基础识别频率进行修正，若是，则进入下一步骤，若否，则确定不对所述基础识别频率进行修正；至少在预设时间后再次获取所述直播间的观众人数、在设定时间周期内的弹幕数量和弹幕字数，并基于所述直播间的观众人数、弹幕数量进行所述直播间的活跃度的评估，基于所述直播间的实时观众人数和实时弹幕数量进行所述直播间的实时活跃度的评估，并基于所述直播间的活跃度和实时活跃度确定是否需要对所述基础识别频率进行修正，若是，则进入下一步骤，若否，则确定不对所述基础识别频率进行修正；利用所述直播间的活跃度和实时活跃度，并结合所述直播间的实时弹幕字数和所述直播间的弹幕字数进行所述修正量的构建。7.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，基于所述直播间的活跃度和实时活跃度确定是否需要对所述基础识别频率进行修正，具体包括：基于所述直播间的活跃度确定是否需要对所述基础识别频率进行修正，若是，则确定需要对所述基础识别频率进行修正，若否，则进入下一步骤；基于所述直播间的活跃度和实时活跃度进行所述直播间的综合活跃度的构建，并基于所述综合活跃度确定是否需要对所述基础识别频率进行修正。8.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，基于所述识别结果进行产品的感兴趣观众和关联弹幕的筛选，具体包括：基于所述识别结果确定所述直播间的弹幕的文字的关键词，并基于所述关键词与所述产品的关联性进行所述产品的感兴趣观众和关联弹幕的筛选，其中所述产品的感兴趣观众为发送的关联弹幕的数量大于预设数量的观众。9.如权利要求1所述的一种基于文字识别的直播数据处理方法，其特征在于，所述推荐介绍时长与获取所述产品的关联弹幕的数量、发送关联弹幕的观众人数、所述兴趣度相关，具体的采用基于神经网络算法的预测模型进行构建，其中当所述产品的关联弹幕的数量越多，所述发送关联弹幕的观众人数越多，兴趣度越高，则所述产品的推荐介绍时长越长。10.一种计算机存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-9任一项所述的一种基于文字识别的直播数据处理方法。

技术总结
本发明提供一种基于文字识别的直播数据处理方法，属于数据处理技术领域，具体包括：通过直播间的历史观众人数、在设定时间周期内的历史弹幕数量和历史弹幕字数确定所述直播间的弹幕的文字识别的基础识别频率；并利用修正量对基础识别频率进行修正得到修正识别频率；基于修正识别频率对直播间的弹幕进行文字识别得到产品的感兴趣观众和关联弹幕，并基于感兴趣观众的数量、比例以及感兴趣观众的关联弹幕的数量进行兴趣度的评估，获取产品的关联弹幕的数量、发送关联弹幕的观众人数，并结合兴趣度进行产品的推荐介绍时长的输出，并基于识别结果进行产品的推荐介绍内容的输出，从而实现了针对性的进行直播产品的推荐和介绍。现了针对性的进行直播产品的推荐和介绍。现了针对性的进行直播产品的推荐和介绍。

技术研发人员：王俊桦杨锋蒋侃蒋军华
受保护的技术使用者：杭州蚊子会数字营销有限公司
技术研发日：2023.06.14
技术公布日：2023/8/13

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种低频超宽带探地雷达小型化蝶形天线及优化方法 下一篇：一种裸瓶码垛系统及裸瓶码垛方法与流程

一种基于文字识别的直播数据处理方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种基于文字识别的直播数据处理方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表