一种基于人工智能的直播数据快速分析方法与流程

未命名 07-23 阅读:133 评论:0


1.本技术涉及智能化数据分析领域,且更为具体地,涉及一种基于人工智能的直播数据快速分析方法。


背景技术:

2.随着直播越来越发达,直播复盘也成为直播运营十分重要的一环。在直播复盘时,通常会利用直播趋势图表,以帮助直播管理者快速了解直播业务数据的变化趋势和规律。
3.在直播趋势图表中,可能会出现异常数据点,例如在线人数在短时间内激增或骤降等情况,这些异常点对于直播运营分析过程中具有至关重要的作用,是直播管理者进行进一步分析和改善的关键时间节点。然而,目前的直播复盘过程中,异常数据点往往需要人工进行分辨检测,不仅耗时耗力,而且容易出现错误。并且,在找到异常点后,还需要进一步根据时间节点来查找相关的直播内容,较为繁琐,不适用于现今的直播复盘需求。
4.因此,期望一种优化的基于人工智能的直播数据快速分析方案。


技术实现要素:

5.为了解决上述技术问题,提出了本技术。本技术的实施例提供了一种基于人工智能的直播数据快速分析方法。其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
6.根据本技术的一个方面,提供了一种基于人工智能的直播数据快速分析方法,其包括:
7.获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;
8.将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;
9.基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;
10.将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;
11.将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;
12.以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
13.在上述的基于人工智能的直播数据快速分析方法中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:
14.以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;
15.其中,所述级联公式为:
16.;
17.其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,表示级联函数,表示所述直播业务数据输入向量。
18.在上述的基于人工智能的直播数据快速分析方法中,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:
19.将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;
20.将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;
21.以及将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
22.在上述的基于人工智能的直播数据快速分析方法中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
23.在上述的基于人工智能的直播数据快速分析方法中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:
24.使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;
25.以及将所述编码分类特征向量通过所述分类器的softmax分类函数以得到所述分类结果。
26.在上述的基于人工智能的直播数据快速分析方法中,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤。
27.在上述的基于人工智能的直播数据快速分析方法中,所述训练步骤,包括:
28.获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;
29.将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;
30.基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;
31.将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;
32.将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;
33.将所述训练分类特征向量通过所述分类器以得到分类损失函数值;
34.以及基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
35.在上述的基于人工智能的直播数据快速分析方法中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:
36.所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,到为权重矩阵,到为偏置向量,为所述训练分类特征向量;
37.以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
38.在上述的基于人工智能的直播数据快速分析方法中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;
39.其中,所述优化公式为:
40.;
41.其中,是所述分类器的权重矩阵,是矩阵的转置矩阵,是矩阵的本征值组成的本征集合向量,是所述训练分类特征向量,和分别表示矩阵乘法和加法,表示迭代后的所述分类器的权重矩阵。
42.与现有技术相比,本技术提供的基于人工智能的直播数据快速分析方法,其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
附图说明
43.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员而言,在没有做出创造性劳动的前提下,还可以根据这些附图获得其他的附图。以下附图并未刻意按实际尺寸等比例缩放绘制,重点在于示出本技术的主旨。
44.图1为根据本技术实施例的基于人工智能的直播数据快速分析方法的应用场景图。
45.图2为根据本技术实施例的基于人工智能的直播数据快速分析方法的流程图。
46.图3为根据本技术实施例的基于人工智能的直播数据快速分析方法的架构示意
图。
47.图4为根据本技术实施例的基于人工智能的直播数据快速分析方法的子步骤s150的流程图。
48.图5为根据本技术实施例的基于人工智能的直播数据快速分析方法的子步骤s160的流程图。
49.图6为根据本技术实施例的基于人工智能的直播数据快速分析方法进一步包括的训练步骤的流程图。
50.图7为根据本技术实施例的基于人工智能的直播数据快速分析系统的框图。
具体实施方式
51.下面将结合附图对本技术实施例中的技术方案进行清楚、完整地描述,显而易见地,所描述的实施例仅仅是本技术的部分实施例,而不是全部的实施例。基于本技术实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,也属于本技术保护的范围。
52.如本技术和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。
53.虽然本技术对根据本技术的实施例的系统中的某些模块做出了各种引用,然而,任何数量的不同模块可以被使用并运行在用户终端和/或服务器上。所述模块仅是说明性的,并且所述系统和方法的不同方面可以使用不同模块。
54.本技术中使用了流程图用来说明根据本技术的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,根据需要,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
55.下面,将参考附图详细地描述根据本技术的示例实施例。显然,所描述的实施例仅仅是本技术的一部分实施例,而不是本技术的全部实施例,应理解,本技术不受这里描述的示例实施例的限制。
56.如上所述,目前的直播复盘过程中,异常数据点往往需要人工进行分辨检测,不仅耗时耗力,而且容易出现错误。并且,在找到异常点后,还需要进一步根据时间节点来查找相关的直播内容,较为繁琐,不适用于现今的直播复盘需求。因此,期望一种优化的基于人工智能的直播数据快速分析方案。
57.相应地,考虑到在实际进行直播复盘时,关键在于对直播业务数据进行分析来确定直播是否存在异常。在此过程中,对于直播在线人数的监测尤为重要,例如在线人数出现在短时间内激增或骤降等情况。因此,期望基于对直播在线人数值的时序变化情况进行监测分析来进行直播的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,从而优化直播内容和管理。但是,由于在线人数值在时序上的不同时间周期下都存在波动性和不确定性,也就是说,所述在线人数值在每个时间段内都有着不同的时序变化规律特征,而且这种时序变化特征有时较为微弱,难以充分地对于在线人数的时序变化
规律进行分析探究。
58.基于此,在本技术的技术方案中,考虑到在线人数时序变化率可以帮助快速识别那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。因此,期望基于所述在线人数值的时序动态变化特征和所述在线人数时序变化率的动态变化特征之间的关联特征信息来综合进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
59.近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述在线人数值的时序动态变化特征和所述在线人数时序变化率的动态变化特征之间的关联特征信息提供了新的解决思路和方案。
60.具体地,在本技术的技术方案中,首先,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值。接着,考虑到由于所述在线人数值在时间维度上具有着动态性的变化规律,因此,为了能够对于所述在线人数值在时间维度上的变化特征信息进行提取,在本技术的技术方案中,需要首先将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,以此来整合所述在线人数值在时序上的分布信息。
61.然后,考虑到由于所述在线人数值在时序上的变化情况对于直播业务数据的异常情况监测的影响较低,难以通过所述在线人数值的时序变化特征来充分地捕捉到各个异常点的情况。因此,在本技术的技术方案中,进一步基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量。也就是,通过计算每两个所述预定时间点之间的在线人数值和时间间隔之间的除法来获取所述在线人数变化率时序输入向量,以此来更加直观的识别显示那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。
62.继而,再将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,以此来整合所述在线人数值和所述在线人数变化率在时间维度上的时序关联变化信息,进而充分利用在线人数值在时序上的变化信息来更加直观地显示所述当在线人数值的异常情况,有利于后续进行直播业务数据的异常检测。
63.进一步地,考虑到由于所述在线人数值在时间维度上具有着波动性和不确定性,因而所述在线人数变化率以及两者的融合信息也都具有着波动性和不确定性,导致其在不同时间周期跨度下呈现出不同的变化状态。因此,在本技术的技术方案中,进一步将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量。特别地,这里,所述第一卷积层和所述第二卷积层分别使用不同尺度的一维卷积核来进行所述直播业务数据输入向量的特征挖掘,以提取出所述直播业务数据,即在线人数值在不同时间跨度下的时序动态多尺度邻域关联特征信息。
64.接着,进一步再将所述分类特征向量通过分类器中进行分类处理,以得到用于表示当前直播业务数据是否存在异常的分类结果。也就是说,以所述在线人数值的时序动态多尺度变化特征来进行分类,从而进行直播业务数据的异常检测。具体地,在本技术的技术方案中,所述分类器的标签包括当前直播业务数据存在异常(第一标签),以及,当前直播业务数据不存在异常(第二标签),其中,所述分类器通过软最大值函数来确定所述分类特征
向量属于哪个分类标签。值得注意的是,这里的所述第一标签p1和所述第二标签p2并不包含人为设定的概念,实际上在训练过程当中,计算机模型并没有“当前直播业务数据是否存在异常”这种概念,其只是有两种分类标签且输出特征在这两个分类标签下的概率,即p1和p2之和为一。因此,当前直播业务数据是否存在异常的分类结果实际上是通过分类标签转化为符合自然规律的二分类的类概率分布,实质上用到的是标签的自然概率分布的物理意义,而不是“当前直播业务数据是否存在异常”的语言文本意义。应可以理解,在本技术的技术方案中,所述分类器的分类标签为当前直播业务数据是否存在异常的检测评估标签,因此,在得到所述分类结果后,可基于所述分类结果来进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
65.特别地,在本技术的技术方案中,考虑到将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后,所述直播业务数据输入向量可以表达在线人数和在线人数变化率沿时序分布的原始信息,在通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块之后,可以提取到在线人数和在线人数变化率各自沿时序的多尺度邻域局部关联特征。但是,考虑到这两部分原始数据沿时序的分布趋势并不相同,在所述多尺度邻域特征提取模块进行多尺度邻域局部关联特征的提取过程中,可能对于所述在线人数时序输入向量和所述在线人数变化率时序输入向量产生拟合差异,例如过拟合或者欠拟合,导致所述分类特征向量分别对应于在线人数和在线人数变化率沿时序的多尺度邻域局部关联特征的特征分布相对于分类器的权重矩阵对应的部分具有不同的权重拟合方向,这样,所述分类特征向量的整体特征分布相对于分类器的权重矩阵就会具有收敛性差的问题,从而影响所述分类器的训练速度。
66.基于此,本技术的申请人在所述分类特征向量,例如记为的训练过程中,在每次分类器的权重矩阵,例如记为的迭代过程中,对权重矩阵进行权重本征支持的半空间结构化约束,具体表示为:
67.;
68.其中,是矩阵的本征值组成的本征集合向量。
69.这里,所述权重本征支持的半空间结构化约束以所述分类器的权重矩阵的结构化矩阵的本征值集合与待分类的分类特征向量的关联性集成作为支持,来对所述权重矩阵表示的用于与所述待分类的分类特征向量的高维流形相耦合的半空间(half-space)进行作为决策边界的超平面的结构化支持约束,以使得所述待分类的分类特征向量的高维流形能够在所述权重矩阵表示的半空间开放域内相对于超平面有效收敛,从而改进所述分类器的训练速度。这样,能够对于直播业务数据的异常点进行准确检测,进而在检测出直播异常时对于异常点的情况进行进一步地分析优化,以此来优化直播内容和管理。
70.图1为根据本技术实施例的基于人工智能的直播数据快速分析方法的应用场景图。如图1所示,在该应用场景中,首先,获取当前直播业务数据(例如,图1中所示意的d),其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值,然后,将所述直播业务数据输入至部署有基于人工智能的直播数据快速分析算法的服务器中(例如,图1中所示意的s),其中,所述服务器能够使用所述基于人工智能的直播数据快速分析算法对所述直播业务数据进行处理以得到用于表示当前直播业务数据是否存在异常的分类结果。
71.在介绍了本技术的基本原理之后,下面将参考附图来具体介绍本技术的各种非限
制性实施例。
72.图2为根据本技术实施例的基于人工智能的直播数据快速分析方法的流程图。如图2所示,根据本技术实施例的基于人工智能的直播数据快速分析方法,包括步骤:s110,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;s120,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;s130,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;s140,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;s150,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;以及,s160,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
73.图3为根据本技术实施例的基于人工智能的直播数据快速分析方法的架构示意图。如图3所示,在该网络架构中,首先,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;接着,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;然后,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;接着,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;然后,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;最后,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
74.更具体地,在步骤s110中,获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值。在实际进行直播复盘时,关键在于对直播业务数据进行分析来确定直播是否存在异常。在此过程中,对于直播在线人数的监测尤为重要,例如在线人数出现在短时间内激增或骤降等情况。因此,可以基于对直播在线人数值的时序变化情况进行监测分析来进行直播的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,从而优化直播内容和管理。
75.更具体地,在步骤s120中,将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量。由于所述在线人数值在时间维度上具有着动态性的变化规律,因此,为了能够对于所述在线人数值在时间维度上的变化特征信息进行提取,在本技术的技术方案中,需要首先将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,以此来整合所述在线人数值在时序上的分布信息。
76.更具体地,在步骤s130中,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量。也就是,通过计算每两个所述预定时间点之间的在线人数值和时间间隔之间的除法来获取所述在线人数变化率时序输入向量,以此来更加直观的识别显示那些出现了异常变化的时间段,比如在很短的时间内,直播间的在线人数急剧增加或减少等情况。
77.更具体地,在步骤s140中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量。以此来整合所述在线人数值和所述
在线人数变化率在时间维度上的时序关联变化信息,进而充分利用在线人数值在时序上的变化信息来更加直观地显示所述当在线人数值的异常情况,有利于后续进行直播业务数据的异常检测。
78.相应地,在一个具体示例中,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;其中,所述级联公式为:
79.;
80.其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,表示级联函数,表示所述直播业务数据输入向量。
81.更具体地,在步骤s150中,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量。这样,可以提取出所述直播业务数据,即在线人数值在不同时间跨度下的时序动态多尺度邻域关联特征信息。
82.相应地,在一个具体示例中,如图4所示,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:s151,将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;s152,将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及,s153,将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
83.相应地,在一个具体示例中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。
84.更具体地,在步骤s160中,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。在得到所述分类结果后,可基于所述分类结果来进行直播业务数据的异常检测,进而在检测出直播异常时对于异常点的在线人数进行进一步地分析,以优化直播内容和管理。
85.应可以理解,分类器的作用是利用给定的类别、已知的训练数据来学习分类规则和分类器,然后对未知数据进行分类(或预测)。逻辑回归(logistics)、svm等常用于解决二分类问题,对于多分类问题(multi-class classification),同样也可以用逻辑回归或svm,只是需要多个二分类来组成多分类,但这样容易出错且效率不高,常用的多分类方法有softmax分类函数。
86.相应地,在一个具体示例中,如图5所示,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:s161,使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,s162,将所述编码分类特征向量通过所述分类器的softmax分类函数以得到所述分类结果。
87.相应地,在一个具体示例中,所述的基于人工智能的直播数据快速分析方法,其还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤,其中,如图6所示,所述训练步骤,包括:s210,获取训练数据,所述训
练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;s220,将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;s230,基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;s240,将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;s250,将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;s260,将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及,s270,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
88.相应地,在一个具体示例中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,到为权重矩阵,到为偏置向量,为所述训练分类特征向量;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
89.特别地,在本技术的技术方案中,考虑到将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联后,所述训练直播业务数据输入向量可以表达在线人数和在线人数变化率沿时序分布的原始信息,在通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块之后,可以提取到在线人数和在线人数变化率各自沿时序的多尺度邻域局部关联特征。但是,考虑到这两部分原始数据沿时序的分布趋势并不相同,在所述多尺度邻域特征提取模块进行多尺度邻域局部关联特征的提取过程中,可能对于所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量产生拟合差异,例如过拟合或者欠拟合,导致所述训练分类特征向量分别对应于在线人数和在线人数变化率沿时序的多尺度邻域局部关联特征的特征分布相对于分类器的权重矩阵对应的部分具有不同的权重拟合方向,这样,所述训练分类特征向量的整体特征分布相对于分类器的权重矩阵就会具有收敛性差的问题,从而影响所述分类器的训练速度。基于此,本技术的申请人在所述训练分类特征向量的训练过程中,在每次分类器的权重矩阵的迭代过程中,对权重矩阵进行权重本征支持的半空间结构化约束。
90.相应地,在一个具体示例中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;其中,所述优化公式为:
91.;
92.其中,是所述分类器的权重矩阵,是矩阵的转置矩阵,是矩阵的本征值组成的本征集合向量,是所述训练分类特征向量,和分别表示矩阵乘法和加法,表示迭代后的所述分类器的权重矩阵。
93.这里,所述权重本征支持的半空间结构化约束以所述分类器的权重矩阵的结构化矩阵的本征值集合与待分类的训练分类特征向量的关联性集成作为支持,来对所述权重矩
阵表示的用于与所述待分类的训练分类特征向量的高维流形相耦合的半空间进行作为决策边界的超平面的结构化支持约束,以使得所述待分类的训练分类特征向量的高维流形能够在所述权重矩阵表示的半空间开放域内相对于超平面有效收敛,从而改进所述分类器的训练速度。这样,能够对于直播业务数据的异常点进行准确检测,进而在检测出直播异常时对于异常点的情况进行进一步地分析优化,以此来优化直播内容和管理。
94.综上,基于本技术实施例的基于人工智能的直播数据快速分析方法,其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。
95.图7为根据本技术实施例的基于人工智能的直播数据快速分析系统100的框图。如图7所示,根据本技术实施例的基于人工智能的直播数据快速分析系统100,包括:数据采集模块110,用于获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;在线人数时序输入向量排列模块120,用于将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;在线人数变化率时序输入向量生成模块130,用于基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;级联模块140,用于将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;多尺度邻域特征编码模块150,用于将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;以及,分类模块160,用于将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。
96.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述级联模块140,用于:以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;其中,所述级联公式为:
97.;
98.其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,表示级联函数,表示所述直播业务数据输入向量。
99.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述多尺度邻域特征编码模块150,用于:将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及,将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。
100.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层
使用具有不同尺度的一维卷积核。
101.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,所述分类模块160,用于:使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的softmax分类函数以得到所述分类结果。
102.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练模块,其中,所述训练模块,用于:获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及,基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。
103.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,到为权重矩阵,到为偏置向量,为所述训练分类特征向量;以及,计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。
104.在一个示例中,在上述基于人工智能的直播数据快速分析系统100中,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;其中,所述优化公式为:
105.;
106.其中,是所述分类器的权重矩阵,是矩阵的转置矩阵,是矩阵的本征值组成的本征集合向量,是所述训练分类特征向量,和分别表示矩阵乘法和加法,表示迭代后的所述分类器的权重矩阵。
107.这里,本领域技术人员可以理解,上述基于人工智能的直播数据快速分析系统100中的各个模块的具体功能和操作已经在上面参考图1到图6的基于人工智能的直播数据快速分析方法的描述中得到了详细介绍,并因此,将省略其重复描述。
108.如上所述,根据本技术实施例的基于人工智能的直播数据快速分析系统100可以实现在各种无线终端中,例如具有基于人工智能的直播数据快速分析算法的服务器等。在一个示例中,根据本技术实施例的基于人工智能的直播数据快速分析系统100可以作为一
个软件模块和/或硬件模块而集成到无线终端中。例如,该基于人工智能的直播数据快速分析系统100可以是该无线终端的操作系统中的一个软件模块,或者可以是针对于该无线终端所开发的一个应用程序;当然,该基于人工智能的直播数据快速分析系统100同样可以是该无线终端的众多硬件模块之一。
109.替换地,在另一示例中,该基于人工智能的直播数据快速分析系统100与该无线终端也可以是分立的设备,并且该基于人工智能的直播数据快速分析系统100可以通过有线和/或无线网络连接到该无线终端,并且按照约定的数据格式来传输交互信息。
110.根据本技术的另一方面,还提供了一种非易失性的计算机可读存储介质,其上存储有计算机可读的指令,当利用计算机执行所述指令时可以执行如前所述的方法。
111.技术中的程序部分可以被认为是以可执行的代码和/或相关数据的形式而存在的“产品”或“制品”,通过计算机可读的介质所参与或实现的。有形的、永久的储存介质可以包括任何计算机、处理器、或类似设备或相关的模块所用到的内存或存储器。例如,各种半导体存储器、磁带驱动器、磁盘驱动器或者类似任何能够为软件提供存储功能的设备。
112.所有软件或其中的一部分有时可能会通过网络进行通信,如互联网或其他通信网络。此类通信可以将软件从一个计算机设备或处理器加载到另一个。例如:从视频目标检测设备的一个服务器或主机计算机加载至一个计算机环境的硬件平台,或其他实现系统的计算机环境,或与提供目标检测所需要的信息相关的类似功能的系统。因此,另一种能够传递软件元素的介质也可以被用作局部设备之间的物理连接,例如光波、电波、电磁波等,通过电缆、光缆或者空气等实现传播。用来载波的物理介质如电缆、无线连接或光缆等类似设备,也可以被认为是承载软件的介质。在这里的用法除非限制了有形的“储存”介质,其他表示计算机或机器“可读介质”的术语都表示在处理器执行任何指令的过程中参与的介质。
113.本技术使用了特定词语来描述本技术的实施例。如“第一/第二实施例”、“一实施例”、和/或“一些实施例”意指与本技术至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本技术的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
114.此外,本领域技术人员可以理解,本技术的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。
115.相应地,本技术的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本技术的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
116.除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本发明所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
117.上面是对本发明的说明,而不应被认为是对其的限制。尽管描述了本发明的若干示例性实施例,但本领域技术人员将容易地理解,在不背离本发明的新颖教学和优点的前
提下可以对示例性实施例进行许多修改。因此,所有这些修改都意图包含在权利要求书所限定的本发明范围内。应当理解,上面是对本发明的说明,而不应被认为是限于所公开的特定实施例,并且对所公开的实施例以及其他实施例的修改意图包含在所附权利要求书的范围内。本发明由权利要求书及其等效物限定。

技术特征:
1.一种基于人工智能的直播数据快速分析方法,其特征在于,包括:获取当前直播业务数据,其中,所述直播业务数据包括预定时间段内多个预定时间点的在线人数值;将所述直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量;基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量;将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量;将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量;以及将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常。2.根据权利要求1所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到直播业务数据输入向量,包括:以如下级联公式将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联以得到所述直播业务数据输入向量;其中,所述级联公式为:;其中,分别表示所述在线人数时序输入向量和所述在线人数变化率时序输入向量,表示级联函数,表示所述直播业务数据输入向量。3.根据权利要求2所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述直播业务数据输入向量通过包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到分类特征向量,包括:将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第一卷积层以得到第一尺度数据特征向量;将所述直播业务数据输入向量通过所述多尺度邻域特征提取模块的所述第二卷积层以得到第二尺度数据特征向量;以及将所述第一尺度数据特征向量和所述第二尺度数据特征向量进行级联以得到所述分类特征向量。4.根据权利要求3所述的基于人工智能的直播数据快速分析方法,其特征在于,所述多尺度邻域特征提取模块包括并行的所述第一卷积层和所述第二卷积层,以及,与所述第一卷积层和所述第二卷积层连接的多尺度特征融合层,其中,所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。5.根据权利要求4所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示当前直播业务数据是否存在异常,包括:使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量;
以及将所述编码分类特征向量通过所述分类器的softmax分类函数以得到所述分类结果。6.根据权利要求5所述的基于人工智能的直播数据快速分析方法,其特征在于,还包括用于对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练的训练步骤。7.根据权利要求6所述的基于人工智能的直播数据快速分析方法,其特征在于,所述训练步骤,包括:获取训练数据,所述训练数据包括当前训练直播业务数据,以及,所述当前直播业务数据是否存在异常的真实值,其中,所述训练直播业务数据包括预定时间段内多个预定时间点的训练在线人数值;将所述训练直播业务数据中的多个预定时间点的训练在线人数值按照时间维度排列为训练在线人数时序输入向量;基于每两个所述预定时间点之间的训练时间间隔和所述训练在线人数时序输入向量,生成训练在线人数变化率时序输入向量;将所述训练在线人数时序输入向量和所述训练在线人数变化率时序输入向量进行级联以得到训练直播业务数据输入向量;将所述训练直播业务数据输入向量通过所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块以得到训练分类特征向量;将所述训练分类特征向量通过所述分类器以得到分类损失函数值;以及基于所述分类损失函数值并通过梯度下降的方向传播来对所述包含第一卷积层和第二卷积层的多尺度邻域特征提取模块和所述分类器进行训练,其中,在所述训练的每一轮迭代中,对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代。8.根据权利要求7所述的基于人工智能的直播数据快速分析方法,其特征在于,将所述训练分类特征向量通过所述分类器以得到分类损失函数值,包括:所述分类器以如下分类公式对所述训练分类特征向量进行处理以得到训练分类结果,所述分类公式为:,其中,到为权重矩阵,到为偏置向量,为所述训练分类特征向量;以及计算所述训练分类结果与所述真实值之间的交叉熵值作为所述分类损失函数值。9.根据权利要求8所述的基于人工智能的直播数据快速分析方法,其特征在于,在所述训练的每一轮迭代中,以如下优化公式对所述分类器的权重矩阵进行权重本征支持的半空间结构化约束迭代;其中,所述优化公式为:;其中,是所述分类器的权重矩阵,是矩阵的转置矩阵,是矩阵的本征值组成的本征集合向量,是所述训练分类特征向量,和分别表示矩阵乘法和加法,表示迭代后的所述分类器的权重矩阵。

技术总结
本申请公开了一种基于人工智能的直播数据快速分析方法。其首先将直播业务数据中的多个预定时间点的在线人数值按照时间维度排列为在线人数时序输入向量,接着,基于每两个所述预定时间点之间的时间间隔和所述在线人数时序输入向量,生成在线人数变化率时序输入向量,然后,将所述在线人数时序输入向量和所述在线人数变化率时序输入向量进行级联后通过多尺度邻域特征提取模块以得到分类特征向量,最后,将所述分类特征向量通过分类器以得到用于表示当前直播业务数据是否存在异常的分类结果。这样,可以实现对直播数据的快速分析。可以实现对直播数据的快速分析。可以实现对直播数据的快速分析。


技术研发人员:潘小平
受保护的技术使用者:杭州新航互动科技有限公司
技术研发日:2023.06.16
技术公布日:2023/7/22
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐