一种数据分析方法以及相关设备与流程
未命名
08-13
阅读:78
评论:0
1.本发明涉及电子领域,尤其涉及一种数据分析方法以及相关设备。
背景技术:
2.在网络设备的运行过程中,网络设备上运行有各式各样的业务,当业务繁忙时,网络 设备的负载较高。业务空闲时,网络设备的负载较低。通常,运维人员或者其他设备可以 通过多种方式来获取网络设备的负载的变化情况。
3.网络设备运行过程中具有多种性能值,例如每秒i/o次数(i/o per second,iops), 中央处理器(central processing unit,cpu)的利用率等。为了准确获取负载的变化情 况,通常会采集某一性能值的时间序列,即某一性能值在一段时间内随时间变化的情况。 因此,通过分析一段时间内该性能值的高低变化可以间接评估网络设备的负载状况。 若一段时间内,性能值持续超过固定阈值时,则可以认为该网络设备处于忙时区间,若性 能值持续低于固定阈值时,则可以认为该网络设备处于闲时区间。
4.传统的分析方法中,不同的性能值所对应的固定阈值不同。针对不同的性能值,在不 同的工况下,固定阈值难以确定,且性能值中存在噪声时容易影响对于网络设备所处状态 的判断,对于网络设备的负载状况评估时得出的结论的准确性较差。
技术实现要素:
5.本技术提供了一种数据分析方法以及相关设备,根据性能数据清单把坐标点划分为不 同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对于评 估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
6.本技术第一方面提供了一种数据分析方法,该方法中包括:获取性能数据清单,所述 性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻 值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐 标点;根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其中:所述坐标分布 区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间中包括相邻的第一 区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以所述任意一个所述 第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所述第一区间和所述 第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测区域内的其他坐标 点的数量小于所述第一阈值。
7.本技术中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括 时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分 为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对 于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
8.在第一方面的一种可能的实现方式中,各个坐标点的所述检测区域为:以该坐标
点为 中心,并以第一参数为短轴长、以第二参数为长轴长的椭圆区域。
9.该种可能的实现方式中,由于性能数据清单中的数据在x方向和y方向的变化尺度不 一致,因此,可以让x方向和y方向的权重不一样,只要适当地设置椭圆的长轴长度和短 轴长度,就可以让x方向距离太远的点不会被纳入当前点的邻域中,同时y方向相邻点如 果波动较大也可以将其纳入其邻域中。进一步增加了区间划分的准确性。
10.在第一方面的一种可能的实现方式中,所述时刻值构成所述坐标点的横坐标值,所述 性能值构成所述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶 差分绝对值的最大值。
11.该种可能的实现方式中,确定椭圆短轴时,为了使相邻的样本点尽可能被纳入当前样 本点的椭圆邻域中,那么椭圆短轴应尽可能放大。但是椭圆短轴的最大值应该等于性能值 在时间序列中变化率绝对值的最大值。因此取性能值在时间序列中的一阶差分绝对值的 最大值作为椭圆短轴长。进一步增加了区间划分的鲁棒性。
12.在第一方面的一种可能的实现方式中,所述方法还包括:当第一区间内坐标点的性能 值的统计量与所述第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值;将 所述第一区间和所述第二区间合并为同一区间。
13.该种可能的实现方式中,不同性能指标的时间序列对参数的敏感程度不同。这就导致 可能某些本来属于同一忙闲等级的数据被聚为了两类。通过比较第一区间内坐标点的性能 值的统计量和第二区间内坐标点的性能值的统计量之间差值的大小,可以分析得出第一区 间和第二区间是否属于同一忙闲等级,该种可能的实现方式还可以排除噪声的干扰,进一 步提升区间划分的准确性。
14.在第一方面的一种可能的实现方式中,所述方法还包括:根据所述性能数据清单中包 括的时间值获取索引值,所述索引值用于构成所述坐标点的横坐标值。
15.该种可能的实现方式中,由于时间戳格式不方便进行坐标间的距离计算,因此,为了能更 方便地计算坐标之间的距离,网络设备需要对性能数据清单中的时间值加以处理。可选的, 网络设备可以根据性能数据清单中的时间值获取索引值,使用索引值代替时间值,便可以 减少计算坐标距离是产生的负载,降低开销。
16.在第一方面的一种可能的实现方式中,所述方法还包括:确认第三参数小于第三阈值, 所述第三参数为所述第一区间内坐标点的性能值的统计量;在所述第一区间所在时间段内 向所述网络设备下发业务。
17.该种可能的实现方式中,网络设备根据以第一坐标点为中心的检测区域内的其他坐标 的数量获取坐标分布区间。根据坐标分布区间得到网络设备负载的忙闲时间段。当有新的 业务需要下发时,只需要把业务上传到业务下发模块,业务下发模块根据坐标分布区间自 动将业务选择在网络设备负载较低的时段下发,节约了人力成本。
18.在第一方面的一种可能的实现方式中,所述方法还包括:确认第三参数大于第四阈值, 所述第三参数为所述第一区间内坐标点的性能值的统计量;指示所述网络设备需要被维护。
19.该种可能的实现方式中,根据以第一坐标点为中心的检测区域内的其他坐标点的数量 获取坐标分布区间。根据坐标分布区间得到网络设备负载的忙闲时间段。根据网络设备的 忙闲时段分别统计网络设备的性能值的变化情况。分析业务繁忙时,网络设备的平均
骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它 步骤或单元。
39.在网络设备的运行过程中,网络设备上运行有各式各样的业务,当业务繁忙时,网络 设备的负载较高。业务空闲时,网络设备的负载较低。通常,运维人员或者其他设备可以 通过多种方式来获取网络设备的负载的变化情况。
40.网络设备运行过程中具有多种性能值,例如每秒i/o次数(i/o per second,iops), 中央处理器(central processing unit,cpu)的利用率等。为了准确获取负载的变化情 况,通常会采集某一性能值的时间序列,即某一性能值在一段时间内随时间变化的情况。 因此,通过分析一段时间内该性能值的高低变化可以间接评估网络设备的负载状况。 若一段时间内,性能值持续超过固定阈值时,则可以认为该网络设备处于忙时区间,若性 能值持续低于固定阈值时,则可以认为该网络设备处于闲时区间。
41.传统的分析方法中,不同的性能值所对应的固定阈值不同。针对不同的性能值,在不 同的工况下,固定阈值难以确定,且性能值中存在噪声时容易影响对于网络设备所处状态 的判断,对于网络设备的负载状况评估时得出的结论的准确性较差。
42.为了解决上述方案中存在的问题,本技术提供了一种数据分析方法、网络设备和网络 系统。本技术中,根据性能数据清单把坐标点划分为不同的坐标分布区间,可以根据区间 中性能值的大小确认网络设备的负载状况,噪声对于评估结果产生的影响较小。对于网络 设备的负载状况评估时得出的结论的准确性较高。
43.本技术中提供的数据分析方法可以应用于多种场景中,不同的场景下,数据分析方法 可以应用于不同的网络系统中,下面结合附图介绍本技术提供的网络系统。
44.场景一:自动化下发业务场景。
45.传统的业务下发技术中,假设设备a为执行业务的设备。在业务下发之前,首先需要 观察设备a的性能指标的历史变化情况,根据历史变化人工统计得到设备a的负载在一天 内的忙闲时间段,然后根据统计结果选择一个设备空闲的时间段由人工操作,将业务下发。 传统的业务下发技术需要人工参与,耗费人力。
46.本技术提供了一种网络系统,通过该网络系统可以实现自动化下发业务,节约了人力 成本。
47.图1为本技术提供的一种网络系统的一种结构示意图。
48.请参阅图1,本技术中,数据采集设备可以持续采集设备a的性能指标数据,可选的, 该性能指标数据中可以包括性能数据清单,并将该性能指标数据传输至设备b。设备b根 据性能数据清单把坐标点划分为不同的坐标分布区间。根据坐标分布区间得到设备a负载 的忙闲时间段。当有新的业务需要下发时,只需要把业务上传到设备b中的业务下发模块, 业务下发模块根据坐标分布区间自动将业务选择在设备a负载较低的时段下发,节约了人 力成本。
49.场景二:设备健康状态评估场景。
50.传统的设备健康状态评估技术中,假设设备c为需要被评估的设备。首先,获取设备 c一段时间内的性能指标的性能值的时间序列,然后对性能值的时间序列求平均值,得到 设备c在一段时间内的健康评估结果。传统评估技术评价健康状态的维度较为单一,评估 结果可能并不能反映设备真实的健康状态变化。例如,某一设备c每天只有一个小时繁
忙, 但是设备c在繁忙时的负载极高,这对设备c的健康状态会产生极大的影响,但是如果采 用取平均的方式得到的评估结果可能是设备c负载合理,设备c运行状态较为健康。由于 对设备c的健康状态产生误判,从而导致对于设备c维护不及时,容易产生重大损失。
51.图2为本技术提供的另一种网络系统的一种结构示意图。
52.请参阅图2,本技术中,数据采集设备可以持续采集设备c的性能指标数据,可选的, 该性能指标数据中可以包括性能数据清单,并将该性能指标数据传输至设备d。根据性能 数据清单把坐标点划分为不同的坐标分布区间。根据坐标分布区间得到设备c负载的忙闲 时间段。根据设备c的忙闲时段分别统计设备c的性能值的变化情况,分析业务繁忙时, 设备c的平均负载处于何种程度。通过多个维度评估设备c的健康状态,给出更为详细的 评估报告,便于及时发现问题,避免重大损失。
53.本技术中,数据分析方法除了可以应用于上述图1、图2所示的网络系统中以外,还 可以应用于其他场景下的其他网络系统中,具体此处不做限定。
54.基于图1和图2所描述的网络系统,对本技术提供的数据分析方法进行介绍。
55.图3为本技术提供的一种数据分析方法的一种流程图。
56.请参阅图3,本技术提供的数据分析方法的一个示例包括步骤101和步骤102。下面, 结合图3来说明本技术提供的数据分析方法。
57.101、获取性能数据清单。
58.本技术中,性能数据清单用于表示性能值的时间序列,性能数据清单中包括时刻值和 与时刻值对应的、描述网络设备性能的性能值。
59.图4为本技术提供的一种性能数据清单的一种结构示意图。
60.请参阅图4,示例性的,性能数据清单是性能值的时间序列,图4中所示的性能数据 清单包含两列,表头为ds的一列为时间戳(时刻值),表头为v的一列是性能指标的具体 值(性能值),该性能数据清单表示了性能指标随时间的变化情况。
61.本技术中,可选的,性能数据清单中性能值对应的性能指标可以是iops,性能指标可 以是cpu利用率,性能指标还可以是其他类型的指标,具体此处不做限定。
62.本技术中,时刻值和性能值用于构成坐标系中的坐标点。
63.图5为本技术提供的一种坐标点的一种结构示意图。
64.请参阅图5,性能数据清单中包括时刻值和与时刻值对应的、描述网络设备性能的性 能值,示例性的,图5中所示的坐标的横坐标值为性能数据清单中的时刻值,纵坐标值为 性能数据清单中的性能值。性能数据清单中包括的时刻值和性能值可以构成多个坐标点。
65.图6为本技术提供的一种性能数据清单的另一种结构示意图。
66.请参阅图6,本技术中,由于时间戳格式不方便进行坐标间的距离计算,因此,为了 能更方便地计算坐标之间的距离,网络设备需要对性能数据清单中的时刻值加以处理。可 选的,网络设备可以根据性能数据清单中的时刻值获取索引值,使用索引值代替时刻值, 便可以减少计算坐标距离是产生的负载,降低网络设备的开销。
67.102、网络设备根据以坐标为中心的检测区域内的其他坐标的数量获取坐标分布区间。
68.本技术中,坐标分布区间用于表示不同时段下网络设备的忙闲程度,坐标分布区间中 包括相邻的第一区间和第二区间,第一区间和第二区间中包括第一坐标点,以任意一
个第 一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,第一区间和第二区之间 存在第二坐标点,以任意一个第二坐标点为中心的检测区域内的其他坐标点的数量小于第 一阈值。
69.图7为本技术提供的一种坐标分布区间的一种示意图。
70.请参阅图7,示例性的,坐标分布区间中包括第一区间和第二区间,第一区间、第二 区间中包括的坐标为坐标点a,坐标点a存在这样的特征,即以坐标点a为中心的某一个 区域内包括的其他坐标的数量大于第一阈值。第一区间、第二区间之间存在一个或多个坐 标点b,坐标点b存在这样的特征,即以坐标点b为中心的某一个区域内包括的其他坐标 的数量小于于第一阈值。由此可以保证第一区间、第二区间中包括性能值相近的坐标点的 集合,第一区间、第二区间中包括的坐标的性能值的统计量可以表示第一区间、第二区间 所在时段内网络设备的忙闲程度。
71.本技术中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括 时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分 为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对 于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
72.图8为本技术提供的一种坐标分布区间的一种示意图。
73.请参阅图8,示例性的,在实际的操作过程中,可以采用dbscan算法根据性能数据清 单获取坐标区间,dbscan算法是一种比较有代表性的基于密度的聚类算法。可以在噪声的 空间数据库中发现任意形状的聚类。dbscan算法需要设置两个关键参数:∈和minpts,其 中,∈描述了某一坐标的邻域距离阈值(半径)。minpts描述了以坐标为中心以∈为半径的 邻域中其他坐标的数量的最小个数(第一阈值)。
74.本技术中,首先输入样本集d={x1,x2,x3,...xm}和邻域参数(∈,minpts)其中,样 本集d便是性能指标表。
75.网络设备获取到样本集合邻域参数后,执行以下步骤:
76.步骤一:初始化核心对象集合初始化类别k=0。
77.步骤二:遍历d的元素,如果是核心对象,则将其加入到核心对象集合ω中。
78.步骤三:如果核心对象集合ω中元素都已经被访问,则算法结束,否则执行如下步骤 四。
79.步骤四:在核心对象ω中,随机选取一个未访问的对象o,首先将o标记为已访问, 然后将o标记类别k,最后将o的∈邻域中未访问的数据,存放到种子集合seeds中。
80.步骤五:若种子集合则当前聚类簇ck生成完毕,且k=k+1,跳转到步骤 三。否则,从种子集合seeds中挑选一个种子点seed,首先将其标记为已访问,标记类别 k,然后判断seed是否为核心对象,如果是,将seed中未访问的种子点加入到种子集合中, 再次跳转至步骤五。
81.本技术中,可选的,采用dbscan算法在判断一个坐标是否处于另一个坐标的∈邻域中 时,使用的距离度量可以是欧式距离。即:
82.83.这种度量方式相当于以一个点的坐标(x,y)为圆心,半径为∈做圆。如果另一个坐标落 在这个圆内部,则说明另一个坐标属于当前坐标的∈邻域内。
84.如图8中所示,假设minpts=2,连续区间内,以坐标点为圆心,∈为半径做圆,圆内 区域中坐标点的数量大于等于2时则可认为属于第一区间。
85.该种可能的实现方式中,通过采用dbscan算法能够在存在噪声的空间数据库中发现 任意形状的聚类,即可以有效地将性能数据清单中包括的数据所构成的坐标进行分区,将 连续序列中性能值相近的坐标划分至相同区间,以便通过观察坐标分布结果中包括的多个 区间判断网络设备在不同时段的忙闲状态。
86.本技术中,上述示例说明了如何根据性能数据清单获取坐标分布区间的具体过程,可 选的,上述示例中,获取坐标分布区间所采用的检测区域具有具体的实现形式,下面将结 合附图详细说明。
87.本技术中,为了增加区间划分的准确性,检测区域可以为以该坐标点为中心,并以第 一参数为短轴长、以第二参数为长轴长的椭圆区域。网络设备可以获取第一参数和第二参 数,其中,第一参数为椭圆区域的短轴长,第二参数为椭圆区域的长轴长。网络设备确认 坐标为中心、第一参数为短轴长、第二参数为长轴长的椭圆区域内的其他坐标的个数大于 第一阈值,则网络设备确认该坐标属于第一区间。
88.示例性的,下面以基于椭圆距离的dbscan算法为例,来说明上述具体的实现方式。 由于性能数据清单中的数据在x方向和y方向的变化尺度不一致,因此,可以让x方向和 y方向的权重不一样,避免出现x方向纳入过远的点,而y方向相邻的点可能不会被纳入 这一现象,增加了区间划分的准确性。下面介绍椭圆距离这一概念。
89.椭圆距离:
[0090][0091]
上述公式等价于以坐标点(x2,y2)为圆心,长轴(x方向)为β(第二参数),短轴(y 方向)为α(第一参数)做椭圆,其对应的曲线为:
[0092]
α2(x-x2)2+β2(y-y2)2=α2β2[0093]
如果distance_ellipse((x1,y1),(x2,y2))≤αβ。则说明点(x1,y1)落在以坐标点(x2,y2)为圆 心,长轴(x方向)为β,短轴(y方向)为α做的椭圆区域内。
[0094]
该种可能的实现方式中,只要适当地设置椭圆的长轴长度和短轴长度,就可以让x方 向距离太远的点不会被纳入当前点的邻域中,同时y方向相邻点如果波动较大也可以将其 纳入其邻域中。进一步增加了区间划分的准确性。
[0095]
本技术中,基于椭圆距离的dbscan算法需要设置三个参数,它们分别是:
[0096]
第二参数,即椭圆长轴β(x方向)。
[0097]
第一参数,即椭圆短轴α(y方向)。
[0098]
第一阈值,即minpts:椭圆邻域内的最大样本点个数。
[0099]
本技术中,确定椭圆短轴时,为了使相邻的样本点尽可能被纳入当前样本点的椭圆邻 域中,那么椭圆短轴应尽可能放大。但是椭圆短轴的最大值应该等于性能值在时间序列中 变化率绝对值的最大值。因此取性能值在时间序列中的一阶差分绝对值的最大值作为椭 圆短轴长α。
[0100]
本技术中,确定椭圆长轴长β和minpts时,minpts和β之间存在固定关系,minpts=
2* β-2+1。当β确定时,minpts也随之确定。可选的,β在一般的时间序列场景下可以取经 验值5,β还可以取值为4,β还可以取其他值,具体此处不做限定。
[0101]
图9为本技术提供的一种坐标分布区间的另一种示意图。
[0102]
例如,如图9所示,根据经验将椭圆长轴长的值设定为5,那么以某坐标为圆心,长 轴为5,短轴取上一步计算的值来画椭圆邻域,则这个椭圆邻域内应当包含9个样本点。 其中有一个样本点为自身,然后左右各四个样本点,左右距离最远的两个样本点没有包含 在椭圆领域内。所以minpts的取值为9。
[0103]
本技术提供的方法示例中,除上述步骤101、步骤102之外,网络设备还可以通过多 种参数确认坐标分布区间中包括的第一区间和第二区间是否需要合并为同一区间,具体的 实现方式将在下面的示例中进行详细说明。
[0104]
本技术中,坐标分布区间中的第二区间和第一区间相邻。当第一区间内坐标点的性能 值的统计量与第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值,则确认 第一区间和第二区间为同一区间。
[0105]
示例性的,基于椭圆距离的dbscan算法能将处于不同忙闲等级的数据分别聚为不同 的类别,但是这需要设置α、β以及minpts等参数。不同性能指标的时间序列对参数的 敏感程度不同。这就导致可能某些本来属于同一忙闲等级的数据被聚为了两类。因此还需 要对聚类后的结果进行一次类簇合并的操作。
[0106]
图10为本技术提供的一种坐标分布区间的另一种示意图。
[0107]
例如,如图10所示,可选的,类簇合并的原则可以有多种,例如,可以通过不同区 间的均值来判断是否需要将类簇进行合并。假设类簇a(第一区间)和类簇b(第二区间) 相邻,网络设备获取类簇a的均值μ1,获取类簇b的均值μ2,若类簇a的均值μ1,分布在 类簇b的均值μ2的正负三倍标准差σ范围内,即如下述公式所示,网络设备可以将第一区 间和第二区间合并。
[0108]
μ
2-3σ≤μ1≤μ2+3σ
[0109]
本技术中,可选的,统计量可以是第一区间、第二区间中性能值的均值,统计量可以 是第一区间、第二区间中性能值的中位数,统计量还可以是其他类型的参数,具体此处不 做限定。
[0110]
本技术中,可选的,网络设备可以确认第一区间中百分之九十的坐标的性能值是否位 于第二区间中的性能值的最大值与最小值之间,若是,则可以认为第一区间和第二区间为 同一区间,若否,则认为第一区间和第二区间为不同区间。此外,网络设备还可以通过其 他多种方式来确认第一区间和第二区间是否为同一区间,具体此处不做限定。
[0111]
本技术中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括 时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分 为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对 于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。
[0112]
上述示例提供了一种数据分析方法的不同的实施方式,下面提供了一种网络设备20, 如图11所示,该网络设备20用于执行上述示例中的步骤,该执行步骤以及相应的有益效 果具体请参照上述相应的示例进行理解,此处不再赘述,该网络设备20包括:
[0113]
获取单元201,用于获取性能数据清单,所述性能数据清单用于表示性能值的时间序 列,所述性能数据清单中包括时刻值和与所述时刻值对应的、描述网络设备性能的性能值, 所述时刻值和所述性能值用于构成坐标系中的坐标点;
[0114]
划分单元202,用于根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其 中:
[0115]
所述坐标分布区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间 中包括相邻的第一区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以 所述任意一个所述第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所 述第一区间和所述第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测 区域内的其他坐标点的数量小于所述第一阈值。
[0116]
一种可能的实现方式中,各个坐标点的所述检测区域为:以该坐标点为中心,并以第 一参数为短轴长、以第二参数为长轴长的椭圆区域。
[0117]
一种可能的实现方式中,所述时刻值构成所述坐标点的横坐标值,所述性能值构成所 述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶差分绝对值的 最大值。
[0118]
一种可能的实现方式中,其特征在于,
[0119]
当第一区间内坐标点的性能值的统计量与所述第二区间内坐标点中的性能值的统计 量的差的绝对值小于第二阈值;
[0120]
合并单元,还用于将所述第一区间和所述第二区间合并为同一区间。
[0121]
一种可能的实现方式中,其特征在于,
[0122]
所述获取单元201,还用于根据所述性能数据清单中包括的时间值获取索引值,所述 索引值用于构成所述坐标点的横坐标值。
[0123]
一种可能的实现方式中,
[0124]
确认单元,还用于确认第三参数小于第三阈值,所述第三参数为所述第一区间内坐标 点的性能值的统计量;
[0125]
发送单元,还用于在所述第一区间所在时间段内向所述网络设备下发业务。
[0126]
一种可能的实现方式中,
[0127]
确认单元,还用于确认第三参数大于第四阈值,所述第三参数为所述第一区间内坐标 点的性能值的统计量;
[0128]
指示单元,还用于指示所述网络设备需要被维护。
[0129]
上述示例提供了一种网络设备20的不同的实施方式,下面提供了一种网络设备30, 如图12所示,该网络设备30用于执行上述示例中网络设备执行的步骤,该执行步骤以及 相应的有益效果具体请参照上述相应的示例进行理解,此处不再赘述。
[0130]
参阅图12所示,为本技术提供一种网络设备的结构示意图,该网络设备30包括:处 理器302、通信接口303、存储器301。可选的,可以包括总线304。其中,通信接口303、 处理器302以及存储器301可以通过总线304相互连接;总线304可以是外围部件互连标 准(peripheral component interconnect,pci)总线或扩充工业标准体系结构(extendedindustry standard architecture,eisa)总线等。所述总线可以分为地址总线、数据总 线、控制总线等。为便于表示,图12中仅用一条粗线表示,但并不表示仅有一根总线或 一种
类型的总线。该网络设备30可以实现图11所示的示例中的网络设备的功能。处理器 302和通信接口303可以执行上述方法示例中网络设备相应的操作。
[0131]
下面结合图12对网络设备的各个构成部件进行具体的介绍:
[0132]
其中,存储器301可以是易失性存储器(volatile memory),例如随机存取存储器 (random-access memory,ram);或者非易失性存储器(non-volatile memory),例如只 读存储器(read-only memory,rom),快闪存储器(flash memory),硬盘(hard disk drive, hdd)或固态硬盘(solid-state drive,ssd);或者上述种类的存储器的组合,用于存储 可实现本技术方法的程序代码、配置文件或其他内容。
[0133]
处理器302是控制器的控制中心,可以是一个中央处理器(central processing unit, cpu),也可以是特定集成电路(application specific integrated circuit,asic),或 者是被配置成实施本技术提供的示例的一个或多个集成电路,例如:一个或多个数字信号 处理器(digital signal processor,dsp),或,一个或者多个现场可编程门阵列(fieldprogrammable gate array,fpga)。
[0134]
通信接口303用于与其他网络设备进行通信。
[0135]
该处理器302可以执行前述图1至图10所示示例中的操作,具体此处不再赘述。
[0136]
需要说明的是,上述网络设备30的各模块之间的信息交互、执行过程等内容,由于 与本技术方法示例基于同一构思,其执行步骤与上述方法步骤的详细内容一致,可参见上 述方法示例处的描述。
[0137]
本技术提供了一种芯片,该芯片包括处理器和通信接口,所述处理器与所述通信接口 耦合,所述处理器用于读取指令执行上述图10所述的示例中网络设备所执行的操作。
[0138]
本技术提供了一种网络系统,该系统包括上述图10所述的示例中所述的网络设备。
[0139]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装 置和单元的具体工作过程,可以参考前述示例中的对应过程,在此不再赘述。
[0140]
在本技术所提供的几个示例中,应该理解到,所揭露的系统,装置和方法,可以通过 其它的方式实现。例如,以上所描述的装置示例仅仅是示意性的,例如,所述单元的划分, 仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以 结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨 论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合 或通信连接,可以是电性,机械或其它的形式。
[0141]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的 部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络 单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本示例的目的。
[0142]
另外,在本技术各个示例中的各功能单元可以集成在一个处理单元中,也可以是各个 单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可 以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0143]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可 以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者 说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形
式体现 出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备 (可以是个人计算机,服务器,或者网络设备等)执行本技术各个示例所述方法的全部或 部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、 随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码 的介质。
[0144]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细 说明,所应理解的是,不同的示例可以进行组合,以上所述仅为本发明的具体实施方式而 已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何组合、 修改、等同替换、改进等,均应包含在本发明的保护范围之内。以上所述,以上示例仅用 以说明本技术的技术方案,而非对其限制;尽管参照前述示例对本技术进行了详细的说明, 本领域的普通技术人员应当理解:其依然可以对前述各示例所记载的技术方案进行修改, 或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本 质脱离本技术各示例技术方案的范围。
技术特征:
1.一种数据分析方法,其特征在于,包括:获取性能数据清单,所述性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐标点;根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其中:所述坐标分布区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间中包括相邻的第一区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以所述任意一个所述第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所述第一区间和所述第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测区域内的其他坐标点的数量小于所述第一阈值。2.根据权利要求1所述的数据分析方法,其特征在于,各个坐标点的所述检测区域为:以该坐标点为中心,并以第一参数为短轴长、以第二参数为长轴长的椭圆区域。3.根据权利要求2所述的数据分析方法,其特征在于,所述时刻值构成所述坐标点的横坐标值,所述性能值构成所述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶差分绝对值的最大值。4.根据权利要求1至3中任意一项所述的数据分析方法,其特征在于,所述方法还包括:当第一区间内坐标点的性能值的统计量与所述第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值;将所述第一区间和所述第二区间合并为同一区间。5.根据权利要求1至4中任意一项所述的数据分析方法,其特征在于,所述方法还包括:根据所述性能数据清单中包括的时间值获取索引值,所述索引值用于构成所述坐标点的横坐标值。6.根据权利要求1至5中任意一项所述的数据分析方法,其特征在于,所述方法还包括:确认第三参数小于第三阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;在所述第一区间所在时间段内向所述网络设备下发业务。7.根据权利要求1至6中任意一项所述的数据分析方法,其特征在于,所述方法还包括:确认第三参数大于第四阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;指示所述网络设备需要被维护。8.一种网络设备,其特征在于,包括:获取单元,用于获取性能数据清单,所述性能数据清单用于表示性能值的时间序列,所述性能数据清单中包括时刻值和与所述时刻值对应的、描述网络设备性能的性能值,所述时刻值和所述性能值用于构成坐标系中的坐标点;划分单元,用于根据所述性能数据清单把坐标点划分为不同的坐标分布区间,其中:所述坐标分布区间用于表示不同时段下所述网络设备的忙闲程度,所述坐标分布区间中包括相邻的第一区间和第二区间,所述第一区间和所述第二区间中包括第一坐标点,以所述任意一个所述第一坐标点为中心的检测区域内的其他坐标点的数量大于第一阈值,所述第一区间和所述第二区之间存在第二坐标点,以所述任意一个第二坐标点为中心的检测
区域内的其他坐标点的数量小于所述第一阈值。9.根据权利要求8所述的网络设备,其特征在于,各个坐标点的所述检测区域为:以该坐标点为中心,并以第一参数为短轴长、以第二参数为长轴长的椭圆区域。10.根据权利要求9所述的网络设备,其特征在于,所述时刻值构成所述坐标点的横坐标值,所述性能值构成所述坐标点的纵坐标值,所述第一参数为性能数据清单中包括的性能值的一阶差分绝对值的最大值。11.根据权利要求8至10中任意一项所述的网络设备,其特征在于,当第一区间内坐标点的性能值的统计量与所述第二区间内坐标点中的性能值的统计量的差的绝对值小于第二阈值;合并单元,还用于将所述第一区间和所述第二区间合并为同一区间。12.根据权利要求8至11中任意一项所述的网络设备,其特征在于,所述获取单元,还用于根据所述性能数据清单中包括的时间值获取索引值,所述索引值用于构成所述坐标点的横坐标值。13.根据权利要求8至12中任意一项所述的网络设备,其特征在于,确认单元,还用于确认第三参数小于第三阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;发送单元,还用于在所述第一区间所在时间段内向所述网络设备下发业务。14.根据权利要求8至13中任意一项所述的网络设备,其特征在于,确认单元,还用于确认第三参数大于第四阈值,所述第三参数为所述第一区间内坐标点的性能值的统计量;指示单元,还用于指示所述网络设备需要被维护。15.一种网络设备,其特征在于,包括:处理器和存储器;所述处理器用于执行所述存储器中存储的指令,使得权利要求1至7中任一项所述的方法被执行。16.一种计算机可读存储介质,用于存储计算机程序,其特征在于,当所述计算机程序在计算机或处理器上执行时,使得权利要求1至7中任一项所述的方法被执行。17.一种计算机程序产品,其特征在于,当其在计算机或处理器上运行时,使得权利要求1至7中任一项所述的方法被执行。
技术总结
本申请公开了一种数据分析方法以及相关设备,本申请中,获取到的性能数据清单用于表示性能值的时间序列,性能数据清单中包括时刻值和与时刻值对应的、描述网络设备性能的性能值。根据性能数据清单把坐标点划分为不同的坐标分布区间,可以根据区间中性能值的大小确认网络设备的负载状况,噪声对于评估结果产生的影响较小。对于网络设备的负载状况评估时得出的结论的准确性较高。的结论的准确性较高。的结论的准确性较高。
技术研发人员:龙坤 宁尚明
受保护的技术使用者:华为技术有限公司
技术研发日:2022.01.30
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
