一种模型生成、磁盘故障预测方法、装置、设备及介质与流程

未命名 09-22 阅读:114 评论:0


1.本发明实施例涉及数据处理技术领域,尤其涉及一种模型生成、磁盘故障预测方法、装置、设备及介质。


背景技术:

2.智能运维(artificial intelligence for it operations,aiops)是一种利用人工智能技术,实现互联网技术(internet technology,it)运维的自动化、智能化和自愈式的技术架构,目前已在多个领域有所应用。
3.磁盘故障预测技术是aiops中的一个重要应用,可帮助运维人员及时发现故障磁盘并更换,从而保障数据的安全性和可靠性。
4.在实现本发明的过程中,发明人发现现有技术中存在以下技术问题:目前采用的磁盘故障预测方案的预测准确度不高,亟待解决。


技术实现要素:

5.本发明实施例提供了模型生成、磁盘故障预测方法、装置、设备及介质,以生成可保证磁盘故障的预测准确度的磁盘故障预测模型。
6.根据本发明的一方面,提供了一种模型生成方法,可以包括:
7.获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,及,与特征提取器和长短期记忆网络分别连接的特征融合模块;
8.得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,及,得到样本属性数据的磁盘故障标签,其中,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后;
9.针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
10.根据本发明的另一方面,提供了一种磁盘故障预测方法,可以包括:
11.获取按照本发明任意实施例提供的模型生成方法生成的磁盘故障预测模型,及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据;
12.针对基于已得到的至少两个目标属性数据构建出的目标时间序列数据,将目标时间序列数据输入到磁盘故障预测模型;
13.根据磁盘故障预测模型的输出结果,得到目标磁盘在未来时间段内的磁盘故障预测结果,其中,未来时间段位于目标时间段之后。
14.根据本发明的另一方面,提供了一种模型生成装置,可以包括:
15.原始预测模型获取模块,用于获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,及,与特征提取器和
长短期记忆网络分别连接的特征融合模块;
16.磁盘故障标签得到模块,用于得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,及,得到样本属性数据的磁盘故障标签,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后;
17.磁盘故障预测模型得到模块,用于针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据以及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
18.根据本发明的另一方面,提供了一种磁盘故障预测装置,可以包括:
19.目标属性数据获取模块,用于按照本发明任意实施例提供的模型生成方法生成的磁盘故障预测模型,及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据;
20.目标属性数据输入模块,用于针对基于已得到的至少两个目标属性数据构建出的目标时间序列数据,将目标时间序列数据输入到磁盘故障预测模型;
21.磁盘故障预测结果得到模块,用于根据磁盘故障预测模型输出的输出结果,得到目标磁盘在未来时间段内的磁盘故障预测结果,其中未来时间段位于目标时间段之后。
22.根据本发明的另一方面,提供了一种电子设备,可以包括:
23.至少一个处理器;以及
24.与至少一个处理器通信连接的存储器;其中,
25.存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器执行时实现本发明任意实施例所提供的模型生成方法或是磁盘故障预测方法。
26.根据本发明的另一方面,提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令用于使处理器执行时实现本发明任意实施例所提供的模型生成方法或是磁盘故障预测方法。
27.本发明实施例的技术方案,通过获取预先构建出的用于实现磁盘故障预测的原始预测模型,该原始预测模型至少可包括特征提取器,lstm网络,以及,与特征提取器和lstm网络分别连接的特征融合模块;得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到样本属性数据的磁盘故障标签,该磁盘故障标签用于表征样本磁盘在样本属性数据对应的样本时间之后的第二样本时间段内的故障情况;进一步,针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据以及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。上述技术方案,通过特征提取器、lstm网络和特征融合模块构建得到的原始预测模型,可充分利用时间序列数据提取特征,而且可基于lstm网络,配合特征融合模块,增强特征提取器的特征提取性能,因此基于原始预测模型训练出的磁盘故障预测模型,可有效保证磁盘故障的预测准确度。
28.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或是重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
29.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
30.图1是根据本发明实施例提供的一种模型生成方法的流程图;
31.图2是根据本发明实施例提供的另一种模型生成方法的流程图;
32.图3是根据本发明实施例提供的另一种模型生成方法的流程图;
33.图4是根据本发明实施例提供的一种磁盘故障预测方法的流程图;
34.图5是根据本发明实施例提供的一种磁盘故障预测方法中的磁盘故障预测模型的结构示意图;
35.图6是根据本发明实施例提供的一种模型生成装置的结构框图;
36.图7是根据本发明实施例提供的一种磁盘故障预测装置的结构框图;
37.图8是实现本发明实施例的模型生成方法或磁盘故障预测方法的电子设备的结构示意图。
具体实施方式
38.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
39.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。“目标”、“原始”等的情况类似,在此不再赘述。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
40.图1是本发明实施例中所提供的一种模型生成方法的流程图。本实施例可适用于生成磁盘故障预测模型的情况。该方法可以由本发明实施例提供的模型生成装置来执行,该装置可以由软件和/或硬件的方式实现,该装置可以集成在电子设备上,该电子设备可以是各种用户终端或是服务器。
41.参见图1,本发明实施例的方法具体包括如下步骤:
42.s110、获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,以及,与特征提取器和长短期记忆网络分别连接的特征融合模块。
43.其中,原始预测模型可理解为预先构建出的用于实现磁盘故障预测的模型,尤其可以是深度学习模型。在本发明实施例中,原始预测模型至少可包括特征提取器,长短期记
忆(long short-term memory,lstm)网络,以及,与特征提取器和lstm分别连接的特征融合模块。
44.其中,特征提取器可理解为用于对时间序列数据进行特征提取的模块,在实际应用中,可选的,可基于深度神经网络构建得到,例如可以是全卷积神经网络(fully convolutional networks,fcn)或是残差网络(residual network,resnet)等具备时间序列数据处理功能的深度神经网络,在此未做具体限定。
45.为了增强基于特征提取器提取出的特征,考虑到lstm网络单个层内单元之间存在有向连接可提取序列之间的时间信息,因此本发明实施例在原始预测模型中设置了lstm网络以及与特征提取器和lstm网络分别连接的特征融合模块,由此可通过特征融合模块,对基于特征提取器从时间序列数据中提取的特征以及基于lstm网络从时间序列数据中提取的特征进行融合,从而实现了增强特征提取器的特征提取性能的效果。实际应用中,可选的,上述的lstm网络可以是单向lstm网络或是双向lstm(bi-directional lstm,bilstm)网络,需要说明的是,相较于单向lstm网络,bilstm网络通过将单向lstm网络的隐藏神经元层分为前向传递和后向传递,由此可从时间序列数据中捕获到更高级的上下文信息,具备更佳的信息提取能力。再可选的,上述特征融合过程,可通过concat或是add等方案实现,在此未做具体限定。
46.在此基础上,考虑到lstm网络难以从较长的时间序列数据中学习到长期依赖关系,为了克服这一缺陷,可选的,本发明实施例在原始预测模型中设置注意力(attention)模块。具体的,原始预测模型至少可包括特征提取器,lstm模块,以及,与特征提取器和lstm模块分别连接的特征融合模块,其中,lstm模块可包括lstm网络以及与lstm网络连接的注意力模块,由此可通过采用注意力机制来帮助lstm网络挖掘这些长期依赖关系。
47.可选的,为了让原始预测模型具备预测功能,可在原始预测模型中设置与特征融合模块连接的分类器,例如可以是通过softmax层表示的分类器,从而可通过分类器对特征融合模块输出的特征进行处理以实现预测功能。
48.再可选的,在实际应用中,特征提取器和lstm网络可用于从不同的角度处理相同的时间序列数据。具体而言,特征提取器可将时间序列数据视为具有多个时间步长的单变量时间序列数据,在这种情况下,若时间序列数据的长度为n,则特征提取器在n个时间步长中接收数据。相应的,lstm网络将时间序列数据处理为具有单个时间步长的多变量时间序列数据,为实现这一目的,本发明实施例在原始预测模型中设置与lstm网络连接的维度重组(shuffle)层,由此可通过维度重组层,将原始的时间序列数据的维度,处理为与lstm网络适配的维度,以便基于此,利用lstm网络处理时间序列数据。
49.s120、得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到样本属性数据的磁盘故障标签,其中,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后。
50.其中,第一样本时间段可理解为在模型训练过程中涉及到的时间段。样本时间可理解为第一样本时间段内的时间,样本时间的数量可以是两个或是多个,这可根据实际情况进行设置,在此未做具体限定。示例性的,可将当前时间之前的10个月作为第一样本时间段,并且将10个月中的每天分别作为样本时间。
51.样本磁盘可理解为在模型训练过程中涉及的磁盘,样本磁盘的数量可以是一个、两个或是多个,这可根据实际情况进行确定,在此未做具体限定。
52.在此基础上,针对至少一个样本磁盘中的每个样本磁盘,可针对样本磁盘在第一样本时间段内的每个样本时间上分别采集到样本属性数据,由此可得到与每个样本时间分别对应的样本属性数据。换言之,样本属性数据可理解为在与样本属性数据对应的样本时间上采集到的用于表征样本磁盘的属性的数据。结合本发明实施例可能涉及的应用场景,可选的,这里的属性可以是smart属性,这时的样本属性数据可称为样本smart数据,在实际应用中,其可由嵌入在磁盘驱动器固件中的硬件级传感器数据提供。smart是自我检测、分析和报告技术(self-monitoring,analysis and reporting technology)的简称。
53.根据上述阐述可知,在本发明实施例中,可得到在每个样本时间上,针对样本磁盘分别采集到的样本属性数据。进一步,针对得到的至少两个样本属性数据中的每个样本属性数据,得到针对样本属性数据标注出的磁盘故障标签,在实际应用中,可选的,磁盘故障标签的标注过程,可通过人工或是自动实现,在此未做具体限定。需要说明的是,为了训练出具备磁盘故障预测功能的磁盘故障预测模型,上述磁盘故障标签,用于表征样本磁盘在第二样本时间段内的故障情况,该第二样本时间段为磁盘故障标签对应的样本时间之后的时间段。在实际应用中,可选的,上述故障情况可以为是否发生故障,在此基础上,进一步,在发生故障的情况下,还可以为故障类型(例如可以是电机轴承磨损或是磁盘磁介质劣化)等,在此未做具体限定。
54.s130、针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
55.其中,由于经过前述步骤得到的至少两个样本属性数据在不同样本时间上分别采集得到,因此可基于这些样本属性数据构建出样本时间序列数据。在此基础上,基于样本时间序列数据以及样本时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
56.本发明实施例的技术方案,通过获取预先构建出的用于实现磁盘故障预测的原始预测模型,该原始预测模型至少可包括特征提取器,lstm网络,以及,与特征提取器和lstm网络分别连接的特征融合模块;得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到样本属性数据的磁盘故障标签,该磁盘故障标签用于表征样本磁盘在样本属性数据对应的样本时间之后的第二样本时间段内的故障情况;进一步,针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据以及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。上述技术方案,通过特征提取器、lstm网络和特征融合模块构建得到的原始预测模型,可充分利用时间序列数据提取特征,而且可基于lstm网络,配合特征融合模块,增强特征提取器的特征提取性能,因此基于原始预测模型训练出的磁盘故障预测模型,可有效保证磁盘故障的预测准确度。
57.一种可选的技术方案,样本属性数据包括样本smart数据,样本smart数据包括至少两个smart特征,上述模型生成方法,还包括:
58.在原始预测模型的训练过程中,根据原始预测模型的输出结果,分析得到至少两
个smart特征中的每个smart特征的重要性;
59.根据重要性,对至少两个smart特征进行筛选,并基于筛选后保留下来的smart特征,对样本smart数据进行更新,以基于样本smart数据,针对原始预测模型进行训练。
60.其中,在实际应用中,在一个样本时间上采集到的样本smart数据通常包括至少两个smart特征。经实验发现,这些smart特征具有冗余性,即它们在磁盘故障预测方面并非具有同等重要的作用。因此,为最大限度的使用样本smart数据中更为重要的smart特征,可针对这些smart特征进行特征重要性分析,以从中找到更为重要的smart特征来应用在模型训练过程中,由此进一步提高了训练出的磁盘故障预测模型的预测准确度。
61.具体的,在原始预测模型的训练过程中,根据原始预测模型的输出结果,分析出至少两个smart特征中每个smart特征的重要性,从而根据重要性,可对至少两个smart特征进行筛选,并基于筛选后保留下来的smart特征,即更为重要的smart,更新样本smart数据,从而可基于更新后的样本smart数据,继续或是重新训练原始预测模型。
62.在实际应用中,可选的,上述smart特征的筛选过程,可进行一轮或是多轮。示例性的,假设共存在100个smart特征,这100个smart特征均提供了磁盘的某些运行状态信息,可用于预测磁盘可能出现的故障。在第一轮模型训练过程中,根据原始预测模型的输出结果,从这100个smart特征中筛掉20个smart特征,然后基于保留下来的80个smart特征更新样本smart数据,并以此为基础进行第二轮模型训练。在第二轮模型训练过程中,类似的,根据原始预测模型的输出结果,从80个smart特征中筛掉20个smart特征,并基于保留下来的60个smart特征更新样本smart数据,以此为基础进行第三轮模型训练。以此类推,最后可得到筛选后保留下来的smart特征,基于这些smart特征进行模型训练。
63.示例性的,在实际应用中,不同磁盘类型和/或制造对象下的磁盘的smart特征可能存在差别,这里对某制造对象制造出的磁盘的各个smart特征进行特征重要性分析,最终保留下来如表1所示的8个smart特征进行应用:smart 1、smart 5、smart 7、smart 187、smart 193、smart 194、smart 241以及smart 242。
64.表1采用的smart特征及其含义
65.[0066][0067]
上述技术方案,通过对smart特征进行特征重要性分析,进一步提高了训练出的磁盘故障预测模型的预测准确度。
[0068]
图2是本发明实施例中提供的另一种模型生成方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,上述模型生成方法,还可包括:从故障池中抽取出发生过磁盘故障的服务器的服务器标识,其中,部署在服务器上的磁盘为样本磁盘;得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,可包括:根据服务器标识,从数据中心抽取出在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据。其中,与上述各实施例相同或是相应的术语的解释在此不再赘述。
[0069]
参见图2,本实施例的方法具体可以包括如下步骤:
[0070]
s210、获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,以及,与特征提取器和长短期记忆网络分别连接的特征融合模块。
[0071]
s220、从故障池中抽取出发生过磁盘故障的服务器的服务器标识,其中,部署在服务器上的磁盘为样本磁盘。
[0072]
其中,本发明实施例阐述的磁盘可理解为服务器磁盘,即部署在服务器上应用的磁盘。针对至少一个服务器中发生过磁盘故障的服务器,这里将部署在服务器上的磁盘称为样本磁盘,样本磁盘的数量可以是一个、两个或是多个,这与实际情况有关,在此并未做具体限定。在此基础上,进一步,将各个样本磁盘中发生过故障的样本磁盘称为故障磁盘。
[0073]
在实际应用中,可将故障磁盘的故障信息存储在故障池中,示例性的,该故障信息可包括故障磁盘的磁盘标识和故障时间,以及,故障磁盘所在的服务器的服务器标识和所在的槽位(slot)的槽位标识等,在此未做具体限定。可选的,上述服务器标识可通过产品序列号(serial number,sn)进行表示。
[0074]
从故障池中抽取服务器标识,该服务器标识对应的服务器发生过磁盘故障。
[0075]
s230、根据服务器标识,从数据中心中抽取出在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据。
[0076]
其中,在实际应用中,有些服务器发生过磁盘故障并且有些服务器未发生过磁盘故障,这意味着全部服务器上的各个磁盘中的有些磁盘是样本磁盘并且有些磁盘不是样本磁盘。针对各个磁盘中的每个磁盘,可将在每个样本时间上针对磁盘分别采集到的磁盘属性数据,存储到数据中心。除此之外,还可将与磁盘属性数据对应的磁盘标识、槽位标识、服务器标识和样本时间等数据,与磁盘属性数据共同存储到数据中心。
[0077]
在此基础上,根据上文阐述可知,从故障池中抽取出的服务器标识所表征的服务器上的各个磁盘均为样本磁盘,因此可以根据抽取出的服务器标识,从数据中心中抽取出样本属性数据,即将数据中心中与抽取出的服务器标识对应的磁盘属性数据作为样本属性数据,抽取出来。
[0078]
实际应用中,可选的,在抽取得到样本属性数据之后,可对这些样本属性数据进行清洗以去除异常数据和无效数据,这保证了在模型训练过程中应用的样本属性数据的规范性和可靠性,由此进一步提高了磁盘故障的预测准确度。
[0079]
再可选的,考虑到不同磁盘类型和/或制造对象下的样本磁盘各有各的特点,因此可针对不同磁盘类型和/或制造对象下的样本磁盘分别进行样本属性数据的抽取以及模型训练,由此进一步提高了磁盘故障的预测准确度。
[0080]
s240、针对已得到的至少两个样本属性数据中的每个样本属性数据,得到样本属性数据的磁盘故障标签,其中,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后。
[0081]
s250、针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
[0082]
本发明实施例的技术方案,针对发生过磁盘故障的服务器,通过从故障池中抽取出服务器的服务器标识,进而,由于部署在服务器上的磁盘为样本磁盘,因此可根据服务器标识,从数据中心中抽取出针对样本磁盘采集到的样本属性数据,由此实现了样本属性数据的准确并且快速得到的效果。
[0083]
一种可选的技术方案,服务器上的样本磁盘的数量包括至少一个,从数据中心抽取出在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,包括:
[0084]
从数据中心抽取出在第一样本时间段内的每个样本时间上,针对至少一个样本磁盘中的每个样本磁盘,分别采集到的样本属性数据;
[0085]
上述模型生成方法,还包括:
[0086]
从故障池中抽取出故障磁盘的磁盘标识以及故障时间,其中,故障磁盘为至少一个样本磁盘中发生过故障的样本磁盘;
[0087]
得到样本属性数据的磁盘故障标签,包括:
[0088]
根据至少一个样本磁盘中与样本属性数据对应的样本磁盘的磁盘标识以及故障磁盘的磁盘标识,得到标识对比结果;
[0089]
根据样本属性数据对应的样本时间、故障时间以及第二样本时间段的样本时间长度,得到时间对比结果;
[0090]
根据标识对比结果和时间对比结果,标注出样本属性数据的磁盘故障标签,以得到样本属性数据的磁盘故障标签。
[0091]
其中,从数据中心中抽取出在每个样本时间上针对每个样本磁盘分别采集到的样本属性数据。可以理解的是,虽然至少一个样本磁盘所在的服务器发生过磁盘故障,但这并不意味着至少一个样本磁盘均是故障磁盘,也并不意味着至少一个样本磁盘中的故障磁盘在每个样本时间上均处于故障状态,因此针对抽取出的样本属性数据进行准确标注,这对
于模型训练精度至关重要。
[0092]
具体的,样本磁盘是否发生过故障,即是否为故障磁盘,这会直接影响到样本属性数据的标注结果。因此,可从故障池中抽取出故障磁盘的磁盘标识,然后针对样本属性数据对应的样本磁盘的磁盘标识与故障磁盘的磁盘标识进行标识对比,得到标识对比结果。
[0093]
除此外,样本时间长度可用于表征第二样本时间段的时间跨度,例如可以是1天、3天或是5天等,这可根据实际情况进行设置,在此未做具体限定。由于本发明实施例训练出的磁盘故障预测模型用于预测未来样本时间长度内的磁盘故障情况,因此可从故障池中抽取出故障磁盘发生故障的故障时间,然后根据样本属性数据对应的样本时间(即样本属性数据的采集时间)、故障时间以及样本时间长度进行时间对比,得到时间对比结果。
[0094]
进而,可根据时间对比结果和标识对比结果,对样本属性数据进行标注,得到样本属性数据的磁盘故障标签。
[0095]
上述技术方案,通过时间对比与标识对比,实现了磁盘故障标签的自动并且准确标注。
[0096]
在此基础上,可选的,根据标识对比结果和时间对比结果,标注出样本属性数据的磁盘故障标签,包括:
[0097]
在标识对比结果表征样本属性数据对应的样本磁盘的磁盘标识与故障磁盘的磁盘标识不同的情况下,将样本属性数据的磁盘故障标签标注为磁盘正常;
[0098]
否则,在时间对比结果表征故障时间晚于样本属性数据对应的样本时间,以及,故障时间与样本属性数据对应的样本时间间的差值小于或等于样本时间长度的情况下,将样本属性数据的磁盘故障标签标注为磁盘故障,否则标注为磁盘正常。
[0099]
换言之,在根据标识对比结果确定样本属性数据对应的样本磁盘不是故障磁盘的情况下,说明基于样本属性数据预测的未来样本时间长度下的磁盘故障结果应该是磁盘正常,因此可直接将样本属性数据的磁盘故障标签标注为磁盘正常,例如可置label=0。否则(即在根据标识对比结果确定样本属性数据对应的样本磁盘是故障磁盘的情况下),可结合时间对比结果,进一步判断基于样本属性数据预测的未来样本时间长度下的磁盘故障结果应该是磁盘故障或是磁盘正常,并基于此为样本属性数据的磁盘故障标签进行标注。
[0100]
具体的,在时间对比结果表征故障时间晚于样本属性数据对应的样本时间,以及,故障时间与样本属性数据对应的样本时间间的差值小于或等于样本时间长度的情况下,说明基于样本属性数据预测的未来样本时间长度下的磁盘故障结果应该是磁盘故障,将样本属性数据的磁盘故障标签标注为磁盘故障,例如可置label=1;相应的,在时间对比结果表征出故障时间早于或等于样本属性数据对应的样本时间,和/或,故障时间与样本属性数据对应的样本时间之间的差值大于样本时间长度的情况下,说明基于样本属性数据预测的未来样本时间长度下的磁盘故障结果应该是磁盘正常,将磁盘故障标签标注为磁盘正常。
[0101]
上述技术方案,通过标识对比结果和时间对比结果的依次判断,可以实现样本属性数据的磁盘故障标签的准确标注。
[0102]
图3是本发明实施例中提供的另一种模型生成方法的流程图。本实施例以上述各技术方案为基础进行优化。在本实施例中,可选的,原始预测模型还可包括与特征融合模块连接的分类器;基于样本时间序列数据及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型,可包括:将样本时间序列数据输入到长短期记忆网络,
得到第一特征;将样本时间序列数据输入到特征提取器,得到第二特征;将第一特征和第二特征输入到特征融合模块,得到融合特征;将融合特征输入到分类器,得到磁盘故障分类结果;根据磁盘故障分类结果及得到的至少两个磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
[0103]
参见图3,本实施例的方法具体可以包括如下步骤:
[0104]
s310、获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,与特征提取器和长短期记忆网络分别连接的特征融合模块,以及,与特征融合模块连接的分类器。
[0105]
其中,分类器可理解为原始预测模型中用于根据特征融合模块输出的融合特征预测磁盘故障情况,即针对磁盘故障情况进行分类的模块。
[0106]
s320、得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到样本属性数据的磁盘故障标签,其中,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后。
[0107]
s330、针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,将样本时间序列数据输入到长短期记忆网络中,得到第一特征,以及,将样本时间序列数据输入到特征提取器中,得到第二特征。
[0108]
其中,将样本时间序列数据,分别输入到lstm网络和特征提取器,从而可得到lstm网络输出的第一特征以及特征提取器输出的第二特征。
[0109]
s340、将第一特征和第二特征输入到特征融合模块,得到融合特征,并将融合特征输入到分类器,得到磁盘故障分类结果。
[0110]
其中,将第一特征和第二特征输入到特征融合模块,以通过特征融合模块,对二者进行融合,得到融合特征,实现了基于第一特征增强第二特征的效果。
[0111]
进一步,将融合特征输入到分类器,以通过分类器,处理融合特征,得到磁盘故障分类结果,例如可以为是否发生故障,在此基础上,进一步,在发生故障的情况下,还可以为故障类型等,在此未做具体限定。实际应用中,可选的,通过分类器,可得到样本时间序列数据中的各个样本属性数据分别对应的磁盘故障分类结果,也可在预先将样本时间序列数据切分为至少两个切分时间序列数据的情况下,得到至少两个切分时间序列数据中每个切分时间序列数据分别对应的磁盘故障分类结果,等等,在此未做具体限定。
[0112]
s350、根据磁盘故障分类结果以及得到的至少两个磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。
[0113]
其中,磁盘故障分类结果是原始预测模型的实际输出结果,磁盘故障标签是原始预测模型的期望输出结果,因此可根据二者调整原始预测模型中的参数,从而训练得到磁盘故障预测模型。
[0114]
本发明实施例的技术方案,通过将样本时间序列数据,分别输入到lstm网络和特征提取器,并将lstm网络和特征提取器分别输出的特征输入到特征融合模块中进行特征融合,由此实现了基于lstm网络增强特征提取器的特征提取功能的效果;然后,通过将特征融合模块输出的融合特征输入到分类器中以得到磁盘故障分类结果,从而可根据磁盘故障分
类结果和磁盘故障标签进行模型训练,由此实现了原始预测模型的有效训练。
[0115]
一种可选的技术方案,原始预测模型还包括与长短期记忆网络连接的维度重组层;
[0116]
将样本时间序列数据输入到长短期记忆网络中,得到第一特征,包括:
[0117]
将样本时间序列数据输入到维度重组层,以通过维度重组层,基于预设时间间隔,切分样本时间序列数据,得到至少两个切分时间序列数据;
[0118]
将至少两个切分时间序列数据分别输入到长短期记忆网络中,得到与至少两个切分时间序列数据分别对应的第一特征;
[0119]
将第一特征和第二特征输入到特征融合模块,得到融合特征,包括:
[0120]
针对至少两个切分时间序列数据中的每个切分时间序列数据,将切分时间序列数据对应的第一特征与第二特征进行融合,得到融合特征;
[0121]
根据磁盘故障分类结果及得到的至少两个磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型,包括:
[0122]
根据切分时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,得到切分时间序列数据的磁盘故障标签;
[0123]
根据磁盘故障分类结果及切分时间序列数据的磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。
[0124]
其中,正如上文所述,为了利用lstm网络有效处理样本时间序列数据,可先将样本时间序列数据输入到维度重组层,从而通过维度重组层,基于预设时间间隔,切分样本时间序列数据,得到至少两个切分时间序列数据。上述的预设时间间隔可理解为预先设置的与时间有关的间隔,例如可以是5天、7天或是9天等,这可根据实际情况进行设置,在此未做具体限定。
[0125]
在此基础上,进一步,针对切分出的各个切分时间序列数据分别进行处理。具体的,针对切分出的至少两个切分时间序列数据中的每个切分时间序列数据,将切分时间序列数据输入到lstm网络,得到与切分时间序列数据对应的第一特征。然后,针对第一特征和第二特征进行融合处理和分类处理,得到与切分时间序列数据对应的磁盘故障分类结果。
[0126]
需要说明的是,目前已得到各个样本属性数据分别对应的磁盘故障标签,由于这里基于切分时间序列数据这个整体进行磁盘故障分类,因此可根据切分时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,得到切分时间序列数据的磁盘故障标签,从而可根据各个切分时间序列数据分别对应的磁盘故障分类结果和磁盘故障标签,训练原始预测模型。
[0127]
上述技术方案,通过利用维度重组层处理样本时间序列数据,得到可被lstm网络处理的切分时间序列数据;在此基础上,通过切分时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,确定切分时间序列数据的磁盘故障标签,进而可结合切分时间序列数据的磁盘故障分类结果,实现模型训练。
[0128]
在此基础上,可选的,根据切分时间序列数据中各个样本属性数据分别对应的磁盘故障标签,得到切分时间序列数据的磁盘故障标签,包括:
[0129]
在切分时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,均表征磁盘正常的情况下,将针对切分时间序列数据的磁盘故障标签标注为磁盘正常,否则标注为
磁盘故障。
[0130]
上述技术方案,实现了磁盘故障标签的简单并且快速标注。
[0131]
另一种可选的技术方案,上述模型生成方法,还包括:
[0132]
基于预设滑动窗口,处理样本时间序列数据,得到样本窗口数据;
[0133]
将样本时间序列数据输入到长短期记忆网络中,得到第一特征,包括:
[0134]
将样本时间序列数据以及样本窗口数据,输入到长短期记忆网络中,得到第一特征;
[0135]
将样本时间序列数据输入到特征提取器中,得到第二特征,包括:
[0136]
将样本时间序列数据以及样本窗口数据,输入到特征提取器中,得到第二特征。
[0137]
其中,为了提升样本时间序列数据的特征表达能力,可基于预设滑动窗口,处理样本时间序列数据,得到样本窗口数据,然后将样本时间序列数据和样本窗口数据共同输入到lstm中,得到第一特征,以及,共同输入到特征提取器中,得到第二特征。除此之外,可选的,还可先利用维度重组层切分样本时间序列数据,然后再利用预设滑动窗口,对切分出的切分时间序列数据进行滑窗处理,得到样本窗口数据,并将样本时间序列数据和样本窗口数据共同输入到lstm网络。当然,还可针对其余对象进行滑窗处理,在此未做具体限定。
[0138]
上述技术方案,通过对时间序列数据进行滑窗处理,提高了时间序列数据的特征表达能力,这有助于进一步提高训练出的磁盘故障预测模型的预测精度。
[0139]
图4是本发明实施例中所提供的一种磁盘故障预测方法的流程图。本实施例可适用于预测目标磁盘在未来时间段内的磁盘故障的情况。该方法可以由本发明实施例提供的磁盘故障预测装置来执行,该装置可由软件和/或硬件的方式实现,该装置可集成在电子设备上,该电子设备可以是各种用户终端或服务器。
[0140]
参见图4,本发明实施例的方法具体包括如下步骤:
[0141]
s410、获取按照本发明任意实施例所提供的模型生成方法生成的磁盘故障预测模型,以及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据。
[0142]
其中,磁盘故障预测模型可理解为按照上述任意技术方案生成的用于实现磁盘故障预测的模型,尤其可以是深度学习模型。
[0143]
目标时间段可理解为在模型应用过程中涉及到的时间段,例如可以是当前时间段或当前时间段之前的历史时间段,可以理解的是,相较于历史时间段,在当前时间段下采集到的目标属性数据属于实时数据,可更好地保证磁盘故障的预测准确度。目标时间段的目标时间长度可以是第一样本时间段的样本时间长度,尤其可以是上文阐述的预设时间间隔,等等,在此未做具体限定。目标时间可理解为目标时间段内的时间,目标时间的数量可以是两个或是多个,这可根据实际情况进行设置,在此未做具体限定。示例性的,可将当前1周作为目标时间段,并且将当前1周内的每天分别作为目标时间。
[0144]
目标磁盘可理解为在模型应用过程中涉及的磁盘,即待预测其的磁盘故障情况的磁盘。在实际应用中,可针对目标磁盘在目标时间段内的每个目标时间上分别采集到目标属性数据,由此可得到与每个目标时间分别对应的目标属性数据。换言之,目标属性数据可理解为在对应的目标时间上采集到的用于表征目标磁盘的属性的数据。结合本发明实施例可能涉及到的应用场景,可选的,这里的目标属性数据可以是目标smart数据。
[0145]
s420、针对基于得到的至少两个目标属性数据构建出的目标时间序列数据,将目标时间序列数据输入到磁盘故障预测模型。
[0146]
其中,由于经过前述步骤得到的至少两个目标属性数据在不同目标时间上分别采集得到,因此可基于这些目标属性数据构建出目标时间序列数据。然后,将目标时间序列数据输入到磁盘故障预测模型中,以通过磁盘故障预测模型,处理目标时间序列数据,并输出相应的处理结果,例如可以针对目标时间序列数据这个整体输出磁盘故障预测结果,也可以针对目标时间序列数据中的各个目标属性数据分别输出磁盘故障预测结果,等等,在此未做具体限定。
[0147]
s430、根据磁盘故障预测模型的输出结果,得到目标磁盘在未来时间段内的磁盘故障预测结果,其中,未来时间段位于目标时间段之后。
[0148]
其中,未来时间段可理解为目标时间段之后的未发生的时间段,通常情况下,未来时间段的未来时间长度与上文中第二样本时间段的样本时间长度相同。根据磁盘故障预测模型的输出结果,得到目标磁盘在未来时间段内的磁盘故障预测结果,例如可为是否发生故障,在此基础上,进一步,在发生故障的情况下,还可为故障类型等,在此未做具体限定。
[0149]
实际应用中,可选的,在磁盘故障预测结果表征出目标磁盘在未来时间段内会发生故障的情况下,运维人员可采取相应的措施,例如及时更换目标磁盘或者对目标磁盘内的数据进行备份,由此保障了数据的安全性和可靠性。
[0150]
本发明实施例的技术方案,通过利用在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据,构建得到目标时间序列数据,然后利用磁盘故障预测模型,对目标时间序列数据进行处理,由此实现了准确预测目标磁盘在未来时间段内的磁盘故障情况的效果。
[0151]
为了更加形象地理解上述任意技术方案中阐述的磁盘故障预测模型,这里结合具体示例,对其进行示例性说明。示例性的,如图5所示,磁盘故障预测模型可包括双向长短期记忆模块(bilstm block),基于fcn或是resnet构建出的深度特征提取器(deep feature extractor),与深度特征提取器连接的全局池化(global pooling)层,与全局池化层和bilstm block分别连接的通过concat实现的特征融合模块,及,与特征融合模块连接的通过softmax实现的分类器。具体的,bilstm block包括依次连接的维度重组(dimension shuffle)层、bilstm网络、注意力(attention)模块以及dropout层。实际应用中,可选的,fcn可由两个堆叠的基本卷积块(basic convolutional block)组成,每个基本卷积块可包括conv1d、bn和relu;再可选的,resnet可由两个基本残差块(basic residual block)堆叠而成,每个基本残差块可包括3个基本卷积块。
[0152]
在磁盘故障预测过程中,可以将基于各个目标smart数据构建出的目标时间序列数据,以及,通过利用预设滑动窗口,处理目标时间序列数据得到的目标窗口数据,共同作为输入数据,分别输入到bilstm block中和深度特征提取器中进行特征提取,然后利用特征融合模块和分类器进行后续处理,从而得到目标磁盘在未来时间段内的磁盘故障预测结果。
[0153]
上述示例中的磁盘故障预测模型,包括bilstm block和深度特征提取器两个部分,可有效地捕获输入数据的相关特征并针对磁盘故障进行准确预测。
[0154]
图6为本发明实施例中提供的模型生成装置的结构框图,该装置用于执行上述任
意实施例所提供的模型生成方法。该装置与上述各实施例的模型生成方法属于同一个发明构思,在模型生成装置的实施例中未详尽描述的细节内容,可以参考上述模型生成方法的实施例。参见图6,该装置具体可以包括:原始预测模型获取模块510、磁盘故障标签得到模块520和磁盘故障预测模型得到模块530。其中,
[0155]
原始预测模型获取模块510,用于获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,以及,与特征提取器和长短期记忆网络分别连接的特征融合模块;
[0156]
磁盘故障标签得到模块520,用于得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到样本属性数据的磁盘故障标签,其中,磁盘故障标签用于表征样本磁盘在第二样本时间段内的故障情况,第二样本时间段位于样本属性数据对应的样本时间之后;
[0157]
磁盘故障预测模型得到模块530,用于针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据以及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。
[0158]
可选的,上述模型生成装置,还包括:
[0159]
服务器标识抽取模块,用于从故障池中抽取出发生过磁盘故障的服务器的服务器标识,其中,部署在服务器上的磁盘为样本磁盘;
[0160]
磁盘故障标签得到模块520,包括:
[0161]
样本属性数据抽取单元,用于根据服务器标识,从数据中心抽取出在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据。
[0162]
在此基础上,可选的,服务器上的样本磁盘的数量是至少一个,样本属性数据抽取单元,包括:
[0163]
样本属性数据抽取子单元,用于从数据中心抽取出在第一样本时间段内的每个样本时间上,针对至少一个样本磁盘中的每个样本磁盘,分别采集得到的样本属性数据;
[0164]
上述模型生成装置,还包括:
[0165]
故障时间抽取模块,用于从故障池中抽取出故障磁盘的磁盘标识以及故障时间,其中,故障磁盘为至少一个样本磁盘中发生过故障的样本磁盘;
[0166]
磁盘故障标签得到模块520,还包括:
[0167]
标识对比结果得到单元,用于根据至少一个样本磁盘中与样本属性数据对应的样本磁盘的磁盘标识以及故障磁盘的磁盘标识,得到标识对比结果;
[0168]
时间对比结果得到单元,用于根据与样本属性数据对应的样本时间、故障时间以及第二样本时间段的样本时间长度,得到时间对比结果;
[0169]
磁盘故障标签标注单元,用于根据标识对比结果和时间对比结果,标注出样本属性数据的磁盘故障标签,以得到样本属性数据的磁盘故障标签。
[0170]
在此基础上,可选的,磁盘故障标签标注单元,具体用于:
[0171]
在标识对比结果表征样本属性数据对应的样本磁盘的磁盘标识与故障磁盘的磁盘标识不同的情况下,将样本属性数据的磁盘故障标签标注为磁盘正常;
[0172]
否则,在时间对比结果表征故障时间晚于样本属性数据对应的样本时间,以及,故障时间与样本属性数据对应的样本时间之间的差值小于或等于样本时间长度的情况下,将
样本属性数据的磁盘故障标签标注为磁盘故障,否则标注为磁盘正常。
[0173]
可选的,原始预测模型还包括与特征融合模块连接的分类器;
[0174]
磁盘故障预测模型得到模块530,包括:
[0175]
第一特征得到子模块,用于将样本时间序列数据输入到长短期记忆网络,得到第一特征;
[0176]
第二特征得到子模块,用于将样本时间序列数据输入到特征提取器,得到第二特征;
[0177]
融合特征得到子模块,用于将第一特征和第二特征输入到特征融合模块,得到融合特征;
[0178]
磁盘故障分类结果得到子模块,用于将融合特征输入到分类器,得到磁盘故障分类结果;
[0179]
模型训练子模块,用于根据磁盘故障分类结果及得到的至少两个磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。
[0180]
在此基础上,一可选的,原始预测模型还可包括与长短期记忆网络连接的维度重组层;第一特征得到子模块,具体用于:
[0181]
将样本时间序列数据输入到维度重组层,以通过维度重组层,基于预设时间间隔,切分样本时间序列数据,得到至少两个切分时间序列数据;
[0182]
将至少两个切分时间序列数据分别输入到长短期记忆网络,得到与至少两个切分时间序列数据分别对应的第一特征;
[0183]
融合特征得到子模块,具体用于:
[0184]
针对至少两个切分时间序列数据中的每个切分时间序列数据,将切分时间序列数据对应的第一特征与第二特征进行融合,得到融合特征;
[0185]
模型训练子模块,包括:
[0186]
磁盘故障标签得到单元,用于根据切分时间序列数据中各个样本属性数据分别对应的磁盘故障标签,得到切分时间序列数据的磁盘故障标签;
[0187]
模型训练单元,用于根据磁盘故障分类结果以及切分时间序列数据的磁盘故障标签,对原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。
[0188]
在此基础上,可选的,磁盘故障标签得到单元,具体用于:
[0189]
在切分时间序列数据中的各个样本属性数据分别对应的磁盘故障标签,均表征磁盘正常的情况下,将针对切分时间序列数据的磁盘故障标签标注为磁盘正常,否则标注为磁盘故障。
[0190]
另一可选的,上述模型生成装置,还包括:
[0191]
样本窗口数据得到模块,用于基于预设滑动窗口,处理样本时间序列数据,得到样本窗口数据;
[0192]
第一特征得到子模块,具体用于:
[0193]
将样本时间序列数据以及样本窗口数据,输入到长短期记忆网络中,得到第一特征;
[0194]
第二特征得到子模块,具体用于:
[0195]
将样本时间序列数据以及样本窗口数据,输入到特征提取器中,得到第二特征。
[0196]
可选的,样本属性数据可包括样本smart数据,样本smart数据包括至少两个smart特征,上述模型生成装置,还包括:
[0197]
重要性分析模块,用于在原始预测模型的训练过程中,根据原始预测模型的输出结果,分析出至少两个smart特征中的每个smart特征的重要性;
[0198]
样本smart数据更新模块,用于根据重要性,对至少两个smart特征进行筛选,并基于筛选后保留下来的smart特征,更新样本smart数据,以基于样本smart数据,针对原始预测模型进行训练。
[0199]
可选的,在上述任意装置的基础上,长短期记忆网络包括双向长短期记忆网络;和/或,
[0200]
特征提取器基于全卷积神经网络或是残差网络构建得到;和/或,
[0201]
原始预测模型还可包括长短期记忆模块,长短期记忆模块包括长短期记忆网络以及与长短期记忆网络连接的注意力模块,特征融合模块与特征提取器和长短期记忆模块分别连接。
[0202]
本发明实施例提供的模型生成装置,通过特征提取器、lstm网络和特征融合模块构建得到的原始预测模型,可充分利用时间序列数据提取特征,而且可基于lstm网络,并配合特征融合模块,对特征提取器的特征提取性能进行增强,因此基于这样的原始预测模型训练出的磁盘故障预测模型,可有效保证磁盘故障的预测准确度。
[0203]
本发明实施例所提供的模型生成装置可执行本发明任意实施例所提供的模型生成方法,具备执行方法相应的功能模块和有益效果。
[0204]
值得注意的是,上述模型生成装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0205]
图7为本发明实施例中提供的磁盘故障预测装置的结构框图,该装置用于执行上述任意实施例所提供的磁盘故障预测方法。该装置与上述各实施例的磁盘故障预测方法属于同一个发明构思,在磁盘故障预测装置的实施例中未详尽描述的细节内容,可参考上述磁盘故障预测方法的实施例。参见图7,该装置具体可包括:目标属性数据获取模块610、目标属性数据输入模块620和磁盘故障预测结果得到模块630。其中,
[0206]
目标属性数据获取模块610,用于获取按照本发明任意实施例所提供的模型生成方法生成的磁盘故障预测模型,以及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据;
[0207]
目标属性数据输入模块620,用于针对基于得到的至少两个目标属性数据构建出的目标时间序列数据,将目标时间序列数据输入到磁盘故障预测模型;
[0208]
磁盘故障预测结果得到模块630,用于根据磁盘故障预测模型的输出结果,得到目标磁盘在未来时间段内的磁盘故障预测结果,其中未来时间段位于目标时间段之后。
[0209]
本发明实施例所提供的磁盘故障预测装置,通过目标属性数据获取模块、目标属性数据输入模块和磁盘故障预测结果得到模块的相互配合,实现了准确预测目标磁盘在未来时间段内的磁盘故障情况的效果。
[0210]
本发明实施例所提供的磁盘故障预测装置可执行本发明任意实施例所提供的磁盘故障预测方法,具备执行方法相应的功能模块和有益效果。
[0211]
值得注意的是,上述磁盘故障预测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0212]
图8示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
[0213]
如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
[0214]
电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0215]
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如模型生成方法或是磁盘故障预测方法。
[0216]
在一些实施例中,模型生成方法或是磁盘故障预测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的模型生成方法或是磁盘故障预测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可通过其他任何适当的方式(例如,借助于固件)而被配置为执行模型生成方法或是磁盘故障预测方法。
[0217]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、以及至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、以及该至少一个输出装置。
[0218]
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合
来编写。这些计算机程序可以提供给通用计算机、专用计算机或是其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行并且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0219]
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0220]
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0221]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
[0222]
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
[0223]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
[0224]
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

技术特征:
1.一种模型生成方法,其特征在于,包括:获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,所述原始预测模型至少包括特征提取器,长短期记忆网络,以及,与所述特征提取器和所述长短期记忆网络分别连接的特征融合模块;得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到所述样本属性数据的磁盘故障标签,其中,所述磁盘故障标签用于表征所述样本磁盘在第二样本时间段内的故障情况,所述第二样本时间段位于所述样本属性数据对应的样本时间之后;针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于所述样本时间序列数据及得到的至少两个磁盘故障标签,对所述原始预测模型进行训练,得到磁盘故障预测模型。2.根据权利要求1所述的方法,其特征在于,还包括:从故障池中抽取出发生过磁盘故障的服务器的服务器标识,其中,部署在所述服务器上的磁盘为样本磁盘;所述得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,包括:根据所述服务器标识,从数据中心抽取出在第一样本时间段内的每个样本时间上,针对所述样本磁盘分别采集到的样本属性数据。3.根据权利要求2所述的方法,其特征在于,所述服务器上的样本磁盘的数量是至少一个,所述从数据中心抽取出在第一样本时间段内的每个样本时间上,针对所述样本磁盘分别采集到的样本属性数据,包括:从数据中心抽取出在第一样本时间段内的每个样本时间上,针对所述至少一个样本磁盘中的每个样本磁盘,分别采集到的样本属性数据;所述方法还包括:从所述故障池中抽取出故障磁盘的磁盘标识和故障时间,其中,所述故障磁盘为所述至少一个样本磁盘中发生过故障的样本磁盘;所述得到所述样本属性数据的磁盘故障标签,包括:根据所述至少一个样本磁盘中与所述样本属性数据对应的样本磁盘的磁盘标识以及所述故障磁盘的磁盘标识,得到标识对比结果;根据所述样本属性数据对应的样本时间、所述故障时间以及所述第二样本时间段的样本时间长度,得到时间对比结果;根据所述标识对比结果和所述时间对比结果,标注出所述样本属性数据的磁盘故障标签,以得到所述样本属性数据的磁盘故障标签。4.根据权利要求3所述的方法,其特征在于,所述根据所述标识对比结果和所述时间对比结果,标注出所述样本属性数据的磁盘故障标签,包括:在所述标识对比结果表征所述样本属性数据对应的样本磁盘的磁盘标识与所述故障磁盘的磁盘标识不同的情况下,将所述样本属性数据的磁盘故障标签标注为磁盘正常;否则,在所述时间对比结果表征所述故障时间晚于所述样本属性数据对应的样本时间,以及,所述故障时间与所述样本属性数据对应的样本时间之间的差值小于或等于所述
样本时间长度的情况下,将所述样本属性数据的磁盘故障标签标注为磁盘故障,否则标注为磁盘正常。5.根据权利要求1所述的方法,其特征在于,所述原始预测模型还包括与所述特征融合模块连接的分类器;所述基于所述样本时间序列数据及得到的至少两个磁盘故障标签,对所述原始预测模型进行训练,得到磁盘故障预测模型,包括:将所述样本时间序列数据输入到所述长短期记忆网络,得到第一特征;将所述样本时间序列数据输入到所述特征提取器,得到第二特征;将所述第一特征和所述第二特征输入到所述特征融合模块,得到融合特征;将所述融合特征输入到所述分类器,得到磁盘故障分类结果;根据所述磁盘故障分类结果及得到的至少两个磁盘故障标签,对所述原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。6.根据权利要求5所述的方法,其特征在于,所述原始预测模型还包括与所述长短期记忆网络连接的维度重组层;所述将所述样本时间序列数据输入到所述长短期记忆网络,得到第一特征,包括:将所述样本时间序列数据输入到所述维度重组层,以通过所述维度重组层,基于预设时间间隔,切分所述样本时间序列数据,得到至少两个切分时间序列数据;将所述至少两个切分时间序列数据分别输入到所述长短期记忆网络,得到与所述至少两个切分时间序列数据分别对应的第一特征;所述将所述第一特征和所述第二特征输入到所述特征融合模块,得到融合特征,包括:针对所述至少两个切分时间序列数据中的每个切分时间序列数据,将所述切分时间序列数据对应的第一特征与所述第二特征进行融合,得到融合特征;所述根据所述磁盘故障分类结果及得到的至少两个磁盘故障标签,对所述原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型,包括:根据所述切分时间序列数据中各个样本属性数据分别对应的磁盘故障标签,得到所述切分时间序列数据的磁盘故障标签;根据所述磁盘故障分类结果以及所述切分时间序列数据的磁盘故障标签,对所述原始预测模型中的参数进行调整,以训练得到磁盘故障预测模型。7.根据权利要求6所述的方法,其特征在于,根据所述切分时间序列数据中各个样本属性数据分别对应的磁盘故障标签,得到所述切分时间序列数据的磁盘故障标签,包括:在所述切分时间序列数据中各个样本属性数据分别对应的磁盘故障标签,均表征磁盘正常的情况下,将针对所述切分时间序列数据的磁盘故障标签标注为磁盘正常,否则标注为磁盘故障。8.根据权利要求5所述的方法,其特征在于,还包括:基于预设滑动窗口,处理所述样本时间序列数据,得到样本窗口数据;所述将所述样本时间序列数据输入到所述长短期记忆网络,得到第一特征,包括:将所述样本时间序列数据以及所述样本窗口数据,输入到所述长短期记忆网络,得到第一特征;所述将所述样本时间序列数据输入到所述特征提取器,得到第二特征包括:
将所述样本时间序列数据以及所述样本窗口数据,输入到所述特征提取器,得到第二特征。9.根据权利要求1所述的方法,其特征在于,所述样本属性数据包括样本smart数据,所述样本smart数据包括至少两个smart特征,所述方法还包括:在所述原始预测模型的训练过程中,根据所述原始预测模型的输出结果,分析出所述至少两个smart特征中的每个smart特征的重要性;根据所述重要性,对所述至少两个smart特征进行筛选,并基于筛选后保留下来的smart特征,更新所述样本smart数据,以基于所述样本smart数据,针对所述原始预测模型进行训练。10.根据权利要求1-9中任一所述的方法,其特征在于:所述长短期记忆网络包括双向长短期记忆网络;和/或,所述特征提取器基于全卷积神经网络或是残差网络构建得到;和/或,所述原始预测模型还包括长短期记忆模块,所述长短期记忆模块包括所述长短期记忆网络以及与所述长短期记忆网络连接的注意力模块,所述特征融合模块与所述特征提取器和所述长短期记忆模块分别连接。11.一种磁盘故障预测方法,其特征在于,包括:获取按照权利要求1-10中任一项的方法生成的磁盘故障预测模型,以及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据;针对基于已得到的至少两个目标属性数据构建出的目标时间序列数据,将所述目标时间序列数据输入到所述磁盘故障预测模型;根据所述磁盘故障预测模型的输出结果,得到所述目标磁盘在未来时间段内的磁盘故障预测结果,其中,所述未来时间段位于所述目标时间段之后。12.一种模型生成装置,其特征在于,包括:原始预测模型获取模块,用于获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,所述原始预测模型至少包括特征提取器,长短期记忆网络,及,与所述特征提取器和所述长短期记忆网络分别连接的特征融合模块;磁盘故障标签得到模块,用于得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,以及,得到所述样本属性数据的磁盘故障标签,所述磁盘故障标签用于表征所述样本磁盘在第二样本时间段内的故障情况,所述第二样本时间段位于所述样本属性数据对应的样本时间之后;磁盘故障预测模型得到模块,用于针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于所述样本时间序列数据以及得到的至少两个磁盘故障标签,对所述原始预测模型进行训练,得到磁盘故障预测模型。13.一种磁盘故障预测装置,其特征在于,包括:目标属性数据获取模块,用于获取按照权利要求1-10中任一项的方法生成的磁盘故障预测模型,及,得到在目标时间段内的每个目标时间上,针对目标磁盘分别采集到的目标属性数据;目标属性数据输入模块,用于针对基于已得到的至少两个目标属性数据构建出的目标时间序列数据,将所述目标时间序列数据输入到所述磁盘故障预测模型;
磁盘故障预测结果得到模块,用于根据所述磁盘故障预测模型的输出结果,得到所述目标磁盘在未来时间段内的磁盘故障预测结果,其中,所述未来时间段位于所述目标时间段之后。14.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-10中任一项所述的模型生成方法,或是如权利要求11中所述的磁盘故障预测方法。15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现如权利要求1-10中任一项所述的模型生成方法,或是如权利要求11中所述的磁盘故障预测方法。

技术总结
本发明实施例公开一种模型生成、磁盘故障预测方法、装置、设备及介质。该模型生成方法包括:获取预先构建得到的用于实现磁盘故障预测的原始预测模型,其中,原始预测模型至少包括特征提取器,长短期记忆网络,以及,与特征提取器和长短期记忆网络分别连接的特征融合模块;得到在第一样本时间段内的每个样本时间上,针对样本磁盘分别采集到的样本属性数据,及,得到样本属性数据的磁盘故障标签;针对基于得到的至少两个样本属性数据构建出的样本时间序列数据,基于样本时间序列数据及得到的至少两个磁盘故障标签,对原始预测模型进行训练,得到磁盘故障预测模型。本发明实施例的技术方案,可生成可保证磁盘故障的预测准确度的磁盘故障预测模型。故障预测模型。故障预测模型。


技术研发人员:李东江 张静 张宪波
受保护的技术使用者:京东科技信息技术有限公司
技术研发日:2023.06.30
技术公布日:2023/9/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐