基于自动深度学习框架的盾构掘进姿态预测方法
未命名
10-09
阅读:183
评论:0
1.本发明涉及盾构施工领域,具体涉及基于自动深度学习框架的盾构掘进姿态预测方法。
背景技术:
2.随着轨道交通的快速发展,盾构施工技术因其对土体扰动小、效率高、安全等优点,日益成为城市地下隧道的主要施工方法。在盾构掘进过程中,盾构姿态的预测和控制是确保隧道施工质量的关键技术之一。盾构掘进姿态偏差会造成其运动路径偏离所设计的隧道轴线,进而影响隧道成环质量,造成管片裂纹、渗漏等安全隐患。因此,有必要在掘进过程中对盾构姿态偏差进行提前预估。
3.目前常用的盾构姿态纠偏方法是基于操作人员的主观判断,该方法存在两个明显缺点,难以满足工程安全性和可靠性要求。一是滞后现象,只有姿态偏差发生后才能进行纠偏操作;二是准确性,控制决策是根据人员知识和经验生成的,决策因人而异,缺乏科学依据。
4.伴随着传感网络技术及人工智能技术的快速发展,数据挖掘驱动的盾构智能控制正获得越来越多的关注。但现有方法在数据处理、特征工程、算法选择、超参数调优方面仍然需要大量的时间和人力,尚缺乏模型训练和测试的自动化端到端学习流程。另外,现有技术已经证明了深度学习算法在盾构机姿态预测的准确率上具有较大优势,相较于随机森林、支持向量机等传统机器学习模型,深度学习更能适应盾构机运行过程中采集到的各类时序数据的非线性拟合从而达到更精准的预测结果。但是构建深度学习模型需要具备数据科学知识的专业技术人员,这限制了深度学习算法在盾构掘进姿态预测方面的推广应用,导致使用深度学习技术进行盾构姿态预测的成本居高不下且工作效率较低。
技术实现要素:
5.本发明提供基于自动深度学习框架的盾构掘进姿态预测方法,以解决现有技术中深度学习技术在盾构掘进姿态预测中所面临的执行难度高、成本高、效率低等问题,实现降低对开发人员专业技能的苛刻要求,以及降低深度学习进入盾构智能控制领域的门槛,使得深度学习技术能够低成本、高效、高精度地用于盾构姿态预测任务中。
6.本发明通过下述技术方案实现:
7.基于自动深度学习框架的盾构掘进姿态预测方法,包括:
8.收集盾构掘进原始数据集,对所述原始数据集做预处理;
9.对预处理后的数据集做特征提取,将特征提取后的数据集划分为第一训练集、第一验证集和第一测试集;
10.搭建自动深度学习框架,使所述深度学习框架包含至少两种数据规范化方法、至少两种深度学习算法、以及粒子群优化算法;并基于特征提取结果确定输入变量、输出变量;
11.将第一训练集的输入变量、输出变量代入至所述深度学习框架中进行神经网络训练,训练过程中使用粒子群优化算法优化模型超参数;
12.输出经第一验证集验证后的深度学习模型,得到不同数据规范化方法、深度学习算法和模型超参数组合下的若干深度学习模型,使用第一测试集对所述若干深度学习模型进行评估,得到表现最优的深度学习模型;
13.以所述表现最优的深度学习模型进行盾构掘进姿态预测。
14.针对现有技术中深度学习技术在盾构掘进姿态预测方向上的使用受限、成本较高等问题,本发明首先提出一种基于自动深度学习框架的盾构掘进姿态预测方法,本方法首先收集盾构掘进过程中盾构机的原始数据集(tbm原始数据),对原始数据集做预处理和特征提取,将得到的数据集备用。然后搭建深度学习框架,使搭建的深度学习框架包含至少两种数据规范化方法、至少两种深度学习算法。然后将第一训练集导入该框架中进行深度学习训练,由于框架中的数据规范化方法和深度学习算法均不止一种,因此该框架会以排列组合的方式得到多个深度学习模型,并使用粒子群优化算法优化模型超参数,进而得到不同数据规范化方法、不同深度学习算法、不同模型超参数组合下的若干深度学习模型,再将第一测试集代入得到的不同模型中进行评估,得到表现最优的深度学习模型,以表现最优的深度学习模型进行盾构掘进姿态预测。
15.其中,发明人在研究过程中发现,对于盾构掘进姿态预测的深度学习过程具有非常大的超参数搜索空间且需要算法能够在短时间内寻找全局最优解,若使用传统的网格搜索调参方法会由于“维度诅咒”而导致计算量过大、且对设备硬件要求极高;若使用传统的随机搜索调参方法,其在每次迭代后的评估都独立于之前的评估,因此浪费了大量时间搜索空间中表现不佳的区域,同样不适用于盾构掘进姿态预测的深度学习过程;而贝叶斯优化和遗传算法等现有算法,在用于盾构掘进姿态预测时往往只能找到局部最优解、且并行优化能力较差,依然不适用于盾构掘进姿态预测的自动深度学习。因此本技术创造性的在盾构掘进姿态预测领域引入粒子群优化算法来优化模型超参数,其收敛速度明显加快、优化结果误差较小,并且还具有容易实现并行优化的优点,因此特别适用于盾构掘进姿态预测的深度学习过程。
16.可以看出,本技术相较于现有技术而言:通过搭建高性能的自动深度学习框架,来自动获取不同数据规范化方法、深度学习算法和模型超参数组合下的若干深度学习模型,显著降低对算法工程师的专业技能要求,有利于降低深度学习技术推广应用于盾构姿态预测,并节约算法执行过程中的人力成本和时间成本;本技术通过粒子群优化算法自动确定适用于不同模型的最优超参数,克服了手动调参需要大量专业知识和经验积累、且成本高效率低等缺点,使得建模过程中无需人工调参、自动化程度极高,并且还具有收敛速度明显加快、优化结果误差较小、容易实现并行优化等优势。此外,本技术通过自动深度学习框架所得到的预测方式,不仅可以得到传统的单点预测结果,还能够得到以区间形式表达的区间预测结果,进而可以量化数据及深度学习模型的不确定性,有利于提高预测结果执行度。
17.本技术中的自动深度学习框架,可在任意现有编程环境下进行搭建,其具体内容基于编程代码实现、且可针对不同编程语言进行适应性调整,故在此不做限定。
18.进一步的,对所述原始数据集做预处理的方法包括:
19.剔除原始数据集中的数据缺失值;
20.对异常值和噪声数据做无效处理。
21.所述剔除原始数据集中的数据缺失值的方法包括:通过如下公式计算第一决策值f,若f=0,则剔除:
22.f=f(x1)f(x2)f(x3)
…
f(xn),
23.式中:x1,x2,x3,
…
,xn为某数据中的n个盾构掘进参数特征;f(xi)为用于检查盾构掘进参数特征xi是否是0值或缺失值的检查函数;i=1,2,3,
…
n;
24.所述对异常值和噪声数据做无效处理的方法包括:通过如下公式计算第二决策值fk,若fk=0,则判定为无效:
25.fk=f(x
k1
)f(x
k2
)f(x
k3
)
…
f(x
kn
);
[0026][0027][0028]
式中:为所有第i个盾构掘进参数特征的平均值;s为所有第i个盾构掘进参数特征的标准差;x
ki
为盾构掘进参数特征xi的标准分;f(x
ki
)为用于判定盾构掘进参数特征xi是否无效的判定函数;m为设定的上限值。
[0029]
由于目前盾构掘进机的数据采集系统均已十分完善,因此原始数据集中可能包含了大量对后续计算过程不利缺失值。因此本方案数据预处理的第一步即是剔除缺失值,若第一决策值f=0,则整条剔除该数据。之后,本方案还对异常值和噪声数据进行甄别和无效,通过第二决策值fk以实现对异常值和噪声数据的甄别,并将甄别出的异常值和噪声数据做无效处理。
[0030]
通过本方案的预处理步骤,能够有效克服tbm原始数据过于庞大且繁杂而导致的深度学习建模及调参困难的问题,能够显著降低后续迭代建模过程中的宕机风险。并且,本方案在对异常值和噪声数据做无效处理的过程中,以x
ki
是否超过预设的上限值m来作为判定函数,而m的具体取值大小可根据实际工况、tbm原始数据的收集情况等进行人为设定,因此在满足本技术高度自动化程度的前提下,还能够使得数据预处理过程具有良好的灵活性和自主性,有利于提高在不同盾构参数、不同盾构机掘进作业下的通用性。
[0031]
进一步的,对预处理后的数据集做特征提取的方法包括:
[0032]
选择表征盾构掘进状态的基础特征;
[0033]
随机删除部分基础特征后代入至深度学习模型进行训练,迭代若干次后,筛除对模型精度提升程度小于设定阈值的基础特征。
[0034]
由于目前盾构掘进机的数据采集系统均已十分完善,因此原始数据集中可能包含了大量对于预测盾构姿态帮助不大甚至无用的特征信息,这些多余的特征不仅会降低后续建模的效率,还会影响预测的精度。因此本技术通过特征提取来排除掉对模型精度提升程度小于设定阈值的基础特征,进而改善后续各模型的完成效率、提高预测精度。
[0035]
本方案中,表征盾构掘进状态的基础特征可从大量的反馈数据中人为挑选指定,也可基于文献资料找出对于预测贡献较大的特征。其中,对模型精度提升程度的设定阈值
可根据实际工况、tbm原始数据的收集情况等进行人为设定,因此在满足本技术高自动化程度的前提下,还能够使得特征工程过程具有良好的灵活性和自主性,有利于提高特征提取作业在不同盾构参数、不同盾构机掘进作业下的通用性。
[0036]
进一步的,所述深度学习框架中:数据规范化方法包括归一化、标准化和最大绝对值标准化;深度学习算法包括mlp、rnn、bi-rnn、lstm和gru。
[0037]
本技术在特征选取完成后,由深度学习框架自动选择合适当前模型和数据集的数据规范化方法,使得数据的变化范围和分布形式更适合盾构掘进姿态预测下的深度学习模型训练;再由深度学习框架自动选择合适当前模型和数据集的深度学习算法。本方案所预设的三种数据规范化方法和五种深度学习算法,均是考虑了tbm原始数据庞大繁杂且时序变化的特性而选择的优选方法;并且本方案所限定的五种深度学习算法共享相同的超参数空间,在采用粒子群优化算法对其超参数空间进行最优超参数搜索后,可以充分保证每种算法的预测结果均都基于同一调参水平。所以,本方案还能够有效克服了不同深度学习模型的超参数调参水平不一致的问题,通过本方案得到的五种特定的深度学习算法的结果对比具有极强的说服力。
[0038]
进一步的,使用粒子群优化算法优化的模型超参数包括:网络隐藏层数、各层神经元的数量、激活函数、优化器、训练批次、批次大小和迭代次数。
[0039]
在经过预处理和特征提取后,数据集已经明确确定,此时对各深度学习模型的影响因素主要在于其超参数的选择和设置。本方案对具体的模型超参数进行了明确限定,保证每种算法的预测结果均都基于同一调参水平。
[0040]
进一步的,对若干深度学习模型进行评估的方法包括两方面:得到模型的区间预测和单点预测结果,评估预测区间质量和单点预测效果
[0041]
进一步的,预测区间可以量化深度学习模型预测的不确定性,预测区间质量通过区间覆盖率和/或归一化区间宽度进行评估:
[0042][0043][0044][0045]
式中:picp为区间覆盖率;n为数据集参与预测的样本数量;当真实值落入上下界区间内时,ci=1,否则ci=0;nmpiw为归一化区间宽度;mpiw为区间宽度;r
date
为输出值的极差;u(xi)为模型输出的区间上界;l(xi)为模型输出的区间下界;
[0046]
单点预测效果通过以下任意一种或多种参数进行评估:mae、mse、mape;其中:
[0047][0048][0049][0050]
式中:mae为预测值和真实值之间的平均绝对离差;rmse为预测值和真实值之间的均方根误差,mape为预测值和真实值之间的百分比误差;n为数据集参与预测的样本数量;fi
(x)为预测值,yi为真实值。
[0051]
其中本领域技术人员应当理解,区间覆盖率越大、模型预测区间的质量越好;归一化区间宽度越小、模型预测区间的质量越好;mae、mse、mape越小、模型单点预测的效果越好。
[0052]
在一种或多种实施方式中,通过如下方法得到表现最优的深度学习模型:
[0053]
计算第三决策值fm,fm=rmse+mae+nmpiw+1/picp;式中,rmse为预测值和真实值之间的均方根误差;mae为预测值和真实值之间的平均绝对离差;nmpiw为归一化区间宽度;picp为区间覆盖率;
[0054]
以fm最小的模型作为表现最优的深度学习模型。
[0055]
本方案给出了一种优选的对最优的深度学习模型的决策方法,能够与本技术所搭建的自动深度学习框架相配合使用,得到更为科学且准确的决策依据,填补了现有技术的空白。
[0056]
进一步的,在搭建深度学习框架之前,还通过预实验确定后续深度学习的时间窗大小;所述预实验包括:
[0057]
基于原始数据集确定受时间窗影响的输入特征、输出特征;
[0058]
将预处理后的数据集划分为第二训练集、第二验证集和第二测试集;
[0059]
取时间窗n=0,1,2
…
,k,将所述第二训练集的输入特征、输出特征代入深度学习模型进行训练,并用第二验证集验证训练结果,用第二测试集得到不同时间窗下的测试结果;其中k为大于或等于3的正整数;
[0060]
选择测试结果最好的时间窗,作为后续深度学习的时间窗。
[0061]
发明人团队在研究过程中发现,引入时间窗进行时空结合的预测能很大程度地增强对时序数据的学习能力,挖掘盾构掘进过程特征的时变规律,提升盾构掘进姿态的时序预测效果,尤其是上一时刻的特征对于当前时刻的偏差预测贡献极高。因此,本方案在进行正式的深度学习训练之前,通过预实验的方式确定时间窗,在后续的自动深度学习框架训练中就不再考虑时间窗参数,而是统一采用预实验结果的时间窗进行模型训练即可,可显著提高模型训练效率和精度。
[0062]
本发明与现有技术相比,具有如下的优点和有益效果:
[0063]
1、本发明基于自动深度学习框架的盾构掘进姿态预测方法,通过搭建高性能的自动深度学习框架,来自动获取不同数据规范化方法、深度学习算法和模型超参数组合下的若干深度学习模型,显著降低对算法工程师的专业技能要求,有利于降低深度学习技术推广应用于盾构姿态预测,并节约算法执行过程中的人力成本和时间成本。
[0064]
2、本发明基于自动深度学习框架的盾构掘进姿态预测方法,通过粒子群优化算法自动确定适用于不同模型的最优超参数,克服了手动调参需要大量专业知识和经验积累、且成本高效率低等缺点,使得建模过程中无需人工调参、自动化程度极高,并且还具有收敛速度明显加快、优化结果误差较小、容易实现并行优化等优势。本技术通过自动深度学习框架所得到的预测方式,不仅可以得到传统的单点预测结果,还能够得到以区间形式表达的区间预测结果,进而可以量化数据及深度学习模型的不确定性,有利于提高预测结果执行度。
[0065]
3、本发明基于自动深度学习框架的盾构掘进姿态预测方法,能够有效克服tbm原
始数据过于庞大且繁杂而导致的深度学习建模及调参困难的问题,能够显著降低后续迭代建模过程中的宕机风险;还可通过特征提取来排除掉对模型精度提升程度小于设定阈值的基础特征,进而改善后续各模型的完成效率、提高预测精度。
[0066]
4、本发明基于自动深度学习框架的盾构掘进姿态预测方法,在满足高自动化程度的前提下,还能够使得数据预处理和特征提取过程具有良好的灵活性和自主性,有利于提高在不同盾构参数、不同盾构机掘进作业下的通用性。
[0067]
5、本发明基于自动深度学习框架的盾构掘进姿态预测方法,能够有效克服不同深度学习模型的超参数调参水平不一致的问题,使得最终得到的深度学习模型具有极强的说服力。
[0068]
6、本发明基于自动深度学习框架的盾构掘进姿态预测方法,能够将时序预测结果以预测区间形式表达,通过量化数据及模型的不稳定性,提升预测值可靠性。基于不同形式的预测结果,提出了对基于深度学习框架所得到的若干深度学习模型的定量评估方法,可得到更为科学且准确的决策依据。
[0069]
7、本发明基于自动深度学习框架的盾构掘进姿态预测方法,所使用的五种备选深度学习算法,能够共享相同的超参数空间,可很好地处理盾构掘进过程所采集的时间序列数据,即是在自动深度学习过程中,不仅可学习当前时刻的信息,还会依赖之前的序列信息,有利于提高预测精度。
[0070]
8、本发明基于自动深度学习框架的盾构掘进姿态预测方法,在进行正式的深度学习训练之前,通过预实验确定时间窗,在后续的自动深度学习框架的训练中就不再考虑时间窗参数,而是统一采用预实验结果的时间窗进行模型训练即可,可显著提高模型训练效率和精度。
附图说明
[0071]
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本技术的一部分,并不构成对本发明实施例的限定。在附图中:
[0072]
图1为本发明具体实施例的流程示意图;
[0073]
图2为本发明具体实施例中不同时间窗的预测结果对比图。
具体实施方式
[0074]
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
[0075]
实施例1:
[0076]
如图1所示的基于自动深度学习的盾构掘进姿态预测方法,包括以下步骤:
[0077]
步骤1:
[0078]
收集盾构掘进原始数据集,对所述原始数据集做预处理;预处理的方法包括:
[0079]
剔除原始数据集中包含的数据缺失值;
[0080]
对异常值和噪声数据做无效处理。
[0081]
其中,剔除原始数据集中的数据缺失值的方法包括:通过如下公式计算第一决策
值f,若f=0,则剔除:
[0082]
f=f(x1)f(x2)f(x3)
…
f(xn),
[0083]
式中:x1,x2,x3,
…
,xn为某数据中的n个盾构掘进参数特征;f(xi)为用于检查盾构掘进参数特征xi是否是0值或缺失值的检查函数;i=1,2,3,
…
n;
[0084]
其中,对异常值和噪声数据做无效处理的方法包括:通过如下公式计算第二决策值fk,若fk=0,则判定为无效:
[0085]fk
=f(x
k1
)f(x
k2
)f(x
k3
)
…
f(x
kn
);
[0086][0087][0088]
式中:为所有第i个盾构掘进参数特征的平均值;s为所有第i个盾构掘进参数特征的标准差;x
ki
为盾构掘进参数特征xi的标准分;f(x
ki
)为用于判定盾构掘进参数特征xi是否无效的判定函数;m为设定的上限值。
[0089]
步骤2:
[0090]
对预处理后的数据集做特征提取,将特征提取后的数据集划分为第一训练集、第一验证集和第一测试集;特征提取的方法包括:
[0091]
选择表征盾构掘进状态的基础特征;
[0092]
随机删除部分基础特征后代入至深度学习模型进行训练,迭代若干次后,筛除对模型精度提升程度小于设定阈值的基础特征。
[0093]
步骤3:
[0094]
搭建自动深度学习框架,使所述深度学习框架包含至少两种数据规范化方法、至少两种深度学习算法、以及粒子群优化算法;并基于特征提取结果确定输入变量、输出变量;
[0095]
深度学习框架中:数据规范化方法包括归一化、标准化和最大绝对值标准化;深度学习算法包括mlp、rnn、bi-rnn、lstm和gru。
[0096]
其中,归一化公式为:标准化公式为:最大绝对值标准化公式为:式中,z为数据规范化输出;x为输入特征;x
min
和x
max
分别为输入特征的最小值和最大值;μ和σ分别为输入特征的均值和标准差;|x|
max
为输入特征x中的最大绝对值。
[0097]
步骤4:
[0098]
将第一训练集的输入变量、输出变量代入至所述深度学习框架中进行神经网络训练,训练过程中使用粒子群优化算法优化模型超参数;
[0099]
其中,使用粒子群优化算法优化的模型超参数为:网络隐藏层数、各层神经元的数量、激活函数、优化器、训练批次、批次大小和迭代次数。
[0100]
步骤5:
[0101]
输出经第一验证集验证后的深度学习模型,得到不同数据规范化方法、深度学习
算法和模型超参数组合下的若干深度学习模型,使用第一测试集对所述若干深度学习模型进行评估,得到表现最优的深度学习模型;
[0102]
其中,对若干深度学习模型进行评估的方法包括:评估模型预测区间的质量、评估模型单点预测的效果。
[0103]
其中,模型预测区间的质量通过区间覆盖率和/或归一化区间宽度进行评估:
[0104][0105][0106][0107]
式中:picp为区间覆盖率;n为数据集参与预测的样本数量;当真实值落入上下界区间内时,ci=1,否则ci=0;nmpiw为归一化区间宽度;mpiw为区间宽度;r
date
为输出值的极差;u(xi)为模型输出的区间上界;l(xi)为模型输出的区间下界;
[0108]
其中,模型单点预测的效果通过以下任意一种或多种参数进行评估:mae、mse、mape;其中:
[0109][0110][0111][0112]
式中:mae为预测值和真实值之间的平均绝对离差;rmse为预测值和真实值之间的均方根误差,mape为预测值和真实值之间的百分比误差;n为数据集参与预测的样本数量;fi(x)为预测值,yi为真实值。
[0113]
在更为优选的实施方式中,所述深度学习框架采用基于粒子群优化算法的autodl框架搭建而成。
[0114]
实施例2:
[0115]
一种基于自动深度学习的盾构掘进姿态预测方法,在实施例1的基础上,本实施例通过如下方法得到表现最优的深度学习模型:
[0116]
计算第三决策值fm,fm=rmse+mae+nmpiw+1/picp;式中,rmse为预测值和真实值之间的均方根误差;mae为预测值和真实值之间的平均绝对离差;nmpiw为归一化区间宽度;picp为区间覆盖率;
[0117]
以fm最小的模型作为表现最优的深度学习模型。
[0118]
实施例3:
[0119]
一种基于自动深度学习的盾构掘进姿态预测方法,在实施例1或2的基础上,在搭建深度学习框架之前,还通过预实验确定后续深度学习的时间窗;所述预实验包括:
[0120]
基于原始数据集确定受时间窗影响的输入特征、输出特征;
[0121]
将预处理后的数据集划分为第二训练集、第二验证集和第二测试集;
[0122]
取时间窗n=0,1,2
…
,k,将所述第二训练集的输入特征、输出特征代入深度学习模型进行训练,并用第二验证集验证训练结果,用第二测试集得到不同时间窗下的测试结
果;其中k为大于或等于3的正整数;
[0123]
选择测试结果最好的时间窗,作为后续深度学习的时间窗。
[0124]
实施例4:
[0125]
本实施例以上海市某天然气主干管网的某段隧道的盾构施工为例,验证本技术的工程可行性。该段隧道总长8236.862m,采用泥水平衡盾构法施工,由一台盾构机一次性掘进完成,在tbm掘进过程中,数据采集系统实时监测运行参数和地质参数,并以20mm的净行程间隔显示数据,在每个环上获得约1000组原始数据,总共约300万组数据作为原始数据集,被用于本实施例。
[0126]
通过本技术中的预处理方法,首先删除0值和缺失值,然后再用第二决策值将标准分大于上限值3的异常值和噪声数据剔除。
[0127]
之后做特征提取,最终保留的特征参数为如下的输入变量和输出变量:
[0128]
输入变量:总推进力、掘进速率、刀盘压力、排泥水压、刀盘回转速度、千斤顶推力、推进油缸行程;
[0129]
输出变量:前端水平偏差hdh、铰接水平偏差hdj、后端水平偏差hdt、前端竖直偏差vdh、铰接竖直偏差vdj、后端竖直偏差vdt。
[0130]
接下来将预处理后的数据集划分成3组:前70%作为训练集,中间10%作为验证集,最后的20%作为测试集,进行预实验。
[0131]
本实施例统一将x1至x7(即分别为总推进力、掘进速率、刀盘压力、排泥水压、刀盘回转速度、千斤顶推力)的上一时刻t-1和当前时刻t的值同时作为当前时刻偏差的特征,同时还对偏差的历史数据也作为特征,探究时间窗对预测结果的影响。选取时间窗变量n=0,1,2
…
,7用于训练和预测。例如,当时间窗n=2时,将t-1和t时刻的x1至x7以及t-2到t-1的y(即所有输出变量)作为输入特征来预测t时刻的y;当时间窗n=7时,仍然将t-1和t时刻的x1至x7作为输入特征,并将t-7到t-1时刻的y作为输入特征来预测t时刻的y。
[0132]
6个输出变量的偏差和4组时间窗的预测结果对比如图2所示,图2中对应数值如表1所示:
[0133]
表1
[0134][0135]
从图2与表1中可以看出,时间窗的引入对于盾构掘进姿态的精准预测具有重要意义,但随着加窗数量的增多,加窗对于预测效果提升的影响变得微乎其微。尤其是当时间窗
n》2时,预测结果的各项指标基本上趋于不变。由于时间窗的增多会增加模型训练的时间,降低预测效率,因此,本实施例采用时间窗n=2作为测试结果最好的时间窗进行后续实验。
[0136]
基于本实施例中的数据集,在预测过程中使用粒子群优化算法得到的各模型的部分最优超参数如表2所示:
[0137]
表2
[0138][0139][0140]
本实施例最终所得到的结果显示,lstm模型是综合表现最优的算法,且其中的数据规范化方法和模型超参数均自动完成计算。
[0141]
为了更进一步的验证本技术的可行性,本实施例还对采用本技术的盾构掘进姿态单点预测结果,和深度学习框架中的五种深度学习算法单独预测的结果,以第三决策值fm为判断依据进行了对比,对比结果如表3所示。
[0142]
表3
[0143]fm
mlprnnbrnnlstmgru本技术hdh14.4702714.3404814.3905514.167257.563017.56301hdj14.4531214.7722214.9311113.4717413.6819513.47174hdt12.3476413.8344614.747512.2153712.5914112.21537vdh10.51969.8432689.71287510.5640710.408519.712875vdj7.8440137.0483569.7819666.9641747.2808836.964174vdt7.377317.5569236.7713697.563018.1304036.771369average11.1686611.2326211.7225610.824279.9426939.449758
[0144]
从表3中可以看出,本技术的预测方法对6个偏差的预测误差均是最小,反应了本技术在训练深度学习框架时能够挑选最适合该数据集的数据规范化方法、神经网络模型并选择最优超参数。并且本实施例的实验还证明了,不论是水平偏差还是垂直偏差,本技术中的方法均得到了最优的结果。因此可以看出,本技术是一种非常有效的方法,可以显著提升
深度学习算法在盾构掘进姿态预测领域的性能,同时也能提供一种便捷的深度学习方法,让开发人员不需要精通深度学习也能轻易地实现精确的单点预测和区间预测。
[0145]
实施例5:
[0146]
一种基于自动深度学习的盾构掘进姿态预测系统,用于执行上述任一实施例中所记载的预测方法,该系统包括:
[0147]
数据收集模块,用于收集盾构掘进原始数据集,并对所述原始数据集做预处理;
[0148]
特征提取模块,用于对预处理后的数据集做特征提取,将特征提取后的数据集划分为第一训练集、第一验证集和第一测试集;
[0149]
基于autodl的深度学习框架,包括数据规范化子模块、深度学习算法子模块、基于粒子群优化算法的超参数优化子模块;所述数据规范化子模块包含至少两种数据规范化方法;所述深度学习算法子模块包括至少两种深度学习算法;
[0150]
评估模块,用于对深度学习框架所运算得到的所有深度学习模型进行评估,得到表现最优的深度学习模型;
[0151]
输出模块,输出表现最优的深度学习模型,用于进行盾构掘进姿态预测。
[0152]
本实施例通过自动深度学习使数据预处理、特征工程、深度学习模型选择和超参数优化的自动化进行成为可能,极大地降低开发人力成本。
[0153]
在更为优选的实施方式中,还包括预实验模块,所述预实验模块用于通过预实验来确定后续深度学习的时间窗。
[0154]
实施例6:
[0155]
在上述任一实施例的基础上,自动深度学习框架的搭建方法包括:在python编程环境下搭建数据规范化子模块、深度学习算法子模块、超参数优化子模块。
[0156]
实施例7:
[0157]
一种盾构掘进姿态预测装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例1-4中任一盾构掘进姿态预测方法的步骤。
[0158]
实施例8:
[0159]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如实施例1-4中任一盾构掘进姿态预测方法的步骤。
[0160]
其中,所述处理器可以是中央处理器(cpu,central processing unit),还可以是其他通用处理器、数字信号处理器(digital signal processor)、专用集成电路(application specific integrated circuit)、现成可编程门阵列(field programmable gate array)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器也可以是任何常规的处理器。
[0161]
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的数据,以实现本发明中盾构掘进姿态预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等。此外,存储器可以包括高速随机存取存储器、还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡,安全数字卡,闪存卡、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0162]
盾构掘进姿态预测装置如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序存储于一个计算机可读存介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码、对象代码形式、可执行文件或某些中间形式等。所述计算机可读取介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器、随机存储器、点载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减。
[0163]
此外,本领域技术人员可以理解,本说明书的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本说明书的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本说明书的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
[0164]
本说明书各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如java、scala、smalltalk、eiffel、jade、emerald、c++、c#、vb.net、python等,常规程序化编程语言如c语言、visual basic、fortran 2003、perl、cobol2002、php、abap,动态编程语言如python、ruby和groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网或广域网,或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务。
[0165]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0166]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其它变体,意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
技术特征:
1.基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,包括:收集盾构掘进原始数据集,对所述原始数据集做预处理;对预处理后的数据集做特征提取,将特征提取后的数据集划分为第一训练集、第一验证集和第一测试集;搭建自动深度学习框架,使所述深度学习框架包含至少两种数据规范化方法、至少两种深度学习算法、以及粒子群优化算法;并基于特征提取结果确定输入变量、输出变量;将第一训练集的输入变量、输出变量代入至所述自动深度学习框架中进行神经网络训练,训练过程中使用粒子群优化算法优化模型超参数;输出经第一验证集验证后的深度学习模型,得到不同数据规范化方法、深度学习算法和模型超参数组合下的若干深度学习模型,使用第一测试集对所述若干深度学习模型进行评估,得到表现最优的深度学习模型;以所述表现最优的深度学习模型进行盾构掘进姿态预测。2.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,对所述原始数据集做预处理的方法包括:剔除原始数据集中的数据缺失值;对异常值和噪声数据做无效处理。3.根据权利要求2所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,所述剔除原始数据集中的数据缺失值的方法包括:通过如下公式计算第一决策值f,若f=0,则剔除:f=f(x1)f(x2)f(x3)
…
f(x
n
),式中:x1,x2,x3,
…
,x
n
为某数据中的n个盾构掘进参数特征;f(x
i
)为用于检查盾构掘进参数特征x
i
是否是0值或缺失值的检查函数;i=1,2,3,
…
n;所述对异常值和噪声数据做无效处理的方法包括:通过如下公式计算第二决策值f
k
,若f
k
=0,则判定为无效:f
k
=f(x
k1
)f(x
k2
)f(x
k3
)
…
f(x
kn
););式中:为所有第i个盾构掘进参数特征的平均值;s为所有第i个盾构掘进参数特征的标准差;x
ki
为盾构掘进参数特征x
i
的标准分;f(x
ki
)为用于判定盾构掘进参数特征x
i
是否无效的判定函数;m为设定的上限值。4.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,对预处理后的数据集做特征提取的方法包括:选择表征盾构掘进状态的基础特征;随机删除部分基础特征后代入至深度学习模型进行训练,迭代若干次后,筛除对模型
精度提升程度小于设定阈值的基础特征。5.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,所述自动深度学习框架中:数据规范化方法包括归一化、标准化和最大绝对值标准化;深度学习算法包括mlp、rnn、bi-rnn、lstm和gru。6.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,使用粒子群优化算法优化的模型超参数包括:网络隐藏层数、各层神经元的数量、激活函数、优化器、训练批次、批次大小和迭代次数。7.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,对若干深度学习模型进行评估的方法包括:得到模型的区间预测和单点预测结果,评估预测区间质量和单点预测效果。8.根据权利要求7所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,所述预测区间质量通过区间覆盖率和/或归一化区间宽度进行评估:于,所述预测区间质量通过区间覆盖率和/或归一化区间宽度进行评估:于,所述预测区间质量通过区间覆盖率和/或归一化区间宽度进行评估:式中:picp为区间覆盖率;n为数据集参与预测的样本数量;当真实值落入上下界区间内时,c
i
=1,否则c
i
=0;nmpiw为归一化区间宽度;mpiw为区间宽度;r
date
为输出值的极差;u(xi)为模型输出的区间上界;l(xi)为模型输出的区间下界;所述单点预测效果通过以下任意一种或多种参数进行评估:mae、mse、mape;其中:所述单点预测效果通过以下任意一种或多种参数进行评估:mae、mse、mape;其中:所述单点预测效果通过以下任意一种或多种参数进行评估:mae、mse、mape;其中:式中:mae为预测值和真实值之间的平均绝对离差;rmse为预测值和真实值之间的均方根误差,mape为预测值和真实值之间的百分比误差;n为数据集参与预测的样本数量;f
i
(x)为预测值,y
i
为真实值。9.根据权利要求7所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,通过如下方法到表现最优的深度学习模型:计算第三决策值f
m
,f
m
=rmse+mae+nmpiw+1/picp;式中,rmse为预测值和真实值之间的均方根误差;mae为预测值和真实值之间的平均绝对离差;nmpiw为归一化区间宽度;picp为区间覆盖率;以f
m
最小的模型作为表现最优的深度学习模型。10.根据权利要求1所述的基于自动深度学习框架的盾构掘进姿态预测方法,其特征在于,在搭建自动深度学习框架之前,还通过预实验确定后续深度学习的时间窗大小;所述预实验包括:基于原始数据集确定受时间窗影响的输入特征、输出特征;
将预处理后的数据集划分为第二训练集、第二验证集和第二测试集;取时间窗n=0,1,2
…
,k,将所述第二训练集的输入特征、输出特征代入深度学习模型进行训练,并用第二验证集验证训练结果,用第二测试集得到不同时间窗下的测试结果;其中k为大于或等于3的正整数;选择测试结果最好的时间窗,作为后续深度学习的时间窗。
技术总结
本发明公开了基于自动深度学习框架的盾构掘进姿态预测方法,收集原始数据集,预处理、特征提取,搭建自动深度学习框架;进行神经网络训练,使用粒子群优化算法优化模型超参数;输出验证后的深度学习模型,得到不同数据规范化方法、深度学习算法和模型超参数组合下的若干深度学习模型,对若干深度学习模型进行评估,得到表现最优的深度学习模型,进行盾构掘进姿态预测。本发明用以解决现有技术中深度学习技术在盾构掘进姿态预测中所面临的执行难度高、成本高、效率低等问题,实现降低对开发人员专业技能的苛刻要求,以及降低深度学习进入盾构智能控制领域的门槛,使得深度学习技术能够低成本、高效、高精度地用于盾构姿态预测任务中。务中。务中。
技术研发人员:潘越 秦剑君 孙林 翁晨刚 罗鑫
受保护的技术使用者:上海交通大学
技术研发日:2023.07.04
技术公布日:2023/10/6
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
