一种短期地铁进站客流量预测方法

未命名 07-22 阅读:131 评论:0


1.本发明涉及智能交通技术中的客流量预测领域,尤其涉及一种短期地铁进站客流量预测方法。


背景技术:

2.交通流预测是智能交通领域中的重要一环。地铁作为公共交通的重要组成部分,越来越多的研究人员致力于地铁客流量的准确预测。地铁进站客流量的精确预测,不仅可以揭示未来时刻的交通需求,帮助地铁运营人员做出更为科学的决策,还可以有效预防人员拥堵带来的安全事故。此外,对地铁进站客流量的预测有助于新地铁站点的规划和建设,从而有效缓解一些大型站点的拥堵。
3.在交通流预测的早期阶段,大量研究者经常使用历史平均、k-最近邻模型、卡尔曼滤波、arima及其变体等统计模型。随着机器学习的兴起,大量学者尝试用机器学习模型来预测交通流量,并取得了比传统的统计模型更好的预测效果。如支持向量机(svm)、循环神经网络rnn,以及基于rnn的改进模型,lstm,gru等。
4.然而,单个机器学习模型的预测精度有限,上述基于rnn的模型只考虑了地铁客流的时间顺序性和周期性,而忽略了多个车站整体间的相关性,导致预测精度低。近几年主流的预测方法是结合两个及以上的深度学习模型进行分析预测,如通过结合图卷积网络(gcn)得到地铁客流的空间相关性,通过结合lstm得到地铁进站客流量的变化趋势。申请号为202211246533.9的中国发明专利,该专利公开了一种基于时空图卷积网络的地铁短时客流量预测方法,利用门控循环单元学习地铁历史数据以获取地铁网络的时间依赖性关系,得到一个隐含历史客流量变化特征的隐藏状态ht;利用图卷积神经网络获取地铁网络的动态空间依赖性关系,以对未来时刻客流量进行预测。本发明对城市地铁客流量进行时空预测时,除了考虑地铁网络的时间依赖性关系外,还考虑到了空间依赖性关系的动态变化特征,利用一阶近似cheb图卷积可得t+1时刻城市地铁网络中所有地铁站点的客流量。但该类方法预测结果的准确性仍有待提高。


技术实现要素:

5.本发明的目的是提供一种短期地铁进站客流量预测方法,能够较为准确地对短期地铁进站客流量进行预测。
6.本发明采用下述技术方案:
7.一种短期地铁进站客流量预测方法,包括以下步骤:
8.a:采集若干不同站点在指定时间范围内的进站客流量数据,得到初始进站数据集;
9.b:首先将初始进站数据集中的每一个初始数据x(t),分别在随机添加若干同等幅值的不同高斯白噪声后进行emd,得到每一个初始数据对应的若干个imf分量;然后将初始数据x(t)在对应位置处的所有imf分量的均值作为一次分解子序列ci(t),并计算得到每一
个初始数据x(t)的初始残差序列r1(t),最后将每一个初始数据x(t)的初始残差序列r1(t)与对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);
[0010][0011]
其中,n为一次分解子序列ci(t)的个数,i=1,2,...,n;
[0012]
c:将步骤b中获得的一次残差序列r2(t),通过ewt得到一次残差序列r2(t)的二次分解子序列em(t)和二次残差序列r3(t);然后将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列em(t)中,得到每一个一次残差序列r2(t)的三次分解子序列qi(t);
[0013][0014][0015]
其中,m表示em(t)的个数;
[0016]
d:将步骤b中获得的除第一个子序列c1(t)以外的初始数据集中初始数据x(t)的所有一次分解子序列ci(t),以及步骤c中获得的初始数据x(t)的一次残差序列r2(t)的三次分解子序列qi(t),作为lstm神经网络的数据集,并划分为训练集和测试集;利用训练集对所构建的lstm神经网络进行训练,将得到的预测结果求和后作为最终预测结果,并通过测试集进行测试;最终得到训练后的lstm神经网络;
[0017]
e:将待预测站点在待预测日期前q天的进站客流量数据作为初始数据,利用步骤a至步骤d中的方法进行处理,然后利用训练后的lstm神经网络进行客流量预测。
[0018]
所述的步骤a包括以下具体步骤:
[0019]
a1:采集得到每个站点在指定时间范围内的进站客流量数据,进站客流量数据中包含进站时间、站点id以及乘客id信息;
[0020]
a2:分别对每个站点的进站客流量数据,按照设定的时间间隔进行合并汇总,得到合并汇总后的每个站点的进站客流量数据;
[0021]
a3:利用得到的合并汇总后的每个站点的进站客流量数据,构建初始进站数据集。
[0022]
所述的步骤b包括以下具体步骤:
[0023]
b1:首先将初始进站数据集中的初始数据x(t)与第一个高斯白噪声ε1(t)结合,得到一个新的时间序列y1(t),y1(t)=x(t)+ε1(t);其中,t表示每个csv文件中按照时间间隔t合并汇总后的第t条地铁乘客进站数据;
[0024]
b2:通过emd对时间序列y1(t)进行分解,得到对应的若干个imf分量imf
11
、imf
12
、...、imf
1i

[0025]
b3:按照步骤b1和b2中的方法,将初始进站数据集中的每一个初始数据x(t),分别与不同高斯白噪声ε2(t)、ε3(t)、...、εj(t)结合,得到对应的新的时间序列y2(t)、y3(t)、...、yj(t),yj(t)=x(t)+εj(t);然后通过emd分别对时间序列y2(t)、y3(t)、...、yj(t)
进行分解,得到每一个时间序列yj(t)对应的若干个imf分量imf
j1
、imf
j2
、...、imf
ji
;其中,ε1(t)、ε2(t)、...、εj(t)幅值相同;
[0026]
b4:对得到的每一个时间序列yj(t)在对应位置处的所有imf分量进行均值计算,得到每一个初始数据x(t)的一次分解子序列ci(t);
[0027][0028]
b5:经过步骤b1至b4后,每一个初始数据x(t)均由一次分解子序列ci(t)和初始残差序列r1(t)组成,计算得到每一个初始数据x(t)的初始残差序列r1(t);
[0029][0030][0031]
其中,n为一次分解子序列ci(t)的个数;
[0032]
b6:将每一个初始数据x(t)的初始残差序列r1(t)与初始数据x(t)对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);
[0033]
r2(t)=r1(t)+c1(t)。
[0034]
所述的步骤c包括以下具体步骤:
[0035]
c1:通过fft将一次残差序列r2(t)变换为序列r(w),然后将序列r(w)的频谱分成n个连续段;其中,fft是指快速傅里叶变换;序列r(w)为一次残差序列r2(t)经过快速傅里叶变换后的表示;
[0036]
c2:定义ewt的带通滤波器中的经验尺度函数φs(ω)和经验小波函数ψs(ω);
[0037][0038][0039]
其中,ω表示频率,s∈[1,n],τs=γωs;
[0040]
z为随机数;
[0041]
c3:计算一次残差序列r2(t)与经验尺度函数φs(ω)的内积,以及一次残差序列r2(t)与经验小波函数ψs(ω)的内积,分别得到逼近系数wf(0,t)和细节系数wf(s,t);
[0042][0043][0044]
c4:计算二次分解子序列em(t);
[0045][0046][0047]
其中,表示卷积运算,m=1,2,3,...,m,e1(t)表示第一个二次分解子序列,em(t)表示第m个二次分解子序列;
[0048]
c5:对一次残差序列r2(t)进行二次分解,得到一次残差序列r2(t)基于二次分解子序列em(t)和二次残差序列r3(t)的表达式;
[0049][0050]
其中,m表示em(t)的个数;
[0051]
c6:将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列em(t)中,得到每一个一次残差序列r2(t)的三次分解子序列qi(t);
[0052][0053][0054]
所述的步骤d中,经过emd和ewt两次分解之后,初始数据x(t)由一次分解子序列ci(t)和三次分解子序列qm(t)组成,
[0055][0056]
所述的步骤d中,训练集和测试集均进行归一化处理;lstm神经网络输出的预测数据,在被输出前对应的进行反归一化处理。
[0057]
所述的步骤d中,所构建的lstm神经网络共有五层,第一层是第一lstm层,设置200个神经元;第二层是dropout层,参数设置为0.4;第三层是第二lstm层,设置240个神经元;
第四层是dropout层,参数设置为0.4;最后一层是dense层,设置为1。
[0058]
所述的步骤e中,q的取值为22。
[0059]
所述的步骤a2中,在进行合并汇总时,在每个站点的进站客流量数据中,均按照设定的时间间隔t,将每t分钟内的乘客进站数据进行合并汇总;若t分钟内无乘客进站,则将该时间段对应的乘客进站数据填补为一条进站乘客数为0的信息。
[0060]
所述的步骤a1中,将对应的法定节日假期的进站客流量数据进行删除。
[0061]
本发明针对地铁乘客进站数据的周期性和突变性两大特点,通过每次加入同等幅值的不同白噪声来改变信号的极值点特性,之后对多次emd得到的相应imf进行总体平均来抵消加入的白噪声,从而有效抑制模态混叠的产生;加入高斯白噪声后的初始数据经过emd之后,通过对所有总体平均后的模态分量求和得到的“分解-重构”数据与初始数据x(t)之间误差较小,能够确保后续进行的数据预测的准确性。
[0062]
本发明中将初始残差序列r1(t)与第一个一次分解子序列c1(t)求和,作为一次残差序列r2(t)送入到后续的ewt模块中,虽然一次残差序列r2(t)同时具有高频率、低振幅两大不利于神经网络学习的特性,但利用后续部分ewt模型所具有的自适应选择频带的特性,能够将复杂信号中频率不同的谐波进行有效分离,降低一次残差序列r2(t)的复杂性,以充分利用一次残差序列r2(t)的高频率、低振幅两个特性,提高模型整体的预测性能;
[0063]
考虑到二次残差序列r3(t)的突变性较强,不利于神经网络的学习且不可消除,影响后续预测的精度,本发明中将r3(t)均匀的分成m等份,分别加入到每一个二次分解子序列em(t)中,既没有简单舍弃二次残差序列r3(t),能够保证数据的完整性,又能够通过对二次残差序列r3(t)等分,降低后续神经网络预测的难度,进一步提高模型整体的预测精度。
附图说明
[0064]
图1为本发明的流程示意图。
具体实施方式
[0065]
以下结合附图和实施例对本发明作以详细的描述:
[0066]
如图1所示,本发明所述的短期地铁进站客流量预测方法,包括以下步骤:
[0067]
a:采集若干不同站点在指定时间范围内的进站客流量数据,得到初始进站数据集;
[0068]
本发明中,站点的进站客流量数据可通过站点现有刷卡设备进行采集,如闸机刷卡数据等,在此不再赘述。初始进站数据集中的进站客流量数据通常为csv格式,指定站点的进站客流量数据可利用基于python语言的pandas工具进行筛选;
[0069]
本发明中,所述的步骤a包括以下具体步骤:
[0070]
a1:采集得到每个站点在指定时间范围内的进站客流量数据,进站客流量数据中包含进站时间、站点id以及乘客id信息;
[0071]
每个站点的进站客流量数据均为csv格式,进站客流量数据中的每条数据均表示一位乘客在对应时间进入指定车站候车。
[0072]
本发明中,考虑到法定节日假期(如元旦等)的进站客流量数据较为特殊,进站数据不同于一般工作日以及周末,因此可将对应的法定节日假期的进站客流量数据进行删
除;
[0073]
a2:分别对每个站点的进站客流量数据,按照设定的时间间隔进行合并汇总,得到合并汇总后的每个站点的进站客流量数据;
[0074]
在进行合并汇总时,在每个站点的进站客流量数据中,均按照设定的时间间隔t,将每t分钟内的乘客进站数据进行合并汇总;若t分钟内无乘客进站,则将该时间段对应的乘客进站数据填补为一条进站乘客数为0的信息;
[0075]
a3:利用得到的合并汇总后的每个站点的进站客流量数据,构建初始进站数据集;
[0076]
以下结合具体实施例对步骤a进行解释说明:
[0077]
设已通过相应采集设备得到2019年1月1日至25日共计25天,杭州地铁每天81个不同站点的进出站原始数据集,上述原始数据集由25个csv文件组成,每个csv文件均表示每天81个不同站点的进出站数据汇总;指定的站点为钱江路站、近江站以及客运中心站三个换乘站;则按照下述方法构建初始进站数据集;
[0078]
a1:利用基于python语言的pandas工具,从原始数据集中筛选出每天钱江路站、近江站以及客运中心站三个换乘站的进站客流量数据,由于2019年1月1日为元旦,因此将2019年1月1日的数据剔除;然后对2019年1月2日至25日共计24天的进站客流量数据进行汇总,最终得到钱江路站、近江站以及客运中心站三个换乘站的进站客流量数据,保存为3个csv文件,每个csv文件均对应一个站点24天内的进站客流量数据;
[0079]
a2:设定时间间隔t为5分钟,分别对每个站点的进站客流量数据进行合并汇总,即在每个站点的进站客流量数据中,将每5分钟内的乘客进站数据进行合并汇总;若5分钟内无乘客进站,则将该时间段对应的乘客进站数据填补为一条进站乘客数为0的信息;
[0080]
本实施例中,合并汇总后的csv文件中每条数据均由三部分组成,分别是进站时间、站点id以及进站人数汇总。由于补录了五分钟内进站人数为0的数据,并剔除了2019年1月1日的数据,因此每个csv文件共计有24*24*12=6912条数据。
[0081]
a3:利用得到的合并汇总后的每个站点的进站客流量数据,构建初始进站数据集;
[0082]
本实施例中,初始进站数据集中的每条数据均为一维,即每个车站的进站客流数据,共计6912条。
[0083]
b:首先将初始进站数据集中的每一个初始数据x(t),分别在随机添加若干同等幅值的不同高斯白噪声后进行emd,得到每一个初始数据对应的若干个imf分量;然后将初始数据x(t)在对应位置处的所有imf分量的均值作为一次分解子序列ci(t),并计算得到每一个初始数据x(t)的初始残差序列r1(t),最后将每一个初始数据x(t)的初始残差序列r1(t)与对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);
[0084][0085]
r2(t)=r1(t)+c1(t);
[0086]
其中,n为一次分解子序列ci(t)的个数,i=1,2,...,n;
[0087]
所述的步骤b包括以下具体步骤:
[0088]
b1:首先将初始进站数据集中的初始数据x(t)与第一个高斯白噪声ε1(t)结合,得到一个新的时间序列y1(t),y1(t)=x(t)+ε1(t);
[0089]
其中,t表示每个csv文件中按照时间间隔t合并汇总后的第t条地铁乘客进站数据(0<t<=6912);
[0090]
本发明中,由于地铁乘客进站数据具有周期性和突变性两大特点,如果直接对其进行emd容易造成不同模态之间的中心频率相近,即模态混叠效应。此外,经实验分析发现,初始数据经过emd之后,通过对所有模态分量求和得到的“分解-重构”数据与初始数据x(t)之间误差较大,表明emd方法容易造成数据的缺失,对后续进行的数据预测造成致命影响。因此本发明中在初始数据中加入同等幅值的不同白噪声,高斯白噪声具有均匀分布的特点,经过多次平均计算后能够消除加入的噪声;同时,白噪声还改变了原始信号的极点分布,降低了emd时的模态混叠效应。此外,初始数据在加入高斯白噪声经过emd之后,通过对所有模态分量求和得到的“分解-重构”数据与初始数据x(t)之间误差较小,能够确保后续进行的数据预测的准确性。
[0091]
b2:通过emd(经验模态分解)对时间序列y1(t)进行分解,得到对应的若干个imf分量imf
11
、imf
12
、...、imf
1i

[0092]
b3:按照步骤b1和b2中的方法,将初始进站数据集中的每一个初始数据x(t),分别与不同高斯白噪声ε2(t)、ε3(t)、...、εj(t)结合,得到对应的新的时间序列y2(t)、y3(t)、...、yj(t),yj(t)=x(t)+εj(t);然后通过emd分别对时间序列y2(t)、y3(t)、...、yj(t)进行分解,得到每一个时间序列yj(t)对应的若干个imf分量imf
j1
、imf
j2
、...、imf
ji
;其中,ε1(t)、ε2(t)、...、εj(t)幅值相同;
[0093]
b4:对得到的每一个时间序列yj(t)在对应位置处的所有imf分量进行均值计算,得到每一个初始数据x(t)的一次分解子序列ci(t);
[0094][0095]
如初始数据x(t)的第一个一次分解子序列
[0096]
b5:经过步骤b1至b4后,每一个初始数据x(t)均由一次分解子序列ci(t)和初始残差序列r1(t)组成,计算得到每一个初始数据x(t)的初始残差序列r1(t);
[0097][0098][0099]
其中,n为一次分解子序列ci(t)的个数;
[0100]
b6:将每一个初始数据x(t)的初始残差序列r1(t)与初始数据x(t)对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);
[0101]
r2(t)=r1(t)+c1(t);
[0102]
由于初始数据x(t)的第一个一次分解子序列c1(t)以及初始残差序列r1(t)的突变
性较强,不利于神经网络的学习且不可消除,会影响后续预测的精度,因此本发明中将r1(t)与c1(t)求和作为一次残差序列r2(t)送入到后续的ewt模块中。虽然一次残差序列r2(t)同时具有高频率、低振幅两大不利于神经网络学习的特性,但是本发明后续部分采用的ewt模型却能通过自适应选择频带,将这两个特性充分运用,将其转化为优势,提高模型整体的预测性能;
[0103]
c:将步骤b中获得的一次残差序列r2(t),通过ewt(经验小波变换)得到一次残差序列r2(t)的二次分解子序列em(t)和二次残差序列r3(t);然后将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列em(t)中,得到每一个一次残差序列r2(t)的三次分解子序列qi(t);
[0104][0105][0106][0107]
其中,m表示em(t)的个数;
[0108]
ewt可以根据信号fourier谱的特点将复杂信号中频率不同的谐波进行有效分离,其“滤波”功能能够大大降低一次残差序列r2(t)的复杂性,将其分解成有利于神经网络模型学习的二次子序列。步骤c与步骤b的结合,不仅充分利用了初始残差序列r1(t),也可以将不利于神经网络学习的第一个一次子序列c1(t)以及初始残差序列r1(t)继续分解,降低其复杂性,提高模型整体的预测性能。
[0109]
本发明中,所述的步骤c包括以下具体步骤:
[0110]
c1:通过fft将一次残差序列r2(t)变换为序列r(w),然后将序列r(w)的频谱分成n个连续段;
[0111]
其中,fft是指快速傅里叶变换;序列r(w)为一次残差序列r2(t)经过快速傅里叶变换后的表示;
[0112]
c2:定义ewt的带通滤波器中的经验尺度函数φs(ω)和经验小波函数ψs(ω);
[0113][0114]
[0115]
其中,由于步骤c1中将r(w)的频谱分成n个连续段,因此在处理过程中r(w)的fourier谱的支撑区间被ωs分割成n个连续的段,ωs表示各段之间的边界,所以共有n+1个边界,ω是一个变量,表示频率,其中ω0=0,ωn=π,s∈[1,n],τs=γωs;
[0116][0117]
z为一个随机数,没有实际意义,用于将β定义成一个范围在0到1之间的参数;
[0118]
c3:计算一次残差序列r2(t)与经验尺度函数φs(ω)的内积,以及一次残差序列r2(t)与经验小波函数ψs(ω)的内积,分别得到逼近系数wf(0,t)和细节系数wf(s,t);
[0119][0120][0121]
c4:计算二次分解子序列em(t);
[0122][0123][0124]
其中,表示卷积运算,m=1,2,3,...,m,其中e1(t)表示第一个二次分解子序列,em(t)表示第m个二次分解子序列
[0125]
c5:对一次残差序列r2(t)进行二次分解,得到一次残差序列r2(t)基于二次分解子序列em(t)和二次残差序列r3(t)的表达式;
[0126][0127]
其中,em(t)表示二次分解子序列,一次残差序列r2(t)是所有二次分解子序列em(t)和二次残差序列r3(t)的总和,m表示em(t)的个数,r3(t)表示一次残差序列r2(t)经过ewt之后的二次残差序列,与r1(t)类似,同样是不可消除。
[0128]
c6:将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列em(t)中,得到每一个一次残差序列r2(t)的三次分解子序列qi(t);
[0129][0130][0131]
同样的,由于二次残差序列r3(t)的突变性较强,不利于神经网络的学习且不可消
除,会影响后续预测的精度,因此本发明中将r3(t)均匀的分成m等份,分别加入到每一个二次分解子序列em(t)中。本发明通过将二次残差序列r3(t)等分,将其复杂性均摊到每个二次分解子序列em(t)中,有两个突出优势,一是没有简单舍弃二次残差序列r3(t),保证了数据的完整性,二是通过对二次残差序列r3(t)等分,降低了后续神经网络预测的难度,也能进一步提高模型整体的预测精度;
[0132]
d:将步骤b中获得的除第一个子序列c1(t)以外的初始数据集中初始数据x(t)的所有一次分解子序列ci(t),以及步骤c中获得的初始数据x(t)的一次残差序列r2(t)的三次分解子序列qi(t),作为lstm神经网络的数据集,并划分为训练集和测试集;利用训练集对所构建的lstm神经网络进行训练,将得到的预测结果求和后作为最终预测结果,并通过测试集进行测试;最终得到训练后的lstm神经网络;
[0133]
本发明中,经过emd和ewt两次分解之后,初始数据x(t)由一次分解子序列ci(t)和三次分解子序列qm(t)组成,如下所示:
[0134][0135]
其中,由于一次分解子序列中的第一个子序列c1(t)作为一次残差序列r2(t)的一部分进行了ewt,因此从2开始计数,一次残差序列r2(t)经过ewt的分解后的个数为m,因此总计需要送入n-1+m个子序列至lstm神经网络。每个子序列都有自己的lstm神经网络,所以我们需要搭建n+m-1个神经网络与子序列想对应。值得注意的是,经过两次分解不会改变每个子序列的长度,所以其与初始数据相同,均为6912。
[0136]
本实施例中,为了提高lstm神经网络的预测精度,训练集和测试集均进行归一化处理;与之相对应的,lstm神经网络输出的预测数据,在被输出前对应的进行反归一化处理;
[0137]
本实施例中,所构建的lstm神经网络共有五层,第一层是第一lstm层,设置了200个神经元;第二层是dropout层,参数设置为0.4;第三层是第二lstm层,设置了240个神经元;第四层是dropout层,参数设置为0.4;最后一层是dense层,由于只需要输出一维数据,因此设置为1。
[0138]
本实施例中,利用for循环将每个子序列的第1个至第60个数据作为第一组输入,第61个数据作为第一组数据的标签;将第2个至第61个数据作为第二组输入,第62个数据作为第二组数据的标签;以此类推,直到第6852个至6911个数据作为输入,第6912个输入作为最后一组数据的标签,循环结束。
[0139]
本实施例中,将每个子序列经过lstm神经网络后最后两天的预测结果转化为csv文件,由于每个csv文件的长度一致,只需对所有的csv文件相同位置处的元素求和,最终得到该模型最终的预测结果。
[0140]
e:将待预测站点在待预测日期前q天的进站客流量数据作为初始数据,利用步骤a至步骤d中的方法进行处理,然后利用训练后的lstm神经网络进行客流量预测。
[0141]
本实施例中,q的取值可为22。

技术特征:
1.一种短期地铁进站客流量预测方法,其特征在于,包括以下步骤:a:采集若干不同站点在指定时间范围内的进站客流量数据,得到初始进站数据集;b:首先将初始进站数据集中的每一个初始数据x(t),分别在随机添加若干同等幅值的不同高斯白噪声后进行emd,得到每一个初始数据对应的若干个imf分量;然后将初始数据x(t)在对应位置处的所有imf分量的均值作为一次分解子序列c
i
(t),并计算得到每一个初始数据x(t)的初始残差序列r1(t),最后将每一个初始数据x(t)的初始残差序列r1(t)与对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);其中,n为一次分解子序列c
i
(t)的个数,i=1,2,...,n;c:将步骤b中获得的一次残差序列r2(t),通过ewt得到一次残差序列r2(t)的二次分解子序列e
m
(t)和二次残差序列r3(t);然后将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列e
m
(t)中,得到每一个一次残差序列r2(t)的三次分解子序列q
i
(t);(t);其中,m表示e
m
(t)的个数;d:将步骤b中获得的除第一个子序列c1(t)以外的初始数据集中初始数据x(t)的所有一次分解子序列c
i
(t),以及步骤c中获得的初始数据x(t)的一次残差序列r2(t)的三次分解子序列q
i
(t),作为lstm神经网络的数据集,并划分为训练集和测试集;利用训练集对所构建的lstm神经网络进行训练,将得到的预测结果求和后作为最终预测结果,并通过测试集进行测试;最终得到训练后的lstm神经网络;e:将待预测站点在待预测日期前q天的进站客流量数据作为初始数据,利用步骤a至步骤d中的方法进行处理,然后利用训练后的lstm神经网络进行客流量预测。2.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于,所述的步骤a包括以下具体步骤:a1:采集得到每个站点在指定时间范围内的进站客流量数据,进站客流量数据中包含进站时间、站点id以及乘客id信息;a2:分别对每个站点的进站客流量数据,按照设定的时间间隔进行合并汇总,得到合并汇总后的每个站点的进站客流量数据;a3:利用得到的合并汇总后的每个站点的进站客流量数据,构建初始进站数据集。3.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于,所述的步骤b包括以下具体步骤:b1:首先将初始进站数据集中的初始数据x(t)与第一个高斯白噪声ε1(t)结合,得到一个新的时间序列y1(t),y1(t)=x(t)+ε1(t);其中,t表示每个csv文件中按照时间间隔t合并
汇总后的第t条地铁乘客进站数据;b2:通过emd对时间序列y1(t)进行分解,得到对应的若干个imf分量imf
11
、imf
12
、...、imf
1i
;b3:按照步骤b1和b2中的方法,将初始进站数据集中的每一个初始数据x(t),分别与不同高斯白噪声ε2(t)、ε3(t)、...、ε
j
(t)结合,得到对应的新的时间序列y2(t)、y3(t)、...、y
j
(t),y
j
(t)=x(t)+ε
j
(t);然后通过emd分别对时间序列y2(t)、y3(t)、...、y
j
(t)进行分解,得到每一个时间序列y
j
(t)对应的若干个imf分量imf
j1
、imf
j2
、...、imf
ji
;其中,ε1(t)、ε2(t)、...、ε
j
(t)幅值相同;b4:对得到的每一个时间序列y
j
(t)在对应位置处的所有imf分量进行均值计算,得到每一个初始数据x(t)的一次分解子序列c
i
(t);b5:经过步骤b1至b4后,每一个初始数据x(t)均由一次分解子序列c
i
(t)和初始残差序列r1(t)组成,计算得到每一个初始数据x(t)的初始残差序列r1(t);(t);其中,n为一次分解子序列c
i
(t)的个数;b6:将每一个初始数据x(t)的初始残差序列r1(t)与初始数据x(t)对应的第一个一次分解子序列c1(t)进行求和,得到一次残差序列r2(t);r2(t)=r1(t)+c1(t)。4.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于,所述的步骤c包括以下具体步骤:c1:通过fft将一次残差序列r2(t)变换为序列r(w),然后将序列r(w)的频谱分成n个连续段;其中,fft是指快速傅里叶变换;序列r(w)为一次残差序列r2(t)经过快速傅里叶变换后的表示;c2:定义ewt的带通滤波器中的经验尺度函数φ
s
(ω)和经验小波函数ψ
s
(ω);
其中,ω表示频率,s∈[1,n],τ
s
=γω
s
;;z为随机数;c3:计算一次残差序列r2(t)与经验尺度函数φ
s
(ω)的内积,以及一次残差序列r2(t)与经验小波函数ψ
s
(ω)的内积,分别得到逼近系数w
f
(0,t)和细节系数w
f
(s,t);(s,t);c4:计算二次分解子序列e
m
(t);(t);其中,表示卷积运算,m=1,2,3,...,m,e1(t)表示第一个二次分解子序列,e
m
(t)表示第m个二次分解子序列;c5:对一次残差序列r2(t)进行二次分解,得到一次残差序列r2(t)基于二次分解子序列e
m
(t)和二次残差序列r3(t)的表达式;其中,m表示e
m
(t)的个数;c6:将二次残差序列r3(t)均匀的分成m等份,分别加入到对应的每一个二次分解子序列e
m
(t)中,得到每一个一次残差序列r2(t)的三次分解子序列q
i
(t);(t);5.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤d中,经过emd和ewt两次分解之后,初始数据x(t)由一次分解子序列c
i
(t)和三次分解子序列q
m
(t)组成,
6.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤d中,训练集和测试集均进行归一化处理;lstm神经网络输出的预测数据,在被输出前对应的进行反归一化处理。7.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤d中,所构建的lstm神经网络共有五层,第一层是第一lstm层,设置200个神经元;第二层是dropout层,参数设置为0.4;第三层是第二lstm层,设置240个神经元;第四层是dropout层,参数设置为0.4;最后一层是dense层,设置为1。8.根据权利要求1所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤e中,q的取值为22。9.根据权利要求2所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤a2中,在进行合并汇总时,在每个站点的进站客流量数据中,均按照设定的时间间隔t,将每t分钟内的乘客进站数据进行合并汇总;若t分钟内无乘客进站,则将该时间段对应的乘客进站数据填补为一条进站乘客数为0的信息。10.根据权利要求2所述的短期地铁进站客流量预测方法,其特征在于:所述的步骤a1中,将对应的法定节日假期的进站客流量数据进行删除。

技术总结
本发明公开了一种短期地铁进站客流量预测方法,包括以下步骤:A:采集若干不同站点在指定时间范围内的进站客流量数据,得到初始进站数据集;B:获取初始进站数据集中的每一个初始数据的一次残差序列;C:获取初始进站数据集中的每一个初始数据的一次残差序列的三次分解子序列;D:将获得的除第一个子序列以外的初始数据集中初始数据的所有一次分解子序列,以及初始数据的三次分解子序列,作为LSTM神经网络的数据集,训练得到训练后的LSTM神经网络;E:将待预测站点在待预测日期前Q天的进站客流量数据作为初始数据,利用训练后的LSTM神经网络进行客流量预测。本发明能够较为准确地对短期地铁进站客流量进行预测。期地铁进站客流量进行预测。期地铁进站客流量进行预测。


技术研发人员:吕灵灵 胡德来 常瑞 王亚辉 白磊 周玉 张红涛 安思伟 杨德龙 卓瑞钦
受保护的技术使用者:华北水利水电大学
技术研发日:2023.04.11
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐