一种用于铁路货运量的预测方法、系统、设备及介质与流程
未命名
10-09
阅读:159
评论:0
1.本发明涉及铁路货运技术领域,具体涉及一种用于铁路货运量的预测方法、系统、设备及介质。
背景技术:
2.铁路货运需求是全社会货运需求的重要组成部分,准确预测铁路货运需求可为经营决策提供可靠的依据。随着铁路货运信息化进程的不断推进,铁路货运作业流与信息流逐渐同步,海量的货运数据具有巨大的应用价值。
3.传统的铁路货运量预测方法主要分为定性预测和定量预测两类,定性预测主要依靠铁路各级相关工作人员根据自身经验及专业知识判断,从而预测铁路货运量,该方法虽然相对灵活,但过于主观,可靠性较低;定量预测通过收集历史铁路数据及关联数据,根据收集的数据建立不同模型,从而对铁路货运未来发展趋势进行预测。现有的用于铁路货运量的预测模型包括时间序列预测、回归预测、灰色预测、人工神经网络预测、分形理论、粗糙集理论及相应改进模型,这些模型主要将所有与铁路货运量相关的影响因素作为变量输入至构建的模型之中,没有考虑影响因素对铁路货运量的影响情况(即各个影响因素是直接影响到铁路货运量,还是间接影响到铁路货运量)及各影响因素之间的关系,导致对铁路货运量的预测准确度低。
技术实现要素:
4.本发明所要解决的技术问题为:现有的铁路货运量预测方法未考虑与铁路货运量相关的影响因素对铁路货运量的影响情况及各影响因素之间的关系,导致对铁路货运量的预测准确度低,使铁路货运企业经营决策具有局限性和滞后性。为解决该技术问题,本发明提供了一种用于铁路货运量的预测方法、系统、设备及介质。
5.本发明解决上述技术问题的技术方案如下:
6.一种用于铁路货运量的预测方法,包括:
7.步骤s1,获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;
8.步骤s2,将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值;
9.其中,所述目标铁路货运量预测模型是通过以下步骤得到的:
10.获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原始历史数据;
11.根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数
据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述直接影响因素为一级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;
12.根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;
13.根据所述二级影响因素对应的第一预测结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;
14.根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量;
15.所述目标铁路货运量预测模型包括所述二级影响因素预测模型、所述直接影响因素预测模型和所述铁路货运量预测模型。
16.本发明的有益效果是:根据铁路货运量的目标影响因素(即对铁路货运量具有直接影响的因素和对铁路货运量具有间接影响的因素)获取用于预测铁路货运量的目标数据,将所述目标数据输入预先构建好的目标铁路货运量预测模型中,从而得到所述目标数据对应的铁路货运量预测值,提高了对铁路货运量的预测准确度,解决了现有的铁路货运量预测方法未考虑与铁路货运量相关的影响因素对铁路货运量的影响情况及各影响因素之间的关系,导致对铁路货运量的预测准确度低的问题。
17.在上述技术方案的基础上,本发明还可以做如下改进。
18.进一步,所述根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,包括:
19.步骤a1,对所述第一历史铁路货运量数据进行数据清洗处理,得到第二历史铁路货运量数据;对所述第一历史铁路货运相关数据进行数据清洗处理,得到处理后的铁路货运相关数据,所述处理后的铁路货运相关数据为与铁路货运量相关的多个因素各自对应的目标历史数据;
20.步骤a2,根据数据类别,对所述第二历史铁路货运量数据和所述处理后的铁路货运相关数据进行分组处理,得到预处理数据,所述预处理数据包括所述第二历史铁路货运量数据和待确定因素相关数据,所述待确定因素相关数据为多个待确定因素各自对应的目标历史数据,所述待确定因素为对铁路货运量具有直接影响的因素或间接影响的因素;
21.步骤a3,根据所述预处理数据,确定所述目标影响因素,多个所述待确定因素包括所述目标影响因素,所述目标影响因素对应的目标历史数据为多个所述待确定因素中的多个所述待确定因素各自对应的目标历史数据。
22.采用上述进一步方案的有益效果是:通过对获取的原始数据进行数据清洗处理,可删除重复信息、纠正存在的错误,并使得数据保持完整性、一致性和有效性;通过对经过数据清洗处理后的数据进行分组处理,便于确定影响铁路货运量的目标影响因素。
23.进一步,所述步骤a3中,所述根据所述预处理数据,确定所述目标影响因素,包括:
24.步骤a3.1,对于每个所述待确定因素,根据所述待确定因素对应的目标历史数据
和所述第二历史铁路货运量数据,确定所述待确定因素的灰色关联度,所述灰色关联度表征所述待确定因素与铁路货运量之间的关联程度;
25.步骤a3.2,对于每个所述待确定因素,若所述待确定因素的灰色关联度大于预设的关联度阈值,则执行步骤a3.3;
26.步骤a3.3,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的相关系数,所述相关系数表征所述待确定因素与铁路货运量之间的线性相关程度;
27.步骤a3.4,根据所述待确定因素的相关系数和预设的相关程度阈值,确定所述待确定因素是否为目标影响因素。
28.采用上述进一步方案的有益效果是:通过计算各个所述待确定因素的灰色关联度,可精简所述预处理数据中包含的待确定因素相关数据;通过计算所述待确定因素的相关系数,从而筛选出目标影响因素,为后续建立用于预测铁路货运量的目标铁路货运量预测模型以及提高铁路货运量的预测准确度奠定了基础。
29.进一步,所述铁路货运量预测模型包括第一传导预测模型和第二传导预测模型,所述第一传导预测模型用于根据行业发展预测铁路货运量,所述第二传导预测模型用于根据经济发展预测铁路货运量;
30.所述方法还包括:
31.根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,所述组合预测模型用于确定所述第一传导预测模型对应的第一权重和所述第二传导预测模型对应的第二权重。
32.采用上述进一步方案的有益效果是:通过为所述第一传导预测模型和所述第二传导预测模型赋予对应的权重,根据赋予了权重后的第一传导预测模型和赋予了权重后的第二传导预测模型预测铁路货运量,可进一步提高对铁路货运量的预测准确度。
33.进一步,所述根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,包括:
34.对于所述第一传导预测模型,根据所述第二历史铁路货运量数据,对多个待预测时刻对应的铁路货运量进行预测,得到所述第一传导预测模型对应的多个第一铁路货运量预估值,其中,所述第二历史铁路货运量数据包含多个历史时刻对应的铁路货运量实际值,每个所述待预测时刻表示所述第二历史铁路货运量数据包含的一个铁路货运量实际值对应的历史时刻,每个所述待预测时刻对应一个所述第一铁路货运量预估值;
35.对于所述第二传导预测模型,根据所述第二历史铁路货运量数据,对多个所述待预测时刻对应的铁路货运量进行预测,得到所述第二传导预测模型对应的多个第二铁路货运量预估值,每个所述待预测时刻对应一个所述第二铁路货运量预估值;
36.对于每个所述待预测时刻,根据所述待预测时刻对应的第一铁路货运量预估值,确定所述待预测时刻时所述第一传导预测模型对应的第一预测相对误差;
37.对于每个所述待预测时刻,根据所述待预测时刻对应的第二铁路货运量预估值,确定所述待预测时刻时所述第二传导预测模型对应的第二预测相对误差;
38.根据所述第二历史铁路货运量数据、多个所述第一铁路货运量预估值、多个所述第二铁路货运量预估值、多个所述第一预测相对误差和多个所述第二预测相对误差,构建
组合预测模型。
39.采用上述进一步方案的有益效果是:通过为所述第一传导预测模型和所述第二传导预测模型赋予对应的权重,根据赋予了权重后的第一传导预测模型和赋予了权重后的第二传导预测模型预测铁路货运量,可进一步提高对铁路货运量的预测准确度。
40.进一步,所述步骤s2包括:
41.根据所述目标数据中的三级影响因素对应的目标历史数据和所述目标数据中的二级影响因素对应的目标历史数据,通过所述二级影响因素预测模型得到所述目标数据中的二级影响因素对应的第一预测结果;
42.根据所述目标数据中的二级影响因素对应的第一预测结果和所述目标数据中的直接影响因素对应的目标历史数据,通过所述直接影响因素预测模型得到所述目标数据中的直接影响因素对应的第二预测结果;
43.根据所述目标数据中的直接影响因素对应的第二预测结果、所述第一传导预测模型、所述第二传导预测模型、所述第一权重和所述第二权重,确定所述目标数据对应的铁路货运量预测值。
44.采用上述进一步方案的有益效果是:通过将所述目标数据输入预先构建好的目标铁路货运量预测模型中进行铁路货运量预测,提高了对铁路货运量的预测准确度。
45.为解决上述技术问题,本发明还提供了一种用于铁路货运量的预测系统,包括:
46.数据获取模块,用于获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;
47.铁路货运量预测模型构建模块,用于根据所述目标影响因素对应的目标历史数据,构建目标铁路货运量预测模型,所述目标铁路货运量预测模型包括二级影响因素预测模型、直接影响因素预测模型和铁路货运量预测模型;
48.铁路货运量预测模块,用于将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值;
49.其中,所述铁路货运量预测模型构建模块包括:
50.原始数据获取子模块,用于获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原始历史数据;
51.目标影响因素及数据确定子模块,用于根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;
52.二级影响因素预测模型构建子模块,用于根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;
53.直接影响因素预测模型构建子模块,用于根据所述二级影响因素对应的第一预测
结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;
54.铁路货运量预测模型构建子模块,用于根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量。
55.为解决上述技术问题,本发明还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如前所述的用于铁路货运量的预测方法。
56.为解决上述技术问题,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述的用于铁路货运量的预测方法。
附图说明
57.图1为本发明中用于铁路货运量的预测方法的流程示意图;
58.图2为本发明中目标影响因素包含的各因素之间的关系示意图;
59.图3为本发明中人工神经网络模型的结构示意图;
60.图4为本发明中用于铁路货运量的预测系统的结构示意图。
具体实施方式
61.以下对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
62.实施例一
63.如图1所示,本实施例提供了一种用于铁路货运量的预测方法,包括:
64.步骤s1,获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;
65.步骤s2,将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值。
66.目前,铁路货运量是由28个品类货运量加总而得,其中,煤炭、冶炼物资(包括焦炭、金属矿石、钢铁及有色金属和非金属矿石)和集装箱是铁路运输的主要品类,其运量占我国铁路货运量的85%以上,为此,本方法根据二八原则,以煤炭、冶炼物资和集装箱品类为主,同时考虑其他品类,从行业发展—品类运量—铁路货运量的思路,分析行业发展—各品类—铁路货运量影响的传导效应,并从经济发展—运输竞争方式运量—铁路货运量的思路,分析经济社会发展对各运输竞争方式以及各运输竞争方式对铁路货运量的影响,从而确定目标影响因素。
67.其中,所述目标铁路货运量预测模型是通过以下步骤得到的:
68.获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原
始历史数据;本实施例中,所述第一历史铁路货运量数据包括铁路货运总量和主要品类货运量,所述第一历史铁路货运相关数据包括宏观经济数据、市场供给数据和竞争环境数据,所述宏观经济数据包括gdp、产业增加值、工业增加值、社会消费品零售总额、固定资产投资、房地产开发投资和进出口总额,所述市场供给数据包括铁路上下游行业产品产量、铁路货运企业产销量和铁路市场份额,竞争环境数据包括各种运输方式货物运输量;
69.根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述直接影响因素为一级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;
70.根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;
71.根据所述二级影响因素对应的第一预测结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;
72.根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量;所述铁路货运量预测模型包括第一传导预测模型和第二传导预测模型,所述第一传导预测模型用于根据行业发展预测铁路货运量,所述第二传导预测模型用于根据经济发展预测铁路货运量;
73.所述目标铁路货运量预测模型包括所述二级影响因素预测模型、所述直接影响因素预测模型和所述铁路货运量预测模型。
74.其中,所述根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,包括:
75.步骤a1,对所述第一历史铁路货运量数据进行数据清洗处理,得到第二历史铁路货运量数据;对所述第一历史铁路货运相关数据进行数据清洗处理,得到处理后的铁路货运相关数据,所述处理后的铁路货运相关数据为与铁路货运量相关的多个因素各自对应的目标历史数据;本实施例中,对所述第一历史铁路货运量数据和所述第一历史铁路货运相关数据进行数据清洗处理包括判断数据是否存在缺失值,若存在缺失值,则对连续型变量采用时间序列方法计算估计值进行填充,对离散型变量采用热卡方法计算估计值进行填充,并根据数据特性对数据的形式及量纲进行统一;
76.步骤a2,根据数据类别,对所述第二历史铁路货运量数据和所述处理后的铁路货运相关数据进行分组处理,得到预处理数据,所述预处理数据包括所述第二历史铁路货运量数据和待确定因素相关数据,所述待确定因素相关数据为多个待确定因素各自对应的目标历史数据,所述待确定因素为对铁路货运量具有直接影响的因素或间接影响的因素;本实施例利用分箱法,将总量、品类、通道多维度应用场景下的所述第二历史铁路货运量数据和所述处理后的铁路货运相关数据进行分类及汇总;
77.步骤a3,根据所述预处理数据,确定所述目标影响因素,多个所述待确定因素包括所述目标影响因素,所述目标影响因素对应的目标历史数据为多个所述待确定因素中的多
个所述待确定因素各自对应的目标历史数据。
78.其中,所述步骤a3中,所述根据所述预处理数据,确定所述目标影响因素,包括:
79.步骤a3.1,对于每个所述待确定因素,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的灰色关联度,所述灰色关联度表征所述待确定因素与铁路货运量之间的关联程度;
80.步骤a3.2,对于每个所述待确定因素,若所述待确定因素的灰色关联度大于预设的关联度阈值,则执行步骤a3.3;其中,对于关联度阈值的取值,本领域通常认为对应的关联度r大于0.9的因子(即与铁路货运量相关的因素)与铁路货运量非常密切,对应的关联度r满足0.7《r≤0.9的因子与铁路货运量有较好的关联性,可以作为关键因子,对应的关联度r满足0.6≤r≤0.7的因子与铁路货运量的关联性一般,可以根据实际研究需要有选择地将其确定为关键因子,对应的关联度r小于0.6的因子为较弱关联因子,不作为关键因子,为保证所选取的因素全面且能较好地反映对铁路货运量的影响情况,本实施例中,所述关联度阈值的取值为0.7;
81.步骤a3.3,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的相关系数,所述相关系数表征所述待确定因素与铁路货运量之间的线性相关程度;
82.步骤a3.4,根据所述待确定因素的相关系数和预设的相关程度阈值,确定所述待确定因素是否为目标影响因素。其中,对于相关程度阈值的取值,本领域通常认为对应的相关系数c大于0.8的因子与铁路货运量有极强相关性,对应的相关系数在c满足0.6《c≤0.8的因子与铁路货运量有强相关性,对应的相关系数c满足0.4《c≤0.6的因子与铁路货运量有中等程度的相关性,对应的相关系数c满足0.2《c≤0.4的因子与铁路货运量有弱相关性;对应的相关系数c满足0≤c≤0.2的因子与铁路货运量有较弱相关性。为保证所选取的因素全面且能较好地反映对铁路货运量的影响情况,本实施例中,所述相关程度阈值的取值为0.6,将对应的相关系数大于0.6的所述待确定因素确定为目标影响因素。
83.本方法通过分析铁路货运量与各因素之间关系的强弱,可以得出各因素对铁路货运量的重要程度。本实施例中,为计算各个所述待确定因素的灰色关联度,首先从所述预处理数据中抽取参考序列(即多个所述第二历史铁路货运量数据)和比较序列集,所述比较序列集中包含的每个比较序列对应一个所述待确定因素在多个时刻对应的目标历史数据的集合,根据所述参考序列和所述比较序列集,通过第一公式组建第一数据序列,所述第一公式为:
[0084][0085]
其中,(x0,x1,x2,
…
,xm)表示所述第一数据序列,t表示所述参考序列/每个所述比较序列包含的数据量,m表示所述待确定因素的总数量,x0表示所述参考序列,x0(l)表示所述参考序列中时刻l对应的数据,其中,1≤l≤t;(x1,x2,
…
,xm)表示所述比较序列集,xh表示所述比较序列集中的第h个比较序列,xh(l)表示所述比较序列xh中时刻l对应的数据,其中,1≤h≤m;
[0086]
然后,对于每个所述比较序列,通过第二公式计算在时刻l时所述比较序列中包含
的每个数据与所述参考序列中包含的每个数据之间的关联系数,所述第二公式为:
[0087][0088]
其中,ζh(l)表示所述参考序列x0中时刻l对应的x0(l)和所述比较序列xh中时刻l对应的xh(l)之间的相对差值(即x0(l)和xh(l)之间的关联系数),ρ为分辨系数,表示对关联系数ζh(l)的影响程度,通常ρ取0.5;
[0089]
最后,对于每个所述待确定因素,通过第三公式计算所述待确定因素的灰色关联度,所述第三公式为:
[0090][0091]
其中,r
oh
表示第h个比较序列对应的待确定因素的灰色关联度。
[0092]
本实施例采用pearson相关系数分析法确定所述待确定因素的相关系数,具体方法如下:
[0093]
将对应的灰色关联度大于所述关联度阈值的待确定因素作为目标待确定因素,根据所述比较序列集,通过第四公式组建第二数据序列,所述第四公式为:
[0094][0095]
其中,(x1,x2,
…
,x
m'
)表示所述第二数据序列,m'表示所述目标待确定因素的总数,x
h'
表示所述比较序列集中的第h'个比较序列,x
h'
(l)表示所述比较序列x
h'
中时刻l对应的数据,其中,1≤h'≤m',每个所述比较序列x
h'
对应一个所述目标待确定因素在多个时刻对应的目标历史数据的集合;
[0096]
对于每个所述目标待确定因素,通过第五公式计算所述目标待确定因素的相关系数,所述第五公式为:
[0097][0098]
其中,r表示比较序列x
h'
对应的目标待确定因素和比较序列xj对应的目标待确定因素之间的相关系数,cov(x
h'
,xj)为所述比较序列x
h'
与所述比较序列xj之间的协方差,varx
h'
为所述比较序列x
h'
中各数据之间的方差,varxj为所述比较序列xj中各数据之间的方差,其中,h'≠j,且1≤j≤n';本实施例中,若所述比较序列x
h'
对应的目标待确定因素和所述比较序列xj对应的目标待确定因素之间的相关系数大于0.6,则所述比较序列x
h'
对应的目标待确定因素和所述比较序列xj对应的目标待确定因素均为目标影响因素。
[0099]
本实施例中,基于所述预处理数据,根据数据变化规律,先利用灰色关联方法精简所述待确定因素相关数据(对应上述步骤a3.1和a3.2),然后利用pearson相关系数分析法确定所述目标影响因素及其对应的目标历史数据(对应上述步骤a3.3和a3.4),再利用主成分分析方法结合人工判断确定各个所述目标影响因素的类别,所述目标影响因素分为三级
影响因素、二级影响因素和直接影响因素。
[0100]
如图2所示,本实施例中,所述二级影响因素共有三种形式,一种是有两个及以上关键影响因素(即所述二级影响因素对应的目标历史数据受到两个及以上所述三级影响因素对应的目标历史数据的影响),另一种是有一个关键影响因素,还有一种是无关键影响因素。其中,具有两个及以上关键影响因素的所述二级影响因素共有6个,分别为火力发电量x
11
、社会消费品零售总额x
31
、进出口总额x
32
、港口集装箱吞吐量x
33
、快递量x
54
和港口货物吞吐量x
61
;具有一个关键影响因素的所述二级影响因素共有6个,分别为煤炭进口量x
13
、铁矿石进口量x
22
、钢铁产量x
23
、粮食产量x
41
、化肥产量x
42
和第二产业增加值x
63
;无关键影响因素的所述二级影响因素共有4个,分别为煤炭产量x
12
、铁矿石产量x
21
、公路总里程x
52
和载货汽车产量x
53
。
[0101]
其中,所述二级影响因素预测模型是通过以下步骤得到的:
[0102]
根据所述预处理数据,获取所述三级影响因素对应的目标历史数据(后文简称三级影响数据)和所述二级影响因素对应的目标历史数据(后文简称二级影响数据);
[0103]
对于每个所述二级影响因素,根据所述二级影响因素对应的目标历史数据和所述三级影响数据,根据第六公式组建所述二级影响因素对应的第一历史数据集,所述第六公式为:
[0104][0105]
其中,(x
im
,x
ime
)表示第im个所述第二影响因素对应的第一历史数据集,x
im
表示第im个所述第二影响因素在时刻1至时刻t各自对应的目标历史数据的集合,x
im
(l)为第im个所述第二影响因素在时刻l时对应的目标历史数据,x
ime
(e为变量,1≤e≤u)表示第e个所述第三影响因素在时刻1至时刻t各自对应的目标历史数据的集合,x
ime
(l)为第e个所述第三影响因素在时刻l时对应的目标历史数据,u表示所述三级影响因素的总个数;
[0106]
将具有两个及以上关键影响因素的所述二级影响因素作为a类二级影响因素,对于每个所述a类二级影响因素,根据所述a类二级影响因素对应的第一历史数据集,构建针对于所述a类二级影响因素的第一预测模型,所述第一预测模型为:
[0107][0108]
其中,表示第a个所述a类二级影响因素对应的第一预测结果,e表示所述三级影响因素的总个数,β0为常数项,ε为误差项;β
ime
为其他影响因素不变的情况下,第e个所述三级影响因素对应的目标历史数据变化1个单位时可引起x
ia
的变化量;
[0109]
为保证所述第一预测模型的损失函数最小,本方法利用最小二乘法求解β,β=(β0,β1,..,βe)
t
,得到:
[0110]
β=(x
imet
x
ime
)-1
x
imet
x
ia
[0111]
将具有一个关键影响因素的所述二级影响因素作为b类二级影响因素,对于每个所述b类二级影响因素,根据所述b类二级影响因素对应的第一历史数据集,构建针对于所
述b类二级影响因素的第二预测模型,所述第二预测模型为:
[0112][0113][0114]
其中,表示第b个所述b类二级影响因素对应的第一预测结果,x
im
(d)为第b个所述b类二级影响因素在时刻d时对应的目标历史数据,x
ime
(d)为时刻d时第e个三级影响数据;
[0115]
对于无关键影响因素的所述二级影响因素,根据国家政策文件公布的数据构建针对于无关键影响因素的所述二级影响因素的第三预测模型;
[0116]
所以二级影响因素预测模型包括所述第一预测模型、所述第二预测模型和所述第三预测模型。
[0117]
其中,所述直接影响因素预测模型是通过以下步骤得到的:
[0118]
根据所述预处理数据,获取所述二级影响数据和所述直接影响因素对应的目标历史数据(后文简称直接影响数据);
[0119]
对于每个所述直接影响因素,根据所述直接影响因素对应的目标历史数据和所述二级影响数据,通过第七公式组建所述直接影响因素对应的第二历史数据集,所述第七公式为:
[0120][0121]
其中,(xi,x
iw
)表示第i个所述直接影响因素对应的第二历史数据集,xi表示第i个所述直接影响因素在时刻1至时刻t各自对应的目标历史数据的集合,xi(l)为时刻l时第i个直接影响数据,x
iw
(w为变量,1≤w≤m)表示第w个所述第二影响因素在时刻1至时刻t各自对应的目标历史数据的集合,x
iw
(l)为时刻l时第w个二级影响数据;m表示所述二级影响因素的总个数;
[0122]
将所述二级影响数据作为训练数据训练人工神经网络模型,得到直接影响因素预测模型;本方法通过将所述训练数据与需要输出的变量(即所述直接影响因素)进行关联,计算得到实际输出(即所述直接影响因素对应的第二预测结果),进而准确预测铁路运输需求非线性变化。
[0123]
本实施例中,所述人工神经网络模型的结构如图3所示,所述人工神经网络模型包括输入层、隐藏层和输出层,输入所述输入层的输入向量xi=(x
i1
,x
i2
,
…
,x
im
),其中,m表示所述输入层中神经元的个数,输入向量x中的每个元素对应一个所述二级影响因素对应的第一预测结果;所述隐藏层中的神经元z=(z
i1
,z
i2
,
…
,z
iq
),其中,q表示所述隐藏层中神经元的个数;所述输出层的输出向量xi';所述人工神经网络模型的结构中,m和q的数值根据所述二级影响数据确定,所述隐藏层中的神经元与所述输入层全连接,所述隐藏层的输入表示为:
[0124]
z(1)=ω(1)xi+b(1)
[0125]
其中,z(1)为所述隐藏层中输入值的线性组合,ω(1)为所述输入层到所述隐藏层的权重,b(1)为所述输入层到所述隐藏层的偏置;
[0126]
本实施例采用sigmoid函数为所述隐藏层定义输出,所述隐藏层的输出表示为:
[0127][0128]
同理,所述输出层的输入表示为:
[0129]
z(2)=ω(2)f(z(1))+b(2)
[0130]
其中,z(2)为所述隐藏层中输出值的线性组合,ω(2)为所述隐藏层到所述输出层的权重,b(2)为所述隐藏层到所述输出层的偏置;
[0131]
所述输出层的输出表示为:
[0132][0133]
最终得到的人工神经网络模型为:
[0134]
xi=f(ω(2)(f(ω(1)xi+b(1)))+b(2))。
[0135]
其中,所述铁路货运量预测模型是通过以下步骤得到的:
[0136]
根据所述直接影响数据,通过第八公式组建第三历史数据集,所述第八公式为:
[0137][0138]
其中,(y,xi)表示所述第三历史数据集,y表示时刻1至时刻t各自对应的第二历史铁路货运量数据的集合,y(l)为时刻l时对应的所述第二历史铁路货运量数据,xi表示第i个所述直接影响因素在时刻1至时刻t各自对应的目标历史数据的集合,xi(l)为时刻l时第i个直接影响数据;
[0139]
基于行业发展—各品类—铁路货运量的传导效应,根据所述第三历史数据集构建第一传导预测模型,所述第一传导预测模型为:
[0140][0141]
其中,表示通过所述第一传导预测模型预测得到的第一铁路货运量预估值,表示通过所述直接影响因素预测模型得到的第i个所述直接影响因素对应的第二预测结果,所述第一传导预测模型用于预测基于行业发展—各品类—铁路货运量的传导效应所确定的直接影响因素对应的铁路货运量(即所述第一铁路货运量预估值),本实施例中,基于行业发展—各品类—铁路货运量的传导效应所确定的直接影响因素分别为煤炭运量x1、冶炼物资运量x2、集装箱运量x3和其他品类运量x4;
[0142]
基于经济发展—运输竞争方式运量—铁路货运量的传导效应,根据所述第三历史数据集构建第二传导预测模型,所述第二传导预测模型为:
[0143]
[0144][0145]
其中,表示通过所述第二传导预测模型预测得到的第二铁路货运量预估值,为时刻d时第i个所述直接影响因素对应的第二预测结果,所述第二传导预测模型用于预测基于经济发展—运输竞争方式运量—铁路货运量的传导效应所确定的直接影响因素对应的铁路货运量(即所述第二铁路货运量预估值),本实施例中,基于经济发展—运输竞争方式运量—铁路货运量的传导效应所确定的直接影响因素分别为公路货运量x5和水运货运量x6;
[0146]
所述铁路货运量预测值根据通过所述第一传导预测模型预测得到的第一铁路货运量预估值和通过所述第二传导预测模型预测得到的第二铁路货运量预估值确定。
[0147]
本方法采用多模型组合方法预测,首先根据所述三级影响数据,利用所述二级影响因素预测模型对所述二级影响因素进行预测,得到所述二级影响因素对应的第一预测结果,然后根据所述第一预测结果,利用所述直接影响因素预测模型对所述直接影响因素进行预测,得到所述直接影响因素对应的第二预测结果,最后根据所述第二预测结果和历史铁路货运量(即所述第二历史铁路货运量数据),利用所述铁路货运量预测模型对铁路货运量进行预测。
[0148]
为进一步提高对铁路货运量的预测准确度,所述方法还包括:
[0149]
根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,所述组合预测模型用于确定所述第一传导预测模型对应的第一权重和所述第二传导预测模型对应的第二权重。
[0150]
其中,所述根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,包括:
[0151]
对于所述第一传导预测模型,根据所述第二历史铁路货运量数据,对多个待预测时刻对应的铁路货运量进行预测,得到所述第一传导预测模型对应的多个第一铁路货运量预估值,其中,所述第二历史铁路货运量数据包含多个历史时刻对应的铁路货运量实际值,每个所述待预测时刻表示所述第二历史铁路货运量数据包含的一个铁路货运量实际值对应的历史时刻,每个所述待预测时刻对应一个所述第一铁路货运量预估值;
[0152]
对于所述第二传导预测模型,根据所述第二历史铁路货运量数据,对多个所述待预测时刻对应的铁路货运量进行预测,得到所述第二传导预测模型对应的多个第二铁路货运量预估值,每个所述待预测时刻对应一个所述第二铁路货运量预估值;
[0153]
对于每个所述待预测时刻,根据所述待预测时刻对应的第一铁路货运量预估值,确定所述待预测时刻时所述第一传导预测模型对应的第一预测相对误差;
[0154]
对于每个所述待预测时刻,根据所述待预测时刻对应的第二铁路货运量预估值,确定所述待预测时刻时所述第二传导预测模型对应的第二预测相对误差;
[0155]
根据所述第二历史铁路货运量数据、多个所述第一铁路货运量预估值、多个所述第二铁路货运量预估值、多个所述第一预测相对误差和多个所述第二预测相对误差,构建组合预测模型。
[0156]
本实施例中,所述组合预测模型是通过以下步骤得到的:
[0157]
假设某一历史时刻为n,对于时刻n,根据所述第二历史铁路货运量数据,通过第j(j=1,2)种传导预测模型对时刻n对应的铁路货运量进行预测,得到该模型对应的铁路货运量预估值(当j=1时,第j种传导预测模型为所述第一传导预测模型,第j种传导预测模型对应的铁路货运量预估值为通过所述第一传导预测模型预测得到的第一铁路货运量预估值当j=2时,第j种传导预测模型为所述第二传导预测模型,第j种传导预测模型对应的铁路货运量预估值为通过所述第二传导预测模型预测得到的第二铁路货运量预估值);
[0158]
根据第j种传导预测模型对应的铁路货运量预估值通过第九公式,可确定第j种传导预测模型的预测有效度,所述第九公式为:
[0159][0160]
其中,uj表示第j种传导预测模型的预测有效度,a
jn
=1-|e
jn
|,a
jn
为第j种传导预测模型在时刻n的预测精度,qn为第j种传导预测模型在时刻n的离散概率分布(若不能确定第j种传导预测模型预测精度的加权系数先验信息,则qn=1/n,所述第一传导预测模型和所述第二传导预测模型在时刻n对应的qn相同),e
jn
为第j种传导预测模型在时刻n预测的相对误差(即时刻n时所述第一传导预测模型对应的第一预测相对误差或时刻n时所述第二传导预测模型对应的第二预测相对误差),e(aj)为第j种传导预测模型的预测精度序列aj的数学期望,σ(aj)为第j种传导预测模型的预测精度序列aj的标准差,其中,aj=[a
j1
,a
j2
,
…
,a
jn
];
[0161]
假设an为时刻n的组合预测精度,所述组合预测为组合所述第一传导预测模型和所述第二传导预测模型对铁路货运量进行预测,通过第十公式确定所述组合预测精度,所述第十公式为:
[0162][0163]
其中,en为时刻n的组合预测相对误差,yn为时刻n的铁路货运量,为时刻n的组合预测对应的铁路货运量预估值,lj为第j种传导预测模型的权重。
[0164]
时刻n的组合预测有效度m表示为:
[0165][0166]
其中,e(a)为组合所述第一传导预测模型和所述第二传导预测模型的预测精度序列a的数学期望,σ(a)为所述预测精度序列a的标准差;
[0167]
所述组合预测模型为:
[0168]
maxm(l1,l2)=e(a)(1-σ(a))
[0169][0170]
所述步骤s2包括:
[0171]
根据所述目标数据中的三级影响因素对应的目标历史数据和所述目标数据中的二级影响因素对应的目标历史数据,通过所述二级影响因素预测模型得到所述目标数据中的二级影响因素对应的第一预测结果;
[0172]
根据所述目标数据中的二级影响因素对应的第一预测结果和所述目标数据中的直接影响因素对应的目标历史数据,通过所述直接影响因素预测模型得到所述目标数据中的直接影响因素对应的第二预测结果;
[0173]
根据所述目标数据中的直接影响因素对应的第二预测结果、所述第一传导预测模型、所述第二传导预测模型、所述第一权重和所述第二权重,确定所述目标数据对应的铁路货运量预测值。
[0174]
本实施例中,所述目标数据对应的铁路货运量预测值的计算公式为:
[0175][0176]
其中,对应所述目标数据对应的铁路货运量无量纲预测值,所述目标数据对应的铁路货运量预测值具体为对恢复量纲后的数值,当j=1时,lj表示所述第一传导预测模型对应的第一权重,表示所述目标数据通过所述第一传导预测模型预测得到的第一铁路货运量预估值;当j=2时,lj表示所述第二传导预测模型对应的第二权重,表示所述目标数据通过所述第二传导预测模型预测得到的第二铁路货运量预估值。
[0177]
实施例二
[0178]
与上述实施例一所述的用于铁路货运量的预测方法相同的原理,本实施例提供了
一种用于铁路货运量的预测系统,如图4所示,该系统包括:
[0179]
数据获取模块,用于获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;
[0180]
铁路货运量预测模型构建模块,用于根据所述目标影响因素对应的目标历史数据,构建目标铁路货运量预测模型,所述目标铁路货运量预测模型包括二级影响因素预测模型、直接影响因素预测模型和铁路货运量预测模型;
[0181]
铁路货运量预测模块,用于将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值;
[0182]
其中,所述铁路货运量预测模型构建模块包括:
[0183]
原始数据获取子模块,用于获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原始历史数据;
[0184]
目标影响因素及数据确定子模块,用于根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述直接影响因素为一级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;
[0185]
二级影响因素预测模型构建子模块,用于根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;
[0186]
直接影响因素预测模型构建子模块,用于根据所述二级影响因素对应的第一预测结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;
[0187]
铁路货运量预测模型构建子模块,用于根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量。
[0188]
其中,所述目标影响因素及数据确定子模块包括:
[0189]
数据清洗单元,用于对所述第一历史铁路货运量数据进行数据清洗处理,得到第二历史铁路货运量数据;对所述第一历史铁路货运相关数据进行数据清洗处理,得到处理后的铁路货运相关数据,所述处理后的铁路货运相关数据为与铁路货运量相关的多个因素各自对应的目标历史数据;
[0190]
分组处理单元,用于根据数据类别,对所述第二历史铁路货运量数据和所述处理后的铁路货运相关数据进行分组处理,得到预处理数据,所述预处理数据包括所述第二历史铁路货运量数据和待确定因素相关数据,所述待确定因素相关数据为多个待确定因素各自对应的目标历史数据,所述待确定因素为对铁路货运量具有直接影响的因素或间接影响的因素;
[0191]
目标影响因素及数据确定单元,用于根据所述预处理数据,确定所述目标影响因素,多个所述待确定因素包括所述目标影响因素,所述目标影响因素对应的目标历史数据为多个所述待确定因素中的多个所述待确定因素各自对应的目标历史数据。
[0192]
其中,所述目标影响因素及数据确定单元包括:
[0193]
灰色关联度确定子单元,用于对于每个所述待确定因素,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的灰色关联度,所述灰色关联度表征所述待确定因素与铁路货运量之间的关联程度;
[0194]
待确定因素精简子单元,用于对于每个所述待确定因素,若所述待确定因素的灰色关联度大于预设的关联度阈值,则执行相关系数确定子单元;
[0195]
相关系数确定子单元,用于根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的相关系数,所述相关系数表征所述待确定因素与铁路货运量之间的线性相关程度;
[0196]
目标影响因素确定子单元,用于根据所述待确定因素的相关系数和预设的相关程度阈值,确定所述待确定因素是否为目标影响因素。
[0197]
其中,所述铁路货运量预测模型包括第一传导预测模型和第二传导预测模型,所述第一传导预测模型用于根据行业发展预测铁路货运量,所述第二传导预测模型用于根据经济发展预测铁路货运量;
[0198]
该系统还包括权重设定子模块,所述权重设定子模块用于:
[0199]
根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,所述组合预测模型用于确定所述第一传导预测模型对应的第一权重和所述第二传导预测模型对应的第二权重。
[0200]
其中,所述权重设定子模块用于根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型时,具体用于:
[0201]
对于所述第一传导预测模型,根据所述第二历史铁路货运量数据,对多个待预测时刻对应的铁路货运量进行预测,得到所述第一传导预测模型对应的多个第一铁路货运量预估值,其中,所述第二历史铁路货运量数据包含多个历史时刻对应的铁路货运量实际值,每个所述待预测时刻表示所述第二历史铁路货运量数据包含的一个铁路货运量实际值对应的历史时刻,每个所述待预测时刻对应一个所述第一铁路货运量预估值;
[0202]
对于所述第二传导预测模型,根据所述第二历史铁路货运量数据,对多个所述待预测时刻对应的铁路货运量进行预测,得到所述第二传导预测模型对应的多个第二铁路货运量预估值,每个所述待预测时刻对应一个所述第二铁路货运量预估值;
[0203]
对于每个所述待预测时刻,根据所述待预测时刻对应的第一铁路货运量预估值,确定所述待预测时刻时所述第一传导预测模型对应的第一预测相对误差;
[0204]
对于每个所述待预测时刻,根据所述待预测时刻对应的第二铁路货运量预估值,确定所述待预测时刻时所述第二传导预测模型对应的第二预测相对误差;
[0205]
根据所述第二历史铁路货运量数据、多个所述第一铁路货运量预估值、多个所述第二铁路货运量预估值、多个所述第一预测相对误差和多个所述第二预测相对误差,构建组合预测模型。
[0206]
其中,所述铁路货运量预测模块包括:
[0207]
第一预测结果确定子模块,用于根据所述目标数据中的三级影响因素对应的目标历史数据和所述目标数据中的二级影响因素对应的目标历史数据,通过所述二级影响因素预测模型得到所述目标数据中的二级影响因素对应的第一预测结果;
[0208]
第二预测结果确定子模块,用于根据所述目标数据中的二级影响因素对应的第一预测结果和所述目标数据中的直接影响因素对应的目标历史数据,通过所述直接影响因素预测模型得到所述目标数据中的直接影响因素对应的第二预测结果;
[0209]
铁路货运量预测值确定子模块,用于根据所述目标数据中的直接影响因素对应的第二预测结果、所述第一传导预测模型、所述第二传导预测模型、所述第一权重和所述第二权重,确定所述目标数据对应的铁路货运量预测值。
[0210]
实施例三
[0211]
为解决上述技术问题,本实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例一所述的用于铁路货运量的预测方法。
[0212]
实施例四
[0213]
为解决上述技术问题,本实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如实施例一所述的用于铁路货运量的预测方法。
[0214]
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0215]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0216]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种用于铁路货运量的预测方法,其特征在于,包括:步骤s1,获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;步骤s2,将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值;其中,所述目标铁路货运量预测模型是通过以下步骤得到的:获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原始历史数据;根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述直接影响因素为一级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;根据所述二级影响因素对应的第一预测结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量;所述目标铁路货运量预测模型包括所述二级影响因素预测模型、所述直接影响因素预测模型和所述铁路货运量预测模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,包括:步骤a1,对所述第一历史铁路货运量数据进行数据清洗处理,得到第二历史铁路货运量数据;对所述第一历史铁路货运相关数据进行数据清洗处理,得到处理后的铁路货运相关数据,所述处理后的铁路货运相关数据为与铁路货运量相关的多个因素各自对应的目标历史数据;步骤a2,根据数据类别,对所述第二历史铁路货运量数据和所述处理后的铁路货运相关数据进行分组处理,得到预处理数据,所述预处理数据包括所述第二历史铁路货运量数据和待确定因素相关数据,所述待确定因素相关数据为多个待确定因素各自对应的目标历史数据,所述待确定因素为对铁路货运量具有直接影响的因素或间接影响的因素;步骤a3,根据所述预处理数据,确定所述目标影响因素,多个所述待确定因素包括所述目标影响因素,所述目标影响因素对应的目标历史数据为多个所述待确定因素中的多个所述待确定因素各自对应的目标历史数据。
3.根据权利要求2所述的方法,其特征在于,所述步骤a3中,所述根据所述预处理数据,确定所述目标影响因素,包括:步骤a3.1,对于每个所述待确定因素,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的灰色关联度,所述灰色关联度表征所述待确定因素与铁路货运量之间的关联程度;步骤a3.2,对于每个所述待确定因素,若所述待确定因素的灰色关联度大于预设的关联度阈值,则执行步骤a3.3;步骤a3.3,根据所述待确定因素对应的目标历史数据和所述第二历史铁路货运量数据,确定所述待确定因素的相关系数,所述相关系数表征所述待确定因素与铁路货运量之间的线性相关程度;步骤a3.4,根据所述待确定因素的相关系数和预设的相关程度阈值,确定所述待确定因素是否为目标影响因素。4.根据权利要求2所述的方法,其特征在于,所述铁路货运量预测模型包括第一传导预测模型和第二传导预测模型,所述第一传导预测模型用于根据行业发展预测铁路货运量,所述第二传导预测模型用于根据经济发展预测铁路货运量;所述方法还包括:根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,所述组合预测模型用于确定所述第一传导预测模型对应的第一权重和所述第二传导预测模型对应的第二权重。5.根据权利要求4所述的方法,其特征在于,所述根据所述第二历史铁路货运量数据、所述第一传导预测模型和所述第二传导预测模型,构建组合预测模型,包括:对于所述第一传导预测模型,根据所述第二历史铁路货运量数据,对多个待预测时刻对应的铁路货运量进行预测,得到所述第一传导预测模型对应的多个第一铁路货运量预估值,其中,所述第二历史铁路货运量数据包含多个历史时刻对应的铁路货运量实际值,每个所述待预测时刻表示所述第二历史铁路货运量数据包含的一个铁路货运量实际值对应的历史时刻,每个所述待预测时刻对应一个所述第一铁路货运量预估值;对于所述第二传导预测模型,根据所述第二历史铁路货运量数据,对多个所述待预测时刻对应的铁路货运量进行预测,得到所述第二传导预测模型对应的多个第二铁路货运量预估值,每个所述待预测时刻对应一个所述第二铁路货运量预估值;对于每个所述待预测时刻,根据所述待预测时刻对应的第一铁路货运量预估值,确定所述待预测时刻时所述第一传导预测模型对应的第一预测相对误差;对于每个所述待预测时刻,根据所述待预测时刻对应的第二铁路货运量预估值,确定所述待预测时刻时所述第二传导预测模型对应的第二预测相对误差;根据所述第二历史铁路货运量数据、多个所述第一铁路货运量预估值、多个所述第二铁路货运量预估值、多个所述第一预测相对误差和多个所述第二预测相对误差,构建组合预测模型。6.根据权利要求4或5所述的方法,其特征在于,所述步骤s2包括:根据所述目标数据中的三级影响因素对应的目标历史数据和所述目标数据中的二级影响因素对应的目标历史数据,通过所述二级影响因素预测模型得到所述目标数据中的二
级影响因素对应的第一预测结果;根据所述目标数据中的二级影响因素对应的第一预测结果和所述目标数据中的直接影响因素对应的目标历史数据,通过所述直接影响因素预测模型得到所述目标数据中的直接影响因素对应的第二预测结果;根据所述目标数据中的直接影响因素对应的第二预测结果、所述第一传导预测模型、所述第二传导预测模型、所述第一权重和所述第二权重,确定所述目标数据对应的铁路货运量预测值。7.一种用于铁路货运量的预测系统,其特征在于,包括:数据获取模块,用于获取目标数据,所述目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,所述目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,所述目标影响因素为对铁路货运量具有直接影响或间接影响的因素;铁路货运量预测模型构建模块,用于根据所述目标影响因素对应的目标历史数据,构建目标铁路货运量预测模型,所述目标铁路货运量预测模型包括二级影响因素预测模型、直接影响因素预测模型和铁路货运量预测模型;铁路货运量预测模块,用于将所述目标数据输入预先构建好的目标铁路货运量预测模型中,得到所述目标数据对应的铁路货运量预测值;其中,所述铁路货运量预测模型构建模块包括:原始数据获取子模块,用于获取原始数据,所述原始数据包括第一历史铁路货运量数据和第一历史铁路货运相关数据,所述第一历史铁路货运相关数据为与铁路货运量相关的多个因素各自对应的原始历史数据;目标影响因素及数据确定子模块,用于根据所述原始数据,确定目标影响因素和所述目标影响因素对应的目标历史数据,所述目标影响因素包括直接影响因素、二级影响因素和三级影响因素,所述三级影响因素对应的目标历史数据影响所述二级影响因素对应的目标历史数据,所述二级影响因素对应的目标历史数据影响所述直接影响因素对应的目标历史数据,所述直接影响因素对应的目标历史数据影响铁路货运量;二级影响因素预测模型构建子模块,用于根据所述三级影响因素对应的目标历史数据和所述二级影响因素对应的目标历史数据,构建二级影响因素预测模型,所述二级影响因素预测模型用于确定所述二级影响因素对应的第一预测结果;直接影响因素预测模型构建子模块,用于根据所述二级影响因素对应的第一预测结果和所述直接影响因素对应的目标历史数据,构建直接影响因素预测模型,所述直接影响因素预测模型用于确定所述直接影响因素对应的第二预测结果;铁路货运量预测模型构建子模块,用于根据所述直接影响因素对应的第二预测结果和所述第一历史铁路货运量数据,构建铁路货运量预测模型,所述铁路货运量预测模型用于预测铁路货运量。8.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的用于铁路货运量的预测方法。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机
程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的用于铁路货运量的预测方法。
技术总结
本发明公开了一种用于铁路货运量的预测方法、系统、设备及介质,涉及铁路货运技术领域,其中,方法包括:获取目标数据,目标数据包括目标历史铁路货运量数据和目标历史铁路货运相关数据,目标历史铁路货运相关数据为与铁路货运量相关的多个目标影响因素各自对应的目标历史数据,目标影响因素为对铁路货运量具有直接影响或间接影响的因素;将目标数据输入预先构建好的目标铁路货运量预测模型中,得到目标数据对应的铁路货运量预测值。本发明解决了现有的铁路货运量预测方法未考虑与铁路货运量相关的影响因素对铁路货运量的影响情况及各影响因素之间的关系,导致对铁路货运量的预测准确度低,使铁路货运企业经营决策具有局限性和滞后性的问题。限性和滞后性的问题。限性和滞后性的问题。
技术研发人员:倪继娜 张巍 王菲 郑平标 权诗琦 刘畅 秦胜 刘海涛 游艳雯 秦欢欢 傅赟 李樱灿 程文毅 张楷唯 李小波
受保护的技术使用者:中国铁道科学研究院集团有限公司
技术研发日:2023.05.04
技术公布日:2023/10/7
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
