一种公交到站时刻预测方法及装置与流程

未命名 07-17 阅读：175 评论：0

1.本发明提供了一种公交到站时刻预测方法及装置，属于公交到站时刻预测技术领域。

背景技术：

2.随着公共交通基础设施建设的日益完备，公共出行已成为民众日常通勤和出行的主要选择。地铁得益于其固定且不受外界干扰的线路，使得地铁到站时刻可以精准预测，为乘客出行带来便利。目前，国内众多有地铁需求且有经济实力的城市已经开始进行地铁的规划、设计及运营，但地铁建设成本较高，无法在所有地市及乡镇普及，而且地铁站点设计对城市的覆盖度相对公路公共交通站点较低，因此，公路公共交通在缓解城市交通压力中仍扮演重要的角色。
3.便利性是民众出行主要的关注点之一，如果公交车辆抵达站台的时刻可以精确预测，那么民众将可以更加合理的安排出行方式，民众出行便利性提升的同时，对公路公共交通满意度也将增加，同时将吸引更多民众在出行时选择公共交通，缓解城市交通压力。而且公交车辆抵达站台的时刻可以精确预测，可以提高公交公司对公交车的调度能力，使公交资源得到充分、均衡利用。
4.因此，在城市公交运行过程中，若不能准确地预测公交到站时间，既会影响乘客的候车体验，也不利于公交公司对公交车的调度。

技术实现要素：

5.本发明的目的在于提供一种公交到站时刻预测方法及装置，用于解决无法准确预测公交到站时刻的问题。
6.为了实现上述目的，本发明提供了一种公交到站时刻预测方法，包括如下步骤：
7.1)在待预测公交车从出发站点前往目标站点的运行过程中，获取公交车运行数据，所述公交车运行数据包括实时运行数据，所述实时运行数据包括从出发站点到目标站点之间的行程信息，实时运行数据还包括待预测公交车当前位置与前公交车所在位置之间的距离、高峰时间段信息和天气情况中的至少一种数据；
8.2)将公交车运行数据输入到预先建立的公交到站时刻预测模型，输出待预测公交车从当前位置到达目标站点所需的预测运行时长；
9.3)根据预测运行时长，计算待预测公交车到达目标站点时的预测时刻。
10.本发明的公交到站时刻预测方法，通过获取公交车运行过程中的公交车运行数据，公交车运行数据包括与待预测公交车运行相关的实时运行数据，实时运行数据包括与运行路线相关的行程信息，还包括待预测公交车当前位置与前公交车所在位置之间的距离、高峰时间段信息和天气情况中的至少一种数据；将公交车运行数据输入预先建立的公交到站时刻预测模型，输出待预测公交车从当前位置到达目标站点所需的预测运行时长，进而计算待预测公交车到达目标站点的预测时刻。本发明在现有公交车到站预测技术的基
础上，进一步考虑与公交车到站相关的其他因素，采用待预测公交车在当前位置与前公交车位置之间的距离、高峰时间段信息和天气情况这三种数据中的至少一种数据，建立预测准确度更高的公交到站时刻预测模型，从而提高公交到站时刻预测的准确度。
11.进一步地，在上述方法中，所述行程信息包括整个行程信息和本次行程信息，所述整个行程信息包括出发站点id、目标站点id和从出发站点指向目标站点的运行方向，所述本次行程信息包括待预测公交车当前位置与目标站点之间的距离；
12.将待预测公交车从出发站点前往目标站点的运行线路作为整个行程，将待预测公交车从当前位置前往目标站点的运行线路作为本次行程。
13.对待预测公交车从出发站点前往目标站点的运行路线进行标定，得到整个行程和本次行程，因此，行程信息可以分为整个行程信息和本次行程信息，整个行程信息采用出发站点id、目标站点id和从出发站点指向目标站点的运行方向，本次行程信息采用待预测公交车当前位置与目标站点之间的距离，通过采用这些行程信息，对影响公交到站时刻预测的因素考虑更加全面，从而提高公交到站时刻预测的准确度。
14.进一步地，在上述方法中，所述实时运行数据还包括待预测公交车从出发站点运动到当前位置等待红绿灯所经历的时长、本次行程的剩余红绿灯个数和整个行程的红绿灯个数中的至少一种数据。
15.还考虑待预测公交车从出发站点运动到当前位置等待红绿灯所经历的时长、本次行程的剩余红绿灯个数和整个行程的红绿灯个数中的至少一种实时运行数据，建立出更加准确的公交到站时刻预测模型，使预测出的公交到站时刻更加准确。
16.进一步地，在上述方法中，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的历史平均载客率和/或出发站点处历史平均上下车时长。
17.还从公交车的历史运行数据出发，考虑历史运行数据中的整个行程的历史平均载客率和出发站点处历史平均上下车时长对公交到站时刻预测的影响，并以此建立出更加准确的公交到站时刻预测模型，从而提高公交到站时刻预测的准确度。
18.进一步地，在上述方法中，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的红绿灯历史等待时间和/或整个行程的红绿灯历史最大等待时间。
19.考虑历史运行数据中整个行程的红绿灯历史等待时间和整个行程的红绿灯历史最大等待时间对公交到站时刻预测的影响，并以此建立出更加准确的公交到站时刻预测模型，从而提高公交到站时刻预测的准确度。
20.进一步地，在上述方法中，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的历史平均运行速度、整个行程的历史最大运行速度、整个行程的历史平均运行时间和整个行程的历史最大运行时间中的至少一种数据。
21.考虑历史运行数据中的整个行程的历史平均运行速度、整个行程的历史最大运行速度、整个行程的历史平均运行时间和整个行程的历史最大运行时间对公交到站时刻预测的影响，并以此建立出更加准确的公交到站时刻预测模型，从而提高公交到站时刻预测的准确度。
22.进一步地，在上述方法中，所述公交到站时刻预测模型采用xgboost模型。
23.针对上述提到的公交到站时刻预测模型，提出一种具体的模型来实现，即xgboost模型，便于本发明的实施和应用。
24.进一步地，在上述方法中，在对xgboost模型训练时，对xgboost模型的学习率、迭代次数、回归树最大深度、回归树叶子节点权值、随机采样比例、每个回归树的随机采样占比和叶节点分裂最小损失函数下降值进行参数调优。
25.在对公交到站时刻预测模型，即xgboost模型，进行训练和测试时，对该模型的参数进行调整以优化模型，根据对实际调试结果的分析，学习率、迭代次数、回归树最大深度、回归树叶子节点权值、随机采样比例、每个回归树的随机采样占比和叶节点分裂最小损失函数下降值对公交到站时刻预测模型的影响较大，因此主要对这些参数进行调整，可以降低训练和测试模型时的工作量，并提高公交到站时刻预测模型的精度。
26.进一步地，在上述方法中，在参数调优时，采用平均绝对误差和正则项的组合作为得分函数，所述得分函数为：
[0027][0028]
式中，为平均绝对误差，为第i次预测的预测到站时间，yi为与对应的实际到站时间，l为预测次数，dis(
…
,
…
)为两个变量差值的绝对值,为正则项，k为回归树个数，fj为第j棵回归树。
[0029]
采用平均绝对误差和正则项的组合作为得分函数，对公交到站时刻预测模型进行参数调优后的结果进行判断，便于得到更加准确的公交到站时刻预测模型。
[0030]
本发明还提供一种公交到站时刻预测装置，包括处理器和存储器，处理器执行存储在存储器中的指令实现上述的公交到站时刻预测方法。
附图说明
[0031]
图1为本发明方法实施例中公交到站时刻预测方法的流程框图；
[0032]
图2为本发明装置实施例中装置的结构示意图。
具体实施方式
[0033]
为了使本发明的目的、技术方案及优点更加清楚明了，以下结合附图及实施例，对本发明进行进一步详细说明。
[0034]
方法实施例：
[0035]
本发明的公交到站时刻预测方法，通过车载网联终端和移动通信网络，获取与公交到站时刻预测相关的车辆运行数据，包括历史运行数据和实时运行数据，建立基于xgboost模型的公交到站时刻预测模型，采用车辆运行历史中积累的车辆运行数据对其进行训练和测试，并采用平均绝对误差和正则项的组合作为得分函数，通过交叉验证的方式对公交到站时刻预测模型进行参数调优，从而得到精确度较高的公交到站时刻预测模型；将车辆运行数据输入训练和调优后的公交到站时刻预测模型，输出公交车到达目标站点的预测时刻。
[0036]
如图1所示，公交到站时刻预测方法包括如下步骤：
[0037]
s1、在待预测公交车从当前位置向目标站点行驶时，将待预测公交车从出发站点
到目标站点之间的路线作为整个行程，将待预测公交车从当前位置到目标站点之间的路线作为本次行程，获取公交车在整个行程中的整个行程信息和在本次行程中的本次行程信息作为公交车运行数据，其中，整个行程信息包括出发站点id(即出发站点的名称信息或标志信息)和目标站点id(即目标站点的名称信息或标志信息)，以及从出发站点指向目标站点的运行方向，本次行程信息包括待预测公交车所在当前位置与目标站点之间的距离。
[0038]
为保证同一路线运行的不同公交车可以间隔均匀地到达同一站点，从而提高公交车的使用率，还获取待预测公交车当前位置与前公交车所在位置之间的距离作为公交车运行数据，在此基础上，还考虑与乘客出行高峰期相关的高峰时间段信息和影响公交车运行的天气情况，并将其中至少一种实时运行数据作为公交车运行数据，
[0039]
本实施例中，根据乘客的出行规律和公交车的实际运行情况，将每天早上7:30-8:30之间的时间段作为早高峰，赋值高峰时间段信息为1，将每天晚上5:30-6:30之间的时间段作为晚高峰，赋值高峰时间段信息为2，其他时间段作为非高峰时间段，赋值高峰时间段信息为0，高峰时间段信息用于表征待预测公交车当前所在时段是否为高峰时间段。对于天气情况，将不适宜公交车运行的天气情况(例如雨雪天气)赋值为0，适宜公交车运行的天气情况(例如晴天或阴天)赋值为1。
[0040]
进一步考虑待预测公交车在运行时需要经过十字路口等位置的数量和在该位置处等待红绿灯的时间，因此，还将待预测公交车从出发站点运动到当前位置等待红绿灯所经历的时长、本次行程的剩余红绿灯个数和整个行程的红绿灯个数中的至少一种数据作为实时运行数据。
[0041]
进一步从公交车在历史运行过程中的历史运行数据出发，考虑与公交车运行速度相关的因素，而公交车的车重会影响公交车运行速度，公交车的车重与乘客数量相关，因此获取与乘客数量相关的整个行程的历史平均载客率和出发站点处历史平均上下车时长作为公交车运行数据中的历史运行数据。
[0042]
考虑公交车在当前整个行程的历史运行过程中，等待红绿灯所耗费时间，获取整个行程的红绿灯历史等待时间和整个行程的红绿灯历史最大等待时间，对不同路口的拥挤程度分析预测，从而提高公交到站时刻预测的准确性。
[0043]
考虑公交车在不同位置的路况不同，公交车的速度也会不同，因此还获取整个行程的历史平均运行速度、整个行程的历史最大运行速度、整个行程的历史平均运行时间和整个行程的历史最大运行时间，对待预测公交车在本次行程中的速度和不同速度所用的时间进行分析预测，从而提高公交到站时刻预测的准确性。
[0044]
对上述的公交车运行数据进行归纳整理如下，包括：1)出发站点id，2)目标站点id，3)从出发站点指向目标站点的运行方向，4)公交车从出发站点运动到当前位置的过程中等待红绿灯所经历的时长，5)公交车在本次行程中的剩余红绿灯个数，6)整个行程的红绿灯个数，7)整个行程的红绿灯等待时间，8)整个行程的红绿灯最大等待时间，9)整个行程的平均运行速度，10)整个行程的最大运行速度，11)公交车在当前位置与目标站点之间的距离，12)公交车在当前位置与前公交车位置之间的距离，13)行程平均载客率，14)行程平均运行时间，15)行程最大运行时间，16)行程平均上下车时长，17)高峰时间段，18)天气情况。
[0045]
s2、将这18个特征变量输入预先建立的公交到站时刻预测模型中，输出公交车从
当前位置到达目标站点所需要的预测时长。
[0046]
s3、根据该预测时长，在当前时间的基础上，计算出公交车到达目标站点时的预测时刻。
[0047]
公交到站时刻预测模型通过如下步骤建立：
[0048]
1)数据采集。通过无线通信的方式，从车载网联终端获取公交车的历史运行数据，包括如下数据：1)出发站点id，2)目标站点id，3)从出发站点指向目标站点的运行方向，4)公交车从出发站点运动到当前位置的过程中等待红绿灯所经历的时长，5)公交车在本次行程中的剩余红绿灯个数，6)整个行程的红绿灯个数，7)整个行程的红绿灯等待时间，8)整个行程的红绿灯最大等待时间，9)整个行程的平均运行速度，10)整个行程的最大运行速度，11)公交车在当前位置与目标站点之间的距离，12)公交车从当前位置到目标站点的运行时间，13)公交车在当前位置与前公交车位置之间的距离，14)行程平均载客率，15)行程平均运行时间，16)行程最大运行时间，17)行程平均上下车时长，18)高峰时间段，19)天气情况。
[0049]
在构建公交到站时刻预测模型时，将公交车从当前位置到目标站点的运行时间作为输出，将其他18种数据作为输入，从而构建公交到站时刻预测模型，作为其他实施方式，也可仅采用这18种数据中的若干数据作为输入，从而减少数据采集的工作量。
[0050]
若仅以从出发站点到目标站点之间的行程信息，即出发站点id、目标站点id、从出发站点指向目标站点的运行方向和待预测公交车当前位置与目标站点之间的距离，结合待预测公交车当前位置与前公交车所在位置之间的距离、高峰时间段和天气情况中的至少一种数据作为输入，公交车从当前位置到目标站点的运行时间作为输出，则在训练和测试公交到站时刻预测模型，从公交车的车辆历史数据中提取相应的数据，划分训练数据和测试数据，进行训练和测试。在实际执行本发明的方法时，也仅需要根据训练时输入数据的类型，获取相应的输入数据，从而输出公交车从当前位置到目标站点的预测运行时长，进而计算出待预测公交车到达目标站点时的预测时刻。
[0051]
若在此基础上，还加入待预测公交车从出发站点运动到当前位置等待红绿灯所经历的时长、本次行程的剩余红绿灯个数和整个行程的红绿灯个数中的至少一种数据作为输入，则在训练和测试公交到站时刻预测模型，从公交车的车辆历史数据中提取相应的数据，划分训练数据和测试数据，进行训练和测试。在实际执行本发明的方法时，也需要根据增加的输入数据类型，获取对应的输入数据，从而输出公交车从当前位置到目标站点的预测运行时长，进而计算出待预测公交车到达目标站点时的预测时刻。
[0052]
同理，若考虑整个行程的历史平均载客率、出发站点处历史平均上下车时长、整个行程的红绿灯历史等待时间、整个行程的红绿灯历史最大等待时间、整个行程的历史平均运行速度、整个行程的历史最大运行速度、整个行程的历史平均运行时间和整个行程的历史最大运行时间中的至少一种数据作为输入，则在训练和测试公交到站时刻预测模型，从公交车的车辆历史数据中提取相应的数据，划分训练数据和测试数据，进行训练和测试。在实际执行本发明的方法时，也需要根据增加的输入数据类型，获取对应的输入数据，从而输出公交车从当前位置到目标站点的预测运行时长，进而计算出待预测公交车到达目标站点时的预测时刻。
[0053]
当考虑上述全部类型的数据特征作为输入，公交车从当前位置到目标站点的运行时间作为输出时，以时间为横坐标，将获取的数据以多变量时间序列的方式表示为车辆数
据序列，并进行存储。车辆数据序列如下所示：
[0054]
x＝[x1,x2,
…
,xi,
…
,xn]
[0055]
其中，x为因变量，即上述的19种数据。n为特征变量的个数，本实施例中，n的个数为19。xi为因变量x中的一个特征变量，以时间为横坐标记录该特征变量对应时间段的所有数据。
[0056][0057]
对于实时运行数据而言，只有一组车辆数据序列，因此m取1；对于历史运行数据而言，取从预测当日向前推4周内的车辆运行数据，以每天运行8小时，每隔1秒上传一次数据进行统计，m取806400。
[0058]
2)创建公交到站时刻预测模型的训练数据集和测试数据集。通过sklearn算法包中的train_test_split()函数，对历史运行数据进行随机划分，将历史运行数据中60％-80％的数据作为训练数据集，剩余40％-20％的数据作为测试数据集。train_test_split()函数的输入包括待划分的历史数据集(即历史运行数据)、待划分样本标签数据和测试数据集在历史数据集中的占比，输出包括训练数据集、训练数据集标签数据、测试数据集和测试数据集标签数据。本实施例中，待划分样本标签数据采用从当前位置到目标站点的实际运行时间，因此，训练数据集标签数据和测试数据集标签数据也为从当前位置到目标站点的实际运行时间。
[0059]
3)通过训练数据集对公交到站时刻预测模型进行训练，并通过测试数据集对公交到站时刻预测模型进行参数调优。本实施例中的公交到站时刻预测模型采用xgboost模型，即extreme gradient boosting，中文直译为极端梯度提升，是一种树集成模型，能够基于输入的历史数据和标签数据建立多个树模型，基于输入的实时数据和树模型计算每棵树对应的叶节点的值，基于各个叶节点的输出值和各个树模型的权值对输入的实时数据进行目标值预测。
[0060]
在模型训练过程中进行误差分析，判断出模型训练过程中训练数据的自变量离散程度不足，导致xgboost模型中树节点精度不足，因此将每日运营时间以2小时作为时间间隔，划分创建新的自变量，以提升模型的精确性。
[0061]
本实施例中，对xgboost模型的7个参数进行调优，分别是学习率、迭代次数、回归树最大深度、回归树叶节点权值、随机采样比例、每个回归树的随机采样占比、叶节点分裂最小损失函数下降值。
[0062]
首先，设定各个参数的初始值。学习率的常规设置范围为0.01-0.2，本实施例中将学习率的初始值设置为0.1。迭代次数的常规设置范围为400-800，本实施例中将迭代次数的初始值设置为500。回归树最大深度的常规设置范围为3-10，本实施例中将回归树最大深度的初始值设置为5。回归树叶节点权值的常规设置范围为1-6，本实施例中将回归树叶节点权值的初始值设置为1。随机采样比例值的常规设置范围为0.6-0.9，本实施例中将随机采样比例值的初始值均为0.8。回归树的随机采样占比常规设置范围为0.6-0.9，本实施例中将回归树的随机采样占比的初始值均为0.8。叶节点分裂最小损失函数下降值的常规设置范围为0.1-0.6，本实施例中将叶节点分裂最小损失函数的初始值设置为0.1。
[0063]
其次，基于测试数据集和测试数据集标签数据，采样平均绝对误差和正则项的组合作为得分函数，对参数调优的结果进行判断，以进一步优化xgboost模型。本实施例中，正
则项采用l2范数来控制模型中回归树的复杂度，避免模型过度拟合。得分函数的表达式为：
[0064][0065]
式中，为预测到站时刻，yi为实际到站时刻，l为预测次数，为平均绝对值误差，用来描述模型拟合数据的程度，dis(
…
,
…
)为两个变量差值的绝对值，为正则项，k为回归树的个数，fj为第j棵回归树。
[0066]
在参数调优时，采用70％作为调优结果的判断阈值，若得分函数的结果大于70％，则采纳本次参数调优的结果，否则继续调整参数，直到得分函数的结果达到模型要求。
[0067]
然后，通过交叉验证和贪心算法对xgboost模型的7个参数进行调优。贪心算法采用自顶向下，以迭代的方法做出相继的最优选择，每做一次最优选择，就将所求问题化为一个规模更小的子问题，通过每一步最优选择，得到问题的最优解。本实施例中，交叉验证的次数为3次。
[0068]
先对迭代次数进行调优，具体步骤为：第一次将迭代次数向量设置为[400,500,600,700,800]，结果显示迭代次数为700时模型得分最优；由于第一次迭代次数的间隔较大，为100，因此在进行第二次迭代次数调优时，将迭代次数向量设置为[650，675，700，725，750]，结果显示迭代次数为675时模型得分最优。随着迭代次数颗粒度减小，最佳迭代次数将越来越精确。本实施中，选取675作为最佳迭代次数，迭代次数调优的颗粒度为25。
[0069]
接着采用同样的方法，对回归树最大深度、回归树叶节点权值、随机采样比例值、回归树的随机采样占比、叶节点分裂最小损失函数下降值和学习率进行迭代调优，并逐步将模型参数设置为最佳值并固定。参数调优后xgboost模型的参数如下：回归树最大深度为6，回归树叶节点权值为5，随机采样比例值为0.8，回归树的随机采样占比为0.8，叶节点分裂最小损失函数下降值为0，学习率为0.1。
[0070]
本实施例中建立的公交到站时刻预测模型，在实际测试时得到的预测到站时刻与实际到站时刻的偏差平均值为25秒，且运算延迟小于1秒，准确度更高。
[0071]
本实施例中的公交到站时刻预测模型，构建训练数据集和测试数据集时，选取预测当日前推4周的历史运行数据，因此，可采用以周为时间间隔的滑动窗口，在每周一将历史运行数据按滑动窗口进行滑动，创建新的历史数据集，从而对训练数据集和测试数据集进行迭代更新，并采用更新后的数据集对公交到站时刻预测模型进行新的训练和测试，实现模型的周迭代。数据集迭代更新如下所示，其中x_old为更新前的历史数据集，x_new为更新后的历史数据集。
[0072]
x_old＝[x1，x2，x3，x4，x5，x6，x7，
…
，x
22
，x
23
，x
24
，x
25
，x
26
，x
27
，x
28
]
[0073]
x_new＝[x8，x9，x
10
，x
11
，x
12
，x
13
，x
14
，
…
，x
29
，x
30
，x
31
，x
32
，x
33
，x
34
，x
35
]
[0074]
本发明通过数据挖掘技术，基于历史运行数据，建立不受车辆类型和运营环境影响的公交到站时刻预测模型，通过增加回归树的数量以提升预测的准确度，通过并行计算和使用二阶偏导的方法加速计算过程，提升了公交到站时刻预测的实时性。
[0075]
装置实施例：
[0076]
本发明还提供一种公交到站时刻预测装置，如图2所示，包括处理器、存储器和内
部总线，通过内部总线实现处理器和存储器之间的数据和通信交互。处理器可以为微处理器mcu、可编程逻辑器件fpga等处理装置。存储器可为利用电能方式存储信息的各式存储器，例如ram、rom等；也可为利用磁能方式存储信息的各式存储器，例如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、u盘等；还可为利用光学方式存储信息的各式存储器，例如cd、dvd等；当然，还可为其他方式的存储器，例如量子存储器、石墨烯存储器等。
[0077]
存储器中存储有公交到站时刻预测模型，处理器执行存储器中的指令实现方法实施例中的公交到站时刻预测方法，关于该方法的实现，在方法实施例中已经介绍的清楚明白，此处不再赘述。
[0078]
本发明的公交到站时刻预测装置部署在云端，云端通过移动信号从车载网联终端获取数据，在云端暂存后进行处理分析，对待预测公交车到达目标站点的时刻进行预测。
[0079]
对于公交公司而言，每条公交运行路线上会安排多辆公交车，采用本发明的装置，可以准确预测公交车的到站时刻，以对各公交车进行调度，从而向民众提供便捷的公交运营服务，提高乘客对公路交通的满意度。

技术特征：
1.一种公交到站时刻预测方法，其特征在于，包括如下步骤：1)在待预测公交车从出发站点前往目标站点的运行过程中，获取公交车运行数据，所述公交车运行数据包括实时运行数据，所述实时运行数据包括从出发站点到目标站点之间的行程信息，实时运行数据还包括待预测公交车当前位置与前公交车所在位置之间的距离、高峰时间段信息和天气情况中的至少一种数据；2)将公交车运行数据输入到预先建立的公交到站时刻预测模型，输出待预测公交车从当前位置到达目标站点所需的预测运行时长；3)根据预测运行时长，计算待预测公交车到达目标站点时的预测时刻。2.根据权利要求1所述的公交到站时刻预测方法，其特征在于，所述行程信息包括整个行程信息和本次行程信息，所述整个行程信息包括出发站点id、目标站点id和从出发站点指向目标站点的运行方向，所述本次行程信息包括待预测公交车当前位置与目标站点之间的距离；将待预测公交车从出发站点前往目标站点的运行线路作为整个行程，将待预测公交车从当前位置前往目标站点的运行线路作为本次行程。3.根据权利要求2所述的公交到站时刻预测方法，其特征在于，所述实时运行数据还包括待预测公交车从出发站点运动到当前位置等待红绿灯所经历的时长、本次行程的剩余红绿灯个数和整个行程的红绿灯个数中的至少一种数据。4.根据权利要求2所述的公交到站时刻预测方法，其特征在于，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的历史平均载客率和/或出发站点处历史平均上下车时长。5.根据权利要求2所述的公交到站时刻预测方法，其特征在于，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的红绿灯历史等待时间和/或整个行程的红绿灯历史最大等待时间。6.根据权利要求2所述的公交到站时刻预测方法，其特征在于，所述公交车运行数据还包括历史运行数据，所述历史运行数据包括整个行程的历史平均运行速度、整个行程的历史最大运行速度、整个行程的历史平均运行时间和整个行程的历史最大运行时间中的至少一种数据。7.根据权利要求1所述的公交到站时刻预测方法，其特征在于，所述公交到站时刻预测模型采用xgboost模型。8.根据权利要求7所述的公交到站时刻预测方法，其特征在于，在对xgboost模型训练时，对xgboost模型的学习率、迭代次数、回归树最大深度、回归树叶子节点权值、随机采样比例、每个回归树的随机采样占比和叶节点分裂最小损失函数下降值进行参数调优。9.根据权利要求8所述的公交到站时刻预测方法，其特征在于，在参数调优时，采用平均绝对误差和正则项的组合作为得分函数，所述得分函数为：式中，为平均绝对误差，为第i次预测的预测到站时间，y
i
为与对应的
实际到站时间，l为预测次数，dis(
…
,
…
)为两个变量差值的绝对值,为正则项，k为回归树个数，f
j
为第j棵回归树。10.一种公交到站时刻预测装置，其特征在于，包括处理器和存储器，处理器执行存储在存储器中的指令实现权利要求1-9任一项所述的公交到站时刻预测方法。

技术总结
本发明提供了一种公交到站时刻预测方法及装置，属于公交到站时刻预测技术领域。通过车载网联终端和移动通信网络，获取历史运行数据和实时运行数据，建立基于XGBoost模型的公交到站时刻预测模型，采用车辆历史数据对其进行训练和测试，并采用平均绝对误差和正则项的组合作为得分函数，通过交叉验证的方式对公交到站时刻预测模型进行参数调优，从而得到精确度较高的公交到站时刻预测模型；将车辆运行数据输入该公交到站时刻预测模型，可以使预测出的公交车到达目标站点的预测时刻更加准确。的公交车到达目标站点的预测时刻更加准确。的公交车到达目标站点的预测时刻更加准确。

技术研发人员：姚鑫鑫李峰黄正华徐慧田长青肖丹丹马鹏飞
受保护的技术使用者：宇通客车股份有限公司
技术研发日：2021.12.06
技术公布日：2023/6/14

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种大型养路机械施工作业周边配合人员安全预警系统的制作方法 下一篇：验证无人飞行器ADS-B接收器可操作性的制作方法

一种公交到站时刻预测方法及装置与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种公交到站时刻预测方法及装置与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表