一种基于Copula的行程时间分布预测方法及系统

未命名 07-17 阅读:125 评论:0

一种基于copula的行程时间分布预测方法及系统
技术领域
1.本发明涉及智慧交通技术领域,尤其是涉及一种基于copula的行程时间分布预测方法及系统。


背景技术:

2.交通信息是智慧交通系统不可缺少的组成部分,在众多交通信息中,行程时间信息是规划者决策投资交通项目、管理者评估交通运行状态、出行者规划行程方案的重要参考指标。行程时间信息是交通系统人、车、路以及环境各组成部分综合作用的最终表现,能够直观反映交通系统的运行状态。因此能够提供准确且丰富的行程时间信息,对交通系统资源合理配置、辨识和疏解交通堵点以及做出明智的出行选择具有重要的意义。
3.由于交通系统不可避免地存在不确定性,行程时间信息也具有不确定性。大多数文献通过预测行程时间的均值和方差来获得行程时间信息,但行程时间不确定性具有正偏态且长尾的基本特征,单一的均值和方差无法提供完整的行程时间信息。此外,移动互联技术的高速发展使得为出行者提供实时在途交通信息成为可能。因此,智慧交通领域需要充分利用历史在途的行程时间信息,并将行程时间不确定性纳入预测体系中,从而提供准确且丰富的在途行程时间预测信息。
4.针对在途行程时间预测方面,现有技术存在预测模型复杂、需要借助大量数据样本、无法提供丰富的行程时间不确定性信息等缺陷。


技术实现要素:

5.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于copula的行程时间分布预测方法及系统,充分利用在途已经历的实际行程时间,建立基于copula的前后序路段行程时间联合分布,预测未来后序路段的行程时间分布。
6.本发明的目的可以通过以下技术方案来实现:
7.一种基于copula的行程时间分布预测方法,包括以下步骤:
8.获取在途已经历的实际行程时间;
9.将所述在途已经历的实际行程时间输入预测模型,得到预测的后序路段行程时间分布;
10.其中,所述预测模型的构建包括以下步骤:
11.s1、获取历史前序路段-后序路段行程时间数据集,构建前序路段、后序路段行程时间边缘分布;
12.s2、通过步骤s1构建的前序路段、后序路段行程时间边缘分布,建立基于copula的前后序路段行程时间联合分布,通过所建立的前后序路段行程时间联合分布能够得到后序路段的行程时间条件概率分布,该条件概率分布即为预测的后序路段行程时间分布。
13.进一步地,步骤s1中,构建前序路段、后序路段行程时间分布的步骤如下:
14.s101、基于包含m对前序路段-后序路段行程时间数据集t,利用统计分布分别拟合
前序路段、后序路段的行程时间边缘分布;
15.s102、以拟合优度指标为准则,选取最优边缘分布,最优前序路段行程时间边缘分布记为fu(u),最优后序路段行程时间边缘分布记为fv(v)。
16.进一步地,所述统计分布包括参数分布与非参数分布。
17.进一步地,步骤s2中,建立基于copula的前后序路段行程时间联合分布包括以下步骤:
18.s201、基于步骤s102中得到的最优前序路段行程时间边缘分布fu(u)及最优后序路段行程时间边缘分布fv(v),根据copula理论,得到copula概率密度函数的表达式为:
19.c(fu(u),fv(v);θ)
20.其中θ为copula函数的参数空间;
21.s202、采用极大似然法标定copula的相关参数θ,构造对数似然函数为:
[0022][0023]
其中t
ui
代表历史前序路段-后序路段行程时间数据集t中前序路段第i条行程时间观测数据,t
vi
代表后序路段第i条行程时间观测数据;
[0024]
s203、基于步骤s202中标定的copula相关参数θ,根据sklar定理,得到前后序路段行程时间联合分布为:
[0025]
h(u,v;θ)=c(fu(u),fv(v);θ)
[0026]
其中c为参数为θ的copula函数。
[0027]
进一步地,步骤s2中,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布包括以下步骤:
[0028]
s204、记前序路段行程时间为随机变量u,后序路段行程时间为随机变量v,将在途后序路段行程时间分布预测场景转化为求v在u=u时的条件概率问题,即求:
[0029]
p(v≤v|u=u)
[0030]
s205、根据copula理论,将所求条件概率p(v≤v|u=u)通过基于copula的前后序路段行程时间联合分布表达为:
[0031][0032]
则即为在途已经历的实际行程时间为u时,预测的未来后序路段行程时间分布。
[0033]
一种基于copula的行程时间分布预测系统,包括数据获取模块、边缘分布构建模块、联合分布构建模块及预测模块;
[0034]
所述数据获取模块用于获取历史前序路段-后序路段行程时间数据集及获取在途已经历的实际行程时间;
[0035]
所述边缘分布构建模块用于基于所述历史前序路段-后序路段行程时间数据集构建前序路段、后序路段行程时间边缘分布;
[0036]
所述联合分布构建模块基于构建的前序路段、后序路段行程时间边缘分布,建立
基于copula的前后序路段行程时间联合分布;
[0037]
所述预测模块将在途已经历的实际行程时间作为预测模型的输入,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布,该条件概率分布即为预测的后序路段行程时间分布。
[0038]
进一步地,所述边缘分布构建模块中,构建前序路段、后序路段行程时间分布的步骤如下:
[0039]
s101、基于包含m对前序路段-后序路段行程时间数据集t,利用统计分布分别拟合前序路段、后序路段的行程时间边缘分布;
[0040]
s102、以拟合优度指标为准则,选取最优边缘分布,最优前序路段行程时间边缘分布记为fu(u),最优后序路段行程时间边缘分布记为fv(v)。
[0041]
进一步地,所述统计分布包括参数分布与非参数分布。
[0042]
进一步地,所述联合分布构建模块中,建立基于copula的前后序路段行程时间联合分布包括以下步骤:
[0043]
s201、基于步骤s102中得到的最优前序路段行程时间边缘分布fu(u)及最优后序路段行程时间边缘分布fv(v),根据copula理论,得到copula概率密度函数的表达式为:
[0044]
c(fu(u),fv(v);θ)
[0045]
其中θ为copula函数的参数空间;
[0046]
s202、采用极大似然法标定copula的相关参数θ,构造对数似然函数为:
[0047][0048]
其中t
ui
代表历史前序路段-后序路段行程时间数据集t中前序路段第i条行程时间观测数据,t
vi
代表后序路段第i条行程时间观测数据;
[0049]
s203、基于步骤s202中标定的copula相关参数θ,根据sklar定理,得到前后序路段行程时间联合分布为:
[0050]
h(u,v;θ)=c(fu(u),fv(v);θ)
[0051]
其中c为参数为θ的copula函数。
[0052]
进一步地,所述预测模块中,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布包括以下步骤:
[0053]
s204、记前序路段行程时间为随机变量u,后序路段行程时间为随机变量v,将在途后序路段行程时间分布预测场景转化为求v在u=u时的条件概率问题,即求:
[0054]
p(v≤v|u=u)
[0055]
s205、根据copula理论,将所求条件概率p(v≤v|u=u)通过基于copula的前后序路段行程时间联合分布表达为:
[0056][0057]
则即为在途已经历的实际行程时间为u时,预测的未来后序路段行程时间分布。
[0058]
与现有技术相比,本发明具有以下有益效果:
[0059]
本发明提供的在途路段行程时间分布预测方法,能够充分利用在途已经历的实际行程时间对后序行程时间做出有效预测,但对数据集样本量大小的需求并不严格,在数据量较小时仍然可以有效预测。本发明利用copula函数建立前后序路段行程时间联合分布,其对前后序路段边缘分布无特定假设,灵活性较高,计算速度较快,所得到的联合分布一方面能够预测行程时间不确定性分布的完全信息,另一方面还能描述前序-后序路段的相关性关系信息,具有较好应用前景。
附图说明
[0060]
图1是本发明实施例中提供的基于copula的在途路段行程时间分布预测方法流程图;
[0061]
图2是本发明实施例中提供的构建前后序路段行程时间边缘分布流程图;
[0062]
图3是本发明实施例中提供的基于copula的前后序路段行程时间联合分布预测后序路段的行程时间分布流程图;
[0063]
图4是本发明实施例中提供的当前序路段行程时间为其分布中位数时,预测的后序路段行程时间分布示意图;
[0064]
图5是本发明实施例中提供的当前序路段行程时间为其分布上界时,预测的后序路段行程时间分布示意图。
具体实施方式
[0065]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0066]
实施例1
[0067]
针对现有技术中存在的缺陷,本发明提出了一种基于copula的行程时间分布预测方法及系统,其中方法包括以下步骤:
[0068]
获取在途已经历的实际行程时间;
[0069]
将在途已经历的实际行程时间输入预测模型,得到预测的后序路段行程时间分布;
[0070]
如图1所示,为本发明提供的基于copula的在途路段行程时间分布预测模型的构建流程图,包括以下步骤:
[0071]
s1、获取包含m条历史观测前序路段-后序路段行程时间数据集t,并基于此数据集分别构建前序路段、后序路段行程时间边缘分布;
[0072]
s2、通过步骤s1构建的前序路段、后序路段行程时间边缘分布,标定copula函数的相关参数,并建立基于copula的前后序路段行程时间联合分布;
[0073]
将在途已经历的实际行程时间作为预测模型的输入,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布,该条件概率分布即为预测的后序路段未来行程时间分布。
[0074]
如图2所示,步骤s1具体包括:
[0075]
s101、基于获取的历史前序路段-后序路段行程时间数据,利用统计分布分别拟合前序路段、后序路段的行程时间边缘分布,其中统计分布包括参数分布与非参数分布;
[0076]
s102、以拟合优度指标为准则,选取最优边缘分布,最优前序路段行程时间边缘分布记为fu(u),最优后序路段行程时间边缘分布记为fv(v)。
[0077]
如图3所示,步骤s2具体包括:
[0078]
s201、基于步骤s102中得到的前序路段行程时间边缘分布fu(u),后序路段行程时间边缘分布fv(v),根据copula理论,得到copula概率密度函数的表达式为c(fu(u),fv(v);θ),其中θ为copula函数的参数空间;
[0079]
s202、采用极大似然法标定copula的相关参数θ,构造对数似然函数为其中t
ui
代表历史前序路段-后序路段行程时间数据集t中前序路段第i条行程时间观测数据,t
vi
代表后序路段第i条行程时间观测数据;
[0080]
s203、基于步骤s202中标定的copula相关参数θ,根据sklar定理,得到前后序路段行程时间联合分布为h(u,v;θ)=c(fu(u),fv(v);θ),其中c为参数为θ的copula函数;
[0081]
s204、设前序路段行程时间为随机变量u,后序路段行程时间为随机变量v,将在途后序路段行程时间分布预测场景转化为求v在u=u时的条件概率问题,即求p(v≤v|u=u);
[0082]
s205、根据copula理论,将所求条件概率p(v≤v|u=u)通过基于copula的前后序路段行程时间联合分布表达为:
[0083][0084]
则即为在途已经历的实际行程时间为u时,预测的未来后序路段行程时间分布。
[0085]
本实施例基于某城市快速路车牌照系统实际行程时间数据集,验证本发明提供的基于copula的在途路段行程时间分布预测方法的有效性。该数据集包括4条路径(每条路径由2个路段组成,即前序路段和后序路段),涵盖某年12月3日至5日(周二至周四),和12月7日(周六),共4天的行程时间数据,数据采集时间段为早上6:00至10:00。以30分钟为分析时间窗,每条路径每天共有8组数据,4条路径4天共128组数据。其中路段行程时间边缘分布采用核密度估计来拟合,copula函数采用bb7-copula。
[0086]
从图4可以看出,当前序路段行程时间为其分布众数159s时,观测到的后序路段行程时间为{180s,184s,191s,213s,184s,211s,195s,184s,194s,179s,193s},通过基于copula的联合分布可以得到上述观测值的概率依次为{0.19,0.33,0.58,0.96,0.33,0.95,0.71,0.33,0.68,0.17,0.65}。
[0087]
从图5可以看出,当前序路段行程时间为其分布上界445s时,目前后序路段只有一个概率为0.25的行程时间观测值312s。按照本发明的预测结果,后序路段行程时间分布的80
th
分位数可达到647s。由此说明本发明提出的方法可以有效预测在途行程时间分布,提供更丰富的行程时间不确定性信息。
[0088]
此外,图4的预测结果仅依赖于112个样本对的观测数据,图5的预测结果仅依赖于178个样本对的观测数据。对于该城市快速路超过7000pcu/h的通行能力而言,上述样本量规模很小,可获得性较高。由此说明本发明提出的方法对数据集样本规模的需求并不严格,
在数据量较小时仍然可以有效预测,在实际应用中受样本规模的限制较小。
[0089]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

技术特征:
1.一种基于copula的行程时间分布预测方法,其特征在于,包括以下步骤:获取在途已经历的实际行程时间;将所述在途已经历的实际行程时间输入预测模型,得到预测的后序路段行程时间分布;其中,所述预测模型的构建包括以下步骤:s1、获取历史前序路段-后序路段行程时间数据集,构建前序路段、后序路段行程时间边缘分布;s2、通过步骤s1构建的前序路段、后序路段行程时间边缘分布,建立基于copula的前后序路段行程时间联合分布,通过所建立的前后序路段行程时间联合分布能够得到后序路段的行程时间条件概率分布,该条件概率分布即为预测的后序路段行程时间分布。2.根据权利要求1所述的一种基于copula的行程时间分布预测方法,其特征在于,步骤s1中,构建前序路段、后序路段行程时间分布的步骤如下:s101、基于包含m对前序路段-后序路段行程时间数据集t,利用统计分布分别拟合前序路段、后序路段的行程时间边缘分布;s102、以拟合优度指标为准则,选取最优边缘分布,最优前序路段行程时间边缘分布记为f
u
(u),最优后序路段行程时间边缘分布记为f
v
(v)。3.根据权利要求2所述的一种基于copula的行程时间分布预测方法,其特征在于,所述统计分布包括参数分布与非参数分布。4.根据权利要求2所述的一种基于copula的行程时间分布预测方法,其特征在于,步骤s2中,建立基于copula的前后序路段行程时间联合分布包括以下步骤:s201、基于步骤s102中得到的最优前序路段行程时间边缘分布f
u
(u)及最优后序路段行程时间边缘分布f
v
(v),根据copula理论,得到copula概率密度函数的表达式为:c(f
u
(u),f
v
(v);θ)其中θ为copula函数的参数空间;s202、采用极大似然法标定copula的相关参数θ,构造对数似然函数为:其中t
ui
代表历史前序路段-后序路段行程时间数据集t中前序路段第i条行程时间观测数据,t
vi
代表后序路段第i条行程时间观测数据;s203、基于步骤s202中标定的copula相关参数θ,根据sklar定理,得到前后序路段行程时间联合分布为:h(u,v;θ)=c(f
u
(u),f
v
(v);θ)其中c为参数为θ的copula函数。5.根据权利要求4所述的一种基于copula的行程时间分布预测方法,其特征在于,步骤s2中,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布包括以下步骤:s204、记前序路段行程时间为随机变量u,后序路段行程时间为随机变量v,将在途后序路段行程时间分布预测场景转化为求v在u=u时的条件概率问题,即求:
p(v≤v|u=u)s205、根据copula理论,将所求条件概率p(v≤v|u=u)通过基于copula的前后序路段行程时间联合分布表达为:则即为在途已经历的实际行程时间为u时,预测的未来后序路段行程时间分布。6.一种基于copula的行程时间分布预测系统,其特征在于,包括数据获取模块、边缘分布构建模块、联合分布构建模块及预测模块;所述数据获取模块用于获取历史前序路段-后序路段行程时间数据集及获取在途已经历的实际行程时间;所述边缘分布构建模块用于基于所述历史前序路段-后序路段行程时间数据集构建前序路段、后序路段行程时间边缘分布;所述联合分布构建模块基于构建的前序路段、后序路段行程时间边缘分布,建立基于copula的前后序路段行程时间联合分布;所述预测模块将在途已经历的实际行程时间作为预测模型的输入,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布,该条件概率分布即为预测的后序路段行程时间分布。7.根据权利要求6所述的一种基于copula的行程时间分布预测系统,其特征在于,所述边缘分布构建模块中,构建前序路段、后序路段行程时间分布的步骤如下:s101、基于包含m对前序路段-后序路段行程时间数据集t,利用统计分布分别拟合前序路段、后序路段的行程时间边缘分布;s102、以拟合优度指标为准则,选取最优边缘分布,最优前序路段行程时间边缘分布记为f
u
(u),最优后序路段行程时间边缘分布记为f
v
(v)。8.根据权利要求7所述的一种基于copula的行程时间分布预测系统,其特征在于,所述统计分布包括参数分布与非参数分布。9.根据权利要求7所述的一种基于copula的行程时间分布预测系统,其特征在于,所述联合分布构建模块中,建立基于copula的前后序路段行程时间联合分布包括以下步骤:s201、基于步骤s102中得到的最优前序路段行程时间边缘分布f
u
(u)及最优后序路段行程时间边缘分布f
v
(v),根据copula理论,得到copula概率密度函数的表达式为:c(f
u
(u),f
v
(v);θ)其中θ为copula函数的参数空间;s202、采用极大似然法标定copula的相关参数θ,构造对数似然函数为:其中t
ui
代表历史前序路段-后序路段行程时间数据集t中前序路段第i条行程时间观测数据,t
vi
代表后序路段第i条行程时间观测数据;
s203、基于步骤s202中标定的copula相关参数θ,根据sklar定理,得到前后序路段行程时间联合分布为:h(u,v;θ)=c(f
u
(u),f
v
(v);θ)其中c为参数为θ的copula函数。10.根据权利要求9所述的一种基于copula的行程时间分布预测系统,其特征在于,所述预测模块中,利用所建立的前后序路段行程时间联合分布得到后序路段的行程时间条件概率分布包括以下步骤:s204、记前序路段行程时间为随机变量u,后序路段行程时间为随机变量v,将在途后序路段行程时间分布预测场景转化为求v在u=u时的条件概率问题,即求:p(v≤v|u=u)s205、根据copula理论,将所求条件概率p(v≤v|u=u)通过基于copula的前后序路段行程时间联合分布表达为:则即为在途已经历的实际行程时间为u时,预测的未来后序路段行程时间分布。

技术总结
本发明涉及一种基于Copula的行程时间分布预测方法及系统,其中方法包括:利用历史前序路段-后序路段行程时间数据构建前序路段、后序路段的行程时间边缘分布,通过边缘分布标定Copula函数的参数,并以此建立基于Copula的前后序路段行程时间联合分布,以出行者在途已经历的实际行程时间为预测模型的输入,利用基于Copula的前后序路段行程时间联合分布,得到后序路段的行程时间条件概率分布,从而为出行者提供预测的未来后序路段的行程时间分布。本发明充分利用已有的路段行程时间信息,动态地预测行程时间分布,可提供更丰富的行程时间分布信息,协助出行者更好地规划路径及安排行程。程。程。


技术研发人员:许项东 陈瑞雅
受保护的技术使用者:同济大学
技术研发日:2023.03.28
技术公布日:2023/7/6
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐