一种春节快递包裹量的预测方法及装置与流程
未命名
10-18
阅读:137
评论:0
1.本发明涉及软件技术领域,具体涉及一种春节快递包裹量的预测方法及装置。
背景技术:
2.快递包裹的业务量预测对企业有重要的意义。快递业务量通常呈现周度,月度和年度的周期性,大促效应以及国家法定节日的特征,在某些特定日期时间范围,比如法定节假日中春节是一个重要的特殊假日,春节期间包裹量会远远低于平日的量,当前的模型时序分解和自回归等传统模型很难捕捉到特殊假日期间快递包裹量呈现u形的特征,快递企业参与电商平台的春节不打烊活动,业务量的准确预测对企业的运营有重要的经济意义。
3.预估快递行业包裹量对企业运营上的科学决策具有重要意义,通常prophet(这一种大规模时间序列预测模型),arima(autoregressive integrated moving average model,差分整合移动平均自回归模型,又称整合移动平均自回归模型,是时间序列预测分析方法之一)以及时间序列特征化机器学习模型等用于大促和日常的包裹量预测,基于时间序列分解和时序回归的建模思路很难满足春节期间这种特定日期时间范围内包裹量的准确度预测的要求。
技术实现要素:
4.有鉴于此,本发明的目的在于提供一种春节快递包裹量的预测方法及装置,以解决现有技术中春节期间对包裹量预测准确度不高的问题。
5.根据本发明实施例的第一方面,一种春节快递包裹量的预测方法,包括:
6.获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;
7.将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;
8.其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。
9.进一步的,所述将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据,之前,还包括:
10.对所述需求数据进行归一化处理。
11.进一步的,所述预测模型的训练过程包括:
12.获取预设第一数量的数据样本和与每一数据样本对应的样本标识作为训练样本;
13.其中,所述每一数据样本包括:春节前预设时间内的日包裹量数据和用于表征该春节期间否参加平台商家春节不打烊的标识数据;
14.所述与每一数据样本对应的样本标识为基于与所述数据样本对应的春节期间的日包裹量生成的;
15.基于所述数据样本对预先构建的深度学习模型进行训练,得到所述预测模型。
16.进一步的,获取未作为数据样本的往年春节前预设时间内的日包裹量数据作为验证数据;
17.将所述验证数据输入所述预测模型,得到预测结果;
18.计算所述预测结果和与所述验证数据对应的春节期间日包裹量数据之间的相似度;
19.若所述相似度低于预设值,则对所述预测模型进行重新训练。
20.进一步的,所述深度学习模型为lstm模型。
21.根据本发明实施例的第二方面,一种快递包裹量的预测装置,包括:
22.获取模块,用于获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;
23.预测模块,用于将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。
24.本发明的实施例提供的技术方案可以包括以下有益效果:
25.本发明通过获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊,如此获取更多数据作为预测模型的预测数据,所述预测模型为深度学习模型能够较现有技术更准确的预测包裹量数据,降低预测误差,提高预测准确度。
26.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
27.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
28.图1是根据一示例性实施例示出的一种春节快递包裹量的预测方法的流程图;
29.图2是根据一示例性实施例示出的一种春节快递包裹量的预测装置的示意框图;
30.图3是根据一示例性实施例示出的一种春节快递包裹量的预测方法预测模型的流程图;
31.图4是根据一示例性实施例示出的lstm模型具体结构。
32.图中:1-获取装置;2-预测装置。
具体实施方式
33.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
34.参考图1,图1是根据一示例性实施例示出的一种春节快递包裹量的预测方法的流程图,如图1所示,该方法具体可以包括如下步骤:
35.s11步骤:获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日
包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;
36.s12步骤:将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。
37.在具体实践中,在s11步骤中,所述需求数据为春节前预设时间内的日包裹量数据,例如:选取2018.01.01到2022.01.22的日包裹量数据,预测日期为2022.01.23到2022.01.09的包裹量的预测结果,将所述需求数据和标识数据输入所述预测模型,经过lstm模型的深度学习训练得到预测结果。
38.具体的,若预测2022年的春节期间的日包裹量数据,假设预设时间为春节前[t-40:t-10]天,春节前[t-10:t-7]天,春节前[t-7]天,春节后[t+7]天,春节后[t+7:t+9]天,分别表征的含义为:春节前30天,春节前10天至春节前7天,春节前7天,春节后7天至春节后9天。那么,如果输入lstm模型的需求数据为2018年、2019年、2020年、2021年四年的春节前[t-40:t-10]天,春节前[t-10:t-7]天,春节前[t-7]天,春节后[t+7]天,春节后[t+7:t+9]天的日包裹量数据,lstm模型训练后,输出2022年春节前[t-40:t-10]天,春节前[t-10:t-7]天,春节前[t-7]天,春节后[t+7]天,春节后[t+7:t+9]天的日包裹量数据作为预测结果。
[0039]
值得说明的是,所述标识数据可以识别所述需求数据中的预设时间的所在日是否参加平台商家春节不打烊,若参加平台商家春节不打烊,即参加促销活动,所述标识数据为1;若不参加平台商家春节不打烊,即不参加促销活动,所述标识数据为0。
[0040]
可以理解的是,所在日参加促销活动产生的包裹量肯定比不参加促销活动产生的包裹量要多,也就是说,参加平台商家春节不打烊代表所在日的包裹量比不参加平台商家春节不打烊所在日的包裹量要多。在模型训练中,所述标识数据可以识别所述需求数据中的预设时间是否所述标识数据,通过识别所述标识数据选取所述需求数据中参加或不参加促销活动的春节日包裹量数据,便于模型更准确的获取需求数据。
[0041]
在s12步骤“将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型”中,具体的,所述预测模型为lstm模型,lstm,即long short-term memory,长短期记忆网络,是一种时间循环神经网络,是为了解决一般的rnn(循环神经网络)存在的长期依赖问题而专门设计出来的,所有的rnn都具有一种重复神经网络模块的链式形式。是建立在rnn上的一种新型深度机器学习神经网络,在输入、反馈与防止梯度爆发之间建立一个了长时间的时滞。这个架构强制其在特殊记忆单元中的内部状态保持一个持续误差流,这样一来梯度既不会爆发也不会消失。在这个模型中lstm单元包含一个尝试将信息储存较久的存储单元。这个记忆单元的入口被一些特殊的门控制,被控制的功能包括保存、写入和读取操作。这些门都是逻辑单元,它们不会将自己的行为作为输入值发送给其他神经元,而是负责在神经网络的其它部分与记忆单元连接的边缘处设定权值。这个记忆单元是一个线型的神经元,有自体内部连接。具体来说就是其在每一个神经元内部加入了三个门,分别是输入门、输出门和忘记门。用来选择性记忆反馈的误差函数随梯度下降的修正参数。当忘记门被打开时(如1中的行为),自己连接权值为1,记忆单元将内容写入自身。当忘记门输出为0时,记忆单元会清除之前的内容。输出门允许在输出值为1的时候,神经网络的其它部分将内容记入记忆单元,而输入门则允许在输出值为1的时候,神经
网络的其它部分读取记忆单元。
[0042]
lstm模型具体结构如图4所示:
[0043]
t时刻lstm网络向前传播的除了隐藏层的状态h
t
还多了单元状态c
t
,遗忘门的作用是以一定的概率矩阵控制上一时刻的隐藏层状态。遗忘门的输出f
t
由上一时刻的隐藏层状态h
t-1
和当前时刻的输入x
t
共同决定:
[0044]ft
=σ(wfh
t-1
+ufx
t
+bf)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0045]
其中,wf、uf和bf为遗忘门相关的权重和偏置矩阵,σ为sigmoid函数。
[0046]
输入门的作用是控制当前时刻的输入。由两部分组成:
[0047]it
=σ(w
iht-1
+uix
t
+b
t
)
ꢀꢀ
(2)
[0048]at
=tanh(wah
t-1
+uax
t
+ba)
ꢀꢀꢀꢀ
(3)
[0049]
其中wi、wa、ua、ui、ba和bf为输入门相关的权重和偏置矩阵;
[0050]
lstm中单元状态c
t
的更新由输入门和遗忘门两部分结果组成:
[0051]ct
=c
t-1
⊙ft
+i
t
⊙at
ꢀꢀꢀꢀꢀ
(4)
[0052]
其中
⊙
为哈达玛积。
[0053]
最后,lstm中的输出门的输出为:
[0054]ot
=σ(w
oht-1
+uox
t
+bo)
ꢀꢀ
(5)
[0055]
隐藏层h
t
的更新为:
[0056]ht
=o
t
⊙
tanh(c
t
)
ꢀꢀ
(6)
[0057]
其中,tanh是双曲正切。
[0058]
本实施例使用的lstm模型较其他模型有更强的拟合能力,预测结果更准确。
[0059]
可以理解的是,通过获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;如此获取更多数据作为预测模型的预测数据,所述预测模型为深度学习模型能够较现有技术更准确的预测包裹量数据,降低预测误差,提高预测准确度。
[0060]
优选的,所述将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据,之前,还包括:对所述需求数据进行归一化处理。
[0061]
值得说明的是,归一化是一种简化计算的方式,为了数据处理方便提出来的,把数据映射到0~1范围之内处理,更加便捷快速,应该归到数字信号处理范畴之内。使后面数据处理的方便,保证程序运行时收敛加快。
[0062]
优选的,所述预测模型的训练过程包括:
[0063]
获取预设第一数量的数据样本和与每一数据样本对应的样本标识作为训练样本;
[0064]
其中,所述每一数据样本包括:春节前预设时间内的日包裹量数据和用于表征该春节期间否参加平台商家春节不打烊的标识数据;
[0065]
所述与每一数据样本对应的样本标识为基于与所述数据样本对应的春节期间的日包裹量生成的;
[0066]
基于所述数据样本对预先构建的深度学习模型进行训练,得到所述预测模型。
[0067]
在具体实践中,预先训练预测模型,其中,预测模型的训练过程包括:获取训练样本,其中,训练样本包括数据样本和样本标识,可选的,数据样本取第一数量,样本标识为基于第一数量对应的春节期间的日包裹量生成。
[0068]
将训练样本输入至预先构建的深度学习模型进行训练,当进行训练的次数达到预设次数阈值,或者,训练过程中的网络损失值小于预设损失值阈值,则训练过程停止,得到预测模型。
[0069]
优选的,获取未作为数据样本的往年春节前预设时间内的日包裹量数据作为验证数据;
[0070]
将所述验证数据输入所述预测模型,得到预测结果;
[0071]
计算所述预测结果和与所述验证数据对应的春节期间日包裹量数据之间的相似度;
[0072]
若所述相似度低于预设值,则对所述预测模型进行重新训练。
[0073]
在具体实践中,选取往年春节前预设时间内的日包裹量数据作为所述验证数据,例如:选取2018.01.01到2022.01.22的日包裹量数据,预测日期为2022.01.23到2022.01.09的包裹量的预测结果,将所述验证数据输入所述预测模型,经过lstm模型的深度学习训练得到预测结果。
[0074]
具体的,假设所述验证数据的春节前预设时间为春节前[t-40:t-10]天,春节前[t-10:t-7]天,春节前[t-7]天,春节后[t+7]天,春节后[t+7:t+9]天,分别表征:春节前30天,春节前10天至春节前7天,春节前7天,春节后7天至春节后9天,那么,如果输入lstm模型的验证数据为2022年春节前[t-40:t-10]天的日包裹量数据,lstm模型训练后,输出2022年春节前[t-10:t-7]天的日包裹量数据作为预测结果;所述预测结果与往年中的任意一年对应的春节日包裹量数据进行对比,优选往年中最后一年的数据,即上述例如中2021年春节前春节前[t-40:t-10]天作为验证数据进行比较,比较两者之间的相似度;若所述相似度低于预设值,则对所述预测模型进行重新训练。
[0075]
如果输入lstm模型的验证数据为2022年春节前[t-10:t-7]天的日包裹量数据,lstm模型训练后,输出2022年春节前[t+7]天的日包裹量数据作为预测结果,优选2021年春节前[t+7]天的日包裹量数据作为验证数据与当前预测结果进行比较,比较两者之间的相似度;若所述相似度低于预设值,则对所述预测模型进行重新训练。
[0076]
如果输入lstm模型的验证数据为2022年春节前[t+7]天的日包裹量数据,lstm模型训练后,输出2022年春节前[t+7:t+9]天的日包裹量数据作为预测结果,优选2021年春节前[t+7:t+9]天的日包裹量数据作为验证数据与当前预测结果进行比较,比较两者之间的相似度;若所述相似度低于预设值,则对所述预测模型进行重新训练。
[0077]
如此,预测出2022年春节期间的快递包裹量。
[0078]
值得说明的是,上述预设时间的设定是根据历史数据经验总结出来的,研究发现仅考虑春节前后7天的特征的预测会出现预测断层的下降,不符合实际的平滑数据特征。而对上述这些时间段的抓取最能准确对应春节期间快递包裹量呈现u形的特征。另外,预测结果实际发生后直接存储起来用来作为需求数据使用。
[0079]
可以理解的是,lstm模型按照预设时间如此训练输出的预测结果能够准确的预测包裹量数据,降低预测误差。
[0080]
参照图2,图2是一种快递包裹量的预测装置的示意框图,如图2所示,预测装置包括:
[0081]
获取模块1,用于获取需求数据和标识数据,所述需求数据包括:春节前预设时间
内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;
[0082]
预测模块2,用于将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。
[0083]
可以理解的是,通过获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;如此获取更多数据作为预测模型的预测数据,所述预测模型为深度学习模型能够较现有技术更准确的预测包裹量数据,降低预测误差,提高预测准确度。
[0084]
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0085]
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
[0086]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0087]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0088]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0089]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0090]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0091]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结果、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结果、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0092]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例
性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种春节快递包裹量的预测方法,其特征在于,包括:获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。2.根据权利要求1所述的方法,其特征在于,所述将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据,之前,还包括:对所述需求数据进行归一化处理。3.根据权利要求1所述的方法,其特征在于,所述预测模型的训练过程包括:获取预设第一数量的数据样本和与每一数据样本对应的样本标识作为训练样本;其中,所述每一数据样本包括:春节前预设时间内的日包裹量数据和用于表征该春节期间否参加平台商家春节不打烊的标识数据;所述与每一数据样本对应的样本标识为基于与所述数据样本对应的春节期间的日包裹量生成的;基于所述数据样本对预先构建的深度学习模型进行训练,得到所述预测模型。4.根据权利要求3所述的方法,其特征在于,包括:获取未作为数据样本的往年春节前预设时间内的日包裹量数据作为验证数据;将所述验证数据输入所述预测模型,得到预测结果;计算所述预测结果和与所述验证数据对应的春节期间日包裹量数据之间的相似度;若所述相似度低于预设值,则对所述预测模型进行重新训练。5.根据权利要求1所述的方法,其特征在于,包括:所述深度学习模型为lstm模型。6.一种快递包裹量的预测装置,其特征在于,包括:获取模块,用于获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;预测模块,用于将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型。
技术总结
本发明涉及软件技术领域,具体涉及一种春节快递包裹量的预测方法及装置。该预测方法通过获取需求数据和标识数据,所述需求数据包括:春节前预设时间内的日包裹量数据,所述标识数据用于表征是否参加平台商家春节不打烊;将所述需求数据和标识数据输入预先训练的预测模型,生成预测结果,所述预测结果包括预测日包裹量数据;其中,所述预测日包裹量数据为春节期间的日包裹量;所述预测模型为深度学习模型,以解决现有技术中春节期间对包裹量的预测准确度不高的问题。测准确度不高的问题。测准确度不高的问题。
技术研发人员:赵江江 王帅 蒋国友
受保护的技术使用者:上海中通吉网络技术有限公司
技术研发日:2023.02.28
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
