基于ARMA模型的营销数据处理方法与流程

未命名 10-09 阅读:134 评论:0

基于arma模型的营销数据处理方法
技术领域
1.本发明涉及数据预测技术领域,具体涉及基于arma模型的营销数据处理方法。


背景技术:

2.随着市场竞争加剧,各个企业对营销策略的制定和投放效果的评估越来越重视,对营销数据进行分析可以帮助企业更好地了解广告投放效果、客户行为趋势和市场变化,从而制定更有效的营销策略,因此需要对营销数据分析。而传统的营销数据分析主要通过arma模型对时间序列数据进行动态变化与潜在规律的分析。
3.由于传统的arma模型经常对整体的时间序列采取统一的阶数p与阶数q进行数据预测,但若整体的时间序列的稳定性较差的话,对预测结果会存在较大的干扰,使预测结果不准确;为了得到更加准确的预测效果,本发明提出了一种通过对时间序列分段,获取不同时间段最合适的阶数p与阶数q后,得到每个时间段与最后一个时间段的匹配度,根据匹配度得到最后一个时间段的最佳arma模型,进行数据预测的基于arma模型的营销数据处理方法。


技术实现要素:

4.本发明提供基于arma模型的营销数据处理方法,以解决现有的问题。
5.本发明的基于arma模型的营销数据处理方法采用如下技术方案:
6.本发明一个实施例提供了基于arma模型的营销数据处理方法,该方法包括以下步骤:
7.采集营销数据,对营销数据进行预处理得到时序序列;
8.对时序序列分段得到若干时间段,根据信息量准则得到每个时间段对应arma模型的预测误差量;
9.获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵,获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵的最佳路径,根据距离矩阵与距离矩阵的最佳路径以及预测误差量得到除最后一个时间段以外每个时间段与最后一个时间段的匹配度;根据除最后一个时间段以外每个时间段与最后一个时间段的匹配度得到目标时间段;根据目标时间段得到最后一个时间段最佳的arma模型,根据最后一个时间段最佳的arma模型,进行营销数据处理。
10.优选的,所述对时序序列分段得到若干时间段,包括的具体方法为:
11.从最后一个时序数据开始,每m个时序数据记为一个时间段,得到若干时间段,其中若剩余时序数据不足m时,以实际时序数据数量为一个时间段,m为预设数量。
12.优选的,所述根据信息量准则得到每个时间段对应arma模型的预测误差量,包括的具
13.体方法为:
14.以任意一个时间段为参考时间段,根据赤池信息量准则对参考时间段对应的时序
数据处理得到最佳阶数p与最佳阶数q,根据参考时间段的最佳阶数p与最佳阶数q对参考时间段的下一个时间段对应的时序数据构建对应的arma模型,得到参考时间段下一个时间段的若干预测值;将参考时间段下一个时间段的若干预测值与对应时序数据进行作差,取绝对值,将参考时间段下一个时间段内所有绝对值的累加值记为参考时间段的对应arma模型的预测误差量。
15.优选的,所述根据距离矩阵与距离矩阵的最佳路径以及预测误差量得到除最后一个时
16.间段以外每个时间段与最后一个时间段的匹配度,包括的具体方法为:
[0017][0018]
对于除最后一个时间段以外任意一个时间段,获取该时间段与最后一个时间段的距离矩阵及最佳路径,将距离矩阵中每个数据点的数值记为第一数据值,式中,p表示该时间段与最后一个时间段的匹配度;n表示距离矩阵中最佳路径上数据点的数量;l
t
表示距离矩阵中最佳路径上第t个数据点到距离矩阵中理想对角线的欧式距离值;d
t
表示距离矩阵中最佳路径上第t个数据点的第一数据值;a表示该时间段对应的arma模型的预测误差量。
[0019]
优选的,所述根据除最后一个时间段以外每个时间段与最后一个时间段的匹配度得到
[0020]
目标时间段,包括的具体方法为:
[0021]
将与最后一个时间段匹配度最小的时间段记为目标时间段。
[0022]
优选的,所述根据目标时间段得到最后一个时间段最佳的arma模型,包括的具体方法为:
[0023]
将目标时间段对应的最佳阶数p与q作为最后一个时间段新的最佳阶数p与q,根据最后一个时间段新的最佳阶数p与q得到最后一个时间段最佳的arma模型。
[0024]
本发明的技术方案的有益效果是:传统的arma模型经常对整体的时间序列采取统一的阶数p与阶数q进行数据预测,但若整体的时间序列的稳定性较差的话,对预测结果会存在较大的干扰,使预测结果不准确;为了得到更加准确的预测效果,相较于现有技术,本发明通过对时序数据分段,提高了局部预测的准确性,进而利用局部预测误差量和不同时间段之间的稳定性近似程度值得到不同时间段的匹配度,进而得到最佳局部arma模型,实现了更加准确的局部数据预测。
附图说明
[0025]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0026]
图1为本发明基于arma模型的营销数据处理方法的步骤流程图。
具体实施方式
[0027]
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于arma模型的营销数据处理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0028]
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
[0029]
下面结合附图具体的说明本发明所提供的基于arma模型的营销数据处理方法的具体方案。
[0030]
请参阅图1,其示出了本发明一个实施例提供的基于arma模型的营销数据处理方法的步骤流程图,该方法包括以下步骤:
[0031]
步骤s001:采集营销数据得到时序序列。
[0032]
需要说明的是,传统的营销数据分析主要通过arma模型对时间序列数据进行动态变化与潜在规律的分析,但由于arma模型中p,q值不同,会导致arma模型的预测效果不同,从而影响数据;为了得到更加准确的预测效果,本实施例提出了基于arma模型的营销数据处理方法。
[0033]
具体的,为了实现本实施例提出的基于arma模型的营销数据处理方法,首先需要采集营销数据,具体过程为:获取营销平台在近三天的营业额数据,其中营业额数据每小时记录一次,将所有营业额数据按时间顺序排序后所构成的序列记为时序序列,其中每个营业额数据对应一个时序数据。
[0034]
至此,通过上述方法得到时序序列。
[0035]
步骤s002:对时序序列进行分段得到若干时间段,根据赤池信息量准则得到时间段的预测误差量。
[0036]
需要说明的是,由于传统的arma模型经常对整体的时间序列采取统一的阶数p与阶数q进行数据预测,但若整体的时间序列的稳定性较差的话,对预测结果会存在较大的干扰,使预测结果不准确;因此对时间序列进行分段,分别分析各时间段的最佳阶数p与q,可以使局部时序数据的稳定性增加,有利于提高局部预测的准确度。
[0037]
进一步需要说明的是,仅依靠局部现有的时序数据进行最佳阶数p与q估计时,得到的预测结果会存在一定的误差,为了使预测结果更准确,可以采用预测结果误差最小时对应的阶数,作为局部最佳阶数,以建立arma模型。
[0038]
具体的,将时序序列进行分段,从最后一个时序数据开始,每100个时序数据记为一个时间段,得到若干时间段,其中每个时间段存在多个时序数据,若剩余时序数据不足100时,则以实际时序数据数量为一个时间段;
[0039]
本实施例以任意一个时间段为例进行叙述,根据赤池信息量准则对该时间段对应的时序数据处理得到最佳阶数p与最佳阶数q,根据该时间段的最佳阶数p与最佳阶数q对该时间段的下一个时间段对应的时序数据构建对应的arma模型,得到该时间段下一个时间段的若干预测值,其中该时间段内下一个时间段内每个预测值对应一个时序数据;将该时间段下一个时间段的若干预测值与对应时序数据进行作差,取绝对值,将对应时间段内所有
绝对值的累加值记为该时间段的对应arma模型的预测误差量;其中最后一个时间段下一个时间段的时序数据对应的营业额数据大小为0,赤池信息量准则是公知技术,本实施例不进行叙述。
[0040]
至此,通过上述方法得到所有时间段对应的arma模型的预测误差量。
[0041]
步骤s003:根据时间段之间的距离矩阵与时间段的预测误差量得到时间段与最后一个时间段的匹配度,根据匹配度得到目标时间段,根据目标时间段得到最佳的arma模型,进行营销数据预测。
[0042]
需要说明的是,由于在对未来营销数据进行预测时,可以根据最后一个时间段对应的时序数据对未来营销数据进行预测;由于最后一个时间段的预测误差量并不一定是实际最小的,导致预测结果的准确性并不高;为了使最后一个时间段的预测误差量为最小的预测误差量,可以通过计算除最后一个时间段外其他时间段的时序数据与最后一个时间段的时序数据之间的近似程度,根据近似程度得到最后一个时间段与其他各时间段的匹配度,根据匹配度得到与最后一个时间段最匹配的时间段,并将与最后一个时间段最匹配的时间段对应的最佳阶数p与q作为最后一个时间段的最佳阶数p与q,得到最后一个时间段新的arma模型,从而提高预测结果的准确性。
[0043]
进一步需要说明的是,在计算除最后一个时间段外其他各时间段的时序数据与最后一个时间段的时序数据之间的近似程度时,可以使用dtw匹配算法得到两个时间段的近似程度;但若直接使用dtw匹配算法计算两个时间段的近似程度,由于两个时间段对应的时序数据是平行关系,会得到较大的距离值,从而导致dtw无法进行有效的近似程度的计算;又因处于平行关系的两个时间段的时序数据变化趋势相似,具有近似的稳定程度,所以两个时间段对应的最佳阶数p与q差异不大,所以可以根据两个时间段的时序数据稳定程度的近似性,得到与最后一个时间段稳定程度最近似的时间段,作为与最后一个时间段最匹配的时间段。
[0044]
更进一步需要说明的是,在进行两个时间段的时序数据稳定程度的近似性判断时,若两个时间段对应的时序数据在dtw匹配算法的距离矩阵上的最佳路径,越贴近距离矩阵中从左下到右上的理想对角线,则两个时间段对应时序数据的稳定程度越近似;但由于存在距离矩阵中最佳路径与对角线的接近位置对应的数值仍然可能较大的情况,所以会对两个时间段对应时序数据稳定程度的近似性判断产生干扰,需要进行抗干扰处理。
[0045]
另外需要说明的是,在进行抗干扰处理时,可以通过获取两个时间段对应的距离矩阵中最佳路径上各个数据点到理想对角线的欧式距离值,若欧式距离值越小,则表示两个时间段的时序数据变化越近似,则最后一个时间段外其他各时间段对应的预测误差量作为最后一个时间段对应的预测误差量越合适,即使最佳路径上对应的部分数值较大,但是由于时序数据变化近似,稳定程度比较近似,所以原本位置的数据应当更小,从而排除最后一个时间段外其他各时间段的时序数据与最后一个时间段的时序数据进行稳定程度的近似性判断时的干扰。
[0046]
具体的,本实施例以除最后一个时间段外其他任意一个时间段为例进行叙述,获取该时间段时序数据与最后一个时间段时序数据的距离矩阵,获取距离矩阵在dtw算法中的最佳路径,将距离矩阵中从左下到右上的对角线记为理想对角线,其中距离矩阵和其对应的最佳路径是dtw算法的公知内容,本实施例不进行叙述。
[0047]
进一步的,将距离矩阵中每个数据点的数值记为第一数据值,根据第一数据值得到该时间段与最后一个时间段的匹配度,其中该时间段与最后一个时间段匹配度的计算公式为:
[0048][0049]
式中,p表示该时间段与最后一个时间段的匹配度,若匹配度越小,则该时间段与最后一个时间段对应的稳定程度越近似,预测误差越小;n表示距离矩阵中最佳路径上数据点的数量;l
t
表示距离矩阵中最佳路径上第t个数据点到距离矩阵中理想对角线的欧式距离值,若欧式距离值越小,则在该时间段对应的时序数据与最后一个时间段对应时序数据中,第t个数据点对应的两个时序数据的变化越近似,稳定程度越近似;d
t
表示距离矩阵中最佳路径上第t个数据点的第一数据值,第一数据值越大,则在该时间段对应的时序数据与最后一个时间段对应时序数据中,第t个数据点对应的两个时序数据的差值绝对值越大;a表示该时间段对应的arma模型的预测误差量。
[0050]
获取除最后一个时间段外其他每个时间段与最后一个时间段的匹配度。
[0051]
进一步的,将与最后一个时间段匹配度最小的时间段记为目标时间段,将目标时间段对应的最佳阶数p与q作为最后一个时间段新的最佳阶数p与q,根据最后一个时间段新的最佳阶数p与q得到最后一个时间段最佳的arma模型;依据该arma模型进行未发生时段下的一段营销数据预测,完成最终的arma模型的营销数据预测处理,得到更为准确的arma模型的营销数据预测结果。
[0052]
至此,本实施例完成。
[0053]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.基于arma模型的营销数据处理方法,其特征在于,该方法包括以下步骤:采集营销数据,对营销数据进行预处理得到时序序列;对时序序列分段得到若干时间段,根据信息量准则得到每个时间段对应arma模型的预测误差量;获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵,获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵的最佳路径,根据距离矩阵与距离矩阵的最佳路径以及预测误差量得到除最后一个时间段以外每个时间段与最后一个时间段的匹配度;根据除最后一个时间段以外每个时间段与最后一个时间段的匹配度得到目标时间段;根据目标时间段得到最后一个时间段最佳的arma模型,根据最后一个时间段最佳的arma模型,进行营销数据处理。2.根据权利要求1所述基于arma模型的营销数据处理方法,其特征在于,所述对时序序列分段得到若干时间段,包括的具体方法为:从最后一个时序数据开始,每m个时序数据记为一个时间段,得到若干时间段,其中若剩余时序数据不足m时,以实际时序数据数量为一个时间段,m为预设数量。3.根据权利要求1所述基于arma模型的营销数据处理方法,其特征在于,所述根据信息量准则得到每个时间段对应arma模型的预测误差量,包括的具体方法为:以任意一个时间段为参考时间段,根据赤池信息量准则对参考时间段对应的时序数据处理得到最佳阶数p与最佳阶数q,根据参考时间段的最佳阶数p与最佳阶数q对参考时间段的下一个时间段对应的时序数据构建对应的arma模型,得到参考时间段下一个时间段的若干预测值;将参考时间段下一个时间段的若干预测值与对应时序数据进行作差,取绝对值,将参考时间段下一个时间段内所有绝对值的累加值记为参考时间段的对应arma模型的预测误差量。4.根据权利要求1所述基于arma模型的营销数据处理方法,其特征在于,所述根据距离矩阵与距离矩阵的最佳路径以及预测误差量得到除最后一个时间段以外每个时间段与最后一个时间段的匹配度,包括的具体方法为:对于除最后一个时间段以外任意一个时间段,获取该时间段与最后一个时间段的距离矩阵及最佳路径,将距离矩阵中每个数据点的数值记为第一数据值,式中,p表示该时间段与最后一个时间段的匹配度;n表示距离矩阵中最佳路径上数据点的数量;l
t
表示距离矩阵中最佳路径上第t个数据点到距离矩阵中理想对角线的欧式距离值;d
t
表示距离矩阵中最佳路径上第t个数据点的第一数据值;a表示该时间段对应的arma模型的预测误差量。5.根据权利要求1所述基于arma模型的营销数据处理方法,其特征在于,所述根据除最后一个时间段以外每个时间段与最后一个时间段的匹配度得到目标时间段,包括的具体方法为:将与最后一个时间段匹配度最小的时间段记为目标时间段。6.根据权利要求3所述基于arma模型的营销数据处理方法,其特征在于,所述根据目标时间段得到最后一个时间段最佳的arma模型,包括的具体方法为:
将目标时间段对应的最佳阶数p与q作为最后一个时间段新的最佳阶数p与q,根据最后一个时间段新的最佳阶数p与q得到最后一个时间段最佳的arma模型。

技术总结
本发明涉及数据预测技术领域,具体涉及基于ARMA模型的营销数据处理方法,包括对时序序列分段得到若干时间段,根据信息量准则得到每个时间段对应ARMA模型的预测误差量;获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵,获取除最后一个时间段以外每个时间段与最后一个时间段的距离矩阵的最佳路径,根据距离矩阵与距离矩阵的最佳路径得到除最后一个时间段以外每个时间段与最后一个时间段的匹配度;根据匹配度得到目标时间段;根据目标时间段得到最后一个时间段最佳的ARMA模型,根据最后一个时间段最佳的ARMA模型,进行营销数据处理。本发明提高了局部预测的准确性,实现了更加准确的局部数据预测。实现了更加准确的局部数据预测。实现了更加准确的局部数据预测。


技术研发人员:黎伟琛 罗士伟 杜阳天
受保护的技术使用者:杭州火奴数据科技有限公司
技术研发日:2023.07.17
技术公布日:2023/10/7
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐