快消商品多因子销量预测系统的制作方法
未命名
10-09
阅读:127
评论:0
1.本发明涉及商品销量预测技术领域,具体为快消商品多因子销量预测系统。
背景技术:
2.快消品牌随着线上线下业务场景日益丰富,在进行不同渠道、门店的库存调整、促销策略及新店规划等工作时,需要参考多场景下的门店销量预测结果作为数据支持,而预测销量结果则需要综合考虑商品、交易、会员等主要影响因素,以及周边客流、节假日、竞品等额外影响因子,快消商品多因子销量预测系统是通过对快消类商品销量及销量影响因子进行建模的,可快速复用于不同快消商品场景的高可解释性和拓展性的销量预测模型,该模型方案能为品牌方提供多种颗粒度下的较高准确率的商品销量预测结果,有助于其详细了解销量走势及影响因子的变化情况,为品牌内部策略规划降本增效,现有的传统销量预测工作大多使用商业分析方法,基于历史同阶段的销量情况、行业分析报告及业务专家评估进行粗粒度预测,且现有的快消商品销量预测模型大多数也是参考历史商品销量数据,采用时间序列或神经网络模型预测未来销量结果;
3.但是当前现有的传统销量预测方法对于较细颗粒度预测目标难以高效实施,人员成本和时间成本较大,在多影响因子的复杂现实场景下,难以确保对各方面销量影响因素的完备考虑,预测准确性较大程度上依赖于业务专家的专业能力,同时,仅使用历史销量数据建模无法对关键销量影响因子进行充分的描述,且当因子发生较大变化时,模型难以得到合理准确的预测结果,此外,在使用神经网络等深度学习模型在模型解释性上具有较大局限性,难以为品牌方提供详实的预测流程阐述,再者,受限于模型结构,在现实业务场景中难以快速实现功能拓展迭代。
技术实现要素:
4.本发明提供快消商品多因子销量预测系统,可以有效解决上述背景技术中提出传统销量预测方法对于较细颗粒度预测目标难以高效实施,人员成本和时间成本较大,在多影响因子的复杂现实场景下,难以确保对各方面销量影响因素的完备考虑,预测准确性较大程度上依赖于业务专家的专业能力,同时,仅使用历史销量数据建模无法对关键销量影响因子进行充分的描述,且当因子发生较大变化时,模型难以得到合理准确的预测结果,此外,在使用神经网络等深度学习模型在模型解释性上具有较大局限性,难以为品牌方提供详实的预测流程阐述,再者,受限于模型结构,在现实业务场景中难以快速实现功能拓展迭代的问题。
5.为实现上述目的,本发明提供如下技术方案:快消商品多因子销量预测系统,通过以商品、销量、会员组成的关键数据为预测主体,确定多种影响因子来构建快消商品的销量预测模型,为品牌方在库存调整、促销策略、新店规划的业务场景中提供数据参考;
6.主要基于快消品牌门店类型构建不同销量预测模型方案,在同一模型方案下,依据门店销售渠道、会员分群及商品类型三个维度拆分结果分别进行独立建模,具体如下实
现步骤:
7.s1、根据开业时长划分成门店类别;
8.s2、根据门店类别分别采取预测模型方案;
9.s3、对商品预测结果的准确性进行评估。
10.2.根据权利要求1所述的快消商品多因子销量预测系统,其特征在于:所述s1中,根据开业时长划分成门店类别主要是指根据门店的开业时长来将门店划分成两类:一类是开业时长满足特定时间跨度的门店,将该类型的门店定义为成熟门店,对于成熟门店采用多因子销量预测模型方案,除成熟门店之外的其余门店均作为新门店,对于新门店则采用冷启动预测方案;
11.对成熟门店,使用移除额外影响因素后的销量数据构建基准预测模型,对门店周边客流信息、竞品信息、节假日/促销日情况、疫情情况、折扣情况、门店营业模式、商品品类占比和销售渠道占比8类销量影响因子进行影响系数建模,并对基准销量预测值进行调整修正,最终生成该门店的销量预测结果;
12.对新门店,选定销量近似成熟门店的历史数据作为参考门店,采用参考门店订单量的历史销量趋势和预测销量季节性分解结果叠加生成门店销量预测结果。
13.根据上述技术方案,所述s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:
14.对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:
15.y(t|sto,chl,mbr,prd)
16.=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
17.·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
18.·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
19.·
d(t|sto,chl,mbr,prd)
20.在上式中:
21.y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;
22.b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。
23.根据上述技术方案,所述s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:
24.对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:
25.y(t|sto,chl,mbr,prd)
26.=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
27.·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
28.·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
29.·
d(t|sto,chl,mbr,prd)
30.在上式中:
31.y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;
32.b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。
33.根据上述技术方案,所述影响因子共有8类,具体包括:
34.1)门店周边客流影响因子模型f(t|sto):门店sto周边客流在t时刻对预测销量修正值;
35.2)竞对信息影响因子模型r(t|sto):门店sto周边竞对信息在t时刻对预测销量修正值;
36.3)门店营业模型m(t|sto,chl):在门店为sto、渠道为chl条件下,营业模式在t时刻对销量掩模值;
37.4)疫情影响模型c(t|sto,mbr):在门店为sto、客群为mbr条件下,疫情在t时刻对门店总销量的影响系数;
38.5)渠道间占比模型p1(t|sto,mbr):在门店为sto、客群为mbr条件下,渠道间占比模型输出的t时刻渠道chl占总销量的比重;
39.6)商品类别占比模型p2(t|sto,chl,mbr):在门店为sto、渠道为chl、客群为mbr条件下,品类占比模型输出的t时刻商品类型prd占总销量的比重;
40.7)节假日/促销日影响模型h(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,节假日/促销日在t时刻对销量影响系数;
41.8)折扣因子影响模型d(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,折扣力度在t时刻对销量影响系数。
42.根据上述技术方案,所述s2中,对于成熟门店具体包括销量基准预测模型、销量影响因子模型、门店周边客流影响因子模型、竞对信息影响因子模型、门店营业模型、疫情影响模型、渠道间占比模型、商品类别占比模型、节假日/促销日影响模型和折扣因子影响模型;
43.所述销量基准预测模型b(t|sto,chl,mbr,prd),具体指该模块依据门店、渠道、客群及商品类型的维度拆分组合结果,对特定组合颗粒度下历史销量值,使用prophet时序预测模型对节假日、疫情的销量显著变化时段进行异常值填补,具体填补方案依据对应客群的销量表现设计不同策略步骤;
44.总销量预测模型使用上述异常填补后历史销量,使用prophet、sarima的时序预测模型输入特定时长历史数据,预测某时间跨度下的未来销量,从而进行销量基准值的预测工作;
45.所述销量影响因子模型具体指各影响因子依据对应数据源,参考因子对销量影响情况,分别进行数据处理及建模,为保证影响因子模型能在上线环境下稳定进行影响系数的计算,部分非突发性的影响因子,将采用时序模型预测或函数拟合的方式预测未来特定
时段内的因子变化情况,并使用预测值进行未来时段因子影响系数的计算工作;
46.所述门店周边客流影响因子模型f(t|sto)具体指:基于客流数据,采用层级聚类算法对每家门店选取相关性最高变量,并进行基于决策树结构的客流影响因子模型的构建,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果;
47.所述竞对信息影响因子模型r(t|st0)具体指:通过定义特定时段内品牌门店竞争指数,显性描述该门店在与周边竞对品牌门店竞争中理论能分得的市场份额,竞争指数计算公式如下:
[0048][0049]
其中:i
(sto)
(t):为门店sto在t时刻竞对指数值,为t时刻该快消品牌brand在特定地理范围内的权重系数,为门店sto在t时刻周边1km范围内各竞对品牌门店的权重和;
[0050]
若对于特定门店,其竞争指数与门店填补后的总订单量之间存在一定的相关性,则认为该门店订单量与竞争指数相关,且对该门店构建基于决策树结构的竞争指数影响因子模型,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终预测结果;
[0051]
所述门店营业模型m(t|sto,chl)具体指:在排除疫情和节假日影响后的各门店每周的开闭店习惯,基于门店销量数据分析结果,将门店的周营业情况划分为若干类别,根据具体门店在观测点前所呈现出的周营业模式,通过计算观测区间内每种周营业模式的总权重得分,将得分最高的营业模式定为预测区间内所使用的营业模式,并由该模式推断门店未来开闭店的情况;
[0052]
营业模式最终预测结果将对订单量进行掩膜处理,即于关店日将销量预测值置零,其他情况不对预测值进行调整。
[0053]
根据上述技术方案,所述疫情影响模型c(t|sto,mbr)主要依据特定区域内疫情时段的累计感染人数及实际封控情况,建立疫情模式并对订单量预测值进行调整,该模块主要由以下两个阶段的预测流程组成:
[0054]
疫情封控情况预测:使用微分方程时滞系统模型,基于历史确诊和无症状感染人数对当前疫情是否导致封控以及发生封控后解封时间进行预测;
[0055]
全渠道销量调整:基于疫情防控预测结果及近期订单量变化情况,采用函数拟合方法,对特定门店、客群的全渠道销量预测结果进行调整;
[0056]
所述渠道间占比模型p1(t|sto,mbr)采用调整后的全渠道预测值和各渠道真实值构造训练数据集,以最小化两个渠道的加权损失为目标,使用梯度下降的方式获取最优的占比时序;
[0057]
在预测阶段则通过对最优占比序列进行趋势化分解,分别对趋势序列和残差序列进行拟合,其中趋势序列采用函数拟合方法,残差部分则使用prophet、sarima时序预测模型进行建模预测;
[0058]
所述商品类别占比模型p2(t|sto,chl,mbr)主要对于特定门店、客群类型,通过使用prophet、sarima的时序预测模型分别拟合各快消商品类别销量对总销量占比,将该占比
叠加至整体销量预测结果并计算获得特定商品类别的销量预测结果;
[0059]
所述节假日/促销日影响模型h(t|sto,chl,mbr,prd)主要基于业务情况及数据分析结果选定对快消商品销量存在显著影响的节假日/促销日日期,使用时间序列聚类算法,对特定渠道、客群类型和快消商品类别的条件下,各门店销量受某一节假日影响情况进行聚类操作;
[0060]
在同一聚类簇内,基于该节假日时段内原始销量与填补后销量的数据差值来计算影响比例,使用简单函数进行平滑并获得此聚类簇中所有门店受该节假日的中庸影响模式,并对聚类簇内所有门店在该节假日时段的销量预测结果进行调整;
[0061]
所述折扣因子影响模型d(t|sto,chl,mbr,prd)主要基于各门店内商品的历史折扣情况,采用前述因子叠加后预测结果与实际销量间残差进行基于决策树结构的折扣因子模型构建,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果。
[0062]
根据上述技术方案,所述s2中,对于新营业门店,主要采用寻找与预测目标门店较相似的成熟门店作为参考,并依据参考门店订单量的趋势和季节性,对新门店订单量进行预测,包括新店订单量趋势预测和新店订单量季节性预测,该策略可抽象为公式:
[0063]ystore_chl_mbr_prd
(t)=trend
chl_mbr_prd
(t)+seasonality
chl_mbr_prd
(t)
[0064]
其中,y
store_chl_mbr_prd
(t)为在特定门店、渠道、客群、快消商品类型下,t时刻新营业门店销量预测值;
[0065]
trend
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店历史订单量数据趋势分解结果;
[0066]
seasonality
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店预测订单量数据季节性波动分解结果。
[0067]
根据上述技术方案,所述新店订单量趋势预测是指筛选与目标新店临近区域内开业满特定时长的成熟门店,依据开业时间点特征,从上述成熟门店中选取特定数量作为趋势性参考门店,通过对参考门店开业后特定时长内历史销量的趋势性分解结果,按日平均计算获得目标新店开业未来一年内的每日订单量趋势预测值;
[0068]
所述新店订单量季节性预测是指季节性参考门店优先筛选与目标新店处于相同地理功能类型的成熟门店,并在这些门店中选取与目标新店地理直线距离较近的特定数量门店作为季节性参考门店,使用参考门店未来一年订单量预测值的季节性分解结果,按日平均计算获得目标新店开业后一年内的每日订单量季节性预测值。
[0069]
根据上述技术方案,所述s3中,对商品预测模型的准确性进行评估主要是指通过销量预测值与预测目标日期实际销量情况进行比对,比对差值可用于评估模型的预测准确度与架构合理性,其中:模型输出的销量预测结果可通过选取mape作为指标设计的基础,该指标对目标变量的全局缩放较不敏感,与快消商品销量易受促销的因素发生显著波动、量纲差距较大的现实场景相匹配,mape的计算公式如下所示:
[0070][0071]
其中,a
t
为t时刻销量实际值,f
t
为t时刻销量预测值,n为测试数据包含天数;
[0072]
mape计算数值越接近0则模型销量预测结果越精确,具体地,首先计算分门店、渠
道以及品类数据集各行的预测mape,随后可根据所需的评估维度进行聚合。
[0073]
与现有技术相比,本发明的有益效果:
[0074]
1、采用较高预测准确性及高可解释性的模型架构,通过对快消商品场景下销量基准值与多种影响因子的预测建模,提供品牌方综合完整的未来销量预测值和影响因子变化趋势,为门店库存调整、促销策略及新店规划等真实场景提供不同时长、周期的数据支持,并且各影响因子预测结果可提供使用者如客流变化、竞品影响等多层面销量洞察角度,为快速应对未来市场变化、合理调整品牌策略提供额外的参考依据;
[0075]
此外,该销量预测模型能快速基于实际业务变动进行影响因子的移除与新增,具有极高的普适性和可拓展性,可快速复用于多类型、多行业快消商品场景,使用多因子销量预测模型能提供较细粒度的长周期销量预测结果,极大降低了预测工作的人员成本,同时,该模型预测结果可作为数据参考依据,辅助品牌业务专家进行更科学、合理的策略调控和未来规划。
[0076]
2、通过以商品、销量、会员等关键数据为预测主体,多种影响因子为准确性提升辅助点的快消商品销量预测模型方案,为品牌方的库存调整、促销策略、新店规划等业务场景提供数据参考,同时基于快消品牌门店类型构建不同销量预测模型方案,在同一模型方案下,依据门店销售渠道、会员分群及商品类型三个维度拆分结果分别进行独立建模,通过从快消商品销量相关数据中建模具有业务价值且高解释性、拓展性的销量及影响因子预测模型。
附图说明
[0077]
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
[0078]
在附图中:
[0079]
图1是本发明模型构建的示意框图;
[0080]
图2是本发明模型构建的步骤流程图。
具体实施方式
[0081]
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0082]
实施例:如图1-2所示,本发明提供一种技术方案,快消商品多因子销量预测系统,通过以商品、销量、会员组成的关键数据为预测主体,确定多种影响因子来构建快消商品的销量预测模型,为品牌方在库存调整、促销策略、新店规划的业务场景中提供数据参考;
[0083]
主要基于快消品牌门店类型构建不同销量预测模型方案,在同一模型方案下,依据门店销售渠道、会员分群及商品类型三个维度拆分结果分别进行独立建模,具体如下实现步骤:
[0084]
s1、根据开业时长划分成门店类别;
[0085]
s2、根据门店类别分别采取预测模型方案;
[0086]
s3、对商品预测结果的准确性进行评估。
[0087]
基于上述技术方案,s1中,根据开业时长划分成门店类别主要是指根据门店的开
业时长来将门店划分成两类:一类是开业时长满足特定时间跨度的门店,将该类型的门店定义为成熟门店,对于成熟门店采用多因子销量预测模型方案,除成熟门店之外的其余门店均作为新门店,对于新门店则采用冷启动预测方案;
[0088]
对成熟门店,使用移除额外影响因素后的销量数据构建基准预测模型,对门店周边客流信息、竞品信息、节假日/促销日情况、疫情情况、折扣情况、门店营业模式、商品品类占比和销售渠道占比8类销量影响因子进行影响系数建模,并对基准销量预测值进行调整修正,最终生成该门店的销量预测结果;
[0089]
对新门店,选定销量近似成熟门店的历史数据作为参考门店,采用参考门店订单量的历史销量趋势和预测销量季节性分解结果叠加生成门店销量预测结果;
[0090]
采用某品牌数据为例,应用平均绝对百分比误差来对预测模型结果进行准确性验证,待验证通过,可将快消商品多因子销量预测系统应用于品牌的现实业务场景,助力提升品牌商品销量预测效率,最终作为品牌方重要参考依据。
[0091]
基于上述技术方案,s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:
[0092]
对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:
[0093]
y(t|sto,chl,mbr,prd)
[0094]
=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
[0095]
·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
[0096]
·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
[0097]
·
d(t|sto,chl,mbr,prd)
[0098]
在上式中:
[0099]
y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;
[0100]
b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。
[0101]
基于上述技术方案,s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:
[0102]
对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:
[0103]
y(t|sto,chl,mbr,prd)
[0104]
=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
[0105]
·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
[0106]
·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
[0107]
·
d(t|sto,chl,mbr,prd)
[0108]
在上式中:
[0109]
y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;
[0110]
b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。
[0111]
基于上述技术方案,影响因子共有8类,具体包括:
[0112]
1)门店周边客流影响因子模型f(t|sto):门店sto周边客流在t时刻对预测销量修正值;
[0113]
2)竞对信息影响因子模型r(t|sto):门店sto周边竞对信息在t时刻对预测销量修正值;
[0114]
3)门店营业模型m(t|sto,chl):在门店为sto、渠道为chl条件下,营业模式在t时刻对销量掩模值;
[0115]
4)疫情影响模型c(t|sto,mbr):在门店为sto、客群为mbr条件下,疫情在t时刻对门店总销量的影响系数;
[0116]
5)渠道间占比模型p1(t|sto,mbr):在门店为sto、客群为mbr条件下,渠道间占比模型输出的t时刻渠道chl占总销量的比重;
[0117]
6)商品类别占比模型p2(t|sto,chl,mbr):在门店为sto、渠道为chl、客群为mbr条件下,品类占比模型输出的t时刻商品类型prd占总销量的比重;
[0118]
7)节假日/促销日影响模型h(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,节假日/促销日在t时刻对销量影响系数;
[0119]
8)折扣因子影响模型d(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,折扣力度在t时刻对销量影响系数。
[0120]
基于上述技术方案,s2中,对于成熟门店具体包括销量基准预测模型、销量影响因子模型、门店周边客流影响因子模型、竞对信息影响因子模型、门店营业模型、疫情影响模型、渠道间占比模型、商品类别占比模型、节假日/促销日影响模型和折扣因子影响模型;
[0121]
销量基准预测模型b(t|sto,chl,mbr,prd),具体指该模块依据门店、渠道、客群及商品类型的维度拆分组合结果,对特定组合颗粒度下历史销量值,使用prophet时序预测模型对节假日、疫情的销量显著变化时段进行异常值填补,具体填补方案依据对应客群的销量表现设计不同策略步骤;
[0122]
总销量预测模型使用上述异常填补后历史销量,使用prophet、sarima的时序预测模型输入特定时长历史数据,预测某时间跨度下的未来销量,比如观测点前历史52周销量数据预测未来52周销量情况,从而进行销量基准值的预测工作;
[0123]
销量影响因子模型具体指各影响因子依据对应数据源,参考因子对销量影响情况,分别进行数据处理及建模,为保证影响因子模型能在上线环境下稳定进行影响系数的计算,部分非突发性的影响因子,如客流、竞品门店数,将采用时序模型预测或函数拟合的方式预测未来特定时段内的因子变化情况,并使用预测值进行未来时段因子影响系数的计算工作;
[0124]
门店周边客流影响因子模型f(t|sto)具体指:基于客流数据,采用层级聚类算法对每家门店选取相关性最高变量,并进行基于决策树结构的客流影响因子模型的构建,通
过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果;
[0125]
竞对信息影响因子模型r(t|sto)具体指:通过定义特定时段内品牌门店竞争指数,显性描述该门店在与周边竞对品牌门店竞争中理论能分得的市场份额,竞争指数计算公式如下:
[0126][0127]
其中:i
(sto)
(t):为门店sto在t时刻竞对指数值,为t时刻该快消品牌brand在特定地理范围内的权重系数,比如城市,为门店sto在t时刻周边1km范围内各竞对品牌门店的权重和;
[0128]
若对于特定门店,其竞争指数与门店填补后的总订单量之间存在一定的相关性,则认为该门店订单量与竞争指数相关,且对该门店构建基于决策树结构的竞争指数影响因子模型,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终预测结果;
[0129]
门店营业模型m(t|sto,chl)具体指:在排除疫情和节假日影响后的各门店每周的开闭店习惯,基于门店销量数据分析结果,将门店的周营业情况划分为若干类别,根据具体门店在观测点前所呈现出的周营业模式,通过计算观测区间内每种周营业模式的总权重得分,将得分最高的营业模式定为预测区间内所使用的营业模式,并由该模式推断门店未来开闭店的情况;
[0130]
营业模式最终预测结果将对订单量进行掩膜处理,即于关店日将销量预测值置零,其他情况不对预测值进行调整。
[0131]
基于上述技术方案,疫情影响模型c(t|sto,mbr)主要依据特定区域内疫情时段的累计感染人数及实际封控情况,建立疫情模式并对订单量预测值进行调整,该模块主要由以下两个阶段的预测流程组成:
[0132]
疫情封控情况预测:使用微分方程时滞系统模型,基于历史确诊和无症状感染人数对当前疫情是否导致封控以及发生封控后解封时间进行预测;
[0133]
全渠道销量调整:基于疫情防控预测结果及近期订单量变化情况,采用函数拟合方法,对特定门店、客群的全渠道销量预测结果进行调整;
[0134]
渠道间占比模型p1(t|sto,mbr)采用调整后的全渠道预测值和各渠道真实值构造训练数据集,以最小化两个渠道的加权损失为目标,使用梯度下降的方式获取最优的占比时序;
[0135]
在预测阶段则通过对最优占比序列进行趋势化分解,分别对趋势序列和残差序列进行拟合,其中趋势序列采用函数拟合方法,残差部分则使用prophet、sarima时序预测模型进行建模预测;
[0136]
商品类别占比模型p2(t|sto,chl,mbr)主要对于特定门店、客群类型,通过使用prophet、sarima的时序预测模型分别拟合各快消商品类别销量对总销量占比,将该占比叠加至整体销量预测结果并计算获得特定商品类别的销量预测结果;
[0137]
节假日/促销日影响模型h(t|sto,chl,mbr,prd)主要基于业务情况及数据分析结果选定对快消商品销量存在显著影响的节假日/促销日日期,使用时间序列聚类算法,如时
间序列kmeans,对特定渠道、客群类型和快消商品类别的条件下,各门店销量受某一节假日影响情况进行聚类操作;
[0138]
在同一聚类簇内,基于该节假日时段内原始销量与填补后销量的数据差值来计算影响比例,使用简单函数进行平滑并获得此聚类簇中所有门店受该节假日的中庸影响模式,并对聚类簇内所有门店在该节假日时段的销量预测结果进行调整;
[0139]
折扣因子影响模型d(t|sto,chl,mbr,prd)主要基于各门店内商品的历史折扣情况,采用前述因子叠加后预测结果与实际销量间残差进行基于决策树结构的折扣因子模型构建,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果。
[0140]
基于上述技术方案,s2中,对于新营业门店,主要采用寻找与预测目标门店较相似的成熟门店作为参考,并依据参考门店订单量的趋势和季节性,对新门店订单量进行预测,包括新店订单量趋势预测和新店订单量季节性预测,该策略可抽象为公式:
[0141]ystore_chl_mbr_prd
(t)=trend
chl_mbr_prd
(t)+seasonality
chl_mbr_prd
(t)
[0142]
其中,y
store_chl_mbr_prd
(t)为在特定门店、渠道、客群、快消商品类型下,t时刻新营业门店销量预测值;
[0143]
trend
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店历史订单量数据趋势分解结果;
[0144]
seasonality
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店预测订单量数据季节性波动分解结果。
[0145]
基于上述技术方案,新店订单量趋势预测是指筛选与目标新店临近区域内开业满特定时长的成熟门店,依据开业时间点特征,从上述成熟门店中选取特定数量作为趋势性参考门店,通过对参考门店开业后特定时长内历史销量的趋势性分解结果,按日平均计算获得目标新店开业未来一年内的每日订单量趋势预测值;
[0146]
新店订单量季节性预测是指季节性参考门店优先筛选与目标新店处于相同地理功能类型的成熟门店,并在这些门店中选取与目标新店地理直线距离较近的特定数量门店作为季节性参考门店,使用参考门店未来一年订单量预测值的季节性分解结果,按日平均计算获得目标新店开业后一年内的每日订单量季节性预测值。
[0147]
基于上述技术方案,s3中,对商品预测模型的准确性进行评估主要是指通过销量预测值与预测目标日期实际销量情况进行比对,比对差值可用于评估模型的预测准确度与架构合理性,其中:模型输出的销量预测结果可通过选取mape作为指标设计的基础,该指标对目标变量的全局缩放较不敏感,与快消商品销量易受促销的因素发生显著波动、量纲差距较大的现实场景相匹配,mape的计算公式如下所示:
[0148][0149]
其中,a
t
为t时刻销量实际值,f
t
为t时刻销量预测值,n为测试数据包含天数;
[0150]
mape计算数值越接近0则模型销量预测结果越精确,具体地,首先计算分门店、渠道以及品类数据集各行的预测mape,随后可根据所需的评估维度进行聚合;
[0151]
例如,若需要计算品类维度的预测误差,则按照品类维度聚合,并计算mape的平均值作为该维度的最终评估指标,使用共8类销量影响因子依次对销量基准值进行调整,在离
线测试数据集中模型平均销量预测mape逐步降低,且未出现过拟合现象,其中叠加客流及竞对影响因子对降低mape值效果最为显著,其次为渠道间占比、营业模式和节假日/促销日影响因子。
[0152]
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.快消商品多因子销量预测系统,其特征在于:通过以商品、销量、会员组成的关键数据为预测主体,确定多种影响因子来构建快消商品的销量预测模型,为品牌方在库存调整、促销策略、新店规划的业务场景中提供数据参考;基于快消品牌门店类型构建不同销量预测模型方案,在同一模型方案下,依据门店销售渠道、会员分群及商品类型三个维度拆分结果分别进行独立建模,具体如下实现步骤:s1、根据开业时长划分成门店类别;s2、根据门店类别分别采取预测模型方案;s3、对商品预测结果的准确性进行评估。2.根据权利要求1所述的快消商品多因子销量预测系统,其特征在于:所述s1中,根据开业时长划分成门店类别主要是指根据门店的开业时长来将门店划分成两类:一类是开业时长满足特定时间跨度的门店,将该类型的门店定义为成熟门店,对于成熟门店采用多因子销量预测模型方案,除成熟门店之外的其余门店均作为新门店,对于新门店则采用冷启动预测方案;对成熟门店,使用移除额外影响因素后的销量数据构建基准预测模型,对门店周边客流信息、竞品信息、节假日/促销日情况、疫情情况、折扣情况、门店营业模式、商品品类占比和销售渠道占比8类销量影响因子进行影响系数建模,并对基准销量预测值进行调整修正,最终生成该门店的销量预测结果;对新门店,选定销量近似成熟门店的历史数据作为参考门店,采用参考门店订单量的历史销量趋势和预测销量季节性分解结果叠加生成门店销量预测结果。3.根据权利要求1所述的快消商品多因子销量预测系统,其特征在于:所述s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:y(t|sto,chl,mbr,prd)=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
·
d(t|sto,chl,mbr,prd)在上式中:y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。4.根据权利要求3所述的快消商品多因子销量预测系统,其特征在于:所述s2中,根据门店类别分别采取预测模型方案具体指快消商品多因子销量预测系统方案从使用场景及模型效果的角度出发,分别对成熟门店和新门店两种情况进行模型构建,具体如下:对于成熟门店,通过门店、会员和商品类别进行分群及粒度划分,并结合门店竞对信息、门店客流信息、节假日/促销日影响模式、疫情影响模式、门店营业模式以及渠道占比变化情况来对各个门店、各个客群的分渠道销量进行了预测,预测模型可抽象为公式:
y(t|sto,chl,mbr,prd)=(b(t|sto,chl,mbr,prd)+f(t|sto)+r(t|sto))
·
m(t|sto,chl)
·
c(t|sto,mbr)
·
p1(t|sto,mbr)
·
p2(t|sto,chl,mbr)
·
h(t|sto,chl,mbr,prd)
·
d(t|sto,chl,mbr,prd)在上式中:y(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻销量预测值;b(t|sto,chl,mbr,prd):为在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,t时刻剔除影响因子后的总销量预测基准值。5.根据权利要求4所述的快消商品多因子销量预测系统,其特征在于:所述影响因子共有8类,具体包括:1)门店周边客流影响因子模型f(t|sto):门店sto周边客流在t时刻对预测销量修正值;2)竞对信息影响因子模型r(t|sto):门店sto周边竞对信息在t时刻对预测销量修正值;3)门店营业模型m(t|sto,chl):在门店为sto、渠道为chl条件下,营业模式在t时刻对销量掩模值;4)疫情影响模型c(t|sto,mbr):在门店为sto、客群为mbr条件下,疫情在t时刻对门店总销量的影响系数;5)渠道间占比模型p1(t|sto,mbr):在门店为sto、客群为mbr条件下,渠道间占比模型输出的t时刻渠道chl占总销量的比重;6)商品类别占比模型p2(t|sto,chl,mbr):在门店为sto、渠道为chl、客群为mbt条件下,品类占比模型输出的t时刻商品类型prd占总销量的比重;7)节假日/促销日影响模型h(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,节假日/促销日在t时刻对销量影响系数;8)折扣因子影响模型d(t|sto,chl,mbr,prd):在门店为sto、渠道为chl、客群为mbr、快消商品类型为prd条件下,折扣力度在t时刻对销量影响系数。6.根据权利要求5所述的快消商品多因子销量预测系统,其特征在于:所述s2中,对于成熟门店具体包括销量基准预测模型、销量影响因子模型、门店周边客流影响因子模型、竞对信息影响因子模型、门店营业模型、疫情影响模型、渠道间占比模型、商品类别占比模型、节假日/促销日影响模型和折扣因子影响模型;所述销量基准预测模型b(t|sto,chl,mbr,prd),具体指该模块依据门店、渠道、客群及商品类型的维度拆分组合结果,对特定组合颗粒度下历史销量值,使用prophet时序预测模型对节假日、疫情的销量显著变化时段进行异常值填补,具体填补方案依据对应客群的销量表现设计不同策略步骤;总销量预测模型使用上述异常填补后历史销量,使用prophet、sartma的时序预测模型输入特定时长历史数据,预测某时间跨度下的未来销量,从而进行销量基准值的预测工作;所述销量影响因子模型具体指各影响因子依据对应数据源,参考因子对销量影响情况,分别进行数据处理及建模,为保证影响因子模型能在上线环境下稳定进行影响系数的计算,部分非突发性的影响因子,将采用时序模型预测或函数拟合的方式预测未来特定时
段内的因子变化情况,并使用预测值进行未来时段因子影响系数的计算工作;所述门店周边客流影响因子模型f(t|sto)具体指:基于客流数据,采用层级聚类算法对每家门店选取相关性最高变量,并进行基于决策树结构的客流影响因子模型的构建,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果;所述竞对信息影响因子模型r(t|st0)具体指:通过定义特定时段内品牌门店竞争指数,显性描述该门店在与周边竞对品牌门店竞争中理论能分得的市场份额,竞争指数计算公式如下:其中:i
(sto)
(t):为门店sto在t时刻竞对指数值,为t时刻该快消品牌brand在特定地理范围内的权重系数,为门店sto在t时刻周边1km范围内各竞对品牌门店的权重和;若对于特定门店,其竞争指数与门店填补后的总订单量之间存在一定的相关性,则认为该门店订单量与竞争指数相关,且对该门店构建基于决策树结构的竞争指数影响因子模型,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终预测结果;所述门店营业模型m(t|sto,chl)具体指:在排除疫情和节假日影响后的各门店每周的开闭店习惯,基于门店销量数据分析结果,将门店的周营业情况划分为若干类别,根据具体门店在观测点前所呈现出的周营业模式,通过计算观测区间内每种周营业模式的总权重得分,将得分最高的营业模式定为预测区间内所使用的营业模式,并由该模式推断门店未来开闭店的情况;营业模式最终预测结果将对订单量进行掩膜处理,即于关店日将销量预测值置零,其他情况不对预测值进行调整。7.根据权利要求6所述的快消商品多因子销量预测系统,其特征在于:所述疫情影响模型c(t|sto,mbr)主要依据特定区域内疫情时段的累计感染人数及实际封控情况,建立疫情模式并对订单量预测值进行调整,该模块主要由以下两个阶段的预测流程组成:疫情封控情况预测:使用微分方程时滞系统模型,基于历史确诊和无症状感染人数对当前疫情是否导致封控以及发生封控后解封时间进行预测;全渠道销量调整:基于疫情防控预测结果及近期订单量变化情况,采用函数拟合方法,对特定门店、客群的全渠道销量预测结果进行调整;所述渠道间占比模型p1(t|sto,mbr)采用调整后的全渠道预测值和各渠道真实值构造训练数据集,以最小化两个渠道的加权损失为目标,使用梯度下降的方式获取最优的占比时序;在预测阶段则通过对最优占比序列进行趋势化分解,分别对趋势序列和残差序列进行拟合,其中趋势序列采用函数拟合方法,残差部分则使用prophet、sarima时序预测模型进行建模预测;所述商品类别占比模型p2(t|sto,chl,mbr)主要对于特定门店、客群类型,通过使用prophet、sarima的时序预测模型分别拟合各快消商品类别销量对总销量占比,将该占比叠加至整体销量预测结果并计算获得特定商品类别的销量预测结果;
所述节假日/促销日影响模型h(t|sto,chl,mbr,prd)主要基于业务情况及数据分析结果选定对快消商品销量存在显著影响的节假日/促销日日期,使用时间序列聚类算法,对特定渠道、客群类型和快消商品类别的条件下,各门店销量受某一节假日影响情况进行聚类操作;在同一聚类簇内,基于该节假日时段内原始销量与填补后销量的数据差值来计算影响比例,使用简单函数进行平滑并获得此聚类簇中所有门店受该节假日的中庸影响模式,并对聚类簇内所有门店在该节假日时段的销量预测结果进行调整;所述折扣因子影响模型d(t|sto,chl,mbr,prd)主要基于各门店内商品的历史折扣情况,采用前述因子叠加后预测结果与实际销量间残差进行基于决策树结构的折扣因子模型构建,通过该模型预测的销量调整值,对销量预测基准进行叠加以调整优化最终的预测结果。8.根据权利要求1所述的快消商品多因子销量预测系统,其特征在于:所述s2中,对于新营业门店,主要采用寻找与预测目标门店较相似的成熟门店作为参考,并依据参考门店订单量的趋势和季节性,对新门店订单量进行预测,包括新店订单量趋势预测和新店订单量季节性预测,该策略可抽象为公式:y
store_chl_mbr_prd
(t)=trend
chl_mbr_prd
(t)+seasonality
chl_mbr_prd
(t)其中,y
store_chl_mbr_prd
(t)为在特定门店、渠道、客群、快消商品类型下,t时刻新营业门店销量预测值;trend
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店历史订单量数据趋势分解结果;seasonality
chl_mbr_prd
(t)为特定渠道、客群及商品类别下参考门店预测订单量数据季节性波动分解结果。9.根据权利要求8所述的快消商品多因子销量预测系统,其特征在于:所述新店订单量趋势预测是指筛选与目标新店临近区域内开业满特定时长的成熟门店,依据开业时间点特征,从上述成熟门店中选取特定数量作为趋势性参考门店,通过对参考门店开业后特定时长内历史销量的趋势性分解结果,按日平均计算获得目标新店开业未来一年内的每日订单量趋势预测值;所述新店订单量季节性预测是指季节性参考门店优先筛选与目标新店处于相同地理功能类型的成熟门店,并在这些门店中选取与目标新店地理直线距离较近的特定数量门店作为季节性参考门店,使用参考门店未来一年订单量预测值的季节性分解结果,按日平均计算获得目标新店开业后一年内的每日订单量季节性预测值。10.根据权利要求1所述的快消商品多因子销量预测系统,其特征在于:所述s3中,对商品预测模型的准确性进行评估主要是指通过销量预测值与预测目标日期实际销量情况进行比对,比对差值可用于评估模型的预测准确度与架构合理性,其中:模型输出的销量预测结果可通过选取mape作为指标设计的基础,该指标对目标变量的全局缩放较不敏感,与快消商品销量易受促销的因素发生显著波动、量纲差距较大的现实场景相匹配,mape的计算公式如下所示:
其中,a
t
为t时刻销量实际值,f
t
为t时刻销量预测值,n为测试数据包含天数;mape计算数值越接近0则模型销量预测结果越精确,具体地,首先计算分门店、渠道以及品类数据集各行的预测mape,随后可根据所需的评估维度进行聚合。
技术总结
本发明公开了快消商品多因子销量预测系统,主要基于快消品牌门店类型构建不同销量预测模型方案,在同一模型方案下,依据门店销售渠道、会员分群及商品类型三个维度拆分结果分别进行独立建模,本发明采用较高预测准确性及高可解释性的模型架构,通过对快消商品场景下销量基准值与多种影响因子的预测建模,提供品牌方综合完整的未来销量预测值和影响因子变化趋势,为门店库存调整、促销策略及新店规划等真实场景提供不同时长、周期的数据支持,并且各影响因子预测结果可提供使用者如客流变化、竞品影响等多层面销量洞察角度,为快速应对未来市场变化、合理调整品牌策略提供额外的参考依据。参考依据。参考依据。
技术研发人员:叶生晅 周琛 麦荣智 柴乐扬
受保护的技术使用者:杭州座头鲸科技有限公司
技术研发日:2023.06.16
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
