净推荐值分析方法、装置、服务器及存储介质与流程
未命名
10-19
阅读:125
评论:0
1.本技术涉及车企数据挖掘技术领域,特别涉及一种净推荐值分析方法、装置、服务器及存储介质。
背景技术:
2.近些年来,随着我国汽车市场的蓬勃发展,汽车行业竞争力的增加,全面了解影响客户nps(net promoter score,净推荐值)的影响因素至关重要,c-nps的研究成果对于帮助企业最终扩大市场占有率、增加销售,预测企业未来成长的可能性有着重要的价值。
3.相关技术中,通过运用客户净推荐值测评体系对公司目前的客户满意情况进行问卷调研,分析目前车的净推荐值影响因素,仅针对客户进行问卷调研费时费力,并且不能够准确快速的定位影响忠诚度和满意度的原因。
技术实现要素:
4.本技术提供一种净推荐值分析方法、装置、服务器及存储介质,以解决相关技术中对客户进行问卷调研费时费力,导致不能准确快速的定位影响忠诚度和满意度的原因等问题。
5.本技术第一方面实施例提供一种净推荐值分析方法,包括以下步骤:获取用户对于车辆的满意度数据;将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子;根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。
6.可选地,在将所述满意度数据输入预先训练的预估模型之前,还包括:获取用于预估模型训练的历史数据;对所述历史数据进行特征处理,得到测试数据集;通过测试数据集和目标学习算法训练所述预估模型。
7.可选地,所述特征处理包括归一化、离散化、异常值剔除、缺失值补充、分类值one-hot处理的一个或多个。
8.可选地,所述通过测试数据集和目标学习算法训练所述预估模型,包括:将所述测试数据集划分为测试集和训练集;通过测试数据集和目标学习算法训练所述预估模型;利用所述测试集测试所述预估模型,直至满足预设条件,得到训练完成的预估模型。
9.可选地,所述目标学习算法的目标函数为:
[0010][0011]
其中,k表示建立的所有树,l表示损失函数,yi表示真实值,表示预测值,f
t
表示函数空间k中的一个函数,代表树这种抽象结构,ω(f
t
)表示当前树的复杂度,其中,t表示叶子节点的数目,wj表示叶子节点的输出值,γ和λ是超参数。
[0012]
可选地,所述获取用于预估模型训练的历史数据,包括:若用户存在历史数据,则获取所述用户的历史数据;若用户不存在历史数据,则利用协同过滤模型筛选具有相同特征的用户,获取具有相同特征用户的历史数据。
[0013]
可选地,根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果,包括:计算每个目标因子的净推荐值的得分值;若所述得分值大于预设净推荐值,则判定所述目标因子为激励因子;若所述得分值小于预设净推荐值,则判定所述目标因子为保健因子;若所述得分值等于预设净推荐值,则判定所述目标因子为线性因子。
[0014]
本技术第二方面实施例提供一种净推荐值分析装置,包括:获取模块,用于获取用户对于车辆的满意度数据;输入模块,用于将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子;分析模块,用于根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。
[0015]
本技术第三方面实施例提供一种服务器,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如上述实施例所述的净推荐值分析方法。
[0016]
本技术第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现如上述实施例所述的净推荐值分析方法。
[0017]
由此,本技术至少具有如下有益效果:
[0018]
本技术实施例可以通过用户对车辆的满意度数据输入预估模型,输出车辆的净推荐值相关的影响因子,快速定位影响因子中的目标因子,根据目标因子的分类类别对净推荐值进行分析得到分析结果,省时省力,并能够基于上述结果准确快速的定位到影响忠诚度和满意度的原因,以结合分析结果做策略优化提升公司客户净推荐值。
[0019]
本技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实践了解到。
附图说明
[0020]
本技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0021]
图1为根据本技术实施例提供的一种净推荐值分析方法的流程图;
[0022]
图2为根据本技术实施例的净推荐值分析方法的思维导图;
[0023]
图3为根据本技术实施例的预估模型实现流程图;
[0024]
图4为根据本技术实施例的特征工程处理的示意图;
[0025]
图5为根据本技术实施例的重要特征筛选结果输出的示意图;
[0026]
图6为根据本技术实施例的重要特征因子分类分析结果输出图;
[0027]
图7为根据本技术实施例的预估模型的欠拟合示意图;
[0028]
图8为根据本技术实施例的净推荐值分析装置的方框图;
[0029]
图9为根据本技术实施例的服务器的结构示意图。
具体实施方式
[0030]
下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终
相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本技术,而不能理解为对本技术的限制。
[0031]
下面参考附图描述本技术实施例的净推荐值分析方法、装置、服务器及存储介质。针对上述背景技术中提到的相关技术中对客户进行问卷调研费时费力,导致不能准确快速的定位影响忠诚度和满意度的原因的问题,本技术提供了一种净推荐值分析方法,在该方法中,通过用户对车辆的满意度数据输入预估模型,输出车辆的净推荐值相关的影响因子,快速定位影响因子中的目标因子,根据目标因子的分类类别对净推荐值进行分析得到分析结果,省时省力,并能够基于上述结果准确快速的定位到影响忠诚度和满意度的原因,以结合分析结果做策略优化提升公司客户净推荐值。由此,解决了相关技术中对客户进行问卷调研费时费力,导致不能准确快速的定位影响忠诚度和满意度的原因等问题。
[0032]
具体而言,图1为本技术实施例所提供的一种净推荐值分析方法的流程图。
[0033]
如图1所示,该净推荐值分析方法包括以下步骤:
[0034]
在步骤s101中,获取用户对于车辆的满意度数据。
[0035]
可以理解的是,本技术实施例可以获取历史的调查问卷,基于历史的调查问卷获取用户对于车辆的满意度数据。
[0036]
在步骤s102中,将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子。
[0037]
可以理解的是,本技术实施例将满意度数据输入预先训练的预估模型,输出车辆的净推荐值相关的影响因子,并定位影响因子中的目标因子,以便于后续根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。
[0038]
在本技术实施例中,在将所述满意度数据输入预先训练的预估模型之前,还包括:获取用于预估模型训练的历史数据;对所述历史数据进行特征处理,得到测试数据集;通过测试数据集和目标学习算法训练所述预估模型。
[0039]
其中,特征处理包括归一化、离散化、异常值剔除、缺失值补充、分类值one-hot处理的一个或多个。
[0040]
可以理解的是,本技术实施例获取用于预估模型训练的历史数据,并对历史数据进行特征处理得到测试数据集,通过测试数据集和目标学习算法训练预估模型,以便于后续利用预估模型得到车辆的净推荐值相关的影响因子。
[0041]
具体地,特征处理中归一化主要是将给定的数据集的不同特征缩放到相同的控件,使其具有相同的权重和参考基准,以改善模型学习的准确性;特征处理中离散化是将连续的数据进行分段,使其变为一段段离散化的区间,连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征,常用做法,就是先对特征进行排序,然后再按照等频离散化为n个区间;异常值剔除就是在一组数据偏差较大的为异常值,将其丢弃;独热编码即one-hot编码,又称一位有效编码,其方法是使用n位状态寄存器来对n个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效;缺失值补充有多种方法,例如均值填充、中位数填充、众数填充、前后数据填充、自定义数据填充、pandas插值填充、算法填充等。
[0042]
而本技术主要采用均值填充等特征处理,再做一些特征的衍生,比如急刹车次数,可以衍生成最近一周的急刹车次数,最近二周急刹车次数,最近1月的急刹车次数,必要时
可运用模型拟合异常数据等;最后,将特征监控,防止特征数据异常,影响模型效果。
[0043]
在本技术实施例中,所述获取用于预估模型训练的历史数据,包括:若用户存在历史数据,则获取所述用户的历史数据;若用户不存在历史数据,则利用协同过滤模型筛选具有相同特征的用户,获取具有相同特征用户的历史数据。
[0044]
可以理解的是,本技术实施例在用户存在历史数据时,直接获取历史数据;在用户不存在历史数据时,利用协同过滤模型筛选具有相同特征的用户,获取对应具有相同特征用户的历史数据,以便于后续用于预估模型的训练。
[0045]
具体地,首先判断车机是否有历史自变量数据,有的话可以进行模型的训练和结果的输出,没有车机历史数据的话,就需要根据用户的特征去判断,可以使用用户相似性的协同过滤模型,将有相同特征的用户判断为是同一类结果的用户,获取对应具有相同特征用户的历史数据。
[0046]
在本技术实施例中,所述通过测试数据集和目标学习算法训练所述预估模型,包括:将所述测试数据集划分为测试集和训练集;通过测试数据集和目标学习算法训练所述预估模型;利用所述测试集测试所述预估模型,直至满足预设条件,得到训练完成的预估模型。
[0047]
其中,预设条件可以是模型参数的auc达到80%,且模型并未出现过拟合和欠拟合的现象,不做具体限定。
[0048]
其中,所述目标学习算法的目标函数为:
[0049][0050]
其中,k表示建立的所有树,l表示损失函数,yi表示真实值,表示预测值,f
t
表示函数空间k中的一个函数,代表树这种抽象结构,ω(f
t
)表示当前树的复杂度,其中,t表示叶子节点的数目,wj表示叶子节点的输出值,γ和λ是超参数。
[0051]
可以理解的是,本技术实施例可以根据将测试数据集划分为测试集和训练集,通过测试数据集和目标学习算法训练预估模型,利用测试集测试预估模型,直至预估模型满足预设条件,得到训练完成的预估模型,以便于后续利用预估模型得到车辆的净推荐值相关的影响因子。
[0052]
具体地,基于处理好的向量之后,分为测试集、训练集做算法模型训练(xgbt),预估用户的nps值;其中,xgboost是extreme gradient boosting的简称,是一种梯度提升树模型,就是以树为基本学习器的模型;与gbdt最大的区别就是树的生成方式不同,加快了树的生成过程,以生成最优树。
[0053][0054]
其中,i表示叶子节点;t表示第t颗树;k表示第k颗树;fk(xi)表示第k颗树叶子权重;f
t
(xi)表示第t颗树叶子权重;表示预测值。
[0055]
xgboost是加法模型,采用前向分步算法生成每一棵树,xgboost采用全新的思路生成一颗最优树。回归树的最终结果是每个被放入模型的任意样本最终一个都会落到一个叶子节点上;对于xgboost来说,每个叶子节点上会有一个预测分数,也被称为叶子权重;这个叶子权重就是所有在这个叶子节点上的样本在这一棵树上的回归取值,用fk(xi)或者w来表示:
[0056]
ij={i|q(xi)=j}
[0057]
其中,i表示叶子节点;j表示第j个叶子节点;q(xi)表示叶子节点集合。
[0058]
它表示:对于任意叶子节点,有哪些样本落在了这个节点上,显然它是一个集合。
[0059]
xgboost的目标函数:
[0060][0061]
其中,其中,k表示建立的所有树,l表示损失函数,yi表示真实值,表示预测值,f
t
表示函数空间k中的一个函数,代表树这种抽象结构,ω(f
t
)表示当前树的复杂度。
[0062]
其中,t代表叶子节点的数目,wj是叶子节点的输出值,第一项是l1正则项,第二项是l2正则项,相应的系数γ和λ是超参数,用于对正则化项进行调节和均衡。
[0063]
在步骤s103中,根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。
[0064]
可以理解的是,本技术实施例根据目标因子的分类类别对净推荐值进行分析,得到分析结果,省时省力,并能够基于上述结果准确快速的定位到影响忠诚度和满意度的原因,以结合分析结果做策略优化提升公司客户净推荐值。
[0065]
在本技术实施例中,根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果,包括:计算每个目标因子的净推荐值的得分值;若所述得分值大于预设净推荐值,则判定所述目标因子为激励因子;若所述得分值小于预设净推荐值,则判定所述目标因子为保健因子;若所述得分值等于预设净推荐值,则判定所述目标因子为线性因子。
[0066]
可以理解的是,本技术实施例根据每个目标因子的净推荐值的得分值划分为激励因子、保健因子和线性因子,以便于根据分析结果做策略优化提升公司客户净推荐值。
[0067]
根据本技术实施例提出的净推荐值分析方法,通过用户对车辆的满意度数据输入预估模型,输出车辆的净推荐值相关的影响因子,快速定位影响因子中的目标因子,根据目标因子的分类类别对净推荐值进行分析得到分析结果,省时省力,并能够基于上述结果准确快速的定位到影响忠诚度和满意度的原因,以结合分析结果做策略优化提升公司客户净推荐值。
[0068]
下面将结合图2对本技术的净推荐值分析方法进行详细阐述,具体如下:
[0069]
1、收集以往调研问卷的用户满意度数据
[0070]
根据行业经验分析影响用户满意度的自变量因子,例如油耗、速度、里程、售后问题等,根据自变量因子设计问卷以及收集问卷结果,通过问卷调研的形式来了解用户是否愿意推荐给其他用户,将结果存储至数据库,如需调用问卷小程序工具,数据采集需要数据库支持(dbeaver、sqlserver),可以利用数据库查询语言sql、hive、python、pyspark等工
具。
[0071]
2、获取车主历史数据
[0072]
车主历史数据包括用户画像数据(性别、年纪等)、用户驾驶行为数据(急刹车次数、油耗、充电次数等)、售后服务数据等;
[0073]
具体地,如图3所示,首先需要判断车机是否有历史自变量数据,有的话可以进行模型的训练和结果的输出,没有车机历史数据的话,就需要根据用户的特征去判断,可以使用用户相似性的协同过滤模型,将有相同特征的用户判断为是同一类结果的用户,获取用一类结果的用户的历史数据。
[0074]
3、基于历史数据做特征工程,特征向量的处理,异常值剔除、缺失值补充、分类值one-hot处理等
[0075]
如图4所示,当有这些基础数据的时候,需要进行特征工程的处理,首先判断这次特征是否容易获取,再判断这次特征的完整性、准确性等,对于缺失严重或者错误率很高的特征,我们可以丢弃,然后,做一些特征的归一化,离散化,异常值剔除、缺失值补充、分类值one-hot处理等;特征处理中归一化主要是将给定的数据集的不同特征缩放到相同的控件,使其具有相同的权重和参考基准,以改善模型学习的准确性;特征处理中离散化是将连续的数据进行分段,使其变为一段段离散化的区间,连续特征在不同的区间有不同的权重,实现的方法就是对特征进行划分区间,每个区间为一个新的特征,常用做法,就是先对特征进行排序,然后再按照等频离散化为n个区间;异常值剔除就是在一组数据偏差较大的为异常值,将其丢弃;独热编码即one-hot编码,又称一位有效编码,其方法是使用n位状态寄存器来对n个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效;缺失值补充有多种方法,例如均值填充、中位数填充、众数填充、前后数据填充、自定义数据填充、pandas插值填充、算法填充等,本技术主要采用均值填充等特征处理,再做一些特征的衍生,比如急刹车次数,可以衍生成最近一周的急刹车次数,最近二周急刹车次数,最近1月的急刹车次数,必要时可运用模型拟合异常数据等;最后,将特征监控,防止特征数据异常,影响模型效果。
[0076]
4、基于处理好的向量之后,分为测试集、训练集做算法模型训练(xgbt),预估用户的nps值
[0077]
基于处理好的向量之后,分为测试集、训练集做算法模型训练(xgbt),预估用户的nps值;其中,算法预测需要python中numpy、pandas、sklearn、xgbt模块包做支持;xgboost是extreme gradient boosting的简称,是一种梯度提升树模型,就是以树为基本学习器的模型;与gbdt最大的区别就是树的生成方式不同,加快了树的生成过程,以生成最优树。
[0078][0079]
其中,i表示叶子节点;t表示第t颗树;k表示第k颗树;fk(xi)表示第k颗树叶子权重;f
t
(xi)表示第t颗树叶子权重;表示预测值。
[0080]
xgboost是加法模型,采用前向分步算法生成每一棵树,xgboost采用全新的思路生成一颗最优树。回归树的最终结果是每个被放入模型的任意样本最终一个都会落到一个叶子节点上;对于xgboost来说,每个叶子节点上会有一个预测分数,也被称为叶子权重;这
个叶子权重就是所有在这个叶子节点上的样本在这一棵树上的回归取值,用fk(xi)或者w来表示:
[0081]
ij={i|q(xi)=j}
[0082]
其中,i表示叶子节点;j表示第j个叶子节点;q(xi)表示叶子节点集合。
[0083]
它表示:对于任意叶子节点,有哪些样本落在了这个节点上,显然它是一个集合。
[0084]
xgboost的目标函数:
[0085][0086]
其中,k表示建立的所有树,l表示损失函数,yi表示真实值,表示预测值,f
t
表示函数空间k中的一个函数,代表树这种抽象结构,ω(f
t
)表示当前树的复杂度;表示求和;表示求和。其中,t代表叶子节点的数目,wj是叶子节点的输出值,第一项是l1正则项,第二项是l2正则项,相应的系数γ和λ是超参数,用于对正则化项进行调节和均衡。
[0087]
5、模型参数调整,将auc达到80%左右
[0088]
如图5和图7所示,判断模型是否过拟合和欠拟合的代码逻辑,若在训练集表现差,在测试集表现同样会很差,这可能是欠拟合导致,若模型在训练集表现非常好,却在测试集上差强人意,则这便是过拟合导致的;解决欠拟合的办法,通过增加新特征,可以考虑加入进特征组合、高次特征,来增大假设空间,添加多项式特征,这个在机器学习算法里面用的很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。
[0089]
6、根据特征的平均增益进行特征重要性筛选,筛选出影响nps的关键因子
[0090]
基于以上模型结果,影响nps因子的代码生成和结果输出,筛选的原理主要是根据该特征带来信息增益(目标函数)优化的平均值筛选方法,筛选出影响nps的关键因子,如下表1所示,top20的因子主要是最近2月充电量、近30日平均速度、最近1月纯电里程、最近2月充电次数、最近2月纯电占比、总里程、最近1月充电次数、近30日最高速度等。
[0091]
表1汽车vin码对应车辆影响nps的关键因子表
[0092]
[0093]
[0094][0095]
7、将关键因子分类分析,分为激励因子、保健因子、线性因子,不同类型的因子结合业务做策略优化
[0096]
如图6所示,将top20的关键因子分类分析,分为激励因子、保健因子、线性因子,不同类型的因子结合业务做策略优化;具体是将因子分为激励因子(该因子的体验好,提升用户推荐,但是该因子体验不好,不会造成用户贬损)、保健因子(该因子的体验差,提升用户贬损,但是该因子体验好,不会提升用户推荐)和线性因子(该因子的体验越好,用户越可能推荐,该因子体验越不好,用户越可能贬损);具体分析方法,计算各个因子的保健性和激励性得分,例如因子a,将因子a的值分为高、中、低三类,分别计算三类中的nps值,并与因子a推荐者的整体nps(43%)比较,如下表1:下表2是一些样本例子,下表3是计算出因子的保健性和激励性得分,因子a的激励性得分是100%,高于因子a推荐者的整体nps(43%),保健性得分是33%低于因子a推荐者的整体nps(43%),所以因子a具有激励性,是保健因子。
[0097]
表2样本因子整体净推荐值
[0098]
[0099][0100]
表3因子整体净推荐值类型
[0101][0102]
其次参照附图描述根据本技术实施例提出的净推荐值分析装置。
[0103]
图8是本技术实施例的净推荐值分析装置的方框示意图。
[0104]
如图8所示,该净推荐值分析装置10包括:获取模块100、输入模块200和分析模块300。
[0105]
其中,获取模块100用于获取用户对于车辆的满意度数据;输入模块200用于将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子;分析模块300用于根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。
[0106]
需要说明的是,前述对净推荐值分析方法实施例的解释说明也适用于该实施例的净推荐值分析装置,此处不再赘述。
[0107]
根据本技术实施例提出的净推荐值分析装置,通过用户对车辆的满意度数据输入预估模型,输出车辆的净推荐值相关的影响因子,快速定位影响因子中的目标因子,根据目标因子的分类类别对净推荐值进行分析得到分析结果,省时省力,并能够基于上述结果准确快速的定位到影响忠诚度和满意度的原因,以结合分析结果做策略优化提升公司客户净推荐值。
[0108]
图9为本技术实施例提供的服务器的结构示意图。该服务器可以包括:
[0109]
存储器901、处理器902及存储在存储器901上并可在处理器902上运行的计算机程序。
[0110]
处理器902执行程序时实现上述实施例中提供的净推荐值分析方法。
[0111]
进一步地,服务器还包括:
[0112]
通信接口903,用于存储器901和处理器902之间的通信。
[0113]
存储器901,用于存放可在处理器902上运行的计算机程序。
[0114]
存储器901可能包含高速ram(random access memory,随机存取存储器)存储器,
也可能还包括非易失性存储器,例如至少一个磁盘存储器。
[0115]
如果存储器901、处理器902和通信接口903独立实现,则通信接口903、存储器901和处理器902可以通过总线相互连接并完成相互间的通信。总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component,外部设备互连)总线或eisa(extended industry standard architecture,扩展工业标准体系结构)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
[0116]
可选的,在具体实现上,如果存储器901、处理器902及通信接口903,集成在一块芯片上实现,则存储器901、处理器902及通信接口903可以通过内部接口完成相互间的通信。
[0117]
处理器902可能是一个cpu(central processing unit,中央处理器),或者是asic(application specific integrated circuit,特定集成电路),或者是被配置成实施本技术实施例的一个或多个集成电路。
[0118]
本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上的净推荐值分析方法。
[0119]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不是必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或n个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0120]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“n个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0121]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或n个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本技术的实施例所属技术领域的技术人员所理解。
[0122]
应当理解,本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,n个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列,现场可编程门阵列等。
[0123]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0124]
尽管上面已经示出和描述了本技术的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本技术的限制,本领域的普通技术人员在本技术的范围内可以对上述实施例进行变化、修改、替换和变型。
技术特征:
1.一种净推荐值分析方法,其特征在于,所述方法包括以下步骤:获取用户对于车辆的满意度数据;将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子;根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。2.根据权利要求1所述的净推荐值分析方法,其特征在于,在将所述满意度数据输入预先训练的预估模型之前,还包括:获取用于预估模型训练的历史数据;对所述历史数据进行特征处理,得到测试数据集;通过测试数据集和目标学习算法训练所述预估模型。3.根据权利要求2所述的净推荐值分析方法,其特征在于,所述特征处理包括归一化、离散化、异常值剔除、缺失值补充、分类值one-hot处理的一个或多个。4.根据权利要求2所述的净推荐值分析方法,其特征在于,所述通过测试数据集和目标学习算法训练所述预估模型,包括:将所述测试数据集划分为测试集和训练集;通过测试数据集和目标学习算法训练所述预估模型;利用所述测试集测试所述预估模型,直至满足预设条件,得到训练完成的预估模型。5.根据权利要求4所述的净推荐值分析方法,其特征在于,所述目标学习算法的目标函数为:其中,k表示建立的所有树,l表示损失函数,yi表示真实值,表示预测值,f
t
表示函数空间k中的一个函数,代表树这种抽象结构,ω(f
t
)表示当前树的复杂度,其中,t表示叶子节点的数目,w
j
表示叶子节点的输出值,γ和λ是超参数。6.根据权利要求2所述的净推荐值分析方法,其特征在于,所述获取用于预估模型训练的历史数据,包括:若用户存在历史数据,则获取所述用户的历史数据;若用户不存在历史数据,则利用协同过滤模型筛选具有相同特征的用户,获取具有相同特征用户的历史数据。7.根据权利要求1所述的净推荐值分析方法,其特征在于,根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果,包括:计算每个目标因子的净推荐值的得分值;若所述得分值大于预设净推荐值,则判定所述目标因子为激励因子;若所述得分值小于预设净推荐值,则判定所述目标因子为保健因子;若所述得分值等于预设净推荐值,则判定所述目标因子为线性因子。8.一种净推荐值分析装置,其特征在于,所述装置包括:获取模块,用于获取用户对于车辆的满意度数据;
输入模块,用于将所述满意度数据输入预先训练的预估模型,输出所述车辆的净推荐值相关的影响因子,并定位所述影响因子中的目标因子;分析模块,用于根据所述目标因子的分类类别对所述净推荐值进行分析得到分析结果。9.一种服务器,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求1-7任一项所述的净推荐值分析方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以用于实现如权利要求1-7任一项所述的净推荐值分析方法。
技术总结
本申请涉及车企数据挖掘技术领域,特别涉及一种净推荐值分析方法、装置、服务器及存储介质,其中,方法包括:获取用户对于车辆的满意度数据;将满意度数据输入预先训练的预估模型,输出车辆的净推荐值相关的影响因子,并定位影响因子中的目标因子;根据目标因子的分类类别对净推荐值进行分析得到分析结果。由此,解决了相关技术中对客户进行问卷调研费时费力,导致不能准确快速的定位影响忠诚度和满意度的原因等问题。度的原因等问题。度的原因等问题。
技术研发人员:叶青佩
受保护的技术使用者:奇瑞汽车股份有限公司
技术研发日:2023.07.14
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
