一种融合多维度策略体系构建的流程分析方法及系统与流程

未命名 07-13 阅读:103 评论:0


1.本发明涉及一种推荐流程系统,具体是一种融合多维度策略体系构建的流程分析方法及系统。


背景技术:

2.个人情绪作为一种复杂的心理过程,具有社会属性,与理性思维和逻辑推理能力一起在决策流程中扮演重要角色。正面个人情绪可以提高人们的积极性和认知能力,而负面个人情绪则会影响人们的动机、决策和记忆,甚至有一些隐藏的情绪都不易被用户本人所发现,因此为了减弱甚至消除负面个人情绪对决策流程的消极影响,需要根据用户个人情绪需求准备的定制个性化的推荐流程系统。
3.而现有的推荐流程系统无法有效建立用户的个人偏好,推荐资源的分类准确度不高。因此,本领域技术人员提供了一种融合多维度策略体系构建的流程分析方法及系统,以解决上述背景技术中提出的问题。


技术实现要素:

4.本发明的目的在于提供一种融合多维度策略体系构建的流程分析方法及系统,能够有效建立用户的个人偏好,提高推荐资源的分类准确度,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:
6.一种融合多维度策略体系构建的流程分析方法,包括以下步骤:
7.建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2

8.建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3

9.融合模型,将随机森林模型(rf)作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;
10.获得目前用户偏好与其对应的资源;
11.生成推荐列表,推送给用户。
12.作为本发明进一步的方案:所述第一层训练模型的具体训练过程如下:
13.构造3个不同参数的cart随机森林模型(rf)和和3个不同参数的mlp多层神经网络adaboost模型(ada)作为基于关键用户推荐和资源情感评分两个维度的训练模型h1={h1,h2,
……
h6};
14.针对基础模型h1,对现有的已验证数据中提取关键用户推荐与资源情感评分两个
维度通过贝叶斯推理、dempster-shafer证据推理、人工神经网络、模糊逻辑和卡尔曼过滤生成训练集得到d
train
,进行随机重复采样得到6组训练集d
train-1
={d
t1
,d
t2

……dt6
};
15.将训练集d
train
中除了训练集d
train-1
外数据作为验证集d
val
={d
v1
,d
v2

……dv6
},再针对验证集d
val
,对d
val
中的数据进行去重,只保留不重复的数据,最后记为验证集d
val-1

16.先用训练集d
train-1
训练基础模型h1,再用训练好的基础模型h1预测验证集d
val-1
,生成新训练集d
train-2

17.作为本发明再进一步的方案:所述cart是一种决策树算法,可用于分类和回归问题,而随机森林(rf)则是一种集成学习算法,它使用多个决策树来改善单一决策树的性能;随机森林使用随机化方法来构建一组决策树,在构建每个决策树时,它随机选择数据样本和特征进行训练,这样可以降低单个决策树过拟合的风险,并提高整个随机森林的泛化性能;对于分类问题,随机森林使用投票法来进行预测,即对于每个测试样本,随机森林中的每个决策树都会给出一个分类结果,最终预测结果是所有决策树结果中出现最多的类别;对于回归问题,随机森林使用平均值来进行预测,即每个决策树预测出来的结果取平均值作为最终预测结果。
18.作为本发明再进一步的方案:所述mlp多层神经网络是一种基于神经元和层级结构的机器学习模型,它可以用于解决分类和回归问题,mlp模型由输入层、隐藏层和输出层组成,其中每一层都包含多个神经元,每个神经元都通过激活函数将输入信号转化为输出,adaboost是一种集成学习算法,它可以将多个弱分类器组合成一个强分类器,adaboost算法通过对每个训练样本赋予不同的权重,使得弱分类器能够对难分类的样本进行更好的分类,从而提高整个模型的准确性。
19.作为本发明再进一步的方案:对所述d
train
进行随机重复采样得到d
train-1
前,为了保证模型的准确性和鲁棒性,需要对训练集d
train
进行数据清洗和预处理,包括去除重复数据、处理缺失数据、标准化数据等操作。同时,还需要进行模型选择和超参数调优等步骤,以提高模型的性能和泛化能力。
20.作为本发明再进一步的方案:所述数据清洗和预处理包括去除重复数据、处理缺失数据、标准化数据。
21.作为本发明再进一步的方案:对所述训练集d
train
进行数据清洗和预处理的同时,需要进行模型选择和超参数调优。
22.作为本发明再进一步的方案:所述第二层训练模型的具体训练过程如下:
23.构造一个随机森林分类器(rf)和一个adaboost分类器,以生成训练模型h2={h1,h2};
24.对新训练集d
train-2
进行重复采样获得2组训练集d
newtrain-2
={dt1,dt2},同时将未采集到的数据进行合并去重,得到第二层训练模型的新验证集d
val-2

25.用训练集d
newtrain-2
对训练模型h2进行训练,并使用训练好的训练模型h2对验证集进行预测,生成融合训练集d
train-3

26.作为本发明再进一步的方案:所述推荐列表按照用户偏好程度从高到低依次排列。
27.本技术还公开一种融合多维度策略体系构建的流程分析系统,包括:
28.第一训练模块,用于建立第一层训练模型,使用随机重复采样方法,对每一个基础
模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2

29.第二训练模块,用于建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3

30.融合模块,用于融合模型,将随机森林模型(rf)作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;
31.资源获取模块,用于获得目前用户偏好与其对应的资源;
32.资源推荐模块,用于生成推荐列表,推送给用户。
33.与现有技术相比,本发明的有益效果是:
34.本技术借鉴用户普遍的认知心理,将系统中的关键用户推荐作为用户选择的一个重要因素,同时综合对客观评分的动态处理,建立用户偏好模型。从用户个人情绪需求角度,定制资源的情感内涵特征能够反映用户对资源的偏好,作为资源推荐集合生成的依据。融合情感评分和关键用户推荐两个维度建立用户偏好,有策略地依据共同评分的资源数目计算用户偏好程度,能够适应数据集类型及稀疏程度的变化,保证了推荐的准确率,同时有效地提升了推荐的覆盖率,具有较强的扩展性,提高了推荐资源的分类准确度,增加了用户选中满意资源的机会。
附图说明
35.图1为一种融合多维度策略体系构建的流程分析方法的流程图;
36.图2为一种融合多维度策略体系构建的流程分析系统的结构框图;
37.图3为本技术第一层训练模型的训练预测示意图;
38.图4为本技术第二层训练模型的训练预测示意图;
39.图5为本技术融合模型的训练预测示意图。
具体实施方式
40.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.正如本技术的背景技术中提及的,发明人经研究发现,现有的推荐流程系统无法有效建立用户的个人偏好,推荐资源的分类准确度不高。为了解决上述缺陷,本技术借鉴用户普遍的认知心理,将系统中的关键用户推荐作为用户选择的一个重要因素,同时综合对客观评分的动态处理,建立第一层训练模型与第二层训练模型,再进行模型融合,最后有效建立用户的个人偏好,提高推荐资源的分类准确度。
42.以下将结合附图对本技术的方案如何解决上述技术问题详细介绍。
43.请参阅图1~5,本发明实施例中,一种融合多维度策略体系构建的流程分析方法,
包括以下步骤:
44.建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2

45.建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3

46.融合模型,将随机森林模型(rf)作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;
47.获得目前用户偏好与其对应的资源;
48.生成推荐列表,推送给用户。
49.在本实施例中:所述第一层训练模型的具体训练过程如下:
50.构造3个不同参数的cart随机森林模型(rf)和和3个不同参数的mlp多层神经网络adaboost模型(ada)作为基于关键用户推荐和资源情感评分两个维度的训练模型h1={h1,h2,
……
h6};
51.针对基础模型h1,对现有的已验证数据中提取关键用户推荐与资源情感评分两个维度通过贝叶斯推理、dempster-shafer证据推理、人工神经网络、模糊逻辑和卡尔曼过滤等数据融合技术生成训练集得到d
train
,进行随机重复采样得到6组训练集d
train-1
={d
t1
,d
t2

……dt6
};
52.将训练集d
train
中除了训练集d
train-1
外数据作为验证集d
val
={d
v1
,d
v2

……dv6
},再针对验证集d
val
,对d
val
中的数据进行去重,只保留不重复的数据,最后记为验证集d
val-1
;相比传统使用固定比例的训练数据作为验证集而言,使用未采集到的数据作为该模型的验证集极大地提高了数据的利用率;
53.先用训练集d
train-1
训练基础模型h1,再用训练好的基础模型h1预测验证集d
val-1
,生成新训练集d
train-2
。需要说明的是,由于训练基模型使用的6组训练集是从资源情感评分训练集d
train
中随机重复采样得到的,保证了各组数据之间的差异性;同时预构造的6组模型参数设定都不一样,保证了训练得到的各组基模型之间的差异性;6组训练集之间的部分数据有重复,这些重复数据经过多组不同的模型进行训练,降低了某些数据被单一模型错误学习的概率。使用同一验证集分别在6组训练后的基础模型上进行预测,得到6组独立的预测结果,即生成了包含6列特征向量的特征集,作为第二层训练模型的训练集。
54.在本实施例中:所述cart(classificationandregressiontrees)是一种决策树算法,可用于分类和回归问题,而随机森林(rf)则是一种集成学习算法,它使用多个决策树来改善单一决策树的性能;随机森林使用随机化方法来构建一组决策树,在构建每个决策树时,它随机选择数据样本和特征进行训练,这样可以降低单个决策树过拟合的风险,并提高整个随机森林的泛化性能;对于分类问题,随机森林使用投票法来进行预测,即对于每个测试样本,随机森林中的每个决策树都会给出一个分类结果,最终预测结果是所有决策树结果中出现最多的类别;对于回归问题,随机森林使用平均值来进行预测,即每个决策树预测出来的结果取平均值作为最终预测结果。随机森林模型具有以下优点:随机森林能够处理
大量的高维数据,而且在处理数据时不需要进行特征选择。随机森林能够处理非线性关系,并且能够处理噪声和异常值。随机森林模型具有很高的准确性,并且能够有效地避免过拟合问题。随机森林模型在训练和预测速度上比其他模型都快。随机森林模型是一个强大的机器学习算法,被广泛应用于分类、回归和特征选择等领域。
55.在本实施例中:所述mlp(multi-layerperceptron)多层神经网络是一种基于神经元和层级结构的机器学习模型,它可以用于解决分类和回归问题,mlp模型由输入层、隐藏层和输出层组成,其中每一层都包含多个神经元,每个神经元都通过激活函数将输入信号转化为输出,adaboost(adaptive boosting)是一种集成学习算法,它可以将多个弱分类器组合成一个强分类器,adaboost算法通过对每个训练样本赋予不同的权重,使得弱分类器能够对难分类的样本进行更好的分类,从而提高整个模型的准确性。adaboost算法的主要步骤如下:
56.(1):初始化每个样本的权重为相等值;
57.(2):在每个弱分类器上训练模型,并计算模型的误差率;
58.(3):根据模型的误差率更新每个样本的权重,使分类错误的样本权重增加,分类正确的样本权重减小;
59.(4):使用更新后的样本权重重新训练弱分类器,并计算误差率;
60.(5):重复步骤(3)和(4),直到达到预设的弱分类器数量或误差率小于指定阈值为止;
61.(6):将所有弱分类器的预测结果进行加权投票或加权平均,得到最终的预测结果;
62.adaboost算法在处理高维数据时表现良好,并且能够处理非线性关系。然而,它对噪声和异常值比较敏感,需要进行一定的数据预处理。此外,adaboost算法在训练过程中需要迭代多次,计算量较大,运行速度比较慢。
63.综合而言,mlp多层神经网络和adaboost算法都是强大的机器学习算法,适用于不同的应用场景。mlp多层神经网络在处理高维数据和非线性关系时表现良好,而adaboost算法在处理分类问题时能够有效提高准确性。
64.在本实施例中:对所述d
train
进行随机重复采样得到d
train-1
前,为了保证模型的准确性和鲁棒性,需要对训练集d
train
进行数据清洗和预处理,包括去除重复数据、处理缺失数据、标准化数据等操作。同时,还需要进行模型选择和超参数调优等步骤,以提高模型的性能和泛化能力。d
train
是一个包含提取关键用户推荐和资源情感评分两个维度数据的训练集,使用了多种数据融合技术生成。现在您可以使用该训练集来训练机器学习模型,以便进行推荐和情感评分任务。需要注意的是,不同的数据融合技术在不同的数据集和应用场景下表现可能有所不同,因此在使用d
train
时需要根据具体情况选择适当的机器学习算法和模型。
65.在本实施例中:所述数据清洗和预处理包括去除重复数据、处理缺失数据、标准化数据。
66.在本实施例中:对所述训练集d
train
进行数据清洗和预处理的同时,需要进行模型选择和超参数调优。
67.在本实施例中:所述第二层训练模型的具体训练过程如下:
68.构造一个随机森林分类器(rf)和一个adaboost分类器,以生成训练模型h2={h1,h2};
69.对新训练集d
train-2
进行重复采样获得2组训练集d
newtrain-2
={dt1,dt2},同时将未采集到的数据进行合并去重,得到第二层训练模型的新验证集d
val-2

70.用训练集d
newtrain-2
对训练模型h2进行训练,并使用训练好的训练模型h2对验证集进行预测,生成融合训练集d
train-3

71.在本实施例中:所述推荐列表按照用户偏好程度从高到低依次排列。
72.本技术还公开一种融合多维度策略体系构建的流程分析系统,包括:
73.第一训练模块,用于建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2

74.第二训练模块,用于建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3

75.融合模块,用于融合模型,将随机森林模型(rf)作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;
76.资源获取模块,用于获得目前用户偏好与其对应的资源;
77.资源推荐模块,用于生成推荐列表,推送给用户。
78.本发明借鉴用户普遍的认知心理,将系统中的关键用户推荐作为用户选择的一个重要因素,同时综合对客观评分的动态处理,建立用户偏好模型。从用户个人情绪需求角度,定制资源的情感内涵特征能够反映用户对资源的偏好,作为资源推荐集合生成的依据。融合情感评分和关键用户推荐两个维度建立用户偏好,有策略地依据共同评分的资源数目计算用户偏好程度,能够适应数据集类型及稀疏程度的变化,保证了推荐的准确率,同时有效地提升了推荐的覆盖率,具有较强的扩展性,提高了推荐资源的分类准确度,增加了用户选中满意资源的机会。
79.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
80.以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

技术特征:
1.一种融合多维度策略体系构建的流程分析方法,其特征在于,包括以下步骤:建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2
;建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3
;融合模型,将随机森林模型作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;获得目前用户偏好与其对应的资源;生成推荐列表,推送给用户。2.根据权利要求1所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述第一层训练模型的具体训练过程如下:构造3个不同参数的cart随机森林模型和和3个不同参数的mlp多层神经网络adaboost模型作为基于关键用户推荐和资源情感评分两个维度的训练模型h1={h1,h2,
……
h6};针对基础模型h1,对现有的已验证数据中提取关键用户推荐与资源情感评分两个维度通过贝叶斯推理、dempster-shafer证据推理、人工神经网络、模糊逻辑和卡尔曼过滤生成训练集得到d
train
,进行随机重复采样得到6组训练集d
train-1
={d
t1
,d
t2

……
d
t6
};将训练集d
train
中除了训练集d
train-1
外数据作为验证集d
val
={d
v1
,d
v2

……
d
v6
},再针对验证集d
val
,对d
val
中的数据进行去重,只保留不重复的数据,最后记为验证集d
val-1
;先用训练集d
train-1
训练基础模型h1,再用训练好的基础模型h1预测验证集d
val-1
,生成新训练集d
train-2
。3.根据权利要求2所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述cart是一种决策树算法,可用于分类和回归问题,而随机森林则是一种集成学习算法,它使用多个决策树来改善单一决策树的性能;随机森林使用随机化方法来构建一组决策树,在构建每个决策树时,它随机选择数据样本和特征进行训练,这样可以降低单个决策树过拟合的风险,并提高整个随机森林的泛化性能;对于分类问题,随机森林使用投票法来进行预测,即对于每个测试样本,随机森林中的每个决策树都会给出一个分类结果,最终预测结果是所有决策树结果中出现最多的类别;对于回归问题,随机森林使用平均值来进行预测,即每个决策树预测出来的结果取平均值作为最终预测结果。4.根据权利要求2所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述mlp多层神经网络是一种基于神经元和层级结构的机器学习模型,它可以用于解决分类和回归问题,mlp模型由输入层、隐藏层和输出层组成,其中每一层都包含多个神经元,每个神经元都通过激活函数将输入信号转化为输出,adaboost是一种集成学习算法,它可以将多个弱分类器组合成一个强分类器,adaboost算法通过对每个训练样本赋予不同的权重,使得弱分类器能够对难分类的样本进行更好的分类,从而提高整个模型的准确性。5.根据权利要求2所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,对所述d
train
进行随机重复采样得到d
train-1
前,为了保证模型的准确性和鲁棒性,需要对训
练集d
train
进行数据清洗和预处理,包括去除重复数据、处理缺失数据、标准化数据等操作,同时,还需要进行模型选择和超参数调优等步骤,以提高模型的性能和泛化能力。6.根据权利要求5所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述数据清洗和预处理包括去除重复数据、处理缺失数据、标准化数据。7.根据权利要求6所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,对所述训练集d
train
进行数据清洗和预处理的同时,需要进行模型选择和超参数调优。8.根据权利要求1所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述第二层训练模型的具体训练过程如下:构造一个随机森林分类器和一个adaboost分类器,以生成训练模型h2={h1,h2};对新训练集d
train-2
进行重复采样获得2组训练集d
newtrain-2
={dt1,dt2},同时将未采集到的数据进行合并去重,得到第二层训练模型的新验证集d
val-2
;用训练集d
newtrain-2
对训练模型h2进行训练,并使用训练好的训练模型h2对验证集进行预测,生成融合训练集d
train-3
。9.根据权利要求1所述的一种融合多维度策略体系构建的流程分析方法,其特征在于,所述推荐列表按照用户偏好程度从高到低依次排列。10.一种融合多维度策略体系构建的流程分析系统,其特征在于,包括:第一训练模块,用于建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,每一次随机重复采样后,将该未采集到的数据作为该基础模型的验证集使用,最后生成新训练集d
train-2
;第二训练模块,用于建立第二层训练模型,对新训练集d
train-2
进行重复采样得到第二层训练模型的训练集,对未采集到的数据进行合并去重得到第二层训练模型的验证集,用训练好的第二层训练模型对验证集进行预测,生成融合训练集d
train-3
;融合模块,用于融合模型,将随机森林模型作为融合层训练的模型,将在第二层训练模型预测得到的融合训练集d
train-3
分别作为该模型的训练集和测试集,将最后在训练好的融合模型上经过随机验证集验证后的结果作为模型融合后的最终用户偏好预测结果;资源获取模块,用于获得目前用户偏好与其对应的资源;资源推荐模块,用于生成推荐列表,推送给用户。

技术总结
本发明公开了一种融合多维度策略体系构建的流程分析方法及系统,属于推荐流程系统领域,方法包括以下步骤:建立第一层训练模型,使用随机重复采样方法,对每一个基础模型的训练集都进行随机重复采样,最后生成新训练集D


技术研发人员:张谋东 陈雄华 陈家铭
受保护的技术使用者:厦门海晟融创信息技术有限公司
技术研发日:2023.03.31
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐