一种制造业多价值链协同数据空间机器学习数据分析方法与流程

未命名 07-15 阅读：100 评论：0

1.本发明属于多源异构数据机器学习领域，尤其涉及一种制造业多价值链协同数据空间机器学习数据分析方法。

背景技术：

2.数据空间作为新兴的数据储存和管理技术，可以帮助数据生产单位有效地管理和维护数据，保护数据资产、打通数据孤岛。制造业多价值链协同数据空间是指将数据空间概念应用于当前制造业，由制造企业主体和协作企业的多条协同价值链所产生的大量多源异构数据及关系组成的集合。
3.目前，多价值链协同数据空间中的异域、异源、异构数据问题，广泛存在于我国制造业及其协作企业中。如何依托数据空间，充分利用智能计算、云计算等技术支持，建立机器学习决策及优化算法库，创新性地构建多学科交叉的组合机器学习方法，从而为制造业的生产及库存提供决策支持，是制造业行业亟待解决的问题。
4.通过利用处理分析后的多源异构数据对比结果可以提升制造业企业及其协作企业运营能力、加强企业间的合作、促使企业实现经营管理的横向统一，从生产、供应、营销和服务等多方面以合作形式展开一系列增值活动，形成制造业多价值链。

技术实现要素：

5.针对上述问题，本发明提出一种制造业多价值链协同数据空间机器学习数据分析方法，在制造业及其协作企业多价值链协同数据空间的大背景下，以制造业及其协作企业为主体，构建制造业多价值链协同数据空间机器学习智能优化决策方法，包括运用爬虫、离线采集etl、实时采集flume/kafka等方法的数据采集与数据预处理；运用bp(back propagation)神经网络、卷积神经网络(convolutional neural networks，cnn)、循环神经网络(recurrent neural network,rnn)等方法的数据关联与建模；运用划分训练集进行的模型训练与参数调整，利用处理分析后的多源异构数据对比结果为企业提供节约成本、智能管理、竞价定价等多方面的决策支持。
6.一种制造业多价值链协同数据空间机器学习数据分析方法，包括以下步骤：
7.步骤1：数据采集与数据预处理；
8.采集制造业多价值链的供应、营销、服务和生产环节各影响因素的异域、异源、异构数据，同时对采集的多源异构数据进行数据预处理，初步建立多源异构数据集；
9.步骤2：预测模型库以及模型参数优化库的建立；
10.将制造业多多价值链的供应、营销及服务环节的各影响因素作为输入，生产作为输出，利用多个神经网络分别进行学习建立预测模型库；根据预测模型的特点建立参数优化库；
11.步骤3：模型训练及优化；
12.将所述步骤1中的数据集按照一定比例划分为训练集、验证集和测试集，对所述步
骤2所建立的模型库中的各个模型进行训练，同时利用参数优化库中的优化算法对各模型的参数进行优化得到最优模型；
13.步骤4：生产预测；
14.将制造业多价值链的供应、营销及服务环节的各影响因素数据输入所述步骤3得到的最优模型中，得到制造业企业的生产预测值。
15.进一步，步骤1中的数据采集方法包括爬虫、离线采集etl、实时采集flume/kafka。
16.进一步，数据预处理包括数据清理、数据集成、数据变换、数据归约。
17.进一步，步骤2中的神经网络包括bp神经网络、卷积神经网络、循环神经网络。
18.进一步，参数优化库的优化算法包括bas搜索算法、粒子群优化算法、遗传算法、adam优化算法、cs算法。
19.进一步，bp神经网络的学习率取值在0.01-0.8之间。
20.进一步，卷积神经网络学习过程中批次大小调整范围为[16,128]内。
[0021]
进一步，循环神经网络rnn隐藏层的节点数量以级数(32,64,128,256)方式优化调整。
[0022]
进一步，步骤1中的数据预处理中，采用异常值20％修匀处理方法对异常值进行判定和修正。
[0023]
进一步，异常值20％修匀处理方法包括：假设制造业各价值链各影响因素数据为x1,x2,
…
xn，取平均值
[0024][0025]
若xi》p(1+20％)或xi《p(1-20％)，则判定该数值为异常值，需要进行处理；处理方法为：
[0026]
当xi》p(1+20％)时，取xi＝p(1+20％)；
[0027]
当xi《p(1-20％)时，取xi＝p(1-20％)。
[0028]
本发明的有益效果在于：在基于数据空间进行准确需求预测时，可以减少原材料的冗余，同时实现库存优化，降低生产成本；能够帮助企业做出智能精准决策，同时数据空间也可以为企业提供个性化智慧服务，有效做到协同知识挖掘，从而提高企业采购、制造、物流、营销和服务等管理水平。制造业多价值链协同数据空间机器学习数据分析方法的运用可以提高企业数据分析与决策支持的能力，对促进我国制造业经济高质量发展、创造新的价值、降低企业成本、提高企业效益和智能化管理水平等具有重要的理论和实际意义。
附图说明
[0029]
图1是本发明的一种制造业多价值链协同数据空间机器学习数据分析方法的流程图；
[0030]
图2是本发明的一个具体实施方式中外部价值链综合因素变化图；
[0031]
图3是本发明的一个具体实施方式中生产库存综合因素变化图；
[0032]
图4是本发明的一个具体实施方式中外部价值链累计综合因素变化图；
[0033]
图5是本发明的一个具体实施方式中生产库存累计综合因素变化图；
[0034]
图6是本发明的一个具体实施方式中模型训练输出结果。
具体实施方式
[0035]
下面结合附图，对实施例作详细说明。
[0036]
如图1所示，为本发明提出的一种制造业多价值链协同数据空间机器学习数据分析方法的流程图。
[0037]
1.数据采集及数据预处理
[0038]
数据采集是将数据从数据源中收集、识别以及选取的过程，为全面、客观地反映制造业及其协作企业经营状况，并给决策者提供可靠的决策依据，本发明通过爬虫技术、离线采集、实时采集等多种数据采集方式，对制造企业及其所有的协作企业的多源异构数据进行挖掘抽取，将其存储为支持邮件、文本、移动通信、图像和webpage等多种形式的数据文件，主要方式如下：
[0039]
(1)网络爬虫采集
[0040]
网络爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，最常见的爬虫便是我们经常使用的搜索引擎，如百度，360搜索等，此类爬虫统称为通用型爬虫，对于所有的网页进行无条件采集。网络爬虫可以自动采集所有其能够访问到的页面内容，为搜索引擎和大数据分析提供数据来源，从一个或若干初始网页的url开始，获得初始网页上的url，爬虫将网页中所需要提取的资源进行提取并保存，同时提取出网站中存在的其他网站链接，经过发送请求，接收网站响应以及再次解析页面，提取所需资源并保存，再将网页中所需资源进行提取。以此类推，直至满足系统的一定停止条件。
[0041]
(2)etl离线采集
[0042]
etl是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程，目的是将企业中的分散、零乱、标准不统一的数据整合到一起，为企业的决策提供分析依据。etl采集包括数据抽取、数据的清洗转换、数据的加载，数据的抽取是从各个不同的数据源抽取到ods(operational data store，操作型数据存储)中，此过程中也可以进行一些数据的清洗与转换，在抽取的过程中需要挑选不同的抽取方法，尽可能的提高etl的运行效率。数据转换一般情况下工作量是整个etl的2/3，在转换的过程中，需要针对具体的业务场景对数据进行治理，例如进行非法数据监测与过滤、格式转换与数据规范化、数据替换、保证数据完整性等。数据的加载一般在数据清洗完了之后直接写入dw(data warehousing，数据仓库)中去。
[0043]
(3)flume实时采集
[0044]
实时采集主要用在考虑流处理的场景，比如，用于记录数据源的执行的各种操作活动，比如网络监控的流量管理、金融应用的股票记账和web服务器记录的用户访问行为。flume是一种提供高可用、高可靠、分布式海量日志采集、聚合和传输的系统。flume支持在日志系统中定制各类数据发送方，用于采集数据，同时，flume提供对数据进行简单处理，并写到各种数据接收方的能力，这是实时采集日志的数据采集引擎。并且可以采集socket数据包、文件、文件夹、kafka等各种形式源数据，又可以将采集到的数据输出到hdfs、hbase、hive、kafka等众多外部存储系统中。一般的采集需求，通过对flume的简单配置即可实现，针对特殊场景，flume也具备良好的自定义扩展能力，因此可以适用于大部分的日常数据采集场景。
[0045]
在实际处理数据的过程中，会得到一些存在缺失值、重复值等的数据，因此，在使
用之前需要进行数据预处理。数据预处理通常针对不同的任务和数据集属性的不同而不同，主要分为数据清理、数据集成、数据归约和数据变换。
[0046]
数据清理的主要思想是通过填补缺失值、光滑噪声数据，平滑或删除离群点，并解决数据的不一致性来清理数据。如果数据是脏乱的，那么基于这些数据的挖掘结果，即输出的结果是不可靠的。数据分析任务多半涉及数据集成，数据集成将多个数据源中的数据结合成、存放在一个一致的数据存储，如数据仓库中这些源可能包括多个数据库、数据方或一般文件。数据归约技术可以用来得到数据集的归约表示，它虽然小得多，但仍接近地保持原数据的完整性。在归约后的数据集上挖掘将更有效，并产生相同或几乎相同的分析结果，一般有维度归约、维度变换等策略。数据变换则包括对数据进行规范化、离散化，稀疏化处理，达到适用于挖掘的目的。
[0047]
2.基于组合机器学习算法库的物资需求(生产)预测模型
[0048]
本方法面向制造企业及协作企业群形成的产业价值链，以多价值链协同数据空间中的历史供应数据、服务故障预警数据和质量数据为依据，通过数据驱动和专家知识相结合方式，构建随机扰动下的深度学习和迁移学习的供应、营销及服务与物资需求(生产)之间的预测模型。
[0049]
(1)bp神经网络
[0050]
bp神经网络(back propagation neural network，bpnn)又称反向传播神经网络，通过样本数据的训练，不断修正网络权值和阈值使误差函数沿负梯度方向下降，逼近期望输出。它是一种应用较为广泛的神经网络模型，多用于函数逼近、模型识别分类、数据压缩和时间序列预测等。采用bp神经网络预测物资需求量具体实施步骤如下：
[0051]
step1：数据预处理。可在总体数据采集与预处理步骤完成，确定输入样本与输出样本后，通过实施归一化处理，使所有结果介于0-1之间，数据通过仿真和训练之后，最后将其实施反归一化处理。
[0052]
step2：确立模型网络结构。结构上bp神经网络具有输入层、隐含层和输出层，输入层由影响因素确定，输出层以物资需求确定。一般来说隐含层个数由以下公式确定：
[0053][0054]
其中，n为输入层神经元个数，m为输出层神经元个数，a为[1,10]之间的常数。
[0055]
从输入层到隐含层的计算公式为：
[0056][0057]
从隐含层到输出层的计算公式为：
[0058][0059]
其中，p为输入层神经元节点数，l为隐含层神经元节点数；b1和b2为阈值；ω
pl
和ω
lm
为连接权值；隐含层输出结果为f1(s
l
)，f1为该层的激活函数；输出层输出结果为f2(sm)，f2为输出层的输出函数。
[0060]
step3：设置激活函数。激活函数的主要作用是改变之前数据的线性关系，如果网络中全部是线性变换，则多层网络可以通过矩阵变换，直接转换成一层神经网络，所以激活
函数的存在，使得神经网络的“多层”有了实际的意义，使网络更加强大，增加网络的能力，使它可以学习复杂的事物，复杂的数据，以及表示输入输出之间非线性的复杂的任意函数映射。bp神经网络通常采用sigmoid、tanh、relu等作为激活函数。
[0061]
step4：模型实现。设定激活函数后设定网络参数，包括学习速率、训练次数、期望误差等多个指标，设定完成后进行训练网络。当重复学习达到期望误差后则完成学习，将各项指标输入网络即可得到预测数据。
[0062]
(2)卷积神经网络
[0063]
卷积神经网络(convolutional neural networks,cnn)是具有参数共享和稀疏连接两个特征的前馈神经网络，可以有效地捕获原始数据的特征，也是少数参考大脑视觉组织来建立的深度学习模型，建模过程如下：
[0064]
step1：确定数据集，处理数据以便进行输入模型。
[0065]
step2：向前传导。
[0066]
卷积层是一个cnn中的核心内容，经过多层卷积可以提取得到更加深层次的特征数据，每一个节点的输入，也是上一层神经网络数据的结果。每个卷积核跟上一层特征图进行卷积计算，在经过一个激活函数后，得到抽象程度更高的特征。运用公式计算卷积过程。
[0067][0068]
式中，l为卷积神经网络结构层数；j代表第j个通道；为卷积层第j个通道输出；为激活函数；nj代表特征图子集；与*分别代表卷积核与卷积操作；为偏置项。
[0069]
运用池化层可以有效地对特征图进行降维处理，降低数据处理量，减少网络参数，提高计算效率，计算如下：
[0070][0071]
式中，为池化操作过程；w和bs为权值矩阵和偏置。
[0072]
在全连接网络中，针对上一层的网络点特征图的拼接，作为全网链接网络的输入，并进行全连接计算，计算公式为：
[0073][0074]
其中，wj为全连接网络权值。
[0075]
step3：反向传播。计算模型误差，而后对参数集进行迭代更新，满足精度条件或迭代次数条件后迭代停止。
[0076]
step4：将模型应用于测试样本，输出预测值并分析预测结果。
[0077]
(3)循环神经网络
[0078]
循环神经网络(recurrent neural network,rnn)是一类以序列数据为输入，在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络。
[0079]
step1：预处理历史数据，进而选择部分数据组成训练样本，其它数据为测试样本，从而构造模型样本。
[0080]
step2：创建rnn模型架构。rnn可将先后输入联系起来，其循环的隐含层由此刻的输入以及上一时刻的值共同决定。rnn记录当前传入信号，处理计算后作为当前传出信息使
隐含层之内各个节点彼此联系。隐含层向外传递信号为：
[0081]ht
＝f(uh
t-1
+wx
t
+bh)
[0082]
其中，是rnn的激活函数；u是由输入层至隐含层的权重；w为记忆单元到隐含层之间的权重；b为偏置项。
[0083]
step3：得到隐含层输出后，神经网络进行传出，如下所示：
[0084]yt
＝g(vh
t
+by)
[0085]
其中，为输出层的激活函数，参数v是隐含层到输出层的参数矩阵。
[0086]
step4：基于rnn前向传播算法，进行rnn反向传播算法流程，即通过梯度下降法轮次迭代，得到合适的rnn模型参数u，w，v，b，c等。
[0087]
step5：得出最优结果，将模型预测结果与实测数据进行对比验证方法有效性。
[0088]
本发明方法中的组合机器学习算法库中参数库与优化库概览如下表1-表2所示：
[0089]
表1组合机器学习算法参数库
[0090][0091]
[0092]
表2组合机器学习算法优化库
[0093][0094]
本发明的方法以多价值链协同数据空间中的历史供应数据、服务故障预警数据和质量数据为依据，构建制造业多价值链协同数据空间下的组合机器学习算法模型与参数库、优化库进行嵌套使用，可甄选多种参数与优化算法对物资需求预测模型进行精度调整，对比模型结果，达到预测精度最优。
[0095]
3.模型训练与调参
[0096]
为提高模型预测的精度，模型框架搭建后根据需要按比例划分的训练集用于模型训练，经建模输出得到预测结果、即测试集，与验证集进行比较，根据训练结果调整参数，进一步优化预测模型工作结果，组合机器学习方法重要可调参数如下。
[0097]
(1)bp神经网络
[0098]
在bp神经网络模型进行训练与调参时，模型训练集准确率的表现会随着学习率增加而较为剧烈，当bp神经网络loss曲线表现为震荡时，需要考虑降低学习率或者增加batch size。在bp神经网络中，学习率的调整较为关键，学习率过小导致收敛过程较慢，学习率过大会造成收敛过程的跳跃，因此取值在0.01-0.8之间进行调整。
[0099]
考虑到降低学习率虽然可以提升稳定性，但同时也降低了收敛速度或产生局部最优，因此，针对下降速度或收敛速度比较慢可以使用优化器进行调整。
[0100]
(2)卷积神经网络cnn
[0101]
针对卷积神经网络的参数调整来说，训练深层神经网络耗时较久且需要配置多个参数，较为重要的超参数主要有以下几种。
[0102]
首先，学习率是指在优化算法中更新网络权重的幅度大小，可以是恒定的、逐渐降低的、基于动量的或者是自适应的，采用哪种学习率取决于所选择优化算法的类型，如sgd、adam、adagrad、adadelta或rmsprop等算法。
[0103]
其次是迭代次数，迭代次数是指整个训练集输入到神经网络进行训练的次数。当测试错误率和训练错误率相差较小时，可认为当前的迭代次数是合适的，否则需继续增大迭代次数，或调整网络结构。
[0104]
最后，卷积神经网络学习过程中对批次大小调整较为敏感，小批次一般会表现得更好，选取范围一般在[16,128]内。
[0105]
(3)循环神经网络rnn
[0106]
在rnn训练与参数调整时，当rnn隐藏层节点数量的大小足够大，使之能够很好地拟合数据。取值越大模型能力会越强，但是训练速度会下降，取值过大使需要计算的权重过多，导致神经网络难以训练。因此rnn隐藏层的节点数量选择时可以级数(32,64,128,256)方式优化调整而不是线性调整，神经网络的表现会更偏向指数特性而不是线性特性。
[0107]
其次，迭代次数的选择主要是需要使神经网络的训练损失值接近或达到最小。一般选择的情况：当给出更多训练次数，神经网络的结果不再有太大的改善时附近的值。
[0108]
最后，学习率参数的调整对rnn具有重要作用，学习率越小越容易拟合，但学习更新相对较慢；学习率较大参数迭代更新越快，但输出误差在反向传播过程中对参数影响相应增大，可通过新建优化器对其调整。同时注意构建新的优化器会重新初始化动量等状态信息，这对使用动量的优化器来说可能会造成损失函数在收敛过程中出现震荡。
[0109]
4.数据分析以支持企业生产决策
[0110]
将机器学习算法库嵌入系统，通过采集制造业多价值链数据空间中海量的多源异构数据，将服务、营销、供应价值链作为模型输入指标，生产价值链作为模型输出指标进行物资需求预测相关工作。
[0111]
通过将近年来最前沿的深度学习方法进行组合、嵌套、优化、调参形成机器学习算法库，并应用到制造业多价值链数据空间领域中，最大化地挖掘多源异构数据背后的数据资料功能、发挥数据作用，一方面提取有用信息，对数据加以详细研究、解读和概括总结，通过对生产订单数量、库存产品数量等生产价值链指标的合理预估，形成相应的结论，为制造业企业的库存成本核算、工单投产、生产需求、订单路径分析等多方面决策提供支持。另一方面，通过建立制造业多价值链协同数据空间机器学习数据分析方法，形成数据生成、汇聚、存储、分析、使用过程的价值链协同数据体系架构，较大提高制造企业智能化管理水平、综合竞争力和综合效益，产生重大的理论和应用成果，形成示范效应，引领前沿发展，促进社会进步。
[0112]
下面通过具体的实施方式来对本发明的方法进行说明。
[0113]
以某电力制造企业为研究对象，通过爬虫、etl采集等方式收集了该企业自2010年1月至2021年10月经营过程中的供应、营销、服务以及生产库存月度数据，并对该缺失数据进行仿真处理。数据情况如图2和3所示。
[0114]
为了保证仿真数据建模的有效性，本发明对数据进行处理。首先对数据的异常值进行修正，然后利用异常值20％修匀技术、累计平滑法以及归一化处理法对数据进行预处理。
[0115]
(1)异常值20％修匀技术
[0116]
对于异常值的判断准则，本发明采用异常值20％修匀处理技术进行判定。设多价值链各影响因素数据为x1,x2,xn，取平均值
[0117][0118]
若xi》p(1+20％)或xi《p(1-20％)，则判定该数值为异常值，需要进行处理。
[0119]
处理方法为：
[0120]
当xi》p(1+20％)时，取xi＝p(1+20％)；
[0121]
当xi《p(1-20％)时，取xi＝p(1-20％)。
[0122]
(2)累计平滑法
[0123]
本发明对数据波动较大的影响因素序列采用累加平滑的方式，该方法能够有效平滑数据，使得数据变化出现随时间变动的基本规律，从而为后续生产决策提供良好的数据基础。具体做法是：当数据随时间变化呈现不规律波动且异常值较多时，在修正异常值的基础上，计算每一时点的累计数值作为这一点的数据，使得整体数据变化呈现上升趋势。用这种方法得到的研究结果也同样为累计值，因此，还需要将累计值还原成实际数据。通过这种方法可以提高研究的准确度，实现有效的数据平滑处理。
[0124]
(3)数据归一化处理
[0125]
为消除数量级不匹配的影响，在模型训练之前需要对输入输出数据进行归一化处理。本发明将数据归一化到[0,1]上，转化公式如式(2)所示：
[0126][0127]
最后，得到的生产决策结果要进行反归一化，转化方式为：
[0128][0129]
其中，x为原始数据，xn为归一化后的数据，x
max
和x
min
分别表示数据中的最大值和最小值。
[0130]
根据以上数据预处理过程，本发明最终得到经过预处理的外部价值链供应(c_icsu)、营销(c_icm)、服务(c_icse)月度数据和内部价值链生产决策变量(c_piq)。数据处理后的情况如图4和5所示。
[0131]
选用基于bp、cnn、rnn及其优化参数方法的机器学习算法库，以bas(天牛须)优化方法为例，作为数据分析模型进行研究，为了验证该机器学习算法库对制造业多价值链协同数据分析的有效性，并设定机器学习算法库的模型训练参数库如下表所示。
[0132]
表3模型训练参数库
[0133]
[0134]
根据以上模型构建参数，本发明将c_icsu、c_icm以及c_icse作为以上模型的输入变量，c_piq作为模型的输出变量，利用前92个月度数据进行神经网络的训练，输出后50个测试集数据，并与实际生产决策结果进行对比分析。得到结果如图6所示。
[0135]
根据机器学习算法库的输出结果，经对比分析后发现bas-cnn的预测结果拟合效果最优，因此选择bas-cnn算法的预测值作为机器学习算法库的输出结果，进而根据生产库存量的预测结果对各个月度的库存情况进行调整，从而提高库存周转率、降低该电力制造业企业的库存成本。
[0136]
此实施例仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应该以权利要求的保护范围为准。

技术特征：
1.一种制造业多价值链协同数据空间机器学习数据分析方法，包括以下步骤：步骤1：数据采集与数据预处理；采集制造业多价值链的供应、营销、服务和生产环节各影响因素的异域、异源、异构数据，同时对采集的多源异构数据进行数据预处理，初步建立多源异构数据集；步骤2：预测模型库以及模型参数优化库的建立；将制造业多多价值链的供应、营销及服务环节的各影响因素作为输入，生产作为输出，利用多个神经网络分别进行学习建立预测模型库；根据预测模型的特点建立参数优化库；步骤3：模型训练及优化；将所述步骤1中的数据集按照一定比例划分为训练集、验证集和测试集，对所述步骤2所建立的模型库中的各个模型进行训练，同时利用参数优化库中的优化算法对各模型的参数进行优化得到最优模型；步骤4：生产预测；将制造业多价值链的供应、营销及服务环节的各影响因素数据输入所述步骤3得到的最优模型中，得到制造业企业的生产预测值。2.根据权利要求1所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述步骤1中的数据采集方法包括爬虫、离线采集etl、实时采集flume/kafka。3.根据权利要求1所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述数据预处理包括数据清理、数据集成、数据变换、数据归约。4.根据权利要求1所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述步骤2中的神经网络包括bp神经网络、卷积神经网络、循环神经网络。5.根据权利要求1所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述参数优化库的优化算法包括bas搜索算法、粒子群优化算法、遗传算法、adam优化算法、cs算法。6.根据权利要求4所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，bp神经网络的学习率取值在0.01-0.8之间。7.根据权利要求4所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，卷积神经网络学习过程中批次大小调整范围为[16,128]内。8.根据权利要求4所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，循环神经网络隐藏层的节点数量以级数(32,64,128,256)方式优化调整。9.根据权利要求1所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述步骤1中的数据预处理中，采用异常值20％修匀处理方法对异常值进行判定和修正。10.根据权利要求9所述的一种制造业多价值链协同数据空间机器学习数据分析方法，其特征在于，所述异常值20％修匀处理方法包括：假设制造业各价值链各影响因素数据为x1,x2,
…
x
n
，取平均值若x
i
>p(1+20％)或x
i
<p(1-20％)，则判定该数值为异常值，需要进行处理；处理方法为：
当x
i
>p(1+20％)时，取x
i
＝p(1+20％)；当x
i
<p(1-20％)时，取x
i
＝p(1-20％)。

技术总结
本发明提出一种制造业多价值链协同数据空间机器学习数据分析方法，采集制造业多价值链的供应、营销、服务和生产环节的异域、异源、异构数据，并对数据预处理，建立多源异构数据集；将供应、营销及服务环节个影响因素作为输入，生产作为输出，利用多个神经网络分别进行学习建立预测模型库，同时建立参数优化库；将数据集按照一定比例划分为训练集、验证集和测试集，对模型库中的各个模型进行训练，同时利用参数优化库中的优化算法对各模型的参数进行优化得到最优模型，利用该模型进行制造业企业的生产预测。本发明方法进一步提高了制造业及其协作企业在研究多模态数据时的协同处理能力，更加可靠地帮助制造业企业做出精确的生产库存决策。产库存决策。产库存决策。

技术研发人员：牛东晓刘云天李明钰彭露瑶郑世鹏孙丽洁余敏耿世平田竹肖张焕粉
受保护的技术使用者：北京清畅电力技术股份有限公司
技术研发日：2023.04.14
技术公布日：2023/7/12

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：基于人脸识别的园区访客数据处理方法及装置与流程 下一篇：基于多维度数据的文章生成方法与流程

一种制造业多价值链协同数据空间机器学习数据分析方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种制造业多价值链协同数据空间机器学习数据分析方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表