一种企业电碳监测模型的构建方法与流程
未命名
10-18
阅读:111
评论:0
1.本发明涉及电碳关系监测技术领域,具体而言,涉及一种企业电碳监测模型的构建方法。
背景技术:
2.随着行业的发展,水泥行业中碳排放管理工作越来越重要。准确计量水泥行业碳排放量是企业进行碳绩效管理的关键。然而,水泥行业碳排放统计口径多样、排放来源复杂,且当前对于水泥行业碳排放检测以传统碳排查方法为主,监测成本高、灵活性低、覆盖范围有限,为准确掌握水泥行业碳排放现状带来较大不确定性。
3.电力是能源消费的重要构成,水泥行业生产过程与电力消费关系密切,且电力消费数据具有准确度高、易于获取、实时性强的特点。水泥行业为流程工艺,当前水泥行业生产工艺与产品较为统一,电力作为水泥生产工艺过程中的关键能源投入,与水泥企业碳排放产生的主要环节高度相关,如熟料制备工段、水泥粉磨工段。研究水泥企业的“电碳”关联关系,建立具有实践意义的水泥企业“电碳”监测模型,对于水泥企业碳排放监测和预测具有应用价值与实际操作意义。
4.而为了获取更准确和更有意义的电碳监测,更是需要建立精准的电碳模型。
技术实现要素:
5.本发明的目的在于提供一种企业电碳监测模型的构建方法,其目的是建立更为精准的电碳模型。
6.本发明的实施例通过以下技术方案实现:
7.一种企业电碳监测模型的构建方法,包括以下步骤:
8.进行指标体系构建,所述指标体系包括因变量和自变量;
9.采集数据集并进行异常点剔除以及变量共线性分析;
10.模型评估与模型选择,获取最终模型;
11.根据选择的最终模型基于所述自变量和所述因变量进行模型构建。
12.优选地,所述因变量包括电碳指数,所述因变量包括熟料生产中碳酸盐分解排放因子、熟料生产电力排放因子、熟料工序耗电量在全厂用电量的占比和水泥熟料产量比值。
13.优选地,所述电碳指数的获取方法为:
[0014][0015]
所述熟料生产中碳酸盐分解排放因子x1的获取方法为:
[0016]
x1=熟料氧化钙含量*44/56+孰料中氧化镁含量*44/40;
[0017]
所述熟料生产电力排放因子x2的获取方法为:
[0018]
x2=(熟料工段余热供电量*0+熟料工段电网供电电量*当地所在区域电网排放因子)/熟料工段耗电量
[0019]
所述熟料工序耗电量在全厂用电量的占比x3的获取方法为:
[0020]
x3=(全厂总用电量-外输电量-水泥工段耗电量)/全厂用电总量
[0021]
所述水泥熟料产量比值x4的获取方法为:
[0022]
x4=水泥产量/熟料产量。
[0023]
优选地,所述进行异常点剔除的方法为:
[0024]
采用均值线性漂移回归模型对数据集进行拟合,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;
[0025]
采用均值线性漂移回归模型对剔除异常值后的数据集,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;
[0026]
重复上一步操作直至没有异常值;
[0027]
所述残差阈值标准为3,所述删除学生化残差为t分布。
[0028]
优选地,所述变量共线性分析的方法为:
[0029]
通过方差膨胀因子对数据变量间多重共线性进行分析,若数据集的共线性强于共线性阈值,在后续的所述模型选择中不考虑lr回归。
[0030]
优选地,所述模型评估与模型选择的方法为:
[0031]
基于多种机器学习算法构建电碳监测模型,通过k折交叉验证对不同模型进行模型评估,选择最终模型。
[0032]
优选地,包括岭回归模型多种所述机器学习算法包括lr线性回归模型、含岭回归模型、lasso模型、elasticnet模型和knn模型方法。
[0033]
优选地,所述k折交叉验证的方法为:
[0034]
将全部样本划分成k个大小相等的样本子集;
[0035]
依次遍历这k个子集,每次把当前子集作为验证集,其余所有样本作为训练集,进行模型的训练和模型评估;
[0036]
输出k次模型评估的指标的平均值以及方差。
[0037]
优选地,所述选择最终模型的方法为:
[0038]
基于模型评价参数选取最终模型,所述模型评价参数用于评估多模型回归拟合效果,模型评价参数为所述k折交叉验证获取的决定系数均值与决定系数方差。
[0039]
优选地,所述根据选择的最终模型基于所述自变量和所述因变量进行模型构建的方法为,基于企业历史数据运用所述最终模型进行拟合,输出模型拟合的评价指标和模型预测公式,实现对水泥企业碳排放水平数据质量的监测;
[0040]
输出的模型拟合的评价指标包括均方根误差、平均绝对误差和决定系数。
[0041]
本发明实施例的技术方案至少具有如下优点和有益效果:
[0042]
本发明可以通过机器学习对水泥行业历史生产数据进行模型模拟,得到水泥企业的电碳指数模型,间接实现以电测碳;
[0043]
本发明采用的自变量全面准确,进一步保障建模结果的准确性;
[0044]
本发明的建模和评估可以提升水泥企业碳排放数据预测的准确性,有利于提升企业碳排放监测、碳盘查的效率,利于监管部门实现对水泥行业碳排放数据质量的监督;
[0045]
根据电力数据及相关生产指标可以实现对水泥企业层面与行业层面碳排放监测,具有客观、简单、便捷的特点,可以有效降低水泥企业碳排放监测成本,提升排放监测效率,
有助于实施和推广;
[0046]
本发明可服务于水泥行业重点排放企业、核查机构等,使用尽可能少的生产活动数据,对企业的碳排放量进行监测与估计,同时对碳排放异常数据进行低成本、高频率的快速定位,从而提高碳排放检测效率和数据质量,助力碳市场有序运行。
附图说明
[0047]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0048]
图1为本发明实施例1提供的一种企业电碳监测模型的构建方法的流程示意图;
[0049]
图2为本发明实施例8提供的不同模型拟合r2箱线图。
具体实施方式
[0050]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0051]
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0052]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
[0053]
实施例1
[0054]
参阅图1,一种企业电碳监测模型的构建方法,包括以下步骤:
[0055]
步骤s1:进行指标体系构建,所述指标体系包括因变量和自变量;
[0056]
步骤s2:采集数据集并进行异常点剔除以及变量共线性分析;
[0057]
步骤s3:模型评估与模型选择,获取最终模型;
[0058]
步骤s4:根据选择的最终模型基于所述自变量和所述因变量进行模型构建。
[0059]
本实施例的核心是利用机器学习算法,通过电力大数据与相关生产数据,对水泥行业碳排放数据进行有效监测和预测,结合水泥企业生产电力消耗特点,构建电力消耗指标与二氧化碳排放总量的关系,研究“电碳指数”的关键影响因子,建立水泥企业电碳监测模型,从而实现以电测碳,达成以电力数据监测碳排放量的目的。
[0060]
实施例2
[0061]
本实施例基于实施例1的技术方案,对步骤s1中的因变量和自变量进行进一步说明。
[0062]
在本实施例中,所述因变量包括电碳指数,所述因变量包括熟料生产中碳酸盐分解排放因子、熟料生产电力排放因子、熟料工序耗电量在全厂用电量的占比和水泥熟料产
量比值。
[0063]
其中,由于水泥行业净购入电量与二氧化碳排放总量并非简单线性关系,为建立较好监测模型,本实施例定义一个新变量电碳指数,电碳指数为企业二氧化碳排放量与净外购电力比值(单位,t co2/mwh)所述电碳指数的获取方法为:
[0064][0065]
所述熟料生产中碳酸盐分解排放因子x1的获取方法为:
[0066]
x1=熟料氧化钙含量*44/56+孰料中氧化镁含量*44/40;
[0067]
所述熟料生产电力排放因子x2的获取方法为:
[0068]
x2=(熟料工段余热供电量*0+熟料工段电网供电电量*当地所在区域电网排放因子)/熟料工段耗电量
[0069]
所述熟料工序耗电量在全厂用电量的占比x3的获取方法为:
[0070]
x3=(全厂总用电量-外输电量-水泥工段耗电量)/全厂用电总量
[0071]
所述水泥熟料产量比值x4的获取方法为:
[0072]
x4=水泥产量/熟料产量。
[0073]
实施例3
[0074]
本实施例基于实施1的技术方案,对步骤s2中的异常点剔除的方法进行进一步说明。
[0075]
作为本实施例的优选方案,所述进行异常点剔除的方法为:
[0076]
采用均值线性漂移回归模型对数据集进行拟合,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;
[0077]
采用均值线性漂移回归模型对剔除异常值后的数据集,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;
[0078]
重复上一步操作直至没有异常值;
[0079]
所述残差阈值标准为3,所述删除学生化残差为t分布。
[0080]
简单来说就是执行一个迭代操作,对数据集进行均值线性漂移回归模型拟合,然后,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除,更新剔除异常值后的数据集,反复迭代直到没有异常值出现,得到最终优化后的数据集。
[0081]
实施例4
[0082]
本实施例基于实施1的技术方案,对步骤s2中变量共线性分析的进行进一步说明。
[0083]
作为优选方案,所述变量共线性分析的方法为:
[0084]
通过方差膨胀因子对数据变量间多重共线性进行分析,若数据集的共线性强于共线性阈值,在后续的所述模型选择中不考虑lr回归。
[0085]
这里涉及的方差膨胀因子简称vif,是表征自变量观察值之间复共线性程度的数值。线性回归分析中,回归系数βj的估计量的方差为σ2cj,cj即为该回归系数的方差膨胀因子,其值如下:
[0086]
[0087]
一般来说:
[0088]
如果vif≤5,代表没有复共线性;
[0089]
如果5《vif≤10,代表有较弱的复共线性;
[0090]
如果10《vif≤100,代表有中等或较强的复共线性;
[0091]
如果vif》100,代表有严重的复共线性。
[0092]
因此,基于以上参数,可以对变量的共线性进行分析。若共线性非常强,这里可以设定一个vif值作为共线性阈值作为参考,超过该vif值则在后续的所述模型选择中不考虑lr回归。
[0093]
实施例5
[0094]
本实施例基于实施1的技术方案,对步骤s3中模型评估与模型选择进行进一步说明。
[0095]
首先,所述模型评估与模型选择的方法可以为:
[0096]
基于多种机器学习算法构建电碳监测模型,通过k折交叉验证对不同模型进行模型评估,选择最终模型。
[0097]
具体地,包括岭回归模型多种所述机器学习算法包括lr线性回归模型、含岭回归模型、lasso模型、elasticnet模型和knn模型方法。
[0098]
在以上模型中,岭回归模型、lasso模型、elasticnet模型均为线性回归下常见的特征选择和模型建立方法,尽管在模型选择、回归系数、回归方法中有差异,但最终拟合结果均可表示为:
[0099]
y=w0+w1x1+w2x2+
…
+wkxk+u;
[0100]
其中,y为因变量,x1、x2、
…
、xk为自变量,w0、w1、
…
、wk值为各自变量的系数,u为模型的残差值。
[0101]
下面简要介绍以上几种模型:
[0102]
lr线性回归模型使用最小二乘法,其系数最小化数据集中观察到的目标与线性近似预测的目标之间的残差平方之和。在数学上,它解决的是这样一个问题:
[0103]
min||xw-y||2岭回归模型,是一种常见的处理多重共线性问题的线性模型。相对于ols,其牺牲回归系数估计的无偏性来降低其估计的均方误差,它可以缓解多重共线问题以及过拟合问题。但由于岭回归中并没有将系数估计收缩到0,而是使得系数估计整体变小,因此,某些时候模型的解释性会大大降低,也无法从根本上解决多重共线问题。
[0104]
在岭回归中,其损失函数为:
[0105][0106]
其中,n表示样本数量,p表示特征数量,yi表示第i个样本的目标值,x
ij
表示第i个样本的第j个特征值,βj表示第j个特征的系数,β0表示截距,λ表示正则化参数。
[0107]
另一方面,lasso模型是一种用于特征选择和回归分析的线性模型。它通过对损失函数加入l1正则化惩罚项,使得模型能够自动地选择出对预测目标最重要的特征,从而达到特征选择和降维的效果。其损失函为:
[0108][0109]
其中,β是回归系数向量,n是样本数量,p是特征数量,x
ij
是第i个样本的第j个特征值,yi是第i个样本的目标变量值,α是超参数,控制正则化的强度。损失函数分为两部分,第一部分是平方误差损失,第二部分是l1正则化项,它对每个系数的绝对值进行惩罚,使得模型更倾向于选择重要的特征,而忽略不重要的特征。
[0110]
相对于岭回归,lasso不仅可以使得系数估计整体变小,而且有将系数估计收缩到0的趋势。因此,在处理某些存在多重共线性的数据问题中,其具有一定的变量选择能力,并且回归结果具有更好的可解释性。但在求解过程中系数估计没有解析解。
[0111]
第三种为elasticnet模型又称弹性网络模型,综合了ridge模型和lasso模型的特点,同时引入了l1范数和l2范数的惩罚项,其损失函数如下式所示:
[0112][0113]
其中,x是自变量矩阵,w是系数向量,y是因变量向量,α是正则化参数,用来控制正则化惩罚项的大小。当α取值较大时,惩罚项的影响较大,能够使得一些系数为0,起到特征选择和降维的作用;ρ为新的超参数,表示添加的两个正则项的比例。
[0114]
最后,还有一种非线性回归模型knn模型。knn法即k最邻近法算法,其核心思想是,如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。knn算法用于回归预测时,同样是寻找新来的预测实例的k近邻,然后对这k个样本的目标值取均值即可作为新样本的预测值。由于knn方法主要靠周围有限的邻近的样本,因此对于类域的交叉或重叠较多的待分样本集来说,knn方法较其他方法更为适合。同时knn算法需要算每个测试点与训练集的距离,当训练集较大时,计算量相当大,时间复杂度高,特别是特征数量比较大的时候。存在样本不平衡问题时(即有些类别的样本数量很多,而其它样本的数量很少),其对稀有类别的预测准确度低。
[0115]
实施例6
[0116]
本实施例基于实施1的技术方案,对步骤s3的模型评估的方法做进一步说明。
[0117]
进一步地,所述k折交叉验证的方法为:
[0118]
将全部样本划分成k个大小相等的样本子集;
[0119]
依次遍历这k个子集,每次把当前子集作为验证集,其余所有样本作为训练集,进行模型的训练和模型评估;
[0120]
输出k次模型评估的指标的平均值以及方差。
[0121]
最后,所述选择最终模型的方法为:
[0122]
基于模型评价参数选取最终模型,所述模型评价参数用于评估多模型回归拟合效果,模型评价参数为所述k折交叉验证获取的决定系数均值与决定系数方差。
[0123]
综合以上几种评估参数考量,可以选取表现更好的模型作为最终模型。
[0124]
实施例7
[0125]
本实施例基于实施1的技术方案,对步骤s4的进行模型构建的方法做进一步说明。
[0126]
本实施例中,所述根据选择的最终模型基于所述自变量和所述因变量进行模型构建的方法为,基于企业历史数据运用所述最终模型进行拟合,输出模型拟合的评价指标和模型预测公式,实现对水泥企业碳排放水平数据质量的监测;
[0127]
输出的模型拟合的评价指标包括均方根误差、平均绝对误差和决定系数;
[0128]
具体地:
[0129]
平均绝对误差(mean absolute error,简称mae)是通过计算预测值和真实值之间残差绝对值的均值,以衡量预测准确性。计算方法见公式:
[0130][0131]
均方根误差(root mean square error,简称rmse)是预测值与真实值偏差的平方与观测次数n比值的平方根。衡量的是预测值与真实值之间的偏差,并且对数据中的异常值较为敏感。rmse假设误差是无偏估计,且服从正态分布。rmse也对离群点敏感,但敏感度低于mse。计算方法见公式:
[0132][0133]
决定系数(r-square)即决定系数(r2),反映模型对样本数据的拟合程度。值越大,拟合效果越好。计算公式为:
[0134][0135][0136][0137]
rmse和mae越接近于0,预测精度越高;决定系数(r2)又称拟合优度,其值越接近于1,说明拟合程度越好。实施例8
[0138]
本实施例基于以上实施例的技术方案,结合一个案例进行进一步说明。
[0139]
本发明以1家水泥企业2016年日度数据为例,经过整理、分析、标准化之后,得到总共364条历史数据,以此构建以电碳指数为核心的数据体系,建立核算模型进行评估。
[0140]
步骤s1:进行指标体系构建,所述指标体系包括因变量和自变量;
[0141]
将经过整理的364条样本进行统计描述分析,具体参阅表1提供的单样本日度数据基本情况,分析数据有熟料生产中碳酸盐分解排放因子x1、熟料生产电力排放因子x2、熟料工序耗电量在全厂用电量的占比x3以及水泥熟料产量比值(x4),输出变量为电碳指数y。表1对上述指标进行了描述性统计,描述性统计参数包含平均数、标准差、最小值、中位数、最
大值。
[0142]
表1单样本日度数据基本情况
[0143][0144]
步骤s2:采集数据集并进行异常点剔除以及变量共线性分析;
[0145]
运用均值漂移线性回归模型迭代拟合剔除异常点,以删除学生化残差大于3作为判断标准进行异常点剔除。
[0146]
方差膨胀系数是衡量多元线性回归模型中复(多重)共线性严重程度的一种度量。它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。对自变量数据集进行变量间共线性分析,得到方差膨胀因子vif于下表2:
[0147]
表2自变量方差膨胀因子情况
[0148][0149]
可以看到在此数据集中方差膨胀因子最大为7.203,存在较弱的复共线性。如果数据集存在较强共线性时,在之后的模型选择中不考虑lr回归,这里则没有出现该情况。
[0150]
步骤s3:模型评估与模型选择,获取最终模型;
[0151]
通过k折交叉验证对不同模型进行评估,本实施例选择了10折,即k=10,对不同模型进行比较分析,结果参阅表3。
[0152]
表3不同模型的r2、mae与rmse基本情况
[0153]
模型检验标准平均值标准差lrr20.9270.031ridger20.8810.060lassor20.9250.028enr20.8240.123
knnr20.8910.040lrmae0.7320.100ridgemae0.9170.115lassomae0.7430.111enmae1.0750.148knnmae0.7930.117lrrmse0.9770.183ridgermse1.2430.236lassormse1.0010.199enrmse1.4750.297knnrmse1.1540.178
[0154]
对每一种模型的每种检验标准,根据其所得平均值与标准差的大小进行排序,得到其序数。其中r2值的平均值取逆序,其余值取正序。再将平均值与标准差的序数加和,并对所得值再次取正序,所得序数即为各检验标准下的排名系数。将三个排名系数相加即得综合排名系数,综合排名系数越小者,模型拟合效果越优。
[0155]
不同模型的排名系数基本情况参阅表4:
[0156]
表4不同模型的排名系数基本情况
[0157]
模型r2排名系数mae排名系数rmse排名系数综合排名系数lr1.5113.5ridge43.5411.5lasso1.5236.5en55515knn33.528.5
[0158]
r2的均值可反应该模型的拟合效果,r2方差可反应模型拟合的稳定性。对不同模型的r2进行箱线图绘制可得到更直观的模型选择优劣展示。不同模型拟合r2箱线图可以参阅图2,横坐标代表了不同的模型,其中lr为lr线性回归模型,lasso为lasso模型,ridge代表岭回归模型、en代表elasticnet模型,knn代表knn模型。
[0159]
综合对比r2的均值与方差,lr线性回归模型在模型拟合效果以及拟合稳定性上表现最佳。采用该模型可以实现基于生产数据与电力数据,对碳排放数据的预测和监测。
[0160]
步骤s4:根据选择的最终模型基于所述自变量和所述因变量进行模型构建;
[0161]
本实施例的最终模型方程如下:
[0162]
y=22.674*x
1-82.831*x2+17.708*x
3-0.439*x4+22.861
[0163]
在本实际案例中,简单来说,以水泥企业日度数据为基础构建水泥企业“电-碳监测模型”,利用k折交叉验证多个机器学习模型回归效果,结果显示利用lr线性回归模型进行回归拟合效果最优,而后构建线性模型,该模型可以实现水泥行业碳排放的有效监测。
[0164]
综上所述,本方法可以通过机器学习对水泥行业历史生产数据进行模型模拟,得到水泥企业的电碳指数模型,间接实现以电测碳。该方法可以提升水泥企业碳排放数据预测的准确性,有利于提升企业碳排放监测、碳盘查的效率,也有利于监管部门实现对水泥行业碳排放数据质量的监督。
[0165]
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
技术特征:
1.一种企业电碳监测模型的构建方法,其特征在于,包括以下步骤:进行指标体系构建,所述指标体系包括因变量和自变量;采集数据集并进行异常点剔除以及变量共线性分析;模型评估与模型选择,获取最终模型;根据选择的最终模型基于所述自变量和所述因变量进行模型构建。2.根据权利要求1所述的一种企业电碳监测模型的构建方法,其特征在于:所述因变量包括电碳指数,所述因变量包括熟料生产中碳酸盐分解排放因子、熟料生产电力排放因子、熟料工序耗电量在全厂用电量的占比和水泥熟料产量比值。3.根据权利要求2所述的一种企业电碳监测模型的构建方法,其特征在于,所述电碳指数的获取方法为:所述熟料生产中碳酸盐分解排放因子x1的获取方法为:x1=熟料氧化钙含量*44/56+孰料中氧化镁含量*44/40;所述熟料生产电力排放因子x2的获取方法为:x2=(熟料工段余热供电量*0+熟料工段电网供电电量*当地所在区域电网排放因子)/熟料工段耗电量所述熟料工序耗电量在全厂用电量的占比x3的获取方法为:x3=(全厂总用电量-外输电量-水泥工段耗电量)/全厂用电总量所述水泥熟料产量比值x4的获取方法为:x4=水泥产量/熟料产量。4.根据权利要求1所述的一种企业电碳监测模型的构建方法,其特征在于,所述进行异常点剔除的方法为:采用均值线性漂移回归模型对数据集进行拟合,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;采用均值线性漂移回归模型对剔除异常值后的数据集,以删除学生化残差绝对值大于残差阈值的标准对异常值进行剔除;重复上一步操作直至没有异常值;所述残差阈值标准为3,所述删除学生化残差为t分布。5.根据权利要求1所述的一种企业电碳监测模型的构建方法,其特征在于,所述变量共线性分析的方法为:通过方差膨胀因子对数据变量间多重共线性进行分析,若数据集的共线性强于共线性阈值,在后续的所述模型选择中不考虑lr回归。6.根据权利要求1所述的一种企业电碳监测模型的构建方法,其特征在于,所述模型评估与模型选择的方法为:基于多种机器学习算法构建电碳监测模型,通过k折交叉验证对不同模型进行模型评估,选择最终模型。7.根据权利要求6所述的一种企业电碳监测模型的构建方法,其特征在于,包括岭回归
模型多种所述机器学习算法包括lr线性回归模型、含岭回归模型、lasso模型、elasticnet模型和knn模型方法。8.根据权利要求7所述的一种企业电碳监测模型的构建方法,其特征在于,所述k折交叉验证的方法为:将全部样本划分成k个大小相等的样本子集;依次遍历这k个子集,每次把当前子集作为验证集,其余所有样本作为训练集,进行模型的训练和模型评估;输出k次模型评估的指标的平均值以及方差。9.根据权利要求8所述的一种企业电碳监测模型的构建方法,其特征在于,所述选择最终模型的方法为:基于模型评价参数选取最终模型,所述模型评价参数用于评估多模型回归拟合效果,模型评价参数为所述k折交叉验证获取的决定系数均值与决定系数方差。10.根据权利要求1所述的一种企业电碳监测模型的构建方法,其特征在于,所述根据选择的最终模型基于所述自变量和所述因变量进行模型构建的方法为,基于企业历史数据运用所述最终模型进行拟合,输出模型拟合的评价指标和模型预测公式,实现对水泥企业碳排放水平数据质量的监测;输出的模型拟合的评价指标包括均方根误差、平均绝对误差和决定系数。
技术总结
本发明提供了一种企业电碳监测模型的构建方法,涉及电碳关系监测技术领域,其目的是建立更为精准的电碳模型,包括进行指标体系构建,所述指标体系包括因变量和自变量;采集数据集并进行异常点剔除以及变量共线性分析;模型评估与模型选择,获取最终模型;根据选择的最终模型基于所述自变量和所述因变量进行模型构建。本发明具有可以提升水泥企业碳排放数据预测的准确性的优点。据预测的准确性的优点。据预测的准确性的优点。
技术研发人员:张栋梁 缪雨含 薛万磊 罗小虎 李晨辉 牟颖 王鹏 安鹏 郑志杰 谢红涛 赵昕 王振坤 李校莹 牛华忠 管大顺 史英 刘知凡 厉艳
受保护的技术使用者:清华四川能源互联网研究院
技术研发日:2023.06.26
技术公布日:2023/10/11
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
