一种基于SVM电子鼻系统的挥发性液体识别模块及方法
未命名
09-08
阅读:98
评论:0
一种基于svm电子鼻系统的挥发性液体识别模块及方法
技术领域
1.本发明涉及一种挥发性液体识别技术,特别是涉及一种基于支持向量机(svm)算法的电子鼻系统挥发性液体识别方法。
背景技术:
2.随着化学、制药和石油行业的发展,越来越多的挥发性液体(vocs)被使用,这些vocs对人类健康和环境都带来了一定的风险。因此,对vocs进行监测和识别变得越来越重要。目前,有多种方法可用于检测和识别vocs,例如毛细管电泳、质谱和气相色谱等。然而,这些方法存在一些缺点,如高成本、需要复杂的样品前处理和分离步骤、需要高技术专业知识等。
3.近年来,一种基于传感器技术的挥发性液体识别技术逐渐发展起来。这种技术的基本思想是利用特定的传感器识别挥发性液体的化学成分,从而实现对挥发性液体的监测和识别。此技术具有成本低、易于使用、快速响应、无需复杂的样品前处理等优点。在该技术中,传感器被设计为对特定的vocs敏感,并且可以通过检测特定的物理或化学特性来区分不同的vocs。
4.然而,该技术也存在一些缺点。例如,传感器的选择性和灵敏度有限,可能会对vocs的数量和种类产生限制。此外,vocs的水平受到环境变化的影响,从而导致测量结果的不确定性。为了解决这些问题,需要进一步改进传感器的设计和制造,并将该技术与其他检测和识别技术结合使用,以提高其准确性和可靠性。现有技术提出了一种基于多传感器的液体检测方法,但其只是简单的通过数据特征来进行液体的识别。现有技术还提出了一种多传感器协同的液体识别方法,但同样只是通过传感器进行简单的特征提取,最后进行了结果融合。而简单的特征提取进行液体识别,识别的准确度会因为使用环境的不同产生较大的波动。所以单一的进行特征提取识别,虽然可行的但却不是最好的办法。
技术实现要素:
5.随着近年来机器学习的发展,研究人员也开始将一些机器学习算法应用到识别领域,svm(支持向量机)算法具有强大的应用潜力,但目前将svm算法更多的是应用在人脸识别、影像分类中;本发明创新性的将svm算法应用于挥发性液体识别的多分类问题中,解决在现有技术只使用单一的数据特征进行的识别的缺陷,不仅提高的识别的准确度而且提高模型的不同环境中的稳定性。
6.本发明公开了一种基于svm电子鼻系统的挥发性液体识别模块,包括:(a)数据采集模块,用于采集挥发性液体的特征数据,并将其转化为数字信号;(b)预处理模块,用于对挥发性液体的特征数据去噪、标准化和降维处理,并将数据进行切割,分为测试集和训练集;(c)svm模型训练模块,用于基于训练数据训练svm分类器;(d)参数优化模块,用于对svm分类器的超参数进行优化;
(f)性能评估模块,用于计算模型的性能指标;(e) svm模型预测模块,用于利用训练好的svm分类器对挥发性液体进行识别。
7.本发明公开了上述基于svm电子鼻系统的挥发性液体识别模块在挥发性液体的识别中的应用。
8.本发明提供了一种利用上述基于svm算法的电子鼻系统的挥发性液体识别模块对挥发性液体识别方法,包括以下步骤:(1)通过电子鼻系统获取挥发性液体的数据集,然后对数据进行预处理,包括去噪、标准化和降维等处理;(2)将处理后的数据集分为训练集和测试集;(3)使用bayesianoptimization类进行贝叶斯优化,得到最优的svm模型参数;(4)使用最优参数组合构建新的svm模型,并对测试集进行预测;(5)计算模型的准确率和其他性能指标;(6)将模型应用于新数据的识别。
9.本发明中,特征数据包括挥发性液体的挥发物质组成数据,其中包括多种不同传感器,或者不同的特征数据,比如6种传感器数据。优选的,特征数据为不同传感器对某一挥发性液体的响应值。
10.本发明中,预处理模块包括去噪模块、标准化模块和降维模块,去噪模块用于去除噪声对特征数据的影响,标准化模块用于将特征数据标准化,降维模块用于对特征数据进行降维处理以减少计算量。优选的,去噪过程使用小波去噪;预处理模块进一步包括主成分分析(pca)算法,用于降低数据的维度,减少输入特征的数量。
11.本发明中,参数优化模块采用贝叶斯优化算法,用于自动调整svm分类器的超参数,以达到最佳的分类效果;贝叶斯优化采用expected improvement (ei)算法作为采样函数。优选的,贝叶斯优化算法采用了以下步骤:(1)定义svm分类器的超参数搜索空间,包括svm核函数、c和gamma;(2)选择目标函数作为评价指标;例如分类准确率;(3)根据贝叶斯定理和高斯过程回归,构建svm超参数的先验分布模型;(4)基于已有的超参数样本,通过调整先验分布模型的参数,计算下一个最佳超参数的条件概率分布;(5)利用el算法寻找下一个最佳超参数;(6)重复步骤(4)和(5),直到达到预设的最大迭代次数或者满足停止条件为止;(7)使用得到的最佳超参数进行支持向量机模型的训练;(8)在训练完成后,使用测试数据集进行模型测试,并计算模型的性能指标,如分类准确率;(9)如果模型的性能指标不满足评价指标,则返回步骤(1)重新进行超参数搜索直到模型满足预设的性能指标。
12.本发明中,svm分类器使用径向基函数核(rbf)或多项式核或线性核中的一个;性能指标包括模型的准确率、回收率、f1评分、roc等。
13.本发明公开了一种计算机可读载体,包括程序,所述程序能够运行上述基于svm电子鼻系统的挥发性液体识别模块。
14.本发明中,训练步骤包括以下子步骤:(a)选择合适的核函数和参数;(b)选择合适的训练样本和训练集;(c)对训练集进行交叉验证,优化svm模型参数。
15.本发明中,分类和识别步骤包括以下子步骤:(a)将新的挥发性液体样本输入到训练好的svm模型中;(b)对新的挥发性液体样本进行分类和识别。
16.本发明的优点在于,利用svm算法对挥发性液体进行识别,具有准确率高、处理速度快、操作简单等优点。
附图说明
17.图1为本发明的结构示意图;图2为本发明的流程示意图;图3为数据收集装置示意图;图4为一元液体数据在经过pca降维过程中的方差解释比例与方差累计百分比;图5为一元数据数据在经过pca降维过程后的pca图;图6为本发明在一元多分类挥发性溶剂识别的roc图,(a)-(e)分别表示的为乙醇、甲醛、甲醇、丙酮、氨水的roc曲线图;图7为二元液体数据在经过pca降维过程中的方差解释比例与方差累计百分比;图8为二元数据数据在经过pca降维过程后的pca图;图9为本发明在二元多分类挥发性溶剂识别的roc图,(a)-(d)分别表示的为乙醇:水由1:1至1:4的 roc曲线图。
具体实施方式
18.下文结合附图和具体实施例对本技术的技术方案进行描述。
19.现有技术中,大部分挥发性液体识别技术存在成本高、耗时长、操作复杂等问题。因此需要一种能够简单、快速、准确的挥发性液体识别方法,满足人们的需要。
20.针对在实际生活中与高校实验室中的危废检测分类需求,本发明基于现有电子鼻技术与神经网络技术,通过利用电子鼻系统与支持向量机(svm)算法相结合的新思路,研究svm算法中核函数、正则化参数(
‘
c’)等超参数和传感器阵列检测参数的关联关系,实现了对一元挥发性液体与二元混合液体识别的效果。研制了电子鼻系统样机,在测试集上对一元纯挥发性液体与二元混合液体的识别率达到100%。
21.本发明提供了一种新的识别方法,该方法应用于挥发性溶剂的识别。在该方法中,通过电子鼻系统收集的数据进行模型训练后,用户可以使用训练好模型快速、准确的进行挥发性液体的识别。并且用户可根据自己所需,增加模型的识别范围和功能。可见,本发明可减少常见挥发性液体识别技术所耗费的时间和成本。
22.数据的采集与记录主要分为三个步骤:一是模拟信号的测量,mq传感器通过电导率的变化来引起模拟信号值的变化,以此来进行浓度或类别检测,主要检测的是电压信号;二是ad采集,通过使用单片机收集传感器响应后的模拟信号;三是将收集到的数据,通过一
些方法(比如通过串口传输)传输到pc机并储存,以备后续数据的预处理及模型的训练使用。模拟信号即传感器将其对气体的响应转变为电信号的过程,并将转换后的信号变为ad采集的输入信号,mq传感器使用的是分压电路,当传感器与气体接触,传感器的电导率增大,输出电阻降低,则输出的模拟信号变大。在采集到数字信号后,单片机通过串口传输将模拟引脚的数值传输到pc端进行收集与处理,单片机内置的a/d转换器可以直接通过api函数读取输出的数字信号,从而获得传感器的模拟信号值,为常规技术。实施例的单片机平台为arduino。arduino是一个包含开源软件(arduino ide)和硬件(各种型号的arduino板)的单片机平台。使用arduino ide编写程序代码后,将代码上传到arduino电路板中,程序便可以控制电路板进行相应的操作。arduino ide提供了许多编程接口和库函数,使得程序编写变得更加简单和高效,为常规技术。在pc端,使用python代码,读取通过串口传输过来的数据,并将其保存为一个csv格式文件存储在电脑中。
23.通过对传感器阵列收集的信息进行去噪、标准化,为后续的识别提供前期准备。在实际应用中,由于传感器本身的物理特性和环境等原因,采集的数据往往受到各种噪声的影响,如电磁干扰、温度变化等,数据去噪是指从原始数据中去除噪声,以提高数据质量和信息可用性的过程。标准化处理可以将不同特征的数据缩放到相同的尺度,消除的特征间的量纲差异,通常是将数据缩放为均值为0,标准差为1的分布范围,标准化的处理可以提高模型的表现个稳定性,避免了量纲和范围的不同导致的偏差和学习速度的不同,其中缩放可以通过公式(1)实现:。
24.其中x是原始数据,μ和σ分别是数据的均值和标准差。
25.特征降维是为了在保留数据关键信息的前提下,降低数据维度,减少数据冗余和噪声对数据分析和建模的干扰,提高数据分析和建模的效率和准确性,主成分分析是一种常用的线型降维的方法,用于减小数据维度,并尽可能的保留原数据集的信息。其主要的步骤如下:对数据进行标准化处理,公式如(2)所示:。
26.其中,x为原始数据集,μ为数据集每个特征的均值,σ为数据集每个特征的标准差,x
{new}
为处理后的数据集。
27.计算数据的协方差矩阵,公式如(3)所示:。
28.其中,n为数据集的样本数,xi为第i个样本,为数据集的均值。
29.对协方差矩阵进行特征值分解,得到特征值和特征向量,公式如(4)所示:cω=λω(4)其中c为协方差矩阵,ω为特征向量,λ为特征值。
30.按特征值从大到小的顺序,选取其中的前k个特征向量,构成投影矩阵w,投影矩阵的计算公式如(5)所示:
31.其中,wi为前k特征向量中的第i个,k为降维后的维度。
32.将数据集x与投影矩阵w相乘,得到降维后的数据集y,公式如(6)所示:
33.其中,x为标准化处理后的数据集,w为投影矩阵,y为降维后的数据集。
34.主成分分析的基本思想是通过线性变换将高维数据映射到低维空间,使得低维数据的方差尽可能大,从而保留数据集的主要特征。
35.svm可以使用不同的核函数来处理非线性分类问题。核函数的作用可以理解为将原始的特征空间映射到一个更高维的特征空间,使得原本线性不可分的样本在空间中变得线性可分;超参数
‘
c’(正则化参数),用于控制模型的复杂程度和惩罚分类错误。较小的
‘
c’值会使分类器尽可能适应数据,可能导致过拟合;而较大的
‘
c’值会更强调分类器的泛化能力,可能导致欠拟合。通常情况下,
‘
c’值越大,模型的容错率越小,分类的精度越高。γ与
‘
c’的取值对模型的表现有重要影响,需要通过交叉验证等技术进行调优,以找到最优的参数组合贝叶斯优化算法是一种基于概率模型的黑盒优化方法,通常用于寻找目标函数的全局最优解,在机器学习领域,它通常用于调优模型超参数,通常基于高斯过程模型(gaussian process,gp)进行优化。
36.示例性的,图1示出了本发明的一种结构示意图,包括电子鼻系统,arduino开源平台以及pca、svm算法的实现及其相关优化。可以理解的是,示意结构并不构成对整个系统结构的具体限定。
37.图2为本发明的主要结构示意图及其流程示意图,可总结为以下过程:(1)数据采集及保存:将挥发性液体放入电子鼻系统 ,等待一段时间后,arduino开源平台开始读取数据,并将其传输到python,通过python将其保存在计算机中;电子鼻组成的中的传感器阵列是由多个化学传感器排列组合而形成,可收集待测样品的多样数据;(2)数据的处理:将保存在计算机中的数据集读取出来,将其分为数据集和标签集,并对数据集进行去噪,标准化,pca降维;(3)数据的分割:将处理后的数据集和标签集进行分割,分为训练集和测试集;(3)贝叶斯优化:定义参数优化字典,使用bayesianoptimization类进行贝叶斯优化,得到最优的svm模型参数;(4)模型构建:使用最优参数组合构建新的svm模型,并对测试集进行预测;(5)性能评估:计算模型的准确率和其他性能指标,并画出roc图。
38.(6)模型应用:用训练好的模型对新数据进行识别。
39.实验所用传感元件均为普通商业传感器,厂家、具体型号及相关参数如表1。
[0040][0041]
本实验中,实验数据收集所用具体试剂名称、厂家及相关数据如表2。
[0042][0043]
本实验数据收集及测试所用装置如图3所示 。传感器阵列以及wifiduino v2固定在亚克力板上,间距约2cm。亚克力板水平插挂在一个25 cm
×
25 cm
×
25 cm的亚克力壁密闭测试气腔中。传感器阵列下方放置250ml 烧杯,内部加入目标待分析或训练挥发性液体,体积50 ml。温度控制为室温,湿度与外界湿度相同,不控制。本发明涉及的具体数据处理等计算操作为常规技术。
实施例一
[0044]
将本模型应用于5种挥发性液体识别:乙醇、甲醛、甲醇、丙酮以及氨水,均为纯溶剂。将不同种类的液体重复实验4次,每次收集500组数据,1组数据为6个传感器测试的响应值(一共6个数值)。部分数据如下。
[0045][0046]
分别将五种挥发性液体放入收集腔室中(如图3所示),等待传感器响应数据较为稳定后,通过串口传输到pc端进行保存,以备后续的模型训练与测试。将收集到的不同挥发性液体的数据进行标签分类:乙醇(0)、甲醛(1)、甲醇(2)、丙酮(3)、氨水(4)。在收集的数据集中,每种类别样品包含2000组数据,其中每次实验收集500组,共进行4次实验,完成数据集的收集。
[0047]
单次检测过程为:(1)进行常规传感器预热,预热结束后,打开收集腔室室门,进行通风,等待传感器数值稳定;(2)将50ml待测纯溶剂放入收集腔室中,等待传感器响应数据较为稳定后,开始收集数据并传输;(3)数据收集完成后,打开室门,通入空气,对腔室进行清洗。
[0048]
以上为一次实验过程,数据通过串口传输到电脑并通过python编写的代码进行保存,以备后续的预处理。
[0049]
将收集的数据通过python读取,并通过小波去噪、标准化对数据集进行预处理。其中小波去噪以及标准化分别用到了python中的pywavelete、sklearn.preprocessing.standardscaler库文件。接着通过pca降维法对数据集进行特征降维,使用python中的
sklearn.decomposition 库来实现。图4展示了该数据集的主成分方差贡献率与累计方差解释图,前三个组分的累计方差解释均已超过0.95,数据损失低于0.05,数据集中的6维数据降为3维。图5则展示了数据集的pca图,为数据集降维后的主成分分析3d图,在降维以后,在三维空间中出现了良好的聚类效果,这也意味着该数据集在三维空间有较好的区分度。
[0050]
在模型训练前,将数据集拆分为训练集与测试集,其中80%的数据作为训练集,剩余的作为测试集。接着开始使用训练集开始训练模型,并通过贝叶斯优化法进行模型优化,具体模型构建与优化方式如下:首先使用python中scikit-learn库中的svc类,定义了一个支持向量机 (svm)分类器。接着,设定了svm分类器的三个超参数:c、gamma和kernel。然后,定义了一个目标函数,用于将svm分类器的参数设置为贝叶斯优化指定的超参数,并使用交叉验证评估分类器的准确性。在这里,使用sklearn.multiclass库中的一对多分类器(
‘
onevsrestclassifier’)对多类别问题进行处理,使用了5折交叉验证。
[0051]
最后,使用scikit-optimize库的bayessearchcv类执行30次迭代的贝叶斯优化,并使用multiprocessing库进行并行处理以搜索最佳超参数。表3展示了该模型在经过贝叶斯优化后的最佳超参数组合以及它在训练集中的得分,其中包括核函数,
‘
c’以及γ,以及训练分数和精确度。
[0052][0053]
最后用测试集中的数据对该模型进行测试,并评价该模型在这五种挥发性液体识别中的性能。图6展示出来该模型在测试集上对五种挥发性液体识别的受试者特征曲线图(roc)。其中,(a)-(e)分别表示的为乙醇、甲醛、甲醇、丙酮、氨水的roc曲线图。从图中不难看出每幅图中的auc(area under the roc curve)值都接近于1。auc的含义是,在所有可能的阈值下,模型将正样本排在负样本前面的概率大小。因此,auc值越接近1,说明模型能够很好地区分正负样本,具有较高的预测准确率。所以,不难看出该模型对于此五种挥发性液体具有非常良好的识别效果,并在识别中表现出了优良的性能。该模型的其余的性能评估结果如下表4。
[0054][0055]
实施例二乙醇与水不同比例的二元混合物进行训练,将乙醇与水不同比例(乙醇:水)的二元混合物分别标号为:1:1(0)、1:2(1)、1:3(2)、1:4(3)。将不同种类的液体重复实验4次,每次收集500组数据,将收集到的数据制作为数据集。
[0056]
数据处理参见实施例一,二元液体识别数据集有4个类别,同样每个类别有两千组数据且每组数据有六个特征(响应值)。在进行数据的预处理后,将数据集分为测试集和训练集,将数据集中的80%的作为训练集。剩余作为测试集,并采用5折交叉验证。将数据集分为测试集和训练集的目的是为了评估机器学习模型的性能和泛化能力。通过贝叶斯优化算法,寻找出适用于数据集的最佳超参数组合,然后用找到的最佳超参数组合重新建立模型,并计算其精确度(accuracy)。并将其应用于测试集的预测。
[0057]
图7展示了数据集的主成分方差贡献率图以及累计方差解释图,前三个组分的累计方差解释均已超过0.95,数据损失低于0.05,数据集中的6维数据降为3维。图8则给出了数据集降维后的主成分分析3d图,对于二元液体识别的数据集来说,数据集在降维后,在三维空间也有明显的聚类,但是仍有部分数据散乱分布,说明该数据集在三维空间的区分度比起一元液体识别数据集有不小的差距。表3展示了通过贝叶斯优化算法找到的数据集的最佳超参数,其中包括核函数,
‘
c’以及γ,以及训练分数和精确度。
[0058]
图9中的(a)-(d)分别展示了该模型在二元液体识别测试集对各个液体识别的受试者工作特征曲线(roc)。roc曲线是一种用于评估二分类器性能的常用方法,在分类器输出连续变量的情况下,选择最佳的分类阈值。roc(receiver operating characteristic)曲线是以真正例率( true positive rate,tpr)为纵坐标,假正例率(false positive rate,fpr)为横坐标所构成的曲线,其中真正例率是指被正确地识别出来的正例占总正例的比例,假正例率是指被错误地识别为正例的负例占总负例的比例。
[0059]
本发明中,各挥发性液体roc曲线的auc(area under the roc curve)均接近于1。auc的含义是,在所有可能的阈值下,模型将正样本排在负样本前面的概率大小。因此,auc值越接近1,说明模型能够很好地区分正负样本,具有较高的预测准确率。而auc值越接近0.5,则说明模型性能越接近随机猜测,预测准确率较低。因此,该模型在两个测试集上面,表现出了近乎完美识别。说明svm算法可以很准确的实现对挥发性液体的识别工作。不管是对于不同挥发性液体的识别还是对水与挥发性液体不同比例混合的识别,该模型都变现了
良好的性能。该模型的性能评估结果可参见表5。其中,精确率指分类器正确分类的正样本数与分类器总分类为正样本的样本数之比,召回率指分类器正确分类的正样本数与样本真实为正样本的样本数之比,f1得分是精确率和召回率的调和平均值,支持数指每个类别在样本中的实际出现次数。这些指标常被用于评估分类模型的性能,以确定分类器在特定数据集上的表现好坏。
[0060][0061]
本发明的技术方案可以应用于挥发性液体的识别,特别是在化学工业、食品工业、医疗保健和环境监测等领域中具有广泛的应用前景。
[0062]
虽然现有的一些挥发性溶剂的检测方法具有优点,但是需要大量的样品预处理和分析时间,不适用于实时识别,并且其识别结果需要具有专业知识才能看懂。因此,需要一种操作简单、不需要过多的样品预处理步骤与分析时间,并且最后的识别结果简单易懂的识别方法的出现。本发明设计一套基于svm算法的电子鼻系统,具有准确识别挥发性溶剂功能,该系统不需要复杂的前处理步骤和较长的分析时间,不仅有较高的识别准确度,而且在不同的环境下也有较高的稳定性,尤其是解决只使用单一的数据特征进行识别的缺陷。
[0063]
在化学工业中,本发明可以应用于挥发性液体的快速识别和检测。挥发性液体在化学反应中常常作为溶剂和催化剂使用,其质量和纯度直接影响到化学反应的效果和产物的质量。使用本发明提出的svm算法识别挥发性液体,可以实现对溶剂和催化剂的快速鉴别,保证反应的成功率和产物的质量。
[0064]
在食品工业中,本发明可以应用于食品的检测和鉴别。食品中的挥发性液体是影响其风味和口感的重要因素之一。使用本发明提出的svm算法,可以实现对食品中挥发性液体的快速鉴别和检测,保证食品的质量和安全。
[0065]
在医疗保健中,本发明可以应用于诊断和治疗。挥发性液体在人体中常常作为生理指标,其含量和组成会随着疾病的发展而发生变化。使用本发明提出的svm算法,可以实现对挥发性液体的快速检测和诊断,帮助医生进行疾病诊断和治疗。
[0066]
在环境监测中,本发明可以应用于空气和水质的检测。挥发性液体是空气和水质中的重要成分之一,其含量和组成与环境污染程度密切相关。使用本发明提出的svm算法,可以实现对空气和水质中挥发性液体的快速检测和监测,及时发现环境污染问题,保护环境和人民健康。
[0067]
因此,本发明的技术方案具有广泛的应用前景和经济价值,可以为相关行业提供快速、准确和可靠的检测和识别技术,促进行业的发展和进步。
技术特征:
1.一种基于svm电子鼻系统的挥发性液体识别模块,其特征在于,包括:(a)数据采集模块,用于采集挥发性液体的特征数据,并将其转化为数字信号;(b)预处理模块,用于对挥发性液体的特征数据去噪、标准化和降维处理,并将数据进行切割,分为测试集和训练集;(c)svm模型训练模块,用于基于训练数据训练svm分类器;(d)参数优化模块,用于对svm分类器的超参数进行优化;(f)性能评估模块,用于计算模型的性能指标;(e) svm模型预测模块,用于利用训练好的svm分类器对挥发性液体进行识别。2.根据权利要求1所述基于svm电子鼻系统的挥发性液体识别模块,其特征在于,特征数据包括挥发性液体的挥发物质组成数据,其中包括至少6种传感器数据。3.根据权利要求1所述基于svm电子鼻系统的挥发性液体识别模块,其特征在于,去噪过程使用小波去噪;预处理模块进一步包括主成分分析算法。4.根据权利要求1所述基于svm电子鼻系统的挥发性液体识别模块,其特征在于,参数优化模块采用贝叶斯优化算法。5.根据权利要求4所述基于svm电子鼻系统的挥发性液体识别模块,其特征在于,贝叶斯优化算法采用了以下步骤:(1)定义svm分类器的超参数搜索空间,包括svm核函数、c和gamma;(2)选择目标函数作为评价指标;(3)根据贝叶斯定理和高斯过程回归,构建svm超参数的先验分布模型;(4)基于已有的超参数样本,通过调整先验分布模型的参数,计算下一个最佳超参数的条件概率分布;(5)利用el算法寻找下一个最佳超参数;(6)重复步骤(4)和(5),直到达到预设的最大迭代次数或者满足停止条件为止;(7)使用得到的最佳超参数进行支持向量机模型的训练;(8)在训练完成后,使用测试数据集进行模型测试,并计算模型的性能指标;(9)如果模型的性能指标不满足评价指标,则返回步骤(1)重新进行超参数搜索直到模型满足预设的性能指标。6.根据权利要求1所述基于svm电子鼻系统的挥发性液体识别模块,其特征在于,svm分类器使用径向基函数核或多项式核或线性核;性能指标包括模型的准确率、回收率、f1评分、roc。7.权利要求1所述基于svm电子鼻系统的挥发性液体识别模块在挥发性液体的识别中的应用。8.利用权利要求1所述基于svm电子鼻系统的挥发性液体识别模块识别挥发性液体的方法,其特征在于,包括以下步骤:(1)通过电子鼻系统获取挥发性液体的数据集,然后对数据进行预处理,包括去噪、标准化和降维等处理;(2)将处理后的数据集分为训练集和测试集;(3)进行贝叶斯优化,得到最优的svm模型参数;(4)使用最优参数组合构建新的svm模型,并对测试集进行预测;
(5)计算模型的准确率和其他性能指标;(6)将模型应用于新数据的识别。9.根据权利要求8所述基于svm电子鼻系统的挥发性液体识别模块识别挥发性液体的方法,其特征在于,贝叶斯优化采用ei算法作为采样函数。10.一种计算机可读载体,包括程序,其特征在于,所述程序能够运行权利要求1所述基于svm电子鼻系统的挥发性液体识别模块。
技术总结
本发明公开了一种基于SVM电子鼻系统的挥发性液体识别模块及方法,包括多个不同传感器获取挥发性液体的状态数据,通过开源电子平台进行数据的收集以及传输;通过收集模块进行数据的记录,并保存在计算机中;通过算法模块对收集到的数据集进行数据的预处理,包括去噪、标准化、PCA降维,将数据进行切割,分为测试集和训练集;通过贝叶斯优化找出最佳超参数,用最佳超参数构建模型;输出模型的准确率和其他性能指标;最后通过训练后的模型进行新数据预测;采用多数量传感器进行数据收集,可提高分类识别的准确度;对数据集进行预处理,可降低数据后续处理的难度,并提高模型的训练效率及准确度;利用训练的模型可实现对挥发性液体的识别应用。识别应用。识别应用。
技术研发人员:柏维维 贺竞辉
受保护的技术使用者:苏州大学
技术研发日:2023.05.11
技术公布日:2023/9/5
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
