一种近红外定标模型构建过程中光谱预处理方案的快速设计方法与流程

未命名 07-22 阅读：83 评论：0

1.本发明涉及近红外分析检测技术领域，尤其涉及一种近红外定标模型构建过程中光谱预处理方案的快速设计方法。

背景技术：

2.近红外光谱检测技术是从20世纪七十年代开始发展，由于其具有高效、快速、低成本、无损等优势，在各个行业尤其是在农产品食品等质量检测和控制中有着广泛的应用。近红外光谱检测技术系统由仪器硬件和软件两部分组成，前者用于采集近红外光谱数据，后者用于对所采集的数据进行转化统计等分析，以得到合适的定标(预测)模型。在建立某待测物质的近红外定标(预测)模型后，将测得的近红外光谱数据代入该模型，即可确定样品中的待测物质含量。近红外光谱技术的定标(预测)模型的建立过程，不仅与统计方程有关，如是采用主成分回归分析还是偏最小二乘法等，还涉及光谱预处理方法。因为近红外光谱录入得到的数据条带，容易受到噪音、温度、固体粉细度等对反射或透射的影响，因此数据统计算法前的光谱预处理是很重要的，光谱预处理方法的选择会对近红外定标(预测)模型的准确度产生重大影响。
3.常见的近红外光谱预处理方法包括很多种，这些光谱预处理方法又可以通过不同的组合，形成不同的光谱预处理方案。在实际应用中，往往需要通过几种预处理方法组合，才能实现较好的效果，使获得的近红外定标模型用于待测物质的含量检测时，具有较高的准确度。由于不同近红外光谱预处理方法的组合类型很多，并且，组合中各方法的排列顺序也会影响近红外定标模型的准确度，若逐一尝试，则需要耗费较长时间，且与待测物质的样品集的数量有关系，样品集越大，数据处理需要的时间就越长。因此，现在已报道的关于近红外光谱预处理方案的设计方法都是随机取几个组合，最多也不会超过百个，而这样的选择往往是随机的，不能保证是最适合的预处理方案，获得的最佳定标模型有不确定性，未必能达到较高的准确度，且这一过程很耗时耗力。

技术实现要素：

4.为了解决现有的近红外光谱预处理方案设计方法耗时耗力，且难以保证获得最适合的方案的技术问题，本发明提供了一种近红外定标模型构建过程中光谱预处理方案的快速设计方法。该方法具有快速高效、选择性强和准确度高的优点，设计简单合理，且对光谱预处理方案具有较好的选择效果，能够使最终建立的近红外定标模型具有较高的预测能力。
5.本发明的具体技术方案为：一种近红外定标模型构建过程中光谱预处理方案的快速设计方法，包括以下步骤：(1)确定光谱预处理的方法类型，记为x1、x2、
……
、xk，k为方法类型的总数；
(2)方法类型x1、x2、
……
、xk中分别设置n1、n2、
……
、nk个水平；(3)对近红外光谱数据依次采用方法类型x1、x2、
……
、xk进行预处理，每个方法类型中按照步骤(2)设置多个水平，共获得n1×
n2×……×
nk种备选的光谱预处理方案；(4)分别采用各备选的光谱预处理方案对待测物质的近红外光谱数据进行预处理，而后构建待测物质含量检测的近红外定标模型，根据近红外定标模型预测的准确性，确定最佳光谱预处理方案。
6.本发明构建了一种系统性的光谱预处理方案设计方法，通过将光谱预处理的方法归类为k个类型，并在每个类型中设置多个水平，设计排列组合，进而筛选出最合适的组合，能够减少组合次数，实现快速、准确、高效的分析筛选，并对光谱预处理方案具有较好的选择效果，从而为待测物质近红外定标模型的建立提供技术保障，有效提高近红外定标模型的预测能力(准确度)。
7.作为优选，步骤(1)中，所述光谱预处理的方法类型为基线漂移校正、光散射校正、噪音校正和数据集归一化(或称为数据标准化，scaling)中的一个或多个，k＝1～4。
8.针对不同的待测物质，近红外技术建立定标模型的光谱预处理算法或方案可以采用基线漂移校正、光散射校正、噪音校正和数据集归一化中一种、二种、三种或四种的组合。
9.进一步地，步骤(3)中，将噪音校正设置在基线漂移校正之后。
10.一般基线漂移校正后会导致噪音增强，因此在设计备选的光谱预处理方案时，将噪音校正设置在基线漂移校正之后，即在基线漂移校正后进行噪音校正，例如，x1为基线漂移校正，x2或x3或x4为噪音校正。通过这种设计，能够在确保最终获得的近红外定标模型预测能力的同时，减少备选的光谱预处理方案数量，进而减少光谱预处理方案设计的工作量。
11.作为优选，所述基线漂移校正在步骤(2)中设置的水平为无处理、一阶导数、二阶导数、三阶导数和四阶导数中的一个或多个。
12.作为优选，所述待测物质为含有吡咯啉环的化合物；所述基线漂移校正在步骤(2)中设置一个水平，为每隔3～8个光谱数据点进行二阶导数处理。
13.进一步地，所述待测物质为含有吡咯啉环的化合物；所述基线漂移校正在步骤(2)中设置一个水平，为每隔3个光谱数据点进行二阶导数处理。
14.作为优选，所述待测物质为蛋白质，或者所述待测物质的近红外光谱数据中含有n-h伸展键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置两个水平，分别为每隔6～8个光谱数据点进行一阶导数处理和每隔6～8个光谱数据点进行二阶导数处理。
15.进一步地，所述待测物质为蛋白质，或者所述待测物质的近红外光谱数据中含有n-h伸展键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置两个水平，分别为每隔8个光谱数据点进行一阶导数处理和每隔8个光谱数据点进行二阶导数处理。
16.作为优选，所述待测物质的近红外光谱数据中含有c-h键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置一个水平，为每隔4～7个光谱数据点进行二阶导数处理。
17.进一步地，所述待测物质的近红外光谱数据中含有c-h键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置一个水平，为每隔6个光谱数据点进行二阶导数处理。
18.本发明基于理论分析和大量试验后发现，针对一些特征物质，能够缩小基线漂移校正方法的备选范围，例如：针对含有吡咯啉环的待测物质，采用“每隔3～8个光谱数据点进行二阶导数处理”的方法进行基线漂移校正，能够实现较好的光谱预处理效果；针对待测
物质为蛋白质的情况，以及近红外光谱数据中含有n-h伸展键的一级倍频吸收谱带的情况，采用“每隔6～8个光谱数据点进行一阶导数处理”或“每隔6～8个光谱数据点进行二阶导数处理”的方法进行基线漂移校正，能够实现较好的光谱预处理效果；针对近红外光谱数据中含有c-h伸展键的一级倍频吸收谱带的情况，采用“每隔4～7个光谱数据点进行二阶导数处理”的方法进行基线漂移校正，能够实现较好的光谱预处理效果。基于上述发现，能够缩小基线漂移校正方法的备选范围，进而减少备选光谱预处理方案的数量，在确保近红外定标模型预测能力的同时，使光谱预处理方案的设计更加快速、高效。
19.作为优选，所述光散射校正在步骤(2)中设置的水平为无处理、多元散射校正(multiplicative scatter correction，msc)、重均多元散射校正(weight multiplicative scatter correction，weight msc)和标准正态变换(standard normal variate，snv)中的一个或多个。
20.作为优选，所述噪音校正在步骤(2)中设置的水平为无处理、一次平滑处理和二次平滑处理中的一个或多个。
21.作为优选，所述数据集归一化在步骤(2)中设置的水平为无处理和均值中心化处理中的一个或两个。
22.作为优选，步骤(4)中，所述近红外定标模型预测的准确性采用决定系数表征，决定系数越高说明准确性越高。
23.与现有技术相比，本发明具有以下优点：(1)本发明针对近红外定标模型构建过程中的光谱预处理方案，提供了一种系统性的设计方法，其设计简单合理、快速高效，且对光谱预处理方案的筛选效果好，能够使建立的近红外定标模型具有较高的准确度，因而具有很好的应用前景；(2)本发明在设计备选的光谱预处理方案时，通过将噪音校正设置在基线漂移校正之后，以及针对一些特征物质缩小基线漂移校正方法的备选范围，能在确保近红外定标模型预测能力的同时，使光谱预处理方案的设计更加快速、高效。
具体实施方式
24.下面结合实施例对本发明作进一步的描述。
25.下述的对实施例的描述是为便于该技术领域的普通技术人员能理解和使用发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于下述实施例，本领域技术人员根据本发明的揭示，不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。
26.总实施例一种近红外定标模型构建过程中光谱预处理方案的快速设计方法，包括以下步骤：(1)确定光谱预处理的方法类型，记为x1、x2、......、xk，k为方法类型的总数；(2)方法类型x1、x2、
……
、xk中分别设置n1、n2、
……
、nk个水平；(3)对近红外光谱数据依次采用方法类型x1、x2、
……
、xk进行预处理，每个方法类型中按照步骤(2)设置多个水平，共获得n1
×
n2
×……×
nk种备选的光谱预处理方案；
(4)分别采用各备选的光谱预处理方案对待测物质的近红外光谱数据进行预处理，而后构建待测物质含量检测的近红外定标模型，根据近红外定标模型预测的准确性，确定最佳光谱预处理方案。
27.作为一种具体实施方式，步骤(1)中，所述光谱预处理的方法类型为基线漂移校正、光散射校正、噪音校正和数据集归一化中的一个或多个，k＝1～4。
28.作为一种具体实施方式，所述基线漂移校正在步骤(2)中设置的水平为无处理、一阶导数、二阶导数、三阶导数和四阶导数中的一个或多个；所述光散射校正在步骤(2)中设置的水平为无处理、多元散射校正、重均多元散射校正和标准正态变换中的一个或多个；所述噪音校正在步骤(2)中设置的水平为无处理、一次平滑处理和二次平滑处理中的一个或多个；所述数据集归一化在步骤(2)中设置的水平为无处理和均值中心化处理；所述数据集归一化在步骤(2)中设置的水平为无处理和均值中心化处理中的一个或两个。
29.作为一种具体实施方式，步骤(3)中，将噪音校正设置在基线漂移校正之后。
30.作为一种具体实施方式，所述待测物质为含有吡咯啉环的化合物；所述基线漂移校正在步骤(2)中设置一个水平，为每隔3～8个光谱数据点进行二阶导数处理，进一步优选为每隔3个光谱数据点进行二阶导数处理。
31.作为一种具体实施方式，所述待测物质为蛋白质，或者所述待测物质的近红外光谱数据中含有n-h伸展键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置两个水平，分别为每隔6～8个光谱数据点进行一阶导数处理和每隔6～8个光谱数据点进行二阶导数处理，进一步优选分别为每隔8个光谱数据点进行一阶导数处理和每隔8个光谱数据点进行二阶导数处理。
32.作为一种具体实施方式，所述待测物质的近红外光谱数据中含有c-h键的一级倍频吸收谱带；所述基线漂移校正在步骤(2)中设置一个水平，为每隔4～7个光谱数据点进行二阶导数处理，进一步优选为每隔6个光谱数据点进行二阶导数处理。
33.作为一种具体实施方式，步骤(4)中，所述近红外定标模型预测的准确性采用决定系数表征，决定系数越高说明准确性越高。
34.下面通过具体实施例对本发明进行说明。以下实施例中，如无特殊说明(特殊说明例如实施例1中的“每隔3个光谱数据点进行二阶导数处理”)，一阶导数、二阶导数、多元散射校正(msc)、标准正态变换(snv)和一次平滑处理均为间隔0个数据点进行(即每个数据点均进行该预处理)。
35.实施例1在构建用于检测水稻糙米粉中2-乙酰-1-吡咯啉含量的近红外定标模型的过程中，通过以下步骤设计光谱预处理方案：(1)确定光谱预处理的方法类型(变量)，共3个，依次顺序是变量1(x1)为基线漂移校正，变量2(x2)为光散射校正，变量3(x3)为噪音校正。
36.(2)三个变量分别设置2～3个水平，包括低水平或对照(即没有处理，采用符号
“‑”
表示)，以及高水平或有处理(采用符号“+”表示)，具体设置如下：变量1(x1)设置2个水平，分别为对照和每隔3个光谱数据点进行二阶导数处理；变量2(x2)设置3个水平，分别为对照、多元散射校正(msc)和标准正态变换(snv)；变量3(x3)设置2个水平，分别为对照和一次平滑处理。
37.(3)对近红外光谱数据依次进行基线漂移校正、光散射校正和噪音校正，每个方法类型中按照步骤(2)设置多个水平，具体排列组合如下表1所示，共有16个组合，其中4个组合重复，有12个独立组合，即12种备选的光谱预处理方案。
38.(4)采集水稻糙米粉定标样品集的近红外光谱数据，分别采用各备选的光谱预处理方案对其进行预处理，采用预处理后的近红外光谱数据构建水稻糙米粉中2-乙酰-1-吡咯啉含量检测的近红外定标模型，各定标模型的决定系数(rsq)见下表1所示。
39.(5)从表1可以看出，对近红外光谱数据依次进行二阶导数处理(每隔3个光谱数据点)和一次平滑处理，采用该光谱预处理方案获得的定标模型决定系数最高，为0.9684，即从12个备选方案中找到了定标水稻糙米粉中2-乙酰-1-吡咯啉含量的最佳光谱预处理方案。
40.表1
①
编号变量x1变量x2变量x3rsq 1+(二阶导数,n＝3)+(msc)+(一次平滑)0.95892+(二阶导数,n＝3)+(msc)-(无)0.95983+(二阶导数,n＝3)-(无)+(一次平滑)0.96844+(二阶导数,n＝3)-(无)-(无)0.96745-(无)+(msc)+(一次平滑)0.93436-(无)+(msc)-(无)0.93447-(无)-(无)+(一次平滑)0.89518-(无)-(无)-(无)0.8952
②
编号变量x1变量x2变量x3rsq1+(二阶导数,n＝3)+(snv)+(一次平滑)0.96422+(二阶导数,n＝3)+(snv)-(无)0.95113+(二阶导数,n＝3)-(无)+(一次平滑)0.96844+(二阶导数,n＝3)-(无)-(无)0.96745-(无)+(snv)+(一次平滑)0.92426-(无)+(snv)-(无)0.92437-(无)-(无)+(一次平滑)0.89518-(无)-(无)-(无)0.8952实施例2在构建用于检测水稻糙米粉中蛋白质含量的近红外定标模型的过程中，通过以下步骤设计光谱预处理方案：(1)确定光谱预处理的方法类型(变量)，共3个，依次顺序是变量1(x1)为基线漂移校正，变量2(x2)为光散射校正，变量3(x3)为噪音校正。
41.(2)三个变量分别设置2～3个水平，包括低水平或对照(即没有处理，采用符号
“‑”
表示)，以及高水平或有处理(采用符号“+”表示)，具体设置如下：变量1(x1)设置3个水平，分别为对照、每隔8个光谱数据点进行一阶导数处理和每隔8个光谱数据点进行二阶导数处理；变量2(x2)设置3个水平，分别为对照、重均多元散射校(weight msc)和标准正态变换(snv)；变量3(x3)设置2个水平，分别为对照和一次平滑处理。
42.(3)对近红外光谱数据依次进行基线漂移校正、光散射校正和噪音校正，每个方法类型中按照步骤(2)设置多个水平，具体排列组合如下表2所示，共有32个组合，其中14个组合重复，有18个独立组合，即18种备选的光谱预处理方案。
43.(4)采集水稻糙米粉定标样品集的近红外光谱数据，分别采用各备选的光谱预处理方案对其进行预处理，采用预处理后的近红外光谱数据构建水稻糙米粉中蛋白质含量检测的近红外定标模型，各定标模型的决定系数(rsq)见下表2所示。
44.(5)从表2可以看出，对近红外光谱数据依次进行一阶导数处理(每隔8个光谱数据点)、重均光散射校正和一次平滑处理，或者依次进行一阶导数处理(每隔8个光谱数据点)和标准正态变换，或者依次进行二阶导数处理(每隔8个光谱数据点)和标准正态变换，采用这三种光谱预处理方案获得的定标模型决定系数都较高，分别为0.9645、0.9646和0.9648，即从18个备选方案中找到了定标水稻糙米粉中蛋白质含量的最佳光谱预处理方案。
45.表2
实施例3在构建用于检测水稻糙米粉中直链淀粉(近红外光谱中含有c-h键一级倍频吸收谱带)含量的近红外定标模型的过程中，通过以下步骤设计光谱预处理方案：(1)确定光谱预处理的方法类型(变量)，共3个，依次顺序是变量1(x1)为基线漂移校正，变量2(x2)为光散射校正，变量3(x3)为噪音校正。
46.(2)三个变量分别设置2～3个水平，包括低水平或对照(即没有处理，采用符号
“‑”
表示)，以及高水平或有处理(采用符号“+”表示)，具体设置如下：变量1(x1)设置2个水平，分别为对照和每隔6个光谱数据点进行二阶导数处理；变量2(x2)设置3个水平，分别为对照、重均多元散射校(weight msc)和标准正态变换(snv)；变量3(x3)设置2个水平，分别为对照和一次平滑处理。
47.(3)对近红外光谱数据依次进行基线漂移校正、光散射校正和噪音校正，每个方法类型中按照步骤(2)设置多个水平，具体排列组合如下表3所示，共有16个组合，其中4个组合重复，有12个独立组合，即12种备选的光谱预处理方案。
48.(4)采集水稻糙米粉定标样品集的近红外光谱数据，分别采用各备选的光谱预处理方案对其进行预处理，采用预处理后的近红外光谱数据构建水稻糙米粉中直链淀粉含量检测的近红外定标模型，各定标模型的决定系数(rsq)见下表3所示。
49.(5)从表3可以看出，对近红外光谱数据依次进行二阶导数处理(每隔6个光谱数据点)和一次平滑处理，采用该光谱预处理方案获得的定标模型决定系数最高，为0.8980，即从12个备选方案中找到了定标水稻糙米粉中直链淀粉含量的最佳光谱预处理方案。
50.表3
对比例1在构建用于检测水稻糙米粉中2-乙酰-1-吡咯啉含量的近红外定标模型的过程中，通过以下步骤设计光谱预处理方案：(1)确定光谱预处理的方法类型(变量)，共3个，依次顺序是变量1(x1)为基线漂移校正，变量2(x2)为光散射校正，变量3(x3)为噪音校正。
51.(2)三个变量分别设置1～3个水平，包括低水平或对照(即没有处理，采用符号
“‑”
表示)，以及高水平或有处理(采用符号“+”表示)，具体设置如下：变量1(x1)设置2个水平，分别为一阶导数处理和每隔2个光谱数据点进行二阶导数处理；变量2(x2)设置3个水平，分别为对照、多元散射校正(msc)和标准正态变换(snv)；变量3(x3)设置2个水平，分别为对照和一次平滑处理。(3)对近红外光谱数据依次进行基线漂移校正、光散射校正和噪音校正，每个方法类型中按照步骤(2)设置多个水平，具体排列组合如下表4所示，共有16个组合，其中4个组合重复，有12个独立组合，即12种备选的光谱预处理方案。
52.(4)采集水稻糙米粉定标样品集的近红外光谱数据(同实施例1)，分别采用各备选的光谱预处理方案对其进行预处理，采用预处理后的近红外光谱数据构建水稻糙米粉中2-乙酰-1-吡咯啉含量检测的近红外定标模型，各定标模型的决定系数(rsq)见下表4所示。
53.表4
1+(一阶导数,n＝3)+(snv)+(一次平滑)0.91292+(一阶导数,n＝3)+(snv)-(无)0.90323+(一阶导数,n＝3)-(无)+(一次平滑)0.90354+(一阶导数,n＝3)-(无)-(无)0.9076对比表2和表5，可以看出，相较于采用“每隔3个光谱数据点进行一阶导数处理”的方法(对比例2)而言，当基线漂移校正采用“每隔8个光谱数据点进行二阶导数处理”的方法(实施例2)时，建立的定标模型决定系数普遍较高(除了依次进行二阶导数处理和标准正态变换这一光谱预处理方案以外)。说明对于蛋白质物质，基线漂移校正采用“每隔8个光谱数据点进行二阶导数处理”的方法，能够实现较好的光谱预处理效果。
59.对比例3在构建用于检测水稻糙米粉中直链淀粉(近红外光谱中含有c-h键的一级倍频吸收谱带)含量的近红外定标模型的过程中，通过以下步骤设计光谱预处理方案：(1)确定光谱预处理的方法类型(变量)，共3个，依次顺序是变量1(x1)为基线漂移校正，变量2(x2)为光散射校正，变量3(x3)为噪音校正。
60.(2)三个变量分别设置2～3个水平，包括低水平或对照(即没有处理，采用符号
“‑”
表示)，以及高水平或有处理(采用符号“+”表示)，具体设置如下：变量1(x1)设置1个水平，为每隔8个光谱数据点进行二阶导数处理；变量2(x2)设置3个水平，分别为对照、重均多元散射校(weight msc)和标准正态变换(snv)；变量3(x3)设置2个水平，分别为对照和一次平滑处理。
61.(3)对近红外光谱数据依次进行基线漂移校正、光散射校正和噪音校正，每个方法类型中按照步骤(2)设置多个水平，具体排列组合如下表6所示，共有8个组合，其中2个组合重复，有6个独立组合，即6种备选的光谱预处理方案。
62.(4)采集水稻糙米粉定标样品集的近红外光谱数据(同实施例3)，分别采用各备选的光谱预处理方案对其进行预处理，采用预处理后的近红外光谱数据构建水稻糙米粉中直链淀粉含量检测的近红外定标模型，各定标模型的决定系数(rsq)见下表6所示。
63.表6
①
编号变量x1变量x2变量x3rsq 1+(二阶导数,n＝8)+(weight msc)+(一次平滑)0.84562+(二阶导数,n＝8)+(weight msc)-(无)0.84183+(二阶导数,n＝8)-(无)+(一次平滑)0.83294+(二阶导数,n＝8)-(无)-(无)0.8126
②
编号变量x1变量x2变量x3rsq 1+(二阶导数,n＝8)+(snv)+(一次平滑)0.83902+(二阶导数,n＝8)+(snv)-(无)0.84013+(二阶导数,n＝8)-(无)+(一次平滑)0.83294+(二阶导数,n＝8)-(无)-(无)0.8126对比表3和表6，可以看出，相较于采用“每隔8个光谱数据点进行二阶导数处理”的方法(对比例3)而言，当基线漂移校正采用“每隔6个光谱数据点进行二阶导数处理”的方法(实施例3)时，建立的定标模型决定系数均较高。说明当待测物质的近红外光谱中含有c-h
伸展键的一级倍频吸收谱带时，基线漂移校正采用“每隔6个光谱数据点进行二阶导数处理”的方法，能够实现较好的光谱预处理效果。
64.在本发明中，除非另有说明，否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且，本文中所述实验方法，如无特殊说明，均为常规方法；所述试剂和生物材料，如无特殊说明，均可从商业途径获得。
65.本发明中所用原料、设备，若无特别说明，均为本领域的常用原料、设备；本发明中所用方法，若无特别说明，均为本领域的常规方法。
66.以上所述，仅是本发明的较佳实施例，并非对本发明作任何限制，凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效变换，均仍属于本发明技术方案的保护范围。

技术特征：
1.一种近红外定标模型构建过程中光谱预处理方案的快速设计方法，其特征在于，包括以下步骤：（1）确定光谱预处理的方法类型，记为x1、x2、
……
、x
k
，k为方法类型的总数；（2）方法类型x1、x2、
……
、x
k
中分别设置n1、n2、
……
、n
k
个水平；（3）对近红外光谱数据依次采用方法类型x1、x2、
……
、x
k
进行预处理，每个方法类型中按照步骤（2）设置多个水平，共获得n1×
n2×……×
n
k
种备选的光谱预处理方案；（4）分别采用各备选的光谱预处理方案对待测物质的近红外光谱数据进行预处理，而后构建待测物质含量检测的近红外定标模型，根据近红外定标模型预测的准确性，确定最佳光谱预处理方案。2.如权利要求1所述的快速设计方法，其特征在于，步骤（1）中，所述光谱预处理的方法类型为基线漂移校正、光散射校正、噪音校正和数据集归一化中的一个或多个，k=1~4。3.如权利要求2所述的快速设计方法，其特征在于，步骤（3）中，将噪音校正设置在基线漂移校正之后。4.如权利要求2或3所述的快速设计方法，其特征在于，所述基线漂移校正在步骤（2）中设置的水平为无处理、一阶导数、二阶导数、三阶导数和四阶导数中的一个或多个。5.如权利要求2所述的快速设计方法，其特征在于，所述待测物质为含有吡咯啉环的化合物；所述基线漂移校正在步骤（2）中设置一个水平，为每隔3~8个光谱数据点进行二阶导数处理。6.如权利要求2所述的快速设计方法，其特征在于，所述待测物质为蛋白质，或者所述待测物质的近红外光谱数据中含有n-h伸展键的一级倍频吸收谱带；所述基线漂移校正在步骤（2）中设置两个水平，分别为每隔6~8个光谱数据点进行一阶导数处理和每隔6~8个光谱数据点进行二阶导数处理。7.如权利要求2所述的快速设计方法，其特征在于，所述待测物质的近红外光谱数据中含有c-h键的一级倍频吸收谱带；所述基线漂移校正在步骤（2）中设置一个水平，为每隔4~7个光谱数据点进行二阶导数处理。8.如权利要求2所述的快速设计方法，其特征在于，所述光散射校正在步骤（2）中设置的水平为无处理、多元散射校正、重均多元散射校正和标准正态变换中的一个或多个。9.如权利要求2或3所述的快速设计方法，其特征在于，所述噪音校正在步骤（2）中设置的水平为无处理、一次平滑处理和二次平滑处理中的一个或多个。10.如权利要求2所述的快速设计方法，其特征在于，所述数据集归一化在步骤（2）中设置的水平为无处理和均值中心化处理中的一个或两个。

技术总结
本发明涉及近红外分析检测技术领域，尤其涉及一种近红外定标模型构建过程中光谱预处理方案的快速设计方法，包括以下步骤：确定光谱预处理的方法类型；对近红外光谱数据依次采用各方法类型进行预处理，每个方法类型中设置多个水平，获得多种备选的光谱预处理方案；分别采用各备选方案对待测物质的近红外光谱数据进行预处理，而后构建待测物质含量检测的近红外定标模型，根据近红外定标模型预测的准确性，确定最佳光谱预处理方案。本发明针对近红外定标模型构建过程中的光谱预处理方案，提供了一种系统性的设计方法，其设计简单合理、快速高效，且对光谱预处理方案的筛选效果好，能够使建立的近红外定标模型具有较高的准确度。够使建立的近红外定标模型具有较高的准确度。

技术研发人员：胡培松唐绍清谢黎虹圣忠华胡时开魏祥进邵高能焦桂爱王玲
受保护的技术使用者：中国水稻研究所
技术研发日：2023.03.20
技术公布日：2023/7/20

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：插秧机车轮交替式自动焊接专用气动夹具的制作方法 下一篇：双段热源一类吸收式热泵控制方法及系统与流程

一种近红外定标模型构建过程中光谱预处理方案的快速设计方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种近红外定标模型构建过程中光谱预处理方案的快速设计方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表