用于在质谱法中进行电荷状态分配的系统和方法与流程
未命名
07-19
阅读:180
评论:0
用于在质谱法中进行电荷状态分配的系统和方法
1.相关案例的交叉引用
2.本技术于2021年8月6日作为pct国际专利申请提交,并要求于2020年8月6日提交的美国专利申请序列号63/062,231的优先权权益,该美国专利申请的全部内容通过引用整体并入本文。
背景技术:
3.作为一般概述,质谱法(ms)是一种基于对从化学化合物形成的离子的质荷比(m/z)值的分析来检测和定量那些化合物的分析技术。ms涉及将来自样品的所关注的一种或多种化合物电离从而产生前体离子,以及对前体离子进行质量分析。串联质谱法或质谱法/质谱法(ms/ms)涉及将来自样品的所关注的一种或多种化合物电离,选择一种或多种化合物的一种或多种前体离子,将一种或多种前体离子碎裂成产物离子,以及对产物离子进行质量分析。
4.ms和ms/ms都可以提供定性和定量信息。测得的前体或产物离子谱可用于识别所关注分子。前体离子和产物离子的强度也可用于对样品中存在的化合物的量进行定量。
5.质谱技术通常利用检测到的离子的质荷比(m/z)生成质谱数据。然而,对检测到的离子的实际电荷或质量的了解通常无法直接测量。因此,在某些情况下,可能会出现检测到的离子的某种重叠。例如,具有一质量的带单电荷的离子可能在质谱中看起来与具有双倍的该质量的带双电荷的离子具有相同的质荷比。这个问题通常可以称为峰重叠问题。
6.例如,在自上而下的质谱法(ms)蛋白质分析中,质谱中质量或质荷比(m/z)峰的重叠是个重大问题。在这种类型的分析中,会产生非常宽范围的不同片段或产物离子,包括长度为1-200个氨基酸并具有1-50种不同电荷状态的产物离子。产物离子峰在单个谱中彼此严重重叠。此外,重叠可能非常广泛,使得即使是具有最高质量分辨率的质谱仪(傅里叶变换离子回旋加速器共振(ft-icr)或轨道阱)也无法对此类重叠峰解卷积。因此,在自上而下的蛋白质分析中经常丢失大的产物离子,从而限制了大蛋白质的序列覆盖。公开于2020年8月6日的国际公开wo2020/157720('720公开)和公开于2019年10月17日的国际公开wo2019/197983均提供了对自上而下ms蛋白质分析和相关联的挑战的额外讨论。
技术实现要素:
7.在一方面,本技术涉及一种用于在质谱法中分配电荷状态的方法,该方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比(m/z)箱(bin)生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;以及基于m/z箱的组,将电荷状态分配给一个或多个特征。在示例中,该方法还包括基于m/z箱的组生成简化质谱,其中m/z箱的组被指示在该简化质谱中。在另一个示例中,该方法还包括基于所分配的电荷状态计算对应于所述离子到达事件的质量。在又一个示例中,对m/z箱的分组进一步基于附加的分离域数据。
在又一示例中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。
8.在上述方面的另一个示例中,使用主成分分析(pca)、k-均值聚类算法、或主成分变量分组(pcvg)算法执行对m/z箱的分组。在示例中,该方法还包括生成所述离子到达事件的表示,所述表示具有m/z维度、检测器响应维度、和离子计数或概率维度。在另一个示例中,所述表示是热图。在又一示例中,对m/z箱的分组至少部分地通过将模式识别算法应用于所述表示来执行。
9.在另一方面,本技术涉及一种用于在质谱法中分配电荷状态的系统,该系统包括:检测器,被配置为针对每个离子到达事件生成检测器响应信号;处理器;以及存储指令的存储器,所述指令被配置为在由所述处理器执行时使所述系统执行一组操作,所述一组操作包括:从所述检测器接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由所述检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比(m/z)箱生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;以及基于m/z箱的组,将电荷状态分配给一个或多个特征。在示例中,操作还包括基于m/z箱的组生成简化质谱,其中m/z箱的组被指示在该简化质谱中。在另一个示例中,对m/z箱的分组进一步基于附加的分离域数据。在又一示例中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。在又一示例中,使用主成分分析(pca)、k-均值聚类算法、或主成分变量分组(pcvg)算法执行对m/z箱的分组。
10.在上述方面的另一个示例中,该系统还包括生成所述离子到达事件的表示,所述表示具有m/z维度、检测器响应维度、和离子计数或概率维度。在示例中,该系统还包括生成组的置信度分数,并且其中分配电荷状态进一步基于所述置信度分数中的至少一个置信度分数。
11.在另一方面,本技术涉及一种用于在质谱法中分配电荷状态的方法,该方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比(m/z)箱生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;识别表示单离子到达事件的m/z箱;以及基于被识别为具有单离子到达事件的m/z箱的组,将电荷状态分配给一个或多个特征。在示例中,该方法还包括生成组的置信度分数,并且其中分配电荷状态进一步基于所述置信度分数中的至少一个。在另一个示例中,对m/z箱的分组进一步基于附加的分离域数据进行,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。在又一个示例中,识别表示单离子到达事件的m/z箱基于在m/z箱中观察到的检测事件的频率。
12.在另一方面,本技术涉及一种用于在质谱法中分析数据的方法,该方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,生成至少由根据所述离子到达事件生成的质谱的质荷比(m/z)箱和检测器响应轮廓组成的数据表示;以及利用所述数据表示进行化合物识别和种类识别中的至少一项。在示例中,化合物识别
包括化合物定量。在另一个示例中,化合物识别包括将电荷分配给检测到的至少一组离子。在又一示例中,分配电荷至少部分地基于所述检测器响应轮廓。在又一示例中,该方法还包括简化所述数据表示。
13.在上述方面的另一个示例中,简化的数据表示包括至少一阶或更高阶的张量数据。在示例中,简化所述数据表示包括生成m/z域中的一个或多个谱。在另一示例中,简化所述数据表示包括生成质量域中的一个或多个谱。在又一示例中,简化所述数据表示至少部分地基于所述检测器响应轮廓。在又一示例中,简化所述数据表示包括将具有相似的检测器响应轮廓的m/z箱分组。
14.在上述方面的另一个示例中,该方法还包括基于所分配的电荷状态计算对应于所述离子到达事件的质量。在示例中,简化所述数据表示基于附加的分离域数据。在另一示例中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。在又一示例中,简化所述数据表示至少部分地通过使用多变量分析来执行。在又一示例中,简化所述数据表示至少部分地通过应用非负因式分解算法来执行。
15.在上述方面的另一个示例中,所述多变量分析包括以下中的至少一种:主成分分析(pca)、k均值聚类算法、t-sne算法和主成分变量分组(pcvg)算法。在示例中,简化所述数据表示至少部分地基于使用模式识别或机器学习来执行。在另一个示例中,简化所述数据表示至少部分地使用统计方法以将观察到的检测器响应匹配到预定检测器响应分布的目录来执行。在又一示例中,所述目录是先验地生成的。在又一示例中,所述目录是根据简化的数据表示生成的。
16.在上述方面的另一个示例中,所述化合物识别或种类识别包括生成化合物库或种类库并使用算法将化合物或种类与库进行匹配。在示例中,检测系统是基于电子倍增器的检测系统或基于像电荷的检测系统之一。
17.提供本发明内容是为了以简化形式介绍概念的选择,这些概念将在下面的具体实施方式中被进一步描述。本发明内容不旨在识别要求保护的主题的关键特征或必要特征,也不旨在用于限制要求保护的主题的范围。示例的附加方面、特征和/或优点将部分地在随后的描述中阐述,并且部分地将从描述中清楚,或者可以通过对本公开的实践获知。
附图说明
18.参考以下附图描述非限制性和非穷尽性示例。
19.图1a描绘了用于执行质谱法的示例系统。
20.图1b描绘了离子脉冲的示例图线。
21.图1c描绘了基于离子脉冲强度而被分入不同带或通道的示例质谱。
22.图2描绘了由像电荷检测器测量的瞬态时域信号的示例图线。
23.图3描绘了包括像电荷检测器的示例系统。
24.图4描绘了具有重叠特征的示例谱。
25.图5描绘了示例脉冲高度分布的图线。
26.图6是图示将质谱拆分到m/z箱中的示例的图线。
27.图7描绘了示例热图。
28.图8是指示示例检测器响应轮廓的图线。
29.图9描绘了用于使用检测器响应轮廓进行电荷状态分配的示例方法。
30.图10描绘了用于使用检测器响应轮廓进行电荷状态分配的示例方法。
31.图11描绘了用于使用检测器响应轮廓进行电荷状态分配的示例方法。
32.图12描绘了用于使用检测器响应轮廓进行电荷状态分配的示例方法。
具体实施方式
33.如上面简略讨论的那样,检测到的离子的峰重叠对于ms结果的分析是有问题的,并且在为具有相似质荷比(m/z)的离子生成的质量信号之间进行区分会是质谱法中的难题。对于化合物识别,质谱通常被转换为对应于不同化合物的单一同位素质量的列表。为了找到这样的质量,通常采用以下策略:首先,将质谱中的每个峰分配给对应的具有特定电荷状态的同位素簇。在此之后,找到每个簇的最低m/z峰,这是对应于单一同位素质量的峰。知道了簇电荷,每个簇的单一同位素峰就可以转换为单一同位素质量的零电荷列表,然后可以将其用于将质谱峰归因于化学化合物的后续算法。可替代地,代替单一同位素m/z,可以类似地使用同位素簇的平均m/z及其对应的电荷状态。如果来自同位素簇的某些峰低于检测限界,特别是如果单一同位素m/z低于检测限界,则此方法具有优势。实际上,将电荷状态正确分配给质谱中的特征(同位素簇)可以是朝着化合物识别的关键一步。
34.通常,m/z域中的电荷解卷积算法用于电荷状态识别。然而,如果存在严重的谱重叠,其包括叉指峰和峰重叠,则此方法具有挑战性。对于混合物的复杂谱或大型生物聚合物的产物离子谱,例如自上而下的分析谱,通常就是这种情况。图4描绘了图示碳酸酐酶2(ca2)的ecd自上而下谱中的多个重叠特征的示例的示例图线,其中常规算法容易出错。
35.已经认识到,电子倍增器或像电荷检测系统的检测响应可以与测量的离子的电荷状态成比例(参见例如'720公开中的参考文献的讨论,其在此通过引用整体并入本文)。因此,理论上可以通过仔细研究这种强度来确定电荷状态。有趣的是,很少有人尝试利用这种现象来推断电荷状态。这是因为其在技术上具有挑战性。
36.第一,来自多次采集的检测事件通常被汇总到单个谱中以压缩数据。然而,这种压缩会阻止对每个单独离子事件的检测器响应进行任何进一步分析,从而无法推断电荷状态。因此,对于此类分析,每个离子检测事件强度及其质谱特征(例如飞行时间或振荡频率)的完整记录是优选的。替代的数据压缩策略也可用于保留单独检测器响应的一些信息,同时仍保持数据压缩。例如,可以将每个检测事件共同添加到形成检测器响应带的多谱,类似于'720公开中描述的方法。
37.第二,多个共同检测的离子可以生成检测器响应,其基本上是由每个共同到达的离子生成的检测器响应的总和。因此,并不总是可以仅使用检测信号的检测器响应强度来推断离子的电荷状态。一般而言,对于使用检测器响应来确定电荷状态而言,足够低的离子通量是优选的,使得具有共同到达离子的检测事件的数量被最小化。
38.第三,此类方法中的另一个挑战是每种特定类型离子的检测器响应分布很宽,并且对于不同种类经常重叠。图5是图示与具有7+电荷的离子相比当检测具有3+电荷的离子时检测器响应分布的示例的图线500。如图所示,具有3+电荷的离子的脉冲高度分布502不同于具有7+电荷的离子的脉冲高度分布504。因此,由检测器针对具有相同m/z(本示例中的m/z值为517)的离子观察到的脉冲高度分布很宽且重叠。
39.如此宽的脉冲高度分布使得基于检测器响应强度的任何常规电荷状态分配方法都较差,因为难以区分m/z相同但电荷不同的离子。
40.认识到使用检测响应强度直接识别电荷状态的宽强度分布问题,并对使用基于像电荷的检测器的质谱仪提出了一些策略来处理该问题。在这样的系统中,宽的分布主要归因于测量期间与残留中性分子的碰撞,这会抑制所关注离子的相干振荡并有效地停止对其信号的检测,使其贡献取决于实际离子测量时间。因此,有人提出过滤归因于在采集期间经历碰撞的离子的检测事件(kafader等人,《分析化学》2019年第91卷第4期第2776
–
2783页)。然而,这种方法会导致大量离子被丢弃,从而充分增加了获得良好离子统计数据的时间。此外,还提出过减少基础压强和降低离子速度的方法,但这些方法会对质量分析器特性产生不利影响。最后,有人提出采用复杂的数据处理技术来检测碰撞的确切时间,从而根据实际检测时间缩放测得的信号强度(kafader等人,《美国质谱学会期刊》2019年第11卷第2200-2203页)。
41.对于使用电子倍增器检测器的质谱仪,二次发射电子的平均数量是针对具有特定m/z和电荷的每个离子明确定义的,但是定义观察到的响应的幅度的一次发射电子的确切数量是个概率量。泊松统计描述了二次发射产额和与浴气的碰撞,但该过程的底层物理却大不相同。因此,为给采用像电荷感应检测器的质谱仪处理宽分布而提出的技术均不适用于具有基于电子倍增器的检测系统的质谱仪。因此,需要能解决至少这个问题的技术。
42.通常,检测器响应轮廓可能不足以准确确定电荷状态,检测器响应轮廓可能非常有助于分离源自不同化合物的信号。如果将常规的电荷确定算法与用于电荷状态确定的检测器响应域联合,则结合准确的电荷状态信息被编码在m/z域中的事实,可以显著提高性能。
43.重要的是,因为分离发生在质谱法分析的最后一步,所以该方法可适用于替代方法将不起作用的一些情况。具体来说,液相色谱(lc)方法可以提供化合物的分离;然而,它们对于分离源自同一前体的产物离子几乎没有用处,而来自同一前体的片段仍然可以基本重叠。类似地,通常在碎裂之前执行的离子迁移率分离(例如微分迁移率分离)需要进行大幅修改以设置碎裂后分离。
44.一种提高常规电荷确定算法性能的方法是利用检测器响应轮廓来对数据进行分组。同一种化学化合物通常有形成同位素簇的多个同位素,这些同位素可能会或可能不会在m/z域中被解析。在某些情况下,对应于那些同位素的位置的m/z箱可以具有相似的检测响应轮廓。例如,如果满足至少两个条件,则检测器响应轮廓可以是相似的。第一,信号不重叠(即m/z箱不包含来自多个不同种类的信号);第二,对于包含来自那些同位素的信号的所有m/z箱,信号是在主要为单离子到达的条件下采集的。这种相似性允许对包含来自同一化合物的信息的m/z箱进行分组——有效地在多个通道之间拆分信号。这产生了大大简化的谱,以便后续通过常规算法进行电荷检测分析。代替电荷检测,这种简化的谱可用于直接谱匹配或不执行电荷检测步骤的化合物或种类识别的其他算法。例如,种类可以是微生物有机体,并且对应的数据可以在ms和ms/ms(串联ms)体系中生成。在一些示例中,可以生成简化的化合物或种类谱的库,并将其用于所述直接谱匹配。
45.图1a描绘了用于执行质谱技术的示例质量分析系统100。在一些示例中,系统100可以是质谱仪。示例系统100包括离子源装置101、解离装置102、质量分析器103、检测器104
20mv之间的最大脉冲高度的检测到的离子生成第一质谱160。为具有介于20-30mv之间的最大脉冲高度的检测到的离子生成第二质谱170。为具有介于20-30mv之间的最大脉冲高度的检测到的离子生成第三质谱180。在'720公开中进一步讨论了关于这种分离和划带的附加细节。如上所述,虽然将离子分成不同的带有好处,但分离不允许识别特定离子的电荷状态。如本文进一步讨论的,脉冲特性可用于生成检测器响应轮廓,其允许对m/z箱进行分组并最终进行电荷分类。
52.图2描绘了由像电荷检测器测量的瞬态时域信号的示例图线200,该瞬态时域信号包括来自在质量分析器中振荡的多个离子中的每个离子的分量。为了将由像电荷检测器测量的瞬态时域信号分解成单独的分量,将瞬态时域信号转换为频域信号。转换方法包括但不限于傅立叶变换或小波变换。频域信号中的峰对应于在质量分析器中振荡的多个离子中的单独离子。使用依赖于特定类型的质量分析器的众所周知的公式将频域峰转换为m/z峰以产生质谱。
53.因此,对于像电荷检测器,频域信号或峰的强度与作为基础的离子的电荷状态成比例,类似于上述脉冲如何与电荷状态成比例。因此,频域(fd)峰的强度或其他特性可用于生成类似于上述脉冲特性分布的分布。从fd峰的特性生成的分布可以称为fd峰特性分布或fd峰强度分布,其中fd峰的强度用作所关注的特性。然后可以以与脉冲特性分布基本相同的方式使用fd峰特性分布来确定电荷状态。
54.图3描绘了包括像电荷检测器318的示例系统300。图3的系统包括质谱仪310和计算部件,计算部件包括存储器和处理器320。系统的计算元件,例如处理器320和存储器,可以被包括在质谱仪本身中、位于质谱仪附近、或者位于远离质谱仪的位置。通常,系统的计算元件可以与检测器318电子通信,使得计算元件能够接收从检测器318生成的信号。处理器320可包括多个处理器并且可包括任何类型的合适的处理部件以用于处理信号并生成本文讨论的结果。
55.质谱仪310包括质量分析器317。质量分析器317包括像电荷检测器318。像电荷检测器318为检测到的离子产生振幅与离子电荷状态成比例的振荡信号或瞬态时域信号。质量分析器317可以是能够使用像电荷检测器检测离子的任何类型的质量分析器,包括但不限于静电线性离子阱(elit)、ft-icr或轨道阱质量分析器。质量分析器317在图13中被示为elit,并且像电荷检测器318被示为elit的拾取电极。
56.质量分析器317检测由质量分析器317中的多个离子的振荡在像电荷检测器318上感应的瞬态时域信号319。多个离子被质谱仪310传输到质量分析器317。处理器320将瞬态时域信号319转换成多个频域脉冲或峰321。每个频域信号对应于多个离子中的一个离子。例如,处理器320使用傅立叶变换将瞬态时域信号319转换为多个频域峰321。
57.处理器320可以将多个频域峰321的每个频域峰的强度与对应于两个或更多个不同电荷状态范围的两个或更多个不同预定强度范围进行比较。处理器320可以基于比较将每个频域峰存储在对应于两个或更多个预定强度范围的两个或更多个数据集322之一中。然后可以根据数据集322生成质谱1623。处理器320可以基于频域峰和/或本文讨论的识别的电荷状态来创建质谱。
58.在各种实施例中,处理器320在采集期间将瞬态时域信号319转换为多个频域峰321,将每个频域峰的强度与两个或更多个不同预定强度范围进行比较,并且将每个频域峰
存储在两个或更多个数据集322之一中。在替代实施例中,处理器320在采集后将瞬态时域信号319转换为多个频域峰321,将每个频域峰的强度与两个或更多个不同预定强度范围进行比较,并将每个频域峰存储在两个或更多个数据集322之一中。
59.如上所述,如果相同离子的多个副本同时在质量分析器317中振荡,则测得的强度可能与电荷状态不成比例。因此,在各种实施例中,质谱仪310将离子传输到质量分析器317,使得质量分析器317在任何给定时间仅包括具有特定m/z和电荷状态的单离子。
60.在各种实施例中,图3的系统还包括离子源装置311。离子源装置311可以是例如电喷射离子源(esi)装置。离子源装置311在图3中被示为质谱仪310的一部分,但也可以是单独的装置。此外,质谱仪310还包括解离装置。解离装置可以是但不限于exd装置315或cid装置316。解离装置可用于例如自上而下的蛋白质分析。
61.在自上而下的蛋白质分析中,离子源装置311电离样品的蛋白质,从而产生在离子束中的该蛋白质的多个前体离子。解离装置解离离子束中的多个前体离子,从而产生在离子束中的具有不同电荷状态的多个产物离子。如上所述,质谱仪310将多个产物离子传输至质量分析器317,使得多个产物离子是由质谱仪310传输至质量分析器317的多个离子。
62.在各种实施例中,处理器320用于控制或提供指令给离子源装置311和质谱仪310并且分析收集的数据。处理器320通过例如控制一个或多个电压、电流或压强源(未示出)来控制或提供指令。
63.图4描绘了图示碳酸酐酶2(ca2)的ecd自上而下谱中的多个重叠特征的示例的示例图线。图5描绘了示例脉冲特性分布的图线500。该脉冲特性分布基于为生成图4中的谱而执行的分析。图线500中的脉冲特性分布基于脉冲高度特性。因此,脉冲特性分布可以称为脉冲高度分布或强度分布。在图线中,x轴表示脉冲高度,并且y轴表示检测的概率或频率。例如,较高的概率值表示更频繁地检测到具有对应脉冲高度的离子。
64.在图线500中描绘了第一脉冲特性分布502和第二脉冲特性分布504。从图线500可以看出,脉冲特性分布重叠,但是第一脉冲特性分布502的轮廓与第二脉冲特性分布504的轮廓不同。轮廓形状的差异主要是由于形成相应脉冲高度分布的检测到的离子的电荷状态不同。例如,形成第一脉冲特性分布502的检测到的离子对应于3+电荷离子,而形成第二脉冲特性分布504的检测到的离子对应于7+电荷离子。因此,一旦已经建立或生成各种脉冲高度分布,就可以通过确定对应的离子脉冲适合哪个脉冲高度分布轮廓来确定任何单个检测到的离子的电荷状态。脉冲特性分布可以被认为是检测器响应轮廓。
65.作为一些附加的细节,脉冲特性分布502、504是针对具有在大约517处的非常相似的m/z值的产物离子生成的。产物离子是根据对碳酸酐酶2(ca2)的自上而下ecd分析而生成的,例如图4中描绘的谱。如上所述,如在图线500中可以看出,源自不同电荷状态的脉冲高度分布可以显著重叠。在这种重叠的情况下,单个强度数据点是不够的,并且基于单个强度数据点的任何电荷状态确定将很可能是不正确的。
66.如上所述,一种提高常规电荷确定算法性能的方法是利用脉冲特性分布来对数据进行分组。同一种化学化合物通常有形成同位素簇的多个同位素,这些同位素可能会或可能不会在m/z域中被解析。在某些情况下,对应于那些同位素的位置的m/z箱具有相似的检测响应轮廓。这种相似性允许对包含来自同一化合物的信息的m/z箱进行分组——有效地在多个通道之间拆分信号。这产生了大大简化的谱,以用于通过常规算法进行的后续电荷
检测分析。
67.图6是图示将质谱拆分到m/z“箱”中的示例的图线600。每个m/z“箱”表示一个m/z范围并包含质谱的一部分(例如,m/z范围内离子的离子计数)。然后基于各种m/z箱的检测器响应轮廓(例如上面讨论的脉冲特性分布)的相似性对各种m/z箱进行分组。通过以这种方式对m/z箱进行分组,可以为每个组形成大大简化的谱。这些分组的谱可以在谱中被示为不同的颜色(例如,“红色”、“黑色”、“深蓝色”、“浅蓝色”)或以其他方式或格式区分。在其他示例中,可以生成、显示和/或分析每个分组的箱的单独谱。
68.在所描绘的示例图线600中,突出显示了四个单独的分组,包括m/z箱的第一分组602、m/z箱的第二分组604、m/z箱的第三分组606和m/z箱的第四分组606。每个分组的对应的检测器响应轮廓也用将检测器响应轮廓连接到相关联的m/z箱的分组的箭头显示。例如,第一组检测器响应轮廓612显示为对应于第一分组602。m/z箱的第一分组602共享相似的检测器响应轮廓(如第一组检测器响应轮廓612中所示),并且因此被分组在一起。类似地,其他组的检测器响应轮廓614-618也被描绘为对应于m/z箱的相应分组。
69.在质谱系统包括附加的分离域(例如lc分离的保留时间、漂移时间、离子迁移率域的补偿电压等)的情况下,也可以单独或者组合使用这些分离域中的一个或多个,以对信号进行分组。在一些方面,分离域的组合可用于将信号分组成多个特定子组。例如,可以首先基于检测器响应轮廓进行m/z箱分组,然后基于此类附加的分离域数据进一步进行亚分组。在其他示例中,可以首先基于附加的分离域数据进行m/z箱的分组,然后基于检测器响应轮廓进行亚分组。在其他示例中,m/z分组可以基于检测器响应轮廓的相似性和附加的分离域数据二者进行。
70.对m/z箱的分组可以通过各种多变量分析算法执行,例如主成分分析(pca)、k-均值聚类、t-分布随机近邻嵌入(t-sne)或本领域已知的其他已知分组算法。在所描绘示例中,使用主成分变量分组(pcvg)算法对m/z箱进行分组。
71.使用检测器响应轮廓来将不同的m/z箱进行分组或相互关联也可以以不同的方式并通过不同的表示来完成。例如,图7描绘了示例热图,在x轴上表示m/z,在y轴上表示检测器响应,以及将对应检测器响应的离子计数或概率作为热图中颜色的强度。例如,颜色越深,则在对应的m/z位置和检测器响应位置处计数的离子就越多。检测器响应轴可以具有与所使用的检测器响应轮廓的类型对应的单位。例如,检测器响应轴可以表示脉冲高度。
72.也可以使用能够表示三个量的可视化或表示(例如,以概率或离子计数作为深度轴的三维图线)。例如,表示的第一维是检测器响应、第二维是m/z位置,第三维是概率或离子计数。
73.通过生成这样的可视化或表示,可以在单算法中处理检测器响应轮廓数据和m/z位置信息。例如,可以对这些数据表示进行各种模式识别算法,这可以允许对模式进行分类和/或检测。这些模式识别算法例如可以是机器学习算法或图像识别算法。
74.在一些实施例中,可以执行附加的步骤,其可以包括例如使用充分表征的化合物生成检测器响应轮廓及其相关联电荷状态的库。该库可以是通用库,适用于多种仪器,或者可替代地,该库可以是为特定仪器生成的自定义库。每个充分表征的化合物的检测器响应轮廓及其相关联电荷状态的库提供了参考模板或检测器响应分布,其可以被存储并且然后在后续分析中被访问以进行比较。例如,在后续的分析中,可以将捕获的检测器响应轮廓与
检测器响应轮廓库中存储的检测器响应轮廓进行比较,以识别对应的存储的检测器响应轮廓,从而识别捕获的检测器响应轮廓的相关联电荷状态。
75.可选地,化合物的m/z位置可以存储在与所关注化合物相关联的检测器响应轮廓及其相关联电荷状态的库中。在这个实施例中,电荷状态分配的步骤是基于以下两者之间的相似度来执行的:从为所关注化合物捕获的捕获质量分析数据生成的捕获的检测器响应轮廓;和,与该化合物相关联的库中存储的检测器响应轮廓。定义了一个或多个m/z箱的m/z位置归因于化合物的对应一个或多个相邻电荷状态。在随后的步骤中,然后可以从捕获质量分析数据中共同提取所定义的一个或多个m/z箱用于后续分析。这种检测器响应库可以互换地称为检测器响应目录。
76.在一些情况下,重叠特征不仅具有叉指峰,而且还具有重叠峰,其中单个m/z箱包含源自到达检测器的多个不同种类的信号。在一些情况下,这样的信号可以准确地归因于那些重叠的特征。实际上,如果没有共同检测到的事件,则总信号是源自不同种类的各种贡献的总和,因此可以使用常规的线性代数算法(诸如例如非负最小二乘(nnls)算法以及其他分解技术)分解为单独的贡献。将源自单一种类并在单离子到达条件下记录的检测器响应轮廓称为基本检测器响应轮廓很方便。在一些方面,可以捕获多个检测器响应轮廓。多个检测器响应轮廓中的每一个对应于其自身的基本检测器响应轮廓,或对应于基本检测器响应轮廓的相关联组合。在任何一种情况下,对应于重叠峰的每个检测响应轮廓都可以分解为其(一个或多个)基本检测器响应轮廓。
77.在并非每个离子都满足单离子到达条件的情况下,存在这样的到达事件:其中包含来自相同类型离子的信号的m/z箱将具有不同的检测器响应分布,这取决于在该事件到达的离子的数量。事实上,信号在检测器上被有效地求和,并且使多个离子同时到达将导致检测器响应分布的强度向右偏移。
78.图8是指示响应于以相对于采集周期的不同速率到达的相同离子类型的示例检测器响应轮廓(例如,分布)的图线。在图8的示例中,离子传输速率对应于平均数量=每次tof推动有0.2个离子(每个采集周期主要是单离子到达)和平均数量=每次推动有6个离子(每个采集周期主要是多离子到达)。第一检测器响应轮廓(例如,分布)802对应于以单离子到达为主的较低离子传输速率,而第二检测器响应轮廓(例如,分布)804对应于以多离子到达为主的较高离子传输速率。
79.如所指示的,多离子到达可以防止此类离子的有效分组。在某些情况下,很难对每种所采集类型的离子都满足单离子到达条件。如果不同离子种类的总计数存在很大差异,则这将特别是个问题。在这种情况下,将需要很长的采集时间来针对低丰度离子采集具有足够统计性的数据,同时满足高丰度离子的单离子到达条件。因此,期望有一种策略可以容忍一定数量的离子到达多重性。
80.重要的是,可以通过简单检查m/z箱中观察到的检测事件的频率来区分单离子到达和多离子到达。该过程可以使用泊松分布并通过简单计算特定m/z箱的“未检出”的发生来建模,可以计算同一箱中每种离子多重性的频率。这样的频率然后可以用作分组算法的输入,以帮助将具有不同多重性的离子分配为同一组离子。可以使用贝叶斯框架或其他合适的技术来解决较高多重性的重叠特征的情况。基于构建块,许多不同的实施例是可行的,其组合了m/z和检测器响应域并解决了电荷状态确定问题。
81.图9是用于使用检测器响应轮廓进行电荷状态分配的示例方法900。在图9的示例方法900的操作902处,以原始模式采集数据(保留关于每个检测事件的信息)。例如,来自检测器的脉冲特性或频域信息被保留,使得可以生成检测器响应轮廓。作为示例,原始数据可以作为对应于多个离子到达事件的检测器响应信号被接收。该检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应(例如,脉冲)相关的信息。在操作904处,可以组合数据以形成检测器响应带和谱,例如上面关于图1c所示和讨论的以及如'720公开中所描述的带状谱。可以在数据采集期间组合并执行操作902和904。在一些示例中,可以省略操作904并且可以使用非带状谱。
82.在操作902和904之后,在操作906处,根据每个m/z箱的检测器响应轮廓对每个m/z箱(具有非零离子计数)进行分组。m/z箱的分组可以包括生成具有相似检测器响应轮廓的m/z箱的列表。该步骤可以使用例如分组算法来执行,例如pca或k最近邻算法,其接收m/z箱的检测器响应轮廓作为输入。m/z箱的分组也可以基于将模式识别算法应用于表示来进行,所述表示诸如图7的热图或关于图7讨论的其他类型的表示。这样的模式识别算法可以包括例如机器学习算法或图像识别算法。如上所述,分组操作也可以基于与m/z箱中的检测事件/离子相关联的附加的分离域数据(例如,lc分离的保留时间、漂移时间、离子迁移率域的补偿电压等)来进行。
83.操作906还可以包括为每个m/z箱生成检测器响应轮廓。生成检测器响应轮廓可以在采集期间基于为每个检测事件接收到的脉冲特性(或频域特性)来生成。因此,在一些示例中,每个脉冲特性不需要存储为对应于每个检测到的离子。相反,检测器响应(例如,脉冲特性)被存储为与m/z箱相关联以允许为m/z箱创建检测器响应轮廓。
84.基于在操作906中生成的m/z箱的列表和/或分组,可以形成大大简化的质谱。可以基于分组生成多个简化的质谱。例如,可以为m/z箱的每个分组或列表生成不同的谱。简化的一个谱和/或多个谱随后可在操作908处经历可在m/z域中应用的电荷状态分配算法。该操作可使用m/z空间中的电荷解卷积算法来执行,如本领域技术人员将理解的。电荷状态分配算法的应用导致由特定组的m/z箱形成的特征的电荷状态的分配。例如,可以为m/z箱的每个分组分配一电荷状态。可选地,表示该特征的信号(例如,由m/z箱的对应分组形成的信号)可以转换为零电荷信号(例如,将分配的电荷乘以m/z值)并共同添加以形成质谱,作为操作908的一部分。随着电荷状态的识别,特定分析物和/或特定分析物的量可以从所得质谱中更准确地确定。
85.图10是用于使用检测器响应轮廓进行电荷状态分配的另一个示例方法1000。在图10的示例方法1000中,操作1002-1006类似于图9中所描绘和上文描述的方法900的操作902-906。方法1000中的操作1008增加了对在操作1006中生成的分组或列表确定或分配置信度分数的操作。置信度分数可以是分组质量的评分,其表示关于某个组或某些组的m/z箱的相似度的定量程度。例如,一个m/z箱的检测器响应轮廓可能与其他m/z箱的几个其他检测器响应轮廓部分地匹配。然而,分组最终是基于部分映射的最佳匹配进行的。该匹配的强度可以由置信度分数来表示。在操作1006中生成的分组/列表和在操作1008中生成的置信度评分输出随后可用作操作1010中m/z空间/域中电荷状态确定算法的输入,类似于图9的方法900中的操作908。在一些示例中,电荷状态确定算法可以基于贝叶斯框架,例如unidec算法(marty等人,《化学分析》2015年第87卷第8期第4370
–
4376页),其可以受益于在操作
1008中生成的附加的置信度分数。
86.图11是用于使用检测器响应轮廓进行电荷状态分配的另一个示例方法1100。在图11的示例方法1100中,操作1102-1106类似于图9中所描绘和上文描述的方法900的操作902-906。在操作1108处,识别具有归因于基本检测器响应轮廓的信号的m/z箱。对此的一个示例方法是检查每个组中包含的m/z箱是否类似于完整的或部分的同位素簇,该同位素簇中归属有至少两个同位素。来自所述组内的那些m/z箱的对应检测器响应可归因于基本检测器响应。
87.在操作1110处,找到或识别具有重叠检测器响应轮廓的m/z箱。该操作可以通过识别在操作1108中未识别的所有非零m/z箱来完成。这些识别的具有重叠检测器响应轮廓的m/z箱可以归因于重叠信号。在操作1112处,使用诸如非负最小二乘(nnls)算法之类的已知算法将在操作1110中识别的每个m/z箱的重叠信号分解为基本信号。在操作1114处,使用在操作1112中生成的分解信号完成m/z箱的分组/列表。例如,然后对分解的基本信号的各个部分进行分组/列表,使得来自每个有贡献的检测器响应轮廓的对应信号(例如,离子计数)量被添加到正确的分组。在操作1116处,m/z箱的分组/列表在m/z域中经历电荷状态分配算法,类似于上面讨论的操作。例如,识别可以例如基于形成同位素簇的峰的相对距离。
88.图12是用于使用检测器响应轮廓进行电荷状态分配的另一个示例方法1200。在图12的示例方法1200中,操作1202-1206类似于图9中描绘和上面描述的方法900的操作902-906。在操作1208处,确定分组/列表是否表示单离子到达。例如,可以识别表示单离子到达事件的m/z箱的组。可以通过分析对应的检测器响应轮廓的特性以确定检测器响应轮廓的特性是更类似于单到达事件(例如,图8中的检测器响应轮廓802)还是更类似于多离子到达(例如,图8中的检测器响应轮廓804)来进行这样的确定或识别。还可以通过简单检查m/z箱中观察到的检测事件的频率来区分单离子到达和多离子到达。该过程可以使用泊松分布并通过简单计算特定m/z箱的“未检出”的发生来建模,可以计算同一箱中的每种离子多重性的频率。这样的频率然后可以用作分组算法的输入,以帮助将具有不同多重性的离子分配为同一组离子。
89.在操作1210处,可以基于离子检测事件的多重性对分组的m/z箱进行过滤或进一步分组。例如,可以将具有单离子事件的m/z箱保留或过滤到单离子事件类别中。然后可以将具有多离子事件的m/z箱移除或过滤到多离子事件类别中。值得注意的是,具有多离子事件的m/z箱可以最初被分组在一起,因为它们各自的检测器响应轮廓最接近地匹配具有多离子事件的其他m/z箱的检测器响应轮廓。
90.在一些示例中,对于具有多离子事件的m/z箱,可以生成或模拟基本检测器响应轮廓(例如,如果出现单离子条件时的检测器响应轮廓)。这种基本响应轮廓的生成可以来自存储的库或数据库,其存储基本响应轮廓与多离子响应轮廓的相关性。也可以执行其他技术来生成基本响应轮廓。生成的基本响应轮廓然后可用于m/z箱的分组/列表。因此,来自具有多离子事件的m/z箱的贡献仍然可以与具有单离子事件的m/z箱一起使用。
91.然后,操作1212-1218类似于上面讨论的图11的方法1100的操作1110-1116。可以使用贝叶斯框架或其他合适的技术来解决更高多重性的重叠特征的情况。
92.图9-图12中的上述方法的操作(以及本文描述的其他操作)可以由本文讨论的系统和/或系统部件执行,例如图1-图3中的系统。例如,操作可以由一个或多个处理器根据存
储在存储器中的指令来执行。
93.虽然结合各种实施例描述了本教导,但不意图将本教导限于此类实施例。相反,如本领域技术人员将理解的那样,本教导包含各种替代、修改和等同方案。
94.例如,上文参考根据本公开的各方面的方法、系统和计算机程序产品的框图和/或操作图示描述了本公开的各方面。框中注明的功能/动作可能会不按任何流程图中所示的顺序发生。例如,连续显示的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行,这取决于所涉及的功能/动作。此外,如本文和权利要求书中所用,短语“元素a、元素b或元素c中的至少一个”旨在传达以下任何一项:元素a,元素b,元素c,元素a和b,元素a和c,元素b和c,以及元素a、b和c。
95.本技术中提供的一个或多个方面的描述和说明不旨在以任何方式限制或约束所要求保护的本公开的范围。本技术中提供的方面、示例和细节被认为足以传达所有权并使其他人能够作出和使用所要求保护的本公开的最佳模式。所要求保护的本公开不应被解释为限于本技术中提供的任何方面、示例或细节。无论是组合地还是单独地显示和描述,各种特征(结构的和方法的)旨在被选择性地包括或省略以产生具有特定一组特征的实施例。在提供以本技术的描述和说明的情况下,本领域技术人员可以设想落入体现在本技术中的总体发明概念的较宽方面的精神内且不偏离所要求保护的本公开的较宽范围的各种变化、修改和替代方面。
技术特征:
1.一种用于在质谱法中分配电荷状态的方法,所述方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比m/z箱生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;以及基于m/z箱的组,将电荷状态分配给一个或多个特征。2.根据权利要求1所述的方法,还包括基于m/z箱的组生成简化质谱,其中,m/z箱的组被指示在所述简化质谱中。3.根据权利要求1-2中任一项所述的方法,还包括基于所分配的电荷状态计算对应于所述离子到达事件的质量。4.根据权利要求1-3中任一项所述的方法,其中,对m/z箱的分组进一步基于附加的分离域数据。5.根据权利要求4所述的方法,其中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。6.根据权利要求1-5中任一项所述的方法,其中,使用主成分分析pca、k-均值聚类算法、或主成分变量分组pcvg算法执行对m/z箱的分组。7.根据权利要求1-6中任一项所述的方法,还包括生成所述离子到达事件的表示,所述表示具有m/z维度、检测器响应维度、和离子计数或概率维度。8.根据权利要求7所述的方法,其中,所述表示是热图。9.根据权利要求7-8中任一项所述的方法,其中,对m/z箱的分组至少部分地通过将模式识别算法应用于所述表示来执行。10.一种用于在质谱法中分配电荷状态的系统,所述系统包括:检测器,被配置为针对每个离子到达事件生成检测器响应信号;处理器;以及存储指令的存储器,所述指令被配置为在由所述处理器执行时使所述系统执行一组操作,所述一组操作包括:从所述检测器接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由所述检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比m/z箱生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;以及基于m/z箱的组,将电荷状态分配给一个或多个特征。11.根据权利要求10所述的系统,其中,所述操作还包括基于m/z箱的组生成简化质谱,其中,m/z箱的组被指示在所述简化质谱中。12.根据权利要求10-11中任一项所述的系统,其中,对m/z箱的分组进一步基于附加的分离域数据。13.根据权利要求12所述的系统,其中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。
14.根据权利要求10-13中任一项所述的系统,其中,使用主成分分析pca、k-均值聚类算法、或主成分变量分组pcvg算法执行对m/z箱的分组。15.根据权利要求10-14中任一项所述的系统,还包括生成所述离子到达事件的表示,所述表示具有m/z维度、检测器响应维度、和离子计数或概率维度。16.根据权利要求10-14中任一项所述的系统,还包括生成组的置信度分数,并且其中,分配电荷状态进一步基于所述置信度分数中的至少一个置信度分数。17.一种用于在质谱法中分配电荷状态的方法,所述方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,为根据所述离子到达事件生成的质谱的质荷比m/z箱生成检测器响应轮廓;基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组;识别表示单离子到达事件的m/z箱;以及基于被识别为具有单离子到达事件的m/z箱的组,将电荷状态分配给一个或多个特征。18.根据权利要求17所述的方法,还包括生成组的置信度分数,并且其中,分配电荷状态进一步基于所述置信度分数中的至少一个置信度分数。19.根据权利要求17或18中任一项所述的方法,其中,对m/z箱的分组进一步基于附加的分离域数据,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、或离子迁移率的补偿电压。20.根据权利要求17-19中任一项所述的方法,其中,识别表示单离子到达事件的m/z箱基于在m/z箱中观察到的检测事件的频率。21.一种用于在质谱法中分析数据的方法,所述方法包括:接收对应于多个离子到达事件的检测器响应信号,所述检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息;基于所述检测器响应信号,生成至少由根据所述离子到达事件生成的质谱的质荷比m/z箱和检测器响应轮廓组成的数据表示;以及利用所述数据表示进行化合物识别和种类识别中的至少一项。22.根据权利要求21所述的方法,其中,化合物识别包括化合物定量。23.根据权利要求21-22中任一项所述的方法,其中,化合物识别包括将电荷分配给检测到的至少一组离子。24.根据权利要求23所述的方法,其中,分配电荷至少部分地基于所述检测器响应轮廓。25.根据权利要求21-24中任一项所述的方法,还包括简化所述数据表示。26.根据权利要求25所述的方法,其中,简化的数据表示包括至少一阶或更高阶的张量数据。27.根据权利要求25所述的方法,其中,简化所述数据表示包括生成m/z域中的一个或多个谱。28.根据权利要求25-26中任一项所述的方法,其中,简化所述数据表示包括生成质量域中的一个或多个谱。
29.根据权利要求25-28中任一项所述的方法,其中,简化所述数据表示至少部分地基于所述检测器响应轮廓。30.根据权利要求25-29中任一项所述的方法,其中,简化所述数据表示包括将具有相似的检测器响应轮廓的m/z箱分组。31.根据权利要求21-30中任一项所述的方法,还包括基于所分配的电荷状态计算对应于所述离子到达事件的质量。32.根据权利要求25-31中任一项所述的方法,其中,简化所述数据表示基于附加的分离域数据。33.根据权利要求32所述的方法,其中,所述附加的分离域数据包括以下中的至少一种:保留时间、漂移时间、和离子迁移率的补偿电压。34.根据权利要求25-33中任一项所述的方法,其中,简化所述数据表示至少部分地通过使用多变量分析来执行。35.根据权利要求25-33中任一项所述的方法,其中,简化所述数据表示至少部分地通过应用非负因式分解算法来执行。36.根据权利要求34所述的方法,其中,所述多变量分析包括以下中的至少一种:主成分分析pca、k均值聚类算法、t-sne算法和主成分变量分组pcvg算法。37.根据权利要求25-33中任一项所述的方法,其中,简化所述数据表示至少部分地基于使用模式识别或机器学习来执行。38.根据权利要求25-33中任一项所述的方法,其中,简化所述数据表示至少部分地使用统计方法以将观察到的检测器响应匹配到预定检测器响应分布的目录来执行。39.根据权利要求38所述的方法,其中,所述目录是先验地生成的。40.根据权利要求38所述的方法,其中,所述目录是根据简化的数据表示生成的。41.根据权利要求21所述的方法,其中,所述化合物识别或种类识别包括生成化合物库或种类库并使用算法将化合物或种类与库进行匹配。42.一种用于执行根据权利要求1-9或17-41中任一项所述的方法的检测系统,其中,所述检测系统是基于电子倍增器的检测系统或基于像电荷的检测系统之一。
技术总结
一种用于在质谱法中分配电荷状态的方法包括接收对应于多个离子到达事件的检测器响应信号。检测器响应信号包括与由检测器针对每个离子到达事件生成的单独离子响应相关的信息。基于检测器响应信号,为根据离子到达事件生成的质谱的质荷比(m/z)箱生成检测器响应轮廓。基于m/z箱的检测器响应轮廓的相似性,将m/z箱分组成多个组。基于m/z箱的组,将电荷状态分配给一个或多个特征。分配给一个或多个特征。分配给一个或多个特征。
技术研发人员:N
受保护的技术使用者:DH科技发展私人贸易有限公司
技术研发日:2021.08.06
技术公布日:2023/7/17
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:电缆沟槽盖板夹的制作方法 下一篇:一种防护支架的制作方法
