代谢产物和CG位点甲基化用于肝癌诊断的标志物

未命名 10-19 阅读:92 评论:0

代谢产物和cg位点甲基化用于肝癌诊断的标志物
技术领域
1.本发明属于癌症诊断技术领域,具体涉及一种代谢产物和cg位点甲基化用于肝癌诊断的标志物。


背景技术:

2.肝癌是指发生于肝脏的恶性肿瘤,包括原发性肝癌和转移性肝癌两种,人们日常说的肝癌指的多是原发性肝癌。原发性肝癌是临床上最常见的恶性肿瘤之一,根据最新统计,全世界每年新发肝癌患者约六十万,居恶性肿瘤的第五位。原发性肝癌按细胞分型可分为肝细胞型肝癌、胆管细胞型肝癌及混合型肝癌。按肿瘤的形态可分为结节型、巨块型和弥漫型。原发性肝癌在我国属于高发病,一般男性多于女性。
3.慢乙肝和肝硬化是常见的乙肝相关肝病,有庞大的人口基数,其中一些患者有转化为肝癌的风险,如何评价乙肝相关肝病转化为肝癌风险的大小,是本领域技术人员亟待解决的问题。


技术实现要素:

4.本发明的目的在于提供一种代谢产物和cg位点甲基化用于肝癌诊断的标志物。
5.一种用于肝癌诊断的标志物,所述标志物为磷脂酰胆碱(phosphatidylcholine,pc)和cpg。
6.所述磷脂酰胆碱为1-十六烷基-2-二氢甘氨酰-烯酰基-sn-甘油-3-磷酸胆碱(o-16:0/20:3(8z,11z,14z))和1-棕榈油酰基-2-(1-烯基-硬脂酰基)-sn-甘油-3-磷酸胆碱(16:1(9z)/p-18:0)。
7.所述cpg包括cg05166871、cg14171514和cg18772205。
8.相较于乙肝相关肝病患者,肝癌患者血浆中磷脂酰胆碱含量下降。
9.相较于乙肝相关肝病患者,肝癌患者中磷脂酰胆碱差异表达与总胆汁酸呈正相关。
10.相较于乙肝相关肝病患者,肝癌患者中磷脂酰胆碱差异表达与高密度脂蛋白、低密度脂蛋白、甘油三酯、胆碱酯酶呈负相关。
11.磷脂酰胆碱和/或cpg在制备检测肝癌的试剂中的应用。
12.本发明的有益效果:应用本发明的标志物,hcc的累积发病率在低风险组和高风险组分别为1.19%和21.40%。高危组的hcc累积发病率在12个月时为10.2%,在16.33个月时则为21.40%,显著高于低风险组患者,其中hcc累积发生率在12和16.33个月中均为1.19%。因此,该标志物有助于识别有hcc风险的hbvld患者,进行早期诊断和干预筛查。
附图说明
13.图1为本发明研究流程图。
14.图2为四个cpg位点在肝病组和hcc组甲基化水平(双侧wilcoxon秩和检验的p值)。
15.图3为质量控制检查血浆中qc样品的pearson相关性,esi-(a)和esi+(b)模型;esi-,负电喷雾电离;esi+,阳性电喷雾电离;qc,质量控制。
16.图4为主成分分析(pca)对所有样本的3d评分,包含用于esi-(a)和esi+(b)模型的qc样品;esi-,负极电喷雾电离;esi+,正电喷雾电离;qc,质量控制。
17.图5为hcc和hbvld血浆样品的代谢产物图谱。描述esi-模型(a)和esi+模型(d)中代谢组学特征的区分的opls-da评分图。在esi-模型(b)和esi+模型(e)中重复200次置换测试的opls-da交叉验证。火山图显示了esi-模型(c)和esi+模型(f)中hcc和hbvld血浆样品中的代谢物。水平虚线表示p=0.05阈值,垂直虚线表示0倍阈值。使用student t检验对两组患者进行比较。hbvld、hbv相关肝病;hcc,肝细胞癌;vip,投影中的可变重要性;esi-,负电喷雾电离;esi+,正电喷雾电离;正交偏最小二乘判别分析。
18.图6为hcc组与hbvld组在esi-(a)和esi+(b)方面关键差异代谢物的匹配分析*代表显著性,*0.01<p<0.05,**0.001<p<0.01,***p<0.001;vip,投影中的可变重要性;hbvld、hbv相关肝病;esi-,负电喷雾电离;esi+,正电喷雾电离;hcc,肝细胞癌。
19.图7与hbvld患者相比,hcc中显著改变的途径的途径富集分析。(a)显著下调(a)和上调(b)途径。红色字体表示不同链长的脂肪酸的线粒体β氧化。(c)hcc血浆中非酯化脂肪酸水平显著降低。火山图显示用脂肪酸酯化的脂质,包括ce、神经酰胺、dg、pa、lysopa、pe、lysope、pi、ps、sm(d)以及pc、lysopc(e)。标记的代谢物处理了vip≥1.0和p<0.05的阈值。水平虚线表示p=0.05阈值,垂直虚线表示0倍阈值。红色字体表示用于开发hcc模型的两台pc。hbvld、hbv相关肝病;hcc,肝细胞癌;vip,预测中的可变重要性;ce,胆固醇酯;dg,二酰基甘油;pa,磷脂酸;溶血磷脂酸;pc,磷脂酰胆碱;溶血磷脂酰胆碱;pe、磷脂酰乙醇胺;溶血磷脂酰乙醇胺;pi、磷脂酰肌醇;ps,磷脂酰丝氨酸;sm,鞘磷脂。
20.图8为hbvld组和hcc组之间11个pc化学结构和归一化峰高的箱形图。
21.图9为11种pc与(a)非酯化脂肪酸、(b)总胆汁酸、(c)高密度脂蛋白、(d)低密度脂蛋白(e)甘油三酯、(f)胆碱酯酶之间的pearson相关性分析。相关分析采用线性回归分析,每个色点表示一个单独的患者。
22.图10为hcc模型的诊断和预测性能评估。(a)发现数据集中hcc模型的受试者工作特性曲线(auroc)下面积。(b)hcc模型在堆叠的20个插补完整数据集中的校准曲线。x轴表示预测的概率;y轴表示实际hcc发生率。黑色的对角线虚线代表了理想诺模图的完美表现。红色虚线表示该模型的性能;绿色实线表示该模型的自举校正性能。(c)hbvld组该模型在6个月、12个月和18个月时的受试者时间依赖性工作特性曲线和auroc。(d)hcc的累积发病率由模型计算的风险组得分。使用kaplan-meier曲线显示低风险组hcc的累积发病率(评分《0.45)和高危组(得分≥0.45)。p值采用对数秩检验确定。hbvld、hbv相关肝病;hcc,肝细胞癌。
具体实施方式
23.为了便于理解本发明,下面将对本发明进行更全面的描述。但是,本发明可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本发明的公开内容的理解更加透彻全面。
24.实施例1
25.一:材料和方法
26.1、患者和数据收集
27.2010年8月至2019年7月,在首都医科大学附属北京佑安医院共采集了400份血浆样本,包括200份乙肝相关肝病(hbvld):100份慢乙肝(chb),100份肝硬化(lc);200份肝癌(hcc)样本。新鲜血液收集到柠檬酸盐和edta中,通过ficoll-hypaque密度梯度离心在4小时内分离血浆和pbmc。血浆样品储存在-80℃温度下。慢性乙型肝炎的诊断标准基于《亚太地区乙型肝炎管理临床实践指南》:2015年更新(14),乙型肝炎相关lc的诊断基于《慢性乙型肝炎预防和治疗指南》(2010年版),hcc的诊断根据2012年easl临床实践指南:慢性乙型肝炎病毒感染的管理,巴塞罗那临床癌症分期系统(bclc)。使用多重亚硫酸氢盐测序(mbs)和发明人先前研究的结果投资了34个cpg的甲基化水平。cpgs甲基化的原始数据由北京博奥公司(capitalbio technology)进行分析。hblvd组采用回顾性设计。hblvd患者的随访数据是通过查阅电子医疗记录或电话通信获得的。最后一次随访是在2022年8月5日,主要终点是hcc的发病率。本发明的工作流程如图1所示。所有患者及其家属签署知情同意书,并获得首都医科大学北京佑安医院伦理委员会的伦理批准(京佑伦字[2020]123#)。这项研究是根据《赫尔辛基宣言》原则进行。
[0028]
2、高效液相色谱-质谱法的非靶向代谢组学
[0029]
从血浆样品中获得代谢提取物,并使用超高效液相色谱(uhplc)系统(vanquish,thermo scientific,san jose,ca,usa)通过液相色谱-质谱(lc-ms)进行分析,该系统配备waters acquity uplc beh酰胺柱(2.1mm
×
100mm,1.7μm)。流动相由25个组成mmol/l乙酸铵和25mmol/l氨的水溶液(a相)和乙腈溶液(b相)。详细参数:保护气流速:50arb,辅助气流速:15arb,毛细管温度:320℃,全ms分辨率:60000,ms/ms分辨率:15000,碰撞能量:nce模式下的10/30/60,喷雾电压:3.8kv(正)或-3.4kv(负)。
[0030]
原始数据由上海生工(sangon biotech)公司处理,在proteowizard软件将原始数据转换为mzxml格式后,使用r包“xcms”进行峰识别、峰提取、峰比对和整合,然后使用自建的二级质谱数据库biotreedb(v2.1)对物质进行注释。算法评分的截止值设置为0.3。
[0031]
3、统计分析
[0032]
连续变量以平均值
±
标准差或中位数(四分位间距,iqr)表示。分类参数采用卡方检验分析各组之间的差异,连续参数采用student t检验或wilcoxon秩和检验分析定量差异。所有统计测试均使用r软件(版本4.2.2)进行。质量控制(qc)样品通过主成分分析(pca)进行分析,以检测方法的重复性和稳定性。正交偏最小二乘判别分析(opls-da)用于计算hcc和hbvld组代谢产物的差异。使用opls-da计算出每种代谢物的可变重要性(vip)的值。student t检验用于比较两组的代谢产物水平,其中vip≥1.0和p值《0.05被认为发生了显著变化。潜在的代谢产物生物标志物用于metaboanalyst 5.0中的进一步途径富集分析(https://genap.metaboanalyst.ca/metaboanalyst/)。
[0033]
使用链式方程多重插补(mice)对缺失数据进行20次插补。r包“mixomics”中的diablo方法被应用于在for循环整合20个插补完整数据,包括临床数据、cpgs数据和代谢组的分析。20组结果中出现最多的变量作为选择潜在生物标志物。将20个插补完整数据集堆叠在一起,以创建用于构建模型的数据集。hcc模型通过使用r软件包“stackimpute”进行加权合并。使用10倍交叉验证方法进行内部验证。kaplan-meier曲线和对数秩检验用于检测
hbvld组hcc的累积发生率,p《0.05被认为具有统计学意义。r包“ggplot2”和“ggexcelle”用于volcano图,“riskregression”用于时间依赖auc曲线。
[0034]
二、结果:
[0035]
1、临床数据分析
[0036]
发明人采用严格的纳入和排除标准对两组hcc和hbvld患者进行了横断面分析,包括200名hcc患者和200名hbvld患者。其特征和临床特征结果如表1所示。与hbvld患者相比,hcc患者年龄较大,γ-谷氨酰转肽酶(γ-gt)、碱性磷酸酶(alp)、afp和中性粒细胞计数水平较高,但淋巴细胞计数水平较低。4个位点甲基化数据如图2。
[0037]
表1.入组患者临床特征
[0038]
[0039][0040]
2、400份血浆样本的总体代谢组学特征和注释的代谢产物
[0041]
使用高性能lc-ms对400个血浆样本进行了非靶向代谢组学分析,以比较hbvld与hcc代谢变化之间的相关性。进行了41个质量控制(qc)样品,以确认实验的系统误差是否在可控范围内。使用pearson相关分析qc数据,以获得稳定准确的代谢组学结果。等离子体负电喷雾电离(esi-)和正esi(esi+)qc样品的pearson相关性很高(图3)。同时,在esi-和esi+模型的主成分分析(pca)评分3d图中(图4),41qc样本紧密聚集在一起。这些结果表明,数据质量可靠,方法重复性好。在400份血浆样本中,共确认了1140种注释代谢物,包括320种(esi-)和820种(esi+)小分子代谢物。
[0042]
3、hcc患者与hbvld患者相比血浆代谢变化
[0043]
应用opls-da分析esi-中的不同代谢物(图4a)和esi+模式(图5d)。为了检验opls-da模型的稳健性和预测能力,进一步进行了200次排列测试。拟合优度(r2)和预测优度(q2)的截距验证了模型的可靠性和不过度拟合(图5b和5e)。火山图显示了在esi-(图5c)和esi+模型(图5f)中,hcc患者的已鉴定血浆代谢物水平相对于hbvld的倍数变化,考虑到预测中的统计学显著差异(p值)和变量重要性。
[0044]
根据vip≥1.0和p<0.05的阈值(学生t检验),选择125种差异表达代谢物(dem),包括36种(esi-)和89种(esi+)小分子代谢物,其保留时间m/z和分组差异如表s1所示。hcc患者的关键dem在esi-中比hbvld组显著增加和减少(图6a)和esi+(图6b)。
[0045]
4、hcc中脂质代谢的重新编程导致脂肪酸酯化脂质的改变
[0046]
通路富集分析显示,与hbvld患者相比,hcc中发现了显著下调的(图7a)和上调的(图7b)通路。代谢途径的改变表明hcc经历了脂质代谢的重新编程。长链(≥14个碳原子)饱和脂肪酸(lc sfas)的线粒体β,而与hbvld患者相比,hcc中短链(《6个碳原子)饱和脂肪酸的线粒体β。事实上,在临床上,具有16-24个碳原子的偶数链和0-6个双键的非酯化脂肪酸(nefa,或游离脂肪酸)在hcc中的水平显著降低(图7c)。这些长链和非常长链的脂肪被切断为用脂肪酸酯化的脂质的组合物,例如胆固醇、鞘脂、甘油和甘油磷脂的脂肪酸酯。最后,发明人确认了152种用脂肪酸酯化的脂质,包括两种脂肪酸酯化胆固醇酯(ce)、六种神经酰胺、六种二酰基甘油(dg)、七种磷脂酸(pa)和溶血磷脂酸(lysopa)、83种磷脂酰胆碱(pc)和lysopc、,7个磷脂酰丝氨酸(ps)和13个鞘磷脂(sm)。总的来说,152种用脂肪酸酯化的脂质中有97种(63.8%)下调,同时17种dem中有15种(88.23%)下调(图7d和7e)。
[0047]
5、hcc中pc的显著变化及其与循环脂质的相关性
[0048]
其中pc和lysopc是数量最多、变化最显著的优势亚类。在1140个注释代谢产物中,有83个pc和lysopc,其中57个减少,26个增加。同时,在总共125个dem中,pc减少表达的有10个,增加的有1个(图8)。
[0049]
发明人推测,lc sfas和vlc sfas的过度β氧化,产生更多的能量并导致脂肪酸的显著减少,导致pc产物的减少,特别是16至24个碳原子长的脂肪酰基链。这一假设得到了我们的数据的进一步支持,该数据显示了nefa和9种差异表达下调的pc之间的显著相关性(图
9a),以及最近的一项研究表明,无论不饱和度如何,所有pc在hcc血浆中都显著下调。
[0050]
同时,11种差异表达的pc中的大多数与总胆汁酸呈正相关(图9b)和高密度脂蛋白(图9c),与低密度(图9d)、脂蛋白、甘油三酯(图9e)、胆碱酯酶(图9f)呈负相关,尽管临床测试数据中的这些循环脂质在hcc中与hbvld相比没有显示出显著差异。这一结果表明,11个差异表达的pc中的大多数可以反映hcc中重塑脂质代谢对循环脂质的特异性影响,并作为hcc中潜在的血浆预测生物标志物。
[0051]
6、临床数据、cpgs数据和代谢组的综合分析,用于选择候选生物标志物综合分析进展如图1所示。原始数据集中的缺失值被估算了20次。mixomics:diablo方法嵌套在for循环中,以分析20个插补完整数据。该程序确定了20组结果,包括区分hcc和hbvld的临床、甲基化和代谢产物特征。20组结果中最常见的变量作为潜在的生物标志物。选取7个临床变量20次;共筛选出4个cpg 20次;19种代谢产物,包括esi-和esi+模型,被选择了20次。参考我们之前选择17个临床因素和34个cpg作为hbvld的hcc的结果,本研究选择了三个临床因素,包括年龄、性别和afp水平,以及三个cpg,包括cg05166871、cg14171514和cg18772205,作为候选生物标志物。在19种选定的代谢产物中,5种代谢产物,包括劳丹碱、蜜二糖、扎波汀、pc(o-16:0/20:3(8z,11z,14z))和pc(16:1(9z)/p-18:0),符合vip≥1.0的阈值,p<0.05。消除药物或中药代谢产物的可能性,最终确定pc(o-16:0/20:3(8z,11z,14z))(hmdb0039527)和pc(16:1(9z)/p-18:0)(hmdb 0008028)为代谢候选生物标志物。
[0052]
7、基于综合分析的hcc模型的开发与内部验证
[0053]
使用r包“stackimpute”通过权重构建模型。hcc模型的参数如表2所示。该模型显示,受试者操作特征下面积(auroc)为0.82(95%置信区间(ci)=0.81-0.83),截止值为0.63,灵敏度为0.67,特异性为0.82,阴性预测值为0.71,阳性预测值为0.7 9,准确度为0.74(图10a)。校准曲线显示预测和观察之间具有良好的一致性,brier评分为0.24(图10b)。也有高估的迹象(校准截距=-2.87)而没有过拟合(校准斜率=5.79)。该模型具有良好的诊断性能。
[0054]
表2hcc模型logistic回归的系数和方差
[0055][0056]
使用10倍交叉验证进行内部验证,以评估表3中的特异性、敏感性、准确性、c统计量和brier评分,显示hcc模型的稳定性。
[0057]
表3hcc模型分类性能的十倍交叉验证
[0058][0059][0060]
8、hcc模型的预测性能
[0061]
hbvld组(n=200)共有133名患者(包括62例慢性乙型肝炎和71例lc)记录了完整的临床数据,并进行了平均13.43个月(iqr,11.23-18.53个月)的随访,其中7名患者发生了hcc。根据hcc模型和低风险组计算的每个hbvld患者的得分(得分《0.45,包括40个慢性乙型肝炎和45个lc)和高危组(得分≥0.45,包括22个慢性乙型乙肝和26个lc)。到最后一次随访时,低风险组的1名慢性乙型肝炎患者和高风险组的6名lc患者发生了hcc。hcc模型预测hcc的harrell c指数为0.70(95%ci 0.50-0.89)。显示了时间依赖性roc曲线,该模型预测6个
月、12个月和18个月hcc的auroc值分别为0.65、0.61和0.89(图10c)。
[0062]
kaplan-meier方法用于计算低风险组和高风险组hcc的累积发病率。hcc的累积发病率在低风险组和高风险组分别为1.19%(95%可信区间为0-3.48%)和21.40%(1.30%-37.40%)。高危组的hcc累积发病率在12个月时为10.2%(95%ci=1.00-19.20%),在16.33个月时则为21.40%(1.30%-37.40%),显著高于低风险组患者,其中hcc累积发生率在12和16.33个月中均为1.19%(95%ci=0-3.48%)(对数秩检验,p=0.0039)(图10d)。因此,该模型可能有助于识别有hcc风险的hbvld患者,他们应该进行早期诊断和干预筛查。
[0063]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

技术特征:
1.一种用于肝癌诊断的标志物,其特征在于,所述标志物为磷脂酰胆碱和cpg。2.根据权利要求1所述用于肝癌诊断的标志物,其特征在于,所述磷脂酰胆碱为1-十六烷基-2-二氢甘氨酰-烯酰基-sn-甘油-3-磷酸胆碱和1-棕榈油酰基-2-(1-烯基-硬脂酰基)-sn-甘油-3-磷酸胆碱。3.根据权利要求1所述用于肝癌诊断的标志物,其特征在于,所述cpg包括cg05166871、cg14171514和cg18772205。4.根据权利要求1所述用于肝癌诊断的标志物,其特征在于,相较于乙肝相关肝病患者,肝癌患者血浆中pc含量下降。5.根据权利要求1所述用于肝癌诊断的标志物,其特征在于,相较于乙肝相关肝病患者,肝癌患者中磷脂酰胆碱差异表达与总胆汁酸呈正相关。6.根据权利要求1所述用于肝癌诊断的标志物,其特征在于,相较于乙肝相关肝病患者,肝癌患者中磷脂酰胆碱差异表达与高密度脂蛋白、低密度脂蛋白、甘油三酯、胆碱酯酶呈负相关。7.磷脂酰胆碱和/或cpg在制备检测肝癌的试剂中的应用。

技术总结
本发明公开了代谢产物和CG位点甲基化用于肝癌诊断的标志物。所述代谢产物为磷脂酰胆碱,所述CG位点甲基化包括cg05166871、cg14171514和cg18772205。应用本发明的标志物,HCC的累积发病率在低风险组和高风险组分别为1.19%和21.40%。高危组的HCC累积发病率在12个月时为10.2%,在16.33个月时则为21.40%,显著高于低风险组患者,其中HCC累积发生率在12和16.33个月中均为1.19%。因此,该标志物有助于识别有HCC风险的HBVLD患者,进行早期诊断和干预筛查。早期诊断和干预筛查。早期诊断和干预筛查。


技术研发人员:李康 张永宏 史婉婷
受保护的技术使用者:首都医科大学附属北京佑安医院
技术研发日:2023.07.05
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐