一种基于血糖的糖尿病眼病风险评估系统及方法

未命名 07-20 阅读:102 评论:0


1.本发明涉及医学数据处理技术领域,具体涉及一种基于血糖的糖尿病眼病风险评估系统及方法。


背景技术:

2.糖尿病是临床上颇为常见的慢性代谢性疾病,主要表现为长期的高血糖状态,损伤全身小血管及微血管,进而影响体内组织的血供。眼病变是糖尿病患者最为常见的并发症之一。
3.糖尿病眼病变严重威胁着糖尿病患者的生存质量,然而现有技术中,对糖尿病患者的评估主要是医生根据自己临床经验,结合查体和实验室检查结果进行评判,由于不同医生的临床经验差异,评估时考虑的因素也会不一样,导致评估的结果多种多样,容易出现误诊和漏诊的情况,进而错失了预防和治疗的最佳时机,从而导致得出的参考依据存在准确性较低的缺陷。


技术实现要素:

4.鉴于上述问题,提出了一种基于血糖的糖尿病眼病风险评估系统及方法,以克服现有技术中,由于不同医生的临床经验差异,导致得出的参考依据存在准确性较低的缺陷。
5.第一方面:一种基于血糖的糖尿病眼病风险评估系统,所述系统包括:
6.数据收集模块,用于将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;
7.数据选择模块,用于基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述糖尿病眼病包括视网膜病变、角膜病变和晶体病变;
8.模型构建模块,用于基于所述样本数据集进行训练,以建立风险评估模型;
9.风险评估模块,用于加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。
10.优选的,所述数据收集模块还用于对获取的原始数据进行数据处理,所述数据处理包括数据规约和数据变换。
11.优选的,所述数据规约具体包括:
12.数据集成和数据类型统一;其中,所述数据集成是指具有不同属性或不同格式的数据按照逻辑集成;所述数据类型统一是指数值型数据全部统一为预设的数据类型。
13.优选的,所述数据变换具体包括:
14.噪声过滤与数据归一化;其中,所述噪声过滤为删除数据缺失值以及去除数据异常值;所述数据归一化为对过滤后的数据进行归一化处理。
15.优选的,所述的一种基于血糖的糖尿病眼病风险评估系统,还包括特征模块,用于
在建立所述风险评估模型之前,基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。
16.优选的,所述风险评估模型通过以下步骤训练所得:
17.基于所述特征变量进行交叉组合并结合所述样本数据集,形成多个特征数据集;
18.再将所述特征数据集分为训练集和测试集,所述训练集用于模型训练,所述测试集用于模拟真实数据测试模型的评估效果;其中,所述模型采用xgboost模型;
19.基于所述评估效果调试模型的参数;
20.将训练好的模型进行存储,以便于后续的模型调用。
21.优选的,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据,具体包括:
22.所述血糖水平与所述糖尿病眼病之间的第一评估值;
23.所述病程时间与所述糖尿病眼病之间的第二评估值;
24.所述血糖水平和病程时间与所述糖尿病眼病之间的第三评估值。
25.优选的,所述评估数据还包括指导数据,所述指导数据包括:健康教育、代谢紊乱的控制、抗血小板治疗、针对糖尿病眼病的内科治疗及眼科治疗。
26.第二方面:一种基于血糖的糖尿病眼病风险评估方法,应用于第一方面所述的一种基于血糖的糖尿病眼病风险评估系统,所述方法包括:
27.将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;
28.基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述糖尿病眼病包括视网膜病变、角膜病变和晶体病变;
29.基于所述样本数据集进行训练,以建立风险评估模型;
30.加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。
31.优选的,所述方法还包括:基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。
32.采用上述技术方案,本发明提出的一种基于血糖的糖尿病眼病风险评估系统及方法,通过基于血糖水平、病程时间和糖尿病眼病作为预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;然后根据所述样本数据集进行训练,以建立风险评估模型,实现对需评估的患者数据进行线上评估;从而克服现有技术中,由于不同医生的临床经验差异,导致评估的结果多种多样,容易出现误诊和漏诊的情况,以及得出的参考依据存在准确性较低的缺陷。
附图说明
33.图1为本发明实施例所提供的一种基于血糖的糖尿病眼病风险评估系统的结构图;
34.图2为本发明实施例所提供的一种基于血糖的糖尿病眼病风险评估方法的流程图。
具体实施方式
35.为了使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
36.需要说明的是,本实施例的技术用语,除了另有说明,均为计算机领域所理解的通常含义。
37.如图1所示,本发明实施例所提供的一种基于血糖的糖尿病眼病风险评估系统,所述系统包括:
38.数据收集模块,用于将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库。
39.具体地,通过抓取的方式进行数据收集,获取大量公开、共享疾病数据集,或从医院、体检机构协议分享、购买脱敏科研数据,之后进行加工处理;
40.门诊数据和住院相似度高,主要包括患者的基本信息、既往病史、各项检查及治疗处置等;
41.所述问卷调查数据根据医学经验与医学专家判定的形式,将较容易诱发糖尿病眼病的一些特征制作成问卷供用户调查,涉及的问题具体包括:
42.1)生活习惯可能会导致疾病,具有较强相关性;
43.2)患有或即将患有该疾病可能会产生如问卷所描述的日常感受;
44.3)长时间的血糖水平程度;
45.4)存在糖尿病的病程时间;
46.5)存在哪些糖尿病眼病。
47.实施时,为提升数据质量,所述数据收集模块还用于对获取的原始数据进行数据处理,所述数据处理包括数据规约和数据变换。
48.具体地,所述数据规约具体包括:
49.数据集成和数据类型统一;其中,所述数据集成是指具有不同属性或不同格式的数据按照逻辑集成;所述数据类型统一是指数值型数据全部统一为预设的数据类型;本实施例中可统一为浮点数型。
50.所述数据变换具体包括:
51.噪声过滤与数据归一化;其中,所述噪声过滤为删除数据缺失值以及去除数据异常值;所述数据归一化为对过滤后的数据进行归一化处理。
52.数据选择模块,用于基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述视网膜病变、角膜病变和晶体病变;需要说明的是,所述选择因子包括的内容只是举例说明,并不是对其进行限制。
53.具体地,所述选择因子即可能引发所述糖尿病眼病的关联数据;本实施例以糖尿病所涉及的血糖水平和病程时间进行举例说明;从而将涉及血糖水平和病程时间的数据与糖尿病眼病关联起来,从而选择出关联度高的数据;
54.并按照检测结果属性的不同进行分类;将每种指标的检测结果分为描述型结果、
数值型结果、以及空值三类。
55.进一步地,所述糖尿病眼病还包括视神经疾病,主要包括非动脉炎性前段缺血性视神经病变、糖尿病性视乳头病变、糖尿病性视盘新生血管及糖尿病性视神经萎缩;其中,年龄、糖尿病病程、糖化血红蛋白和收缩压均为存在显著影响的因素,且随着糖尿病病程的延长或hba1c水平的增加均将导致发生的风险增加。
56.模型构建模块,用于基于所述样本数据集进行训练,以建立风险评估模型。
57.应用时,为提升所述风险评估模型的预测效果,所述的一种基于血糖的糖尿病眼病风险评估系统,还包括特征模块,用于在建立所述风险评估模型之前,基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。
58.实施时,特征选择对后期的模型预测起着关键性的作用,正确的特征选择会对模型整体的准确性和稳定性有着质的提升;本实施例在进行特征选择时,可采用iv值分析进行特征选择,它衡量了某个特征对目标的影响程度,其基本思想是根据该特征所命中黑白样本的比率与总黑白样本的比率,来对比和计算其关联程度,实现有效去除冗余特征,确定最后的最优特征子集来训练模型;其中,iv,英文名称(information value),顾名思义就是信息价值,用来评估变量的预测能力。
59.相对应的,所述风险评估模型通过以下步骤训练所得:
60.基于所述特征变量进行交叉组合并结合所述样本数据集,形成多个特征数据集;这一步还可使用聚类算法,从而将根据某个特征做聚类分成若干的小的数据集作为多个特征数据集,进而使模型更加准确。
61.再将所述特征数据集分为训练集和测试集,所述训练集用于模型训练,所述测试集用于模拟真实数据测试模型的评估效果;其中,所述模型采用xgboost模型;
62.xgboost是一种改进的gbdt算法,能够自动学习出缺失项的处理策略,在提升了运行速度以及预测准确率的同时,也有效抑制了过拟合现象;gbdt是2001年friedman等人提出的一种boosting算法,它是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论加起来作为最终答案;
63.具体地,可将70%作为训练样本,30%作为测试样本;由于分类阈值对模型的准确性影响重大,本技术采用样本的区间准确率来确定最后的阈值;如,分为多个区间,将准确率最大的区间,所对应的端点值作为最后的阈值。
64.基于所述评估效果调试模型的参数;
65.将训练好的模型进行存储,以便于后续的模型调用。
66.评估时,使用准确率、精确率和召回率来评价;准确率指的是被分类正确的样本数占总样本数的比值;精确率表示的是预测为正的样本中,实际为正的所占的比例;召回率表示的是实际为正的样本中,被预测为正的所占的比例。
67.风险评估模块,用于加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。
68.具体包括:
69.所述血糖水平与所述糖尿病眼病之间的第一评估值;
70.所述病程时间与所述糖尿病眼病之间的第二评估值;
71.所述血糖水平和病程时间与所述糖尿病眼病之间的第三评估值。
72.应用时,采用图文报告的形式向医生展示某个或复合因素可能会造成所述糖尿病眼病的风险概率,并对风险概率进行详细说明,以供医生参考;报告采用以pdf、word、h5页面等形式提供给医生。
73.同时,所述评估数据还包括指导数据,所述指导数据包括:健康教育、代谢紊乱的控制、抗血小板治疗、针对糖尿病眼病的内科治疗及眼科治疗。
74.上述方案,通过基于血糖水平、病程时间和糖尿病眼病作为预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;然后根据所述样本数据集进行训练,以建立风险评估模型,实现对需评估的患者数据进行线上评估;从而克服现有技术中,由于不同医生的临床经验差异,导致评估的结果多种多样,容易出现误诊和漏诊的情况,以及得出的参考依据存在准确性较低的缺陷。
75.基于相同的发明构思,参照图2所示,本发明实施例还提供了一种基于血糖的糖尿病眼病风险评估方法,应用于前文所述的一种基于血糖的糖尿病眼病风险评估系统,所述方法包括:
76.s101,将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;
77.s102,基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述糖尿病眼病包括视网膜病变、角膜病变和晶体病变;
78.s103,基于所述样本数据集进行训练,以建立风险评估模型;
79.s104,加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。
80.进一步地,为提升所述风险评估模型的预测效果,所述方法还包括:基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。
81.实施时,所述风险评估模型通过以下步骤训练所得:
82.基于所述特征变量进行交叉组合并结合所述样本数据集,形成多个特征数据集;
83.再将所述特征数据集分为训练集和测试集,所述训练集用于模型训练,所述测试集用于模拟真实数据测试模型的评估效果;其中,所述模型采用xgboost模型;
84.基于所述评估效果调试模型的参数;
85.将训练好的模型进行存储,以便于后续的模型调用。
86.需要说明的是,本发明实施例所提供的方法实施例为简要描述,实施例部分未提及之处及详细的描述,可参考前述系统实施例中相关文字内容。
87.通过上述方案,可克服现有糖尿病眼病的风险评估还是依靠医生的个人经验和体检数据为准的缺陷,具有很强的主观性,容易出现误诊和漏诊的情况;本技术通过将糖尿病、糖尿病眼病和机器学习相结合的方式,采用机器学习算法来辅助医生,为其提供参考,将会很大程度上提高诊断和科学性,有效的克服医生凭经验诊断的主观性的问题。
88.可选地,作为本发明的另一种优选实施例,上述一种基于血糖的糖尿病眼病风险
评估系统可以包括:一个或多个处理器和存储器,上述处理器和存储器通过总线相互连接,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令执行上述一种基于血糖的糖尿病眼病风险评估方法实施例部分的方法。
89.应当理解,在本发明实施例中,所称处理器可以是中央处理单元(central processing unit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
90.该存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据。存储器的一部分还可以包括非易失性随机存取存储器。
91.在本技术所提供的几个实施例中,应该理解到,所揭露的模块和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
92.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

技术特征:
1.一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述系统包括:数据收集模块,用于将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;数据选择模块,用于基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述糖尿病眼病包括视网膜病变、角膜病变和晶体病变;模型构建模块,用于基于所述样本数据集进行训练,以建立风险评估模型;风险评估模块,用于加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。2.根据权利要求1所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述数据收集模块还用于对获取的原始数据进行数据处理,所述数据处理包括数据规约和数据变换。3.根据权利要求2所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述数据规约具体包括:数据集成和数据类型统一;其中,所述数据集成是指具有不同属性或不同格式的数据按照逻辑集成;所述数据类型统一是指数值型数据全部统一为预设的数据类型。4.根据权利要求2所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述数据变换具体包括:噪声过滤与数据归一化;其中,所述噪声过滤为删除数据缺失值以及去除数据异常值;所述数据归一化为对过滤后的数据进行归一化处理。5.根据权利要求2所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,还包括特征模块,用于在建立所述风险评估模型之前,基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。6.根据权利要求5所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述风险评估模型通过以下步骤训练所得:基于所述特征变量进行交叉组合并结合所述样本数据集,形成多个特征数据集;再将所述特征数据集分为训练集和测试集,所述训练集用于模型训练,所述测试集用于模拟真实数据测试模型的评估效果;其中,所述模型采用xgboost模型;基于所述评估效果调试模型的参数;将训练好的模型进行存储,以便于后续的模型调用。7.根据权利要求6所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据,具体包括:所述血糖水平与所述糖尿病眼病之间的第一评估值;所述病程时间与所述糖尿病眼病之间的第二评估值;所述血糖水平和病程时间与所述糖尿病眼病之间的第三评估值。8.根据权利要求7所述的一种基于血糖的糖尿病眼病风险评估系统,其特征在于,所述
评估数据还包括指导数据,所述指导数据包括:健康教育、代谢紊乱的控制、抗血小板治疗、针对糖尿病眼病的内科治疗及眼科治疗。9.一种基于血糖的糖尿病眼病风险评估方法,其特征在于,应用于权利要求1所述的一种基于血糖的糖尿病眼病风险评估系统,所述方法包括:将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;其中,所述选择因子包括血糖水平、病程时间和糖尿病眼病;其中,所述糖尿病眼病包括视网膜病变、角膜病变和晶体病变;基于所述样本数据集进行训练,以建立风险评估模型;加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其中,所述评估数据包括血糖水平与病程时间中的至少一项和所述糖尿病眼病的关系数据。10.根据权利要求9所述的一种基于血糖的糖尿病眼病风险评估方法,其特征在于,所述方法还包括:基于所述样本数据集进行特征选择,以筛选出与所述糖尿病眼病存在显著影响的特征变量,并将其作为所述风险评估模型的输入变量。

技术总结
本发明公开了一种基于血糖的糖尿病眼病风险评估系统及方法,所述系统包括:数据收集模块,用于将从门诊、住院和问卷调查中获取的原始数据进行存储,以此建立数据库;数据选择模块,用于基于预设的选择因子,对所述数据库中的数据进行选择,以形成样本数据集;所述选择因子包括血糖水平、病程时间和糖尿病眼病;模型构建模块,用于基于所述样本数据集进行训练,以建立风险评估模型;风险评估模块,用于加载所述风险评估模型对需评估的患者数据进行线上评估,并输出评估数据;其效果是:克服现有技术中,由于不同医生的临床经验差异,导致评估的结果多种多样,容易出现误诊和漏诊的情况,以及得出的参考依据存在准确性较低的缺陷。陷。陷。


技术研发人员:王华 李雅嘉 曹子秦 李强翔 邹晶
受保护的技术使用者:中南大学湘雅医院
技术研发日:2023.03.21
技术公布日:2023/7/19
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐