基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质与流程
未命名
08-05
阅读:325
评论:0
1.本技术涉及中医体质辨识技术领域,特别是涉及基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质。
背景技术:
2.中医体质是个体生命过程中客观存在的生命现象,是一种在先天遗传与后天获得基础上表现出的形态结构、生理机能以及心理状态等方面综合的、相对稳定的特质。中医体质分类是中医体质学说的基础和核心内容。中华中医药学会于2009年正式发布《中医体质分类与判定》标准。该标准应用了流行病学、免疫学、分子生物学、遗传学、数理统计学等多学科交叉的方法,将体质分为平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、血瘀质、气郁质、特禀质九个类型,并制定了中医体质量表。
3.目前,中医体质量表条目较多,实际应用中用户需要完成至少30道题目,答题耗时较长。如何将人工智能技术引入到中医体质量表的设计中,在保证中医体质判定结果一致的基础上极大地简化目前量表的题目数量,以形成快速高效的中医体质辨识工具是本领域亟需解决的技术难题。
技术实现要素:
4.鉴于以上所述现有技术的缺点,本技术的目的在于提供基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质,用于解决目前的中医体质辨识的答题耗时较长智能化程度不够的技术问题。
5.为实现上述目的及其他相关目的,本技术的第一方面提供一种基于融合舌象特征及简化量表的中医体质分析系统,包括:简化量表设计模块,用于基于标准版中医体质量表生成简化版中医体质量表;数据预处理模块,用于多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像;特征融合模块,用于对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征;模型训练模块,用于将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。
6.于本技术的第一方面的一些实施例中,所述数据预处理模块基于所述简化版中医体质量表对所述样本数据进行数据处理的过程包括:根据每个样本数据在所述简化版中医体质量表中每种体质条目所对应的若干个选项上的表现,确定该样本数据存在的体质条目。
7.于本技术的第一方面的一些实施例中,确定样本数据存在的体质条目的过程包括:根据所述简化版中医体质量表确定每个样本数据在每种体质条目所对应的各个项上的
得分情况,并基于每个选项的得分情况得到每个样本在每种体质条目上的总分;确定每个样本在每种体质条目上的总分是否超过预设阈值;若大于所述预设阈值,则表示该样本存在该种体质条目且特征明显;若小于等于所述预设阈值,则表示该样本不存在该种体质条目;将每个样本数据中存在的体质条目标识为第一标识符,并将不存在的体质条目标识为第二标识符。
8.于本技术的第一方面的一些实施例中,所述简化量表设计模块基于标准版中医体质量表生成简化版中医体质量表的过程包括:通过简化特征词的方式对标准版中医体质量表中的体质条目进行精简;每个体质条目包含若干个选项;每个选项设置为是或否的两种可选状态。
9.于本技术的第一方面的一些实施例中,所述特征融合模块提取到的选项特征被表示为:
10.其中,m表示所述简化版中医体质量表中体质条目的数量;n表示每个体质条目对应的选项数量;x
ij
表示样本x第i个体质条目中第j个选项的得分值。
11.于本技术的第一方面的一些实施例中,所述特征融合模块通过舌象分割算法对舌象图像进行分割提取得到舌象特征。
12.于本技术的第一方面的一些实施例中,所述模型训练模块在对所述梯度提升决策树回归模型进行训练的过程中,将样本数据所对应的融合特征作为模型输入参数,将样本数据在标准版中医体质量表中体质测试的原始得分之和的转换分作为该体质的体质得分;所述梯度提升决策树回归模型输出所述简化版中医体质量表中各体质的体质得分并撷取若干个最高得分的体质作为该样本的预测体质类型。
13.为实现上述目的及其他相关目的,本技术的第二方面提供一种基于融合舌象特征及简化量表的中医体质分析方法,包括:基于标准版中医体质量表生成简化版中医体质量表;多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像;对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征;将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。
14.为实现上述目的及其他相关目的,本技术的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于融合舌象特征及简化量表的中医体质分析方法。
15.为实现上述目的及其他相关目的,本技术的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述基于融合舌象特征及简化量表的中医体质分析方法。
16.如上所述,本技术的基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质,具有以下有益效果:本发明基于当前中医体质量表题目数量较多的问题,通过将标准版中医体质量表进行简化,并借助机器学习算法训练融合了舌象特征的中医体质预测
模型,不仅能够大大减少人力成本,推进了中医体质研究的智能化进程。
附图说明
17.图1显示为本技术一实施例中的一种基于融合舌象特征及简化量表的中医体质分析方法的流程示意图。
18.图2显示为本技术一实施例中的简化版中医体质量表的示意图。
19.图3显示为本技术一实施例中的特征融合示意图。
20.图4显示为本技术一实施例中的66题回归值下各模型top3一致率比较图。
21.图5显示为本技术一实施例中的30题回归值下各模型top3一致率比较图。
22.图6显示为本技术一实施例中的一种基于融合舌象特征及简化量表的中医体质分析系统的结构示意图。
23.图7显示为本技术一实施例中电子终端的结构示意图。
具体实施方式
24.以下通过特定的具体实例说明本技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本技术的其他优点与功效。本技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
25.需要说明的是,在下述描述中,参考附图,附图描述了本技术的若干实施例。应当理解,还可使用其他实施例,并且可以在不背离本技术的精神和范围的情况下进行机械组成、结构、电气以及操作上的改变。下面的详细描述不应该被认为是限制性的,并且本技术的实施例的范围仅由公布的专利的权利要求书所限定。这里使用的术语仅是为了描述特定实施例,而并非旨在限制本技术。空间相关的术语,例如“上”、“下”、“左”、“右”、“下面”、“下方”、“下部”、“上方”、“上部”等,可在文中使用以便于说明图中所示的一个元件或特征与另一元件或特征的关系。
26.在本技术中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”、“固持”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本技术中的具体含义。
27.再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“a、b或c”或者“a、b和/或c”意味着“以下任一个:a;b;c;a和b;a和c;b和c;a、b和c”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
28.为解决上述背景技术中的问题,本发明提供基于融合舌象特征及简化量表的中医
体质分析系统、方法、终端及介质,旨在对多地采集的66条目和30条目中医体质量表数据分析后,基于30题量表设计了9题多选形式量表,并结合人群的舌象特征建立梯度提升决策树回归模型对应用者所属中医9种体质结果进行预测。中医体质top3类型一致率分析结果显示,本发明所提供的基于融合舌象特征及简化量表的中医体质分析方案,能够有效识别中医体质并提升体质辨识的评测效率。
29.为了使本发明的目的、技术方案及优点更加清楚明白,通过下述实施例并结合附图,对本发明实施例中的技术方案的进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定发明。
30.在对本发明进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释:
31.(1)中医体质:按照王琦中医体质九分法,分为平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、瘀血质、气郁质、特禀质等9种基本类型。
32.(2)gbdt(gradient boosting decision tree):梯度提升决策树回归模型,是利用树模型进行回归的算法模型,采用cart决策树,通过梯度下降来对新的学习器进行迭代。
33.本发明实施例提供基于融合舌象特征及简化量表的中医体质分析方法、基于融合舌象特征及简化量表的中医体质分析方法的系统、以及存储用于实现基于融合舌象特征及简化量表的中医体质分析方法的可执行程序的存储介质。就基于融合舌象特征及简化量表的中医体质分析方法的实施而言,本发明实施例将对基于融合舌象特征及简化量表的中医体质分析的示例性实施场景进行说明。
34.如图1所示,展示了本发明实施例中的一种基于融合舌象特征及简化量表的中医体质分析方法的流程示意图。本实施例中的基于融合舌象特征及简化量表的中医体质分析方法主要包括如下各步骤:
35.步骤s1:基于标准版中医体质量表生成简化版中医体质量表。
36.于本发明实施例中,所述基于标准版中医体质量表生成简化版中医体质量表的过程包括:通过简化特征词的方式对标准版中医体质量表中的体质条目进行精简;每个体质条目包含若干个选项;每个选项设置为是或否的两种可选状态。值得说明的是,当问卷中的题目较多时会让体质测试对象有放弃做题的想法,因此减少问卷题目数量并以多选的方式获得更多的对体质辨识高价值信息是非常重要的。
37.需说明的是,30条目版本《中医体质量表》虽然较之60条目版本的题量有所下降,但无论是在诊疗场景还是在健康评测场景,进行问卷调研时仍存在耗时较长、用户完成困难、配合度较低等情况。因此,本发明实施例对30条目版本做了进一步的改进,根据9种体质设置多选9题版本问卷的量表。
38.以图2展示的简化版中医体质量表为例进行说明:标准版中医体质量表为30条目版本,为9种中医体质设置3~5个选项,每个选项仅设置为“是”、“否”这两种状态。例如平和质的中医体质,设置有4个选项分别是,选项1~4分别是“容易疲乏”、“容易情绪低落”、“怕冷”、“容易失眠”。答题者只需勾选每题自我感觉存在的症状即可,如此可提升体质辨识的答题效率。
39.步骤s2:多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像。
40.应理解的是,由于各个地区的体质测试对象的中医体质有较大区别,为确保预测模型的预测准确度,需多源采集多个样本数据,例如对采集地区的数量以及地区与地区之间的跨度有一定要求等等。
41.于本发明实施例中,基于所述简化版中医体质量表对所述样本数据进行数据处理的过程包括:根据每个样本数据在所述简化版中医体质量表中每种体质条目所对应的若干个选项上的表现,确定该样本数据存在的体质条目。具体过程如下:
42.首先,根据所述简化版中医体质量表确定每个样本数据在每种体质条目所对应的各个项上的得分情况,并基于每个选项的得分情况得到每个样本在每种体质条目上的总分。对于每种体质条目而言,其对应的每个选项会被相应设置为“是”或“否”;“是”则计1分,“否”则计0分,最终由每个选项的得分情况得到该个样本数据在每种体质条目上的总分。
43.其次,确定每个样本在每种体质条目上的总分是否超过预设阈值;若大于所述预设阈值,则表示该样本存在该种体质条目且特征明显;若小于等于所述预设阈值,则表示该样本不存在该种体质条目。
44.最后,将每个样本数据中存在的体质条目标识为第一标识符,并将不存在的体质条目标识为第二标识符。举例来说,将每个样本数据中存在的中医体质标识为1,而将不存在的中医体质标识为0。
45.以2分作为预设阈值为例进行说明:若一个样本数据符合“容易疲劳”、“容易情绪低落”及“怕冷”的选项,但不符合“容易失眠”的选项,那么“平和质”这一中医体质的总分是3分,大于预设阈值2分,因此这个样本数据符合“平和质”这种体质。若一个样本数据符合“容易疲乏”、“容易气短”的选项,但不符合“容易感冒”、“不想说话”、“容易出汗”的选项,那么“气虚质”这一中医体质的总分是2分,等于预设阈值2分,因此这个样本数据不符合“气虚质”。
46.由于各地区的中医体质有区别,因此本发明实施例在采集样本数据时采集的是多地多组数据,这样能够得到质量更高更全面的样本数据。例如一实施例中的应用数据共计374组,分别采集a城市和b城市两地,其中a城市采集数据80组,b城市采集数据294组。基于所述简化版中医体质量表对所述样本数据进行数据处理后得到这374组数据在9种中医体质的分布情况如下表1所示:“平和质”98组,占26.2%;剩余8种偏颇体质共276组,占73.8%;位于前3的偏颇体质分别是:“阴虚质”占17.11%;“阳虚质”占14.17%;“痰湿质”占12.03%。
47.表1:374组数据在9种中医体质的分布情况
48.[0049][0050]
进一步地,为验证本发明实施例所提供的基于融合舌象特征及简化量表的中医体质分析方法的可靠性,以8:2的比例和不同随机数,将所有收集的374组数据划分为训练集和测试集,因此训练集为299组,测试集为75组。与此同时,本发明实施例的实验环境是window10系统和python3.7,以sklearn为工具实现相应代码;sklearn(scikit-learn)是针对python编程语言的免费软件机器学习库,它具有各种分类,回归和聚类算法,包括支持向量机、随机森林、梯度提升、k均值和dbscan等。
[0051]
步骤s3:对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征。
[0052]
在一些示例中,提取到的选项特征被表示为:
[0053][0054]
其中,m表示所述简化版中医体质量表中体质条目的数量;n表示每个体质条目对应的选项数量;x
ij
表示样本x第i个体质条目中第j个选项的得分值。
[0055]
以图2中展示的简化版中医体质量表为例说明:共有9个体质条目,每个体质条目有3~5个选项不等,每个选项存在0和1两种状态。因此,样本x具体表示为:
[0056][0057]
其中,x
ij
表示样本x第i个多选题第j个选项的值;x
ij
=0表示样本x未选择题目i的第j个选项;x
ij
=1表示样本x选择了题目i的第j个特征。因此,一个样本的选项特征可以表示为特征向量{0,1,0,1,
…
},特征向量中的特征维度由简化版中医体质量中的选项总数确定,共计35个维度。
[0058]
在一些示例中,所述权重特征是为所述简化版中医体质量表中所有体质条目下的所有选型赋予相应权重,该权重是由该选项验证该体质条目的贡献度和重要度来决定的。具体而言,基于前期收集的数据分析,本发明采用统计分析和加权的方式,为9题版本涉及的35个选项赋予了相应的权重特征,用w
ij
表示样本x第i个多选题第j个选项的权重,具体选项权重特征如下表2所示。
[0059]
表2:9题版中医体质问卷各选项权重
[0060][0061]
所述舌象特征的提取过程包括基于舌象分割算法对所述舌象图像进行分割以提取得到对应的舌象特征。
[0062]
应理解的是,舌象特征是体质辨识的主要特征之一,包括舌色特征、舌形特征、舌态特征中的任一种或多种组合。所述舌色特征包括如下属性特征中的任一种或多种的组合:整体舌色特征、舌边色特征、舌尖色特征、全舌苔色特征、舌苔腐腻特征、舌苔厚度特征、裂纹特征、点刺特征、瘀血特征、干湿度特征、剥苔特征、舌形特征、齿痕特征。
[0063]
需说明的是,原始的舌象数字图像中,舌象由舌体、脸颊和嘴唇组成。由于舌体和嘴唇颜色比较接近,而且舌体与背景之间不存在明显的分界线,因此自动分割的难度较大。将舌象图像转换到his空间,通过对色度分量和亮度分量直方图的分析,获取两个分量阈值。通过色度阈值对图像进行初分割以去除脸颊区域,再通过亮度阈值断开嘴唇区域和舌体区域的细小连接。在分割过程中利用二值形态学算法填补舌体区域的小孔,断开连通区域的细小连接处。获取舌体模板后与原始图像做乘法运算获取舌体图像。在获得舌体图像后,对舌体图像针对h(色度)分量进行模糊聚类,将图像分割成舌质、舌苔和背景三个区域。最后在舌质舌苔分离的基础上,根据舌质和舌苔在舌面上的分布特点,可以准确识别舌质区、舌苔区和背景区,舌质和舌苔区域的正确识别供进行特征分析和颜色识别以实现体质分析。
[0064]
将所述选项特征、权重特征及舌象特征进行拼接后得到对应的融合特征表述如下:
[0065]
x=x
ij
⊕wij
⊕wt
;
[0066]
其中,
⊕
表示拼接,x
ij
表示选项特征,w
ij
表示权重特征,w
t
表示舌象特征。特征融合的示意图如图3所示。
[0067]
于本发明实施例中,可采用早融合方式进行特征融合。早融合方式是指在特征上进行融合后进行不同特征的连接,再输入到模型中进行训练。具体可采用concat系列特征融合,直接将多个特征进行连接,例如输入特征x和y的维数若为p和q,那么输出特征z的维数为(p+q)。还可采用add并行策略,将多个特征向量组合成复合向量,例如对于输入特征x和y,输出特征z=x+iy,其中i是虚数单位。
[0068]
步骤s4:将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。
[0069]
于本发明实施例中,在对所述梯度提升决策树回归模型进行训练的过程中,将样本数据所对应的融合特征作为模型输入参数,将样本数据在标准版中医体质量表中体质测试的原始得分之和的转换分作为该体质的体质得分;所述梯度提升决策树回归模型输出所述简化版中医体质量表中各体质的体质得分并撷取若干个最高得分的体质作为该样本的预测体质类型。也即,本发明实施例中的梯度提升决策树回归模型以体质测试对象在标准问卷(如66题版问卷或30题版问卷)上的表现得分作为模型输出参数进行训练。
[0070]
举例来说,对于任意数据样本x,本发明以《中医体质量表》66题版问卷中各体质对应条目的原始分之和的转换分作为该体质的分值,以中医体质判定标准结果的top3作为其体质结果。由此,可利用收集数据训练梯度提升决策树(gbdt)回归模型对体质测试对象所属9种中医体质结果进行预测。具体的,该模型可以表示为如下公式:
[0071]
y1,y2,y3,y4,y5,y6,y7,y8,y9=f(xn);
[0072]
其中,yi,i={1,2,3,
…
,9}表示第n个样本平和质、气虚质、阳虚质、阴虚质、痰湿质、湿热质、血瘀质、气郁质和特禀质9种体质分别对应的转换分;f表示多元输出gbdt回归算法。具体的,以融合特征作为gbdt模型的输入,以体质转换分作为9种体质模型的输出,训练多元输出gbdt回归模型。特别地,本发明实施例将各体质的回归值由大到小进行排序后选取最高的三者作为该样本的预测体质类型。
[0073]
需说明的是,梯度提升决策树回归模型(gbdt,gradient boosting decision tree)是利用树模型进行回归的算法模型,采用cart决策树,通过梯度下降来对新的学习器进行迭代。gbdt算法可以看成是m棵树组成的加法模型,其对应的公式如下:
[0074][0075]
其中,x为输入样本;w为模型参数;h为分类回归树;α为每棵树的权重。
[0076]
gbdt算法的实现过程如下:给定训练数据集t={(x1,y1),(x2,y2),
…
,(xn,yn)};其中,xi∈x∈rn,x为输入空间;yi∈y∈r,y为输出空间;损失函数为l(y,f(x))。模型训练的目的是得到最终的回归树fm。
[0077]
步骤s41:初始化第一个弱学习器f0(x):
[0078]
步骤s42:建立m棵分类回归树。
[0079]
步骤s42a:对于i=1,2,
…
,n,计算第m棵树对应的响应值r
m,i
:
[0080][0081]
步骤s42b:对于i=1,2,
…
,n,利用cart回归树拟合数据(xi,r
m,i
),得到第m棵回归树,其对应的叶子节点区域为r
m,j
,其中j=1,2,
…
,jm,且jm为第m棵回归树叶子节点的个数。
[0082]
步骤s42c:对于jm个叶子节点区域j=1,2,
…
,jm,计算出最佳拟合值c
m,j
:
[0083][0084]
步骤s42d:更新强学习器fm(x):
[0085][0086]
步骤s43:得到强学习器fm(x)的表达式:
[0087]
[0088]
上文,对本发明实施例提供的基于融合舌象特征及简化量表的中医体质分析方法的实施过程做了详尽的解释说明。为验证使用上述方法进行体质预测的准确性和有效性,下文将进行结果验证。
[0089]
在划分的两组训练集中分别以单独的选项特征(feature1),将选项特征和权重特征相融合得到的特征(feature2),以及将选项特征、权重特征及舌象特征三者相融合得到的特征(feature3)为三组特征提取方法,分别训练了梯度提升决策树回归模型(gbdt,gradient boosting decision tree)、支持向量机模型(svr,support vector regression)和线性回归模型(lr,linear regression)。同时,分别以66题和30题转换分作为回归值建模预测的体质top3一致率对本发明所提方法进行分析与讨论。
[0090]
两组测试集的实验结果如图4和图5所示:其中,baseline_all表示全部数据集66题与30题版本的top3一致率,baseline_test表示对应测试集下66题与30题版本的top3一致率。
[0091]
图4表示以66题转换分作为回归值训练模型,3组特征下3个模型测试集的top3一致率。由图可知,在gbdt模型、svr模型和lr模型这三个模型中,将选项特征、权重特征及舌象特征三者相融合得到的特征feature3的gbdt模型top3一致率最高,与全部数据集baseline_all的top3一致率相当。
[0092]
图5表示以30题转换分作为回归值训练模型,3组特征下3个模型测试集的top3一致率。由图可知,在gbdt模型、svr模型和lr模型这三个模型中,将选项特征、权重特征及舌象特征三者相融合得到的特征feature3的gbdt模型top3一致率最高,高达81.33%。这比全部数据集baseline_all的top3一致率高5.75%,比测试集baseline_test的top3一致率高6.66%。
[0093]
由图4和图5可知,虽然在66题回归值的测试集中gbdt模型的top3一致率稍低,但在全部数据集中,相较于66题和30题版本的体质问卷,本发明所提供的方法有较高的top3一致率。由此可以证明,本发明实施例提供的基于融合舌象特征及简化量表的中医体质分析方法在中医体质分析方面具有显著的技术效果。
[0094]
如图6所示,展示了本发明实施例中的一种基于融合舌象特征及简化量表的中医体质分析系统的结构示意图。本发明实施例中的中医体质分析系统600包括:简化量表设计模块601、数据预处理模块602、特征融合模块603及模型训练模块604。
[0095]
简化量表设计模块601用于基于标准版中医体质量表生成简化版中医体质量表。
[0096]
在一些示例中,所述基于标准版中医体质量表生成简化版中医体质量表的过程包括:通过简化特征词的方式对标准版中医体质量表中的体质条目进行精简;每个体质条目包含若干个选项;每个选项设置为是或否的两种可选状态。
[0097]
数据预处理模块602用于多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像。
[0098]
在一些示例中,数据预处理模块602基于所述简化版中医体质量表对所述样本数据进行数据处理的过程包括:根据每个样本数据在所述简化版中医体质量表中每种体质条目所对应的若干个选项上的表现,确定该样本数据存在的体质条目。
[0099]
具体而言,确定样本数据存在的体质条目的过程包括:根据所述简化版中医体质量表确定每个样本数据在每种体质条目所对应的各个项上的得分情况,并基于每个选项的
得分情况得到每个样本在每种体质条目上的总分;确定每个样本在每种体质条目上的总分是否超过预设阈值;若大于所述预设阈值,则表示该样本存在该种体质条目且特征明显;若小于等于所述预设阈值,则表示该样本不存在该种体质条目;将每个样本数据中存在的体质条目标识为第一标识符,并将不存在的体质条目标识为第二标识符。
[0100]
特征融合模块603用于对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征。
[0101]
在一些示例中,提取到的选项特征被表示为:
[0102]
其中,m表示所述简化版中医体质量表中体质条目的数量;n表示每个体质条目对应的选项数量;x
ij
表示样本x第i个体质条目中第j个选项的得分值。
[0103]
在一些示例中,所述舌象特征通过舌象分割算法对舌象图像进行分割提取得到。
[0104]
模型训练模块604用于将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。
[0105]
在一些示例中,模型训练模块604在对所述梯度提升决策树回归模型进行训练的过程中,将样本数据所对应的融合特征作为模型输入参数,将样本数据在标准版中医体质量表中体质测试的原始得分之和的转换分作为该体质的体质得分;所述梯度提升决策树回归模型输出所述简化版中医体质量表中各体质的体质得分并撷取若干个最高得分的体质作为该样本的预测体质类型。
[0106]
需要说明的是:上述实施例提供的基于融合舌象特征及简化量表的中医体质分析系统在进行基于融合舌象特征及简化量表的中医体质分析时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的基于融合舌象特征及简化量表的中医体质分析系统与基于融合舌象特征及简化量表的中医体质分析方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
[0107]
本发明实施例提供的基于融合舌象特征及简化量表的中医体质分析方法可以采用终端侧或服务器侧实施,就基于融合舌象特征及简化量表的中医体质分析终端的硬件结构而言,请参阅图7,为本发明实施例提供的基于融合舌象特征及简化量表的中医体质分析终端700的一个可选的硬件结构示意图,该终端700可以是移动电话、计算机设备、平板设备、个人数字处理设备、工厂后台处理设备等。基于融合舌象特征及简化量表的中医体质分析终端700包括:至少一个处理器701、存储器702、至少一个网络接口704和用户接口706。装置中的各个组件通过总线系统705耦合在一起。可以理解的是,总线系统705用于实现这些组件之间的连接通信。总线系统705除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图7中将各种总线都标为总线系统。
[0108]
其中,用户接口706可以包括显示器、键盘、鼠标、轨迹球、点击枪、按键、按钮、触感板或者触摸屏等。
[0109]
可以理解,存储器702可以是易失性存储器或非易失性存储器,也可包括易失性和
非易失性存储器两者。其中,非易失性存储器可以是只读存储器(rom,read only memory)、可编程只读存储器(prom,programmable read-only memory),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(sram,staticrandom access memory)、同步静态随机存取存储器(ssram,synchronous static randomaccess memory)。本发明实施例描述的存储器旨在包括但不限于这些和任意其它适合类别的存储器。
[0110]
本发明实施例中的存储器702用于存储各种类别的数据以支持基于融合舌象特征及简化量表的中医体质分析终端700的操作。这些数据的示例包括:用于在基于融合舌象特征及简化量表的中医体质分析终端700上操作的任何可执行程序,如操作系统7021和应用程序7022;操作系统7021包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序7022可以包含各种应用程序,例如媒体播放器(mediaplayer)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例提供的基于融合舌象特征及简化量表的中医体质分析方法可以包含在应用程序7022中。
[0111]
上述本发明实施例揭示的方法可以应用于处理器701中,或者由处理器701实现。处理器701可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器、数字信号处理器(dsp,digital signal processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器701可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器701可以是微处理器或者任何常规的处理器等。结合本发明实施例所提供的配件优化方法的步骤,可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中,该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成前述方法的步骤。
[0112]
在示例性实施例中,基于融合舌象特征及简化量表的中医体质分析终端700可以被一个或多个应用专用集成电路(asic,application specific integrated circuit)、dsp、可编程逻辑器件(pld,programmable logic device)、复杂可编程逻辑器件(cpld,complex programmable logicdevice),用于执行前述方法。
[0113]
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0114]
于本技术提供的实施例中,所述计算机可读写存储介质可以包括只读存储器、随机存取存储器、eeprom、cd-rom或其它光盘存储装置、磁盘存储装置或其它磁存储设备、闪存、u盘、移动硬盘、或者能够用于存储具有指令或数据结构形式的期望的程序代码并能够由计算机进行存取的任何其它介质。另外,任何连接都可以适当地称为计算机可读介质。例如,如果指令是使用同轴电缆、光纤光缆、双绞线、数字订户线(dsl)或者诸如红外线、无线电和微波之类的无线技术,从网站、服务器或其它远程源发送的,则所述同轴电缆、光纤光缆、双绞线、dsl或者诸如红外线、无线电和微波之类的无线技术包括在所述介质的定义中。然而,应当理解的是,计算机可读写存储介质和数据存储介质不包括连接、载波、信号或者
其它暂时性介质,而是旨在针对于非暂时性、有形的存储介质。如申请中所使用的磁盘和光盘包括压缩光盘(cd)、激光光盘、光盘、数字多功能光盘(dvd)、软盘和蓝光光盘,其中,磁盘通常磁性地复制数据,而光盘则用激光来光学地复制数据。
[0115]
综上所述,本技术提供基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质,基于当前中医体质量表题目数量较多的问题,通过将标准版中医体质量表进行简化,并借助机器学习算法训练融合了舌象特征的中医体质预测模型,不仅能够大大减少人力成本,推进了中医体质研究的智能化进程。所以,本技术有效克服了现有技术中的种种缺点而具高度产业利用价值。
[0116]
上述实施例仅例示性说明本技术的原理及其功效,而非用于限制本技术。任何熟悉此技术的人士皆可在不违背本技术的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本技术所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本技术的权利要求所涵盖。
技术特征:
1.一种基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,包括:简化量表设计模块,用于基于标准版中医体质量表生成简化版中医体质量表;数据预处理模块,用于多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像;特征融合模块,用于对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征;模型训练模块,用于将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。2.根据权利要求1所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,所述数据预处理模块基于所述简化版中医体质量表对所述样本数据进行数据处理的过程包括:根据每个样本数据在所述简化版中医体质量表中每种体质条目所对应的若干个选项上的表现,确定该样本数据存在的体质条目。3.根据权利要求2所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,确定样本数据存在的体质条目的过程包括:根据所述简化版中医体质量表确定每个样本数据在每种体质条目所对应的各个项上的得分情况,并基于每个选项的得分情况得到每个样本在每种体质条目上的总分;确定每个样本在每种体质条目上的总分是否超过预设阈值;若大于所述预设阈值,则表示该样本存在该种体质条目且特征明显;若小于等于所述预设阈值,则表示该样本不存在该种体质条目;将每个样本数据中存在的体质条目标识为第一标识符,并将不存在的体质条目标识为第二标识符。4.根据权利要求1所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,所述简化量表设计模块基于标准版中医体质量表生成简化版中医体质量表的过程包括:通过简化特征词的方式对标准版中医体质量表中的体质条目进行精简;每个体质条目包含若干个选项;每个选项设置为是或否的两种可选状态。5.根据权利要求1所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,所述特征融合模块提取到的选项特征被表示为:其中,m表示所述简化版中医体质量表中体质条目的数量;n表示每个体质条目对应的选项数量;x
ij
表示样本x第i个体质条目中第j个选项的得分值。6.根据权利要求1所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,所述特征融合模块通过舌象分割算法对舌象图像进行分割提取得到舌象特征。7.根据权利要求1所述基于融合舌象特征及简化量表的中医体质分析系统,其特征在于,所述模型训练模块在对所述梯度提升决策树回归模型进行训练的过程中,将样本数据所对应的融合特征作为模型输入参数,将样本数据在标准版中医体质量表中体质测试的原始得分之和的转换分作为该体质的体质得分;所述梯度提升决策树回归模型输出所述简化版中医体质量表中各体质的体质得分并撷取若干个最高得分的体质作为该样本的预测体
质类型。8.一种基于融合舌象特征及简化量表的中医体质分析方法,其特征在于,包括:基于标准版中医体质量表生成简化版中医体质量表;多源采集多个样本数据并基于所述简化版中医体质量表对所述样本数据进行数据处理,并采集各样本数据所对应的舌象图像;对预处理得到的样本数据进行特征提取以得到选项特征和权重特征;并对所述舌象图像进行特征提取以得到舌象特征;将所述选项特征、权重特征及舌象特征进行特征融合以得到样本数据的融合特征;将所述样本数据的融合特征输入梯度提升决策树回归模型进行训练,以对体质测试对象所属简化版中医体质量表的各种中医体质结果进行预测。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求8所述基于融合舌象特征及简化量表的中医体质分析方法。10.一种电子终端,其特征在于,包括:处理器及存储器;所述存储器用于存储计算机程序;所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行如权利要求8所述基于融合舌象特征及简化量表的中医体质分析方法。
技术总结
本申请提供基于融合舌象特征及简化量表的中医体质分析系统、方法、终端及介质,旨在设计简化版中医体质量表;采集样本数据和舌象图像后进行预处理;提取选项特征、权重特征及舌象特征后进行特征融合;融合得到的特征输入梯度提升决策树回归模型进行训练。本发明基于当前中医体质量表题目数量较多的问题,通过将标准版中医体质量表进行简化,并借助机器学习算法训练融合了舌象特征的中医体质预测模型,不仅能够大大减少人力成本,推进了中医体质研究的智能化进程。的智能化进程。的智能化进程。
技术研发人员:张刚强 徐鹤丹 滕晴 马宇冲 赵旭 章培昊 邸丹
受保护的技术使用者:上海国民集团健康科技有限公司
技术研发日:2023.03.27
技术公布日:2023/8/4
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种剪花织物织造方法 下一篇:一种高稳定度的蓝光激光器的制作方法
