一种动态知识图谱构建方法、电子设备及存储介质与流程

未命名 07-27 阅读:102 评论:0


1.本技术属于信息处理技术领域,尤其涉及一种动态知识图谱构建方法、电子设备及计算机可读存储介质。


背景技术:

2.临床思维是医生运用医学科学、自然科学、人文社会科学和行为科学的相关知识,以患者为中心,综合患者的检查结果、病史、家庭、人文背景、症状及与患者的沟通结果,作出针对患者的全面思考,并予以执行和不断修正的思维过程和思维活动。
3.针对西医已有较为成熟的临床思维训练方式。但是,由于中西医临床思维的不同,针对西医的临床思维训练方式并不能很好地移植到中医上。当前,针对中医的临床思维训练方式仍依赖于人工带教或是课本知识。显然,这种临床思维训练方式并不便捷,且训练效率也较为低下。基于此,针对中医的临床思维训练方式仍有待发展。


技术实现要素:

4.本技术提供了一种动态知识图谱构建方法、电子设备及计算机可读存储介质,可获得基于临床情况动态变化的知识图谱,由此实现针对中医的快捷、高效且精准的临床思维训练。
5.第一方面,本技术提供了一种动态知识图谱构建方法,包括:
6.根据患者的病历文本,确定针对患者的四诊要素集合,四诊要素集合包括多个四诊要素,四诊要素为从中医四诊的角度描述的患者拥有的与疾病相关的特征;
7.基于四诊要素集合进行中医长逻辑链推导,通过不同的思维线程表现,并得到至少一个目标证素、各个目标证素的得分、与目标证素匹配的至少一个目标证候及各个目标证候的得分;
8.根据四诊要素集合、各个目标证素的得分及各个目标证候的得分,生成动态知识图谱。
9.第二方面,本技术提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。
10.第三方面,本技术提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。
11.本技术与现有技术相比存在的有益效果是:本技术考虑以知识图谱作为临床思维训练的工具,提出了一种可根据临床情况而构建动态的知识图谱的方法。在该方法中,中医长逻辑链推导所得的结果不仅包括目标证素及目标证候,还包括目标证素的得分及目标证候的得分,通过该得分来最终生成动态知识图谱。可以理解,面对不同的临床情况,各目标证素及各目标证候的得分也会有所不同,这可使得知识图谱能够根据临床情况而动态且精准的构建,得到有针对性的动态知识图谱。并且,动态知识图谱的构建过程并不需要人工参
与。用户只需提供患者的病历文本,就可通过上述过程自动化构建得到动态知识图谱,非常方便且高效。最终,用户基于构建所得的动态知识图谱,即可实现对自己临床思维的快捷、高效且精准训练。可以理解的是,上述第二方面至第三方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
12.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
13.图1是本技术实施例提供的动态知识图谱构建方法的实现流程示意图;
14.图2是本技术实施例提供的电子设备的结构示意图。
具体实施方式
15.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
16.为了说明本技术所提出的技术方案,下面通过具体实施例来进行说明。
17.下面对本技术实施例所提出的动态知识图谱构建方法作出说明。可以理解,该动态知识图谱构建方法基于医疗知识库而实现,该医疗知识库可根据中医领域所提出的证素辨证体系为基础而构建,后文会对该医疗知识库作出具体介绍。请参阅图1,本技术实施例所提出的动态知识图谱构建方法包括:
18.步骤101,根据患者的病历文本,确定针对患者的四诊要素集合。
19.电子设备可首先获得患者的病历文本。该电子病历内包含有患者临床就诊的信息,这些信息具体以自然语言为表达;也即,电子病历实际呈现为自然语言文本。电子设备可对该病历文本进行自然语言处理(natural language process,nlp),得到针对患者的多个四诊要素;或者,电子设备也可向用户展示该病历文本及所有可能的四诊要素,由用户查阅该病历文本并对四诊要素进行勾选,根据用户的勾选确定针对患者的多个四诊要素。其中,四诊要素,指的是从中医四诊的角度描述的患者拥有的与疾病相关的特征。电子设备所得的针对患者的多个四诊要素可构成针对患者的四诊要素集合。其中,患者的病历文本,可以是虚拟案例,也可以是脱敏处理的真实案例,此处不作限定。并且,该病历文本可通过文件接口导入,也可在用户界面上直接录入,此处不作限定。
20.步骤102,基于四诊要素集合进行中医长逻辑链推导,通过不同的思维线程表现,并得到至少一个目标证素、各个目标证素的得分、与所述目标证素匹配的至少一个目标证候及各个目标证候的得分。
21.电子设备在获得四诊要素集合之后,可设置该四诊要素集合中的各个四诊要素的症状程度。仅作为示例,症状程度可被划分为“轻”、“中”及“重”这三个等级。电子设备可将各个四诊要素的症状程度缺省设置为“中级”。出于医学的严谨性,用户可根据自己已掌握
的患者信息,对不符合实际情况的四诊要素的症状程度进行调整。
22.电子设备可以根据医疗知识库对四诊要素集合进行层层递进的中医长逻辑链推导,通过不同的思维线程表现。由此,基于这些思维线程,可得到至少一个推导所得的证素(记作目标证素)、各个目标证素的得分、至少一个推导所得的证候(记作目标证候)及各个目标证候的得分。可以理解,目标证素的得分表示了该目标证素与患者的相关程度;类似地,该目标证候的得分表示了该目标证候与患者的相关程度。下面对此过程涉及的各个概念进行解释及说明:
23.知识节点,指的是知识体系构成的基本要素,表现为关键术语,由系统字典支持。在本技术实施例中,该知识节点实际对应的是最终生成的知识图谱中的每个节点。仅作为示例,每个目标证素及目标证候均为一个知识节点。
24.思维线程,指的是用连接方式描述思维起止的最小单位。在本技术实施例中,该思维线程实际对应的是知识图谱中带有箭头的一段曲线,其起点为某一节点,终点为根据起点所推导得到的另一节点。仅作为示例,一个目标证素及与该目标证素相匹配的一个目标证候之间的匹配关系,即为一个思维线程。
25.中医长逻辑链,指的是由思维线程与知识节点构成的前后有序关联(也即关联序),这种关联序必须符合中医学逻辑,称为某一段的逻辑链。多个环环相扣的逻辑链即可构成一个完整的医学命题或医学过程,即为中医长逻辑链。
26.证素及证候为中医的证素辨证体系中的已有概念,此处不再赘述。
27.步骤103,根据四诊要素集合、各个目标证素的得分及各个目标证候的得分,生成动态知识图谱。
28.基于证素辨证体系可知,目标证素是由四诊要素集合直接推导而得的,而目标证候是由目标证素直接推导而得的。也即,电子设备得到了由四诊要素到证素再到证候的映射关系,且该映射关系是有针对性的(针对的是当前所处理的病历文本)。考虑到目标证素及目标证候的得分均用于表示与患者的相关程度,因而电子设备可基于得分由高至低的顺序,对各个目标证素进行排序,以及,对各个目标证候进行排序。
29.电子设备可根据四诊要素集合中的各个四诊要素与已排序的各个目标证素的映射关系,生成第一知识图谱;类似地,电子设备还可根据已排序的各个目标证素与已排序的各个目标证候的映射关系,生成第二知识图谱。在此基础上,电子设备还可根据医疗知识库,进一步生成第三知识图谱、第四知识图谱及第五知识图谱,该第三知识图谱用于表示目标证候与目标治则(也即根据目标证候推导而得的治则)的映射关系、第四知识图谱用于表示目标治则与目标中药方剂(也即根据目标治则推导而得的中药方剂)的映射关系,第五知识图谱用于表示目标中药方剂与目标中药(也即根据目标中药方剂推导而得的中药)的映射关系。电子设备可以逐级显示所得的各知识图谱,使得知识图谱得以动态显示于用户界面,以便于用户对知识图谱进行查阅,实现基于知识图谱的中医临床思维训练。
30.在一些实施例中,为提高处理效率,省去用户人工审阅病历文本并提取四诊要素的操作,步骤101可具体包括:
31.a1、根据患者的病历文本,提取出要素集合。
32.病历文本中,通常包含有如下信息:患者的年龄、性别、孕否以及现病史。电子设备可先对该病历文本进行nlp处理,解析出病历文本中所包含的年龄、性别、孕否以及现病史,
然后将解析所得的现病史与医疗知识库中预设的要素词典进行对比,即可得到该病例的要素集合。其中,该要素集合包含了该现病史中的多个要素,该要素指的是患者拥有的与疾病相关的特征。
33.仅作为示例,要素词典中的各词条的格式如下:{要素id|要素名称|要素性别|要素最小年龄|要素最大年龄|怀孕标志|要素其它信息}
34.其中,要素id表示要素唯一标识;要素名称表示标准化的要素名称;要素性别表示要素适用的性别,例如0表示男女通用,1表示只适用于男性,2表示只适用于女性;要素最小年龄和要素最大年龄表示要素适用的年龄范围;怀孕标志表示该要素是否怀孕适用,例如0表示通用,1表示怀孕禁用,2表示怀孕可用;要素其它信息表示其它与要素相关的信息。
35.由于要素词典中对各要素定义了其适用的性别、是否怀孕适用及适用的年龄范围等信息,因而基于病历文本的现病史得到了要素集合后,还可将该要素集合中的各要素与患者的年龄、性别和孕否等进行匹配,去除不满足该患者的年龄、性别和孕否的要素,才可得到最终的要素集合。
36.a2、将要素集合转换为四诊要素集合。
37.考虑到病历文本的现病史不一定采用的是纯中医的描述方式,因而通过步骤a1所得的要素集合可能既包含适用于中医的要素(也即四诊要素),又包含适用于西医的要素(也即西医要素)。考虑到本技术实施例关注的是中医角度下的动态知识图谱的生成,因而电子设备可根据医疗知识库中预设的四诊要素词典来将要素集合转换为四诊要素集合,其过程可具体为:根据要素id,将步骤a1所得的要素集合与缓存中的中西医要素转换词典进行匹配,由此得到:需要转换的要素id列表和不需要转换的要素id列表;对需要转换的要素id列表进行处理,具体为:针对该要素id列表中的每个要素id,根据该要素id在缓存中的中西医要素转换词典中查找其可转换的四诊要素id和名称,并在要素词典中对应获取所需的各项相关信息,加入四诊要素集合;对不需要转换的要素id列表进行处理,具体为:针对该要素id列表中的每个要素id,将该要素id与缓存中的四诊要素关系树词典进行匹配,得到可相匹配的四诊要素id和名称,并在要素词典中对应获取所需的各项相关信息,加入四诊要素集合。通过以上过程,即可完成对要素集合的转换,得到最终的四诊要素集合。
38.在一些实施例中,考虑到四诊要素、证素及证候之间的逻辑关系,电子设备可将推导的全过程拆分为两个阶段,分别为证素推导的阶段以及证候推导的阶段,由此实现基于四诊要素集合的快速推导。基于此,步骤102可具体包括:
39.b1、基于四诊要素集合进行证素推导,得到至少一个目标证素及各个目标证素的得分。
40.电子设备可根据医疗知识库中预设的中医证素词典及证素推导算法规则来对四诊要素集合进行证素推导,所得结果为至少一个目标证素及各个目标证素的得分。其中,证素推导算法规则包括:分类规则、计分规则及阈值规则,以及基于这些规则所对应的第一计分算法等。
41.仅作为示例,中医证素词典中的各词条的格式如下:
42.{证素id|证素名称|证素分类标志|证素性别|证素最小年龄|证素最大年龄|怀孕标志|证素其它信息}
43.其中,证素id表示证素唯一标识;证素名称表示标准化的证素名称;证素分类标志
表示证素类别,例如1表示病位证素,2表示病性证素;证素性别表示证素适用的性别,例如0表示男女通用,1表示只适用于男性,2表示只适用于女性;证素最小年龄和证素最大年龄表示证素适用的年龄范围;怀孕标志表示证素是否怀孕适用,例如0表示通用,1表示怀孕禁用,2表示怀孕可用;证素其它信息表示其它与该证素相关的信息。
44.仅作为示例,分类规则与要素对证素所属的贡献度等级相关,该分类规则中的各词条的格式如下:
45.{证素id|四诊要素id|要素所属贡献度等级|要素的贡献度分值cp_score|其它信息}
46.其中,证素id表示证素的唯一标识;四诊要素id—四诊要素的唯一标识;要素所属贡献度等级用于表示该四诊要素对该证素的贡献度等级,其定义为rc-ps,具体说明如下:
47.rc-ps中的参数r用于表示贡献度等级;本实施例中,针对与证素相关的四诊要素,共定义六个贡献度等级,由高至低分别为a、b、c、d、e及f,也即r参数的取值可以是a至f中的任一项。
48.其中,a贡献度等级,用于表示病症组,说明四诊要素的症状已经可以定义为疾病;b贡献度等级,用于表示已有病态型症状;c贡献度等级,用于表示直接主症组,说明四诊要素可特征性表示典型证素;d贡献度等级,用于表示间接主症组,说明四诊要素可牵扯性表示典型证素;e贡献度等级,用于表示辅症组,说明四诊要素的影响较轻;f贡献度等级,用于表示留症组,说明四诊要素字面上严重,但实际与证素相关性很低。
49.rc-ps中的参数c用于表示要素所属贡献度等级对证素的贡献度的计分生效要素个数。仅作为示例,该参数c可被配置为0、1、2或3。可以理解,针对不同的计分生效要素个数,后续所要采用的第一计分规则也不一样。
50.rc-ps中的参数ps用于表示要素所属贡献度等级出现的四诊要素多于其所对应的计分生效要素个数后,多出的四诊要素所占据的贡献度分值。仅作为示例,该参数ps可被配置为0分、1分或2分。
51.要素的贡献度分值cp_score表示该要素所属贡献度等级对证素的初始的贡献度分值cp_score。仅作为示例,可将该要素的贡献度分值cp_score配置为:a等级为18分,b等级为16分,c等级为13分,d等级为10分,e等级为5分,f等级为2分。
52.其它信息用于表示其它与该条规则条目相关的信息。
53.仅作为示例,计分规则用于表示贡献度等级所对应的不同计分生效要素个数的计分规则,可理解为基于贡献度等级所对应的计分生效要素个数,对属于该贡献度等级的四诊要素所应采用的计算系数的规则。由于计分生效要素个数的取值范围为0,1,2及3,因而该计分规则可定义如下:
54.{count=1,s11=a|count=2,s21=b,s22=c|count=3,s31=d,s32=e,s33=f|}
55.以上计分规则的具体释义如下:
56.在某一贡献度等级的count=1,也即其所对应的计分生效要素个数为1时,属于该贡献度等级的第1个要素按s11(也即a)来计分。
57.在某一贡献度等级的count=2,也即其所对应的计分生效要素个数为2时,属于该贡献度等级的第1个四诊要素在计分时的计算系数为s21(也即b),第2个四诊要素在计分时
的计算系数为s22(也即b)。
58.在某一贡献度等级的count=3,也即其所对应的计分生效要素个数为3时,属于该贡献度等级的第1个四诊要素在计分时的计算系数为s31(也即d),第2个四诊要素在计分时的计算系数为s32(也即e),第3个四诊要素在计分时的计算系数为s33(也即f)。
59.需要说明的是,计分规则中并不需要对count=0时所对应的计算系数进行配置。实际上,在某一贡献度等级的count=0,也即其所对应的计分生效要素个数为0时,该贡献度等级可由r被配置为r0,例如a0、b0、c0、d0、e0或f0等。可以理解,针对贡献度等级r0,属于该贡献度等级的要素可直接按已配置的要素的贡献度分值cp-score来计分,且该cp-score会被配置为对应r等级的贡献度分值的负值,例如,a0贡献度等级的cp-score被配置为-18,b0贡献度等级的cp-score被配置为-16,以此类推,此处不再赘述。也即,某个贡献度等级所对应的计分生效要素个数为0,说明属于该贡献度等级的四诊要素对相应的证素为负向计分(也即扣分)。
60.在一种典型应用场景中,a=b=d,c<b,f<e<d,例如,a、b及d可均被配置为100%,b可被配置为70%,e可被配置为60%,f可被配置为30%。
61.仅作为示例,阈值规则用于表示四诊要素的症状程度对计分的影响,以及证素的得分阈值,和证候的得分阈值。该阈值规则可定义如下:
62.{sym_weak=g|sym_middle=h|sym_heavy=i|snf_threshold=j|syn_threshold=k}
63.如前文已描述的每个四诊要素都有轻中重程度之别,且缺省为中等程度。基于该阈值规则,四诊要素的症状程度对计分的影响是:某一四诊要素若为轻症,则计分时其得分需与sym_weak的值相乘;若为中症,则计分时其得分需与sym_middle的值相乘;若为重症,则计分时其得分需与sym_heavy的值相乘。以及,snf_threshold表示某个证素最终计分的贡献度阈值。syn_threshold用于表示某个证候最终计分的贡献度阈值。
64.在一种典型应用场景中,g<h<i,snf_threshold<syn_threshold,例如g可被配置为70%,h可被配置为100%,i可被配置为150%,snf_threshold可被配置为49.9,syn_threshold可被配置为99。
65.基于以上所提出的分类规则、计分规则及阈值规则,下面对本实施例所提出的一种可能的第一计分算法进行描述,该第一计分算法用于计算证素的各贡献度等级的贡献度得分:
66.在某个证素的贡献度等级r(r可为a/b/c/d/e/f中的任一等级)的count=1的情况下,依据属于该贡献度等级的四诊要素的个数,其贡献度得分算法为:
67.i)若属于该贡献度等级的四诊要素的个数为0,则其贡献度得分为0分;
68.ii)若属于该贡献度等级的四诊要素的个数为1,则其贡献度得分为sym_svr*s11*cp_score;
69.iii)若属于该贡献度等级的四诊要素的个数为n(n>1),则其贡献度得分为sym_svr*s11*cp_score+(n-1)*ps。
70.需要说明的是,sym_svr指的是出现的四诊要素被标记的症状程度,取值可以为sym_weak(对应轻)、sym_middle(对应中)和sym_heavy(对应重)。若属于证素的某个贡献度等级的四诊要素的数量仅为1个,则以该四诊要素的症状程度对应的值(在阈值规则中有配
置)来进行计算;若属于证素的某个贡献度等级的四诊要素的数量大于1个,则以属于该贡献度等级中的四诊要素的症状程度最重的值来计算。
71.在某个证素的贡献度等级r(r可为a/b/c/d/e/f中的任一等级)的count=2的情况下,依据属于该贡献度等级的四诊要素的个数,其贡献度得分算法为:
72.i)若属于该贡献度等级的四诊要素的个数为0,则其贡献度得分为0分;ii)若属于该贡献度等级的四诊要素的个数为1,则其贡献度得分为sym_svr*s21*cp_score;
73.ii)若属于该贡献度等级的四诊要素的个数为2,则其贡献度得分为sym_svr1*s21*cp_score+sym_svr2*s22*cp_score;
74.iii)若属于该贡献度等级的四诊要素的个数为n(n>2),则其贡献度得分为sym_svr1*s21*cp_score+sym_svr2*s22*cp_score+(n-2)*ps。
75.需要说明的是,sym_svr1和sym_svr2指的是出现的四诊要素被标记的症状程度,取值可以为sym_weak(对应轻)、sym_middle(对应中)和sym_heavy(对应重)。若属于证素的某个贡献度等级的四诊要素的数量仅为1个,则sym_svr1以该四诊要素的症状程度对应的值(在阈值规则中有配置)来进行计算;若属于证素的某个贡献度等级的四诊要素的数量大于1个,则sym_svr1以属于该贡献度等级中的四诊要素的症状程度最重的值来计算,sym_svr2以排除该症状程度最重的一个四诊要素后,余下的四诊要素中出现的症状程度最重的值来计算。
76.在某个证素的贡献度等级r(r可为a/b/c/d/e/f中的任一等级)的count=3的情况下,依据属于该贡献度等级的四诊要素的个数,其贡献度得分算法为:
77.i)若属于该贡献度等级的四诊要素的个数为0,则其贡献度得分为0分;ii)若属于该贡献度等级的四诊要素的个数为1,则其贡献度得分为sym_svr1*s31*cp_score;
78.iii)若属于该贡献度等级的四诊要素的个数为2,则其贡献度得分为sym_svr1*s31*cp_score+sym_svr2*s32*cp_score;
79.iv)若属于该贡献度等级的四诊要素的个数为3,则其贡献度得分为sym_svr1*s31*cp_score+sym_svr2*s32*cp_score+sym_svr3*s33*cp_score;
80.v)若属于该贡献度等级的四诊要素的个数为n(n>3),则其贡献度得分为sym_svr1*s31*cp_score+sym_svr2*s32*cp_score+sym_svr3*s33*cp_score+(n-3)*ps。
81.由此可知,对于任一目标证素所对应的每个要素列表而言,其贡献度得分的计算过程可简述为;确定该要素列表的计分参数(包括但不限于count及cp_score等参数);根据所述要素列表所包含的四诊要素的个数以及所述计分参数,计算所述要素列表的贡献度得分。
82.需要说明的是,sym_svr1、sym_svr2和sym_svr3指的是出现的四诊要素被标记的症状程度,取值可以为sym_weak(对应轻)、sym_middle(对应中)和sym_heavy(对应重)。若属于证素的某个贡献度等级的四诊要素的数量仅为1个,则sym_svr1以该四诊要素的症状程度对应的值(在阈值规则中有配置)来进行计算;若属于证素的某个贡献度等级的四诊要素的数量为2个,则sym_svr1以该贡献度等级中的四诊要素的症状程度最重的值来计算,sym_svr2以排除该症状程度最重的一个四诊要素后,余下的四诊要素中出现的症状程度最重的值来计算;若属于证素的某个贡献度等级的四诊要素的数量大于2个,则sym_svr1以该贡献度等级中的四诊要素的症状程度最重的值来计算,sym_svr2以排除该症状程度最重的
一个四诊要素后,余下的四诊要素中出现的症状程度最重的值来计算,sym_svr3以排除该症状程度最重的两个四诊要素后,余下的四诊要素中出现的症状程度最重的值来计算。
83.b2、基于至少一个目标证素进行证候推导,得到至少一个目标证候及各个目标证候的得分。
84.电子设备可根据医疗知识库中预设的中医证候词典、身体部位词典、证侯和治则的映射关系列表及证候推导算法规则来对已得到的所有目标证素进行证候推导,所得结果为至少一个目标证候及各个目标证候的得分。考虑到同一证候可能有不同的表达,该医疗知识库还可预设有中医证侯同义词词典。
85.其中,证素推导算法规则包括:清洗规则、调整规则及推导规则,以及基于这些规则所对应的第二计分算法及第三计分算法等。
86.仅作为示例,中医证候词典中的各词条的格式如下:
87.{证侯id|证侯名称|证侯性别|证侯最小年龄|证侯最大年龄|怀孕标志|证侯其它信息}
88.其中,证侯id表示证侯唯一标识;证侯名称表示标准化的证侯名称;证侯性别表示证侯适用的性别,例如0表示男女通用,1表示只适用于男性,2表示只适用于女性;证侯最小年龄和证侯最大年龄表示证侯适用的年龄范围;怀孕标志表示是否怀孕适用,例如0表示通用,1表示怀孕禁用,2表示怀孕可用;证侯其它信息表示与该证侯相关的其它信息。
89.仅作为示例,身体部位词典中的各词条的格式如下:{id|名称}
90.其中,id表示身体部位唯一标识;名称表示身体部位的名称。
91.仅作为示例,中医证候同义词词典中的各词条的格式如下:
92.{证候id|证候同义词名称|证候同义词其它信息}
93.其中,证候id表示证候唯一标识,其可和中医证候词典中的证候id对应;证候同义词名称表示该证候的同义词名称,可以理解,若某证候有多个同义词,则此处有多条条目对应;证候同义词其它信息表示与该证候同义词相关的其它信息。
94.其中,证侯和治则的映射关系列表可表示如下:
95.{主关系对应表名|主关系id|从关系对应表名|从关系id|从关系排序|其它信息}
96.其中,主关系对应表名表示主关系所对应的表名,此处为syn,也即证侯;主关系id表示主关系的唯一标识,和主关系所对应的表名中的记录id对应;从关系对应表名表示从关系所对应的表名,此处为tre,也即治则;从关系id表示从关系的唯一标识,和从关系所对应的表名中的记录id对应;从关系排序表示确定从关系的排序,一般从1递增。
97.可以理解,医疗知识库中还可根据需求,预设有治则和中药方剂的映射关系列表,中药方剂和中药的映射关系列表,其形式均可参照以上证侯和治则的映射关系列表的形式,只是各参数有适应性修改。例如,治则和中药方剂的映射关系列表中,主关系对应表名为tre,也即治则,从关系对应表名为pre,也即中药方剂,以此类推,此处不再赘述。
98.仅作为示例,清洗规则用于对证素名称及证候名称的干扰字符进行清洗,其可被配置为如下所示:{snf_interfer=“(证)”|syn_interfer=“证”or“证候”}
99.其中,snf_interfer中配置了证素名称中需要清洗的干扰字符,本示例配置为“(证)”。例如,证素名称为“心神(证)”,则在进行证候推导前,可先清洗该证素名称中的“(证)”,仅保留“心神”,之后再进行后续处理。syn_interfer中配置了证候名称中需要清洗
的干扰字符,其可配置为“证”或者“证候”。
100.仅作为示例,调整规则用于对单一病位证素的分数进行调整,该调整规则可被配置为如下所示:
101.{possnf_count=1|possnf_percentage1《40,adjustvalue1=+5%|possnf_percentage2《30,adjustvalue2=+10%}
102.其中,possnf_count配置了需要进行计分调整的病位证素数量,本示例配置为1,即推导得到的病位证素只有1个时,需要对该病位证素计分所得的分数进行调整;possnf_percentage1配置当病位证素分值小于40时,其adjustvalue1计分调整值为+5%;possnf_percentage2配置当病位证素分值小于30时,其adjustvalue2计分调整值为+10%。
103.仅作为示例,推导规则可被配置为如下所示:
104.《snftosyn_rules|{snfgroup_count=1,snftosyn_count=5|snfgroup_count=2,snftosyn_count=3|snfgroup_count>=3,snftosyn_count=2},{shield_rule1|tr e_relation=0},{shield_rule2|bodypart_including_reduchar=1&symname_includ ing_reduchar=0}>
105.其中,snfgroup_count和snftosyn_count定义了根据分组证素的组数来确定每组证素可推导的证侯数量。若只有1组分组证素,则该组证素可推导5个证侯;若有2组分组证素,则每组证素可推导3个证侯。若有3组及以上分组证素,则每组证素可推导两个证侯。
106.其中,shield_rule1定义了分组证素推导证侯时的屏蔽规则1:tre_relation=0,说明若推导得到的证侯没有关联的治则,则该证侯将被屏蔽。
107.其中,shield_rule2定义了分组证素推导证侯时的屏蔽规则2:先统计根据分组证素所推导得到的证侯名称中,没有包括对应分组证素名称的字符reduchar;bodypart_including_reduchar=1&symname_including_reduchar=0表示:若知识库中身体部位词典名称包括了冗余字符reduchar,同时四诊要素名称中没有包括该冗余字符reduchar,则该证侯将被屏蔽。
108.下面对本实施例所提出的一种可能的第二计分算法进行描述,该第二计分算法用于计算某一分组证素所能推导的证候的初步得分,具体可表示为:
109.syn_score=∑snf_percentage*probit_value
110.其中,∑snf_percentage为一个分组证素下所有证素的贡献度分数的累加值;probit_value为对证侯进行计分的概率值,其算法为:
111.probit_value=(100/snf_count)/100*multiple+adjustvalue
112.其中,snf_count为该分组证素所包含的证素数量;若snf_count>1,则multiple=2,否则multiple=1;若snf_count为奇数且不为1,则adjustvalue=0.01,否则adjustvalue=0。可以理解,基于前文的阈值规则可知,每个证素的计分小于50,因而该算法可确保证侯计分小于100。
113.下面对本实施例所提出的一种可能的第三计分算法进行描述,该第三计分算法用于根据某一分组证素所能推导的证候的名称对分数进行扣减,也即该第三计分算法为一种扣分机制,具体可表示为:
114.syn_score=syn_score*(1-10%*deducted_count)
115.其中,deducted_count用于统计根据分组证素所推导得到的证侯的名称中,没有
包括对应分组证素名称的字符,却包含在中医证素词典中的其它证素名称中的字符的数量,其取值为0~5;也即,若统计得到的该数量大于5,则该deducted_count直接按5计算。可以理解,10%*deducted_count表达了扣减比例。
116.可以将以上扣分机制理解为,若证素推导的证候的证候名称中,包括符合条件的字符(该字符未被对应的分组证素中的任一证素的名称包含,却被在证素词典中的其它证素的证素名称包含),则该证候按每单个符合条件的字符扣减10%的分值进行计分,最多按5个符合条件的字符来进行扣减。
117.在一些实施例中,电子设备可在载入患者的年龄、性别和孕否等信息之后,再载入已得到的四诊要素集合,该四诊要素集合中的各四诊要素均已被设定了症状程度(轻中重中的任一项),之后从中医知识库中获取中医证素词典以及及证素推导算法规则写入到缓存。其中,中医证素词典以及及证素推导算法规则在前文已有描述,此处不再赘述。在载入了以上这些内容后,电子设备可先根据患者的年龄、性别及孕否等信息,在缓存中对已获取的中医证素词典进行条目剔除等处理。可以理解,由于中医证素词典定义了中医证素所适用的患者年龄、性别以及孕否是否适用等信息,因而通过将中医证素词典与病例患者的年龄、性别和孕否进行匹配,即可在缓存中的中医证素词典中去除掉不满足患者年龄、性别和孕否条件的证素的条目。之后,电子设备设备即可开始进行证素推导,该证素推导具体可通过以下步骤而实现:
118.c1、在四诊要素集合中进行遍历,确定当前四诊要素。
119.c2、查找与当前四诊要素相关联的证素作为目标证素。
120.通过前文所提出的证素推导算法规则,电子设备可以快速确定当前四诊要素所关联的证素,也即通过当前四诊要素所能够推导出的证素。这些证素即可被作为该当前四诊要素的目标证素。
121.c3、根据当前四诊要素对各目标证素分别所处的贡献度等级,更新证素列表。
122.通过前文所提出的证素推导算法规则,电子设备可以明确当前四诊要素对其所对应的每个目标证素分别所处的贡献度等级(也即要素组rc-ps),包括该当前四诊要素所属贡献度等级、对该目标证素的贡献度的计分生效要素个数,以及该贡献度等级在超出计分生效要素个数之外的四诊要素所占据的贡献度分值等信息。同时,电子设备还可获知各个贡献度等级的初始的贡献度分值cp_score等信息。以上参数前文具有描述,此处不再赘述。基于以上所得信息,电子设备可对证素列表进行更新。
123.c4、返回执行在四诊要素集合中进行遍历,确定当前四诊要素的步骤及后续步骤,直至遍历完全。
124.可以理解,以上c1-c3的步骤将会被重复执行,直至四诊要素集合中的所有四诊要素均被遍历后才停止。
125.c5、计算最新的证素列表中的各个目标证素的得分。
126.在停止重复执行步骤c1-c3,也即对四诊要素集合已遍历完全后,电子设备可获得基于四诊要素集合所得的最新的(同时也是最全的)证素列表。根据前文所提出的第一计分算法,电子设备可计算出该证素列表中的各个目标证素的得分。
127.在一些实施例中,证素列表具体是以各目标证素为关键值,且证素列表记录了各目标证素所分别对应的至少一个要素列表,每个要素列表中的四诊要素对对应的目标证素
均处于同一个贡献度等级;则该步骤c3可包括:
128.d1、在当前四诊要素所对应的目标证素中进行遍历,确定当前目标证素。
129.前文已描述了,一个四诊要素可能可以推导出多个证素,也即当前四诊要素所对应的目标证素可能有多个。基于此,电子设备可在当前四诊要素所对应的目标证素中进行遍历,将当前被遍历到的目标证素记作当前目标证素。
130.d2、检测所述证素列表中是否存在所述当前目标证素。
131.d3、若所述证素列表中不存在所述当前目标证素,则在所述证素列表中添加所述当前目标证素,并将所述当前四诊要素加入目标要素列表,其中,所述目标要素列表为所述当前四诊要素对所述当前目标证素所处的贡献度等级所对应的要素列表。
132.d4、若所述证素列表中已存在所述当前目标证素,则检测所述目标要素列表中是否存在所述当前四诊要素。
133.d5、若所述目标要素列表中不存在所述当前四诊要素,则将所述当前四诊要素加入所述目标要素列表。
134.仅作为示例,证素列表的格式可如下所示:
135.[{snfid1|《r组1,symlist,rc,r
cp_score
,r
ps
|r组2,symlist,rc,r
cp_score
,r
ps
|
……
>},{snfid2|《r组1,symlist,rc,r
cp_score
,r
ps
|r组2,symlist,rc,r
cp_score
,r
ps
|
……
>},
……
]
[0136]
其中,snfid1和snfid2为根据四诊要素集合所推导得到的证素id(也即目标证素的证素id)。因通过一个当前四诊要素可能可以得到多个目标证素,因而电子设备得到的是以证素id为关键值的列表(证素列表)。r组1及r组2等为一个四诊要素针对对应的目标证素所在的贡献度等级,其最多可包括有a、b、c、d、e及f共六个等级。symlist为贡献度等级所对应的要素列表,该要素列表包括四诊要素的id和已标记的轻中重症状程度。rc为贡献度等级对对应的证素的贡献度的计分生效要素个数,取值为0、1、2或3。r
cp_score
为贡献度等级对对应的证素初始的贡献度分值。r
ps
为要素贡献度等级在超出计分生效要素个数之外的要素出现的贡献度分值。
[0137]
针对当前目标证素而言,该证素列表记录有该当前目标证素下的各个贡献度等级的要素列表。电子设备可在该当前目标证素所对应的所有要素列表中查找当前四诊要素,如已查找到,则表明该当前四诊要素与该当前目标证素的对应关系已在证素列表中有所记录,电子设备不再需要重新记录。反之,如未查找到,则表明该当前四诊要素与该当前目标证素的对应关系还未在证素列表中有所记录,电子设备需要将该当前四诊要素加入至对应的要素列表中。由此,即可实现对证素列表的更新。
[0138]
在一些实施例中,步骤c5可以包括:
[0139]
e1、根据与所述目标证素对应的各个要素列表的计分参数,分别计算与所述目标证素对应的各个要素列表的贡献度得分。
[0140]
针对每个目标证素而言,电子设备可根据第一计分算法,计算出与该目标证素对应的各个要素列表的贡献度得分sr。根据前文的第一计分算法可知,以证素a为例,对其下的任一贡献度等级r的贡献度得分sr的计算可具体为:
[0141]
[0142][0143][0144][0145]
其中,rc为贡献度等级r对证素a的贡献度的计分生效要素个数,有0、1、2或3几种取值情况。
[0146]
其中,rn为该证素的贡献度等级r所对应的要素列表中,出现的四诊要素的个数。由前文所提出的第一计分算法可知,rn为0时,该贡献度等级r对证素a的组内贡献度分值为0。
[0147]
其中,r
sym_svr
是当贡献度等级r的rc为0时,该贡献度等级r所对应的要素列表中,出现的各四诊要素的症状程度,有轻中重三种情况,对应取值可分别为sym_weak、sym_middle和sym_heavy。
[0148]
其中,sym_svr、sym_svr1、sym_svr2和sym_svr3代表贡献度等级r所对应的要素列表中,出现的各四诊要素的症状程度,有轻中重三种情况,对应取值可分别为sym_weak、sym_middle和sym_heavy。
[0149]
由以上计分过程可知,若贡献度等级r所对应的要素列表中出现的四诊要素个数为1,则sym_svr和sym_svr1直接以贡献度等级r内所对应的要素列表中出现的该唯一一个四诊要素的症状程度对应的值来计算;若某证素的贡献度等级下所出现的四诊要素个数大于1,则sym_svr、sym_svr1、sym_svr2和sym_svr3可在该贡献度等级r内所对应的要素列表中,按照四诊要素的症状程度从重到轻的顺序依次取值来计算。
[0150]
其中,s11、s21、s22、s31、s32和s33均为预先已设置的值,其在前文所描述的计分规则中已有描述,此处不再赘述。
[0151]
其中,r
cp_score
为贡献度等级r对该证素a初始的贡献度分值,其在前文的分类规则中已有描述,此处不再赘述;
[0152]
其中,r
ps
为贡献度等级r在超出计分生效要素个数之外,多出的四诊要素所占据的贡献度分值,其在前文的分类规则中已有描述,此处不在赘述。
[0153]
e2、对与目标证素对应的各个要素列表的贡献度得分进行求和,得到贡献度总分。
[0154]
电子设备可将目标证素所对应的各个要素列表的贡献度得分进行累加,所得结果∑sr即为该目标证素的贡献度总分。
[0155]
e3、在贡献度总分小于预设的贡献度阈值的情况下,确定目标证素的得分为贡献度总分。
[0156]
e4、在贡献度总分大于或等于贡献度阈值的情况下,确定目标证素的得分为贡献度阈值。
[0157]
前文的阈值规则中,已有对syn_threshold的描述,其表示的是证素最终计分的贡献度阈值。可以理解,不管是哪一目标证素,其最终的贡献度总分均不能超过该贡献度阈值
syn_threshold。基于此,电子设备可将得到的目标证素的贡献度总分∑sr和贡献度阈值snf_threshold进行比较;若σsr《snf_threshold,则该目标证素最终真正的得分即为该贡献度得分∑sr;若∑sr≥snf_threshold,则该目标证素最终真正的得分即为该贡献度阈值snf_threshold。以上过程可表达为:
[0158][0159]
至此,电子设备即可得到各个目标证素,以及各个目标证素的得分。电子设备可以根据各个目标证素的得分,对证素列表中的目标证素重新进行排序,将得分高的目标证素排至证素列表的前面,将得分低的目标证素排至证素列表的后面。由此,即可按照证素列表中各目标证素的排序构建第一知识图谱。
[0160]
在一些实施例中,考虑到电子设备的显示界面有限,用户可以预先设置一证素推导最大数量和/或证素显示最小得分。在设置了证素推导最大数量的情况下,如果证素列表中的目标证素过多,其数量大于该证素推导最大数量,则可剔除掉得分少的目标证素,直至该证素列表中的目标证素的数量不大于该证素推导最大数量。类似地,在设置了证素显示最小得分的情况下,如果证素列表中的目标证素过多,则可剔除掉得分小于该证素显示最小得分的目标证素。
[0161]
在一些实施例中,电子设备可在载入患者的年龄、性别和孕否等信息之后,再载入已得到的四诊要素集合,该四诊要素集合中的各四诊要素均已被设定了症状程度(轻中重中的任一项)及已推导而得的证素列表,之后从中医知识库中获取中医证素词典、中医证侯词典、中医证候同义词词典、身体部位词典、证侯和治则的映射关系列表及证候推导算法规则等信息写入到缓存。以上这些词典、映射关系列表及算法规则在前文已有描述,此处不再赘述。在载入了以上这些内容后,电子设备可先根据患者的年龄、性别及孕否等信息,在缓存中对已获取的中医证候词典进行条目剔除等处理。可以理解,由于中医证候词典定义了中医证候所适用的患者年龄、性别以及孕否是否适用等信息,因而通过将中医证候词典与患者的年龄、性别和孕否进行匹配,即可在缓存中的中医证候词典中去除掉不满足患者年龄、性别和孕否条件的证候的条目。之后,电子设备设备即可开始进行证候推导,该证候推导具体可通过以下步骤而实现:
[0162]
f1、分别查找与各个目标证素相关联的证候作为候选证候。
[0163]
其中,针对任一目标证素而言,与该目标证素相关联的证候指的是:证候名称中,包含该目标证素的证素名称的证候。例如,某一目标证素的证素名称为a,某一证候的证候名称为abc,则该证候即为与该目标证素相关联的证候,其可被确定为候选证候。考虑到同一证候可能有不同表达,因而电子设备具体可基于中医证候词典及中医证候同义词词典查找出与各个目标证素相关联的证候。也即,对于某一证候而言,只要该证候的证候同义词包括了某一目标证素的证素名称,该证候即可被确定为候选证候。
[0164]
为便于后续处理,电子设备可将查找出的所有候选证候均写入一个临时变量tempsynlist中。
[0165]
在一些实施例中,在步骤f1之前,电子设备还可先根据前文所提出的清洗规则对当前所得的证素列表、缓存中的中医证素词典以及缓存中的中医证侯词典等进行名称清
洗,用以清洗掉所有的干扰字符。例如,证素列表中的某一目标证素的证素名称为“心神(证)”,则在电子设备清洗掉干扰字符后,该目标证素的证素名称被更新为“心神”。
[0166]
f2、根据候选证候对至少一个目标证素进行分组,以根据分组结果确定目标证候数量。
[0167]
电子设备可根据各个候选证素与各个目标证素的对应关系,对所得的目标证素进行分组处理,得到多个分组证素,也即多个目标证素组。具体地,电子设备可将与同一候选证候相关联的目标证素划分至同一组,由此得到至少一个目标证素组,其过程为:电子设备可在临时变量tempsynlist中进行循环处理,也即在临时变量tempsynlist中进行遍历。为便于描述,本实施例将当前被遍历到的候选证候记作当前候选证素。电子设备随后可查找与该当前候选证素相关联的所有目标证素,并将查找到的所有目标证素确定为一个目标证素组。可以理解,该当前候选证候可能实际关联有多个目标证素,例如候选证候abc可关联有目标证素a、b及c,则可得到一个包含a、b及c的目标证素组。
[0168]
需要注意的是,不同目标证素组中可能有相同的目标证素。例如,电子设备得到的证素列表包括如下独立的目标证素:a、b、c、d、e及f;tempsynlist中的候选证候包括ab、bcd、def及efh;则,电子设备可得到四个目标证素组,具体为:第一个目标证素组包括a及b、第二个目标证素组包括b、c及d,第三个目标证素组包括d、e及f,第四个目标证素组包括e及f。
[0169]
根据前文所提出的推导规则可知,分组证素的组数确定了每组证素可推导的证候数量。基于此,电子设备可根据目标证素组的数量,查阅并匹配该推导规则,以确定目标证候数量,该目标证候数量指的是:单个目标证素组可推导的证候数量。以电子设备得到四个目标证素组为例,通过查阅前文所示例的推导规则,可知目标证候数量为2,即每个目标证素组均可推导出两个目标证侯。
[0170]
f3、分别计算各个候选证候的得分。
[0171]
根据前文所提出的第二计分算法及第三计分算法可知,电子设备此处需要进行两步计算,分别为:根据分组结果确定各个候选证候的候选得分,以及,根据各个候选证候的名称,确定各个候选证候的扣减比例,由此得到各个候选证候最终的得分。
[0172]
其中,候选得分的计算过程如下:先针对每个目标证素组,根据probit_value=(100/snf_count)/100*multiple+adjustvalue计算该目标证素组对相应候选证候的概率值probit_value;然后再根据syn_score=∑snf_percentage*probit_value计算该目标证素组对相应候选证候的初步得分,该初步得分即为该候选证候的候选得分。以上公式在前文已有介绍,此处不再赘述。
[0173]
其中,扣减比例的计算过程如下:先对每个候选证候的证候名称进行处理,找到证候名称中没有包括对应的目标证素组中任意证素名称的字符,为便于描述,可将该字符记作多余字符;然后再结合缓存中的中医证素词典,统计该中医证素词典的其它证素(非对应的目标证素组中的任一目标证素)的证素名称中,包含该多余字符的证素名称的数量,需要注意的是,该数量的取值范围为0~5(也即该数量最大取值为5);根据前文所提出的第三计分算法,可得到扣减比例10%*deducted_count,deducted_count为统计所得的该数量。
[0174]
仅作为示例,候选证候为efh,目标证素组包括证素e及证素f,则可知多余字符为h。电子设备可在中医证素词典中,查阅其它所有包含该多余字符的证素。假定电子设备最
终查阅到如下证素f、fg及fh包含该多余字符,则可知统计所得数量为3,扣减比例为30%。
[0175]
由前文可知,根据第三计分算法,针对任一候选证候而言,其最终的得分为:syn_score=syn_score*(1-10%*deducted_count)。电子设备可根据各个候选证候中的得分,对候选证候进行降序排列。
[0176]
在一些实施例中,电子设备还可在计算出各个候选证候的候选得分之后,计算各个候选证候的扣减比例之前,再根据每个目标证素组,对所得的所有候选证候进行筛除(屏蔽)处理,以使得推导结果更加精准,其过程可具体为:
[0177]
首先,确定当前目标证素组。可以理解,电子设备通过分组,可得到至少一个目标证素组。电子设备可以组为单位进行遍历,确定当前被遍历到的目标证素组,该目标证素组即为当前目标证素组。
[0178]
其次,在通过步骤f2所得的tempsynlist中进行匹配,查找该tempsynlist中,证候名称同时包括了对应的目标证素组的所有证素的证素名称的候选证候,作为初始推导的证候列表synlist1,并对该初始推导的证候列表按名称长短降序处理。
[0179]
然后,根据前文所示出的屏蔽规则1,将缓存中已有的证侯和治则的映射关系列表与初始推导的证候列表synlist1进行匹配。电子设备可去除初始推导的证候列表synlist1中没有治则关系的候选证候,得到屏蔽了没有治则关系的证候列表synlist2。
[0180]
接着,根据前文所示出的屏蔽规则2,在证候列表synlist2中对每个候选证候的证候名称进行处理,找到证候名称中没有包括对应分组证素中所有证素名称的字符char,并判断身体部位词典以及载入的四诊要素集合中是否包括这些相应的字符;若存在char,且身体部位词典中包括了char,且载入的四诊要素集合中没有包括char,则满足该屏蔽规则2。电子可在证候列表synlist2中去除满足该屏蔽规则2的候选证候,得到证候列表synlist3。可以理解,该证候列表synlist3为当前目标证素组所对应的证候列表。
[0181]
电子设备可在进行了以上筛除(屏蔽)处理之后,再对证候列表synlist3中的各个候选证候进行扣减比例的计算,得到证候列表synlist3中的各个候选证候最终的得分。电子设备可根据证候列表synlist3中的各个候选证候最终的得分,对该synlist3中的所有候选证候进行降序排列,此处不再赘述。
[0182]
可以理解,通过以上过程,每个目标证素组均可得到对应的证候列表synlist3,且各个证候列表synlist3中的候选证候均已根据得分进行了排序。
[0183]
f4、根据各个候选证候的得分及目标证候数量进行筛查,得到至少一个目标证候及各个目标证候的得分。
[0184]
如前文已描述的目标证候数量,限定了每个目标证素组所能够推导出的证候的数量。基于此,电子设备可根据各个候选证候的得分及目标证候数量进行筛查,由此得到至少一个目标证候及各个目标证候的得分,具体为:
[0185]
针对每个目标证素组所对应的证候列表(也即证候列表synlist3),由于该证候列表synlist3中的候选证候已根据得分排序,电子设备可仅保留该证候列表synlist3中,排序靠前的n个候选证候作为目标证候,其中,n表示目标证候数量,由此得到根据该目标证素所得的n个目标证候及各自的得分。
[0186]
电子设备可对已保留的所有的目标证候进行汇总,汇总结果即为推导所得的证候列表。电子设备可以根据各个目标证候的得分,对证候列表中的目标证候重新进行排序,将
得分高的目标证候排至证候列表的前面,将得分低的目标证候排至证候列表的后面。电子设备由此即可按照证候列表中各目标证候的排序构建第二知识图谱。
[0187]
在一些实施例中,考虑到电子设备的显示界面有限,用户可以预先设置一证候推导最大数量和/或证候显示最小得分。如果证候列表中的目标证候过多,其数量大于该证候推导最大数量,则可剔除掉得分少的目标证候,直至该证候列表中的目标证候的数量不大于该证候推导最大数量。类似地,在设置了证候显示最小得分的情况下,如果证候列表中的目标证候过多,则可剔除掉得分小于该证候显示最小得分的目标证素。
[0188]
在一些实施例中,在中医领域,证素和证候存在完全互斥的类型定义,即为对冲类型。在电子设备基于证素来推导证候(也即进行证候推导)时,需要将含其对冲类型的条目清理掉。基于此,医疗知识库中可预设有对冲类型列表,其中,对冲类型列表可定义如下:{类型名称列表|对冲类型名称列表}。仅作为示例,该对冲类型列表可被配置为:{"热","实","表","上","寒","虚","里","下"|"寒","虚","里","下","热","实","表","上"}
[0189]
基于该对冲类型列表,电子设备还可对推导所得的证候列表进行冲突排查处理,具体为:在从医疗知识库中将对冲类型列表读入至缓存后,先根据证素列表中各目标证素的证素名称,在对冲类型列表中查找与任一证素名称相匹配的字符,并将该字符写入字符列表;之后,分别查找该字符列表中的各个字符所对应的对冲类型名称,并写入对冲字符列表;最后根据该对冲字符列表对证候列表进行清理,如果该证候列表中的某个目标证候的证候名称包含有对冲字符列表中的任一字符,则可从该证候列表中清理该目标证候。
[0190]
在一些实施例中,电子设备还可在对证素列表进行分组之后,对特定情况下的病位证素的得分进行处理,其过程具体为:在推导所得的证素列表中,根据各个目标证素的证素分类标志,统计该证素列表中病位证素的数量。若统计所得的病位证素的数量为0,或者该病位证素的数量大于1,则可直接进行证候推导。反之,若统计所得的病位证素的数量为1,则电子设备可根据前文所示出的调整规则,对证素列表中唯一的病位证素的得分进行调整。仅作为示例,根据前文所示例的已被配置的调整规则可知,若该唯一的病位证素的得分《30,则该病位证素的得分可上调10%;若该病位证素的得分《40,则该唯一的病位证素的得分可上调5%。
[0191]
在一些实施例中,电子设备的中医知识库中还可预设有其它词典,该其它词典可包括但不限于如下一种以上:中医治则词典、中药方剂词典及中药词典。
[0192]
仅作为示例,该中医治则词典中的各词条的格式如下:{治则id|治则名称|治则性别|治则最小年龄|治则最大年龄|怀孕标志|治则其它信息}
[0193]
其中,治则id表示治则唯一标识;治则名称表示标准化的中医治则名称;治则性别表示该治则适用的性别,例如0表示男女通用,1表示只适用于男性,2表示只适用于女性;治则最小年龄和治则最大年龄表示该治则适用的年龄范围;怀孕标志表示是否怀孕适用,例如0表示通用,1表示怀孕禁用,2表示怀孕可用;治则其它信息表示与其它该治则相关的信息。
[0194]
仅作为示例,该中药方剂词典中的各词条的格式如下:{方剂id|方剂名称|方剂性别|方剂最小年龄|方剂最大年龄|怀孕标志|方剂其它信息};该中药词典中的各词条的格式如下:{中药id|中药名称|中药性别|中药最小年龄|中药最大年龄|怀孕标志|中药其它信息}。各项内容的释义可参照前文对中医治则词典的词条的各项内容的释义,此处不再赘
述。
[0195]
中医治则词典可用于构建第三知识图谱,中药方剂词典可用于构建第四知识图谱,中药词典可用于构建第五知识图谱。在构建知识图谱前,电子设备可从中医知识库中将对应的词典读入缓存。该第三知识图谱的构建过程具体如下:
[0196]
在已推导得到的证候列表中进行遍历;
[0197]
根据证候的表名“syn”、治则的表名为“tre”和当前遍历的目标证候的证候id,在缓存中的证候和治则的映射关系列表中查找目标治则(也即与该目标证候相关的治则),并按各目标治则在映射关系列表中的排序关系对各目标治则进行排序;
[0198]
以当前遍历的目标证候的证候id为关键值,建立第一关系列表{synid1|trelist1}。其中,synid1是该目标证候的唯一标识(也即该目标证候的证候id),trelist1是与该目标证候相关联的所有治则所构成的治则列表,该治则列表包括治则id和相应的治则名称,且该治则名称是根据该治则id从中医治则词典中重获取而得。
[0199]
以上过程不断重复,直至证候列表中的所有目标证素均被遍历后结束,得到最终的第一关系列表可如下所示:[{synid1|trelist1},{synid2|trelist2},

]。
[0200]
类似地,第四知识图谱及第五知识图谱的构建过程可参照前文所描述的第三知识图谱的构建过程,只是遍历的对象有所变更,读入缓存的映射关系列表有所变更,以及查找对象有所变更,此处不再赘述。电子设备最终得到的第二关系列表可如下所示:[{treid1|prelist1},{treid2|prelist2}

];电子设备最终得到的第三关系列表可如下所示:[{preid1|herlist1},{preid2|herlist2}

]
[0201]
其中,treid是目标治则的唯一标识,prelist是与该目标治则相关联的所有目标中药方剂所构成的中药方剂列表列表,preid是目标中药方剂的唯一标识,herlist是与该目标中药方剂相关联的所有中药所构成的列表。
[0202]
电子设备可根据该第一关系列表构建出第三知识图谱,根据该第二关系列表构建出第四知识图谱,以及根据该第三关系列表,构建出第五知识图谱,此处不再赘述。
[0203]
需要注意的是,与前文所描述的对中医证素词典进行条目剔除处理类似,电子设备在缓存中载入中医治则词典、中药方剂词典及中药词典中的任意词典后,均可根据患者的年龄、性别及孕否等信息对所载入的词典进行条目剔除处理,此处不再赘述。
[0204]
由上可见,本技术实施例,中医长逻辑链推导所得的结果不仅包括目标证素及目标证素,还包括目标证素的得分及目标证候的得分,通过该得分来最终生成动态知识图谱。可以理解,面对不同的临床情况,各目标证素及各目标证候的得分也会有所不同,这可使得知识图谱能够根据临床情况而动态且精准的构建,得到有针对性的动态知识图谱。并且,动态知识图谱的构建过程并不需要人工参与。用户只需提供患者的病历文本,就可通过上述过程自动化构建得到动态知识图谱,非常方便且高效。最终,用户基于构建所得的动态知识图谱,即可实现对自己临床思维的快捷、高效且精准训练。
[0205]
对应于上文所提供的动态知识图谱构建方法,本技术实施例还提供了一种电子设备。请参阅图2,本技术实施例中的电子设备2包括:存储器201,一个或多个处理器202(图2中仅示出一个)及存储在存储器201上并可在处理器上运行的计算机程序。其中:存储器201用于存储软件程序以及单元,处理器202通过运行存储在存储器201的软件程序以及单元,从而执行各种功能应用以及数据处理,以获取上述预设事件对应的资源。具体地,处理器
202通过运行存储在存储器201的上述计算机程序时实现上述方法实施例中的各个步骤,此处不再赘述。
[0206]
应当理解,在本技术实施例中,所称处理器202可以是中央处理单元(central processing unit,cpu),该处理器还可以是其它通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0207]
存储器201可以包括只读存储器和随机存取存储器,并向处理器202提供指令和数据。存储器201的一部分或全部还可以包括非易失性随机存取存储器。例如,存储器201还可以存储设备类别的信息。
[0208]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0209]
可以理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关联的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读存储介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机可读存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。
[0210]
以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:
1.一种动态知识图谱构建方法,其特征在于,包括:根据患者的病历文本,确定针对所述患者的四诊要素集合,所述四诊要素集合包括多个四诊要素,所述四诊要素为从中医四诊的角度描述的所述患者拥有的与疾病相关的特征;基于所述四诊要素集合进行中医长逻辑链推导,通过不同的思维线程表现,并得到至少一个目标证素、各个所述目标证素的得分、与所述目标证素匹配的至少一个目标证候及各个所述目标证候的得分;根据所述四诊要素集合、各个所述目标证素的得分及各个所述目标证候的得分,生成动态知识图谱。2.如权利要求1所述的动态知识图谱构建方法,其特征在于,所述基于所述四诊要素集合进行中医长逻辑链推导,通过不同的思维线程表现,并得到至少一个目标证素、各个所述目标证素的得分、与所述目标证素匹配的至少一个目标证候及各个所述目标证候的得分,包括:基于所述四诊要素集合进行证素推导,得到至少一个目标证素及各个所述目标证素的得分;基于所述至少一个目标证素进行证候推导,得到至少一个目标证候及各个所述目标证候的得分;相应地,所述根据所述四诊要素集合、各个所述目标证素的得分及各个所述目标证候的得分,生成动态知识图谱,包括:根据所述四诊要素集合中的四诊要素与所述目标证素的对应关系,以及各个所述目标证素的得分,生成第一知识图谱;根据所述目标证素与所述目标证候的对应关系,以及各个所述目标证候的得分,生成第二知识图谱。3.如权利要求2所述的动态知识图谱构建方法,其特征在于,所述基于所述四诊要素集合进行证素推导,得到至少一个目标证素及各个所述目标证素的得分,包括:在所述四诊要素集合中进行遍历,确定当前四诊要素;查找与所述当前四诊要素相关联的证素作为目标证素;根据所述当前四诊要素对各所述目标证素分别所处的贡献度等级,更新证素列表;返回执行所述在所述四诊要素集合中进行遍历,确定当前四诊要素的步骤及后续步骤,直至遍历完全;计算最新的证素列表中的各个目标证素的得分。4.如权利要求3所述的动态知识图谱构建方法,其特征在于,所述证素列表以各所述目标证素为关键值;所述证素列表记录了各所述目标证素所分别对应的至少一个要素列表,每个所述要素列表中的四诊要素对对应的目标证素均处于同一个贡献度等级;所述根据所述当前四诊要素对各所述目标证素分别所处的贡献度等级,更新证素列表,包括:在所述当前四诊要素所对应的目标证素中进行遍历,确定当前目标证素;检测所述证素列表中是否存在所述当前目标证素;若所述证素列表中不存在所述当前目标证素,则在所述证素列表中添加所述当前目标证素,并将所述当前四诊要素加入目标要素列表,其中,所述目标要素列表为所述当前四诊
要素对所述当前目标证素所处的贡献度等级所对应的要素列表;若所述证素列表中已存在所述当前目标证素,则检测所述目标要素列表中是否存在所述当前四诊要素;若所述目标要素列表中不存在所述当前四诊要素,则将所述当前四诊要素加入所述目标要素列表。5.如权利要求4所述的动态知识图谱构建方法,其特征在于,所述计算最新的证素列表中的各个目标证素的得分,包括:针对每个所述目标证素,根据与所述目标证素对应的各个要素列表的计分参数,分别计算与所述目标证素对应的各个要素列表的贡献度得分;对与所述目标证素对应的各个要素列表的贡献度得分进行求和,得到贡献度总分;在所述贡献度总分小于预设的贡献度阈值的情况下,确定所述目标证素的得分为所述贡献度总分;在所述贡献度总分大于或等于所述贡献度阈值的情况下,确定所述目标证素的得分为所述贡献度阈值。6.如权利要求2所述的动态知识图谱构建方法,其特征在于,所述基于所述至少一个目标证素进行证候推导,得到至少一个目标证候及各个所述目标证候的得分,包括:分别查找与各个所述目标证素相关联的证候作为候选证候;根据所述候选证候对所述至少一个目标证素进行分组,以根据分组结果确定目标证候数量;分别计算各个所述候选证候的得分;根据各个所述候选证候的得分及所述目标证候数量进行筛查,得到至少一个目标证候及各个所述目标证候的得分。7.如权利要求6所述的动态知识图谱构建方法,其特征在于,所述根据所述候选证候对所述至少一个目标证素进行分组,以根据分组结果确定目标证候数量,包括:将与同一候选证候相关联的目标证素划分至同一组,得到至少一个目标证素组;根据所述目标证素组的数量,确定目标证候数量。8.如权利要求7所述的动态知识图谱构建方法,其特征在于,所述分别计算各个所述候选证候的得分包括:根据所述分组结果确定各个所述候选证候的候选得分;根据各个所述候选证候的名称,确定各个所述候选证候的扣减比例;根据各个所述候选证候的候选得分及各个所述候选证候的扣减比例,确定各个所述候选证候最终的得分。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的方法。

技术总结
本申请公开了一种动态知识图谱构建方法、电子设备及计算机可读存储介质。该方法包括:根据患者的病历文本,确定针对所述患者的四诊要素集合,所述四诊要素集合包括多个四诊要素,所述四诊要素为从中医四诊的角度描述的所述患者拥有的与疾病相关的特征;基于所述四诊要素集合进行中医长逻辑链推导,通过不同的思维线程表现,并得到至少一个目标证素、各个所述目标证素的得分、与所述目标证素匹配的至少一个目标证候及各个所述目标证候的得分;根据所述四诊要素集合、各个所述目标证素的得分及各个所述目标证候的得分,生成动态知识图谱。通过本申请方案可获得基于临床情况动态变化的知识图谱,由此实现针对中医的快捷、高效且精准的临床思维训练。精准的临床思维训练。精准的临床思维训练。


技术研发人员:李科威
受保护的技术使用者:科凌力智能医学软件(深圳)有限公司
技术研发日:2023.04.17
技术公布日:2023/7/25
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐