数据检索方法、装置、电子设备和存储介质与流程

未命名 07-20 阅读:95 评论:0


1.本技术涉及数据检索技术领域,尤其涉及一种数据检索方法、装置、电子设备和存储介质。


背景技术:

2.电子健康档案是人们在健康相关活动中直接形成的具有保存备查价值的电子化历史记录。基于电子健康档案,人们能够检索到各阶段的健康数据,满足居民健康管理、健康决策及自我保健的需求。因此,如何提高健康数据检索速度,进一步提升人们的使用体验,是本领域技术人员亟待解决的技术问题。


技术实现要素:

3.有鉴于此,本技术提出一种数据检索方法、装置、电子设备和存储介质,以解决现有技术中检索效率较低的问题。
4.本技术提出的技术方案具体如下:
5.一方面,本技术提供了一种数据检索方法,包括:
6.获取检索信息;
7.通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,所述数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息;
8.根据所述检索信息,输出所述目标用户的健康摘要信息,和/或,输出与所述目标用户的健康摘要信息对应的健康数据中的数据。
9.进一步的,以上所述的方法中,通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息,包括:
10.根据所述检索信息,从所述数据库中检索得到与所述检索信息匹配的多个用户的健康摘要信息;
11.通过计算所述检索信息与检索得到的每个用户的健康摘要信息之间的相似度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
12.进一步的,以上所述的方法中,通过计算所述检索信息与所述多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息,包括:
13.通过计算所述检索信息与所述多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,以及所述多个用户的健康摘要信息中每个用户的健康摘要信息的数据完整度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
14.进一步的,以上所述的方法中,所述数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;
15.获取检索信息之后,还包括:将所述检索信息的格式转换为嵌套查询语句;所述嵌套查询语句包括主索引摘要信息查询语句和嵌套索引摘要信息查询语句。
16.进一步的,以上所述的方法中,所述数据库的构建方法,包括:
17.从多个健康数据平台中获取用户的健康数据,并从用户的健康数据中提取健康摘要信息;
18.将用户的健康数据、健康摘要信息,以及用户的健康数据与健康摘要信息的关联关系存储于所述数据库中;
19.其中,所述数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;所述主索引摘要信息包括用户的就诊记录摘要和个人信息摘要;所述嵌套索引摘要信息包括用户的诊断信息摘要、手术信息摘要、检查信息摘要、检验信息摘要和门诊处方信息摘要。
20.进一步的,以上所述的方法中,从多个健康数据平台中获取用户的健康数据,包括:
21.从多个健康数据平台中获取健康数据;
22.通过建立患者全局唯一标识,将从多个健康数据平台中获取的相同用户的健康数据关联在一起。
23.进一步的,以上所述的方法中,从用户的健康数据中提取健康摘要信息包括:
24.从所述用户的健康数据中提取用户的摘要数据;
25.按照标准医院术语对所述摘要数据进行转换,得到所述用户的健康摘要信息。
26.另一方面,本技术还提供了一种数据检索装置,包括:
27.获取模块,用于获取检索信息;
28.确定模块,用于通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,所述数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息;
29.输出模块,用于根据所述检索信息,输出所述目标用户的健康摘要信息,和/或,输出与所述目标用户的健康摘要信息对应的健康数据中的数据。
30.另一方面,本技术还提供了一种电子设备,包括:
31.存储器和处理器;
32.其中,所述存储器用于存储程序;
33.所述处理器,用于通过运行所述存储器中的程序,实现以上任意一项所述的方法。
34.另一方面,本技术还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现以上任意一项所述的方法。
35.本技术提出的数据检索方法,能够获取检索信息,通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息。根据检索信息,输出目标用户的健康摘要信息,和/或,输出目标用户的健康数据中的数据。本技术的实施例中,从健康数据中提取健康摘要信息,通过比对检索信息与数据库中用户的健康摘要信息之间的相似度即可以确定目标用户的健康摘要信息,不需要比对检索信息与健康数据,有效提高了检索速度,进而在一定程度上提升了用户体验。
附图说明
36.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
37.图1是本技术实施例提供的一种数据检索方法的流程示意图;
38.图2是本技术实施例提供的一种数据检索模型的结构示意图;
39.图3是本技术实施例提供的一种构建数据库的流程示意图;
40.图4是本技术实施例提供的一种数据检索装置的结构示意图;
41.图5是本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
42.申请概述
43.本技术实施例技术方案适用于数据检索的应用场景,采用本技术实施例技术方案,能够提高健康数据检索速度,进一步提升人们的使用体验。
44.电子健康档案(electronic health r ecords,ehr)是人们在健康相关活动中直接形成的具有保存备查价值的电子化历史记录。电子健康档案也称为电子健康记录,即电子化的健康档案,是关于医疗保健对象健康状况的信息资源库,该信息资源库以计算机可处理的形式存在,并且能够安全地存储和传输,各级授权用户均可访问。
45.电子健康档案以人的健康为中心,以生命阶段健康和疾病问题、卫生服务活动作为三个维度构建一个逻辑架构。通过电子健康档案,能够展示整合后的医疗保健对象的卫生信息,包括诊疗数据和公共卫生数据等,使医疗保健对象在进行诊疗时,授权就诊医生查阅自己的电子健康档案及历史诊疗信息,从而使就诊医生更好地为居民服务;医疗保健对象也能通过移动端app查阅自己的电子健康档案数据。
46.但是,由于电子健康档案的数据量大,在检索过程中检索引擎需要从海量的数据中检索到所需的检索目标,检索速度较慢,影响用户体验。基于此,本技术提出一种数据检索方法、装置、电子设备和存储介质,该技术方案能够根据用户的健康数据生成健康摘要信息,通过比对检索信息与数据库中用户的健康摘要信息之间的相似度即可以确定目标用户的健康摘要信息,不需要比对检索信息与健康数据,需要处理的数据量减少,进而有效提高了检索速度,在一定程度上提升了用户体验。
47.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
48.示例性方法
49.本技术实施例提出一种数据检索方法,该方法可以由电子设备执行,该电子设备可以是任意的具有数据及指令处理功能的设备,例如可以是计算机、智能终端、服务器等。参见图1所示,该方法包括:
50.s101、获取检索信息。
51.上述检索信息指的是检索者输入的检索条件。一些实施例中,检索条件包括检索者在检索时输入的具体内容,例如检索对象的名字、身份证号、健康状态等。此外,为了获取更加精确的检索结果,检索条件还可以包括检索维度,例如患者基本信息、诊断信息、症状信息、病历信息、手术信息、检查信息、检验信息、处方信息等维度。检索者可以输入具体的内容,同时选择检索维度,以便于获取更加在该维度上更加精确的检索结果。一些实施例中,检索条件还可以是多主题多类型输入组合条件,例如字符串匹配、数值比较、日期范围查找等。
52.上述检索者指的是利用电子健康档案进行查询的主体。例如,在医疗保健对象在进行诊疗,授权就诊医生查阅自己的电子健康档案及历史诊疗信息时,该医生则为检索者;医疗保健对象查阅自己的电子健康档案数据时,该医疗保健对象为检索者。
53.本技术的实施例中,先获取检索信息,以便于根据检索信息在电子健康档案中进行检索,获取检索者所需的数据。
54.s102、通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息。
55.上述数据库是预先构建的、用于存储用户的健康数据以及与健康数据对应的健康摘要信息的数据库。
56.其中,健康数据指的是在构建电子健康档案时,从多个医疗机构获取到的用户的电子诊疗记录、公共卫生记录等数据。健康数据包括医疗事件中基础数据、门急诊数据、住院数据、医技数据、体检数据、公共卫生数据等维度。基础数据可以包括用户的个人基本信息数据、医疗机构数据、科室数据、卫生人员数据、药品数据等,门急诊数据可以包括门急诊病历数据、门急诊处方数据等,住院数据可以包括病案首页数据、医嘱数据、电子病历数据等,医技数据可以包括检查数据、检验数据、病理数据、心电数据、危急值数据等。一些实施例中,在存储用户的健康数据时,可以以用户为单位按照不同的维度进行存储。
57.健康摘要信息是从健康数据中提取得到。具体地,可以根据实际情况,从健康数据中提取能够作为检索条件的数据字段作为健康摘要信息。健康摘要信息可以同步到搜索引擎检索服务器中,以便于后期进行检索。一些实施例中,可以将健康摘要信息同步到分布式搜索引擎检索服务器中,以便于基于分布式搜索引擎进行数据的检索,提高检索速度。
58.本实施例中,将用户的健康数据以及与健康数据对应的健康摘要信息存储于数据库中。
59.在根据上述检索信息进行检索时,一些实施例中,可以通过计算检索信息与数据库中各个用户的健康摘要信息之间的相似度,从各个用户的健康摘要信息中确定出目标用户的健康摘要信息,以避免出现漏检索的情况,提高检索结果的准确性。
60.另外一些实施例中,还可以仅检索部分用户的健康摘要信息,即通过计算检索信息与该部分用户的健康摘要信息之间的相似度,从该部分用户的健康摘要信息中确定出目标用户的健康摘要信息,以进一步提高检索速度。其中,在仅检索部分用户的健康摘要信息时,为了在最大程度上避免出现漏检的情况,可以事先根据所述地域不同将用户的健康数据以及与健康数据对应的健康摘要信息分为多个部分,在获取检索信息时,可以同时获取检索目标的地域,以便于从与检索目标地域相同的部分用户的健康摘要信息中,确定出目标用户的健康摘要信息。
61.本实施例通过比对检索信息与数据库中用户的健康摘要信息之间的相似度即可以确定目标用户的健康摘要信息,不需要比对检索信息与健康数据,需要处理的数据量减少,进而有效提高了检索速度。
62.s103、根据检索信息,输出目标用户的健康摘要信息,和/或,输出与目标用户的健康摘要信息对应的健康数据中的数据。
63.确定目标用户的健康摘要信息后,可以根据检索信息,输出目标用户的健康摘要信息,和/或目标用户的健康数据中的数据。而具体输出的是目标用户的健康摘要信息中的数据还是目标用户的健康数据中的数据,可以根据输入的检索信息确定。
64.具体的,若根据检索信息确定的需要检索的内容包含在目标用户的健康摘要信息中,则可以仅输出健康摘要信息中相关的数据;若根据检索信息确定的需要检索的内容未包含在健康摘要信息中,则需要根据健康摘要信息确定对应的健康数据,然后输出健康数据中相关的数据;若根据检索信息确定的需要检索的内容有一部分包含在健康摘要信息中,一部分未包含在健康摘要信息中,则可以同时返回目标用户的健康摘要信息和健康数据中的数据,本实施例不做限定。
65.示例性的,若检索者输入检索信息的目的是查询某一用户的手术信息,并在根据各个用户的健康数据生成的健康摘要信息中包含用户的手术信息,那么则可以根据检索信息确定目标用户的健康摘要信息后,仅返回目标用户的健康摘要信息中手术信息的部分内容即可。
66.又一示例性的,若检索者输入检索信息的目的是查询某一用户的详细检验信息,并在根据各个用户的健康数据生成的健康摘要信息中未包含用户的详细检验信息,那么则可以根据检索信息确定目标用户的健康摘要信息后,需要确定目标用户的健康数据,从目标用户的健康数据中选择该用户的详细检验信息并输出。
67.以上实施例中,能够获取检索信息,通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息。根据检索信息,输出目标用户的健康摘要信息,和/或,输出目标用户的健康数据中的数据。本技术的实施例中,从健康数据中提取健康摘要信息,通过比对检索信息与数据库中用户的健康摘要信息之间的相似度即可以确定目标用户的健康摘要信息,不需要比对检索信息与健康数据,有效提高了检索速度,进而在一定程度上提升了用户体验。
68.作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的步骤通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息,具体可以包括如下步骤:
69.根据检索信息,从数据库中检索得到与检索信息匹配的多个用户的健康摘要信息;通过计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
70.本实施例中,在进行检索时,先根据检索信息,从数据库中检索得到与检索信息匹配的多个用户的健康摘要信息,然后再从上述多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
71.具体地,在获取到检索信息后,可以利用分布式搜索引擎对健康摘要信息进行全
文的初步检索,从分布式搜索引擎聚合结果中获取与检索信息匹配的多个用户的健康摘要信息。需要说明的是,本实施例的全文初步检索可以采用速度较快的检索方式,快速地从分布式搜索引擎聚合结果中获取与检索信息匹配的多个用户的健康摘要信息。例如,可以采用词频-逆向文件频率(term frequency

inverse document frequency,tf-idf)算法进行检索,选择tf-idf值大于设定值的健康摘要信息为与检索信息匹配的健康摘要信息。
72.可以分别计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度,将相似度最高的健康摘要信息确定为目标用户的健康摘要信息;或者,还可以将相似度值大于设定相似度值的多个健康摘要信息确定为目标用户的健康摘要信息。需要说明的是,若存在多个目标用户的健康摘要信息,则可以按照相似度数值降序的方式输出多个目标用户的健康摘要信息和/或健康数据中的数据,即,优先输出相似度更高的目标用户的健康摘要信息和/或健康数据中的数据。
73.计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度时,可以采用bm25等算法,本实施例不做限定。
74.以上实施例中,先快速从数据库中检索得到与检索信息匹配的多个用户的健康摘要信息,然后再从上述多个用户的健康摘要信息中确定出目标用户的健康摘要信息,能够有效提高检索速度,实现提高用户体验的目的。
75.作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的步骤通过计算检索信息与多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息,具体可以包括如下步骤:
76.通过计算检索信息与多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,以及多个用户的健康摘要信息中每个用户的健康摘要信息的数据完整度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
77.在从健康数据中提取得到健康摘要信后,可以计算并存储健康摘要信息的完整度。然后根据检索信息与多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,以及多个用户的健康摘要信息中每个用户的健康摘要信息的数据完整度确定出目标用户的健康摘要信息。
78.计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度时,可以采用bm25算法, 公式如下:
[0079][0080]
其中,score(d,q)表示用户输入q与文档d的相关性得分;
[0081]
idf(qi)表示关键字qi的逆文档频值,
[0082]
n表示全部文档的个数;
[0083]
n(qi)表示包含关键词qi所有文档的个数;
[0084]
f(qi,d)表示关键词qi在文档d中的频数;
[0085]
avgdl表示文档平均token个数,即全部文档包含的token个数总和除以总文档数;
[0086]
|d|表示文档d包含的token个数;
[0087]
k1表示超参数,该值越小,大词频的词对整体得分的贡献就越会被抑制,默认值为1.2;
[0088]
b表示超参数,该值越大,包含相同多关键词qi情况下,文档得分越短得分越高,若该值为0,b的默认值是0.75。
[0089]
一些实施例中,可以将多个用户的健康摘要信息中,与检索信息的相似度大于设定相似度值,以及数据完整度大于设定数据完整度值的健康摘要信息确定为目标用户的健康摘要信息。上述设定相似度值和设定数据完整度值可以根据实际情况进行设置,本实施例不做限定。
[0090]
以上实施例中,通过与检索信息的相似度以及健康摘要信息的完整度确定目标用户的健康摘要信息,能够进一步提高目标用户的健康摘要信息的准确性。
[0091]
作为一种可选的实现方式,在本技术另一实施例中公开了,数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息,以上实施例的步骤获取检索信息之后,具体还可以包括如下步骤:
[0092]
将检索信息的格式转换为嵌套查询语句。
[0093]
数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息。一些实施例中,数据库中各个用户的健康摘要信息均包括主索引摘要信息和嵌套索引摘要信息。进一步的,本实施例中以嵌套索引的方式建立检索模型,将健康摘要信息同步到分布式搜索引擎检索服务器。其中,主索引摘要信息包括用户的就诊记录摘要和个人信息摘要;嵌套索引摘要信息包括用户的诊断信息摘要、手术信息摘要、检查信息摘要、检验信息摘要和门诊处方信息摘要,检索模型的逻辑图如图2所示。
[0094]
如图2所示,“患者基本信息”模块是对“患者事件表”模块的字段补充,“患者基本信息”模块与“患者事件表”模块中存储的是主索引摘要信息中的字段。下一层的“检查记录”模块、“检验记录”模块、“手术记录”模块等,存储的是嵌套索引摘要信息。其中,“检查记录”模块用于存储检查信息摘要,“检验记录”模块用于存储检验信息摘要,“手术记录”模块用于存储手术信息摘要,此外,该层还可以包括其他模块用于存储用户的诊断信息摘要和门诊处方信息摘要等,本实施例不做限定。
[0095]
进一步的,主套索引摘要信息可以设置为josn摘要格式,嵌套索引摘要信息可以设置为josn数组格式,本实施例不做限定。
[0096]
在进行检索之前,本实施例中先对检索信息进行格式转换处理,将检索信息拼装成主索引和嵌套索引对应的分布式搜索引擎嵌套查询语句,从分布式搜索引擎检索服务器聚合结果中获取中确定出目标用户的健康摘要信息。
[0097]
作为一种可选的实现方式,如图3所示,在本技术另一实施例中公开了,以上实施例的数据库的构建步骤,包括:
[0098]
s301、从多个健康数据平台中获取用户的健康数据,并从用户的健康数据中提取健康摘要信息;
[0099]
s302、将用户的健康数据、健康摘要信息,以及用户的健康数据与健康摘要信息的关联关系存储于数据库中。
[0100]
具体的,本实施例中可以采集各等级医院、基层医疗机构等多个健康数据平台的居民诊疗记录和公共卫生系统记录作为健康数据。然后从用户的健康数据中提取健康摘要
信息,同时建立相同用户健康数据与健康摘要信息之间的关联关系,将用户的健康数据、健康摘要信息,以及用户的健康数据、健康摘要信息的关联关系存储于数据库中。
[0101]
一些实施例中,上述数据库中至少包括两个子数据库,一个子数据库用于存储用户的健康数据,另一个数据库用于存储用户的健康摘要信息。
[0102]
以上实施例中,从健康数据中提取健康摘要信息,在检索时不需要比对检索信息与健康数据,需要处理的数据量减少,进而有效提高了检索速度,在一定程度上提升了用户体验。
[0103]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的步骤从多个健康数据平台中获取用户的健康数据,具体包括如下步骤:
[0104]
从多个健康数据平台中获取健康数据;通过建立患者全局唯一标识,将从多个健康数据平台中获取的相同用户的健康数据关联在一起。
[0105]
具体的,本实施例中可以采集各等级医院、基层医疗机构等多个健康数据平台的居民诊疗记录和公共卫生系统记录作为健康数据,然后建立患者全局唯一标识,利用患者全局唯一表示将相同用户的健康数据关联到一起。一些实施例中,可以采用患者主索引(enterprise master patient index,empi)作为患者全局唯一标识。
[0106]
具体的,不同医疗机构中,相同用户的本地标识可能并不相同,本技术的实施例中通过构建患者全局唯一标识关联不同医疗机构的用户本地标识,实现利用患者全局唯一表示将相同用户的健康数据关联到一起的目的。
[0107]
以上实施例中,通过设置患者全局唯一标识,将多个健康数据平台有效的关联在一起。以实现多个健康数据平台之间的互联互通,保证对同一个用户,分布在不同健康数据平台中的个人信息采集的完整性和准确性。
[0108]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的步骤从用户的健康数据中提取健康摘要信息,具体包括如下步骤:
[0109]
从用户的健康数据中提取用户的摘要数据;按照标准医院术语对摘要数据进行转换,得到用户的健康摘要信息。
[0110]
具体的,本技术的实施例中,可以根据实际情况,从健康数据中提取能够作为检索条件的数据字段作为摘要数据。然后按照标准医院术语对摘要数据进行转换,一些实施例中,按照标准医院术语对摘要数据进行转换包括标准化处理和语义化处理。
[0111]
其中,标准化处理指的是基于医学术语标准字典对摘要数据进行标准化。对于手写数据,可以不做处理,也可以将手写数据进行文本转换之后再进行标准化处理,本实施例不做限定。语义化处理指的是对标准化后的摘要数据重新组合为自定义结构,提供给引擎进行分词和索引,转为软件便于识别和处理的格式。
[0112]
以上实施例中,通过按照标准医院术语对摘要数据进行转换,在数据层面屏蔽原始数据差异,提供数据统一分析的可能,还可以减少必要信息存储,提升检索性能。
[0113]
在一个具体的实施例中,可以预先采集各等级医院、基层医疗机构等数据源的居民诊疗记录和公共卫生系统记录作为健康数据,依托医疗事件中基础数据、门急诊数据、住院数据、医技数据、体检数据、公卫数据等,以用户为中心建立电子健康档案的数据库。从健康数据中提取健康摘要信息一并存储于数据库中。
[0114]
通过引用empi将同一用户的所有数据关联。具体来说,本实施例中,从病案首页、
就诊记录、体检报告、健康档案封面中提取患者基本信息,基于患者基本信息识别用户实体与用户本地标识,通过empi将所有区域数据相同用户的用户本地标识关联起来。
[0115]
然后以嵌套索引的方式建立检索模型,将健康摘要信息同步到分布式搜索引擎检索服务器。其中,以用户的就诊记录摘要和个人信息摘要作为主索引,以用户的诊断信息摘要、手术信息摘要、检查信息摘要、检验信息摘要和门诊处方信息摘要等记录作为嵌套索引。
[0116]
检索者在检索时,可以从患者基本信息、诊断信息、症状信息、病历信息、手术信息、检查信息、检验信息、处方信息等多维度条件选择一个或多个。本实施例中,将输入的检索信息拼装成主索引和嵌套索引对应的分布式搜索引擎嵌套查询语句,从分布式搜索引擎聚合结果中获取与检索信息匹配多个健康摘要信息对应的empi。
[0117]
根据检索信息与多个健康摘要信息中每个健康摘要信息之间的相似度,以及多个健康摘要信息中每个健康摘要信息的数据完整度,从多个健康摘要信息对应的empi中确定出目标用户的健康摘要信息对应的empi。
[0118]
若根据检索信息可以确定目标用户的健康摘要信息能够满足检索者的检索要求,则可以返回健康摘要信息中相关的内容。若根据检索信息确定目标用户的健康摘要信息无法满足检索者的检索要求,则可以进一步返回健康数据中的相关内容。
[0119]
需要说明的是,由于居民搬迁到新地区会在新地方建档(激活),旧档案会迁移(废弃),因此返回健康数据中的相关内容时,需要通过目标用户的empi检索当前激活的健康数据。
[0120]
以上实施例提供的检索方法,能够在保障算法准确性的前提下,避免了大规模数据匹配,适合大规模生产使用。全量3600万明细数据基础上,混合场景检索下平均响应时间小于900ms。通过患者全局唯一标识打通区域内各医疗机构数据,建立并维护统一的区域电子健康档案库,数据可扩展性强。通过分布式搜索引擎嵌套索引检索模型设计,巧妙分两步检索解决大数据量下关系型数据库联表查询性能问题,系统稳定性强。
[0121]
示例性装置
[0122]
与上述数据检索方法相对应的,本技术实施例还公开了一种数据检索装置,参见图4所示,该装置包括:
[0123]
获取模块100,用于获取检索信息;
[0124]
确定模块110,用于通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息;
[0125]
输出模块120,用于根据检索信息,输出目标用户的健康摘要信息,和/或,输出与目标用户的健康摘要信息对应的健康数据中的数据。
[0126]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的确定模块110,具体可以包括:
[0127]
匹配单元,用于根据检索信息,从数据库中检索得到与检索信息匹配的多个用户的健康摘要信息;
[0128]
确定单元,用于通过计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
[0129]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的确定单元,在通过计算检索信息与检索得到的每个用户的健康摘要信息之间的相似度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息时,具体用于通过计算检索信息与多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,以及多个用户的健康摘要信息中每个用户的健康摘要信息的数据完整度,从多个用户的健康摘要信息中确定出目标用户的健康摘要信息。
[0130]
作为一种可选的实现方式,在本技术另一实施例中公开了,数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;
[0131]
以上实施例的装置还包括:
[0132]
转换模块,用于在获取检索信息之后,将检索信息的格式转换为嵌套查询语句;嵌套查询语句包括主索引摘要信息查询语句和嵌套索引摘要信息查询语句。
[0133]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的装置还包括:
[0134]
构建模块,用于从多个健康数据平台中获取用户的健康数据,并从用户的健康数据中提取健康摘要信息;
[0135]
将用户的健康数据、健康摘要信息,以及用户与用户的健康数据、健康摘要信息的关联关系存储于数据库中;
[0136]
其中,数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;主索引摘要信息包括用户的就诊记录摘要和个人信息摘要;嵌套索引摘要信息包括用户的诊断信息摘要、手术信息摘要、检查信息摘要、检验信息摘要和门诊处方信息摘要。
[0137]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的构建模块,在从多个健康数据平台中获取用户的健康数据,并从用户的健康数据中提取健康摘要信息时,具体用于:
[0138]
从多个健康数据平台中获取健康数据;
[0139]
通过建立患者全局唯一标识,将从多个健康数据平台中获取的相同用户的健康数据关联在一起。
[0140]
作为一种可选的实现方式,在本技术另一实施例中公开了,以上实施例的构建模块,在从用户的健康数据中提取健康摘要信息包括时,具体用于:
[0141]
从用户的健康数据中提取用户的摘要数据;
[0142]
按照标准医院术语对摘要数据进行转换,得到用户的健康摘要信息。
[0143]
具体地,上述的数据检索装置的各个单元的具体工作内容,请参见上述方法实施例的内容,此处不再赘述。
[0144]
示例性电子设备、存储介质和计算产品
[0145]
与上述数据检索方法相对应的,本技术实施例还公开了一种电子设备,参见图5所示,该电子设备包括:
[0146]
存储器200和处理器210;
[0147]
其中,存储器200与处理器210连接,用于存储程序;
[0148]
处理器210,用于通过运行存储器200中存储的程序,实现上述任一实施例公开的数据检索方法。
[0149]
具体地,上述电子设备还可以包括:总线、通信接口220、输入设备230和输出设备240。
[0150]
处理器210、存储器200、通信接口220、输入设备230和输出设备240通过总线相互连接。其中:
[0151]
总线可包括一通路,在计算机系统各个部件之间传送信息。
[0152]
处理器210可以是通用处理器,例如通用中央处理器(cpu)、微处理器等,也可以是特定应用集成电路(application-specific integrated circuit,asic),或一个或多个用于控制本技术方案程序执行的集成电路。还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0153]
处理器210可包括主处理器,还可包括基带芯片、调制解调器等。
[0154]
存储器200中保存有执行本技术技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器200可以包括只读存储器(read-only memory,rom)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,ram)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。
[0155]
输入设备230可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。
[0156]
输出设备240可包括允许输出信息给用户的装置,例如显示屏、打印机、扬声器等。
[0157]
通信接口220可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(ran),无线局域网(wlan)等。
[0158]
处理器210执行存储器200中所存放的程序,以及调用其他设备,可用于实现本技术上述实施例所提供的数据检索方法的各个步骤。
[0159]
除了上述方法和设备以外,本技术的实施例还可以是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器210运行时使得处理器210执行上述实施例所提供的数据检索方法的各个步骤。
[0160]
计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本技术实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行,或者完全在远程计算设备或服务器上执行。
[0161]
此外,本技术的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器210执行上述实施例所提供的数据检索方法的各个步骤。
[0162]
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线,或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储
器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件,或者上述的任意合适的组合。
[0163]
具体的,上述的电子设备、计算机程序产品和存储介质的各个部分的具体工作内容,以及计算机程序产品或者上述的存储介质上的计算机程序被处理器运行时的具体处理内容,均可以参见上述的数据检索方法的各个实施例的内容,此处不再赘述。
[0164]
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必需的。
[0165]
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
[0166]
本技术各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,各实施例中记载的技术特征可以进行替换或者组合。
[0167]
本技术各实施例中装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
[0168]
本技术所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其他的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其他的形式。
[0169]
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
[0170]
另外,在本技术各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
[0171]
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0172]
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件单元,或者二者的结合来实施。软件单元可以置于随机存储器(ram)、内存、只读存
储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其他形式的存储介质中。
[0173]
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0174]
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本技术。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其他实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

技术特征:
1.一种数据检索方法,其特征在于,包括:获取检索信息;通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,所述数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息;根据所述检索信息,输出所述目标用户的健康摘要信息,和/或,输出与所述目标用户的健康摘要信息对应的健康数据中的数据。2.根据权利要求1所述的方法,其特征在于,通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息,包括:根据所述检索信息,从所述数据库中检索得到与所述检索信息匹配的多个用户的健康摘要信息;通过计算所述检索信息与检索得到的每个用户的健康摘要信息之间的相似度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息。3.根据权利要求2所述的方法,其特征在于,通过计算所述检索信息与所述多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息,包括:通过计算所述检索信息与所述多个用户的健康摘要信息中每个用户的健康摘要信息之间的相似度,以及所述多个用户的健康摘要信息中每个用户的健康摘要信息的数据完整度,从所述多个用户的健康摘要信息中确定出目标用户的健康摘要信息。4.根据权利要求1所述的方法,其特征在于,所述数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;获取检索信息之后,还包括:将所述检索信息的格式转换为嵌套查询语句;所述嵌套查询语句包括主索引摘要信息查询语句和嵌套索引摘要信息查询语句。5.根据权利要求1所述的方法,其特征在于,所述数据库的构建方法,包括:从多个健康数据平台中获取用户的健康数据,并从用户的健康数据中提取健康摘要信息;将用户的健康数据、健康摘要信息,以及用户的健康数据与健康摘要信息的关联关系存储于所述数据库中;其中,所述数据库中用户的健康摘要信息包括主索引摘要信息和嵌套索引摘要信息;所述主索引摘要信息包括用户的就诊记录摘要和个人信息摘要;所述嵌套索引摘要信息包括用户的诊断信息摘要、手术信息摘要、检查信息摘要、检验信息摘要和门诊处方信息摘要。6.根据权利要求5所述的方法,其特征在于,从多个健康数据平台中获取用户的健康数据,包括:从多个健康数据平台中获取健康数据;通过建立患者全局唯一标识,将从多个健康数据平台中获取的相同用户的健康数据关联在一起。7.根据权利要求5所述的方法,其特征在于,从用户的健康数据中提取健康摘要信息包
括:从所述用户的健康数据中提取用户的摘要数据;按照标准医院术语对所述摘要数据进行转换,得到所述用户的健康摘要信息。8.一种数据检索装置,其特征在于,包括:获取模块,用于获取检索信息;确定模块,用于通过计算所述检索信息与数据库中用户的健康摘要信息之间的相似度,从所述用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,所述数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息;输出模块,用于根据所述检索信息,输出所述目标用户的健康摘要信息,和/或,输出与所述目标用户的健康摘要信息对应的健康数据中的数据。9.一种电子设备,其特征在于,包括:存储器和处理器;其中,所述存储器用于存储程序;所述处理器,用于通过运行所述存储器中的程序,实现如权利要求1至7中任意一项所述的方法。10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1至7中任意一项所述的方法。

技术总结
本申请提出一种数据检索方法、装置、电子设备和存储介质,能够获取检索信息,通过计算检索信息与数据库中用户的健康摘要信息之间的相似度,从用户的健康摘要信息中确定出目标用户的健康摘要信息;其中,数据库中存储有用户的健康数据以及与健康数据对应的健康摘要信息。根据检索信息,输出目标用户的健康摘要信息,和/或,输出目标用户的健康数据中的数据。本申请的实施例中,从健康数据中提取健康摘要信息,通过比对检索信息与数据库中用户的健康摘要信息之间的相似度即可以确定目标用户的健康摘要信息,不需要比对检索信息与健康数据,有效提高了检索速度,进而在一定程度上提升了用户体验。提升了用户体验。提升了用户体验。


技术研发人员:王勇 刘壮 叶鹏 黄发 肖桥
受保护的技术使用者:讯飞医疗科技股份有限公司
技术研发日:2023.03.06
技术公布日:2023/7/19
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐