一种电子病历的质控方法、装置、存储介质及电子设备与流程

未命名 08-13 阅读:133 评论:0


1.本说明书涉及医疗技术领域,尤其涉及一种电子病历的质控方法、装置、存储介质及电子设备。


背景技术:

2.随着信息化技术的发展,电子病历逐渐取代了纸质电子病历。电子病历是指医务人员在医疗活动过程中,使用信息系统生成的文字、符号、图表、图形、数字、影像等数字化信息来能实现存储、管理、传输和重现的医疗记录。电子病历是病历的一种记录形式,包括门(急)诊病历和住院病历。它包含了患者的个人资料,病史,主客观陈述,病程记录等内容,不仅给患者的治疗带来便捷性,对科研和教学有重大的应用价值,在整个医学领域都发挥了不可替代的作用。而随着病历数据的应用价值被逐渐挖掘与利用,电子病历的数据质量问题则日益突显,改善电子病历的质量问题迫在眉睫。
3.现有技术中改善电子病历的质量问题的方法:先对医疗文本进行结构化和关键字段提取,生成电子病历,然后,对大批量的电子病历中的数据进行人工抽检,对错误的数据进行溯源和更正。
4.然而,由于电子病历的量比较大,人工抽检无法保证质控效率和质量,而且从发现电子病历中数据存在错误到对错误的数据进行更正的过程是存在时间差的,这就可能影响科研的完成度,甚至造成无法挽回的诊疗差错,并且人工抽检的方法无法保证医学用语的规范性和准确性。


技术实现要素:

5.本说明书实施例提供一种电子病历的质控方法、装置、存储介质及电子设备,以部分解决上述现有技术存在的问题。
6.本说明书实施例采用下述技术方案:本说明书提供的一种电子病历的质控方法,包括:实时获取用户输入的病历文本;根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略;基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段;基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语;根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。
7.可选地,基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的
关键字段,具体包括:若针对所述病历文本的质控策略为第一质控策略,则通过序列标注模型,对所述病历文本进行关键字段提取,得到待质控的关键字段;若针对所述病历文本的质控策略为第二质控策略,则将所述病历文本确定为待质控的关键字段。
8.可选地,根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语,具体包括:若针对所述病历文本的质控策略为第一质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的第一相似度;根据该候选标准医学术语的上下文信息与所述关键字段的上下文信息,确定该候选标准医学术语与所述关键字段之间的第二相似度;根据所述第一相似度和所述第二相似度,确定该候选标准医学术语与所述关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度;根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。
9.可选地,基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:基于所述目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
10.可选地,所述方法还包括:若根据每个候选标准医学术语对应的综合相似度无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,则对所述关键字段进行拆分,得到所述关键字段对应的关键词;根据预先保存的各标准医学术语各自对应的关键词,从所述各标准医学术语中选择出目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
11.可选地,根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语,具体包括:若针对所述病历文本的质控策略为第二质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的余弦相似度,作为该候选标准医学术语对应的余弦相似度;根据每个候选标准医学术语对应的余弦相似度,从各候选标准医学术语中选择出
余弦相似度大于预设阈值的候选标准医学术语,作为目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本进行替换,得到质控后的病历文本。
12.可选地,将所述目标标准医学术语展示给所述用户,以使所述用户进行选择,具体包括:基于历史上输入的历史病历文本,统计出与所述病历文本相匹配的目标标准医学术语历史上出现的次数;将所述次数以及所述目标标准医学术语展示给所述用户,以使所述用户进行选择。
13.可选地,所述方法还包括:在获取到所述用户输入的全部病历文本之后,根据预设的检测规则,对由所述全部病历文本构成的电子病历进行异常检测,得到检测结果;根据检测结果,对所述电子病历中的病历文本进行异常标注。
14.本说明书提供的一种电子病历的质控装置,包括:获取模块,用于实时获取用户输入的病历文本;质控策略确定模块,用于根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略;关键字段确定模块,用于基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段;选择候选标准医学术语模块,用于基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语;选择目标标准医学术语模块,用于根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语;质控模块,用于基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。
15.可选地,所述关键字段确定模块,具体用于若针对所述病历文本的质控策略为第一质控策略,则通过序列标注模型,对所述病历文本进行关键字段提取,得到待质控的关键字段;若针对所述病历文本的质控策略为第二质控策略,则将所述病历文本确定为待质控的关键字段。
16.可选地,所述选择目标标准医学术语模块,具体用于若针对所述病历文本的质控策略为第一质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的第一相似度;根据该候选标准医学术语的上下文信息与所述关键字段的上下文信息,确定该候选标准医学术语与所述关键字段之间的第二相似度;根据所述第一相似度和所述第二相似度,确定该候选标准医学术语与所述关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相
似度;根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。
17.可选地,所述质控模块,具体用于基于所述目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
18.可选地,所述选择目标标准医学术语模块,还用于若根据每个候选标准医学术语对应的综合相似度无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,则对所述关键字段进行拆分,得到所述关键字段对应的关键词;根据预先保存的各标准医学术语各自对应的关键词,从所述各标准医学术语中选择出目标标准医学术语。
19.可选地,所述质控模块,具体用于将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
20.本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的电子病历的质控方法。
21.本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的电子病历的质控方法。
22.本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:本说明书实施例中实时获取用户输入的病历文本,采用标准医学术语,对病历文本中的关键字段进行实时质控,以避免电子病历中的术语不规范和不准确的问题,并且实时对电子病历进行质控,可以避免从电子病历的生成到对电子病历中的数据进行修改这个过程产生的时间差,从而降低诊疗出错的概率。
附图说明
23.此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:图1为本说明书实施例提供的电子病历质控系统的结构示意图;图2为本说明书实施例提供的电子病历质控系统中文本标准化单元与术语单元的交互示意图;图3为本说明书实施例提供的电子病历的质控方法的流程示意图;图4为本说明书实施例提供的病历文本质控前与质控后的对比示意图;图5为本说明书实施例提供的展示出现次数的示意图;图6为本说明书实施例提供的电子病历的质控装置结构示意图;图7为本说明书实施例提供的电子设备的结构示意图。
具体实施方式
24.为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人
员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
25.以下结合附图,详细说明本说明书各实施例提供的技术方案。
26.在本说明书中,本说明书实施例中提供的电子病历的质控方法适用于电子病历质控系统,如图1所示。在图1 中,该电子病历质控系统可以包括:文本标准化单元、术语单元、术语统计单元和病历检测单元。文本标准化单元可以包括:获取模块、质控策略确定模块、关键字段确定模块、选择目标标准医学术语模块、质控模块。术语单元可以包括:选择候选标准医学术语模块。术语统计单元可以包括:术语统计模块。病历检测单元可以包括:病历检测模块。其中,在电子病历质控系统中,各单元之间可以通过应用程序编程接口(application programming interface,api)进行无线通信或有线通信。
27.接下来,对电子病历质控系统中各单元的交互进行说明,本说明书实施例提供电子病历质控系统中文本标准化单元与术语单元之间的交互示意图,如图2所示。
28.文本标准化单元,用于实时获取用户输入的病历文本,根据病历文本的文本类型,确定出针对病历文本的质控策略,基于针对病历文本的质控策略以及病历文本,确定出待质控的关键字段,基于关键字段的术语类别,向术语单元发送术语匹配请求。
29.术语单元,用于根据接收到的术语匹配请求中携带的术语类别,从预先保存的各标准医学术语中选择出满足术语类别的标准医学术语,作为候选标准医学术语,并将候选标准医学术语返回给文本标准化单元。
30.其中,术语单元或术语模块部署有一体化医学术语模型,一体化医学术语模型可以是指将不同语种、不同医疗场景、不同术语来源的医学术语进行集成并实现各医学术语交互的术语模型。一体化医学术语模型中保存有标准医学术语表、术语关系表和术语同义词表。标准医学术语表记录了每个标准医学术语的定义、术语唯一标识(如id)、术语类别、术语来源等。术语类别可以包括:症状(比如:咳嗽、肺肿瘤等症状)、体征(比如:性别、年龄等)、形态学异常(比如:骨折等)、疾病、身体部位、操作方法、时间信息、器械、药物等术语类别。术语来源可以包括:snomed ct、loinc、rxnorm、mesh、icd-10、atc、真实医疗机构等。术语关系表记录了不同术语之间的关联关系,关联关系可包括:同术语类别间的层级关系、不同术语类别间的属性关系(如:肺肿瘤在肺部位上)、同义词术语之间的映射关系。
31.文本标准化单元,用于接收候选标准医学术语,并根据候选标准医学术语与关键字段之间的相似度,从候选标准医学术语中选择出与关键字段相匹配的候选标准医学术语,作为目标标准医学术语,基于目标标准医学术语,对病历文本进行实时质控,得到质控后的病历文本。
32.术语统计单元,用于监测用户输入的病历文本,统计出在历史上与病历文本相匹配的目标标准医学术语出现的次数,并将次数返回给文本标准化单元。
33.文本标准化单元,用于将目标标准医学术语和次数展示给用户。
34.病历检测单元,用于在获取到用户输入的全部病历文本之后,对由全部病历文本构成的电子病历进行完整性、逻辑性、一致性检测,得到检测结果,并基于检测结果,对电子病历进行异常标注。
35.图3为本说明书实施例提供的电子病历的质控方法的流程示意图,该电子病历的质控方法可以适用于电子病历质控系统,包括:s300:实时获取用户输入的病历文本。
36.在本说明书实施例中,电子病历质控系统响应于用户的输入操作,通过文本标准化单元获取用户输入的病历文本。其中,用户可以是指医护人员。病历文本可以是指记录患者就诊信息的文本,病历文本比如:患者的基本信息(如性别、年龄等)、患者的诊断信息(如出院诊断疾病信息、入院诊断疾病信息、实验室检查名称、影像学检查名称、主诉内容、个人史内容、影像学检查结果等)。当获取到用户输入的针对患者的所有病历文本之后,可以将由所有病历文本构成的文本作为针对该患者的电子病历。
37.由于病历文本比较杂乱,可以将病历文本分为非结构化文本类型和结构化文本类型。其中,结构化文本类型可以是指采用统一格式和标准的数据结构进行文本表达的文本类型。非结构化文本类型可以是指采用没有统一格式和标准的自然语言进行文本表达的文本类型,非结构化文本类型的文本表达形式比较复杂多样。
38.结构化文本类型的病历文本可以包括:患者的基本信息(如性别、籍贯、文化程度、出生日期等)、出院诊断疾病信息、入院诊断疾病信息、实验室检查名称、影像学检查名称等,非结构化文本类型的病历文本可以包括:主诉内容、个人史内容、家族史内容、影像学检查结果等。
39.当用户输入病历文本时,用户可以通过针对结构化文本类型的输入界面输入病历文本,或,通过针对非结构化文本类型的输入界面输入病历文本。即,通过文本标准化单元可以监测到病历文本的文本类型。
40.s302:根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略。
41.s104:基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段。
42.在本说明书实施例中,在实时获取到用户输入的病历文本之后,需要实时对病历文本进行质控。
43.具体的,通过文本标准化单元,可以根据用户输入的病历文本的文本类型,确定出针对该病历文本的质控策略。若病历文本的文本类型为非结构化文本类型,则确定针对该病历文本的质控策略为第一质控策略;若病历文本的文本类型为结构化文本类型,则确定针对该病历文本的质控策略为第二质控策略。其中,第一质控策略可以是指对非结构化文本类型的病历文本进行关键词提取得到关键字段之后,确定出与关键字段相匹配的标准医学术语,并基于与关键字段相匹配的标准医学术语,对病历文本进行质控的方法。第二质控策略可以是指在术语统计次数辅助下,确定出与关键字段相匹配的标准医学术语,并基于与关键字段相匹配的标准医学术语,对病历文本进行质控的方法。
44.在确定出针对该病历文本的质控策略之后,可以基于针对该病历文本的质控策略以及该病历文本,确定出待质控的关键字段。其中,关键字段可以是可拆分为多个词语的结构化文本,也可以是无法拆分的单个词语,关键字段可以是多个。关键字段可以是指用于描述患者症状信息、体征信息或治疗操作的文本段,即,关键字段可以是指用于描述患者症状信息、体征信息或治疗操作的术语。在确定出待质控的关键字段之后,可以在用户输入的病历文本中标注出待质控的关键字段,其中,标注方式可以包括:高亮、框定、改变字体颜色等标注方式。
45.需要说明的是,由于每个医护人员的书写习惯和书写用语的不同,造成每个医护人员输入的病历文本中关键字段的用词可能是不一样的或可能出现错别字的情况。所以,
需要采用本说明书提供的质控方法,对描述同一内容的关键字段所采用的不同用词进行标准化或规范化,以及对错别字进行纠正,以保证关键字段的准确性。
46.若针对该病历文本的质控策略为第一质控策略,则需要对非结构化文本类型的该病历文本进行关键字段提取,得到待质控的关键字段。若针对该病历文本的质控策略为第二质控策略,则无需对结构化文本类型的该病历文本进行关键字段提取,而是直接将该病历文本作为待质控的关键字段。
47.在针对该病历文本的质控策略为第一质控策略的情况下,可以通过正则匹配的方法和/或序列标注模型,对该病历文本进行关键字段提取。
48.采用正则匹配的方法包括:可以根据预先配置的第一正则表达式以及预先保存的标准医学术语表,从该病历文本中提取出待质控的关键字段。其中,第一正则表达式用于匹配症状信息、体征信息、疾病信息、手术名称等常规术语类别的字段,关键字段可以是指用于描述症状信息、体征信息、疾病信息、手术名称的术语。
49.采用序列标注模型的方法包括:可以先根据预先配置的第二正则表达式,对该病历文本进行句子拆分,得到各语句。其中,第二正则表达式用于基于预设的分割符,对该病理文本进行句子拆分,分割符可以包括:标点符号、缩略语等。在得到各语句之后,可以将各语句输入到预先训练的序列标注模型中,以通过序列标注模型提取出每个语句中的关键字段。
50.其中,序列标注模型可以包括:bilstm-crf模型,bilstm-crf模型是一种含有双向长短时记忆网络和条件随机场的序列标注模型。在对bilstm-crf模型进行训练时,将医疗文本输入到bilstm-crf模型中,以通过bilstm-crf模型预测出医疗文本中每个字段对应的术语类别。以预测出的术语类别与真实术语类别之间的差异最小化为优化目标,对bilstm-crf模型进行训练。
51.例如:病历文本为“经期腹部疼痛严重”,“经期”为一个关键字段,该关键字段的术语类别为时间信息。“腹部”为一个关键字段,该关键字段的术语类别为身体部位。“疼痛”为一个关键字段,该关键字段的术语类别为症状,“严重”为一个关键字段,该关键字段的术语类别为严重程度。
52.另外,可以先将正则匹配方法与序列标注模型进行结合。具体的,针对常规术语类别,可以先根据预先配置的第一正则表达式以及预先保存的标准医学术语表,从该病历文本中提取出待质控的关键字段。针对不常规的术语类别或未知的术语,可以先根据预先配置的第二正则表达式,对该病历文本进行句子拆分,得到各语句。在得到各语句之后,可以将各语句输入到预先训练的序列标注模型中,以通过序列标注模型提取出每个语句中的关键字段。
53.在针对该病历文本的质控策略为第二质控策略的情况下,将病历文本作为关键字段,比如:病历文本为“内镜检查”、“ct检查”。
54.s306:基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语。
55.在本说明书实施例中,在确定出待质控的关键字段之后,通过文本标准化单元,根据关键字段的术语类别,向术语单元发送术语匹配请求。术语单元接收到的术语匹配请求中携带的术语类别,从预先保存的各标准医学术语中选择出满足术语类别的标准医学术
语,作为候选标准医学术语。然后,可以将候选标准医学术语返回给文本标准化单元。其中,候选标准医学术语可以是多个。候选标准医学术语都属于关键字段的术语类别。
56.当待质控的关键字段存在多个时,针对每个关键字段,根据该关键字段的术语类别,向术语单元发送术语匹配请求。术语单元接收到的术语匹配请求中携带的术语类别,从预先保存的各标准医学术语中选择出满足该关键字段的术语类别的标准医学术语,作为针对该关键字段的候选标准医学术语。
57.s308:根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语。
58.s310:基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。
59.在本说明书实施例中,文本标准化单元接收到各候选标准医学术语之后,可以根据每个候选标准医学术语与关键字段之间的相似度,从各候选标准医学术语中选择出与关键字段相匹配的候选标准医学术语,作为目标标准医学术语。在选择出与关键字段相匹配的目标标准医学术语之后,可以基于目标标准医学术语,对病历文本进行实时质控,得到质控后的病历文本。其中,与关键字段相匹配的目标标准医学术语可以是与关键字段的语义内容最接近的标准医学术语。
60.由于针对非结构化文本类型的病历文本和结构化文本类型的病历文本所采用的质控策略是不一样的,因此,接下来,对采用不同的质控策略对病历文本进行质控的方法进行说明(以一个关键字段对应的各候选标准医学术语为例)。
61.针对第一质控策略:在从非结构化文本类型的病历文本中提取出关键字段,并确定出同属于关键字段的术语类别的各候选标准医学术语之后,根据每个候选标准医学术语与关键字段之间的相似度,从各候选标准医学术语中选择出与关键字段相匹配的目标标准医学术语。
62.具体的,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与关键字段的词向量,确定该标准医学术语与关键字段之间的相似度,作为第一相似度。考虑到病历文本为非结构化文本,关键字段是有上下文信息的,为了提高匹配的精度,可以根据该候选标准医学术语的上下文信息与关键字段的上下文信息,确定该候选标准医学术语与关键字段之间的相似度,作为第二相似度。然后,根据第一相似度和第二相似度,确定该候选标准医学术语与关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度。最后,根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。其中,该候选标准医学术语的上下文信息可以是该候选标准医学术语所在的原始医疗文本中针对该候选标准医学术语的上下文信息。
63.其中,可以根据该候选标准医学术语的词向量与关键字段的词向量,确定该标准医学术语与关键字段之间的余弦相似度,作为第一相似度。计算第一相似度的公式为:。为关键字段,为候选标准医学术语。为关
键字段的词向量,为候选标准医学术语的词向量。
64.在根据该候选标准医学术语的上下文信息与关键字段的上下文信息,确定该候选标准医学术语与关键字段之间的第二相似度时,可以确定出病历文本中位于关键字段左侧的词汇集合,作为第一词汇集合,以及确定病历文本中位于关键字段右侧的词汇集合,作为第二词汇集合。同时,确定出原始医疗文本中位于该候选标准医学术语左侧的词汇集合,作为第三词汇集合,以及确定原始医疗文本中位于该候选标准医学术语右侧的词汇集合,作为第四词汇集合。根据第一词汇集合与第三词汇集合之间的语义相似度以及第二词汇集合与第四词汇集合之间的语义相似度,确定该候选标准医学术语与关键字段之间的第二相似度。
65.其中,计算第一词汇集合与第三词汇集合之间的语义相似度的公式为:。为第一词汇集合,为第三词汇集合,为第一词汇集合的词汇数量。为第一词汇集合中第个词汇与第三词汇集合中第个词汇之间的余弦相似度。另外,第二词汇集合与第四词汇集合之间的语义相似度的计算公式与第一词汇集合与第三词汇集合之间的语义相似度的计算公式类似,即,。
66.在确定出第一相似度和第二相似度之后,将第一相似度和第二相似度进行加权求和,得到该候选标准医学术语与关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度。
67.其中,综合相似度的计算公式为:。其中,,,为权重参数,且有。本实施例中取,。
68.在确定出每个候选标准医学术语对应的综合相似度之后,可以从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。其中,预设阈值可以是0.9。
69.在可以从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的目标标准医学术语的情况下,在对病历文本进行质控时,可以直接基于目标标准医学术语,对病历文本中的关键字段进行替换,得到质控后的病历文本,并将质控后的病历文本展示给用户。其中,质控后的病历文本中采用标准医学术语对患者的症状信息、体征信息或治疗操作进行描述。另外,在对病历文本中的关键字段进行替换得到质控后的病历文本之后,还可以在质控后的病历文本中标注出已替换的目标标准医学术语。
70.若无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度
最大的候选标准医学术语,则可以对关键字段进行拆分,得到各词语。其中,每个词语无法再进行拆分。根据各词语对应的词类别,从各词语中选择出表征关键字段词语,作为关键字段对应的关键词。然后,根据预先保存的各标准医学术语各自对应的关键词,从各标准医学术语中选择出与关键字段对应的关键词相匹配的目标标准医学术语。其中,目标标准医学术语可以是多个,针对每个标准医学术语,可以将关键字段对应的关键词与该标准医学术语对应的关键词进行匹配,若关键字段对应的关键词与该标准医学术语对应的关键词相同,则将该标准医学术语作为目标标准医学术语。在对病历文本进行质控时,可以将选择出的目标标准医学术语增加到推荐队列中,向用户展示推荐队列,以使用户进行选择。根据用户选择出的目标标准医学术语,对病历文本中的关键字段进行替换,得到质控后的病历文本。
71.其中,词类别可以包括:评价对象、形态学异常、操作方法等词类别。当关键字段或标准医学术语包含有评价对象的词语时,可以将评价对象的词语作为这个关键字段或标准医学术语对应的关键词。其中,评价对象词类别的优先级最高,形态学异常词类别的优先级次之,操作方法词类别的优先级最低。以关键字段为例,若关键字段包含有评价对象的词语和形态学异常的词语时,可以将评价对象的词语作为这个关键字段对应的关键词。
72.针对词类别,比如:关键字段为“神经性听力减退”,“听力”为评价对象的词类别,所以,该关键字段对应的关键词为“听力”。
73.基于上述采用第一质控策略对病历文本进行质控的方法,本说明书实施例提供病历文本质控前和质控后的对比示意图,如图4所示。
74.在图4中,质控前的病历文本为“患者食欲下降、腹区胀、爱气、打嗝、胃部不适,自觉尿滴沥,食后容易出现上腹区疼痛等症状”,其中,关键字段有:“腹区胀”、“爱气”、“自觉尿滴沥”、“上腹区疼痛”,可以通过框定的方式,在质控前的病历文本中标注出这几个关键字段。针对每个关键字段,从预先保存的各标准医学术语中确定出综合相似度大于预设阈值且综合相似度最大的目标标准医学术语,即,“腹区胀”的目标标准医学术语为“腹胀”,“爱气”的目标标准医学术语为“嗳气”,“上腹区疼痛”的目标标准医学术语为“上腹痛”,这类目标标准医学术语可以直接替换关键字段。而“自觉尿滴沥”没有匹配上综合相似度大于预设阈值且综合相似度最大的目标标准医学术语,需要对“自觉尿滴沥”进行拆分,确定出“自觉尿滴沥”的关键词为“尿”,然后,在推荐队列中展示与“尿”有关的各目标标准医学术语,即,“尿不尽”、“尿无力”、“多尿”、“尿等待”、“无尿”、“茶色尿”、“尿频”等,用户可以在推荐队列中选择相应的目标标准医学术语。最终,质控后的病历文本为“患者食欲下降、腹胀、嗳气、打嗝、胃部不适,(1),食后容易出现上腹痛等症状”。其中,(1)是由用户在推荐队列中选择出的目标标准医学术语所决定的。
75.以上是采用第一质控策略对病历文本进行质控的方法,接下来,对采用第二质控策略对病历文本进行质控的方法进行说明。
76.针对第二质控策略:在将病历文本作为关键字段,并从术语单元获取同属于关键字段的术语类别的各候选标准医学术语之后,可以根据每个候选标准医学术语与关键字段之间的相似度,从候选标准医学术语中选择出与关键字段相匹配的候选标准医学术语,作为目标标准医学术语。
77.具体的,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与关键字段的词向量,确定该标准医学术语与关键字段之间的余弦相似度,作为该候选标准医学术语对应的余弦相似度。根据每个候选标准医学术语对应的余弦相似度,从各候选标准医学术语中选择出余弦相似度大于预设阈值的候选标准医学术语,作为目标标准医学术语,并将选择出的目标标准医学术语增加到第一推荐队列中。其中,目标标准医学术语可以是多个,选择出的目标标准医学术语中可能包含有与病历文本完全相同的标准医学术语。
78.需要说明的是,计算余弦相似度的公式上述已说明,在此不再赘述。
79.若无法根据每个候选标准医学术语对应的余弦相似度,从各候选标准医学术语中选择出余弦相似度大于预设阈值的目标标准医学术语,则可以对关键字段进行拆分,得到各词语。其中,每个词语无法再进行拆分。然后,针对每个词语,根据该词语的术语类别,从预先保存的各标准医学术语中选择出满足该词语的术语类别的标准医学术语,作为其他标准医学术语。之后,根据该词语与其他标准医学术语之间的相似度,从其他标准医学术语中选择出相似度大于预设阈值的标准医学术语,作为与该词语相匹配的目标标准医学术语,并将选择出的目标标准医学术语增加到第二推荐队列中。
80.在通过上述的方法确定出目标标准医学术语之后,可以将目标标准医学术语展示给用户,以使用户进行选择,根据用户选择出的目标标准医学术语,对病历文本进行替换,得到质控后的病历文本。
81.具体的,可以将第一推荐队列中目标标准医学术语和/或第二推荐队列中的目标标准医学术语展示给用户,以使用户进行选择。
82.另外,在向用户展示目标标准医学术语的同时,还可以向用户展示目标标准医学术语在历史上出现的次数,以供用户查验病历文本或目标标准医学术语是否存在错误。其中,若目标标准医学术语或病历文本在历史上出现的次数较少,这个目标标准医学术语或病历文本存在错误的可能性较大。
83.具体的,在将目标标准医学术语展示给用户时,可以基于历史上输入的历史病历文本,统计出与病历文本相匹配的目标标准医学术语历史上出现的次数。将统计出的次数以及目标标准医学术语展示给用户,以使用户基于每个目标标准医学术语出现的次数进行选择。如图5所示。其中,与病历文本相匹配的目标标准医学术语可以是指与病历文本之间的余弦相似度大于预设阈值的标准医学术语。当病历文本为标准医学术语时,与病历文本相匹配的目标标准医学术语可以是病历文本本身,当病历文本不是标准医学术语时,与病历文本相匹配的目标标准医学术语可以是与病历文本语义相近的标准医学术语。
84.在图5中,若用户在民族栏输入的病历文本为“藏”,则确定出与“藏”相匹配的一个目标标准医学术语为“藏族”,可以向用户展示历史上“藏族”出现的次数,比如:451次。
85.在统计与病历文本相匹配的目标标准医学术语出现的次数时,通过术语统计单元,监测用户输入的病历文本,从预先保存的各标准化医学术语中确定出与病历文本相匹配的目标标准医学术语,并基于历史上输入的历史病历文本,统计出与病历文本相匹配的目标标准医学术语历史上出现的次数。将统计出的次数返回给文本标准化单元,以通过文本标准化单元将统计出的次数以及目标标准医学术语展示给用户,以使用户基于每个目标标准医学术语出现的次数进行选择。
86.以上是实时获取病历文本,并对实时的病历文本进行实时质控的过程,当文本标
准化单元获取到用户输入的全部病历文本之后,可以对由全部病历文本构成的电子病历的完整性、逻辑性、一致性进行检测。
87.具体的,在获取到用户输入的全部病历文本之后,根据预设的检测规则,对由全部病历文本构成的电子病历进行异常检测,得到检测结果。根据检测结果,对电子病历中的病历文本进行异常标注。其中,异常检测是指检测电子病历的完整性、逻辑性、一致性是否存在异常。异常标注可以是指在电子病历中采用高亮、改变字体颜色或框定的方式,将存在异常的文本标注出来。
88.针对完整性的检测:统计电子病历中每个段落的字数,根据预设的字数阈值,对每个段落的字数进行检测,得到检测结果。其中,对于不满足字数阈值的段落进行异常标注。例如:主诉,现病史、个人史、既往史等段落不少于4个字符;病程内容,诊疗经过等段落不少于10个字符。
89.针对逻辑性的检测:对时序进行检测:时间相关字段符合出入院及诊疗路径时序,例如出院时间必须晚于入院时间,医嘱的停止时间必须晚于医嘱开立时间和生效时间;手术结束时间必须晚于手术开始时间等。
90.对时间范围进行检测:设定合理的时间范围,对于超出时间范围的字段进行异常标注。例如:时间晚于本年12月31日,则进行错误标注。
91.对性别进行检测:当患者基本信息中性别为男性,电子病历中出现女性特有疾病如子宫内膜异位症,卵巢囊肿等,病历中出现月经史信息,出现卵巢、子宫能术语,则进行错误标注;当患者性别为女性,病历文本中出现男性特有疾病症状如前列腺增生,精子运动能力不足,出现前列腺、睾丸等术语则进行错误标注。
92.对术语组合进行逻辑检测:当前术语关系表通过两个术语id及关系名称进行术语间的关系建立。例如:标准化的检验检查名称“血小板分布宽度:比率:血清:定量型”与样本名称“血清”通过关系名称“受检样本”进行关联,检验检查名称“血小板分布宽度:比率:血清:定量型”与观察实体“血小板分布宽度”通过关系名称“受检成分”进行关联。在术语关系表中,通过受检成分和受检样本进行关联的对象存在相同实体。在用户输入的电子病历中,若医疗人员输入的受检成分与受检样本在术语关系表没有重复的关联对象,则进行错误标注。
93.针对一致性的检测:判断同一患者的电子病历中用于描述患者症状的不同段落内容是否一致。例如:出入院诊断与出入院记录中的出入院诊断是否一致;主诉与现病史中的内容是否一致,若主诉文本为呼吸困难,现病史为无呼吸困难等症状,则判断为前后不一致,进行错误标注。
94.判断同一患者的电子病历中用于描述患者症状的同一段落内容是否一致。例如:病程记录表中的病程内容,若文本中同时出现“发热”与“体温正常”,“左腹疼痛”与“右腹疼痛”,则进行错误标注。
95.判断同一患者的基本信息与历史就诊病历的基本信息是否一致。例如:性别,姓名,国籍,籍贯等。
96.需要说明的是,本技术中所有获取信号、信息或文本数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进
行的。
97.通过上述图3所示的方法可见,本说明书实时获取用户输入的病历文本,采用标准医学术语,对病历文本中的关键字段进行实时质控,以避免电子病历中的术语不规范和不准确的问题,并且实时对电子病历进行质控,可以避免从电子病历的生成到对电子病历中的数据进行修改这个过程产生的时间差,从而降低诊疗出错的概率。
98.以上为本说明书实施例提供的电子病历的质控方法,基于同样的思路,本说明书还提供了相应的装置、存储介质和电子设备。
99.图6为本说明书实施例提供的一种电子病历的质控装置的结构示意图,所述装置包括:获取模块601,用于实时获取用户输入的病历文本;质控策略确定模块602,用于根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略;关键字段确定模块603,用于基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段;选择候选标准医学术语模块604,用于基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语;选择目标标准医学术语模块605,用于根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语;质控模块606,用于基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。
100.可选地,所述关键字段确定模块603具体用于,若针对所述病历文本的质控策略为第一质控策略,则通过序列标注模型,对所述病历文本进行关键字段提取,得到待质控的关键字段;若针对所述病历文本的质控策略为第二质控策略,则将所述病历文本确定为待质控的关键字段。
101.可选地,所述选择目标标准医学术语模块605具体用于,若针对所述病历文本的质控策略为第一质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的第一相似度;根据该候选标准医学术语的上下文信息与所述关键字段的上下文信息,确定该候选标准医学术语与所述关键字段之间的第二相似度;根据所述第一相似度和所述第二相似度,确定该候选标准医学术语与所述关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度;根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。
102.可选地,所述质控模块606具体用于,基于所述目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
103.可选地,所述选择目标标准医学术语模块605还用于,若根据每个候选标准医学术语对应的综合相似度无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,则对所述关键字段进行拆分,得到所述关键字段对应
的关键词;根据预先保存的各标准医学术语各自对应的关键词,从所述各标准医学术语中选择出目标标准医学术语。
104.可选地,所述质控模块606具体用于,将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。
105.可选地,所述选择目标标准医学术语模块605具体用于,若针对所述病历文本的质控策略为第二质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的余弦相似度,作为该候选标准医学术语对应的余弦相似度;根据每个候选标准医学术语对应的余弦相似度,从各候选标准医学术语中选择出余弦相似度大于预设阈值的候选标准医学术语,作为目标标准医学术语。
106.可选地,所述装置还包括:术语统计模块607;所述术语统计模块607,用于基于历史上输入的历史病历文本,统计出与所述病历文本相匹配的目标标准医学术语历史上出现的次数。
107.所述质控模块606具体用于,将所述次数以及所述目标标准医学术语展示给所述用户,以使所述用户进行选择。
108.可选地,所述装置还包括:病历检测模块608;所述病历检测模块608,用于在获取到所述用户输入的全部病历文本之后,根据预设的检测规则,对由所述全部病历文本构成的电子病历进行异常检测,得到检测结果;根据检测结果,对所述电子病历中的病历文本进行异常标注。
109.本说明书还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可用于执行上述图3提供的电子病历的质控方法。
110.基于图3所示的电子病历的质控方法,本说明书实施例还提供了图7所示的电子设备的结构示意图。如图7,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图3所述的电子病历的质控方法。
111.当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
112.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device, pld)(例如现场可编程门阵列(field programmable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,
而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
113.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20 以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
114.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
115.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
116.本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
117.本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
118.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
119.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
120.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
121.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
122.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
123.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
124.本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
125.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
126.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例
的部分说明即可。
127.以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

技术特征:
1.一种电子病历的质控方法,其特征在于,包括:实时获取用户输入的病历文本;根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略;基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段;基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语;根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。2.如权利要求1所述的方法,其特征在于,基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段,具体包括:若针对所述病历文本的质控策略为第一质控策略,则通过序列标注模型,对所述病历文本进行关键字段提取,得到待质控的关键字段;若针对所述病历文本的质控策略为第二质控策略,则将所述病历文本确定为待质控的关键字段。3.如权利要求2所述的方法,其特征在于,根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语,具体包括:若针对所述病历文本的质控策略为第一质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的第一相似度;根据该候选标准医学术语的上下文信息与所述关键字段的上下文信息,确定该候选标准医学术语与所述关键字段之间的第二相似度;根据所述第一相似度和所述第二相似度,确定该候选标准医学术语与所述关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度;根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。4.如权利要求3所述的方法,其特征在于,基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:基于所述目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。5.如权利要求3所述的方法,其特征在于,所述方法还包括:若根据每个候选标准医学术语对应的综合相似度无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,则对所述关键字段进行拆分,得到所述关键字段对应的关键词;根据预先保存的各标准医学术语各自对应的关键词,从所述各标准医学术语中选择出目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;
根据所述用户选择出的目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。6.如权利要求2所述的方法,其特征在于,根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语,具体包括:若针对所述病历文本的质控策略为第二质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的余弦相似度,作为该候选标准医学术语对应的余弦相似度;根据每个候选标准医学术语对应的余弦相似度,从各候选标准医学术语中选择出余弦相似度大于预设阈值的候选标准医学术语,作为目标标准医学术语;基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本,具体包括:将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本进行替换,得到质控后的病历文本。7.如权利要求6所述的方法,其特征在于,将所述目标标准医学术语展示给所述用户,以使所述用户进行选择,具体包括:基于历史上输入的历史病历文本,统计出与所述病历文本相匹配的目标标准医学术语历史上出现的次数;将所述次数以及所述目标标准医学术语展示给所述用户,以使所述用户进行选择。8.如权利要求1所述的方法,其特征在于,所述方法还包括:在获取到所述用户输入的全部病历文本之后,根据预设的检测规则,对由所述全部病历文本构成的电子病历进行异常检测,得到检测结果;根据检测结果,对所述电子病历中的病历文本进行异常标注。9.一种电子病历的质控装置,其特征在于,包括:获取模块,用于实时获取用户输入的病历文本;质控策略确定模块,用于根据所述病历文本的文本类型,确定出针对所述病历文本的质控策略;关键字段确定模块,用于基于针对所述病历文本的质控策略以及所述病历文本,确定出待质控的关键字段;选择候选标准医学术语模块,用于基于所述关键字段的术语类别,从预先保存的各标准医学术语中选择出满足所述术语类别的标准医学术语,作为候选标准医学术语;选择目标标准医学术语模块,用于根据所述候选标准医学术语与所述关键字段之间的相似度,从所述候选标准医学术语中选择出与所述关键字段相匹配的候选标准医学术语,作为目标标准医学术语;质控模块,用于基于所述目标标准医学术语,对所述病历文本进行实时质控,得到质控后的病历文本。10.如权利要求9所述的装置,其特征在于,所述关键字段确定模块,具体用于若针对所述病历文本的质控策略为第一质控策略,则通过序列标注模型,对所述病历文本进行关键
字段提取,得到待质控的关键字段;若针对所述病历文本的质控策略为第二质控策略,则将所述病历文本确定为待质控的关键字段。11.如权利要求10所述的装置,其特征在于,所述选择目标标准医学术语模块,具体用于若针对所述病历文本的质控策略为第一质控策略,针对每个候选标准医学术语,根据该候选标准医学术语的词向量与所述关键字段的词向量,确定该标准医学术语与所述关键字段之间的第一相似度;根据该候选标准医学术语的上下文信息与所述关键字段的上下文信息,确定该候选标准医学术语与所述关键字段之间的第二相似度;根据所述第一相似度和所述第二相似度,确定该候选标准医学术语与所述关键字段之间的综合相似度,作为该候选标准医学术语对应的综合相似度;根据每个候选标准医学术语对应的综合相似度,从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,作为目标标准医学术语。12.如权利要求11所述的装置,其特征在于,所述质控模块,具体用于基于所述目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。13.如权利要求11所述的装置,其特征在于,所述选择目标标准医学术语模块,还用于若根据每个候选标准医学术语对应的综合相似度无法从各候选标准医学术语中选择出综合相似度大于预设阈值且综合相似度最大的候选标准医学术语,则对所述关键字段进行拆分,得到所述关键字段对应的关键词;根据预先保存的各标准医学术语各自对应的关键词,从所述各标准医学术语中选择出目标标准医学术语。14.如权利要求13所述的装置,其特征在于,所述质控模块,具体用于将所述目标标准医学术语展示给所述用户,以使所述用户进行选择;根据所述用户选择出的目标标准医学术语,对所述病历文本中的关键字段进行替换,得到质控后的病历文本。15.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-8任一项所述的方法。16.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-8任一项所述的方法。

技术总结
本说明书公开了一种电子病历的质控方法、装置、存储介质及电子设备,本说明书实施例实时获取用户输入的病历文本,采用标准医学术语,对病历文本中的关键字段进行实时质控,以避免电子病历中的术语不规范和不准确的问题,并且实时对电子病历进行质控,可以避免从电子病历的生成到对电子病历中的数据进行修改这个过程产生的时间差,从而降低诊疗出错的概率。率。率。


技术研发人员:俞紫怡 李劲松 刘康莉 周天舒 田雨
受保护的技术使用者:之江实验室
技术研发日:2023.07.10
技术公布日:2023/8/9
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐