一种卷宗分析系统、分析方法、装置及其存储介质与流程

未命名 08-15 阅读:105 评论:0


1.本发明涉及一种分析系统,尤其是一种卷宗分析系统、分析方法、装置及其存储介质。


背景技术:

2.卷宗是一个案件的完整记录和再现,是案件活动的重要载体,是检验审判、执行活动准确性、合法性、严肃性的重要依据。在案件场景中,检察官、法官往往面临着含海量文本信息的案件卷宗。目前电子卷宗智能分析主要有两种模式:
3.一种是全文检索模式:程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。该方式的优点是查全率高、检索效率高;缺点是检准率低。
4.另一种是自然语言处理(nlp)模式:该模式中可利用决策树、朴素贝叶斯、支持向量机、逻辑回归、k-means、神经网络等机器学习算法进行电子卷宗处理。该方式的优点是通过nlp技术可实现功能丰富,如可通过无监督方法进行新的关键词提取;缺点是算法的效果与训练样本的数量与数据多样性直接相关,维护一个庞大的训练集需要长期大量的人工投入。


技术实现要素:

5.为解决上述问题,本发明提供电子卷宗智能分析模型,能有效减轻检察官、法官文本处理卷宗工作负担,提高工作质效,实现人工智能赋能卷宗分析的目的一种卷宗分析系统,具体技术方案为:
6.一种卷宗分析系统,包括:数据支撑体系层,包括基础公共数据和政法行业数据;基础分析模型层,包括全文检索模式、自然语言处理模式及大数据碰撞检索模式;基础能力层:用于文本生成、文本分类、语义分析、情感分析、特征提取、信息检索、文本标识、信息推荐、命名实体识别、对比识别、文本向量化、文本推理、信息抽取、机器翻译;模型管理层,包括建模语言、可视化建模组件和案件模型管理。
7.优选的,所述全文检索模式包括lucene全文检索引擎;所述自然语言处理模式包括决策树、朴素贝叶斯、支持向量机、逻辑回归、梯度下降、k-means、lstm网络、卷积神经网络、循环神经网络、随机森林中的一种或多种;所述大数据碰撞检索模式用于利用大数据基础公共信息库,通过多方数据融合比对碰撞,准确识别检索结果。
8.优选的,所述建模语言包含变量、运算符、判断、循坏、递归、数据类型、基本语法、程序结构、正则表达式、作用域规则;所述可视化建模组件包括变量管理、判定树节点、可视化建模;所述案件模型管理包括对已建立的案件模型进行分类管理、模型激活、取消激活、模型复制、模型新建、模型修改、模型删除、批量删除、正确率设置。
9.进一步的,所述变量管理包括对案件变量实现增/删/改/查操作,对作为变量的基
础信息通过对接基础信息公共库进行实时核验;所述判定树节点包括根节点、决策节点、叶子节点图标;所述可视化建模包括对判定树节点图标拖/拉/拽/放/连线/取消、决策节点编辑、决策线编辑、判定树模型断点/调试/运行的可视化操作。
10.优选的,还包括工具集,所述工具集通过对输入的电子卷宗进行智能分析,向检察官、法官提供案件类型匹配、案件要素提取、案情判罚预测,案件救助方案推荐、智能案件检索、类案推荐、技术工作指引、关键字回填、文本纠错、身份证识别、签名辨伪、倾斜校正、语言翻译、文本转语音、智能问答中的一种或多。
11.一种卷宗分析系统的分析方法,包括以下步骤:
12.卷宗导入,通过大数据接口从检察工作网获取和更新案件电子卷宗;
13.lucene索引创建,通过lucene全文检索引擎技术,对卷宗文本创建索引,实现全文检索;
14.运行模型,针对的一种案件,构建多棵不同条件的模型树,训练时将结果正确率在每棵决策模型树进行手动标注;运行时,汇总多棵决策树整合成森林来预测最终结果;
15.运行变量,运行模型树各决策节点中的变量:
16.得到结果,得到案件模型运行结果。
17.能力提供,将运行结果与数据支撑体系层中的数据资源进行深度关联整合,按照各专题所需的特定方式进行重组,形成满足各案件专题业务需求的数据库;
18.工具集提供,向检察官、法官提供输入电子卷宗分析结果及智能工作辅助工具集。
19.优选的,所述运行变量包括:大数据变量核验:对于选择需要大数据核验的基础信息变量通过对接基础公共大数据信息库,实现需要救助人群在册信息的实时核验;运行判定式:通过运算函数和变量根据运算符计算,返回判定结果;运行nlp算法:加载所需场景的自然语言处理算法。
20.一种卷宗分析系统的分析方法的装置,所述装置包括:处理器、存储器以及程序;所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行上述一种卷宗分析系统的分析方法的步骤。
21.一种计算机可读存储介质,所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行上述一种卷宗分析系统的分析方法的步骤。
22.与现有技术相比本发明具有以下有益效果:
23.本发明提供的一种卷宗分析系统在对案件知识体系和业务深层次的理解和挖掘的基础上,基于自然语言处理(nlp)技术,设立电子卷宗智能分析模型,能有效减轻检察官、法官文本处理卷宗工作负担,提高工作质效,实现人工智能赋能卷宗分析的目的,能有效辅助检察官、法官卷宗分析工作,提高工作质效,从侧面减少人为干预因素,提高人民群众的案件满意度。
附图说明
24.图1是一种卷宗分析系统的结构框体;
25.图2是一种卷宗分析系统的分析方法的流程图;
26.图3是可视化建模的示意图。
具体实施方式
27.现结合附图对本发明作进一步说明。
28.基于检察官、法官的先验知识,利用全文检索模式检索效率高、查全率高的优点与自然语言处理(nlp)模式功能丰富、查准率高的优点,结合两者优势兼顾效率、准确率、及维护成本,通过电子卷宗智能分析模型,实现文本转换、特征要素提取、语义分析、案件类型匹配、卷宗解析、人物画像、智能筛查、案件推理等一系列功能的工具集;并与基础公共大数据信息库对接,实现需要救助人群在册信息的实时核验。
29.将检察官、法官从繁琐的的文本工作中解放出来,将精力聚焦于案件本身关键要素,实现高效精准工作,能有效辅助检察官、法官卷宗分析工作,提高工作质效,从侧面减少人为干预因素,提高人民群众的案件满意度。
30.实施例一
31.如图1至图3所示,一种卷宗分析系统,包括数据支撑体系层、基础分析模型层、基础能力层和模型管理层。
32.数据支撑体系层:包括基础公共数据、政法行业数据两块。基础公共数据与基础公共信息库对接,实现需要救助人群在册信息的数据接入、数据管理、数理加工。政法行政数据按一定标准、规则、模型、算法等对卷宗数据、案卡数据、案件流程数据等进行存储管理。
33.基础分析模型层:包括全文检索模式、自然语言处理(nlp)模式及大数据碰撞检索模式。全文检索模式采用lucene全文检索引擎。自然语言处理(nlp)模式采用决策树、朴素贝叶斯、支持向量机、逻辑回归、梯度下降、k-means、lstm网络、卷积神经网络、循环神经网络、随机森林等自然语言处理算法模型。大数据碰撞检索模式充分利用大数据基础公共信息库,通过多方数据融合比对碰撞,准确识别检索结果。
34.基础能力层:提供文本生成、文本分类、语义分析、情感分析、特征提取、信息检索、文本标识、信息推荐、命名实体识别、对比识别、文本向量化、文本推理、信息抽取、机器翻译等基础能力。
35.模型管理层:包括建模语言、可视化建模组件、案件模型管理三块。
36.a.建模语言是为建模开发的一套自定义语言,主要包含变量、运算符、判断、循坏、递归、数据类型、基本语法、程序结构、正则表达式、作用域规则。
37.b.可视化建模组件是基于建模语言的基础上开发的一套可视化组件,包括变量管理(对案件变量实现增/删/改/查操作;能对作为变量的基础信息通过对接基础信息公共库进行实时核验)、判定树节点(根节点、决策节点、叶子节点图标)、可视化建模(判定树节点图标拖/拉/拽/放/连线/取消、决策节点编辑、决策线编辑、判定树模型断点/调试/运行等可视化操作)。
38.c.案件模型管理:对已建立的案件模型进行分类管理、模型激活、取消激活、模型复制、模型新建、模型修改、模型删除、批量删除、正确率设置等操作。
39.提供工具集:通过对输入的电子卷宗进行智能分析,向检察官、法官提供案件类型匹配、案件要素提取、案情判罚预测,案件救助方案推荐、智能案件检索、类案推荐、技术工作指引、关键字回填、文本纠错、身份证识别、签名辨伪、倾斜校正、语言翻译、文本转语音、智能问答等一系列工作辅助工具集。
40.如图3所示,可视化建模通过自定义建模语言,针对卷宗开发可视化建模组件;通
过对建模组件(如案件变量、判定树节点)进行拖/拉/拽/放/连线/取消、决策节点编辑(变量选择、判定式)、决策线编辑等可视化操作进行建模;并实现对判定树模型实现可视化调试、运行操作。可视化建模界面参考设计如下:
41.检察官、法官可从左上侧判定树节点中将所需图形拖拽至右侧编辑框中。各图形之间可进行连线操作。对于想要删除的图形或线段,只需点击该图形或线段,按“backspace”键即可删除。双击线段可选择决策线的内容。双击菱形“决策节点图标”会弹出对话框,在该对话框内可完成决策点名称填写、决策点内容描述、判定式设置、变量新增/搜索/选择/编辑、大数据变量核验选择、决策点类型选择、断点设置等。在编辑框下侧,选择相应按钮可对建立的判定树模型进行调试、运行及保存等操作。
42.案件模型管理针对的一种案件,能构建多棵不同条件的模型树(类似随机森林),训练时可将结果正确率在每棵决策模型树进行手动标注。运行时,汇总多棵决策树整合成森林来预测最终结果,能在运算量没有显著提高的前提下提高预测精度。
43.全文检索模式、自然语言处理(nlp)模式及大数据碰撞检索模式相结合,利用全文检索模式检索效率高、查全率高的优点与自然语言处理(nlp)模式功能丰富、查准率高的优点,同时利用大数据碰撞检索模式大数据优势,结合三者优势兼顾效率、准确率、及维护成本;实现文本转换、特征要素提取、语义分析、案件类型匹配、卷宗解析、人物画像、智能筛查、案件推理等一系列功能。
44.模型树变量实时核验对作为模型树变量的基础信息,通过对接基础公共大数据信息库,实现需要救助人群在册信息的实时核验,进一步提高模型整体预测精度。
45.还包括工具集,工具集通过对输入的电子卷宗进行智能分析,向检察官、法官提供案件类型匹配、案件要素提取、案情判罚预测,案件救助方案推荐、智能案件检索、类案推荐、技术工作指引、关键字回填、文本纠错、身份证识别、签名辨伪、倾斜校正、语言翻译、文本转语音、智能问答。
46.实施例二
47.如图1和图2所示,一种卷宗分析系统的分析方法,包括以下步骤:
48.卷宗导入,通过大数据接口从检察工作网获取和更新案件电子卷宗;同时也支持移动存储设备方式导入案件卷宗。
49.lucene索引创建,通过lucene全文检索引擎技术,对卷宗文本创建索引,实现全文检索。
50.运行模型,针对的一种案件,能构建多棵不同条件的模型树(类似随机森林),训练时可将结果正确率在每棵决策模型树进行手动标注。运行时,汇总多棵决策树整合成森林来预测最终结果,能在运算量没有显著提高的前提下提高预测精度。
51.运行变量,运行模型树各决策节点中的变量:
52.大数据变量核验:对于选择需要大数据核验的基础信息变量,通过对接基础公共大数据信息库,实现需要救助人群在册信息的实时核验,进一步提高模型整体预测精度。
53.运行判定式:通过运算函数和变量根据运算符计算,返回判定结果。
54.表达式由数字、算符、数字分组符号(括号)、变量、自定义函数等以能求得数值的有意义排列方法所得的组合。
55.变量是通过函数在卷宗里取出想要的字,在表达式运算前已经计算得出的值,在
表达式里引用变量是在变量名的前后加上“#”即可。
56.自定义函数提供检索关键词片段,判断是否包含关键词,判断多个关键词在指定范围内是否同时出现,通过身份证获取年龄,取出片段中的数字,获取多个函数的结果数组等功能。
57.如:判断受害人是否是需要救助人群,表达式:near("#受害人#需要救助人群"~50)||near("调取证据通知书需要救助人群#受害人#"~100)==true
58.运行nlp算法:加载所需场景的自然语言处理(nlp)算法,如决策树、朴素贝叶斯、支持向量机、逻辑回归、梯度下降、k-means、lstm网络、卷积神经网络、循环神经网络、随机森林等。
59.得到结果,得到案件模型运行结果。
60.能力提供,将运行结果与数据支撑体系层中的数据资源进行深度关联整合,按照各专题所需的特定方式进行重组,形成满足各案件专题业务需求的数据库。降低用户理解和获取数据的难度,降低数据加工的深度和复杂度,提升数据应用和产品获取数据的效率。
61.工具集提供,向检察官、法官提供输入电子卷宗分析结果及智能工作辅助工具集,如案件类型匹配、案件要素提取、案情判罚预测,案件救助方案推荐、智能案件检索、类案推荐、技术工作指引、关键字回填、文本纠错、身份证识别、签名辨伪、倾斜校正、语言翻译、文本转语音、智能问答等。
62.一种卷宗分析系统的分析方法的装置,所述装置包括:处理器、存储器以及程序;所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行上述一种卷宗分析系统的分析方法的步骤。
63.存储器和处理器之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可以通过一条或者多条通信总线或信号线实现电性连接,如可以通过总线连接。存储器中存储有实现数据访问控制方法的计算机执行指令,包括至少一个可以软件或固件的形式存储于存储器中的软件功能模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理。
64.存储器可以是,但不限于,随机存取存储器(randomaccess memory,简称:ram),只读存储器(read only memory,简称:rom),可编程只读存储器(programmable read-only memory,简称:prom),可擦除只读存储器(erasable programmable read-only memory,简称:eprom),电可擦除只读存储器(electric erasable programmable read-only memory,简称:eeprom)等。其中,存储器用于存储程序,处理器在接收到执行指令后,执行程序。
65.处理器可以是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,简称:cpu)、网络处理器(network processor,简称:np)等。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
66.一种计算机可读存储介质,所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行上述一种卷宗分析系统的分析方法的步骤。
67.本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图来描述的。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可
编程数据处理终端设备的处理器执行的指令产生用于实现在流程图和/或中指定的功能的装置。
68.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图指定的功能。
69.这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图中指定的功能的步骤。
70.以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明权利要求的保护范围之内。

技术特征:
1.一种卷宗分析系统,其特征在于,包括:数据支撑体系层,包括基础公共数据和政法行业数据;基础分析模型层,包括全文检索模式、自然语言处理模式及大数据碰撞检索模式;基础能力层:用于文本生成、文本分类、语义分析、情感分析、特征提取、信息检索、文本标识、信息推荐、命名实体识别、对比识别、文本向量化、文本推理、信息抽取、机器翻译;模型管理层,包括建模语言、可视化建模组件和案件模型管理。2.根据权利要求1所述的一种卷宗分析系统,其特征在于,所述全文检索模式包括lucene全文检索引擎;所述自然语言处理模式包括决策树、朴素贝叶斯、支持向量机、逻辑回归、梯度下降、k-means、lstm网络、卷积神经网络、循环神经网络、随机森林中的一种或多种;所述大数据碰撞检索模式用于利用大数据基础公共信息库,通过多方数据融合比对碰撞,准确识别检索结果。3.根据权利要求1所述的一种卷宗分析系统,其特征在于,所述建模语言包含变量、运算符、判断、循坏、递归、数据类型、基本语法、程序结构、正则表达式、作用域规则;所述可视化建模组件包括变量管理、判定树节点、可视化建模;所述案件模型管理包括对已建立的案件模型进行分类管理、模型激活、取消激活、模型复制、模型新建、模型修改、模型删除、批量删除、正确率设置。4.根据权利要求3所述的一种卷宗分析系统,其特征在于,所述变量管理包括对案件变量实现增/删/改/查操作,对作为变量的基础信息通过对接基础信息公共库进行实时核验;所述判定树节点包括根节点、决策节点、叶子节点图标;所述可视化建模包括对判定树节点图标拖/拉/拽/放/连线/取消、决策节点编辑、决策线编辑、判定树模型断点/调试/运行的可视化操作。5.根据权利要求1所述的一种卷宗分析系统,其特征在于,还包括工具集,所述工具集通过对输入的电子卷宗进行智能分析,向检察官、法官提供案件类型匹配、案件要素提取、案情判罚预测,案件救助方案推荐、智能案件检索、类案推荐、技术工作指引、关键字回填、文本纠错、身份证识别、签名辨伪、倾斜校正、语言翻译、文本转语音、智能问答中的一种或多。6.根据权利要求1所述的一种卷宗分析系统的分析方法,其特征在于,包括以下步骤:卷宗导入,通过大数据接口从检察工作网获取和更新案件电子卷宗;lucene索引创建,通过lucene全文检索引擎技术,对卷宗文本创建索引,实现全文检索;运行模型,针对的一种案件,构建多棵不同条件的模型树,训练时将结果正确率在每棵决策模型树进行手动标注;运行时,汇总多棵决策树整合成森林来预测最终结果;运行变量,运行模型树各决策节点中的变量:得到结果,得到案件模型运行结果。能力提供,将运行结果与数据支撑体系层中的数据资源进行深度关联整合,按照各专题所需的特定方式进行重组,形成满足各案件专题业务需求的数据库;
工具集提供,向检察官、法官提供输入电子卷宗分析结果及智能工作辅助工具集。7.根据权利要求6所述的一种卷宗分析系统的分析方法,其特征在于,所述运行变量包括:大数据变量核验:对于选择需要大数据核验的基础信息变量通过对接基础公共大数据信息库,实现需要救助人群在册信息的实时核验;运行判定式:通过运算函数和变量根据运算符计算,返回判定结果;运行nlp算法:加载所需场景的自然语言处理算法。8.一种卷宗分析系统的分析方法的装置,其特征在于,所述装置包括:处理器、存储器以及程序;所述程序存储在所述存储器中,所述处理器调用存储器存储的程序,以执行权利要求6所述的一种卷宗分析系统的分析方法的步骤。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质被配置成存储程序,所述程序被配置成执行权利要求6所述的一种卷宗分析系统的分析方法的步骤。

技术总结
本发明涉及一种分析系统,尤其是一种卷宗分析系统、分析方法、装置及其存储介质。一种卷宗分析系统,包括:数据支撑体系层,包括基础公共数据和政法行业数据;基础分析模型层,包括全文检索模式、自然语言处理模式及大数据碰撞检索模式;基础能力层:用于文本生成、文本分类、语义分析、情感分析、特征提取、信息检索、文本标识、信息推荐、命名实体识别、对比识别、文本向量化、文本推理、信息抽取、机器翻译;模型管理层,包括建模语言、可视化建模组件和案件模型管理。本发明提供的一种卷宗分析系统能有效辅助检察官、法官卷宗分析工作,提高工作质效,从侧面减少人为干预因素,提高人民群众的案件满意度。案件满意度。案件满意度。


技术研发人员:徐一清 曾建平 李银晓 姜峻 朱慧丽 徐亮 牛大庆
受保护的技术使用者:浙江省磐安县人民检察院
技术研发日:2022.12.05
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐