一种水利数据管理方法及系统与流程

未命名 10-18 阅读:160 评论:0


1.本技术涉及数据管理技术领域,尤其涉及一种水利数据管理方法及系统。


背景技术:

2.目前,数字化转型对越来越多的行业而言变得重要且紧急,如何更好地利用数据已经成为数字化转型的关键,而数据的精确度、实时性往往决定产品的核心竞争力及价值。对水利行业而言,水利知识的再利用对各种应急预案的制定、供取水计划的制定等民生问题起到至关重要的作用。
3.然而目前缺少一体化的水利数据管理方法及平台,无法更全面、系统地对水利数据进行再利用,从而导致水利行业的决策缺乏完备的数据支撑,不利于水利行业发展。


技术实现要素:

4.本技术实施例提供了一种水利数据管理方法及系统,用于解决如下技术问题:目前缺少一体化的水利数据管理方法及平台,无法更全面、系统地对水利数据进行再利用,导致水利行业的决策缺乏完备的数据支撑。
5.本技术实施例采用下述技术方案:
6.一方面,本技术实施例提供了一种水利数据管理方法,所述方法包括:
7.对需要接入知识库的外部水利数据进行初步整合;
8.对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;
9.对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;
10.根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。
11.在一种可行的实施方式中,对需要接入知识库的外部水利数据进行初步整合,具体包括:
12.获取需要接入到知识库的外部水利数据;其中,所述外部水利数据包含db数据库结构化数据以及外部api接口接入数据;
13.将所述外部水利数据整合到数据源管理模块中。
14.在一种可行的实施方式中,对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,具体包括:
15.对整合后的所述外部水利数据进行数据提取;其中,所述数据提取包括属性提取以及依赖关系提取;
16.将所述外部水利数据中的非结构化数据转存为结构化数据;
17.对数据提取及转存后的所述外部水利数据进行数据清洗,得到所述目标水利数据。
18.在一种可行的实施方式中,对数据提取及转存后的所述外部水利数据进行数据清洗,得到所述目标水利数据,具体包括:
19.通过结果分类算法以及数据清洗工具,对所述外部水利数据进行数据清洗,以消除数据歧义。
20.在一种可行的实施方式中,对所述目标水利数据进行数据关系管理,具体包括:
21.对所述目标水利数据进行节点管理;其中,所述节点管理包括单节点管理及节点批量管理;
22.对所述目标水利数据进行关系管理;其中,所述关系管理包括单个关系管理及批量关系管理;
23.在已注册的外部api接口中提取变量,并将所述变量与所述外部api接口中接入的数据进行绑定,以对所述目标水利数据进行外部数据绑定;
24.对节点进行告警规则维护,并通过定义校验规则组,对数据属性进行实时校验,实现对所述目标水利数据的规则管理。
25.在一种可行的实施方式中,在对整合后的所述外部水利数据进行数据提炼,得到目标水利数据之后,所述方法还包括:
26.为非结构文件提供上传入口;
27.其中,所述上传入口支持文件名称的入库检索以及文件内容的文件存储;
28.所述上传入口还支持图片上传及存储,以及图片名称的入库检索。
29.在一种可行的实施方式中,在对所述目标水利数据进行数据关系管理之后,所述方法还包括:
30.为已建立数据关系管理的数据配置节点数据服务及图谱服务,并进行服务发布;
31.对已发布的服务进行服务上下线管理;
32.确定审核人员的审核权限,并根据所述审核权限绑定操作菜单权限;
33.根据所述操作菜单权限,对服务发布、服务管理、服务申请的操作进行审核。
34.在一种可行的实施方式中,根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案,具体包括:
35.基于语义解析方法及信息检索方法,在知识库中已有的专利数据、规则、关系及文档中检索与所述关键词相匹配的知识,并以预设展示形式进行显示,以完成用户数据问答;其中,所述预设展示形式至少包括超级档案展示、图谱关系展示以及文档预览展示。
36.另一方面,本技术实施例还提供了一种水利数据管理系统,所述系统包括:
37.数据源管理模块,用于对需要接入知识库的外部水利数据进行初步整合;
38.数据提炼模块,用于对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;
39.数据关系管理模块,用于对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;
40.智能搜索模块,用于根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。
41.在一种可行的实施方式中,所述系统还包括:
42.服务管理模块,用于为已建立数据关系管理的数据配置节点数据服务及图谱服
务,并进行服务发布;
43.对已发布的服务进行服务上下线管理;
44.确定审核人员的审核权限,并根据所述审核权限绑定审核菜单权限;
45.根据所述审核菜单权限,对服务发布、服务管理、服务申请的操作进行审核。
46.本发明实施例提供的一种水利数据管理方法及系统,具备如下有益效果:
47.本发明基于大数据技术进行数据资产的管理,实现了多形态的水利数据共享分析。能够更加方便的管理水利行业各项重点数据,为预警、决策提供高精度的参考。有效的提升了水利行业数据的智能应用,更加精确的反应事实数据,供使用单位参考。并且本发明所使用的方法可以推广至其他领域中进行数据的维护和分析,应用范围广泛,不局限于水利领域中。
附图说明
48.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
49.图1为本技术实施例提供的一种水利数据管理方法流程图;
50.图2为本技术实施例提供的一种水利数据管理系统的结构示意图。
具体实施方式
51.为了使本技术领域的人员更好地理解本技术中的技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
52.本技术实施例提供了一种水利数据管理方法,该方法应用于水利数据管理系统。本发明提供的水利数据管理系统基于浏览器/服务器模式(browser/server,b/s)架构,底层依赖于搜索服务器(elasticsearch,es)、neo4j等技术,实现了关键图片、文档等非结构化数据及结构化数据的存储和数据检索,还实现了结构化数据和非结构化数据的分类检索及结构化数据图谱展示,供水利知识的再利用,为水利行业决策提供数据支撑。
53.水利数据管理系统依赖于大模型技术,将水利相关结构化数据及非结构化数据图片、文件等内容导入至es、neo4j中,实现数据的存储及检索。系统主要包括以下功能:
54.1.实时数据api接口数据接入;
55.2.非结构化数据的上传;
56.3.结构化数据库表数据维护;
57.4.结构化数据es任务同步;
58.5.结构化及非结构化数据检索;
59.6.数据同步任务监控;
60.7.检索数据分类展示,支持关系图谱展示;
61.8.基于可视化的方式完成数据的配置、同步,并提供分模块的数据展示。
62.9.单体维护多级使用,不同的用户导入数据,建立数据资源库,多人共享的模式,达到单体维护多人使用的共享数据模式。
63.其中,elasticsearch是elastic stack核心的分布式搜索和分析引擎。
64.elasticsearch为所有类型的数据提供近乎实时的搜索和分析。无论是结构化或非结构化文本、数字数据还是地理空间数据,elasticsearch都能以支持快速搜索的方式高效地存储和索引它。neo4j是一个高性能的nosql图形数据库,它将结构化数据存储在网络上而不是表中。
65.如图1所示,水利数据管理方法具体包括步骤s101-s104:
66.s101、对需要接入知识库的外部水利数据进行初步整合。
67.具体地,首先获取需要接入到知识库的外部水利数据;其中,外部水利数据包含db数据库结构化数据以及外部api接口接入数据。
68.进一步地,将获取的外部水利数据整合到数据源管理模块中。
69.s102、对整合后的外部水利数据进行数据提炼,得到目标水利数据,并存入知识库中。
70.具体地,对整合后的外部水利数据进行数据提取;其中,数据提取包括属性提取以及依赖关系提取。
71.进一步地,将外部水利数据中的非结构化数据转存为结构化数据。
72.进一步地,对数据提取及转存后的外部水利数据进行数据清洗,得到目标水利数据,具体包括:通过结果分类算法以及数据清洗工具,对外部水利数据进行数据清洗,以消除数据歧义。
73.作为一种可行的实施方式,数据抽取是根据用户提供的结构化、半结构化以及非结构化数据,利用casrel算法、bootstrap算法及pdfminer、deepdive工具,进行属性提取及关系依赖提取。数据清洗主要解决数据消歧和统一问题,例如苹果手机和苹果(水果),这两个实体不是同一个实体,需要消除歧义。利用结果分类算法及现有的dedupe、openea等工具进行处理,消除问答歧义。
74.进一步地,本发明实施例提供的水利数据管理系统还为非结构文件提供了上传入口。其中,上传入口支持文件名称的入库检索以及文件内容的文件存储;还支持图片上传及存储,以及图片名称的入库检索。
75.作为一种可行的实施方式,上传入口用于将数据、文件或图片导入es中。
76.s103、对目标水利数据进行数据关系管理;其中,数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理。
77.具体地,对目标水利数据进行节点管理;其中,节点管理包括单节点管理及节点批量管理。
78.对目标水利数据进行关系管理;其中,关系管理包括单个关系管理及批量关系管理。
79.在已注册的外部api接口中提取变量,并将变量与外部api接口中接入的数据进行绑定,以对目标水利数据进行外部数据绑定。
80.对节点进行告警规则维护,并通过定义校验规则组,对数据属性进行实时校验,实
现对目标水利数据的规则管理。
81.进一步地,为已建立数据关系管理的数据配置节点数据服务及图谱服务,并进行服务发布。然后对已发布的服务进行服务上下线管理。确定审核人员的审核权限,并根据所述审核权限绑定操作菜单权限;根据所述操作菜单权限,对服务发布、服务管理、服务申请的操作进行审核。
82.作为一种可行的实施方式,为已建立管理的数据资源发布数据服务及图谱服务,支持传入变量获取源节点的关系图谱及相关基础属性。
83.a)服务发布,配置节点数据服务及图谱服务,进行服务发布。
84.b)服务管理,对已发布的服务进行服务上下线管理。
85.c)服务审核,对服务发布、服务管理、服务申请的操作进行审核。并按照审核权限绑定可操作的菜单权限。
86.在一个实施例中,不同的审核权限对应不同的操作菜单,可操作的空间也不同。例如审核权限最高的人员可审核服务发布、服务管理、服务申请三种操作,审核权限最低的人只能审核服务发布这一种操作。
87.s104、根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。
88.具体地,基于语义解析方法及信息检索方法,在知识库中已有的专利数据、规则、关系及文档中检索与所述关键词相匹配的知识,并以预设展示形式进行显示,以完成用户数据问答;其中,预设展示形式至少包括超级档案展示、图谱关系展示以及文档预览展示。
89.作为一种可行的实施方式,智能搜索功能是利用基于语义解析的方法和信息检索的方法,根据用户的输入,依赖于大模型技术进行数据问答。对已有的数据、规则、关系、文档进行检索,找到相应的答案。以超级档案、图谱关系、文档预览等形式对检索的内容进行展示。
90.另外,本技术实施例还提供了一种水利数据管理系统,如图2所示,水利数据管理系统200具体包括:
91.数据源管理模块210,用于对需要接入知识库的外部水利数据进行初步整合;
92.数据提炼模块220,用于对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;
93.数据关系管理模块230,用于对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;
94.智能搜索模块250,用于根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。
95.作为一种可行的实施方式,水利数据管理系统200还包括:
96.服务管理模块240,用于为已建立数据关系管理的数据配置节点数据服务及图谱服务,并进行服务发布;
97.对已发布的服务进行服务上下线管理;
98.确定审核人员的审核权限,并根据所述审核权限绑定审核菜单权限;
99.根据所述审核菜单权限,对服务发布、服务管理、服务申请的操作进行审核。
100.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,
或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
101.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
102.本领域内的技术人员应明白,本说明书实施例可提供为方法、系统、或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
103.本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
104.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
105.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
106.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
107.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
108.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
109.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
110.本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
111.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
112.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
113.以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。

技术特征:
1.一种水利数据管理方法,其特征在于,所述方法包括:对需要接入知识库的外部水利数据进行初步整合;对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。2.根据权利要求1所述的一种水利数据管理方法,其特征在于,对需要接入知识库的外部水利数据进行初步整合,具体包括:获取需要接入到知识库的外部水利数据;其中,所述外部水利数据包含db数据库结构化数据以及外部api接口接入数据;将所述外部水利数据整合到数据源管理模块中。3.根据权利要求1所述的一种水利数据管理方法,其特征在于,对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,具体包括:对整合后的所述外部水利数据进行数据提取;其中,所述数据提取包括属性提取以及依赖关系提取;将所述外部水利数据中的非结构化数据转存为结构化数据;对数据提取及转存后的所述外部水利数据进行数据清洗,得到所述目标水利数据。4.根据权利要求3所述的一种水利数据管理方法,其特征在于,对数据提取及转存后的所述外部水利数据进行数据清洗,得到所述目标水利数据,具体包括:通过结果分类算法以及数据清洗工具,对所述外部水利数据进行数据清洗,以消除数据歧义。5.根据权利要求1所述的一种水利数据管理方法,其特征在于,对所述目标水利数据进行数据关系管理,具体包括:对所述目标水利数据进行节点管理;其中,所述节点管理包括单节点管理及节点批量管理;对所述目标水利数据进行关系管理;其中,所述关系管理包括单个关系管理及批量关系管理;在已注册的外部api接口中提取变量,并将所述变量与所述外部api接口中接入的数据进行绑定,以对所述目标水利数据进行外部数据绑定;对节点进行告警规则维护,并通过定义校验规则组,对数据属性进行实时校验,实现对所述目标水利数据的规则管理。6.根据权利要求1所述的一种水利数据管理方法,其特征在于,在对整合后的所述外部水利数据进行数据提炼,得到目标水利数据之后,所述方法还包括:为非结构文件提供上传入口;其中,所述上传入口支持文件名称的入库检索以及文件内容的文件存储;所述上传入口还支持图片上传及存储,以及图片名称的入库检索。7.根据权利要求1所述的一种水利数据管理方法,其特征在于,在对所述目标水利数据进行数据关系管理之后,所述方法还包括:
为已建立数据关系管理的数据配置节点数据服务及图谱服务,并进行服务发布;对已发布的服务进行服务上下线管理;确定审核人员的审核权限,并根据所述审核权限绑定操作菜单权限;根据所述操作菜单权限,对服务发布、服务管理、服务申请的操作进行审核。8.根据权利要求1所述的一种水利数据管理方法,其特征在于,根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案,具体包括:基于语义解析方法及信息检索方法,在知识库中已有的专利数据、规则、关系及文档中检索与所述关键词相匹配的知识,并以预设展示形式进行显示,以完成用户数据问答;其中,所述预设展示形式至少包括超级档案展示、图谱关系展示以及文档预览展示。9.一种水利数据管理系统,其特征在于,所述系统包括:数据源管理模块,用于对需要接入知识库的外部水利数据进行初步整合;数据提炼模块,用于对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;数据关系管理模块,用于对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;智能搜索模块,用于根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。10.根据权利要求9所述的一种水利数据管理系统,其特征在于,所述系统还包括:服务管理模块,用于为已建立数据关系管理的数据配置节点数据服务及图谱服务,并进行服务发布;对已发布的服务进行服务上下线管理;确定审核人员的审核权限,并根据所述审核权限绑定审核菜单权限;根据所述审核菜单权限,对服务发布、服务管理、服务申请的操作进行审核。

技术总结
本发明公开了一种水利数据管理方法及系统,属于数据管理技术领域,用于解决目前缺少一体化的水利数据管理方法及平台,无法更全面、系统地对水利数据进行再利用,导致水利行业的决策缺乏完备的数据支撑的技术问题。方法包括:对需要接入知识库的外部水利数据进行初步整合;对整合后的所述外部水利数据进行数据提炼,得到目标水利数据,并存入所述知识库中;对所述目标水利数据进行数据关系管理;其中,所述数据关系管理至少包括:节点管理、关系管理、外部数据绑定以及规则管理;根据用户输入的关键词,在数据关系管理后的知识库中进行检索,输出对应的答案。有效的提升了水利行业数据的智能应用,更加精确的反应事实数据。更加精确的反应事实数据。更加精确的反应事实数据。


技术研发人员:闫海旺 曲建龙 房爱印 尹曦萌 张宇
受保护的技术使用者:浪潮智慧科技有限公司
技术研发日:2023.07.14
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐