科技成果转化数据查询方法、系统、终端及存储介质与流程
未命名
07-19
阅读:105
评论:0
1.本技术涉及数据查询及检索技术领域,尤其是涉及一种科技成果转化数据查询方法、系统、终端及存储介质。
背景技术:
2.目前,随着数字化信息资源共享的体系架构的逐步形成,网络数据资源的整体开发、交流、利用的深度、广度以及传播的速度正在发生革命性的变化,这为广大的公众特别是科技人员共享科技信息的资源提供了良好的技术与资源保障。
3.但是现有的网络数据资源繁杂,尤其是科技成果转化领域相关数据,这使得用户在筛选和查询数据时无法做到快速准确定位,难以直接获取有价值信息,无法满足用户进行专业分析的需求。
技术实现要素:
4.为了解决上述现有技术中存在的难题,本技术提供一种科技成果转化数据查询方法、系统、终端及存储介质。
5.第一方面,本技术提供一种科技成果转化数据查询方法,采用如下的技术方案:一种科技成果转化数据查询方法,包括:获取查询关键词;将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;将所述查询结果列表返回至终端用户。
6.可选地,所述在预设数据库中提取预设关键词,包括:获取预设数据库中的若干个数据主题;将所述数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算所述数据主题中每个词出现的概率及权重;计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
7.可选地,计算所述数据主题中的每个词出现的概率及权重,以及计算每个词在所有数据主题中的总权重,包括:在其中一个所述数据主题中词出现的概率为:;
其中,表示词出现的概率,表示词出现的概率,表示词和词有关联的概率,表示预设关键词关联到预设关键词的数目,表示词的出链数目,表示设定的窗口大小;在其中一个所述数据主题中词的权重为:;其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目;在所有数据主题中词的总权重为:;其中,表示词的总权重,表示词在其中一个数据主题中的权重,表示词在其中一个数据主题中出现的概率。
8.可选地,还包括:根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;获取用户筛选信息,所述用户筛选信息为预设筛选信息中的一种或多种;根据用户筛选信息,将相应的筛选列表加入筛选结果列表;将所述筛选结果列表返回至终端用户。
9.可选地,还包括:获取数据类型;若干个所述数据类型分别对应不同的预设数据库;根据获取的数据类型,将所述分词数组中的每个字段分别与所述数据类型对应的预设数据库的所述关联集合中的每个所述预设关键词进行匹配。
10.可选地,所述数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。
11.可选地,还包括:获取终端用户权限级别;根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
12.第二方面,本技术提供一种科技成果转化数据查询系统,采用如下的技术方案:一种科技成果转化数据查询系统,包括:数据获取模块,用于获取查询关键词;数据处理模块,用于将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;
数据管理模块,用于在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;所述数据处理模块还用于将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;所述数据处理模块还用于将所述查询结果列表返回至终端用户。
13.第三方面,本技术提供一种智能终端,采用如下的技术方案:一种智能终端,包括存储器、处理器,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行上述的方法。
14.第四方面,本技术提供一种计算机可读存储介质,采用如下的技术方案:一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器加载时,执行上述的方法。
15.综上所述,本技术包括以下至少一种有益技术效果:本技术根据预设数据库中词的权重提取预设关键词,并将关键词与相应地数据结果列表进行关联,便于在终端用户查询时直接与预设关键词进行匹配,以便于快速、准确地输出查询结果;本技术针对终端用户输入的查询关键词进行分词处理,并将分词数据的每个字段与预设关键词进行匹配,提高了查询结果的完整性和准确性;本技术通过预设筛选信息,并将筛选信息与相应的筛选列表进行关联,便于终端用户直接根据预设筛选信息进行查询,不仅方便终端用户使用,也有效提高了查询速度;本技术对数据类型进行分类,将不同的数据类型分别建立对应的预设数据库,便于终端用户快速、准确地得到查询结果。
附图说明
16.图1是本技术实施例的流程示意图。
具体实施方式
17.以下结合附图1对本技术作进一步详细说明。
18.本技术实施例公开一种科技成果转化数据查询方法。
19.参照图1,一种科技成果转化数据查询方法,包括:步骤s101:获取查询关键词。
20.具体地,终端用户通过文本输入或选择框触发指令,进而获取查询关键词str。
21.步骤s102:将查询关键词str进行分词处理,得到包含若干个字段的分词数组,并输出分词数组resultarr={str1,str2,...,strn}。
22.步骤s103:在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:步骤s1031:获取预设数据库中的若干个数据主题。
23.步骤s1032:将数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算数据主题中每个词出现的概率及权重。
24.具体地,若词与词在同一窗口内,则词出现的概率为:;其中,表示词出现的概率,表示词出现的概率,表示词和词有关联的概率。
25.由上述计算方式可得,在其中一个数据主题中词出现的概率为:;其中,表示词出现的概率,表示词出现的概率,表示词和词有关联的概率,表示预设关键词关联到预设关键词的数目,表示词的出链数目,表示设定的窗口大小。
26.词a的权重计算公式为:;其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目。
27.对于词,根据训练得到词在每个数据主题中的分布,且可把概率值根据跳转概率得到,则在其中一个数据主题中词的权重为:;
28.其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目。
29.步骤s1033:计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
30.具体地,在所有数据主题中词的总权重为:;其中,表示词的总权重,表示词在其中一个数据主
题中的权重,表示词在其中一个数据主题中出现的概率。
31.在本实施例中,根据每个词的总权重高低排序,取总权重排序处于前1000的词进行提取关键词。
32.进一步地,将关键词与相应数据进行关联,关键词为key,相应数据列表为value,得到关联集合key-value。
33.其中,系统用户能够对预设数据库中的数据进行新增、删除、编辑、查询等操作,以保证数据是最新的、正确的、有效的信息。
34.步骤s104:将分词数组中的每个字段分别与关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表,具体包括:步骤s1041:循环分词数组resultarr={str1,str2,...,strn},读取分词数组中第一个值str1。
35.步骤s1042:循环关联集合key-value。
36.步骤s1043:将str1与循环关联集合key-value中的每一个关键词key进行匹配,若匹配,则将该关键词key相应的数据列表为value加入查询结果列表resultlist,结束本次循环。
37.步骤s1044:读取分词数组中下一个值,并再次执行步骤步骤s1043,直至读取分词数组中最后一个值strn后结束。
38.步骤s105:将查询结果列表resultlist返回至终端用户。
39.其中,还包括获取终端用户权限级别,并根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
40.在本技术的另一实施例中,步骤s101中还包括获取数据类型,若干个数据类型分别对应不同的预设数据库。
41.具体地,在本实施例中,数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。其中,产业数据对应的预设数据库为产业数据库,专家数据对应的预设数据库为专家数据库,成果数据对应的预设数据库为成果数据库,投资机构数据对应的预设数据库为投资机构数据库,科技政策数据对应的预设数据库为科技政策数据库,报告数据对应的预设数据库为报告数据库。
42.相应地,步骤s103中对每种类型的预设数据库分别提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合。
43.步骤s104中将分词数组中的每个字段分别与获取的数据类型对应的预设数据库形成的关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表。
44.通过上述查询方法,能够对预设数据库中的数据进行分析,根据数据中词的权重得到预设关键词,便于在终端用户查询时直接与预设关键词进行匹配,以便于快速、准确地输出查询结果。
45.除了上述能够根据预设数据库得到预设关键词的方式,本技术还能够直接预设筛选信息,进一步便于终端用户进行查询。
46.具体地,在本技术的另一实施例中,一种科技成果转化数据查询方法还包括:根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设
筛选信息与相应的筛选列表进行关联;获取用户筛选信息,用户筛选信息为预设筛选信息中的一种或多种;根据用户筛选信息,将相应的筛选列表加入筛选结果列表;将筛选结果列表返回至终端用户。
47.在本实施例中,产业数据库的预设筛选信息包括产业名称、地区、融资阶段和所属行业;专家数据库的预设筛选信息包括专家名称和所属地区;成果数据库的预设筛选信息包括成果名称、所属地区和所属行业;投资机构数据库的预设筛选信息包括投资机构名称;科技政策数据库的预设筛选信息包括政策名称、政策类型和省份;报告数据库的预设筛选信息包括报告名称、行业领域和报告年份。
48.本实施例还公开一种科技成果转化数据查询系统。
49.一种科技成果转化数据查询系统,包括:终端用户模块,用于管理终端用户的数据。
50.其中,每个终端用户均拥有唯一账号,终端用户数据还包括姓名、手机号、单位、职位、所在地、用户权限级别。
51.系统用户模块,用于管理查询系统。
52.其中,每个系统用户均拥有唯一账号,系统用户能够对系统管理的数据进行新增、删除、编辑、查询等操作。
53.数据获取模块,用于获取查询关键词。
54.具体地,终端用户通过文本输入或选择框触发指令,进而获取查询关键词str。
55.数据处理模块,将查询关键词str进行分词处理,得到包含若干个字段的分词数组,并输出分词数组resultarr={str1,str2,...,strn}。
56.数据管理模块,用于在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:在预设数据库中提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合,具体包括:获取预设数据库中的若干个数据主题;将数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算数据主题中每个词出现的概率及权重。
57.具体地,若词与词在同一窗口内,则词出现的概率为:;其中,表示词出现的概率,表示词出现的概率,表示词和词有关联的概率。
58.由上述计算方式可得,在其中一个数据主题中词出现的概率为:;其中,表示词出现的概率,表示词出现的概率,表示
词和词有关联的概率,表示预设关键词关联到预设关键词的数目,表示词的出链数目,表示设定的窗口大小。
59.词a的权重计算公式为:;其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目。
60.对于词,根据训练得到词在每个数据主题中的分布,且可把概率值根据跳转概率得到,则在其中一个数据主题中词的权重为:;
61.其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目。
62.计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。
63.具体地,在所有数据主题中词的总权重为:;其中,表示词的总权重,表示词在其中一个数据主题中的权重,表示词在其中一个数据主题中出现的概率。
64.在本实施例中,根据每个词的总权重高低排序,取总权重排序处于前1000的词进行提取关键词。
65.进一步地,将关键词与相应数据进行关联,关键词为key,相应数据列表为value,得到关联集合key-value。
66.数据处理模块还用于将分词数组中的每个字段分别与关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表,具体包括:循环分词数组resultarr={str1,str2,...,strn},读取分词数组中第一个值str1;
循环关联集合key-value;将str1与循环关联集合key-value中的每一个关键词key进行匹配,若匹配,则将该关键词key相应的数据列表为value加入查询结果列表resultlist,结束本次循环;读取分词数组中下一个值,并再次执行步骤步骤s1043,直至读取分词数组中最后一个值strn后结束。
67.数据处理模块还用于将查询结果列表返回至终端用户。
68.权限管理模块,用于获取终端用户权限级别,并根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。
69.在本技术的另一实施例中,数据获取模块还用于获取数据类型,若干个数据类型分别对应不同的预设数据库。
70.具体地,在本实施例中,数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。其中,产业数据对应的预设数据库为产业数据库,专家数据对应的预设数据库为专家数据库,成果数据对应的预设数据库为成果数据库,投资机构数据对应的预设数据库为投资机构数据库,科技政策数据对应的预设数据库为科技政策数据库,报告数据对应的预设数据库为报告数据库。
71.系统用户能够对上述预设数据库进行新增、删除、编辑、查询等操作。
72.相应地,数据管理模块还用于对每种类型的预设数据库分别提取预设关键词,并将每个预设关键词与相应的数据结果列表进行关联,得到关联集合。
73.数据处理模块还用于将分词数组中的每个字段分别与获取的数据类型对应的预设数据库形成的关联集合中的每个预设关键词进行匹配,匹配成功后将与预设关键词关联的数据结果列表加入查询结果列表。
74.在本技术的另一实施例中,数据管理模块还用于根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;相应地,数据获取模块还用于获取用户筛选信息,用户筛选信息为预设筛选信息中的一种或多种;数据处理模块还用于根据用户筛选信息,将相应的筛选列表加入筛选结果列表,并将筛选结果列表返回至终端用户。
75.在本实施例中,产业数据库的预设筛选信息包括产业名称、地区、融资阶段和所属行业;专家数据库的预设筛选信息包括专家名称和所属地区;成果数据库的预设筛选信息包括成果名称、所属地区和所属行业;投资机构数据库的预设筛选信息包括投资机构名称;科技政策数据库的预设筛选信息包括政策名称、政策类型和省份;报告数据库的预设筛选信息包括报告名称、行业领域和报告年份。
76.本实施例还公开一种智能终端,包括存储器、处理器,存储器中用于存储能够在处理器上运行的计算机程序,处理器加载计算机程序时,执行上述的方法。
77.本实施例还公开一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器加载时,执行上述的方法。
78.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的
普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
79.在本发明的描述中,除非另有说明,术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
80.最后应说明的是,上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
技术特征:
1.一种科技成果转化数据查询方法,其特征在于,包括:获取查询关键词;将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;将所述查询结果列表返回至终端用户。2.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,所述在预设数据库中提取预设关键词,包括:获取预设数据库中的若干个数据主题;将所述数据主题中的每个词作为节点,词与词共同出现在同一窗口内作为节点与节点之间的链,计算所述数据主题中每个词出现的概率及权重;计算每个词在所有数据主题中的总权重,并根据每个词的总权重高低排序靠前的一部分提取预设关键词。3.根据权利要求2所述的科技成果转化数据查询方法,其特征在于,计算所述数据主题中的每个词出现的概率及权重,以及计算每个词在所有数据主题中的总权重,包括:在其中一个所述数据主题中词出现的概率为:;其中,表示词出现的概率,表示词出现的概率,表示词和词有关联的概率,表示预设关键词关联到预设关键词的数目,表示词的出链数目,表示设定的窗口大小;在其中一个所述数据主题中词的权重为:;其中,表示词的权重,表示词的权重,表示词出现的概率,表示词出现的概率,表示随机设定的概率,表示设定的窗口大小,表示词的入链数目,表示词和词同时出现的概率乘积,表示词的出链数目;在所有数据主题中词的总权重为:;其中,表示词的总权重,表示词在其中一个数据主题中的权重,表示词在其中一个数据主题中出现的概率。
4.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:根据预设筛选信息对预设数据库中的数据进行筛选分别得到筛选列表,并将预设筛选信息与相应的筛选列表进行关联;获取用户筛选信息,所述用户筛选信息为预设筛选信息中的一种或多种;根据用户筛选信息,将相应的筛选列表加入筛选结果列表;将所述筛选结果列表返回至终端用户。5.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:获取数据类型;若干个所述数据类型分别对应不同的预设数据库;根据获取的数据类型,将所述分词数组中的每个字段分别与所述数据类型对应的预设数据库的所述关联集合中的每个所述预设关键词进行匹配。6.根据权利要求5所述的科技成果转化数据查询方法,其特征在于,所述数据类型包括产业数据、专家数据、成果数据、投资机构数据、科技政策数据、报告数据。7.根据权利要求1所述的科技成果转化数据查询方法,其特征在于,还包括:获取终端用户权限级别;根据终端用户权限级别对查询结果列表中部分内容或全部内容进行分级显示/隐藏处理。8.一种科技成果转化数据查询系统,其特征在于,包括:数据获取模块,用于获取查询关键词;数据处理模块,用于将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;数据管理模块,用于在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;所述数据处理模块还用于将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;所述数据处理模块还用于将所述查询结果列表返回至终端用户。9.一种智能终端,包括存储器、处理器,其特征在于,所述存储器中用于存储能够在所述处理器上运行的计算机程序,所述处理器加载计算机程序时,执行权利要求1-7中任一项所述的方法。10.一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其特征在于,所述计算机程序被处理器加载时,执行权利要求1-7中任一项所述的方法。
技术总结
本申请涉及一种科技成果转化数据查询方法、系统、终端及存储介质,涉及数据查询的领域,其包括获取查询关键词;将所述查询关键词进行分词处理,得到包含若干个字段的分词数组;在预设数据库中提取预设关键词,并将每个所述预设关键词与相应的数据结果列表进行关联,得到关联集合;将所述分词数组中的每个字段分别与所述关联集合中的每个所述预设关键词进行匹配,匹配成功后将与所述预设关键词关联的所述数据结果列表加入查询结果列表;将所述查询结果列表返回至终端用户。本申请具有便于快速、准确地输出查询结果的效果。准确地输出查询结果的效果。准确地输出查询结果的效果。
技术研发人员:张佩佩 房玉峰 张潘丽
受保护的技术使用者:天津联创科技发展有限公司
技术研发日:2023.06.13
技术公布日:2023/7/17
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
