一种孕育知识的知识管理方法和系统与流程

未命名 08-15 阅读:73 评论:0


1.本发明涉及数据挖掘技术领域,尤其是一种孕育知识的知识管理方法和系统。


背景技术:

2.现在中国每年有1700万新生儿人口,而每年怀孕的人群还大于这个数字,如何让更多的人掌握正确的孕育知识与方法,以至如何根据每个人的所处环境与个体差异,进行个性化指导,使优生优育的质量不断提高,是每个家庭乃至社会需要不断解决的问题。
3.现有技术中,通过机器学习的方式对孕育知识基于相关性进行组织和优化,未对孕育知识中包含的隐性知识进行挖掘,无法为用户提供孕育知识隐性知识的参考,提高用户对孕育知识的认知。


技术实现要素:

4.本发明的目的是通过提出一种孕育知识的知识管理方法和系统,以解决上述背景技术中提出的缺陷。
5.本发明采用的技术方案如下:
6.提供一种孕育知识的知识管理方法,包括如下步骤:
7.s1:通过多渠道采集孕育知识数据;
8.s2:对采集的孕育知识数据进行预处理操作;
9.s3:对预处理完成后的孕育知识数据基于知识挖掘算法进行孕育知识数据的挖掘;
10.s4:对经过挖掘获取的孕育知识集进行搜索索引创建供用户查询。
11.作为本发明的一种优选技术方案:所述s1的多渠道采集孕育知识数据具体包括电脑端、移动设备端及手动采集的方式采集孕育知识数据。
12.作为本发明的一种优选技术方案:所述s2对获取的孕育知识数据进行整理、清洗,并将获取的孕育知识数据进行分词、去停词、去标点符号、大写变小写的词法分析操作后,形成由一系列词组成的孕育知识数据集。
13.作为本发明的一种优选技术方案:所述知识挖掘算法基于cart算法与改进的遗传算法相结合对孕育知识数据进行挖掘。
14.作为本发明的一种优选技术方案:所述cart算法具体如下:
15.设x1,x2,

,xn表示孕育知识数据的某个样本中包含的n个属性,用y表示属性所属类别,每个属性都有一个固定的输出值;选取孕育知识数据集中第j个属性xj和属性xj的取值z作为回归树的切分点,由此点将孕育知识数据集分割成x1=(j,z)={x|x(j)≤z}、x2=(j,z)={x|x(j)>z}两个区域,寻找最佳切分点xj,即计算出平方差最小值的点:
16.17.其中,y1表示区域x1中的孕育知识数据x1属性类别,c1表示区域x1中的孕育知识数据x1的输出值,y2表示区域x2中的孕育知识数据x2属性类别,c2表示区域x2中的孕育知识数据x2的输出值;
18.采用递归的方式将孕育知识数据集的n维空间界分成互补重叠的矩形,通过计算基尼指数选定最佳的特征属性,并通过基尼指数决定该属性的最佳二值切分点;
19.设孕育知识数据集d有某一点属于第k类的概率为pk,概率分布的基尼指数g(p)为:
[0020][0021]
在孕育数据孕育知识数据集d中确定属性f存在某一点f将孕育知识数据集划分为d1和d2两个区域d1={(x,y)∈d|f(x)=f),d2=d,其中,x表示孕育知识数据,y表示孕育知识数据x的属性类别,f(x)=f表示孕育知识数据为x时的取值为f,在属性f这一固定属性下,孕育知识数据集d的基尼指数g(d,f)为:
[0022][0023]
其中,g(d1)表示孕育知识数据子集d1的基尼指数,g(d2)表示孕育知识数据子集d2的基尼指数;
[0024]
以孕育知识数据的信息增益作为适应度函数,生成决策树,所述适应度函数gain(f)具体如下:
[0025][0026]
其中,pi表示孕育知识数据集中有某一点属于第i类的概率,dj表示以第j个属性孕育知识数据划分孕育知识数据集获取的孕育知识数据子集。
[0027]
作为本发明的一种优选技术方案:所述决策树生成具体如下:
[0028]
对孕育知识数据集进行编码生成初始种群,以孕育知识数据的信息增益作为适应度函数,对孕育知识数据进行知识挖掘和属性划分,计算种群个体适应度,以被选中的孕育知识数据作为主导种群,未被选择的孕育知识数据作为辅助种群,对主导种群个体进行自适应交叉操作和自适应变异操作,判断是否满足收敛条件,满足则结束,不满足则对幅值种群个体进行自适应交叉和自适应变异操作,增加迭代次数,重新返回计算个体适应度并执行后续步骤至收敛,即将孕育知识数据对应的种群个体按照属性划分为同一类。
[0029]
作为本发明的一种优选技术方案:所述s3中的自适应交叉操作具体如下:
[0030][0031]
[0032]
其中,pa表示主导种群的交叉概率,p
a1
和p
a2
分别表示主导种群的最小交叉概率和最大交叉概率;pb表示辅助种群的交叉概率,p
b1
和p
b2
分别表示辅助种群的最小交叉概率和最大交叉概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值;
[0033]
所述s3中的自适应变异操作具体如下:
[0034][0035][0036]
其中,pa表示主导种群的变异概率,p
a1
和p
a2
分别表示主导种群的最小变异概率和最大变异概率;pb表示辅助种群的变异概率,p
b1
和p
b2
分别表示辅助种群的最小变异概率和最大变异概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值。
[0037]
作为本发明的一种优选技术方案:所述决策树生成后,设决策树的叶子节点数为l,损失函数δ(t)定义为:
[0038]
δ(t)=σ(t)+τ|l|
[0039]
其中,σ(t)表示叶子节点t的预测误差,τ表示模型参数,|l|表示模型的复杂度;
[0040]
计算每一个叶子节点的经验熵,从叶子节点开始往上递归遍历各个节点,判断删除某一叶节点后损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;遍历所有节点,直到判断完所有节点为止。
[0041]
作为本发明的一种优选技术方案:所述s4中搜索索引的创建步骤如下:
[0042]
s4.1:基于知识挖掘算法挖掘结果生成孕育知识集;
[0043]
s4.2:创建查询语句;
[0044]
s4.3:对进行词法分析形成一系列词;
[0045]
s4.4:利用决策树进行搜索索引,获得与查询语句相关的索引知识,对知识进行交、差、并操作得到结果知识集;
[0046]
s4.5:计算s4.4的结果知识与查询语句的相关性;
[0047]
s4.6:根据相关性对查询结果进行排序输出。
[0048]
提供一种孕育知识的知识管理系统,包括:
[0049]
知识采集模块:用于通过多渠道采集孕育知识;
[0050]
知识预处理模块:用于对采集的孕育知识进行整理和清洗;
[0051]
知识挖掘模块:用于预处理完成后的孕育知识基于知识挖掘算法进行孕育知识的挖掘;
[0052]
索引创建模块:用于对孕育知识集进行搜索索引创建以供用户查询。
[0053]
本发明提供的孕育知识的知识管理方法和系统,与现有技术相比,其有益效果有:
[0054]
本发明通过对孕育数据进行收集、挖掘,获取不同孕育数据之间的联系,为用户提供隐性孕育知识的参考,得到隐含在孕育知识中的隐性孕育知识规则,提高孕育知识的科学性,并提高用户对孕育知识的认知;并生成决策树,便于孕育数据的归类和用户的查询,有助于提高优生优育质量,降低母婴患病概率。
附图说明
[0055]
图1为本发明优选实施例的方法流程图;
[0056]
图2为本发明优选实施例中系统框图。
[0057]
图中各个标记的意义为:100、知识采集模块;200、知识预处理模块;300、知识挖掘模块;400、索引创建模块。
具体实施方式
[0058]
需要说明的是,在不冲突的情况下,本实施例中的实施例及实施例中的特征可以相互组合,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0059]
参照图1,本发明优选实施例提供了一种孕育知识的知识管理方法,包括如下步骤:
[0060]
s1:通过多渠道采集孕育知识数据;
[0061]
s2:对采集的孕育知识数据进行预处理操作;
[0062]
s3:对预处理完成后的孕育知识数据基于知识挖掘算法进行孕育知识数据的挖掘;
[0063]
s4:对经过挖掘获取的孕育知识集进行搜索索引创建供用户查询。
[0064]
所述s1的多渠道采集孕育知识数据具体包括电脑端、移动设备端及手动采集的方式采集孕育知识数据。
[0065]
所述s2对获取的孕育知识数据进行整理、清洗,并将获取的孕育知识数据进行分词、去停词、去标点符号、大写变小写的词法分析操作后,形成由一系列词组成的孕育知识数据集。
[0066]
所述知识挖掘算法基于cart算法与改进的遗传算法相结合对孕育知识数据进行挖掘。
[0067]
所述cart算法具体如下:
[0068]
设x1,x2,

,xn表示孕育知识数据的某个样本中包含的n个属性,用y表示属性所属类别,每个属性都有一个固定的输出值;选取孕育知识数据集中第j个属性xj和属性xj的取值z作为回归树的切分点,由此点将孕育知识数据集分割成x1=(j,z)={x|x(j)≤z}、x2=(j,z)={x|x(j)>z}两个区域,寻找最佳切分点xj,即计算出平方差最小值的点:
[0069][0070]
其中,y1表示区域x1中的孕育知识数据x1属性类别,c1表示区域x1中的孕育知识数据x1的输出值,y2表示区域x2中的孕育知识数据x2属性类别,c2表示区域x2中的孕育知识数据x2的输出值;
[0071]
采用递归的方式将孕育知识数据集的n维空间界分成互补重叠的矩形,通过计算基尼指数选定最佳的特征属性,并通过基尼指数决定该属性的最佳二值切分点;
[0072]
设孕育知识数据集d有某一点属于第k类的概率为pk,概率分布的基尼指数g(p)为:
[0073][0074]
在孕育数据孕育知识数据集d中确定属性f存在某一点f将孕育知识数据集划分为d1和d2两个区域d1={(x,y)∈d|f(x)=f},d2=d,其中,x表示孕育知识数据,y表示孕育知识数据x的属性类别,f(x)=f表示孕育知识数据为x时的取值为f,在属性f这一固定属性下,孕育知识数据集d的基尼指数g(d,f)为:
[0075][0076]
其中,g(d1)表示孕育知识数据子集d1的基尼指数,g(d2)表示孕育知识数据子集d2的基尼指数;
[0077]
以孕育知识数据的信息增益作为适应度函数,生成决策树,所述适应度函数gain(f)具体如下:
[0078][0079]
其中,pi表示孕育知识数据集中有某一点属于第i类的概率,dj表示以第j个属性孕育知识数据划分孕育知识数据集获取的孕育知识数据子集。
[0080]
所述决策树生成具体如下:
[0081][0082]
其中,
[0083][0084]
m是属性f的取值个数;
[0085]
|dj|和|d|分别表示子集dj和总数据集d的大小。
[0086]
通过使用信息增益率作为适应度函数,可以在一定程度上克服信息增益的缺陷,从而在生成决策树时更好地选择分裂属性。
[0087]
对孕育知识数据集进行编码生成初始种群,以孕育知识数据的信息增益作为适应
度函数,对孕育知识数据进行知识挖掘和属性划分,计算种群个体适应度,以被选中的孕育知识数据作为主导种群,未被选择的孕育知识数据作为辅助种群,对主导种群个体进行自适应交叉操作和自适应变异操作,判断是否满足收敛条件,满足则结束,不满足则对幅值种群个体进行自适应交叉和自适应变异操作,增加迭代次数,重新返回计算个体适应度并执行后续步骤至收敛,即将孕育知识数据对应的种群个体按照属性划分为同一类。
[0088]
其中,适应度函数gain(f)信息增益在选择分裂属性时可能偏向于具有更多取值的属性,因为这样的属性往往能产生更多的分支,从而使得信息熵降低。但这并不意味着具有更多取值的属性一定是最佳分裂属性。为了解决这个问题,本实施例使用信息增益率对其进行改进。
[0089]
信息增益率在计算过程中引入了一个属性的固有值作为归一化因子,降低了具有更多取值的属性的权重。具体定义如下:
[0090]
所述s3中的自适应交叉操作具体如下:
[0091][0092][0093]
其中,pa表示主导种群的交叉概率,p
a1
和p
a2
分别表示主导种群的最小交叉概率和最大交叉概率;pb表示辅助种群的交叉概率,p
b1
和p
b2
分别表示辅助种群的最小交叉概率和最大交叉概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max、fb,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值;
[0094]
所述s3中的自适应变异操作具体如下:
[0095][0096][0097]
其中,pa表示主导种群的变异概率,p
a1
和p
a2
分别表示主导种群的最小变异概率和最大变异概率;pb表示辅助种群的变异概率,p
b1
和p
b2
分别表示辅助种群的最小变异概率和最大变异概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max、fb,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值。
[0098]
所述决策树生成后,设决策树的叶子节点数为l,损失函数δ(t)定义为:
[0099]
δ(t)=σ(t)+τ|l|
[0100]
其中,σ(t)表示叶子节点t的预测误差,τ表示模型参数,|l|表示模型的复杂度;
[0101]
计算每一个叶子节点的经验熵,从叶子节点开始往上递归遍历各个节点,判断删除某一叶节点后损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;遍历所有节点,直到判断完所有节点为止。
[0102]
所述s4中搜索索引的创建步骤如下:
[0103]
s4.1:基于知识挖掘算法挖掘结果生成孕育知识集;
[0104]
s4.2:创建查询语句;
[0105]
s4.3:对进行词法分析形成一系列词;
[0106]
s4.4:利用决策树进行搜索索引,获得与查询语句相关的索引知识,对知识进行交、差、并操作得到结果知识集;
[0107]
s4.5:计算s4.4的结果知识与查询语句的相关性;
[0108]
s4.6:根据相关性对查询结果进行排序输出。
[0109]
参照图2,提供一种孕育知识的知识管理系统,包括:
[0110]
知识采集模块100:用于通过多渠道采集孕育知识;
[0111]
知识预处理模块200:用于对采集的孕育知识进行整理和清洗;
[0112]
知识挖掘模块300:用于预处理完成后的孕育知识基于知识挖掘算法进行孕育知识的挖掘;
[0113]
索引创建模块400:用于对孕育知识集进行搜索索引创建以供用户查询。
[0114]
本实施例中,知识采集模块100通过电脑端,如网页、app等,移动设备端,如手机端,智能手环等设备,以及手动采集的数据,如衣物等采集的孕育知识数据,其中孕育知识还包括母婴知识,对采集的各种孕育知识数据进行整理和清洗,知识预处理模块200将获取的孕育数据进行分词、去停词、去标点符号、大写变小写等词法分析操作后,形成由一系列词组成的孕育知识数据集。
[0115]
知识挖掘模块300进行如下的孕育知识挖掘操作,设x1,x2,

,x
50
表示孕育知识数据的某个样本中包含的50个属性,选取孕育知识数据集中第25个属性x
25
和属性x
25
的取值z作为回归树的切分点,由此点将孕育知识数据集分割成x1=(25,z)={x|x(25)≤z}、x2=(25,z)={x|x(25)>z}两个区域,寻找最佳切分点x
25
,即计算出平方差最小值的点:
[0116][0117]
其中,y1表示区域x1中的孕育知识数据x1属性类别,c1表示区域x1中的孕育知识数据x1的输出值,y2表示区域x2中的孕育知识数据x2属性类别,c2表示区域x2中的孕育知识数据x2的输出值;
[0118]
采用递归的方式将孕育知识数据集的50维空间界分成互补重叠的矩形,通过计算基尼指数选定最佳的特征属性,并通过基尼指数决定该属性的最佳二值切分点;
[0119]
设孕育知识数据集d有某一点属于第k类的概率为pk,概率分布的基尼指数g(p)为:
[0120][0121]
在孕育数据孕育知识数据集d中确定属性f存在某一点f将孕育知识数据集划分为
d1和d2两个区域d1={(x,y)∈d|f(x)=f),d2=d,其中,x表示孕育知识数据,y表示孕育知识数据x的属性类别,f(x)=f表示孕育知识数据为x时的取值为f,在属性f这一固定属性下,孕育知识数据集d的基尼指数g(d,f)为:
[0122][0123]
其中,g(d1)表示孕育知识数据子集d1的基尼指数,g(d2)表示孕育知识数据子集d2的基尼指数;
[0124]
以孕育知识数据的信息增益作为适应度函数,生成决策树,所述适应度函数gain(f)具体如下:
[0125][0126]
其中,pi表示孕育知识数据集中有某一点属于第i类的概率,d
25
表示以第25个属性孕育知识数据划分孕育知识数据集获取的孕育知识数据子集。
[0127]
对孕育知识数据集进行编码生成初始种群,以孕育知识数据的信息增益作为适应度函数,对孕育知识数据进行属性划分,计算种群个体适应度,以被选中的孕育知识数据作为主导种群,未被选择的孕育知识数据作为辅助种群,对主导种群个体进行自适应交叉操作:
[0128][0129][0130]
其中,pa表示主导种群的交叉概率,p
a1
和p
a2
分别表示主导种群的最小交叉概率和最大交叉概率;pb表示辅助种群的交叉概率,p
b1
和p
b2
分别表示辅助种群的最小交叉概率和最大交叉概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值;
[0131]
和自适应变异操作:
[0132][0133][0134]
其中,pa表示主导种群的变异概率,p
a1
和p
a2
分别表示主导种群的最小变异概率和最大变异概率;pb表示辅助种群的变异概率,p
b1
和p
b2
分别表示辅助种群的最小变异概率和最大变异概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表
示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值。
[0135]
对孕育知识数据进行交叉和变异以进行孕育知识的挖掘。挖掘完成后判断是否满足收敛条件,满足则结束,不满足则对幅值种群个体进行自适应交叉和自适应变异操作,增加迭代次数,重新返回计算个体适应度并执行后续步骤至收敛,即将孕育知识数据对应的种群个体按照属性划分为同一类。
[0136]
按照属性相同的孕育知识数据为一类进行决策树生成,决策树生成后,设决策树的叶子节点数为500,第150个叶子节点的损失函数δ(150)定义为:
[0137]
δ(150)=σ(150)+τ|l|
[0138]
其中,σ(150)表示第150个叶子节点的预测误差,τ表示模型参数,|l|表示模型的复杂度;
[0139]
计算每一个叶子节点的经验熵,从叶子节点开始往上递归遍历各个节点,判断删除某一叶节点后损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;遍历所有节点,直到判断完所有节点为止。至此决策树完成创建,并以此生成孕育知识集,索引创建模块400采集用户查询语句,对查询语句进行词法分析形成一系列词;利用决策树进行搜索索引,获得与查询语句相关的索引知识,对知识进行交、差、并操作得到结果知识集;计算结果知识与查询语句的相关性;根据相关性进行排序,按照相关性从高到低的顺序进行输出显示。
[0140]
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0141]
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

技术特征:
1.一种孕育知识的知识管理方法,其特征在于:包括如下步骤:s1:通过多渠道采集孕育知识数据;s2:对采集的孕育知识数据进行预处理操作;s3:对预处理完成后的孕育知识数据基于知识挖掘算法进行孕育知识数据的挖掘;s4:对经过挖掘获取的孕育知识集进行搜索索引创建供用户查询。2.根据权利要求1所述的孕育知识的知识管理方法,其特征在于:所述s1的多渠道采集孕育知识数据具体包括电脑端、移动设备端及手动采集的方式采集孕育知识数据。3.根据权利要求1所述的孕育知识的知识管理方法,其特征在于:所述s2对获取的孕育知识数据进行整理、清洗,并将获取的孕育知识数据进行分词、去停词、去标点符号、大写变小写的词法分析操作后,形成由一系列词组成的孕育知识数据集。4.根据权利要求1所述的孕育知识的知识管理方法,其特征在于:所述知识挖掘算法基于cart算法与改进的遗传算法相结合对孕育知识数据进行挖掘。5.根据权利要求4所述的孕育知识的知识管理方法,其特征在于:所述cart算法具体如下:设x1,x2,

,x
n
表示孕育知识数据的某个样本中包含的n个属性,用y表示属性所属类别,每个属性都有一个固定的输出值;选取孕育知识数据集中第j个属性x
j
和属性x
j
的取值z作为回归树的切分点,由此点将孕育知识数据集分割成x1=(j,z)={x|x(j)≤z}、x2=(j,z)={x|x(j)>z}两个区域,寻找最佳切分点x
j
,即计算出平方差最小值的点:其中,y1表示区域x1中的孕育知识数据x1属性类别,c1表示区域x1中的孕育知识数据x1的输出值,y2表示区域x2中的孕育知识数据x2属性类别,c2表示区域x2中的孕育知识数据x2的输出值;采用递归的方式将孕育知识数据集的n维空间界分成互补重叠的矩形,通过计算基尼指数选定最佳的特征属性,并通过基尼指数决定该属性的最佳二值切分点;设孕育知识数据集d有某一点属于第k类的概率为p
k
,概率分布的基尼指数g(p)为:在孕育数据孕育知识数据集d中确定属性f存在某一点f将孕育知识数据集划分为d1和d2两个区域d1={(x,y)∈d|f(x)=f},d2=d,其中,x表示孕育知识数据,y表示孕育知识数据x的属性类别,f(x)=f表示孕育知识数据为x时的取值为f,在属性f这一固定属性下,孕育知识数据集d的基尼指数g(d,f)为:其中,g(d1)表示孕育知识数据子集d1的基尼指数,g(d2)表示孕育知识数据子集d2的基尼指数;以孕育知识数据的信息增益作为适应度函数,生成决策树,所述适应度函数gain(f)具
体如下:其中,p
i
表示孕育知识数据集中有某一点属于第i类的概率,d
j
表示以第j个属性孕育知识数据划分孕育知识数据集获取的孕育知识数据子集。6.根据权利要求5所述的孕育知识的知识管理方法,其特征在于:所述决策树生成具体如下:对孕育知识数据集进行编码生成初始种群,以孕育知识数据的信息增益作为适应度函数,对孕育知识数据进行知识挖掘和属性划分,计算种群个体适应度,以被选中的孕育知识数据作为主导种群,未被选择的孕育知识数据作为辅助种群,对主导种群个体进行自适应交叉操作和自适应变异操作,判断是否满足收敛条件,满足则结束,不满足则对幅值种群个体进行自适应交叉和自适应变异操作,增加迭代次数,重新返回计算个体适应度并执行后续步骤至收敛,即将孕育知识数据对应的种群个体按照属性划分为同一类。7.根据权利要求6所述的孕育知识的知识管理方法,其特征在于:所述s3中的自适应交叉操作具体如下:叉操作具体如下:其中,p
a
表示主导种群的交叉概率,p
a1
和p
a2
分别表示主导种群的最小交叉概率和最大交叉概率;p
b
表示辅助种群的交叉概率,p
b1
和p
b2
分别表示辅助种群的最小交叉概率和最大交叉概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表示主导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值;所述s3中的自适应变异操作具体如下:所述s3中的自适应变异操作具体如下:其中,p
a
表示主导种群的变异概率,p
a1
和p
a2
分别表示主导种群的最小变异概率和最大变异概率;p
b
表示辅助种群的变异概率,p
b1
和p
b2
分别表示辅助种群的最小变异概率和最大变异概率;f
ai
、f
bi
分别表示主导种群个体和辅助种群个体的适应度,f
a,max
、f
b,max
分别表示主
导种群个体和辅助种群个体的适应度最大值,分别表示主导种群个体和辅助种群个体的适应度平均值。8.根据权利要求7所述的孕育知识的知识管理方法,其特征在于:所述决策树生成后,设决策树的叶子节点数为l,损失函数δ(t)定义为:δ(t)=σ(t)+τ|l|其中,σ(t)表示叶子节点t的预测误差,τ表示模型参数,|l|表示模型的复杂度;计算每一个叶子节点的经验熵,从叶子节点开始往上递归遍历各个节点,判断删除某一叶节点后损失函数的值是否减少,如果减少,则将父节点作为新的叶子节点;遍历所有节点,直到判断完所有节点为止。9.根据权利要求1所述的孕育知识的知识管理方法,其特征在于:所述s4中搜索索引的创建步骤如下:s4.1:基于知识挖掘算法挖掘结果生成孕育知识集;s4.2:创建查询语句;s4.3:对进行词法分析形成一系列词;s4.4:利用决策树进行搜索索引,获得与查询语句相关的索引知识,对知识进行交、差、并操作得到结果知识集;s4.5:计算s4.4的结果知识与查询语句的相关性;s4.6:根据相关性对查询结果进行排序输出。10.一种孕育知识的知识管理系统,基于权利要求1-9任意一项所述的孕育知识的知识管理方法,其特征在于:包括:知识采集模块(100):用于通过多渠道采集孕育知识;知识预处理模块(200):用于对采集的孕育知识进行整理和清洗;知识挖掘模块(300):用于预处理完成后的孕育知识基于知识挖掘算法进行孕育知识的挖掘;索引创建模块(400):用于对孕育知识集进行搜索索引创建以供用户查询。

技术总结
本发明涉及数据挖掘技术领域,尤其为一种孕育知识的知识管理方法和系统,包括如下步骤:通过多渠道采集孕育知识数据;对采集的孕育知识数据进行预处理操作;对预处理完成后的孕育知识数据基于知识挖掘算法进行孕育知识数据的挖掘;对经过挖掘获取的孕育知识集进行搜索索引创建供用户查询。本发明通过对孕育数据进行收集、挖掘,获取不同孕育数据之间的联系,为用户提供隐性孕育知识的参考,得到隐含在孕育知识中的隐性孕育知识规则,提高孕育知识的科学性,并提高用户对孕育知识的认知;并生成决策树,便于孕育数据的归类和用户的查询,有助于提高优生优育质量,降低母婴患病概率。率。率。


技术研发人员:杨钢
受保护的技术使用者:广州盛成妈妈网络科技股份有限公司
技术研发日:2023.05.16
技术公布日:2023/8/14
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐