基于融合万有引力的自然邻搜索的图像聚类方法及系统

未命名 08-24 阅读：244 评论：0

1.本发明属于图像处理技术领域，具体涉及一种基于融合万有引力的自然邻搜索的图像聚类方法及系统。

背景技术：

2.在科学研究中，图像处理是一个非常热门的研究领域。图像聚类是将相同或相似的图像划分到同一簇中，不同的图像划分到不同簇中。通过对图像进行聚类，可实现图像数据的自动分类。
3.目前，常见的图像聚类方法包括：基于k最近邻算法(knn)的图像聚类方法、基于自然邻居的图像聚类方法等。
4.然而，现有的基于knn图像聚类方法中，关键参数(k值)取值的不同会得到完全不同的图像聚类结果；虽然现阶段已经提出了许多基于knn的优化图像聚类方法，无论哪种优化方式，这些参数的确定都要依赖于研究人员的经验知识和大量的实验。另外，现有的基于自然邻居的图像聚类方法虽然解决了传统邻居算法的参数选择难题，但仍然使用传统的距离度量方式作为邻居判断标准，它们在邻居搜索的过程中不能很好的体现图像数据集的整体结构；对噪声点十分敏感，对距离较近的簇边缘点的处理能力也不高，导致图像聚类准确性较低。综上，目前现有的图像聚类方法准确性均较低。
5.因此，如何提高图像聚类准确性，是本领域亟待解决的问题。

技术实现要素：

6.本发明的目的是针对现有技术的缺陷，提供一种基于融合万有引力的自然邻搜索的图像聚类方法及系统。本发明基于融合万有引力的自然邻搜索的图像聚类方法，利用万有引力定律，结合图像数据集的自然结构，选择适当的质量权重计算方式，计算图像数据间的万有引力，通过万有引力来代替传统的距离衡量方式，重新定义图像数据的自然邻居，基于邻居列表，得到图像聚类结果，解决了现有的基于最近邻的图像聚类方法中对参数依赖和基于自然邻的图像聚类方法中对噪声点敏感及对簇边缘的点处理性能不足导致的图像聚类准确性低问题。
7.为了实现以上目的，本发明采用以下技术方案：
8.本文提出一种基于融合万有引力的自然邻搜索的图像聚类方法，其特征在于，包括步骤：
9.s1、获取待聚类的图像数据集；
10.s2、根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离dist(x,y)；具体包括：
11.s21、计算两幅图像之间的相似度ssim(x,y)；
12.由如下公式计算x、y两幅图像之间的相似度，记为ssim(x,y)
[0013][0014]
其中u
x
和uy表示两幅图像灰度的平均值，σ
x
和σy表示两幅图像的标准差，σ
xy
表示两幅图像的协方差；c1和c2为常数，以避免分母等于零,c1和c2的值取决于u和σ；如果分母接近于零，则任意选择c1和c2的值以增加ssim值的稳定性；上式表示两幅图像之间的结构相似性；ssim值越大，表示两幅图像越相似；
[0015]
s22、计算两幅图像之间的距离dist(x,y)；
[0016]
两幅图像之间的距离记为dist(x,y)，计算如下公式：
[0017]
dust(x，y)＝1-ssim(x，y)；
[0018]
s3、基于所述各图像数据之间的距离dist(x,y)，计算所述图像数据集中各图像数据之间的引力；
[0019]
s31、根据自然最近邻居算法构造出饱和邻域图；
[0020]
s32、根据所述饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重，计算方式如下：
[0021][0022]
其中，质量权重m
xy
为图像x的质量m
x
与图像y的质量my的乘积，σ(x，y)表示样图像x与图像y之间的结构相似度,定义为图像节点x和y共享的结构数量与它们各自节点结构数乘积的开方的商；γ(x)表示图像x的节点结构,指图像节点x及其相连节点的集合，γ(y)表示图像y的节点结构,指图像节点y及其相连节点的集合；
[0023]
s33、计算图像x和图像y之间的万有引力；具体计算公式如下：
[0024][0025]
其中，g为万有引力常数，取值为1；my为图像y的质量，m
x
为图像x的质量，r为图像y与x之间的距离，其中r＝dist(x,y)；
[0026]
s4、根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；
[0027]
s41、对于每一个图像数据，在其他所有图像数据中找到对它引力最大那个图像数据，并将其加入该图像数据的邻居列表中；
[0028]
s42、每一轮循环中，在未归入该图像的邻居列表以外的其他所有图像中搜索一个对它引力最大的图像数据加入该图像数据的邻居列表中，直至当所有图像数据都至少有一个其他图像数据把它当作邻居时，整个图像数据集就达到一种引力稳定状态，邻居搜索过程结束；
[0029]
s5、基于所述各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。
[0030]
进一步地，ssim的值为[0,1]。
[0031]
本文提出一种基于融合万有引力的自然邻搜索的图像聚类系统，其特征在于，所
述图像聚类系统执行上述的基于融合万有引力的自然邻搜索的图像聚类方法，包括：图像数据集获取模块、图像间距离计算模块、图像间引力计算模块、图像邻居列表构造模块、图像聚类结果生成模块；
[0032]
所述图像数据集获取模块，用于获取待聚类的图像数据集；
[0033]
所述图像间距离计算模块，用于根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离；
[0034]
所述图像间引力计算模块，用于基于所述各图像数据之间的距离，计算所述图像数据集中各图像数据之间的引力；
[0035]
所述图像邻居列表构造模块，根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；
[0036]
图像聚类结果生成模块，基于各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。
[0037]
本发明还提出一种计算机设备，所述设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现上述的方法。
[0038]
与现有技术相比，具有如下有益效果：
[0039]
本发明的基于融合万有引力的自然邻搜索的图像聚类方法，利用了自然最近邻居无参特性，以及利用万有引力定律，结合图像数据集的自然结构，选择适当的质量权重计算方式，计算图像数据间的万有引力，通过万有引力代替传统的距离衡量方式，重新定义图像数据的自然邻居，基于邻居列表，得到图像聚类结果，提升了图像聚类的准确性。
附图说明
[0040]
为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0041]
图1为本发明实施例提供的基于融合万有引力的自然邻搜索的图像聚类方法示意图。
[0042]
图2为本发明实施例提供的根据自然最近邻居算法构造饱和邻域图的示意图。
[0043]
图3为本发明实施例提供的基于融合万有引力的自然邻搜索的图像聚类系统示意图。
具体实施方式
[0044]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0045]
应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0046]
下面结合附图和具体实施例对本发明作进一步说明，但不作为本发明的限定。
[0047]
还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0048]
还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。
[0049]
术语解释：
[0050]
最近邻：最近邻检索是大数据处理中基础的问题之一，它在机器学习和模式识别等领域有广泛的应用。其主要流程是对海量数据预处理并建立索引，从而可以高效的找到和指定查询最接近的数据对象。最近邻的核心思想是，对于需要预测的数据对象，找到和他距离最近的几个数据对象，并根据这几个数据对象的类别来对新的数据对象做预测。
[0051]
k最近邻居(knn)：就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。cover和hart在1968年提出了最初的邻近算法。knn是一种分类(classification)算法，它输入基于实例的学习(instance-based learning)，属于懒惰学习(lazy learning)即knn没有显式的学习过程，也就是说没有训练阶段，数据集事先已有了分类和特征值，待收到新样本后直接进行处理。
[0052]
自然邻居：自然邻居的核心思想是数据集中最离群的数据对象拥有较少的最近邻居或者说具有最低的能量，而稠密的对象有较多的最近邻居或者较高的能量。可以将自然最近邻看做是一种特殊的k最近邻算法，它自动为每个点赋予了一个不同的k值，另外该算法还确保每个点都有一个最近邻居。如果把k最近邻和ε最近邻的形成过程看做是主动的邻居寻找过程，那么自然最近邻居的形成过程就是一种完全被动的邻居寻找过程。在自然邻居算法中，每个数据点可以自适应地获得不同数量的自然邻居。当所有数据点都至少有一个自然邻居时，整个数据集就变得稳定，搜索过程就结束了。
[0053]
万有引力：万有引力是由牛顿所发现的一种自然规律：任何两个质点都存在通过其连心线方向上的相互吸引力。该引力的大小与它们质量的乘积成正比，与它们距离的平方成反比，与两物体的化学组成和其间介质种类无关。
[0054][0055]
万有引力公式有两个关键参数，一个是质量m，一个是距离r。
[0056]
本发明一种基于融合万有引力的自然邻搜索的图像聚类方法。如图1所示，基于融合万有引力的自然邻搜索的图像聚类方法包括以下步骤s1至s5。
[0057]
s1、获取待聚类的图像数据集。
[0058]
s2、根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离dist(x,y)；具体包括：
[0059]
s21、计算两幅图像之间的相似度ssim(x,y)；
[0060]
由如下公式计算x、y两幅图像之间的相似度，记为ssim(x,y)；
[0061][0062]
其中u
x
和uy表示两幅图像灰度的平均值，σ
x
和σy表示两幅图像的标准差，σ
xy
表示两
幅图像的协方差；c1和c2为常数，以避免分母等于零,c1和c2的值取决于u和σ；如果分母接近于零，则任意选择c1和c2的值以增加ssim值的稳定性；上面的式子表示两幅图像之间的结构相似性；ssim值越大，表示两幅图像越相似；
[0063]
s22、计算两幅图像之间的距离dist(x,y)；
[0064]
两幅图像之间的距离记为dist(x,y)，计算如下公式：
[0065]
dist(x，y)＝1-ssim(x，y)。
[0066]
s3、基于所述各图像数据之间的距离dist(x,y)，计算所述图像数据集中各图像数据之间的引力。
[0067]
质量权重m
yx
的计算：在计算样本点之间的万有引力的时候，我们需要先计算样本的质量，图像数据不是物体，不能直接计算其质量，我们可以通过一种计算图像数据质量权重的方式来代替。在scan算法中定义了结构相似度概念，在这里利用该方法思想来计算质量权重。具体做法是：先根据自然最近邻居算法构造出饱和邻域图，然后根据饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重。具体步骤如下：
[0068]
s31、根据自然最近邻居算法构造出饱和邻域图。
[0069]
根据自然最近邻居算法构造出饱和邻域图具体过程如图2所示。首先利用自然邻居算法，得到每个数据点的自然邻居和特征值参数r。在图2中，r＝6，意味着每个数据点搜索它的六个最近的邻居。当r＝6时，每个数据点都被认为是另一个数据点的邻居，之后过程结束。如图2中(a)至(f)所示，每个点都有邻居，并通过带逐步箭头的直线与其最近的r邻居相连(r由自然邻居算法自动确定)。图2中的(f)是构建的饱和邻域图最终结果。
[0070]
s32、根据所述饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重，计算方式如下：
[0071][0072]
其中，质量权重m
xy
为图像x的质量m
x
与图像y的质量my的乘积，σ(x，y)表示样图像x与图像y之间的结构相似度,定义为图像节点x和y共享的结构数量与它们各自节点结构数乘积的开方的商；γ(x)表示图像x的节点结构,指图像节点x及其相连节点的集合，γ(y)表示图像y的节点结构,指图像节点y及其相连节点的集合；
[0073]
s33、计算图像x和图像y之间的万有引力；具体计算公式如下：
[0074][0075]
其中，g为万有引力常数，取值为1；my为图像y的质量，m
x
为图像x的质量，r为图像y与x之间的距离，其中r＝dist(x,y)。
[0076]
万有引力的计算：在融合基于万有引力的自然邻居搜索的图像聚类方法中,将所有图像视为在一条直线上，只计算引力大小，而不考虑引力的方向，以保证算法的简单性。牛顿万有引力公式中g为万有引力常数，对聚类结果没有影响，为方便计算，把它设置为1。
[0077]
s4、根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；
[0078]
s41、对于每一个图像数据，在其他所有图像数据中找到对它引力最大那个图像数据，并将其加入该图像数据的邻居列表中；
[0079]
s42、每一轮循环中，在未归入该图像的邻居列表以外的其他所有图像中搜索一个对它引力最大的图像数据加入该图像数据的邻居列表中，直至当所有图像数据都至少有一个其他图像数据把它当作邻居时，整个图像数据集就达到一种引力稳定状态，邻居搜索过程结束。
[0080]
基于融合万有引力的自然邻搜索的图像聚类方法的步骤s1-s4的伪代码描述如下：
[0081]
输入：图像数据集x
[0082]
输出：:gnan(xi)(图像xi的引力自然邻居)、gnnr(x中图像xi的r个引力自然邻居)、r(引力自然邻居特征值)、nb(xi)(图像xi的引力自然邻居数)
[0083]
初始值：r＝1,flag＝1,count(1)＝size(x),初始值：r＝1,flag＝1,count(1)＝size(x),
[0084]
while flag do
[0085]
#计算每两个样本之间的万有引力
[0086]
for each data x
i in x do
[0087]
for each data x
j in x do
[0088]
根据样本间的万有引力公式计算f(xiyi)；
[0089]
把f(xiyi)加入到样本xi和其他样本之间的引力集合g(xi)；
[0090]
end
[0091]
从集合g(xi)取出xi的第r个引力最近邻居
[0092]
nb(xq)＝nb(xq)+1；
[0093]
gnan(xq)＝gnan(xq)∪xi；
[0094]
gnnr(xi)＝gnnr(xi)∪xq；
[0095]
end
[0096]
统计nb值为零的样本点数量count(r)；
[0097]
if count(r)不在发生改变then
[0098]
flag＝0
[0099]
else
[0100]
r＝r+1
[0101]
end
[0102]
end
[0103]
其中，x＝xi∈rd：具有d维特征空间的图像数据集，gnnr(xi):图像数据集x中图像xi的r个引力自然邻居，gnan(xi):xi的引力自然邻居，nb(xi):xi的引力自然邻居数，g(xi)是样本xi和其他样本之间的引力集合。
[0104]
其中，gnan(xi)即为通过步骤s4获得的各图像数据的自然邻居列表。
[0105]
s5、基于所述各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。
[0106]
具体地，根据步骤s4中获得的邻居列表gnan(xi)，确定邻居关系；并基于所述邻居关系，把互为邻居的图像聚类为同一个簇，最终得到图像聚类结果。
[0107]
在一具体实施例中，根据所述邻居列表，生成引力饱和自然邻域图gsnang(x)，通过引力饱和自然邻域图可更直观地查看图像聚类结果。
[0108]
本技术基于融合万有引力的自然邻搜索的图像聚类方法，利用了自然最近邻居无参特性，自适应地计算出需要的参数，排除人为参数对于图像聚类方法的影响，提升了图像聚类的准确性。其次，本技术基于融合万有引力的自然邻搜索的图像聚类方法，提出了一种新的万有引力计算方式，利用万有引力定律，结合图像数据集的自然结构，选择适当的质量权重计算方式，计算图像数据间的万有引力，通过万有引力来代替传统的距离衡量方式，应用到图像邻居搜索的方法中，重新定义图像数据的自然邻居，基于邻居列表，得到图像聚类结果；使用引力作为判断图像邻居的标准，能更好的体现图像数据集的整体特性，基于引力的邻域图降低了对图像数据集中噪声点的敏感性，提高了对簇边缘点处理的合理性，提升了图像聚类的准确性。
[0109]
图3是本发明实施例提供的一种基于融合万有引力的自然邻搜索的图像聚类系统。如图3所示，该基于融合万有引力的自然邻搜索的图像聚类系统包括图像数据集获取模块、图像间距离计算模块、图像间引力计算模块、图像邻居列表构造模块、图像聚类结果生成模块。
[0110]
所述图像数据集获取模块，用于获取待聚类的图像数据集；
[0111]
所述图像间距离计算模块，用于根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离；
[0112]
所述图像间引力计算模块，用于基于所述各图像数据之间的距离，计算所述图像数据集中各图像数据之间的引力；
[0113]
所述图像邻居列表构造模块，根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；
[0114]
图像聚类结果生成模块，基于各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。
[0115]
上述基于融合万有引力的自然邻搜索的图像聚类系统可以实现为一种计算机程序的形式，该计算机程序可以在计算机设备上运行。
[0116]
该计算机设备可以是服务器，其中，服务器可以是独立的服务器，也可以是多个服务器组成的服务器集群。
[0117]
计算机设备包括通过系统总线连接的处理器、存储器和网络接口，其中，存储器可以包括非易失性存储介质和内存储器。
[0118]
该非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令，该程序指令被执行时，可使得处理器执行一种基于融合万有引力的自然邻搜索的图像聚类方法。
[0119]
该处理器用于提供计算和控制能力，以支撑整个计算机设备的运行。
[0120]
该内存储器为非易失性存储介质中的计算机程序的运行提供环境，该计算机程序被处理器执行时，可使得处理器执行一种基于融合万有引力的自然邻搜索的图像聚类方法。
[0121]
该网络接口用于与其它设备进行网络通信。本领域技术人员可以理解，上述计算机设备结构仅仅是与本技术方案相关的部分结构，并不构成对本技术方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。
[0122]
其中，所述处理器用于运行存储在存储器中的计算机程序，该程序实现实施例一所述的基于融合万有引力的自然邻搜索的图像聚类方法。
[0123]
应当理解，在本技术实施例中，处理器可以是中央处理单元(central processing unit，cpu)，该处理器还可以是其他通用处理器、数字信号处理器(digital signal processor，dsp)、专用集成电路(application specific integrated circuit，asic)、现成可编程门阵列(field-programmable gatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0124]
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令，计算机程序可存储于一存储介质中，该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行，以实现上述方法的实施例的流程步骤。
[0125]
本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序，其中该计算机程序被处理器执行时使处理器执行实施例一所述的一种基于融合万有引力的自然邻搜索的图像聚类方法。
[0126]
所述存储介质可以是u盘、移动硬盘、只读存储器(read-onlymemory，rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
[0127]
本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0128]
在本发明所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的。例如，各个单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。
[0129]
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。
[0130]
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个
人计算机，终端，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
[0131]
注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

技术特征：
1.一种基于融合万有引力的自然邻搜索的图像聚类方法，其特征在于，包括步骤：s1、获取待聚类的图像数据集；s2、根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离dist(x,y)；具体包括：s21、计算两幅图像之间的相似度ssim(x,y)；由如下公式计算x、y两幅图像之间的相似度，记为ssim(x,y)其中u
x
和u
y
表示两幅图像灰度的平均值，σ
x
和σ
y
表示两幅图像的标准差，σ
xy
表示两幅图像的协方差；c1和c2为常数，以避免分母等于零,c1和c2的值取决于u和σ；如果分母接近于零，则任意选择c1和c2的值以增加ssim值的稳定性；上式表示两幅图像之间的结构相似性；ssim值越大，表示两幅图像越相似；s22、计算两幅图像之间的距离dist(x,y)；两幅图像之间的距离记为dist(x,y)，计算如下公式：dist(x，y)＝1-ssim(x，y)；s3、基于所述各图像数据之间的距离dist(x,y)，计算所述图像数据集中各图像数据之间的引力；s31、根据自然最近邻居算法构造出饱和邻域图；s32、根据所述饱和邻域图分析每个图像数据与其他图像数据之间的结构相似度来计算质量权重，计算方式如下：其中，质量权重m
xy
为图像x的质量m
x
与图像y的质量m
y
的乘积，σ(x，y)表示样图像x与图像y之间的结构相似度,定义为图像节点x和y共享的结构数量与它们各自节点结构数乘积的开方的商；γ(x)表示图像x的节点结构,指图像节点x及其相连节点的集合，γ(y)表示图像y的节点结构,指图像节点y及其相连节点的集合；s33、计算图像x和图像y之间的万有引力；具体计算公式如下：其中，g为万有引力常数，取值为1；m
y
为图像y的质量，m
x
为图像x的质量，r为图像y与x之间的距离，其中r＝dist(x,y)；s4、根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；s41、对于每一个图像数据，在其他所有图像数据中找到对它引力最大那个图像数据，并将其加入该图像数据的邻居列表中；s42、每一轮循环中，在未归入该图像的邻居列表以外的其他所有图像中搜索一个对它
引力最大的图像数据加入该图像数据的邻居列表中，直至当所有图像数据都至少有一个其他图像数据把它当作邻居时，整个图像数据集就达到一种引力稳定状态，邻居搜索过程结束；s5、基于所述各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。2.根据权利要求1所述的方法，其特征在于，ssim的值为[0,1]。3.一种基于融合万有引力的自然邻搜索的图像聚类系统，其特征在于，所述图像聚类系统执行如权利要求1所述的基于融合万有引力的自然邻搜索的图像聚类方法，包括：图像数据集获取模块、图像间距离计算模块、图像间引力计算模块、图像邻居列表构造模块、图像聚类结果生成模块；所述图像数据集获取模块，用于获取待聚类的图像数据集；所述图像间距离计算模块，用于根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离；所述图像间引力计算模块，用于基于所述各图像数据之间的距离，计算所述图像数据集中各图像数据之间的引力；所述图像邻居列表构造模块，根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；图像聚类结果生成模块，基于各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像聚类为同一个簇，得到图像聚类结果。4.一种计算机设备，其特征在于，所述设备包括存储器及处理器，所述存储器上存储有计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至2中任一项所述的方法。

技术总结
本发明提供了基于融合万有引力的自然邻搜索的图像聚类方法及系统，方法包括：获取待聚类的图像数据集；根据所述图像数据集，计算所述图像数据集中各图像数据之间的距离；基于所述各图像数据之间的距离，计算所述图像数据集中各图像数据之间的引力；根据所述各图像数据之间的引力，基于融合万有引力的自然邻搜索方法获得各图像数据的邻居列表；基于各图像数据的邻居列表，确定邻居关系，并根据所述邻居关系，把互为邻居的图像数据聚类为同一个簇，得到图像聚类结果。本发明基于融合万有引力的自然邻搜索的图像聚类方法，从而从根源上解决了现有的图像聚类方法准确率低的问题。了现有的图像聚类方法准确率低的问题。了现有的图像聚类方法准确率低的问题。

技术研发人员：杨力军杨俊涛王文彤唐东明刘韬
受保护的技术使用者：西南民族大学
技术研发日：2023.04.26
技术公布日：2023/8/22

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

上一篇：一种基于北斗短报文的多元异构数据编码及组帧方法与流程 下一篇：一种弧型玻璃基板弧度检测装置的制作方法

基于融合万有引力的自然邻搜索的图像聚类方法及系统

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

基于融合万有引力的自然邻搜索的图像聚类方法及系统

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表