基于张量补全的多源异构数据特征提取方法、设备及介质

未命名 07-22 阅读:109 评论:0


1.本发明属于数据处理技术领域,尤其涉及一种基于张量补全的多源异构数据特征提取方法、设备及介质。


背景技术:

2.目前多源异构数据特征提取分为两类,第一类是基于向量表示来刻画各类异构数据特征,第二类为基于张量表示,并借助于张量分解技术来提取各类异构数据特征。第一类的方式会造成多源异构数据数据样本的空间结构信息丢失,而且会因为维数过高而产生小样本与维数灾难问题。因此现有技术通常采用张量表示和张量分解来提取异构数据特征。
3.现有技术中,通常需要将多源异构数据用高阶张量表示,然后tucker分解,利用核张量的log-sum惩罚函数来刻画多源异构数据的低秩性,接着以交替方向法的方式求解张量补全的优化模型,然后获得核张量、因子矩阵和张量重构数据,核张量即为多源异构数据的特征提取。这种方式虽然能通过降维获得高阶张量在低维空间的有效特征,但却忽略了多源异构数据保持低维子空间的一致性,导致异构数据特征提取的效果较差。


技术实现要素:

4.有鉴于此,本发明提供了一种基于张量补全的多源异构数据特征提取方法、设备及介质,旨在解决现有技术中多源异构数据特征提取效果较差的问题。
5.本发明实施例的第一方面提供了一种基于张量补全的多源异构数据特征提取方法,包括:根据多源异构数据中的初始特征,构建多源异构数据的张量数据;对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵;将核张量、因子矩阵、构建的张量数据输入到预先建立的张量补全模型中,对张量补全模型进行求解,并将构建的张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量,作为多源异构数据的特征提取结果;其中,张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,张量补全模型将构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,张量补全模型通过图嵌入正则项和先验信息,保持异构数据构建的张量数据在低维子空间的一致性。
6.本发明实施例的第二方面提供了一种基于张量补全的多源异构数据特征提取装置,包括:张量构建模块,用于根据多源异构数据中的初始特征,构建多源异构数据的张量数据;张量分解模块,用于对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵;特征提取模块,用于将核张量、因子矩阵、构建的张量数据输入到预先建立的张量补全模型中,对张量补全模型进行求解,并将构建的张量数据对根据求解得到的张量重构
数据进行张量补全,得到目标核张量,作为多源异构数据的特征提取结果;其中,张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,张量补全模型将构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,张量补全模型通过图嵌入正则项和先验信息,保持异构数据构建的张量数据在低维子空间的一致性。
7.本发明实施例的第三方面提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上第一方面的基于张量补全的多源异构数据特征提取方法的步骤。
8.本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上第一方面的基于张量补全的多源异构数据特征提取方法的步骤。
9.本发明实施例提供的基于张量补全的多源异构数据特征提取方法、设备及介质,首先根据多源异构数据中的初始特征,构建多源异构数据的张量数据;然后对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵;接着将核张量、因子矩阵、构建的张量数据输入到预先建立的张量补全模型中,对张量补全模型进行求解,并将构建的张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量和目标因子矩阵;最终目标核张量为多源异构数据的特征提取结果。通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,利用图嵌入正则项并结合构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,能够保持异构数据构建的张量数据在低维子空间的一致性,保证所提取的异构数据特征的有效性。
附图说明
10.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
11.图1是本发明实施例提供的基于张量补全的多源异构数据特征提取方法的应用场景图;图2是本发明实施例提供的基于张量补全的多源异构数据特征提取方法的实现流程图;图3是本发明另一实施例提供的基于张量补全的多源异构数据特征提取方法的实现流程图;图4是本发明实施例提供的基于张量补全的多源异构数据特征提取装置的结构示意图;图5是本发明实施例提供的电子设备的结构示意图。
具体实施方式
12.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电
路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
13.图1是本发明实施例提供的基于张量补全的多源异构数据特征提取方法的应用场景图。如图1所示,在一些实施例中,本发明实施例提供的基于张量补全的多源异构数据特征提取方法可以但不限于应用于该应用场景。在该发明实施例中,该系统包括:数据采集系统11和电子设备12。
14.数据采集系统11可以是数据采集装置、视频监控系统、存储多源异构数据的数据库等,在此不作限定。电子设备12可以是终端、服务器等,终端可以是电脑、mcu等,服务器可以是物理服务器、云服务器等,在此不作限定。数据采集系统11首先向电子设备12上报从多源异构数据中提取的初始特征数据,电子设备12对待提取数据的低维特征进行提取。
15.图2是本发明实施例提供的基于张量补全的多源异构数据特征提取方法的实现流程图。如图2所示,在一些实施例中,基于张量补全的多源异构数据特征提取方法,应用于图1中所示的电子设备12,该方法包括:s210,根据多源异构数据中的初始特征,构建多源异构数据的张量数据。
16.在本发明实施例中,首先,我们构建n阶的张量数据,为各维度的大小。
17.s220,对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵。
18.本发明的目标是通过n阶多源异构的张量数据的tucker分解来找到低秩的核张量与投影因子矩阵的更紧凑表示。在本发明实施例中,由于多源异构数据的缺失源,使得构建的张量数据具有低秩性或近似低秩,因此可以通过一个适当4d张量的正交tucker分解以恢复:(1)其中,为核张量。可以借助于正交tucker分解后的核张量的低秩性来刻画样本之间的高度相似性。若核张量在上有一个低秩性,那么它的结构稀疏性的形式为相对小的值,其中是一个值都为1的向量。此外,可以利用构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,对因子矩阵引入图正则化约束来保持低维空间的一致性,通过正则项来刻画。其中,为相似矩阵导出的拉普拉斯矩阵,表示矩阵的迹。与此同时,可以得到:(2)上式中包括进行n模展开的相似矩阵的图的拉普拉斯矩阵和对角线矩阵,且,且定义为热核(heat kernel)权重,表示如下:
(3)其中,分别是第n模展开的第i行和第j行,t用来调整权重值的大小。由于为第n模构建的张量数据的主成分,它的行对应着构建的张量数据的低维近似,因此构建的张量数据的一致性在低维空间得到保持。利用核张量的结构稀疏性刻画构建的张量数据的低秩性,利用图嵌入正则项并结合构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息来保持异构数据构建的张量数据保持低维子空间的一致性,得到的张量补全模型为:(4)其中,为核张量,在上具备低秩性,为因子矩阵,,表示第模展开,表示核张量的稀疏性,e为一个值都为1的向量,e,θ为正则化参数,,为图嵌入正则项,表示矩阵的迹,为相似矩阵导出的拉普拉斯图,,是stiefel流形,,为张量重构数据,为构建的张量数据,表示的非零项。
19.其中,为全模积,表示核张量与n个un相乘的n模展开。
20.s230,将核张量、因子矩阵、构建的张量数据输入到预先建立的张量补全模型中,对张量补全模型进行求解,并将构建的张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量,作为多源异构数据的特征提取结果;其中,张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,张量补全模型将构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,张量补全模型通过图嵌入正则项和先验信息,保持异构数据构建的张量数据在低维子空间的一致性。
21.在一些实施例中,s230可以包括:将张量补全模型中的l0范数替换成log-sum凸函数松弛策略,得到约束优化模型;根据tikhonov正则化方法,将约束优化模型转化为无约束优化模型;采用交替方向法对无约束优化模型进行迭代,得到目标核张量和目标因子矩阵。
22.在本发明实施例中,由于涉及范数和正交性约束,由此产生的张量优化问题通常是np难的问题。因此,可以将范数替换成log-sum凸函数松弛策略。可以得到,约束优化模型为:(5)其中,表示第模展开的矩阵的第行,ε为预设精度参数。
23.为了使约束优化模型更易于处理,我们利用tikhonov正则化方法将约束优化模型转化为以下无约束优化模型。在一些实施例中,无约束优化模型包括:(6)其中,β为第一参数,是核张量的稀疏性和拟合误差之间的权衡参数。
24.随后可以采用交替方向法(alternating direction method,adm)公式(6)所示的非凸非线性张量优化问题,即将含有多变量的复杂问题分离成易解决的子问题并进行迭代求解,且分离的子问题对应的目标函数是凸函数。
25.在一些实施例中,采用交替方向法对无约束优化模型进行迭代,得到目标核张量和目标因子矩阵,包括:对核张量、因子矩阵以及张量重建数据进行迭代更新,并在每次迭代更新完成后,根据更新前的核张量、更新前的因子矩阵和更新后的张量重构数据,确定是否满足迭代停止条件;若满足迭代停止条件,则将更新后的核张量作为目标核张量,将更新后的因子矩阵作为目标因子矩阵;若不满足迭代停止条件,则进行下一次迭代更新。
26.在本发明实施例中,算法的输入为构建的张量数据、θ、第一参数β、ξ、γ、最大迭代次数t
max
。输出为目标核张量,在第一次迭代时,将s220中分解得到的核张量和因子矩阵作为迭代的初始值。
27.在一些实施例中,对核张量、因子矩阵以及张量重构数据进行迭代更新的过程中,每次迭代包括以下步骤:根据更新前的核张量、更新前的因子矩阵、更新前的张量重构数据和第一更新公式,计算更新后的核张量;根据更新后的核张量、更新前的因子矩阵、更新前的张量重构数据和第二更新公式,计算更新后的因子矩阵;根据更新后的核张量、更新后的因子矩阵、更新前的张量重构数据和第三更新公式,计算更新后的张量重构数据。
28.在本发明实施例中,核张量的更新具体如下:为了得到核张量的封闭形式的更新,首先引入的代理函数,根据在处的对数和函数的推导,可得到:
(7)显然,当=时,不等式(7)等式成立。另外,可以得到:(8)其中,是一个与大小相同的张量,其第元素为:(9)于是,公式(6)中定义的的代理函数如下:(10)(11)由于,因此,对于当前迭代,这部分的更新可以表示为:(12)令。式(12)的问题转化为以下优化问题:(13)很明显,公式(13)有一个唯一的最优解决方案g*,即:(14)因此,可以得到第一更新公式为:(15)其中,将一个向量以适当的方式转换为张量的映射。
29.在本发明实施例中,因子矩阵的更新具体如下:令为{1,2,

,n}任意给出的排列,借助公式:
(16)于是因子矩阵可以通过第二更新公式更新:(17)其中,。因此,可以将式(17)转换成以下问题:(18)其中,。为了求解式(18),利用von neumann的迹不等式,求解得到:(19)其中,和分别为进行奇异值分解(svd)后的左、右奇异矩阵。
30.在本发明实施例中,张量重构数据的更新具体如下:给出,重建的张量数据的更新可以通过解决以下问题进行获得:(20)通过投影性质,的唯一最优解可轻松通过以下形式获得,即第三更新公式:(21)其中,是的补集。
31.在一些实施例中,迭代停止条件为:(22)其中,为第t次迭代得到的核张量,为第t次迭代得到的因子矩阵,为第t+1次迭代得到的张量重构数据,为张量数据,为frobenius范数,ξ为预设的容忍值,t《t
max
,t
max
为最大迭代次数。
32.s240,目标核张量为多源异构数据的特征提取结果。
33.本发明的目标是通过一种张量降维技术,将构建的n阶张量正交投影到一个低维的张量子空间中,并转化为更紧凑的表示,即得到一组因子矩阵和核张量,目标核张量为多源异构数据的特征提取结果。
34.图3是本发明另一实施例提供的基于张量补全的多源异构数据特征提取方法的实现流程图。如图3所示,在一些实施例中,基于张量补全的多源异构数据特征提取方法的过
程如下:首先对多源异构数据构建张量数据,然后对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵,接着将核张量、因子矩阵和构建的张量数据送入构建的张量补全模型,并对其进行迭代求解,在每次迭代中,将求解得到的核张量和因子矩阵按模相乘生成新的张量(即上述张量重构数据),利用构建的张量数据来来补全张量重构数据,并判断是否满足停止规则(即迭代停止条件),若满足则核张量为多源异构数据的特征提取结果,反之进行下一次迭代。
35.综上,本发明的有益效果具体为:通过在张量补全模型中核张量的结构稀疏性来刻画构建的张量数据的低秩性,图嵌入正则项并结合构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,能够保持异构数据构建的张量数据在低维子空间的一致性,保证所提取的异构数据特征的有效性。
36.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
37.图4是本发明实施例提供的基于张量补全的多源异构数据特征提取装置的结构示意图。如图4所示,在一些实施例中,基于张量补全的多源异构数据特征提取装置4,包括:张量构建模块410,用于根据多源异构数据中的初始特征,构建多源异构数据的张量数据;张量分解模块420,用于对构建的张量数据进行正交tucker分解,得到核张量和因子矩阵;特征提取模块430,用于将核张量、因子矩阵、构建的张量数据输入到预先建立的张量补全模型中,对张量补全模型进行求解,并将构建的张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量和目标因子矩阵;其中,张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,利用图嵌入正则项并结合构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,能够保持异构数据构建的张量数据在低维子空间的一致性;可选的,特征提取模块430,具体用于将张量补全模型中的l0范数替换成log-sum凸函数松弛策略,得到约束优化模型;根据tikhonov正则化方法,将约束优化模型转化为无约束优化模型;采用交替方向法对无约束优化模型进行迭代,得到目标核张量和目标因子矩阵。
38.可选的,张量补全模型为:其中,为核张量,在上具备低秩性,为因子矩阵,,表示第模展开,表示核张量的稀疏性,e为一个值
都为1的向量,e,θ为正则化参数,,为图嵌入正则项,表示矩阵的迹,ln为相似矩阵导出的拉普拉斯图,,是stiefel流形,,为张量重构数据,为张量数据,表示的非零项。
39.可选的,约束优化模型为:其中,表示第模展开的矩阵的第行,ε为预设精度参数。
40.可选的,无约束优化模型包括:其中,β为第一参数,是核张量的稀疏性和拟合误差之间的权衡参数。
41.可选的,可选的,特征提取模块430,具体用于:对核张量、因子矩阵以及张量重构数据进行迭代更新,并在每次迭代更新完成后,根据更新前的核张量、更新前的因子矩阵和更新后的张量重构数据,确定是否满足迭代停止条件;若满足迭代停止条件,则将更新后的核张量作为目标核张量,将更新后的因子矩阵作为目标因子矩阵;若不满足迭代停止条件,则进行下一次迭代更新。
42.可选的,特征提取模块430,具体用于:根据更新前的核张量、更新前的因子矩阵、更新前的张量重构数据和第一更新公式,计算更新后的核张量;根据更新后的核张量、更新前的因子矩阵、更新前的张量重构数据和第二更新公式,计算更新后的因子矩阵;根据更新后的核张量、更新后的因子矩阵、更新前的张量重构数据和第三更新公式,计算更新后的张量重构数据。
43.可选的,迭代停止条件为:其中,为第t次迭代得到的核张量,为第t次迭代得到的因子矩阵,为第t+1次迭代得到的张量重构数据,为张量数据,为frobenius范数,ξ为预设的容忍值,t《t
max
,t
max
为最大迭代次数。
44.本实施例提供的基于张量补全的多源异构数据特征提取装置,可用于执行上述方
法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
45.图5是本发明实施例提供的电子设备的结构示意图。如图5所示,本发明的一个实施例提供的电子设备5,该实施例的电子设备5包括:处理器50、存储器51以及存储在存储器51中并可在处理器50上运行的计算机程序52。处理器50执行计算机程序52时实现上述各个基于张量补全的多源异构数据特征提取方法实施例中的步骤,例如图2所示的步骤210至步骤230。或者,处理器50执行计算机程序52时实现上述各系统实施例中各模块/单元的功能,例如图4所示模块410至430的功能。
46.示例性的,计算机程序52可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器51中,并由处理器50执行,以完成本发明。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序52在电子设备5中的执行过程。
47.电子设备5可以是可以为终端、服务器等,在此不作限定,服务器可以是物理服务器、云服务器等,在此不作限定。电子设备5可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是电子设备5的示例,并不构成对电子设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如电子设备还可以包括输入输出设备、网络接入设备、总线等。
48.所称处理器50可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器 (digital signal processor,dsp)、专用集成电路 (application specific integrated circuit,asic)、现场可编程门阵列 (field-programmable gate array,fpga) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
49.存储器51可以是电子设备5的内部存储单元,例如电子设备5的硬盘或内存。存储器51也可以是电子设备5的外部存储设备,例如电子设备5上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器51还可以既包括电子设备5的内部存储单元也包括外部存储设备。存储器51用于存储计算机程序以及电子设备所需的其他程序和数据。存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
50.本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述基于张量补全的多源异构数据特征提取方法实施例中的步骤。
51.计算机可读存储介质存储有计算机程序52,计算机程序52包括程序指令,程序指令被处理器50执行时实现上述实施例方法中的全部或部分流程,也可以通过计算机程序52来指令相关的硬件来完成,计算机程序52可存储于一计算机可读存储介质中,该计算机程序52在被处理器50执行时,可实现上述各个方法实施例的步骤。其中,计算机程序52包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
52.计算机可读存储介质可以是前述任一实施例的电子设备的内部存储单元,例如电子设备的硬盘或内存。计算机可读存储介质也可以是电子设备的外部存储设备,例如电子设备上配备的插接式硬盘,智能存储卡(smart media card, smc),安全数字(secure digital, sd)卡,闪存卡(flash card)等。进一步地,计算机可读存储介质还可以既包括电子设备的内部存储单元也包括外部存储设备。计算机可读存储介质用于存储计算机程序及电子设备所需的其他程序和数据。计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
53.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
54.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
55.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
56.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
57.在本发明所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
58.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
59.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
60.集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方
法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
61.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于张量补全的多源异构数据特征提取方法,其特征在于,包括:根据多源异构数据中的初始特征,构建多源异构数据的张量数据;对所述的张量数据进行正交tucker分解,得到核张量和因子矩阵;将所述核张量、所述因子矩阵、所述张量数据输入到预先建立的张量补全模型中,对所述张量补全模型进行求解,并用所述张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量,作为所述多源异构数据的特征提取结果;其中,所述张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,所述张量补全模型将构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,所述张量补全模型通过图嵌入正则项和所述先验信息,保持异构数据构建的张量数据在低维子空间的一致性。2.根据权利要求1所述的张量补全的多源异构数据特征提取方法,其特征在于,对所述张量补全模型进行求解,并根据所述张量数据对求解得到的张量重构数据进行张量补全,得到目标核张量和目标因子矩阵,包括:将所述张量补全模型中的l0范数替换成log-sum凸函数松弛策略,得到约束优化模型;根据tikhonov正则化方法,将所述约束优化模型转化为无约束优化模型;采用交替方向法对所述无约束优化模型进行迭代,得到目标核张量和目标因子矩阵。3.根据权利要求2所述的张量补全的多源异构数据特征提取方法,其特征在于,所述张量补全模型为:其中,为所述核张量,在上具备低秩性,为所述因子矩阵,,表示第模展开,表示核张量的稀疏性,e为一个值都为1的向量,e,θ为正则化参数,,为所述图嵌入正则项,表示矩阵的迹,l
n
为相似矩阵导出的拉普拉斯图,,是stiefel流形,,为所述张量重构数据,为所述张量数据,表示的非零项。4.根据权利要求3所述的张量补全的多源异构数据特征提取方法,其特征在于,所述约束优化模型为:
其中,表示第模展开的矩阵的第行,ε为预设精度参数。5.根据权利要求4所述的张量补全的多源异构数据特征提取方法,其特征在于,所述无约束优化模型包括:其中,β为第一参数,是核张量的稀疏性和拟合误差之间的权衡参数。6.根据权利要求2所述的张量补全的多源异构数据特征提取方法,其特征在于,所述采用交替方向法对所述无约束优化模型进行迭代,得到目标核张量和目标因子矩阵,包括:对所述核张量、所述因子矩阵以及所述张量重构数据进行迭代更新,并在每次迭代更新完成后,根据更新前的核张量、更新前的因子矩阵和更新后的张量重构数据,确定是否满足迭代停止条件;若满足迭代停止条件,则将更新后的核张量作为所述目标核张量,将更新后的因子矩阵作为所述目标因子矩阵;若不满足迭代停止条件,则进行下一次迭代更新。7.根据权利要求6所述的张量补全的多源异构数据特征提取方法,其特征在于,对所述核张量、所述因子矩阵以及所述张量重构数据进行迭代更新的过程中,每次迭代包括以下步骤:根据更新前的核张量、更新前的因子矩阵、更新前的张量重构数据和第一更新公式,计算更新后的核张量;根据更新后的核张量、更新前的因子矩阵、更新前的张量重构数据和第二更新公式,计算更新后的因子矩阵;根据更新后的核张量、更新后的因子矩阵、更新前的张量重构数据和第三更新公式,计算更新后的张量重构数据。8.根据权利要求6所述的张量补全的多源异构数据特征提取方法,其特征在于,所述迭代停止条件为:其中,为第t次迭代得到的核张量,为第t次迭代得到的因子矩阵,为第t+1次迭代得到的张量重构数据,为所述张量数据,为frobenius范数,ξ为预设的容忍值,t<t
max
,t
max
为最大迭代次数。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上的权利要求1至8中任一项所述基于张量补全的多源异构数据特征提取方法的步骤。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上的权利要求1至8中任一项所述基于张量补全
的多源异构数据特征提取方法的步骤。

技术总结
本发明提供了一种基于张量补全的多源异构数据特征提取方法、设备及介质,首先根据多源异构数据的初始特征来构建张量数据;然后对构建的张量数据进行正交Tucker分解,将分解后得到的核张量、因子矩阵和构建的张量数据输入到张量补全模型中,根据构建的张量数据对依据模型求解的张量重构数据进行张量补全,模型求解得到的核张量即为多源异构数据的特征提取结果。通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,利用图嵌入正则项并结合构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,能够保持异构数据构建的张量数据在低维子空间的一致性,保证所提取的异构数据特征的有效性。异构数据特征的有效性。异构数据特征的有效性。


技术研发人员:符蕴芳 褚云霞 陈永肖 方明辉 孟惜 马玉鹏
受保护的技术使用者:石家庄学院
技术研发日:2023.06.20
技术公布日:2023/7/20
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐