一种隐私数据共享和数据交易方法

未命名 08-25 阅读:83 评论:0


1.本发明涉及一种数据共享技术,特别涉及一种边缘智能场景下面向联盟分析的隐私数据共享和数据交易方法。


背景技术:

2.在万物互联大背景下,全球数据量呈指数级增长,推动了对边缘智能的需求。在引入边缘智能模式前,终端设备所产生的大量数据往往需要被传输到云端进行处理,由此带来了较长的数据传输、分析、处理的时延,进而导致数据价值呈现断崖式下跌;另一方面,终端设备由于其存储资源的有限性,不利于数据的存储。边缘智能模式利用边缘节点的计算和存储能力,在边缘侧提供数据分析、场景感知、实时决策等服务,可以在数据交易过程中实现高性能、低时延、高智能等特点,让数据在端边云协同架构下充分发挥其价值。
3.基于边缘智能实现的数据交易问题与传统的数据交易问题存在诸多差异。第一,数据来源广泛,终端设备种类繁多、资源特点差异巨大,并且各类终端设备通常隶属于不同的个体,数据资源也归不同的理性个体所拥有,因此往往不存在一个可信的中心化数据收集者。第二,数据交易过程中的时延要求更高,必须考虑信息时效性、终端设备差异性等重要特征。第三,大数据时代下,挖掘数据价值、实现数据效用最大化是各参与方的目标,数据交易过程必须实现高效的资源配置。第四,数据交易过程中的隐私保护问题非常关键,终端设备向外提供数据就存在隐私泄露的风险,并且由于终端设备的异构性,不同个体呈现出个性化的隐私保护需求。因此,在基于边缘智能实现的数据交易问题中需要着重讨论如何在端、边、云三层架构的各类异构设备之间实现公平、可靠、高效的数据交易过程,从而达到总体数据效用最优化,并且满足各类终端设备的隐私性、自私性和激励性。
4.与普通商品不同,大数据商品的价值具有特殊性,包括不确定性、稀缺性和多样性。大数据价值的特殊性以及数据交易过程中存在的交易双方之间的信息不对称,使得数据的定价及交易中存在一系列的问题。例如,数据交易过程中的数据隐私问题,群智终端向外提供数据就存在隐私泄露的风险。差分隐私技术已被广泛用于保护数据隐私,使我们能够准确地量化隐私泄露的程度。在采用中心化差分隐私(cdp)的数据交易过程中,一个值得信赖的数据收集者从群智终端处收集原始数据,然后对收集到的数据执行隐私保护方案,最后根据数据请求者的要求将扰动后的数据发送给他们。然而,基于cdp的私有数据交易是不切实际的,原因有三:第一,很难找到一个值得信赖的数据收集者;第二,一个中心化的数据收集者会导致高风险的隐私泄露和大量的通信成本;第三,这些方法忽略了群智终端对隐私保护的个性化要求。
5.由于不同的资源特性,群智终端通常有不同的隐私偏好;也就是说,群智终端对隐私泄露表现出不同的敏感性,即使在相同的隐私保护水平下,也可能要求不同的货币补偿。此外,群智终端更愿意将他们的原始数据保存在本地,而不是将原始数据暴露给不值得信任的其他人;群智终端甚至希望以自己的方式控制他们的数据隐私。因此,将本地化差分隐私(ldp)纳入数据交易成为一个更可行的选择。基于ldp的数据交易过程允许每个群智终端
单独执行隐私保护方案,其只需要发送扰动后的数据即可。
6.许多现有的研究都提出了鼓励自私的群智终端参与数据交易的激励机制,但是一些方法只是对群智终端因收集数据而造成的资源成本进行补偿,还有一些方法在激励机制的设计中考虑了隐私保护,例如投标隐私和位置隐私,却假设存在一个值得信赖的数据收集者。大多数现有的研究都忽略了一个事实,即群智终端对隐私泄露有不同的敏感性,并且隐私偏好作为它们自身的隐私信息,其他参与者或数据交易平台无从知晓。除此之外,由于数据隐私保护和数据效用最大化是互相制约的关系,数据交易方法必须合理地权衡两者之间的关系。如何对扰动后的数据进行聚合处理,从而得到尽可能准确的聚合结果,这也是设计数据交易方法过程中必须要解决的问题。


技术实现要素:

7.针对考虑个性化隐私保护和群智终端自私性的数据交易问题,提出了一种隐私数据共享和数据交易方法,基于合约机制的数据交易方法,解决了当数据需求的候选值为多值时的数据交易问题。例如,数据请求者请求统计某特定人群中某种疾病的不同病情等级的概率分布,那么每个群智终端需要根据自身情况并结合隐私机制回答其中一种病情等级,最终由数据交易平台通过聚合处理得到尽可能准确的聚合数据,从而实现所交易数据的数据效用最优化。
8.本发明的技术方案为:一种隐私数据共享和数据交易方法,具体包括如下步骤:
9.1)数据交易平台根据预算b约束和群智终端的隐私偏好信息设计一系列合约然后将设计好的一系列合约和相应的数据需求q一起发布给参与的群智终端;
10.2)每个群智终端与平台签订一份合约(∈k,pk),其中为群智终端k的隐私保护水平,pi为群智终端k的数据交易价格,合约以最优化自身群智终端k的收益uk为目标:
11.3)每个群智终端按照隐私保护水平对应的随机扰动机制处理原数据,并将扰动后的数据提交给数据交易平台;
12.4)数据交易平台收到从群智终端获取的数据后,按照每个群智终端所签到的合同中的数据交易价格给各个群智终端支付报酬;
13.5)数据交易平台对收集到的数据采用分组加权的估计方法计算聚合统计结果,并返回给提出数据需求q的数据请求者。
14.进一步,所述步骤3)具体实现方法:为了降低隐私泄露的风险,每个群智终端在上传数据前采用随机扰动机制对原始数据进行扰动,则扰动后数据的概率分布向量用表示,其中,随机扰动机制是一个定义域和值域均为χ的函数,对于任意离散型数据x∈χ和一个随机扰动概率ρ,经过随机扰动机制扰动后,它将以概率ρ等于原始数据x,以概率等于其他某个值x

,x

≠x,x

∈χ;
15.当原始数据候选值数量为t时,|χ|=t,在不失一般性的情况下,假设则随
机扰动机制满足本地化差分隐私∈,并且该式表明随机扰动概率ρ与隐私保护水平∈之间的关系;
16.具体来说,如果一个群智终端选择了合约(∈k,pk),他将以的概率提交原始数据,以的概率提交其余t-1个候选值中的一个;
17.每个群智终端按照各自合约中签订的扰动概率对其原始数据进行扰动处理,记扰动后的数据为群智终端将提交给数据交易平台。
18.进一步,所述步骤5)具体实现方法:数据交易平台收集到每个群智终端提交的数据后,得到扰动数据集然后采用类似分组加权的估计方法来尽可能准确地估计t个候选值的真实概率分布向量π,将其记为
19.假设n个群智终端按照隐私偏好被分成k组,每个组的群智终端数量为mk,每个组中提交数据t的群智终端数量为中提交数据t的群智终端数量为并且首先,在随机响应机制下,扰动后的数据dk分布情况可用以下式子表示:
[0020][0021]
其次,πk的经验估计可表示为:
[0022][0023]
其中是dk的经验估计,具体表示为的经验估计,具体表示为的公式如下:
[0024][0025]
最后,将各组人数占比作为权重对进行加权,得到即
[0026][0027]
进一步,所述步骤1)和2)中的合约,通过估计概率分布向量及其真实概率分布
向量π之间的曼哈顿距离的期望,估算聚合结果的准确度,将最大化准确度的目标反推回到对于合约中的隐私保护水平和数据交易价格的要求上,优化合约中的隐私保护水平和数据交易价格。
[0028]
一种隐私数据共享和数据交易系统,包括群智终端、数据交易平台和数据请求者;数据请求者向数据交易平台提出数据需求并提供相应的预算支撑,期望利用购买的数据使其利益最大化;群智终端按照约定的隐私保护水平对收集的原始数据添加扰动,实现本地化差分隐私的同时最大化其收益;数据交易平台作为桥梁连接两方,发布合约集和数据需求给群智终端,数据交易平台根据合约收集群智终端提交的数据并支付报酬,最终将收集的数据进行聚合处理后提交给数据请求者。
[0029]
本发明隐私数据共享和数据交易方法,包括下面至少一种有意效果:
[0030]
1、所述的数据交易方法考虑了不同群智终端的个性化隐私需求,以合理的方式补偿了群智终端的数据隐私损失,解决了群智终端和数据交易平台之间的信息不对称问题,保证了群智终端和数据请求者双方都能够从数据交易过程中获益,从而能够有效地激励双方参与数据交易过程;与被动的、无偿的数据分享方式相比,本发明所述的数据交易方法提供了一种主动的、互利共赢的、可持续运行的数据流通模式。
[0031]
2、本发明引入随机扰动机制量化每位群智终端的隐私保护水平,同时设计了一系列最佳合约和聚合方法,最大限度地提高了聚合结果的准确度,同时满足每个群智终端的个体理性、激励相容性以及预算可行性。
[0032]
3、本发明所述的合约机制是在交易前构建的,不需要定期执行,因而与拍卖机制相比,在在线数据交易市场上采用合约机制有利于进一步提高交易效率。
[0033]
4、本发明考虑了第三方数据收集者的不可信风险,所采用的本地化差分隐私技术为现实中数据交易问题提供了可行的解决思路。
[0034]
5、本发明形成了一种基于端边云架构实现的以数据效用最优化为目标的实用新型数据交易方法,为物联网应用中的数据分享和数据交易的实用化与产业化发展作出贡献,并且在大量模拟数据集和真实数据集上的实验结果证明了本发明的可行性。
附图说明
[0035]
图1为本发明设计的基于合约理论的数据交易模型的架构图;
[0036]
图2为本发明设计的基于边缘智能的数据交易方法的完整流程图。
具体实施方式
[0037]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0038]
如图1所示本发明设计的基于合约理论的数据交易模型的架构图。在本发明所考虑的数据交易场景中,共涉及三方参与者:群智终端、数据交易平台和数据请求者。数据请求者向数据交易平台提出数据需求并提供相应的预算支撑,期望利用购买的数据使其利益最大化;群智终端有个性化的隐私偏好,且隐私偏好为私有信息,其收集数据后按照约定的隐私保护水平对原始数据添加扰动,实现本地化差分隐私,目的在于保护数据隐私的同时
最大化其收益;数据交易平台作为桥梁连接两方,发布合约集和数据需求给群智终端,数据交易平台根据合约收集群智终端提交的数据并支付报酬,最终将收集的数据进行聚合处理后提交给数据请求者。
[0039]
如图2所示本发明设计的基于边缘智能的数据交易方法的完整流程图。假设不同的数据需求之间不存在关联关系,本发明所述的数据交易方法的流程包括五个步骤,具体如下:
[0040]
1、数据交易平台根据预算b约束和群智终端的隐私偏好信息设计一系列合约然后将设计好的一系列合约和相应的数据需求q一起发布给参与的群智终端。
[0041]
1.1、数据请求者向数据交易平台提交包含数据需求描述信息的服务请求;
[0042]
1.2、数据交易平台根据预算b约束和群智终端的隐私偏好信息设计一系列合约
[0043]
本发明分析了当每个数据需求的候选值为多值时的最佳合约设计,假定一共有n个群智终端和q个数据需求,n个群智终端的真实答案所构成的数据集为x={x1,...,xn},其中一个群智终端i的数据xi共有t种取值,记为xi∈{1,2,...,t},t个候选值的真实概率分布向量为π=(π1,...,π
t
)。每个数据需求是一个针对多值数据的频率计数的查询。此外,由于群智终端i的隐私偏好ci是群智终端i的私有信息,数据交易平台无法得知,这使得数据交易问题变得更加难以求解。为了简化该问题,本发明中假设n个群智终端的隐私偏好必须从已知的k种类型中取值,并且每种隐私偏好的分布是公共知识。数据交易平台根据预算b约束和群智终端的隐私偏好信息在交易前设计出数据交易方案,即设计一系列合约合约的具体设计方案将在后续的说明中阐述;
[0044]
1.3、数据交易平台将设计好的一系列合约和相应的数据需求q一起发布给群智终端。
[0045]
2、每个群智终端与平台签订一份合约(∈k,pk),其中为群智终端k的隐私保护水平,pi为群智终端k的数据交易价格,合约以最优化自身群智终端k的收益uk为目标。
[0046]
群智终端i的收益ui用数据交易价格pi与其自身隐私成本之间的差值来表示,因此每个群智终端“最优化自身收益”的目标等价于最大化ui=p
i-ci∈i。其中,数据交易价格pi和隐私成本都与隐私保护水平相关:隐私保护水平越高,隐私成本就越高,但相应的数据交易价格pi也越高;隐私保护水平越低,隐私成本越低,但相应的数据交易价格pi也越低。每个群智终端基于上述原则,在最优化自身收益的目标导向下选择一份合约(∈k,pk)与平台签订。
[0047]
3、每个群智终端按照隐私保护水平对应的随机扰动机制处理原数据,并将扰动后的数据提交给数据交易平台。
[0048]
为了降低隐私泄露的风险,每个群智终端在上传数据前会采用随机扰动机制对原始数据进行扰动,则扰动后数据的概率分布向量可以用表示。其中,随机扰动机制是一个定义域和值域均为χ的函数,对于任意离散型数据x∈χ和一个随机扰动概率ρ,经过随机扰动机制扰动后,它将以概率ρ等于原始数据x,以概率等于其他某个值x

,x

≠x,x

∈χ。当原始数据候选值数量为t时,|χ|=t,在不失一般性的情况下,我
们假设则随机扰动机制满足本地化差分隐私∈,并且该式表明了随机扰动概率ρ与隐私保护水平∈之间的关系。
[0049]
具体来说,如果一个群智终端选择了合约(∈k,pk),他将以的概率提交原始数据,以的概率提交其余t-1个候选值中的一个。每个群智终端按照各自合约中签订的扰动概率对其原始数据进行扰动处理,记扰动后的数据为群智终端将提交给数据交易平台。
[0050]
4、数据交易平台收到从群智终端获取的数据后,按照每个群智终端所签到的合同中的数据交易价格给各个群智终端支付报酬。
[0051]
5、数据交易平台对收集到的数据采用分组加权的估计方法计算聚合统计结果,并返回给提出数据需求q的数据请求者。
[0052]
数据交易平台收集到每个群智终端提交的数据后,得到扰动数据集然后采用一种类似分组加权的估计方法来尽可能准确地估计t个候选值的真实概率分布向量π,将其记为假设n个群智终端按照隐私偏好被分成k组,每个组的群智终端数量为mk,每个组中提交数据t的群智终端数量为并且
[0053]
首先,在随机响应机制下,扰动后的数据dk分布情况可以用以下式子表示:
[0054][0055]
其次,πk的经验估计可以表示为:
[0056][0057]
其中是dk的经验估计,具体表示为的经验估计,具体表示为的公式如下:
[0058][0059]
由于几乎可以肯定所以几乎可以肯定
[0060]
最后,将各组人数占比作为权重对进行加权,得到即
[0061][0062]
以下说明内容重点介绍步骤1中如何设计一系列最佳合约。
[0063]
通过估计概率分布向量及其真实概率分布向量π之间的曼哈顿距离的期望,估算聚合结果的准确度,将最大化准确度的目标反推回到对于合约中的隐私保护水平和数据交易价格的要求上。与π之间的曼哈顿距离的期望计算如下:
[0064][0065][0066][0067]
[0068][0069]
其中,公式(a)可以根据向量范数的三角不等式得到,进一步考虑向量范数的正齐次性可以得到公式(b)。
[0070]
然后,根据现有研究中的结论可以进一步得到公式(c),此处的πc表示常数圆周率3.1415926。最后,将代入公式(c),并通过拉格朗日乘数法解得当时取得其上界。
[0071]
由于本发明中数据效用最优化目标对应的是尽可能获取更准确的数据,即最小化及其真实值π之间的距离。进一步的,把上述问题转化为最小化的上界,即最小化显然,在给定群智终端数量n和候选值数量t的情况下,上述问题可以进一步转化为最小化由此得到最终优化目标。
[0072]
综上所述,最佳合约集可以通过求解以下优化问题得到:
[0073]
[0074][0075][0076][0077]
其中三个约束条件分别对应预算可行性、个体理性和激励相容性。
[0078]
由于上述问题共包括1+k+k(k-1)个约束条件,直接对其进行求解较为困难。因此,进一步的对上述优化问题的三个约束条件分别简化得到以下等价的形式:
[0079][0080]
p
k-ck∈k=0,
[0081]
p
k-ck∈k=p
k+1-ck∈
k+1
,k=1,2,...,k-1。
[0082]
进一步的,该问题还可以转换为以下等价的形式:
[0083][0084][0085]
其中,qk的具体形式如下:
[0086][0087]
δck=c
k-c
k-1

[0088]
简化后的优化问题的约束条件中不包含pk,因此该优化问题可以直接使用经典优化方法求解得到期望的隐私保护水平1≤k≤k。在问题等价转化过程中,得到pk和∈k的关系如下:
[0089][0090]
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

技术特征:
1.一种隐私数据共享和数据交易方法,其特征在于,具体包括如下步骤:1)数据交易平台根据预算b约束和群智终端的隐私偏好信息设计一系列合约然后将设计好的一系列合约和相应的数据需求q一起发布给参与的群智终端;2)每个群智终端与平台签订一份合约(∈
k
,p
k
),其中∈
k
为群智终端k的隐私保护水平,p
i
为群智终端k的数据交易价格,合约以最优化自身群智终端k的收益u
k
为目标:3)每个群智终端按照隐私保护水平对应的随机扰动机制处理原数据,并将扰动后的数据提交给数据交易平台;4)数据交易平台收到从群智终端获取的数据后,按照每个群智终端所签到的合同中的数据交易价格给各个群智终端支付报酬;5)数据交易平台对收集到的数据采用分组加权的估计方法计算聚合统计结果,并返回给提出数据需求q的数据请求者。2.根据权利要求1所述隐私数据共享和数据交易方法,其特征在于,所述步骤3)具体实现方法:为了降低隐私泄露的风险,每个群智终端在上传数据前采用随机扰动机制对原始数据进行扰动,则扰动后数据的概率分布向量用表示,其中,随机扰动机制是一个定义域和值域均为χ的函数,对于任意离散型数据x∈χ和一个随机扰动概率ρ,经过随机扰动机制扰动后,它将以概率ρ等于原始数据x,以概率等于其他某个值x

,x

≠x,x

∈χ;当原始数据候选值数量为t时,|χ|=t,在不失一般性的情况下,假设则随机扰动机制满足本地化差分隐私∈,并且该式表明随机扰动概率ρ与隐私保护水平∈之间的关系;具体来说,如果一个群智终端选择了合约(∈
k
,p
k
),他将以的概率提交原始数据,以的概率提交其余t-1个候选值中的一个;每个群智终端按照各自合约中签订的扰动概率对其原始数据进行扰动处理,记扰动后的数据为群智终端将提交给数据交易平台。3.根据权利要求2所述隐私数据共享和数据交易方法,其特征在于,所述步骤5)具体实现方法:数据交易平台收集到每个群智终端提交的数据后,得到扰动数据集然后采用类似分组加权的估计方法来尽可能准确地估计t个候选值的真实概率分布向量π,将其记为假设n个群智终端按照隐私偏好被分成k组,每个组的群智终端数量为m
k
,每个组中提交
数据t的群智终端数量为并且首先,在随机响应机制下,扰动后的数据d
k
分布情况可用以下式子表示:其次,π
k
的经验估计可表示为:其中是d
k
的经验估计,具体表示为的经验估计,具体表示为的公式如下:最后,将各组人数占比作为权重对进行加权,得到即4.根据权利要求3所述隐私数据共享和数据交易方法,其特征在于,所述步骤1)和2)中的合约,通过估计概率分布向量及其真实概率分布向量π之间的曼哈顿距离的期望,估算聚合结果的准确度,将最大化准确度的目标反推回到对于合约中的隐私保护水平和数据交易价格的要求上,优化合约中的隐私保护水平和数据交易价格。5.一种隐私数据共享和数据交易系统,其特征在于,包括群智终端、数据交易平台和数据请求者;数据请求者向数据交易平台提出数据需求并提供相应的预算支撑,期望利用购买的数据使其利益最大化;群智终端按照约定的隐私保护水平对收集的原始数据添加扰动,实现本地化差分隐私的同时最大化其收益;数据交易平台作为桥梁连接两方,发布合约集和数据需求给群智终端,数据交易平台根据合约收集群智终端提交的数据并支付报酬,最终将收集的数据进行聚合处理后提交给数据请求者。

技术总结
本发明涉及一种隐私数据共享和数据交易方法,数据交易平台收到来自数据请求者的数据需求后根据预算约束和群智终端的隐私偏好信息设计最佳合约集;数据交易平台发布设计好的最佳合约集和相应的数据需求;每个群智终端以自身收益最大化为目标与平台签订一份合约;每个群智终端根据合约中隐私保护水平所对应的随机扰动机制处理原数据后提交给数据交易平台;数据交易平台收到数据后按照每个群智终端所签订合约中的数据交易价格给其支付报酬;数据交易平台对收集到的数据采用一种分组加权的估计方法计算聚合结果返回给数据请求者。以数据效用最优化为目标的实用新型数据交易方法,为物联网应用中的数据分享和数据交易的实用化与产业化发展作出贡献。用化与产业化发展作出贡献。用化与产业化发展作出贡献。


技术研发人员:冯珍妮 俞思佳 方秀
受保护的技术使用者:东华大学
技术研发日:2023.02.10
技术公布日:2023/8/24
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐