一种面向6G的文本语义通信资源分配方法

未命名 09-07 阅读:126 评论:0

一种面向6g的文本语义通信资源分配方法
技术领域
1.本发明涉及无线通信领域,特别涉及一种面向6g的文本语义通信资源分配方法。


背景技术:

2.随着全球移动用户数量和移动数据流量的爆炸式增长,无线网络正面临着越来越严重的频谱压力。传统的比特或符号传输已经无法满足人们对于高速、高效、高质量通信的需求。因此,为了应对未来无线通信的挑战,6g通信技术需要采用更加智能的语义通信(semantic communication,sc)范式,从而实现更加高效、精准和可靠的数据传输。sc技术能够恢复句子的含义,减少语义错误,提高通信的质量和可靠性。在6g的发展中,研究人员可以借鉴已有的sc系统的设计思路,利用机器学习和自然语言处理技术,实现语义信息的自动提取和转换,从而使6g系统容量最大化,同时使语义错误最小化。因此,可以预见,在未来的6g通信中,语义通信技术将成为一个重要的研究方向和应用领域,为6g通信的高效、精准和可靠提供技术支持。
3.虽然sc系统的设计已经有了很大的进展,但是多小区sc网络中的资源分配的研究却相对较少。不合理的资源分配可能会导致语义理解上出现重大的偏差。因此,研究多小区sc网络中的资源分配是非常必要的。sc资源分配的目标是以最小的资源成本实现最大的语义理解准确性。这就面临着以下三个主要挑战:
4.(1)如何在多小区网络中采用sc?
5.(2)如何实现语义符号映射的协同适配?
6.(3)如何实现实时和适应信道变化?研究人员需要探索多小区sc网络的资源分配算法,以实现最佳的系统性能和资源利用效率。


技术实现要素:

7.为了实现更高效的语义传输系统,本发明提出一个最大化总语义信息频谱效率的模型,求解该模型获取最优资源分配,最大化总语义信息频谱效率的模型表示为:
[0008][0009]
约束条件:
[0010][0011][0012][0013]
其中,τ表示所有用户的每个词的平均语义符号数的集合,τk表示第k个用户的每个词的平均语义符号数;w表示所有基站到所有用户的波束赋形,wk表示所有基站到第k个用户的波束赋形,w
n,k
表示从第n个bs到第k用户的波束赋形;h表示所有基站到所有用户的
信道,hk表示所有基站到第k个用户的信道,h
n,k
表示从第n个bs到第k用户的信道;为基站的集合,n为基站的数量;为用户的集合,k为用户的数量;lk表示文本的长度,ik表示文本的语义信息量;ξ(τk,wk;hk)表示语义相似度;γ表示τk的最大取值;pn表示第n个基站的传输功率;γk(wk;hk)表示第k个用户的sinr值,γ
th
为设置的sinr阈值;ξ
th
为设置的语义相似度阈值。
[0014]
进一步的,语义相似度ξ(τk,wk;hk)采用广义逻辑回归函数进行定义,表示为:
[0015][0016]
其中,为广义逻辑回归函数参数,这些参数可以使用非线性最小二乘法的标准来确定;γ为τk的最大取值。
[0017]
进一步的,在求解最大化总语义信息频谱效率的模型的过程中,将该模型拆分为选择决策和资源分配两个子问题,其中选择决策是指在e个可能的选择动作中进行选择,以找到最优的选择动作τ
*
;对于这e个可能的选择动作,资源分配问题可以表示为:
[0018][0019]
约束条件:
[0020][0021][0022]
进一步的,引入新的优化变量和附加约束对资源分配问题进行优化,优化后的资源分配问题表示为:
[0023][0024]
约束条件:
[0025][0026][0027][0028]
其中,s
*
(τ;h)表示优化后的最优资源分配;η表示所有用户的优化变量,ηk表示第k个用户的优化变量;为一个广义逻辑回归函数,为广义逻辑回归函数参数,这些参数可以使用非线性最小二乘法的标准来确定。
[0029]
进一步的,在求解优化后的资源分配问题时,将该问题拆分为两个子问题,具体包括:
[0030]
在给定所有用户的优化变量η的前提下对所有基站到所有用户的波束赋形w进行
优化,包括:
[0031]
find w
[0032]
约束条件:
[0033][0034]
利用优化得到的所有基站到所有用户的波束赋形w,对所有用户的优化变量η进行优化,包括:
[0035][0036]
约束条件:
[0037][0038][0039]
其中,pn表示第n个基站的传输功率。
[0040]
进一步的,设计一个选择策略函数π
θ
当信道h确定后,该函数可以快速生成最优选择动作τ
*
,具体包括以下步骤:
[0041]
在第t个时间间隔中,深度神经网络将第t个时间间隔确认的信道h
t
作为输入,h
t
被转换成h
t
,其中之后h
t
作为输入传递给参数化函数输出松弛选择动作,表示为:
[0042][0043]
使用knn算法将松弛选择动作τ
t
量化为e个选择动作,其中e可以是[1,γk]内的任意整数,具体包括:
[0044][0045]
在第t个时间间隔的最佳选择动作表示为:
[0046][0047]
利用第t个时间间隔的最佳选择动作来更新深度神经网络的选择策略,利用完成训练的深度神经网络根据当前时间帧确认的信道确定最佳选择动作;
[0048]
其中,是此时生成松弛选择动作的参数化函数,为第t个时间间隔第i个用户输出的松弛选择动作,qe(
·
)是将松弛选择动作量化成选择动作的量化函数,为第t个时间间隔第i个用户输出的选择动作;为以h
t
为输入的优化后的资源分配问题。
[0049]
进一步的,深度神经网络在悬念过程中的损失函数表示为:
[0050][0051]
其中,l(θ
t
)表示网络参数为θ
t
的深度神经网络的损失函数;ω
t
表示在第t个时间帧选择的样本集;表示从样本集ω
t
中随机选择出来的第ω个最优选择动作,h
ω
表示的是第ω个最优选择动作对应的信道。
[0052]
本发明考虑了一个具有多天线bss和单天线用户的多小区网络,该网络利用联合传输comp和sc技术来传输文本,为了使总语义信息的频谱效率最大化,本发明提出了一个非凸的minlp问题,之后通过结合drl方法和am算法,开发了一种低复杂度的dsmra算法来求解上述问题;仿真结果表明,本发明所提出的dsmra算法取得了与最优方案接近的最佳选择性能,但大大减少了运行时间的消耗,使实时选择优化在实际动态信道环境下真正可行。
附图说明
[0053]
图1为本发明中多小区网络中基于comp的sc系统示意图;
[0054]
图2为本发明采用dsmra算法的流程图;
[0055]
图3为本发明采用dsmra算法的训练损失曲线。
具体实施方式
[0056]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0057]
为了实现更高效的语义传输系统,必须同时解决背景技术中提到的三个挑战。本发明针对一个多天线基站(base stations,bs)和单天线用户的多小区网络,该网络采用协调多点(coordinated multi-point,comp)和sc技术来传输文本语义信息。为了最大限度地提高该网络的总语义信息频谱效率(semantic spectral efficiency,sse),构建了一个非凸的混合整数非线性规划(mixed-integer nonlinear programming,minlp)问题。之后设计了一个有效的低复杂度的基于深度强化学习(deep reinforcement learning,drl)的动态语义映射和资源分配(drl-based dynamic semantic mapping and resource allocation,dsmra)算法来解决形成的问题。具体来说,此算法将该问题分解为两个子问题:选择决策和资源分配。对于选择决策,本发明设计了一个深度神经网络(deep neural network,dnn),通过不断学习经验来确定最佳选择行动;对于资源分配,本发明采用交替最小化(alternating minimization,am)算法来解决。与传统的drl方法不同,本发明提出的dsmra算法将传统数值优化算法与drl方法相结合,使其能够实现接近最优的选择性能,并适用于实际的动态信道环境。
[0058]
如图1所示,本实施例考虑了一个多小区网络,该网络由一个边缘云、n个基站和k个用户组成,在本实施例中定义基站集合和用户集合分别为和n个基站采用comp技术进行协作,以使用相同的时间和频率向k个用户发送文本数据
如图1,边缘云将文本数据通过光纤发送给每个基站,基站通过文本数据构建发送数据通过信道发给用户,用户从接受数据中获取对应的文本数据。本发明通过使用sc技术,每个基站可以只向每个用户传输文本的含义(称为语义信息),而不是文本本身,以减小在无线信道上传输的数据的大小。在sc系统中,首先在基站端从文本数据中提取语义信息,之后送入无线信道进行传输,最后在用户端将语义信息恢复为文本数据,本实施例通过在基站端和用户端部署机器学习模型deepsc来实现语义信息的提取和恢复。
[0059]
接下来,本实施例从语义传输模型,构建以及求解最大化语义信息的系统吞吐量的模型等几个方面对本发明进行具体说明。
[0060]
1、语义传输模型
[0061]
对于第k个用户的文本其中s
k,l
表示第k个用户的第l个单词,lk表示文本的长度。首先将sk输入各个基站处的deepsc中,以提取出该文本的语义符号向量这里表示第k个用户的每个词的平均语义符号数,同时:
[0062][0063]
其中,γ表示它可以取到的最大值。
[0064]
本实施例假设每个基站有m根发射天线,每个用户有一根接收天线,则表示从第n个基站到第k用户的波束赋形,同时其满足下列约束:
[0065][0066]
其中,pn表示第n个基站的传输功率。因此第k个用户的信干噪比(signal to interference and noise ratio,sinr)为:
[0067][0068]
则第k个用户的sse为:
[0069][0070]
其中,ik表示文本sk的语义信息量,τklk表示传输这些语义信息量所需的语义符号数,ξ(τk,wk;hk)表示语义相似度。由于语义相似度并未有一个明确的表达式,本实施例则采用了广义逻辑回归函数,即:
[0071][0072]
之后,为了保证传输可靠性,本实施例设置了sinr阈值γ
th
和语义相似度阈值ξ
th

因此有以下约束:
[0073][0074][0075]
2、问题形成
[0076]
根据以上分析,本实施例提出一个总sse最大化的资源分配模型,该模型可以表示为:
[0077]
p 1:
[0078]
约束条件:
[0079][0080][0081][0082]
其中,表示所有用户的波束赋形,wk表示所有基站到第k个用户的波束赋形;表示所有用户的信道集合,表示所有基站到第k个用户的信道集合,表示每个用户选择的动作。由于整数变量τ的存在,p1显然是一个非凸的minlp问题,通常是np-hard,传统的数值优化方法是难以解决这个问题的,但是可以将p1分解为两个子问题:选择决策和资源分配p1.1,以便更好地进行求解。
[0083]
(1)选择决策:需要在e个可能的选择动作中进行选择,以找到最优的选择动作τ
*

[0084]
(2)资源分配:通过求解p1.1可以获得最佳资源分配w
*

[0085]
p 1.1:
[0086]
约束条件:
[0087][0088][0089]
之后本实施例提出了一种基于drl的dsmra算法来求解上述优化问题。
[0090]
3、dsmra算法
[0091]
本实施例的目的是设计一个选择策略函数π
θ
,其中θ是选择策略函数的参数集。当信道h确定后,该函数可以快速生成最优选择动作τ
*
,即:
[0092][0093]
本实施例所提出的dsmra算法就是从经验中逐渐学习这个策略函数。dsmra算法由
3个模块组成组成:学习模块、资源分配模块和更新模块。具体包括:
[0094]
(1)学习模块
[0095]
在第t个时间帧中,dnn将h
t
作为输入,然后h
t
被转换成h
t
,其中并作为输入传递给参数化函数输出松弛选择动作,
[0096][0097]
然后,使用knn将松弛选择动作τ
t
量化为e个选择动作,其中e可以是[1,γk]内的任意整数,即:
[0098][0099]
当给定选择动作时,p1就被转换成p1.1,之后通过求解p1.1就可以确定最优资源分配p1.1的具体求解在后续(3)更新模块中给出。这样,本实施例就可以得到总sse,即并记其为选择动作τe对应的奖励。同时e次选择动作可以并行处理。因此,在第t个时间间隔的最佳选择动作是:
[0100][0101]
(2)资源分配模块
[0102]
当最佳选择动作确定之后,我们来求解问题p1.1。为了获得问题p1.1的更好的可解性,首先引入新的优化变量ηk和附加约束,即
[0103][0104][0105]
然后公式(6)和(7)就可以转换为
[0106][0107][0108]
这样就可以得到p1.1的等价问题p1.2。
[0109]
p1.2:
[0110]
约束条件:
[0111][0112][0113]
[0114]
其中,之后再将p1.2分解为两个子问题p1.2.1和p1.2.2进行求解,具体包括以下步骤:
[0115]
给定η优化w:
[0116]
p1.2.1:find w
[0117]
约束条件:
[0118][0119]
给定w优化η:
[0120]
p1.2.2:
[0121]
约束条件:
[0122][0123][0124]
上述这两个子问题都采用求解器cvx进行求解,之后通过交替最小化(the alternating minimization,am)算法进行交替求解得到问题p1.2的解。
[0125]
(3)更新模块
[0126]
本实施例使用在公式(11)中获得的最优选择动作来更新dnn的选择策略。具体地说,建立一个容量有限的存储器,该存储器最初是空的,新的训练数据样本不断添加到其中。当存储器满时,新生成的数据样本将替换最旧的数据样本。然后,使用经验重放技术用存储的数据样本训练dnn。在第t个时间帧,随机选择一批数据样本其中ω
t
表示在第t个时间帧选择的样本集,|ω
t
|表示样本集中样本的数量。之后dnn的参数θ
t
由adam算法更新以降低平均交叉熵,即:
[0127][0128]
当收集到足够的数据样本时,本实施例每隔δ段时间训练一次dnn。图3是损失函数曲线图,记录了dsmra算法的训练收敛过程,表明随着时间t的增加,训练损失逐渐减少。当t>20000时,训练损失开始稳定在0.1左右。
[0129]
图2展示了本实施例所提出的dsmra算法的流程图,该算法包括三个模块,即学习模块、资源分配模块和更新模块。学习模块的目的是设计一个策略函数,当信道状态h确定后,策略函数可以快速生成最优选择动作τ
*
;资源分配模块的目的是在τ
*
确定的情况下解决问题p1.1;更新模块的目的是通过体验重放技术随时间更新策略函数。
[0130]
图3显示了我们的dsmra算法的训练损失。最初的高损失是由产生随机映射设计的未精炼策略函数导致的。然而,通过强化学习过程,dnn利用过去的经验不断改进政策功能。随着训练的进行,损耗逐渐稳定在0.1左右。损失的微小波动很大程度上是由于训练数据中固有的随机性,这表明策略函数的训练是成功的。
[0131]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种面向6g的文本语义通信资源分配方法,其特征在于,提出一个最大化总语义信息频谱效率的模型,求解该模型获取最优资源分配,最大化总语义信息频谱效率的模型表示为:约束条件:约束条件:约束条件:约束条件:其中,τ表示所有用户的每个词的平均语义符号数的集合,τ
k
表示第k个用户的每个词的平均语义符号数;w表示所有基站到所有用户的波束赋形,w
k
表示所有基站到第k个用户的波束赋形,w
n,k
表示从第n个bs到第k用户的波束赋形;h
k
表示所有基站到第k个用户的信道;为基站的集合,n为基站的数量;为用户的集合,k为用户的数量;l
k
表示文本的长度,i
k
表示文本的语义信息量;ξ(τ
k
,w
k
;h
k
)表示语义相似度;γ表示τ
k
的最大取值;p
n
表示第n个基站的传输功率;γ
k
(w
k
;h
k
)表示第k个用户的sinr值,γ
th
为设置的sinr阈值;ξ
th
为设置的语义相似度阈值,上标h表示求矩阵的共轭转置。2.根据权利要求1所述的一种面向6g的文本语义通信资源分配方法,其特征在于,语义相似度ξ(τ
k
,w
k
;h
k
)采用广义逻辑回归函数进行定义,表示为:其中,为广义逻辑回归函数参数。3.根据权利要求1所述的一种面向6g的文本语义通信资源分配方法,其特征在于,在求解最大化语义信息的频谱效率的模型的过程中,将该模型拆分为选择决策和资源分配两个子问题,其中选择决策是指在e个可能的选择动作中进行选择,以找到最优的选择动作τ
*
;对于这e个可能的选择动作,资源分配问题可以表示为:约束条件:约束条件:约束条件:4.根据权利要求3所述的一种面向6g的文本语义通信资源分配方法,其特征在于,引入新的优化变量和附加约束对资源分配问题进行优化,优化后的资源分配问题表示为:
约束条件:约束条件:约束条件:约束条件:其中,s
*
(τ;h)表示优化后的最优资源分配,h表示所有基站到所有用户的信道;η表示所有用户的优化变量;为一个广义逻辑回归函数,为广义逻辑回归函数参数;η
k
表示第k个用户的优化变量。5.根据权利要求4所述的一种面向6g的文本语义通信资源分配方法,其特征在于,在求解优化后的资源分配问题时,将该问题拆分为两个子问题,具体包括:在给定所有用户的优化变量η的前提下对所有基站到所有用户的波束赋形w进行优化,包括:find w约束条件:约束条件:利用优化得到的所有基站到所有用户的波束赋形w,对所有用户的优化变量η进行优化,包括:约束条件:约束条件:约束条件:其中,p
n
表示第n个基站的传输功率。6.根据权利要求4所述的一种面向6g的文本语义通信资源分配方法,其特征在于,设计一个选择策略函数π
θ
当信道h确定后,该函数可以快速生成最优选择动作τ
*
,具体包括以下步骤:在第t个时间间隔中,深度神经网络将第t个时间间隔确认的信道h
t
作为输入,将h
t
转换为h
t
,表示为:将h
t
作为输入传递给参数化函数输出松弛选择动作,表示为:
使用knn算法将松弛选择动作τ
t
量化为e个选择动作,其中e可以是[1,γ
k
]内的任意整数,具体包括:在第t个时间间隔的最佳选择动作表示为:利用第t个时间间隔的最佳选择动作来更新深度神经网络的选择策略,利用完成训练的深度神经网络根据当前时间间隔确认的信道确定最佳选择动作;其中,是此时生成松弛选择动作的参数化函数,为第t个时间间隔第i个用户输出的松弛选择动作,q
e
(
·
)是将松弛选择动作量化成选择动作的量化函数,为第t个时间间隔第i个用户输出的选择动作;为以h
t
为输入的优化后的资源分配问题。7.根据权利要求6所述的一种面向6g的文本语义通信资源分配方法,其特征在于,深度神经网络在悬念过程中的损失函数表示为:其中,l(θ
t
)表示网络参数为θ
t
的深度神经网络的损失函数;ω
t
表示在第t个时间帧选择的样本集,|ω
t
|表示样本集中样本的数量;表示从样本集ω
t
中随机选择出来的第ω个最优选择动作,h
ω
表示的是第ω个最优选择动作对应的信道。

技术总结
本发明涉及无线通信领域,特别涉及一种面向6G的文本语义通信资源分配方法,包括提出一个最大化总语义信息频谱效率的模型,求解该模型获取最优资源分配;本发明结合DRL方法和AM算法求解最优资源分配,与现有技术相比,本发明大大减少了运行时间的消耗,使实时选择优化在实际动态信道环境下真正可行。在实际动态信道环境下真正可行。在实际动态信道环境下真正可行。


技术研发人员:蒲旭敏 雷田田 温万里 陈前斌
受保护的技术使用者:重庆邮电大学空间通信研究院
技术研发日:2023.06.19
技术公布日:2023/9/6
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐