一种模型调整方法和装置

未命名 09-13 阅读:97 评论:0


1.本公开涉及通信技术领域,尤其涉及一种模型调整方法和装置。


背景技术:

2.在未来的万物智联网络中,网络节点趋向于智能化,网络节点智能化导致了信息空间快速扩张、甚至维度灾难,加剧了表征信息承载空间的难度,导致传统的网络服务能力与高维信息空间难以匹配,通信传输的数据量过大,信息业务服务系统无法持续满足人们复杂、多样和智能化信息传输的需求。而通过人工智能模型来编码、传播、解码业务信息,可显著降低通信业务中的数据传输量,极大地提升了信息传输效率。这些模型相对稳定,并具有复用性、传播性。模型的传播和复用将有助于增强网络智能,同时降低开销和资源浪费,形成节点极智、网络极简的智简网络。
3.随着深度学习技术的发展,深度学习模型得以广泛地应用,然而目前存在如何将其他模型应用于目标模型的场景中的技术问题。


技术实现要素:

4.本公开提供了一种模型调整方法和装置。
5.根据本公开的第一方面,提供了一种模型调整方法,其中,包括:
6.获取与目标模型相关联的第一模型和第二模型,其中,目标模型为第一模型和第二模型之间的过渡模型;
7.将标准训练集输入到第一模型中,以得到第一输出结果;
8.将标准训练集输入到第二模型中,以得到第二输出结果;
9.根据第一输出结果和第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的功能接近目标模型的功能;
10.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数;
11.第三参数介于第一参数和第二参数之间。
12.根据本公开的第二方面,提供了一种模型调整装置,其中,包括:
13.获取单元,获取与目标模型相关联的第一模型和第二模型,其中,目标模型为第一模型和第二模型之间的过渡模型;
14.第一输入单元,将标准训练集输入到第一模型中,以得到第一输出结果;
15.第二输入单元,将标准训练集输入到第二模型中,以得到第二输出结果;
16.调整单元,根据第一输出结果和第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的功能接近目标模型;
17.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数;
18.第三参数介于第一参数和第二参数之间。
19.根据本公开的第三方面,提供了一种电子设备,包括:
20.至少一个处理器;以及
21.与至少一个处理器通信违接的存储器;其中,
22.存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
23.根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述方法。
24.本公开提供的技术方案带来的有益效果是:
25.本公开实施例提供的方案,获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间;从而实现对本地的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的应用场景,进而提升网络性能。
26.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
27.附图用于更好地理解本方案,不构成对本公开的限定。其中:
28.图1是根据本公开实施例一提供的模型调整方法的流程示意图;
29.图2是根据本公开实施例二提供的模型调整装置的结构示意图;
30.图3是本公开实施例的电子设备的框图。
具体实施方式
31.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
32.智简网络中主要通过人工智能模型传播业务信息,通过使用人工智能模型将待传播的第一业务信息压缩为与所述人工智能模型相关的第二业务信息,极大地降低了网络中的数据通信量,压缩效率进超传统的压缩算法。其中,发送端设备利用预先配置的第一模型对所述第一业务信息进行提取并得到待传输的第二业务信息;所述发送端设备向接收端设备传输所述第二业务信息。接收端设备接收所述第二业务信息,并利用预先配置的第二模型对所述第二业务信息进行恢复处理得到第三业务信息;经第二模型恢复的第三业务信息比起原先的第一业务信息会有些许质量上的差异,但两者在内容上是一致的,给用户的体验几乎是无差异的。在所述发送端设备向接收端设备传输所述第二业务信息之前,还包括:更新模块判断所述接收端设备是否需要对所述第二模型进行更新,并在判断需要更新时向所述接收端设备传输预先配置的第三模型,所述接收端设备利用所述第三模型对所述第二模型进行更新。通过预先训练好的人工智能模型对业务信息进行处理,可显著降低通信业
务中的数据传输量,极大地提升了信息传输效率。这些模型相对稳定,并具有复用性、传播性。模型的传播和复用将有助于增强网络智能,同时降低开销和资源浪费。所述模型能够根据不同切分规则切分为若干个模型切片,上述模型切片也可以在不同的网络节点之间传输,模型切片可以组装成模型。模型切片可以分散存储在多个网络节点上。当网络节点请发现自己缺少或需要更新某模型或某模型切片时,可以通过请求的方式,向周围可能具有该切片的节点请求。
33.传输所述业务信息、传输所述模型均发生在通信网络的网络层,基于网络层协议进行通信传输。传输所述业务信息、传输所述模型的路径上经过的网络节点包括智简路由器。智简路由器的功能包括但不限于业务信息传输、模型传输,吸收模型自我更新,安全保护等功能。智简路由器的传输功能,涉及将业务信息或模型从信源节点传输到信宿节点,信源节点和信宿节点之间存在多个路径。智简路由器的模型传输功能,可以对模型切片进行传输,通过合理安排模型切片走多个路径,多路传输模型切片,提高模型传输速率。
34.实施例一
35.图1示出了本公开实施例提供的一种模型调整方法,如图1所示,包括:
36.步骤s101,获取与目标模型相关联的第一模型和第二模型,其中,目标模型为第一模型和第二模型之间的过渡模型;
37.步骤s102,将标准训练集输入到第一模型中,以得到第一输出结果;
38.将标准训练集输入到第二模型中,以得到第二输出结果;
39.步骤s103,根据第一输出结果和第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的功能接近于目标模型的功能;
40.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数;
41.第三参数介于第一参数和第二参数之间。
42.本公开获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间;从而实现对本地的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的应用场景,进而提升网络性能。
43.本公开在调整第一模型的第一参数时,不仅考虑了第一模型处理标准训练集的第一输出结果,还结合了第二模型处理标准训练集的第二输出结果,从而使得调整得到的第三参数介于第一模型的第一参数和第二模型的第二参数之间,有效避免了过拟合问题,并且优化第三模型的泛化能力,使得第三模型可以应用在目标模型的场景,进而提升网络性能。
44.本公开实施例提供了一种可能的实现方式,其中,在步骤s101之前,还包括:
45.接收请求;
46.根据请求查询目标模型;
47.响应于未查询到目标模型,查询与目标模型相关联的第一模型和第二模型。
48.具体地,当没有查询到目标模型时,可以获取与目标模型相关联的第一模型和第
二模型,进而通过模型调整方法得到与目标模型接近的第三模型。
49.具体地,智简通信中的智能节点不直接传输信息本身,而是传输信息的特殊编码以及进行解码的深度学习智简模型,将解码恢复数据的工作交由接收端的智简模型进行处理,因而在移动设备上拥有广泛的应用前景,本公开可以应用于发射端;
50.步骤s101之前,包括:
51.获取接收端的请求;
52.根据请求查询与请求对应的目标模型;
53.响应于未查询到目标模型,查询与目标模型相关联的第一模型和第二模型。
54.本公开中的发射端获取接收端的请求,响应于发射端未查找到请求对应的目标模型,获取接近于目标模型的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,即第一模型和第二模型为目标模型过渡两端的模型,通过对目标模型过渡两端的其中一个模型进行参数调整,得到第三模型,从而实现对接收端本地的现有模型进行参数调整,使得参数调整后的模型满足请求,并且发射端不需要获取新的模型参数,进而提升网络性能。
55.其中,发射端为网络中的节点,接收端为移动端,发射端和接收端无线通违接。
56.示例性地,用户乘坐高铁从平原地区进入高原地区,此时目标模型为平原场景到高原场景的中间场景对应的健康分析模型。但节点现有模型参数包括第一参数和第二参数,第一参数适用于平原场景对应的第一模型,第二参数适用于高原场景对应的第二模型,然而第一模型和第二模型对中间过程则精度不足。
57.节点查询并获取与目标模型相关联的第一模型和第二模型,并需要生成可应用于中间海拔场景的渐变新模型;
58.节点根据请求获取标准数据集,将标准数据集划分为标准训练集和标准测试集,其中,标准数据集为中间海拔场景对应的数据集;
59.将标准训练集输入到第一模型中,以得到第一输出结果s1;
60.将标准训练集输入到第二模型中,以得到第二输出结果s2;
61.节点根据第一输出结果s1和第二输出结果s2对第一模型进行参数调整,得到第三模型;
62.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数,第三参数介于第一参数和第二参数之间。
63.本公开实施例提供了一种可能的实现方式,其中,步骤s103包括:
64.对第一模型进行分析,以得到第一模型的待调整参数,其中,第一参数包括待调整参数;
65.根据第一输出结果和第二输出结果对待调整参数进行参数调整,以得到第三模型。
66.具体地,待调整参数可以为第一参数的部分参数或全部参数。
67.具体地,可以根据需求对第一模型进行分析;
68.由于第一模型是与目标模型相关联的模型,因此,即使需求发生变化,也只是应用场景发生变化,因此,只需要对第一模型的部分模型参数进行调整,无需对整个模型进行重新训练。
69.示例性地,以用户乘坐高铁从平原地区进入高原地区举例说明,由于平原地区和高原地区的海拔不同,因此气压也不同,高海拔地区大气稀薄,人体心率会随着海拔升高而升高,此时将心率数据输入第一模型可能会导致模型误判心率异常,因此需要对第一模型的部分参数进行调整,例如可以将心率检测部分的权重(weights)和偏置(bias)参数进行修改,因此心率检测部分的权重参数和偏置参数为待调整参数。
70.具体地,由于移动端发送的请求中包括有需求,因此可以根据移动端的请求对第一模型进行分析。
71.本公开实施例提供了一种可能的实现方式,其中,进行参数调整,包括:
72.对第一输出结果进行微分处理,以得到梯度;
73.根据梯度、更新步长和第二输出结果对第一模型进行参数调整。
74.其中,更新步长用于控制模型更新的幅度,更新步长越大则参数更新越快。
75.具体的,假定权重修改后表示为;
76.则参数更新公式如下述公式所示:
77.;
78.其中,w用于表示原始权重;
79.l用于表示更新步长;
80.g用于表示梯度矩阵,由模型输出值与标签值输入loss函数后对权重w求微分获得,需要说明的是偏置bias更新方式同上。
81.本公开实施例提供了一种可能的实现方式,其中,还包括:
82.采用标准测试集对第三模型进行测试,将通过测试的第三模型进行发送。
83.具体地,为了保证模型的准确率,就需要在模型发送到移动端之前对模型进行测试,只有在模型测试通过后,才会将模型发送至移动端。
84.本公开实施例提供了一种可能的实现方式,其中,还包括:
85.采用标准测试集对第三模型进行测试,根据通过测试的第三模型对第一模型进行更新。
86.具体地,为了保证模型的准确率,就需要在模型发送到移动端之前对模型进行测试,只有在模型测试通过后,才会将测试通过的模型更新到本地模型中。
87.示例性地,可以只将调整参数进行更新;
88.例如,将第一参数中的待调整参数记为参数a;
89.将第一模型进行参数调整后的参数记为参数b,第三模型的第三参数包括参数b;
90.根据通过测试的第三模型对第一模型进行更新,可以将参数b替换第一参数的参数a。
91.示例性地,可以将模型参数进行更新;
92.例如,将第三参数替换第一参数。
93.示例性地,可以将模型进行更新;
94.例如,将第三模型替换第一模型。
95.本公开实施例提供了一种可能的实现方式,其中,目标模型应用于目标场景,第一模型应用于第一场景,第二模型应用于第二场景;
96.目标场景介于第一场景和第二场景之间。
97.示例性地,用户乘坐高铁从平原地区进入高原地区,期间使用移动端的健康分析模型对自身进行监测,第一模型的应用场景为平原场景,第二模型的应用场景为高原场景,目标模型应用于平原场景和高原场景之间的中间场景。
98.本公开实施例提供了一种可能的实现方式,其中,还包括:
99.根据请求获取标准数据集,将标准数据集划分为标准训练集和标准测试集。
100.具体地,针对不同功能的模型选取对应类型的标准测试集来测量模型精度。
101.例如,视觉模型可以选取图像测试集;
102.例如,语音识别模型可以选取声音测试集。
103.具体地,针对请求中的不同需求对应的智简模型选取对应的标准数据集。
104.例如,请求为检测对应海拔的心率,可以选取对应海拔的标准心率数据集,将对应海拔的标准心率数据集输入第三模型进行推理,该对应海拔的标准心率数据集有标准答案即标签,将标签与第三模型推理出的第三输出结果进行比较,根据比较结果的相似度即可了解第三模型是否能应用于目标场景。
105.示例性地,用户乘坐高铁从平原地区进入高原地区,期间使用移动端的健康分析模型对自身进行监测,该健康分析模型为目标模型,该目标模型需要从节点获取。但节点现有模型参数包括第一参数和第二参数,第一参数适用于平原场景对应的第一模型,第二参数适用于高原场景对应的第二模型,然而第一模型和第二模型对中间过程则精度不足。
106.移动端向节点发起请求,节点没有检测到符合请求的目标模型,该目标模型为中间海拔场景对应的健康分析模型,因此节点查询并获取与目标模型相关联的第一模型和第二模型,并需要生成可应用于中间海拔场景的渐变新模型。
107.节点对本地现存的平原场景对应的第一模型进行分析,根据请求确定与需要更改的模型参数,此处需要更改的模型参数为待调整参数。
108.根据请求获取标准数据集,将标准数据集划分为标准训练集和标准测试集,其中,标准数据集为中间海拔场景对应的数据集;
109.将标准训练集输入到第一模型中,以得到第一输出结果s1;
110.将标准训练集输入到第二模型中,以得到第二输出结果s2;
111.智能节点对第一输出结果s1进行微分,获取梯度,并结合步长以及第二输出结果s2等参数对第一模型进行参数调整,得到第三模型;
112.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数,第三参数介于第一参数和第二参数之间;
113.读取标准测试集,并将标准测试集输入至第三模型中,得到第三输出结果,将第三输出结果与标签相比较,并根据比较结果判断第三模型是否通过测试;
114.节点将通过测试的第三参数更新至本地的模型中,以得到第三模型,该第三模型就是介于平原地区与高原地区之间的渐变模型,能够良好地适应高铁上坡行进中的健康分析需求;
115.节点将本地的第三模型发送至移动端。
116.实施例二
117.以上是对一种模型调整方法进行的描述,下面将对一种模型调整装置进行描述。
118.图2示出了本公开实施例提供的一种模型调整装置,如图2所示,包括:
119.获取单元201,获取与目标模型相关联的第一模型和第二模型,其中,目标模型为第一模型和第二模型之间的过渡模型;
120.第一输入单元202,将标准训练集输入到第一模型中,以得到第一输出结果;
121.第二输入单元203,将标准训练集输入到第二模型中,以得到第二输出结果;
122.调整单元204,根据第一输出结果和第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的功能接近目标模型;
123.其中,第一模型的模型参数为第一参数,第二模型的模型参数为第二参数,第三模型的模型参数为第三参数;
124.第三参数介于第一参数和第二参数之间。
125.本公开获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间;从而实现对本地的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的场景,进而提升网络性能。
126.本公开在调整第一模型的第一参数时,不仅考虑了第一模型处理标准训练集的第一输出结果,还结合了第二模型处理标准训练集的第二输出结果,从而使得调整得到的第三参数介于第一模型的第一参数和第二模型的第二参数之间,有效避免了过拟合问题,并且优化第三模型的泛化能力,使得第三模型可以应用在目标模型的场景,进而提升网络性能。
127.本公开实施例提供了一种可能的实现方式,其中,还包括:
128.接收单元,接收请求;
129.第一查询单元,根据请求查询目标模型;
130.第二查询单元,响应于未查询到目标模型,查询与目标模型相关联的第一模型和第二模型。
131.本公开实施例提供了一种可能的实现方式,其中,调整单元包括:
132.分析模块,根据请求对第一模型进行分析,以得到第一模型的待调整参数,其中,第一参数包括待调整参数;
133.处理模块,根据第一输出结果和第二输出结果对待调整参数进行参数调整,以得到第三模型。
134.本公开实施例提供了一种可能的实现方式,其中,调整单元包括:
135.微分计算模块,对第一输出结果进行微分处理,以得到梯度;
136.参数调整模块,根据梯度、更新步长和第二输出结果对第一模型进行参数调整。
137.本公开实施例提供了一种可能的实现方式,其中,处理模块包括:
138.微分计算组件,对第一输出结果进行微分处理,以得到梯度;
139.参数调整组件,根据梯度、更新步长和第二输出结果对第一模型进行参数调整。
140.本公开实施例提供了一种可能的实现方式,其中,还包括:
141.发送单元,采用标准测试集对第三模型进行测试,将通过测试的第三模型进行发送。
142.本公开实施例提供了一种可能的实现方式,其中,还包括:
143.更新单元,采用标准测试集对第三模型进行测试,根据通过测试的第三模型对第一模型进行更新。
144.本公开实施例提供了一种可能的实现方式,其中,目标模型应用于目标场景,第一模型应用于第一场景,第二模型应用于第二场景;
145.目标场景介于第一场景和第二场景之间。
146.本公开实施例提供了一种可能的实现方式,其中,还包括:
147.根据请求获取标准数据集,将标准数据集划分为标准训练集和标准测试集。
148.对于本公开实施例,其实现的有益效果同上述模型调整方法实施例,此处不再赘述。
149.本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不远背公序良俗。
150.根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
151.该电子设备,包括:
152.至少一个处理器;以及
153.与至少一个处理器通信违接的存储器;其中,
154.存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
155.该电子设备获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间;从而实现对本地的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的场景,进而提升网络性能。
156.该电子设备在调整第一模型的第一参数时,不仅考虑了第一模型处理标准训练集的第一输出结果,还结合了第二模型处理标准训练集的第二输出结果,从而使得调整得到的第三参数介于第一模型的第一参数和第二模型的第二参数之间,有效避免了过拟合问题,并且优化第三模型的泛化能力,使得第三模型可以应用在目标模型的场景,进而提升网络性能。
157.该存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开实施例提供的方法。
158.该可读存储介质获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间;从而实现对本地的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的场景,进而提升网络性能。
159.该可读存储介质在调整第一模型的第一参数时,不仅考虑了第一模型处理标准训练集的第一输出结果,还结合了第二模型处理标准训练集的第二输出结果,从而使得调整
得到的第三参数介于第一模型的第一参数和第二模型的第二参数之间,有效避免了过拟合问题,并且优化第三模型的泛化能力,使得第三模型可以应用在目标模型的场景,进而提升网络性能。
160.图3示出了可以用来实施本公开的实施例的示例电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其他适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其他类似的计算装置。本文所示的部件、它们的违接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
161.如图3所示,设备300包括计算单元301,其可以根据存储在只读存储器(rom)302中的计算机程序或者从存储单元308加载到随机访问存储器(rm)303中的计算机程序,来执行各种适当的动作和处理。在rm303中,还可存储设备300操作所需的各种程序和数据。计算单元301、rom 302以及rm 303通过总线304彼此相违。输入/输出(i/o)接口307也违接至总线304。
162.设备300中的多个部件违接至i/o接口305,包括:输入单元306,例如键盘、鼠标等;输出单元307,例如各种类型的显示器、扬声器等;存储单元308,例如磁盘、光盘等;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
163.计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(pu)、图形处理单元(gpu)、各种专用的人工智能(i)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理,例如模型调整方法。例如,在一些实施例中,模型调整方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元307。在一些实施例中,计算机程序的部分或者全部可以经由rom302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到rm 303并由计算单元301执行时,可以执行上文描述的模型调整方法的一个或多个步骤。备选地,在其他实施例中,计算单元301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行模型调整方法。
164.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpg)、专用集成电路(si)、专用标准产品(ssp)、芯片上系统的系统(so)、负载可编程逻辑设备(pld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
165.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的
功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在进程机器上执行或完全在进程机器或服务器上执行。
166.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气违接、便携式计算机盘、硬盘、随机存取存储器(rm)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(d-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
167.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,rt(阴极射线管)或者ld(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
168.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互违接。通信网络的示例包括:局域网(ln)、广域网(wn)和互联网。
169.计算机系统可以包括客户端和服务器。客户端和服务器一般进离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
170.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
171.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:
1.一种模型调整方法,其特征在于,包括:获取与目标模型相关联的第一模型和第二模型,其中,所述目标模型为所述第一模型和所述第二模型之间的过渡模型;将标准训练集输入到所述第一模型中,以得到第一输出结果;将标准训练集输入到所述第二模型中,以得到第二输出结果;根据所述第一输出结果和所述第二输出结果对所述第一模型进行参数调整,以得到第三模型,使得所述第三模型的功能接近所述目标模型的功能;其中,所述第一模型的模型参数为第一参数,所述第二模型的模型参数为第二参数,所述第三模型的模型参数为第三参数;所述第三参数介于所述第一参数和所述第二参数之间。2.如权利要求1所述的模型调整方法,其中,所述得到所述第三模型,包括:对所述第一模型进行分析,以得到所述第一模型的待调整参数,其中,所述第一参数包括所述待调整参数;根据所述第一输出结果和所述第二输出结果对所述待调整参数进行参数调整,以得到所述第三模型。3.如权利要求1或2所述的模型调整方法,其中,所述进行参数调整,包括:对所述第一输出结果进行微分处理,以得到梯度;根据所述梯度、更新步长和所述第二输出结果对所述第一模型进行参数调整。4.如权利要求1所述的模型调整方法,其中,在获取所述第一模型和所述第二模型之前,还包括:接收请求;根据所述请求查询所述目标模型;响应于未查询到所述目标模型,查询与所述目标模型相关联的所述第一模型和所述第二模型。5.如权利要求1所述的模型调整方法,其中,还包括:采用标准测试集对所述第三模型进行测试,将通过测试的所述第三模型进行发送。6.如权利要求1所述的模型调整方法,其中,还包括:采用标准测试集对所述第三模型进行测试,根据通过测试的所述第三模型对所述第一模型进行更新。7.如权利要求1所述的模型调整方法,其中,所述目标模型应用于目标场景,所述第一模型应用于第一场景,所述第二模型应用于第二场景;所述目标场景介于所述第一场景和所述第二场景之间。8.一种模型调整装置,其特征在于,包括:获取单元,获取与目标模型相关联的第一模型和第二模型,其中,所述目标模型为所述第一模型和所述第二模型之间的过渡模型;第一输入单元,将标准训练集输入到所述第一模型中,以得到第一输出结果;第二输入单元,将标准训练集输入到所述第二模型中,以得到第二输出结果;调整单元,根据所述第一输出结果和所述第二输出结果对所述第一模型进行参数调
整,以得到第三模型,使得所述第三模型的功能接近所述目标模型;其中,所述第一模型的模型参数为第一参数,所述第二模型的模型参数为第二参数,所述第三模型的模型参数为第三参数;所述第三参数介于所述第一参数和所述第二参数之间。9.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信违接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法。10.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的方法。

技术总结
本公开提供了一种模型调整方法和装置,涉及通信技术领域。具体实现方案为:获取与目标模型相关联的第一模型和第二模型,此处的目标模型为第一模型和第二模型之间的过渡模型,通过第一模型处理标准训练集的第一输出结果和第二模型处理标准训练集的第二输出结果对第一模型进行参数调整,以得到第三模型,使得第三模型的第三参数介于第一模型的第一参数和第二模型的第二参数之间,并且第三模型的功能接近目标模型的功能。本公开实现了对与目标模型相关联的现有模型进行参数调整,使得参数调整后的模型可以应用在目标模型的应用场景,从而提升了网络性能。而提升了网络性能。而提升了网络性能。


技术研发人员:董辰 鲍智成 许晓东 韩书君 王碧舳
受保护的技术使用者:北京邮电大学
技术研发日:2022.03.07
技术公布日:2023/9/12
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐