基于增量学习的大语言模型、训练方法及文本生成方法与流程

未命名 10-19 阅读:116 评论:0


1.本发明涉及自然语言生成、金融科技、智慧医疗、智能法务技术领域,尤其涉及一种基于增量学习的大语言模型、训练方法及文本生成方法,以及对应的装置、计算机设备及存储介质。


背景技术:

2.随着互联网信息的爆炸性增长,人们对于文本内容的需求和期望也越来越高。特别是在一些专业领域,如法律、医疗、金融等,人们需要快速、准确、高质量地生成或处理相关的文档,如合同、诊断报告、投资分析等。然而,这些文档往往具有高度的专业性、规范性和逻辑性,对于人工编写或修改非常耗时、费力,且容易出错。
3.大语言模型型(llm,large language model),如(chat generative pre-trained transformer,生成型预训练变换模型)能够为面向任务的对话和问题解答生成类似人类的文本响应。
4.然而,这些预训练语言模型虽然具有强大的泛化能力,但是在面对一些专业领域问题时,仍然存在一些挑战和局限性。由于预训练语料库通常是从互联网上收集而来的,可能无法覆盖到一些专业领域的知识和术语,导致模型在这些领域上缺乏足够的理解和表达能力。因此现有预训练的语言模型往往缺乏对垂直专业领域知识的理解和掌握。例如,在医疗、法律、金融等领域,需要使用专业术语和逻辑推理的能力,现有预训练的语言模型生成的文本缺乏专业知识和相应的专业逻辑。


技术实现要素:

5.本发明提供一种基于增量学习的大语言模型、训练方法及文本生成方法,以及与方法配套的装置、计算机设备及存储介质,以解决专业领域文本生成不专业、缺乏逻辑的技术问题。
6.第一方面,本发明提供了一种基于增量学习的大语言模型,包括:编码器、解码器和适应层;
7.所述编码器与所述解码器通信连接;
8.所述适应层设置于所述编码器和所述解码器之间;
9.所述编码器,用于将输入文本转换为高维的向量表示得到编码向量;
10.所述解码器,用于根据所述编码向量和给定条件生成目标文本;
11.所述适应层,用于在所述编码器和所述解码器之间插入可训练的参数,使基于增量学习的大语言模型可根据不同的专业领域问答训练集数据进行增量学习。
12.第二方面,本发明提供了一种基于增量学习的大语言模型训练方法,用于训练如上述的基于增量学习的大语言模型,包括:
13.获取专业领域问答训练集数据和给定条件;
14.将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模
型的编码器中,得到编码向量;
15.在所述基于增量学习的大语言模型的适应层创建增量学习策略;
16.通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
17.将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
18.根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
19.第三方面,本发明提供了一种文本生成方法,包括:
20.获取用户查询文本;
21.将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如上述的基于增量学习的大语言模型训练方法得到。
22.第四方面,本发明提供了一种基于增量学习的大语言模型训练装置,包括:
23.获取模块,用于获取专业领域问答训练集数据和给定条件;
24.编码模块,用于将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
25.创建模块,用于在所述基于增量学习的大语言模型的适应层创建增量学习策略;
26.学习模块,用于通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
27.文本生成模块,用于将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
28.评估训练模块,用于根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
29.第五方面,本发明提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的基于增量学习的大语言模型训练方法的步骤,和/或如上述的文本生成方法的步骤。
30.第六方面,本发明提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述的基于增量学习的大语言模型训练方法的步骤,和/或如上述的文本生成方法的步骤。
31.上述基于增量学习的大语言模型、训练方法及文本生成方法,以及与方法配套的装置、计算机设备及存储介质所实现的方案中,通过编码器、解码器和适应层构建基于增量学习的大语言模型,通过所述适应层在所述编码器和所述解码器之间插入可训练的参数,使所述基于增量学习的大语言模型不仅具有在通用语料库上良好的泛化能力,而且通过创建增量学习策略,使模型基于专业领域问答训练集数据和给定条件进行增量学习。使得所述基于增量学习的大语言模型更好的适配于专业领域的文本生成,提高了所述基于基于增量学习的大语言模型在专业领域上的表达能力。
附图说明
32.为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施
例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
33.图1是本发明一实施例中基于增量学习的大语言模型训练方法的一应用环境示意图;
34.图2是本发明一实施例中基于增量学习的大语言模型的一结构示意图;
35.图3是本发明一实施例中基于增量学习的大语言模型训练方法的一流程示意图;
36.图4是本发明一实施例中文本生成方法的一流程示意图;
37.图5是本发明一实施例中基于增量学习的大语言模型训练装置的一结构示意图;
38.图6是本发明一实施例中计算机设备的一结构示意图;
39.图7是本发明一实施例中计算机设备的另一结构示意图。
具体实施方式
40.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
42.在本说明书的描述中,参考术语“实施例”、“一些实施例”和“可选地实施例”等的描述意指结合该实施例或实施方式描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示实施方式中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实施方式。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或实施方式以合适的方式结合。
43.本发明实施例提供的基于增量学习的大语言模型训练方法,可应用在如图1的应用环境中,所述基于增量学习的大语言模型训练方法既可以应用在客户端设备中,也可以应用在服务端设备中,其中,客户端通过网络与服务端进行通信。所述网络可以包各种连接类型,例如有线、无线通信链路或者光纤电缆等等。其中,客户端可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一些实施例中,客户端可以直接获取所述专业领域问答训练集数据和给定条件,也可以通过服务端获取所述专业领域问答训练集数据和给定条件。服务端可以直接获取所述专业领域问答训练集数据和给定条件,也可以通过客户端获取所述专业领域问答训练集数据和给定条件。
44.在一些实施例中,所述基于增量学习的大语言模型可由服务端设备上内置的模型训练类应用按如下步骤训练:
45.步骤s1,获取专业领域问答训练集数据和给定条件;
46.步骤s2,将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
47.步骤s3,在所述基于增量学习的大语言模型的适应层创建增量学习策略;
48.步骤s4,通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
49.步骤s5,将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
50.步骤s6,根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
51.需要说明的是,由于为训练得到目标大语言模型需要占用较多的运算资源和较强的运算能力,因此本技术后续各实施例所提供的基于增量学习的大语言模型训练方法一般由拥有较强运算能力、较多运算资源的服务端设备来执行,相应地,所述基于增量学习的大语言模型训练装置一般也设置于服务端设备中。但同时也需要指出的是,在客户端设备也具有满足要求的运算能力和运算资源时,客户端设备也可以通过其上安装的模型训练类应用完成上述本交由服务端做的各项运算,进而输出与服务端同样的结果。相应的,所述基于增量学习的大语言模型训练装置也可以设置于客户端设备中。
52.在一些实施例中,用于训练得到目标大语言模型的服务器可以不同于调用训练好的目标大语言模型来使用的服务器。
53.示例性地,在医疗领域的应用场景中,所述专业领域问答训练集数据可以为医学领域问答训练集数据,例如,医生问诊问答文本数据或者电子病历文本数据,或者其他基于互联网或者医学书籍等的医学文本信息。通过所述医学领域问答训练集数据训练所述基于增量学习的大语言模型,可生成高质量的医疗领域文本。例如,用户可根据病情描述获得自动问诊答案,该自动问诊答案可供医生或患者参考。
54.结合图2所示,本发明实施例提供一种基于增量学习的大语言模型,包括:编码器、解码器和适应层;
55.所述编码器与所述解码器通信连接;
56.所述适应层设置于所述编码器和所述解码器之间;
57.所述编码器,用于将输入文本转换为高维的向量表示得到编码向量;
58.所述解码器,用于根据所述编码向量和给定条件生成目标文本;
59.所述适应层,用于在所述编码器和所述解码器之间插入可训练的参数,使基于增量学习的大语言模型可根据不同的专业领域问答训练集数据进行增量学习。
60.具体地,在本实施例中,所述编码器与所述解码器通信连接。所述通信连接即可以通过有线的方式传输数据也可以通过无线的方式传输数据,在本实施例中不做限定。所述适应层,用于在所述编码器和所述解码器之间插入可训练的参数,使基于增量学习的大语言模型可根据不同的专业领域问答训练集数据进行增量学习。所述输入文本在训练环境中是指用于训练模型的文本,在应用环境下是指用户输入的问题或要求文本,例如“生成一个法律合同”,“根据美景、桃树、月亮创造一篇文章”等。所述编码向量是指编码器生成的高维向量。所述目标文本在训练环境中是指根据训练用输入文本得到的输出文本,在应用环境下是指根据根据用户输入的问题或要求,模型输出的回答文本或符合客户要求的输出文本。所述可训练的参数可根据实际需要设置参数数量,在本实施例中不做限定。所述专业领域问答训练集数据可包括与特定领域相关的结构化或半结构化文本数据,示例性地,所述
特定领域可包括但不限于金融领域、医疗领域和法律领域等。示例性地,所述专业领域问答训练集数据可包括金融领域的投资分析问答文本、医疗领域的问诊对话文本、法律领域的合同文本。所述专业领域问答训练集数据可来源于数据库,网站或者金融、医疗、法律的服务平台,在本实施例中不做限定。所述的适应层可以采用任何基于线性变换或非线性变换的方法,如全连接层(fully connected layer)、卷积层(convolutional layer)、残差层(residual layer)等,在本实施例中不做限定。所述的编码器和解码器可以采用任何基于变换器架构的神经网络模型,如gpt等,在本实施例中不做限定。
61.在本实施例中,通过编码器、解码器和适应层构建基于增量学习的大语言模型,通过所述适应层在所述编码器和所述解码器之间插入可训练的参数,使所述基于增量学习的大语言模型不仅具有在通用语料库上良好的泛化能力,使模型基于专业领域问答训练集数据和给定条件进行增量学习。使得所述基于增量学习的大语言模型更好的适配于专业领域的文本生成,提高了所述基于基于增量学习的大语言模型在专业领域上的表达能力。
62.在本发明的另一可选地实施例中,所述适应层内还包括:注意力分配系统;
63.所述注意力分配系统,用于在所述编码器和所述解码器之间建立注意力分配机制,可以根据所述输入文本和所述给定条件的相关性,动态地分配注意力权重。
64.具体地,在本实施例中,所述注意力分配系统用于在所述编码器和所述解码器之间建立注意力分配机制。所述注意力机制用于决定整段输入所述基于增量学习的大语言模型的哪个部分需要更加关注,从而对重要的部分分配更多的权重,使得所述基于增量学习的大语言模型更好的理解输入文本的意图。例如,输入医学领域文本,并输入给定条件为描述病因,则通过注意力分配机制可对医学领域文本中的病因给与更多的关注权重,从而提高模型的理解能力。所述注意力分配机制可以采用任何基于自注意力(self-attention)或交叉注意力(cross-attention)的方法,如多头注意力(multi-head attention)、缩放点积注意力(scaled dot-product attention)等,在本实施例中不做限定。
65.结合图3所示,本发明实施例还提供一种基于增量学习的大语言模型训练方法,用于训练如上述的基于增量学习的大语言模型,包括步骤:
66.步骤s1,获取专业领域问答训练集数据和给定条件;
67.步骤s2,将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
68.步骤s3,在所述基于增量学习的大语言模型的适应层创建增量学习策略;
69.步骤s4,通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
70.步骤s5,将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
71.步骤s6,根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
72.对于步骤s1,获取专业领域训练集数据和给定条件。所述专业领域问答训练集数据可包括与特定领域相关的结构化或半结构化文本数据,示例性地,所述特定领域可包括但不限于金融领域、医疗领域和法律领域等。示例性地,所述专业领域问答训练集数据可包括金融领域的投资分析问答文本、医疗领域的问诊对话文本、法律领域的合同文本。所述专
业领域问答训练集数据可来源于数据库,网站或者金融、医疗、法律的服务平台,在本实施例中不做限定。
73.对于步骤s2,将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量。所述给定条件可以是上下文条件,也可以是对文本的约束条件,例如文本字数、文本字体格式等等。所述编码向量是指所述编码器输出的高维向量。所述基于增量学习的大语言模型是指经过通用语料库预训练后的大语言模型。所述通用语料库可以是任何包含大量无标注自然语言文本数据的数据集,例如维基百科、新闻、社交媒体等。
74.对于步骤s3,在所述基于增量学习的大语言模型的适应层创建增量学习策略。所述增量学习策略可以是任何基于数据或人物特征和需求来动态调整参数模型更新方式和频率的方法,例如弹性权重共享、梯度累积、元学习等,在本实施例中不做限定。
75.对于步骤s4,通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量。所述适应层输出向量是指经过增量学习后的适应层的最终输出向量。
76.对于步骤s5,将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本。所述目标文本是指在所述基于增量学习的大语言模型训练过程中根据训练输入即专业领域训练集数据和给定条件得到的输出文本。所述编码器和解码器可以采用任何基于变换器架构的神经网络模型,如gpt等,在本实施例中不做限定。
77.对于步骤s6,根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。所述评估指标可以是任何评估文本生成质量和效果的指标,如准确性(accuracy)、流畅性(fluency)、多样性(diversity)、相关性(relevance)等。在实际应用中,可人为根据实际需要进行选择,在本实施例中不做限定。所述评价分是指根据所述评估指标对所述目标文本进行质量评价后的打分。所述目标大语言模型是指训练完成满足使用条件的所述基于增量学习的大语言模型。
78.在本实施例中,所述的基于增量学习的大语言模型训练方法通过获取专业领域问答训练集数据和给定条件;将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;在所述基于增量学习的大语言模型的适应层创建增量学习策略;可通过所述增量学习策略对所述专业领域问答训练集数据进行增量学习,提高了模型的泛化能力。通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本。由此弯成了一轮所述基于增量学习的大语言模型输入到输出的过程,实现了通过所述专业领域问答训练集数据和所述给定条件,生成目标文本。根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。通过质量评价的方式,获得了目标大语言模型,所述目标大语言模型即为训练好的所述基于增量学习的大语言模型。使得所述基于增量学习的大语言模型更好的适配于专业领域的文本生成,提高了所述基于基于增量学习的大语言模型在专业领域上的表达能力。
79.在本发明的另一可选地实施例中,所述在所述基于增量学习的大语言模型的适应层创建增量学习策略,包括步骤:
80.步骤s31,根据预设维度将所述专业领域问答训练集数据划分为训练子集数据;
81.步骤s32,根据所述训练子集数据的重要性,对所述训练子集数据分配权重;
82.步骤s33,根据所述训练子集数据和所述权重,创建增量学习策略。
83.对于步骤s31,根据预设维度将所述专业领域问答训练集数据划分为训练子集数据。所述预设纬度是指将所述专业领域问答训练集数据进行划分为子集的标准,可包括但不限于领域、主题、结构、时间等。
84.对于步骤s32,根据所述训练子集数据的重要性,对所述训练子集数据分配权重。所述分配权重可采用任何基于概率或启发式的方法,如基于均匀分布、正态分布、指数分布等,在本实施例中不做限定。
85.对于步骤s33,根据所述训练子集数据和所述权重,创建增量学习策略。所述创建增量学习策略可以采用任何基于优化或正则化的方法,如基于梯度下降、弹性权重共享、知识蒸馏等,在本发明实施例中不做限定。
86.在本发明的另一可选地实施例中,所述根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型,包括步骤:
87.步骤s61,根据所述评估指标构建评价模型,所述评价模型对所述目标文本进行评估得到评价分,其中所述评价分越高表示所述目标文本生成的质量越高;
88.步骤s62,跳转至获取专业领域问答训练集数据和给定条件的步骤重新执行,直到所述评价分大于预设分值,所述评价分大于预设分值时对应的所述基于增量学习的大语言模型即为目标大语言模型。
89.对于步骤s61,根据所述评估指标构建评价模型,所述评价模型对所述目标文本进行评估得到评价分,其中所述评价分越高表示所述目标文本生成的质量越高。所述评估指标可以是任何评估文本生成质量和效果的指标,如准确性(accuracy)、流畅性(fluency)、多样性(diversity)、相关性(relevance)等。在实际应用中,可人为根据实际需要进行选择,在本实施例中不做限定。所述评价模型是指根据所述评估指标构建的,用于计算评价分的模型。所述评价模型可以综合多个所述评估指标计算所述评估分,实际使用过程中所述评价模型可人为根据实际需要构建,本发明实施例中不做具体限定。
90.对于步骤s62,跳转至获取专业领域问答训练集数据和给定条件的步骤重新执行,直到所述评价分大于预设分值,所述评价分大于预设分值时对应的所述基于增量学习的大语言模型即为目标大语言模型。所述跳转至获取专业领域问答训练集数据和给定条件的步骤重新执行是指重新根据不同的所述专业领域问答训练集数据和不同的所述给定条件重新执行上述步骤s1至步骤s5,并对每一个生成的所述目标文本确定所述评价分。直到所述评价分大于预设分值,所述评价分大于预设分值时对应的所述基于增量学习的大语言模型即为目标大语言模型。所述预设分值是根据实际需要人为设置的分值标准。所述评价分大于所述预设分值,说明满足了预设标准。
91.在本发明的另一可选地实施例中,所述增量学习策略为弹性权重共享策略、梯度累积策略和元学习策略中的任意一种。
92.具体地,在本实施例中,所述弹性权重共享策略是指一种旨在解决神经网络中灾难性遗忘问题的方法。弹性权重共享的主要思想是在学习新任务时,对模型参数施加一种形式的正则化,从而保留对先前任务重要的那些参数。具体来说,弹性权重共享将先前任务中每个权重的重要性作为一个约束来保护它,使其在学习新任务时不会太过改变。这种重要性通常由该权重在先前任务的性能上的影响来衡量。在自然语言处理领域,弹性权重共
享被用来帮助模型在学习新任务的同时,保持对旧任务的性能。通过这种方式,模型可以避免在学习新任务时遗忘旧任务的知识。
93.在训练神经网络的时候,单次传递给程序用以训练的数据个数越大模型训练越稳定,但是往往受制于显存大小而不能设置较大的单次传递给程序用以训练的数据个数,为了达到和设置大单次传递给程序用以训练的数据个数一样的训练效果,可以采用梯度累积的方式来进行训练。传统的训练方式都是训练一个批处理的样本就执行一次梯度下降算法更新参数,梯度累积策略则是设置一个累积步数,每训练所述累积步数个批处理样本才更新一次参数。
94.元学习策略是指元学习使得模型获取一种学会学习调参的能力,使其可以在获取已有知识的基础上快速学习新的任务。机器学习是先人为调参,之后直接训练特定任务下深度模型。元学习则是先通过其它的任务训练出一个较好的超参数,然后再对特定任务进行训练。
95.结合图4所示,本发明实施例还提供一种文本生成方法,包括步骤:
96.步骤s7,获取用户查询文本;
97.步骤s8,将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如上述的基于增量学习的大语言模型训练方法得到。
98.对于步骤s7,获取用户查询文本。所述用户查询文本是指用户输入的查询文本。用户可通过语音输入查询文本也可以通过文字输入查询文本,在本实施例中不做限定。
99.对于步骤s8,将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如上述的基于增量学习的大语言模型训练方法得到。所述目标大语言模型是指基于增量学习的大语言模型训练好的适用于专业领域的大语言模型。
100.在本实施例中,通过获取用户查询文本,将所述用户查询文本作为输入数据输入目标大语言模型中得到生成文本,可以为用户获得专业领域(例如金融、法律、医疗等领域)的专业生成文本带来方便,提高了所述目标大语言模型的泛化能力,使其更好地适配特定的专业领域,提供更专业的生成文本。
101.应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
102.结合图5所示,在一实施例中,本发明提供一种基于增量学习的大语言模型训练装置,该基于增量学习的大语言模型训练装置与上述实施例中基于增量学习的大语言模型训练方法一一对应。该基于增量学习的大语言模型训练装置包括获取模块101、编码模块102、创建模块103、学习模块104、文本生成模块105、评估训练模块106。各功能模块详细说明如下:
103.获取模块101,用于获取专业领域问答训练集数据和给定条件;
104.编码模块102,用于将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
105.创建模块103,用于在所述基于增量学习的大语言模型的适应层创建增量学习策略;
106.学习模块104,用于通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
107.文本生成模块105,用于将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
108.评估训练模块106,用于根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
109.在一实施例中,所述创建模块103,具体用于:
110.根据预设维度将所述专业领域问答训练集数据划分为训练子集数据;
111.根据所述训练子集数据的重要性,对所述训练子集数据分配权重;
112.根据所述训练子集数据和所述权重,创建增量学习策略。
113.在一实施例中,所述评估训练模块106,具体用于:
114.根据所述评估指标构建评价模型,所述评价模型对所述目标文本进行评估得到评价分,其中所述评价分越高表示所述目标文本生成的质量越高;
115.跳转至获取专业领域问答训练集数据和给定条件的步骤重新执行,直到所述评价分大于预设分值,所述评价分大于预设分值时对应的所述基于增量学习的大语言模型即为目标大语言模型。
116.在一实施例中,所述创建模块103,用于在所述基于增量学习的大语言模型的适应层创建增量学习策略,所述增量学习策略为弹性权重共享策略、梯度累积策略和元学习策略中的任意一种。
117.在本实施例中,所述的基于增量学习的大语言模型训练装置通过获取专业领域问答训练集数据和给定条件;将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;在所述基于增量学习的大语言模型的适应层创建增量学习策略;可通过所述增量学习策略对所述专业领域问答训练集数据进行增量学习,提高了模型的泛化能力。通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本。由此弯成了一轮所述基于增量学习的大语言模型输入到输出的过程,实现了通过所述专业领域问答训练集数据和所述给定条件,生成目标文本。根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。通过质量评价的方式,获得了目标大语言模型,所述目标大语言模型即为训练好的所述基于增量学习的大语言模型。使得所述基于增量学习的大语言模型更好的适配于专业领域的文本生成,提高了所述基于基于增量学习的大语言模型在专业领域上的表达能力。
118.关于基于增量学习的大语言模型训练装置的具体限定可以参见上文中对于基于增量学习的大语言模型训练方法的限定,在此不再赘述。上述基于增量学习的大语言模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
119.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务端,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包
括非易失性和/或易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的客户端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于增量学习的大语言模型训练方法服务端侧的功能或步骤。
120.在一个实施例中,提供了一种计算机设备,该计算机设备可以是客户端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种基于增量学习的大语言模型训练方法客户端侧的功能或步骤。
121.在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
122.步骤s1,获取专业领域问答训练集数据和给定条件;
123.步骤s2,将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
124.步骤s3,在所述基于增量学习的大语言模型的适应层创建增量学习策略;
125.步骤s4,通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
126.步骤s5,将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;
127.步骤s6,根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
128.和/或实现以下步骤:
129.步骤s7,获取用户查询文本;
130.步骤s8,将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如上述的基于增量学习的大语言模型训练方法得到。
131.本发明实施例中提供的计算机设备,与上述基于增量学习的大语言模型、基于增量学习的大语言模型训练方法、基于增量学习的大语言模型训练装置相对于现有技术的优势相同,在此不再赘述。
132.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
133.步骤s1,获取专业领域问答训练集数据和给定条件;
134.步骤s2,将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;
135.步骤s3,在所述基于增量学习的大语言模型的适应层创建增量学习策略;
136.步骤s4,通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;
137.步骤s5,将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器
中,生成目标文本;
138.步骤s6,根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。
139.和/或实现以下步骤:
140.步骤s7,获取用户查询文本;
141.步骤s8,将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如上述的基于增量学习的大语言模型训练方法得到。
142.需要说明的是,上述关于计算机可读存储介质或计算机设备所能实现的功能或步骤,可对应参阅前述方法实施例中,服务端侧以及客户端侧的相关描述,为避免重复,这里不再一一描述。
143.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
144.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
145.本发明实施例提供的计算机可读存储介质,与上述基于增量学习的大语言模型、基于增量学习的大语言模型训练方法、基于增量学习的大语言模型训练装置相对于现有技术的优势相同,在此不再赘述。
146.以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术特征:
1.一种基于增量学习的大语言模型,其特征在于,包括:编码器、解码器和适应层;所述编码器与所述解码器通信连接;所述适应层设置于所述编码器和所述解码器之间;所述编码器,用于将输入文本转换为高维的向量表示得到编码向量;所述解码器,用于根据所述编码向量和给定条件生成目标文本;所述适应层,用于在所述编码器和所述解码器之间插入可训练的参数,使基于增量学习的大语言模型可根据不同的专业领域问答训练集数据进行增量学习。2.根据权利要求1所述的基于增量学习的大语言模型,其特征在于,所述适应层内还包括:注意力分配系统;所述注意力分配系统,用于在所述编码器和所述解码器之间建立注意力分配机制,可以根据所述输入文本和所述给定条件的相关性,动态地分配注意力权重。3.一种基于增量学习的大语言模型训练方法,用于训练如权利要求1或2所述的基于增量学习的大语言模型,其特征在于,包括:获取专业领域问答训练集数据和给定条件;将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;在所述基于增量学习的大语言模型的适应层创建增量学习策略;通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。4.根据权利要求3所述的基于增量学习的大语言模型训练方法,其特征在于,所述在所述基于增量学习的大语言模型的适应层创建增量学习策略,包括:根据预设维度将所述专业领域问答训练集数据划分为训练子集数据;根据所述训练子集数据的重要性,对所述训练子集数据分配权重;根据所述训练子集数据和所述权重,创建增量学习策略。5.根据权利要求3所述的基于增量学习的大语言模型训练方法,其特征在于,所述根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型,包括:根据所述评估指标构建评价模型,所述评价模型对所述目标文本进行评估得到评价分,其中所述评价分越高表示所述目标文本生成的质量越高;跳转至获取专业领域问答训练集数据和给定条件的步骤重新执行,直到所述评价分大于预设分值,所述评价分大于预设分值时对应的所述基于增量学习的大语言模型即为目标大语言模型。6.根据权利要求3所述的基于增量学习的大语言模型训练方法,其特征在于,所述增量学习策略为弹性权重共享策略、梯度累积策略和元学习策略中的任意一种。7.一种文本生成方法,其特征在于,包括:获取用户查询文本;
将所述用户查询文本作为输入数据输入目标大语言模型,得到生成文本,其中,所述目标大语言模型通过如权利要求3-6任一项所述的基于增量学习的大语言模型训练方法得到。8.一种基于增量学习的大语言模型训练装置,其特征在于,包括:获取模块,用于获取专业领域问答训练集数据和给定条件;编码模块,用于将所述专业领域问答训练集数据和所述给定条件输入基于增量学习的大语言模型的编码器中,得到编码向量;创建模块,用于在所述基于增量学习的大语言模型的适应层创建增量学习策略;学习模块,用于通过所述增量学习策略对所述编码向量进行增量学习,得到适应层输出向量;文本生成模块,用于将所述适应层输出向量传输至所述基于增量学习的大语言模型的解码器中,生成目标文本;评估训练模块,用于根据评估指标对所述目标文本进行质量评价,得到评价分,根据所述评价分确定目标大语言模型。9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求3至6任一项所述的基于增量学习的大语言模型训练方法的步骤,和/或如权利要求7所述的文本生成方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求3至6任一项所述的基于增量学习的大语言模型训练方法的步骤,和/或如权利要求7所述的文本生成方法的步骤。

技术总结
本发明涉及自然语言生成、金融科技、智慧医疗、智能法务技术领域,公开了一种基于增量学习的大语言模型、训练方法及文本生成方法,以及对应的装置、计算机设备及存储介质。本发明的技术方案通过编码器、解码器和适应层构建基于增量学习的大语言模型,通过所述适应层在所述编码器和所述解码器之间插入可训练的参数,使所述基于增量学习的大语言模型不仅具有在通用语料库上良好的泛化能力,使模型基于专业领域问答训练集数据和给定条件进行增量学习。使得所述基于增量学习的大语言模型更好的适配于专业领域的文本生成,提高了所述基于基于增量学习的大语言模型在专业领域上的表达能力。能力。能力。


技术研发人员:王俊 侯昶宇
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.30
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐