文本处理方法、文本阅读理解方法与流程

未命名 10-09 阅读:92 评论:0


1.本说明书实施例涉及自然语言处理技术领域,特别涉及一种文本处理方法。


背景技术:

2.近年来,深度学习成为了机器学习领域的一个热门研究方向,在计算机视觉、自然语言处理等领域得到了广泛的应用。
3.传统的多语言文本处理方法中,需要利用多种语言的样本数据对多语言处理模型进行训练,但经常会存在某语言的样本数据较少的情况,基于此种情况,通常是对样本数据丰富的语言对应的样本数据进行翻译,以实现对样本数据较少语言的样本数据进行增强,利用增强后的样本数据对模型进行训练,但是在一些特殊任务中,通过样本数据增强无法准确获得与增强后的样本数据相对应的样本标签。
4.比如,在阅读理解任务中,将样本数据丰富的语言对应的样本数据翻译为样本数据较少语言,获得增强后的样本数据,但是样本数据中包含的篇章在进行翻译时,会出现字符顺序调换、颠倒的情况,导致翻译得到的样本标签通常是不准确的,基于不准确的样本标签对模型进行训练,使得训练得到的模型在对文本进行处理得到的结果也是不准确的,因此,亟需一种提高文本处理准确性的方法。


技术实现要素:

5.有鉴于此,本说明书实施例提供了一种文本处理方法,应用于指定语言场景。本说明书一个或者多个实施例同时涉及一种文本阅读理解方法,应用于指定语言场景,一种文本处理方法,一种文本阅读理解方法,一种文本处理装置,应用于指定语言场景,一种文本阅读理解装置,应用于指定语言场景,一种文本处理装置,一种文本阅读理解装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
6.根据本说明书实施例的第一方面,提供了一种文本处理方法,应用于指定语言场景,包括:
7.获取指定语言的初始文本和多语言处理模型,其中,多语言处理模型基于参考语言的样本文本训练得到;
8.将初始文本输入多语言处理模型,获得至少一个第一处理结果;
9.将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,其中,目标文本为将初始文本译为参考语言得到;
10.基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。
11.根据本说明书实施例的第二方面,提供了一种文本阅读理解方法,应用于指定语言场景,包括:
12.获取指定语言的初始文本和多语言阅读理解模型,其中,初始文本包括篇章文本和问题文本,多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得
到;
13.将篇章文本和问题文本输入多语言阅读理解模型,获得至少一个第一阅读理解结果;
14.将目标篇章文本和目标问题文本输入多语言阅读理解模型,并将多语言阅读理解模型的输出译为指定语言的第二阅读理解结果,其中,目标篇章文本和目标问题文本为将篇章文本和问题文本译为参考语言得到;
15.基于第一阅读理解结果和第二阅读理解结果,确定篇章文本和问题文本对应的目标阅读理解结果。
16.根据本说明书实施例的第三方面,提供了一种文本处理方法,包括:
17.获取初始文本;
18.将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果,其中,多语言处理模型基于指定语言的测试文本对初始多语言处理模型微调得到,初始多语言处理模型基于参考语言的样本文本训练得到,微调过程中测试文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试文本输入初始多语言处理模型得到,第二测试结果为将译文文本输入初始多语言处理模型并将模型输出译为指定语言得到,译文文本为将测试文本译为参考语言得到。
19.根据本说明书实施例的第四方面,提供了一种文本阅读理解方法,包括:
20.获取初始文本,其中,初始文本包括篇章文本和问题文本;
21.将篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果;其中,多语言阅读理解模型基于指定语言的测试篇章文本和测试问题文本对初始多语言阅读理解模型微调得到,初始多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到,微调过程中测试篇章文本和测试问题文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试篇章文本和测试问题文本输入初始多语言阅读理解模型得到,第二测试结果为将译文篇章文本和译文问题文本输入初始多语言阅读理解模型并将模型输出译为指定语言得到,译文篇章文本和译文问题文本为将测试篇章文本和测试问题文本译为参考语言得到。
22.根据本说明书实施例的第五方面,提供了一种文本处理装置,应用于指定语言场景,包括:
23.第一获取模块,被配置为获取指定语言的初始文本和多语言处理模型,其中,多语言处理模型基于参考语言的样本文本训练得到;
24.第一获得模块,被配置为将初始文本输入多语言处理模型,获得至少一个第一处理结果;
25.第一输入模块,被配置为将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,其中,目标文本为将初始文本译为参考语言得到;
26.第一确定模块,被配置为基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。
27.根据本说明书实施例的第六方面,提供了一种文本阅读理解装置,应用于指定语言场景,包括:
28.第二获取模块,被配置为获取指定语言的初始文本和多语言阅读理解模型,其中,
初始文本包括篇章文本和问题文本,多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到;
29.第二获得模块,被配置为将篇章文本和问题文本输入多语言阅读理解模型,获得至少一个第一阅读理解结果;
30.第二输入模块,被配置为将目标篇章文本和目标问题文本输入多语言阅读理解模型,并将多语言阅读理解模型的输出译为指定语言的第二阅读理解结果,其中,目标篇章文本和目标问题文本为将篇章文本和问题文本译为参考语言得到;
31.第二确定模块,被配置为基于第一阅读理解结果和第二阅读理解结果,确定篇章文本和问题文本对应的目标阅读理解结果。
32.根据本说明书实施例的第七方面,提供了一种文本处理装置,包括:
33.第三获取模块,被配置为获取初始文本;
34.处理结果获得模块,被配置为将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果,其中,多语言处理模型基于指定语言的测试文本对初始多语言处理模型微调得到,初始多语言处理模型基于参考语言的样本文本训练得到,微调过程中测试文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试文本输入初始多语言处理模型得到,第二测试结果为将译文文本输入初始多语言处理模型并将模型输出译为指定语言得到,译文文本为将测试文本译为参考语言得到。
35.根据本说明书实施例的第八方面,提供了一种文本阅读理解装置,包括:
36.第四获取模块,被配置为获取初始文本,其中,初始文本包括篇章文本和问题文本;
37.阅读理解结果获得模块,被配置为将篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果;其中,多语言阅读理解模型基于指定语言的测试篇章文本和测试问题文本对初始多语言阅读理解模型微调得到,初始多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到,微调过程中测试篇章文本和测试问题文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试篇章文本和测试问题文本输入初始多语言阅读理解模型得到,第二测试结果为将译文篇章文本和译文问题文本输入初始多语言阅读理解模型并将模型输出译为指定语言得到,译文篇章文本和译文问题文本为将测试篇章文本和测试问题文本译为参考语言得到。
38.根据本说明书实施例的第九方面,提供了一种计算设备,包括:
39.存储器和处理器;
40.所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本处理方法、文本阅读理解方法的步骤。
41.根据本说明书实施例的第十方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述文本处理方法、文本阅读理解方法的步骤。
42.根据本说明书实施例的第十一方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本处理方法、文本阅读理解方法的步骤。
43.本说明书一个实施例获取指定语言的初始文本和多语言处理模型,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。通过将初始文本译为训练多语言处理模型的样本文本相同语言的目标文本,并将目标文本输入多语言处理模型,将获得的输出译为第二处理结果,可以以目标文本经过多语言处理模型并进行翻译得到的第二处理结果为基准,从至少一个第一处理结果中确定一个第一处理结果作为初始文本对应的目标处理结果,使得确定得到的目标处理结果是基于基准的第二处理结果对至少一个第一处理结果进行筛选得到的,保证了确定的目标处理结果的准确性。
附图说明
44.图1是本说明书一个实施例提供的一种文本处理系统架构下的交互流程示意图;
45.图2是本说明书一个实施例提供的一种文本处理系统的框架图;
46.图3是本说明书一个实施例提供的一种文本处理方法的流程图;
47.图4是本说明书一个实施例提供的一种文本阅读理解方法的流程图;
48.图5是本说明书一个实施例提供的另一种文本处理方法的流程图;
49.图6是本说明书一个实施例提供的另一种文本阅读理解方法的流程图;
50.图7是本说明书一个实施例提供的一种文本处理方法的处理过程流程图;
51.图8是本说明书一个实施例提供的另一种文本处理方法的处理过程流程图;
52.图9是本说明书一个实施例提供的一种文本处理装置的结构示意图;
53.图10是本说明书一个实施例提供的一种文本阅读理解装置的结构示意图;
54.图11是本说明书一个实施例提供的另一种文本处理装置的结构示意图;
55.图12是本说明书一个实施例提供的另一种文本阅读理解装置的结构示意图;
56.图13是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
57.在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
58.在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
59.应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”。
60.此外,需要说明的是,本说明书一个或多个实施例所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
61.首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
62.transformer:是一个利用注意力机制来提高模型训练速度的模型。
63.预训练模型:是一个已经训练好的保存下来的网络,该网络之前在一个大型的数据集上进行了训练(如图像相关的网络在imagenet数据上进行了训练)
64.多层感知机(mlp,multilayer perceptron):也叫人工神经网络(ann,artificial neural network),除了输入输出层,它中间可以有多个隐层,最简单的mlp只含一个隐层,即三层的结构。
65.近年来,深度学习成为了机器学习领域的一个热门研究方向,在计算机视觉、自然语言处理等领域得到了广泛的应用。
66.在全球化的今天,针对单一语种的自然语言理解能力急需扩展到多语言场景,以适应更广泛的商业化需求,因此,针对跨语言场景的研究工作开始涌现。多语言场景的自然语言预训练模型,可以在多种语言的下游任务上取得优异的结果,由于其在语种间通用的性质,受到广泛关注。
67.但针对部分低资源语言,训练数据的获取相对困难,如果缺乏特定语言的训练数据,对模型在该语言的迁移能力会造成很大的影响,因此,在跨语言场景,往往会通过对齐数据做数据增强,以帮助模型在跨语言场景习得多语言能力(比如,将a语言翻译为b语言,将翻译得到的b语言与a语言做句子对齐)。翻译是最常见的数据增强手段,但不同于分类、检索等翻译后标签不变的任务,机器阅读理解任务在翻译过后,增强的译文数据无法自动得到准确的标签,导致模型无法直接通过翻译数据进行数据增强(比如,a语言篇章和a语言问题以及问题对应的答案在a语言篇章中的位置,翻译为b语言之后,篇章和问题没有很大影响,但是由于不同语言的表达方式以及句子组成不同,会导致不同语言的句子中相同位置的单字不同,进而使得通过翻译获得问题对应的答案,即标签是不准确的,基于不准确的标签对模型进行训练,使得训练得到的模型在对文本进行处理得到的结果也是不准确的),因此,亟需一种提高文本处理准确性的方法。
68.在本说明书中,提供了一种文本处理方法,应用于指定语言场景。本说明书一个或者多个实施例同时涉及一种文本阅读理解方法,应用于指定语言场景,一种文本处理方法,一种文本阅读理解方法,一种文本处理装置,应用于指定语言场景,一种文本阅读理解装置,应用于指定语言场景,一种文本处理装置,一种文本阅读理解装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
69.参见图1,图1示出了本说明书一个实施例提供的一种文本处理系统架构下的交互流程示意图,如图1所示,该系统包括服务端100和客户端200。
70.服务端100:用于获取指定语言的初始文本和多语言处理模型,其中,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个
第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,其中,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果;
71.客户端200:用于接收服务端100发送的目标处理结果。
72.应用本说明书实施例的方案,获取指定语言的初始文本和多语言处理模型,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。通过将初始文本译为训练多语言处理模型的样本文本相同语言的目标文本,并将目标文本输入多语言处理模型,将获得的输出译为第二处理结果,可以以目标文本经过多语言处理模型并进行翻译得到的第二处理结果为基准,从根据初始文本经过多语言处理模型获得的至少一个第一处理结果中确定一个第一处理结果作为初始文本对应的目标处理结果,使得确定得到的目标处理结果是基于基准的第二处理结果对至少一个第一处理结果进行筛选得到的,保证了确定的目标处理结果的准确性。
73.参见图2,图2示出了本说明书一个实施例提供的一种文本处理系统的框架图,该系统可以包括服务端100以及多个客户端200。多个客户端200之间通过服务端100可以建立通信连接,在文本处理场景中,服务端100即用来在多个客户端200之间提供文本处理服务,多个客户端200可以分别作为发送端或接收端,通过服务端100实现通信。
74.用户通过客户端200可与服务端100进行交互以接收其它客户端200发送的数据,或将数据发送至其它客户端200等。在文本处理场景中,可以是用户通过客户端200向服务端100发布文本处理请求,服务端100根据该文本处理请求生成文本处理结果,并将文本处理结果推送至其他建立通信的客户端200中。
75.其中,客户端200与服务端100之间通过网络建立连接。网络为客户端200与服务端100之间提供了通信链路的介质。网络可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。客户端200所传输的数据可能需要经过编码、转码、压缩等处理之后才发布至服务端100。
76.客户端200可以为浏览器、应用程序(app,application)、或网页应用如超文本标记语言第5版(h5,hypertext markup language5)应用、或轻应用(也被称为小程序,一种轻量级应用程序)或云应用等,客户端200可以基于服务端提供的相应服务的软件开发工具包(sdk,software development kit),如基于实时通信(rtc,real time communication)sdk开发获得等。客户端200可以部署在电子设备中,需要依赖设备运行或者设备中的某些app而运行等。电子设备例如可以具有显示屏并支持信息浏览等,如可以是个人移动终端如手机、平板电脑、个人计算机等。在电子设备中通常还可以配置各种其它类应用,例如人机对话类应用、模型训练类应用、文本处理类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
77.服务端100可以包括提供各种服务的服务器,例如为多个客户端提供通信服务的服务器,又如为客户端上使用的模型提供支持的用于后台训练的服务器,又如对客户端发送的数据进行处理的服务器等。需要说明的是,服务端100可以实现成多个服务器组成的分
布式服务器集群,也可以实现成单个服务器。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(cdn,content delivery network)以及大数据和人工智能平台等基础云计算服务的云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
78.值得说明的是,本说明书实施例中提供的文本处理方法一般由服务端100执行,但是,在本说明书的其它实施例中,客户端200也可以与服务端具有相似的功能,从而执行本说明书实施例所提供的文本处理方法。在其它实施例中,本说明书实施例所提供的文本处理方法还可以是由客户端200与服务端100共同执行。
79.参见图3,图3示出了本说明书一个实施例提供的一种文本处理方法的流程图,应用于指定语言场景,具体包括以下步骤:
80.步骤302:获取指定语言的初始文本和多语言处理模型,其中,多语言处理模型基于参考语言的样本文本训练得到。
81.本说明书实施例应用于具有文本处理的应用所属的客户端或者服务端,下述以服务端为例进行说明。
82.在有对指定语言的初始文本进行文本处理的需求时,服务端获取指定语言的初始文本和多语言处理模型,指定语言的初始文本可以是用户在前端输入的,也可以是服务端从存储文本的文本存储库中获得的,多语言处理模型是预先训练好,并存储在模型存储库中的。
83.具体地,指定语言是指基于多语言处理模型进行指定的语言,指定语言是多语言处理模型可以识别的语言,指定语言可以是除参考语言之外的其他语言,指定语言对应的样本文本的样本量较少,至少少于参考语言对应的样本文本,比如,参考语言为英语、法语等,则指定语言可以为中文、俄语等。参考语言是指训练多语言处理模型的样本文本的语言。初始文本为待进行文本处理的文本,初始文本中包括多个文本字符,初始文本在不同场景下包括的内容不同,比如,在阅读理解的场景下,初始文本可以包括阅读理解的篇章文本和问题文本,其中,阅读理解场景包括很多种使用方式,比如,根据英文样本文本训练得到多语言处理模型,中文客户使用中文向智能客服进行提问,提问关于项目a的问题,智能客服获取提问的中文文本和项目a对应的中文说明书,中文文本和中文说明书即为初始文本。
84.多语言处理模型是指预先基于参考语言的样本文本对多语言预训练模型进行训练得到的,多语言处理模型天然具有对多语言进行识别的能力,且经过参考语言的样本文本进行训练,也拥有了进行文本处理的能力。样本文本是指对多语言预训练模型进行训练获得多语言处理模型的文本,其中,初始文本的文本形式与样本文本的文本形式是相同的,在利用参考语言的样本文本训练得到多语言处理模型的过程中使用的损失函数可以是交叉熵损失函数。
85.本说明书一种可能的实现方式中,可以是服务端通过用户在前端的点击,开启一个上传初始文本的通道(比如,通过蓝牙、网络上传等等),由用户上传初始文本,服务端基于用户上传的初始文本进行文本处理。
86.本说明书另一种可能的实现方式中,可以是服务端中存储有存储文本的文本存储库,通过用户在客户端的选择,服务端从文本存储库获得对应的文本,作为初始文本,以对
初始文本进行文本处理。
87.多语言处理模型可以是可以进行多语言识别等处理的神经网络模型,利用参考语言的样本文本对多语言处理模型进行训练,将训练得到的多语言处理模型存储入模型存储库中,在获取初始文本时,获取多语言处理模型。
88.通过获取指定语言的初始文本和由指定语言的样本文本训练得到的多语言处理模型,使得后续可以利用多语言处理模型对初始文本进行处理,也即进行文本处理。
89.步骤304:将初始文本输入多语言处理模型,获得至少一个第一处理结果。
90.指定语言的样本文本的数据量较少,无法对多语言处理模型进行训练,但为获得指定语言的初始文本对应的处理结果,故需要利用多语言处理模型对指定语言的初始文本进行处理,获得初始文本对应的目标处理结果,具体是将初始文本输入多语言处理模型,获得处理结果,但多语言处理模型并未基于指定语言的样本数据进行训练,无法保证多语言处理模型基于初始文本获得的结果的准确性,故需要获得多语言处理模型对初始文本进行处理获得的至少一个第一处理结果,以使后续可以基于基准的第二处理结果,从至少一个第一处理结果选定较为准确的一个第一处理结果作为目标处理结果。
91.具体地,第一处理结果是指初始文本经过多语言处理模型进行处理获得的结果,第一处理结果可以是位置标识也可以是文本,若第一处理结果为文本,则文本的语言是与初始文本的语言是相同的,是指定语言,比如,在阅读理解场景中,初始文本为指定语言的篇章文本和问题文本,第一处理结果可以是阅读理解中问题文本对应的答案文本,也可以是答案文本在篇章文本中的位置标识。
92.可选地,多语言处理模型包括语义提取层和mlp层,其中,语义提取层对初始文本进行语义提取,获得初始文本的语义表示;mlp层基于语义表示分别预测初始文本中各字符作为第一处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end)。
93.可选地,多语言处理模型包括语义提取层和注意力层,其中,语义提取层对初始文本进行语义提取,获得初始文本的语义表示;注意力层用于通过注意力计算的方式,计算初始文本中各字符作为第一处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end)。
94.将初始文本输入多语言处理模型,获得至少一个第一处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
95.本说明书一种可能的实现方式中,可以是将初始文本输入多语言处理模型,多语言处理模型输出至少一个第一处理结果。
96.本说明书另一种可能的实现方式中,还可以是将初始文本输入多语言处理模型,多语言处理输出初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率,并基于得到的各字符对应的起始概率和结尾概率,从初始文本中确定至少一个第一处理结果,也即上述步骤将初始文本输入多语言处理模型,获得至少一个第一处理结果,包括如下步骤:
97.将初始文本输入多语言处理模型,获得初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率;
98.基于各字符对应的起始概率和结尾概率,从初始文本中截取至少一个第一处理结果。
99.具体地,起始概率是指字符作为第一处理结果中的起始字符的起始概率,比如,起始概率可以是70%的形式,还可以是0.7的形式。结尾概率是指字符作为第一处理结果中的结尾概率的结尾概率,比如,结尾概率可以是70%的形式,还可以是0.7的形式,其中,起始概率和结尾概率的具体数值根据字符的实际情况进行确定,上述数字的形式仅为举例。
100.将初始文本输入多语言处理模型,获得初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率的实现方式,可以是将初始文本输入多语言处理模型,获得多语言处理模型输出的各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率。
101.基于各字符对应的起始概率和结尾概率,从初始文本中截取至少一个第一处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
102.本说明书一种可能的实现方式中,可以是基于各字符对应的起始概率和结尾概率,对初始文本中的字符进行排序,获得起始概率队列和结尾概率队列;基于起始概率队列和结尾概率队列,从初始文本中截取至少一个第一处理结果。
103.可选地,基于起始概率队列和结尾概率队列,从初始文本中截取至少一个第一处理结果的实现方式,可以是将起始概率队列与结尾概率队列中的字符进行遍历组合,获得多个初始结果组合;基于各初始结果组合中起始概率和结尾概率,选定满足预设选定条件的至少一个初始结果组合确定为至少一个第一处理结果。
104.可选地,在获得多个初始组合结果之后,还可以包括获取各初始结果组合中起始字符与结尾字符在初始文本中所处的位置,将结尾字符的位置在起始字符的位置之前的初始结果组合进行删除,基于未删除的初始结果组合执行后续步骤。
105.可选地,基于各初始结果组合中起始概率和结尾概率,选定满足预设选定条件的至少一个初始结果组合确定为至少一个第一处理结果的实现方式,可以是计算各初始结果组合中起始概率和结尾概率的乘积,对各乘积从大到小排序,选定前预设数目个乘积对应的初始结果组合确定为预设数目个第一处理结果;还可以是选定各初始结果组合中起始字符的起始概率和结尾字符的结尾概率均满足概率阈值的初始结果组合,作为第一处理结果,其中,概率阈值可以包括起始概率阈值和结尾概率阈值,使用起始概率阈值对起始字符的起始概率进行限定,使用结尾概率阈值对结尾字符的结尾概率进行限定。
106.本说明书另一种可能的实现方式中,可以是基于各字符在初始文本中所处的位置,从初始文本中截取至少一个初始第一处理结果;基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定至少一个第一处理结果。
107.可选地,基于各字符在初始文本中所处的位置,从初始文本中截取至少一个初始第一处理结果的实现方式,可以是基于各字符在初始文本中所处的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果。
108.可选地,基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定至少一个第一处理结果的实现方式,可以是基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率均满足概率阈值的至少一个第一处理结果。
109.应用本说明书实施例的方案,将初始文本输入多语言处理模型,获得初始文本中
各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从初始文本中截取至少一个第一处理结果。通过初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从初始文本中截取至少一个第一处理结果,使得确定出来的第一处理结果是经过概率确定出来的,保证了确定得到的各第一处理结果的准确性。
110.可选地,上述步骤基于各字符对应的起始概率和结尾概率,从初始文本中截取至少一个第一处理结果,包括如下步骤:
111.获取各字符在初始文本中所处的位置;
112.基于各字符在初始文本中所处的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果;
113.基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的至少一个第一处理结果。
114.具体地,位置是指字符在初始文本中的位置,位置可以是位置标识、位置排序等,比如,初始文本为“对初始文本进行文本处理”,则字符“对”的位置为1,字符“初”的位置为2,字符“始”的位置为3,以此类推,字符“理”的位置为11。概率乘积阈值是指预先设置的对第一处理结果中起始字符的起始概率和结尾字符的结尾概率的乘积进行限定的阈值,其中,概率乘积阈值的设定可以是基于当前的实际情况进行设定的,比如计算各初始第一处理结果中起始字符的起始概率与结尾字符的结尾概率的乘积,将乘积按照从大到小的顺序进行排序,预先设定选定k个第一处理结果,则将第k个乘积确定为概率乘积阈值。
115.获取各字符在初始文本中所处的位置的实现方式可以是对初始文本中的字符依次进行识别,对识别到的字符进行编号,获得各字符在初始文本中所处的位置。
116.基于各字符在初始文本中所处的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果的实现方式,可以是针对初始文本中的任一字符,将任一字符确定为起始字符;基于任一字符在初始文本中所处的位置,遍历初始文本中该位置之后位置的字符作为结尾字符;基于起始字符和各结尾字符,获得至少一个任一初始第一处理结果;基于初始文本中各字符对应的至少一个任一初始第一处理结果,获得至少一个初始第一处理结果。
117.基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的至少一个第一处理结果的实现方式,可以是遍历各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,将起始概率和结尾概率的乘积不满足概率乘积阈值的初始第一处理结果进行筛除,将未筛除的初始第一处理结果确定为第一处理结果。
118.应用本说明书实施例的方案,获取各字符在初始文本中所处的位置;基于各字符在初始文本中所处的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果;基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的至少一个第一处理结果。通过各字符在初始文本中所处的位置获得至少一个初始第一处理结果,并基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概
率,从至少一个初始第一处理结果中确定至少一个第一处理结果,使得确定得到的至少一个第一处理结果是经过位置和概率的双重筛选,保证了确定出来的第一处理结果的准确性。
119.步骤306:将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,其中,目标文本为将初始文本译为参考语言得到。
120.具体地,目标文本是指将初始文本进行翻译得到的文本,其中,进行翻译是将初始文本翻译为参考语言的文本,比如,指定语言为中文,参考语言为英文,则初始文本为“对初始文本进行文本处理”,相应的,目标文本即为“text processing of the initial text”。第二处理结果是指目标文本经过多语言处理模型的处理,并将输出译为指定语言的处理结果,第二处理结果可以是位置标识也可以是文本,比如,在阅读理解场景中,初始文本为指定语言的篇章文本和问题文本,相应的,目标文本为参考语言的篇章文本和问题文本,第二处理结果可以是阅读理解中问题文本对应的答案文本,也可以是答案文本在篇章文本中的位置标识。
121.将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果的实现方式,可以是将初始文本译为参考语言的目标文本;将目标文本输入多语言处理模型,获得参考语言的参考处理结果;将参考处理结果译为指定语言的第二处理结果。
122.可选地,参考处理结果的数量可以是一个或多个,相应的,第二处理结果的数量也可以是一个或多个。
123.其中,将目标文本输入多语言处理模型,获得参考语言的参考处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
124.本说明书一种可能的实现方式中,可以是将目标文本输入多语言处理模型,获得多语言处理模型输出的参考语言的参考处理结果。
125.本说明书另一种可能的实现方式中,可以是将目标文本输入多语言处理模型,获得目标文本中各字符作为参考处理结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从目标文本中截取参考处理结果。
126.可选地,将目标文本输出多语言处理模型,获得目标文本中各字符作为参考处理结果中起始字符的起始概率和结尾字符的结尾概率的实现方式,可以是将目标文本输出多语言处理模型,获得多语言处理模型输出的目标文本中各字符作为参考处理结果中起始字符的起始概率和结尾字符的结尾概率。
127.其中,基于各字符对应的起始概率和结尾概率,从目标文本中截取参考处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
128.本说明书一种可能的实现方式中,可以是基于各字符对应的起始概率和结尾概率,从目标文本中截取一个参考处理结果。
129.本说明书另一种可能的实现方式中,可以是基于各字符对应的起始概率和结尾概率,从目标文本中截取至少一个初始参考处理结果;按照预设选择条件,从至少一个初始参考处理结果中确定参考处理结果,其中预设选择条件是指从至少一个初始参考处理结果中选择参考处理结果的条件,预设选择条件可以是按照概率从大到小排序,选择第一个;预设选择条件还可以是按照概率从小到大排序,选择最后一个。
130.其中,基于各字符对应的起始概率和结尾概率,从目标文本中截取至少一个初始参考处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
131.本说明书一种可能的实现方式中,可以是基于各字符对应的起始概率和结尾概率,对目标文本中的字符进行排序,获得起始概率队列和结尾概率队列;基于起始概率队列和结尾概率队列,从目标文本中截取至少一个初始参考处理结果。
132.可选地,基于起始概率队列和结尾概率队列,从目标文本中截取至少一个初始参考处理结果的实现方式,可以是将起始概率队列与结尾概率队列中的字符进行遍历组合,获得多个初始结果组合;基于各初始结果组合中起始概率和结尾概率,选定满足预设选定条件的至少一个初始结果组合确定为至少一个初始参考处理结果。
133.可选地,在获得多个初始组合结果之后,还可以包括获取各初始结果组合中起始字符与结尾字符在初始文本中所处的位置,将结尾字符的位置在起始字符的位置之前的初始结果组合进行删除,基于未删除的初始结果组合执行后续步骤。
134.可选地,基于各初始结果组合中起始概率和结尾概率,选定满足预设选定条件的至少一个初始结果组合确定为至少一个初始参考处理结果的实现方式,可以是计算各初始结果组合中起始概率和结尾概率的乘积,对各乘积从大到小排序,选定前预设数目个乘积对应的初始结果组合确定为预设数目个初始参考处理结果;还可以是选定各初始结果组合中起始字符的起始概率和结尾字符的结尾概率均满足概率阈值的初始结果组合,作为初始参考处理结果,其中,概率阈值可以包括起始概率阈值和结尾概率阈值,使用起始概率阈值对起始字符的起始概率进行限定,使用结尾概率阈值对结尾字符的结尾概率进行限定。
135.本说明书另一种可能的实现方式中,可以是基于各字符在目标文本中所处的位置,从目标文本中截取至少一个初始处理结果;基于各初始处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始处理结果中确定至少一个初始参考处理结果。
136.可选地,基于各字符在目标文本中所处的位置,从目标文本中截取至少一个初始处理结果的实现方式,可以是基于各字符在目标文本中所处的位置,从目标文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始处理结果。
137.可选地,基于各初始处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始处理结果中确定至少一个初始参考处理结果的实现方式,可以是基于各初始处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始处理结果中确定起始概率和结尾概率均满足概率阈值的至少一个初始参考处理结果。
138.通过将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,使得后续基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。
139.步骤308:基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。
140.具体地,目标处理结果是指初始文本对应的结果,目标处理结果可以是位置标识也可以是文本,比如,在阅读理解场景中,初始文本为篇章文本和问题文本,目标处理结果可以是问题文本对应的答案文本,还可以是问题文本对应的答案文本在篇章文本中的位置标识。
141.基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果的实现方
式是基于第二处理结果,从至少一个第一处理结果中确定初始文本对应的目标处理结果。
142.基于第二处理结果,从至少一个第一处理结果中确定初始文本对应的目标处理结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
143.本说明书一种可能的实现方式中,可以是匹配第二处理结果与各第一处理结果中的字符,根据各匹配度,从至少一个第一处理结果中确定初始文本对应的目标处理结果。
144.本说明书另一种可能的实现方式中,还可以是分别计算第二处理结果与各第一处理结果之间的相似度;基于各相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果,也即上述步骤308,包括如下步骤:
145.分别计算第二处理结果与各第一处理结果之间的相似度;
146.基于各相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果。
147.具体地,相似度是指处理结果之间的相似值,其中,相似度可以是数值,比如,70%、0.7等。
148.分别计算第二处理结果与各第一处理结果之间的相似度的实现方式,可以是分别计算第二处理结果与各第一处理结果之间的编辑距离,根据编辑距离,确定第二处理结果与各第一处理结果之间的相似度;还可以是分别获得第二处理结果和各第一处理结果的语义表示;基于各语义表示,计算第二处理结果与各第一处理结果之间的语义相似度,将语义相似度确定为相似度;还可以是分别确定第二处理结果与各第一处理结果之间的字符集评价指标;基于各字符集评价指标,确定第二处理结果与各第一处理结果之间的相似度,其中,字符集评价指标是指字符集f指标,用于评价两个结果之间的相似度。
149.可选地,分别确定第二处理结果与各第一处理结果之间的字符集评价指标;基于各字符集评价指标,确定第二处理结果与各第一处理结果之间的相似度的实现方式,可以是确定第二处理结果与各第一处理结果中的交集;基于各交集,确定第二处理结果与各第一处理结果的相似度。
150.其中,基于各交集,确定第二处理结果与各第一处理结果的相似度的实现方式,可以是计算目标交集分别在目标第一处理结果和第二处理结果的占比;基于两个占比,确定目标第一处理结果和第二处理结果之间的相似度。
151.基于各相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果的实现方式,可以是从各相似度中选定满足预设相似度阈值的第一处理结果确定为初始文本对应的目标处理结果;还可以是针对目标第一处理结果与第二处理结果之间的相似度和目标第一处理结果中起始字符的起始概率和结尾字符的结尾概率,确定目标第一处理结果与第二处理结果之间的总相似度,其中,目标第一处理结果为至少一个第一处理结果中的任一个;基于各总相似度,确定目标处理结果。
152.应用本说明书实施例的方案,通过第二处理结果与各第一处理结果之间的相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果,使得确定的目标处理结果是基于相似度进行确定的,保证了确定得到的目标处理结果的准确性。
153.可选地,上述步骤分别计算第二处理结果与各第一处理结果之间的相似度,包括如下步骤:
154.确定目标第一处理结果和第二处理结果的交集,其中,目标第一处理结果为至少一个第一处理结果中的任一个;
155.计算交集在目标第一处理结果和第二处理结果中出现的第一占比和第二占比;
156.基于第一占比和第二占比,确定目标第一处理结果和第二处理结果之间的相似度。
157.具体地,交集是指两个处理结果对应文本之间相交的文本,比如,目标第一处理结果对应的文本为“ab市”,第二处理结果对应的文本为“ab”,则确定目标第一处理结果与第二处理结果的交集为“ab”。第一占比和第二占比是指交集指代的文本在两个处理结果中所占的比重,比如,交集“ab”在目标第一处理结果中的占比为2/3,在第二处理结果中的占比为1。
158.确定目标第一处理结果和第二处理结果的交集的实现方式,可以是识别目标第一处理结果与第二处理结果中的字符;将目标第一处理结果与第二处理结果中的字符进行比对,基于比对结果,确定目标第一处理结果和第二处理结果的交集。
159.其中,基于比对结果,确定目标第一处理结果和第二处理结果的交集的实现方式,可以是基于比对结果,提取比对成功的字符,将提取得到的字符确定为目标第一处理结果和第二处理结果的交集。
160.计算交集在目标第一处理结果和第二处理结果中出现的第一占比和第二占比的实现方式,可以是将交集中字符的数量作为分子,分别将目标第一处理结果和第二处理结果中字符的数量作为分母,获得交集在目标第一处理结果中出现的第一占比和交集在第二处理结果中出现的第二占比。
161.基于第一占比和第二占比,确定目标第一处理结果和第二处理结果之间的相似度的实现方式,可以是将第一占比和第二占比之积的二倍作为分子,将第一占比和第二占比之和作为分母,确定目标第一处理结果和第二处理结果之间的相似度。
162.示例性地,目标第一处理结果对应的文本为“ab市”,第二处理结果对应的文本为“ab”,则确定目标第一处理结果与第二处理结果的交集为“ab”;交集“ab”在目标第一处理结果中的第一占比为2/3,在第二处理结果中的第二占比为1;相似度为{2*[(2/3)*1]}/[(2/3)+1]=4/5。
[0163]
应用本说明书实施例的方案,通过确定目标第一处理结果和第二处理结果中的交集,并根据交集在目标第一处理结果与第二处理结果中的占比,确定目标第一处理结果和第二处理结果之间的相似度,使得确定得到的目标第一处理结果和第二处理结果之间的相似度是基于二者之间的交集,以及二者本身确定的,保证了确定得到的相似度的准确性。
[0164]
可选地,上述步骤基于各相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果,包括如下步骤:
[0165]
获取目标第一处理结果中起始字符的起始概率和结尾字符的结尾概率,其中,目标第一处理结果为至少一个第一处理结果中的任一个;
[0166]
根据起始概率、结尾概率以及目标第一处理结果与第二处理结果之间的相似度,确定目标第一处理结果与第二处理结果之间的总相似度;
[0167]
基于各第一处理结果与第二处理结果之间的总相似度,确定目标总相似度对应的第一处理结果为目标处理结果。
[0168]
具体地,总相似度是指两个处理结果之间总的相似度,其中,总相似度由相似度与处理结果中起始字符的起始概率和结尾字符的结尾概率确定。
[0169]
获取目标第一处理结果中起始字符的起始概率和结尾字符的结尾概率的实现方式,可以是获取目标第一处理结果中的起始字符和结尾字符;分别获取起始字符的起始概率和结尾字符的结尾概率。
[0170]
根据起始概率、结尾概率以及目标第一处理结果与第二处理结果之间的相似度,确定目标第一处理结果与第二处理结果之间的总相似度的实现方式,可以是根据起始概率和结尾概率,确定目标第一处理结果的概率乘积;基于概率乘积和目标第一处理结果与第二处理结果之间的相似度,确定目标第一处理结果与第二处理结果之间的总相似度。
[0171]
根据起始概率和结尾概率,确定目标第一处理结果的概率乘积的实现方式,可以是将起始概率和结尾概率相乘,获得概率乘积。
[0172]
基于概率乘积和目标第一处理结果与第二处理结果之间的相似度的实现方式,可以是将概率乘积与相似度相乘,获得目标第一处理结果与第二处理结果之间的总相似度。
[0173]
相应的,按照上述确定目标第一处理结果与第二处理结果之间总相似度的计算方式,获得第二处理结果与各第一处理结果之间的总相似度。
[0174]
基于各第一处理结果与第二处理结果之间的总相似度,确定目标总相似度对应的第一处理结果为目标处理结果的实现方式,可以是基于各第一处理结果与第二处理结果之间的总相似度,从各总相似度中选定大于等于总相似度阈值的目标总相似度对应的第一处理结果为目标处理结果,其中,总相似度阈值的设定方式可以根据实际情况进行设定,比如,需要选定一个第一处理结果作为目标处理结果,则将第二处理结果与各第一处理结果之间的相似度从大到小排序,将排在第一个的总相似度确定为总相似度阈值;还可以是将各第一处理结果与第二处理结果之间的总相似度按照从大到小排序,选定排在第一位的总相似度确定为目标总相似度,将目标总相似度对应的第一处理结果确定为目标处理结果。
[0175]
应用本说明书实施例的方案,通过目标第一处理结果中的起始字符的起始概率和结尾字符的结尾概率以及与第二处理结果之间的相似度,确定目标第一处理结果与第二处理结果之间的总相似度,并根据总相似度从至少一个第一处理结果中确定初始文本对应的目标处理结果,使得确定得到的初始文本对应的目标处理结果是经过第一处理结果自身的筛选以及与第二处理结果之间通过相似度的筛选,保证了确定得到的目标处理结果的准确性。
[0176]
应用本说明书实施例的方案,在xtreme榜单的xquad数据集上进行实验得到的准确率,相比于基于数据增强得到的标签与样本文本对多语言处理模型进行训练得到的处理模型进行文本处理得到结果的准确率,由77.84提升到79.52;在xtreme榜单的xlqa数据集上进行实验得到的准确率,相比于基于数据增强得到的标签与样本文本对多语言处理模型进行训练得到的处理模型进行文本处理得到结果的准确率,由69.59提升到72.23。
[0177]
在只有参考语言的样本篇章文本和样本问题文本和多语言预训练处理模型的情况下,训练得到的多语言阅读理解模型在参考语言中执行阅读理解任务时,会有较高的准确性,但多语言阅读理解模型在处理除参考语言之外的其他语言的阅读理解任务时,会导致模型处理得到的准确性较差,即使多语言预训练处理模型具有语言迁移能力,但在只有参考语言的样本篇章文本和样本问题文本微调训练得到的多语言处理模型的情况下,在处理除参考语言之外的其他语言对应的阅读理解任务的情况下,产生的结果依然较差,因此,亟需一种阅读理解任务处理方法。
[0178]
参见图4,图4示出了本说明书一个实施例提供的一种文本阅读理解方法的流程图,应用于指定语言场景,具体包括以下步骤:
[0179]
步骤402:获取指定语言的初始文本和多语言阅读理解模型,其中,初始文本包括篇章文本和问题文本,多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到。
[0180]
具体地,篇章文本是指阅读材料中篇章对应的文本,比如,篇章文本可以是说明书、规格书等。问题文本是指阅读材料中问题对应的文本,比如,问题文本可以是基于说明书提出的问题对应的文本、基于规格书提出的问题对应的文本。多语言阅读理解模型是指预先基于参考语言的样本篇章文本和样本问题文本训练得到的,多语言阅读理解模型天然具有对多语言进行识别的能力,且经过参考语言的样本篇章文本和样本问题文本进行训练,也拥有了对文本进行文本阅读理解的能力。样本篇章文本和样本问题文本是指对多语言预训练模型进行训练获得多语言阅读理解模型的文本,其中,样本篇章文本和样本问题文本的文本形式和初始文本中的篇章文本和问题文本的文本形式是相同的,但是所属的语言不同,在利用样本篇章文本和样本问题文本训练得到多语言阅读理解模型的过程中,使用的损失函数可以是交叉熵损失函数。
[0181]
步骤404:将篇章文本和问题文本输入多语言阅读理解模型,获得至少一个第一阅读理解结果。
[0182]
具体地,第一阅读理解结果是指篇章文本和问题文本经过多语言阅读理解模型进行处理获得的结果,第一阅读理解结果可以是答案文本对应的位置标识也可以是答案文本对应的文本,若第一阅读理解结果为文本,则文本的语言与篇章文本、问题文本的语言是相同的,是指定语言。
[0183]
将篇章文本和问题文本输入多语言阅读理解模型,获得至少一个第一阅读理解结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
[0184]
本说明书一种可能的实现方式中,可以是将篇章文本和问题文本输入多语言阅读理解模型,多语言阅读理解模型输出至少一个第一阅读理解结果。
[0185]
本说明书另一种可能的实现方式中,可以是将篇章文本和问题文本输入多语言阅读理解模型,多语言阅读理解模型输出篇章文本中各字符作为第一阅读理解结果中起始字符的起始概率和结尾字符的结尾概率,并基于得到的各字符对应的起始概率和结尾概率,从篇章文本中确定至少一个第一阅读理解结果。
[0186]
步骤406:将目标篇章文本和目标问题文本输入多语言阅读理解模型,并将多语言阅读理解模型的输出译为指定语言的第二阅读理解结果,其中,目标篇章文本和目标问题文本为将篇章文本和问题文本译为参考语言得到。
[0187]
具体地,目标篇章文本是指将初始文本中的篇章文本进行翻译得到的文本,其中,进行翻译是将初始文本中的篇章文本翻译为参考语言的篇章文本。目标问题文本是指将初始文本中的问题文本进行翻译得到的文本,其中,进行翻译是将初始文本中的问题文本翻译为参考语言的问题文本。第二阅读理解结果是指目标篇章文本和目标问题文本经过多语言阅读理解模型的处理,并将输出译为指定语言的阅读理解结果。
[0188]
将目标篇章文本和目标问题文本输入多语言阅读理解模型,并将多语言阅读理解模型的输出译为指定语言的第二阅读理解结果的实现方式,可以是将目标篇章文本和目标
问题文本输入多语言阅读理解模型,获得参考语言的参考阅读理解结果;将参考阅读理解结果以为指定语言的第二阅读理解结果。
[0189]
可选地,参考阅读理解结果的数量可以是一个或多个,相应的,第二阅读理解结果的数量也可以是一个或多个。
[0190]
其中,将目标篇章文本和目标问题文本输入多语言阅读理解模型,获得参考语言的参考阅读理解结果的实现方式有很多种,具体根据实际情况进行确定,本说明书在此不作限定。
[0191]
本说明书一种可能的实现方式中,可以是将目标篇章文本和目标问题文本输入多语言阅读理解模型,获得多语言阅读理解模型输出的参考语言的参考阅读理解结果。
[0192]
本说明书另一种可能的实现方式中,可以是将目标篇章文本和目标问题文本输入多语言阅读理解模型,获得目标篇章文本中各字符作为参考阅读理解结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从目标篇章文本中截取参考阅读理解结果。
[0193]
步骤408:基于第一阅读理解结果和第二阅读理解结果,确定篇章文本和问题文本对应的目标阅读理解结果。
[0194]
具体地,目标阅读理解结果是指初始文本中问题文本对应的结果,目标阅读理解结果可以是问题文本对应的答案文本,还可以是问题文本对应的答案文本在篇章文本中的位置标识。
[0195]
基于第一阅读理解结果和第二阅读理解结果,确定篇章文本和问题文本对应的目标阅读理解结果的实现方式,可以是基于第二阅读理解结果,从至少一个第一阅读理解结果中确定篇章文本和问题文本对应的目标阅读理解结果。
[0196]
基于第二阅读理解结果,从至少一个第一阅读理解结果中确定篇章文本和问题文本对应的目标阅读理解结果的实现方式有多种,具体根据实际情况进行确定,本说明书在此不作限定。
[0197]
本说明书一种可能的实现方式中,可以是匹配第二阅读理解结果与各第一阅读理解结果中的字符,根据各匹配度,从至少一个第一阅读理解结果中确定篇章文本和问题文本对应的目标阅读理解结果。
[0198]
本说明书另一种可能的实现方式中,还可以是分别计算第二阅读理解结果与各第一阅读理解结果之间的相似度;基于各相似度,从至少一个第一阅读理解结果中确定篇章文本和问题文本对应的目标阅读理解结果。
[0199]
应用本说明书实施例的方案,通过将初始文本中的篇章文本和问题文本译为训练多语言阅读理解模型的样本篇章文本和样本问题文本相同语言的目标篇章文本和目标问题文本,并将目标篇章文本和目标问题文本输入多语言阅读理解模型,将获得的输出译为第二阅读理解结果,使得可以根据初始文本中的篇章文本和问题文本经过多语言阅读理解模型获得的第一阅读理解结果和目标篇章文本和目标问题文本经过多语言阅读理解模型并进行翻译得到的第二阅读理解结果,确定初始文本中篇章文本和问题文本对应的目标阅读理解结果,保证了获得的目标阅读理解结果的准确性。
[0200]
参见图5,图5示出了本说明书一个实施例提供的一种文本处理方法的流程图,具体包括以下步骤:
[0201]
步骤502:获取初始文本。
[0202]
具体地,初始文本为待进行文本处理的文本,初始文本中包括多个文本字符,初始文本在不同场景下包括的内容不同,比如,在阅读理解的场景下,初始文本可以包括阅读理解的篇章文本和问题文本,其中,阅读理解场景包括很多种使用方式,比如,根据英文样本文本训练得到多语言处理模型,中文客户使用中文向智能客服进行提问,提问关于项目a的问题,智能客服获取提问的中文文本和项目a对应的中文说明书,中文文本和中文说明书即为初始文本。
[0203]
获取初始文本的方式有很多种,可以是用户在前端输入的,也可以是服务端从存储文本的文本存储库中获得的。
[0204]
通过获取初始文本,使得后续可以基于初始文本与多语言处理模型,获得初始文本对应的目标处理结果。
[0205]
步骤504:将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果。
[0206]
其中,多语言处理模型基于指定语言的测试文本对初始多语言处理模型微调得到,初始多语言处理模型基于参考语言的样本文本训练得到,微调过程中测试文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试文本输入初始多语言处理模型得到,第二测试结果为将译文文本输入初始多语言处理模型并将模型输出译为指定语言得到,译文文本为将测试文本译为参考语言得到。
[0207]
具体地,多语言处理模型是指对初始文本进行处理,获得初始文本对应的目标处理结果的模型,其中,多语言处理模型是利用指定语言的测试文本对初始多语言处理模型微调得到的。目标处理结果是指对初始文本进行处理,获得的初始文本对应的处理结果,目标处理结果的形式可以是位置标识也可以是文本,比如,在阅读理解场景中,初始文本为篇章文本和问题文本,目标处理结果可以是问题文本对应的答案文本,也可以是答案文本在篇章文本中的位置对应的位置标识。指定语言是指基于初始多语言处理模型进行指定的语言,指定语言是指初始多语言处理模型可以识别的语言,指定语言是出参考语言之外的语言,比如,参考语言为英语、法语等,则指定语言可以为中文、俄语等。参考语言是指训练初始多语言处理模型的样本文本对应的语言。
[0208]
初始多语言处理模型是指预先基于参考语言的样本文本对初始多语言预训练模型进行训练得到的模型,初始多语言处理模型天然具有识别多语言的能力,且经过参考语言的样本文本进行训练,也拥有了进行文本处理的能力,其中,多语言预训练模型可以是多语言transformer模型,样本文本是指对初始多语言预训练模型进行训练获得多初始语言处理模型的文本,在利用参考语言的样本文本训练得到多语言处理模型的过程中使用的损失函数可以是交叉熵损失函数。
[0209]
微调是指对模型中的模型参数进行微调,比如,对初始多语言处理模型中的模型参数进行微调,获得多语言处理模型,其中,对初始多语言处理模型进行微调可以是基于指定语言的测试文本进行微调。测试文本是指对初始多语言处理模型进行训练获得多语言处理模型中的样本,样本有对应的标签信息。标签信息是指对模型在基于测试文本获得测试文本对应的测试结果之后,利用测试结果与标签信息,对初始多语言处理模型的模型参数进行微调,其中测试文本的标签信息是基于第一测试结果和第二测试结果得到,第一测试结果为将测试文本输入初始多语言处理模型得到,第二测试结果为将译文文本输入初始多
语言处理模型并将模型输出译为指定语言得到,译文文本为将测试文本译为参考语言得到。
[0210]
第一测试结果是指指定语言的测试文本经过初始多语言处理模型进行处理,得到的测试结果,其中,测试结果的文本形式可以是位置标识也可以是文本,比如在阅读理解场景中,测试文本为测试篇章文本和测试问题文本,测试结果可以是测试问题文本对应的测试结果文本,也可以是测试结果文本在测试篇章文本中的位置标识。第二测试结果是指将参考语言的译文文本输入初始多语言处理模型进行处理,并将输出译为指定语言的测试结果,其中,测试结果的文本形式可以是位置标识也可以是文本,比如在阅读理解场景中,测试文本为测试篇章文本和测试问题文本,测试结果可以是测试问题文本对应的测试结果文本,也可以是测试结果文本在测试篇章文本中的位置标识。译文文本是指将指定语言的测试文本进行翻译获得的参考语言的译文文本。
[0211]
将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果的实现方式,可以是将初始文本输入多语言处理模型,经过多语言处理模型的处理,多语言处理模型输出初始文本对应的目标处理结果;还可以是将初始文本输入多语言处理模型,多语言处理模型输出初始文本中各字符作为目标处理结果中起始字符的起始概率和结尾字符的结尾概率;根据各字符对应的起始概率和结尾概率,从初始文本中截取初始文本对应的目标处理结果。
[0212]
根据各字符对应的起始概率和结尾概率,从初始文本中截取初始文本对应的目标处理结果的实现方式,可以是获取各字符在初始文本中所处的位置,基于各字符在初始文本中的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始目标处理结果;基于各初始目标处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标处理结果中确定目标处理结果。
[0213]
基于各初始目标处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标处理结果中确定目标处理结果的实现方式,可以是基于各初始目标处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标处理结果中确定起始概率和结尾概率均满足概率阈值的目标处理结果;还可以是基于各初始目标处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的目标处理结果。
[0214]
可选地,在上述步骤将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果之前,还包括如下步骤:
[0215]
获取指定语言的测试文本和初始多语言处理模型;
[0216]
将测试文本输入初始多语言处理模型,获得至少一个第一测试结果;
[0217]
将译文文本输入初始多语言处理模型,并将初始多语言处理模型的输出译为指定语言的第二测试结果,其中,译文文本为将测试文本译为参考语言得到;
[0218]
基于第一测试结果和第二测试结果,确定测试文本的标签信息;
[0219]
基于测试文本的标签信息及第一测试结果,对初始多语言处理模型进行模型微调,获得微调后的多语言处理模型。
[0220]
获取指定语言的测试文本可以是用户通过前端上传的,也可以是基于用户的选择,从存储文本的文本存储库中获取的。获取初始多语言处理模型可以是在存储模型的模
型存储库中获取的。
[0221]
将测试文本输入初始多语言处理模型,获得至少一个第一测试结果的实现方式,可以是将测试文本输入初始多语言处理模型,初始多语言处理模型输出至少一个第一测试结果;还可以是将测试文本输入初始多语言处理模型,初始多语言处理模型输出测试文本中各字符作为第一测试结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符作为第一测试结果中起始字符的起始概率和结尾字符的结尾概率,从测试文本中确定至少一个第一测试结果。
[0222]
将译文文本输入初始多语言处理模型,并将初始多语言处理模型的输出译为指定语言的第二测试结果的实现方式,可以是将测试文本译为参考语言的译文文本;将译文文本输入初始多语言处理模型,获得参考语言的参考测试结果;将参考测试结果译为指定语言的第二测试结果。
[0223]
可选地,参考测试结果的数量可以是一个也可以是多个,相应的,第二测试结果的数量也可以是一个或多个。
[0224]
将译文文本输入初始多语言处理模型,获得参考语言的参考测试结果的实现方式,可以是将译文文本输入初始多语言处理模型,获得初始多语言处理模型输出的参考测试结果;还可以是将译文文本输入初始多语言处理模型,获得译文文本中各字符作为参考测试结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从测试文本中截取参考测试结果。
[0225]
基于第一测试结果和第二测试结果,确定测试文本的标签信息的实现方式,可以是基于第二测试结果,从至少一个第一测试结果中确定测试文本的标签信息。
[0226]
基于第二测试结果,从至少一个第一测试结果中确定测试文本的标签信息的实现方式,可以是匹配第二测试结果与各第一测试结果中的字符;根据匹配度,从至少一个第二测试结果中确定目标测试结果,将目标测试结果确定为测试文本的标签信息;还可以是分别计算第二测试结果和各第一测试结果之间的相似度;基于各相似度,从至少一个第一测试结果中确定目标测试结果;将目标测试结果确定为测试文本的标签信息。
[0227]
基于测试文本的标签信息及第一测试结果,对初始多语言处理模型进行模型微调,获得微调后的多语言处理模型的实现方式,可以是基于测试文本的标签信息及第一测试结果,确定损失值;基于损失值,对初始多语言处理模型进行模型微调,获得微调后的多语言处理模型。
[0228]
应用本说明书实施例的方案,通过将测试文本译为训练初始多语言处理模型的样本文本相同语言的译文文本,并将译文文本输入初始多语言处理模型,将获得的输出以为第二测试结果,使得可以根据测试文本对应的第一测试结果和译文文本获得的第二测试结果,确定测试文本对应的标签信息,并可以利用标签信息和第一测试结果,对初始多语言处理模型进行微调,获得微调后的多语言处理模型,使得在测试文本没有标签信息的情况下,可以是生成测试文本对应的标签信息,并可以根据测试文本和标签信息对初始多语言处理模型进行微调,获得多语言处理模型。
[0229]
可选地,上述步骤基于第一测试结果和第二测试结果,确定测试文本的标签信息,包括如下步骤:
[0230]
分别计算第二测试结果与各第一测试结果之间的测试相似度;
[0231]
基于各测试相似度,从至少一个第一测试结果中确定测试文本的标签信息。
[0232]
具体地,测试相似度是指测试结果之间的相似值,其中,测试相似度可以是数值,比如,70%、0.7等等。
[0233]
分别计算第二测试结果与各第一测试结果之间的测试相似度的实现方式,可以是分别计算第二测试结果中的字符与各第一测试结果中的字符之间的相似度;还可以是分别确定第二测试结果与各第一测试结果之间的字符集评价指标;基于各字符集评价指标,确定第二测试结果与各第一测试结果之间的相似度。
[0234]
可选地,分别确定第二测试结果与各第一测试结果之间的字符集评价指标;基于各字符集评价指标,确定第二测试结果与各第一测试结果之间的相似度的实现方式,可以是确定第二测试结果与各第一测试结果中的交集;基于各交集,确定第二测试结果与各第一测试结果的相似度。
[0235]
基于各测试相似度,从至少一个第一测试结果中确定测试文本的标签信息的实现方式,可以是从各测试相似度中选定满足预设测试相似度阈值的第一测试结果确定为测试文本对应的目标测试结果;还可以是针对目标第一测试结果与第二测试结果之间的测试相似度和目标第一测试结果中起始字符的起始概率和结尾字符的结尾概率,确定目标第一测试结果与第二测试结果之间的总相似度,其中,目标第一测试结果为至少一个第一测试结果中的任一个;基于各总相似度,确定目标测试结果。
[0236]
应用本说明书实施例的方案,通过第二测试结果与各第一测试结果之间的测试相似度,从至少一个第一测试结果中确定测试文本对应的目标测试结果,使得确定的目标测试结果是基于测试相似度进行确定的,保证了确定得到的目标测试结果的准确性。
[0237]
可选地,上述步骤基于测试文本的标签信息及第一测试结果,对初始多语言处理模型进行模型微调,包括如下步骤:
[0238]
基于测试文本的标签信息及第一测试结果,计算损失值;
[0239]
根据损失值,对初始多语言处理模型中的模型参数进行微调。
[0240]
具体地,损失值是指预测值和真实值之间的差异对应的数值,比如,可以是标签信息与第一测试结果之间的差异对应的数值。
[0241]
基于测试文本的标签信息及第一测试结果,计算损失值的实现方式,可以是从至少一个第一测试结果中选定指定第一测试结果;基于指定第一测试结果及测试文本的标签信息,计算得到损失值。
[0242]
从至少一个第一测试结果中选定指定第一测试结果的实现方式,可以是获取各第一测试结果中起始字符的起始概率和结尾字符的结尾概率;基于各第一测试结果对应的起始概率和结尾概率,确定各第一测试结果的概率值;基于各概率值,确定目标概率值对应的第一测试结果为指定第一测试结果。
[0243]
基于各第一测试结果对应的起始概率和结尾概率,计算各第一测试结果的起始概率和结尾概率求和或求积,将求和或求积的结果确定为各第一测试结果的概率值,其中,各第一测试结果使用的求和或者求积的计算方式是一致的。
[0244]
基于指定第一测试结果及测试文本的标签信息,计算得到损失值的实现方式,可以是基于指定第一测试结果、测试文本的标签信息以及损失函数,确定测试文本对应的损失值,其中,损失函数可以是交叉熵损失函数。
[0245]
根据损失值,对初始多语言处理模型中的模型参数进行微调之前还包括判断损失值是否超过损失阈值,若未超过,则执行根据损失值,对初始多语言处理模型中的模型参数进行微调的步骤,若超过,则停止训练初始多语言处理模型,将停止训练后的模型作为多语言处理模型。
[0246]
应用本说明书实施例的方案,根据标签信息和第一测试结果,计算损失值;根据损失值,对初始多语言处理模型中的模型参数进行微调,通过计算损失值,并为初始多语言处理模型进行微调的方式,获得多语言处理模型。
[0247]
参见图6,图6示出了本说明书一个实施例提供的一种文本阅读理解方法的流程图,具体包括以下步骤:
[0248]
步骤602:获取初始文本,其中,初始文本包括篇章文本和问题文本。
[0249]
具体地,篇章文本是指阅读材料中篇章对应的文本,比如,篇章文本可以是说明书、规格书等。问题文本是指阅读材料中问题对应的文本,比如,问题文本可以是基于说明书提出的问题对应的文本、基于规格书提出的问题对应的文本。
[0250]
获取篇章文本和问题文本的方式有很多种,可以是用户在前端输入的,也可以是服务端从存储文本的文本存储库中获得的。
[0251]
步骤604:将篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果。
[0252]
其中,多语言阅读理解模型基于指定语言的测试篇章文本和测试问题文本对初始多语言阅读理解模型微调得到,初始多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到,微调过程中测试篇章文本和测试问题文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试篇章文本和测试问题文本输入初始多语言阅读理解模型得到,第二测试结果为将译文篇章文本和译文问题文本输入初始多语言阅读理解模型并将模型输出译为指定语言得到,译文篇章文本和译文问题文本为将测试篇章文本和测试问题文本译为参考语言得到。
[0253]
多语言阅读理解模型是指对篇章文本和问题文本进行阅读理解,获得篇章文本和问题文本对应的目标阅读理解结果的模型,其中,多语言阅读理解模型是利用指定语言的测试篇章文本和测试问题文本对初始多语言阅读理解模型微调得到的。目标阅读理解结果是指对篇章文本和问题文本进行处理,获得的篇章文本和问题文本对应的阅读理解结果,目标阅读理解结果的形式可以是问题文本对应的答案文本,也可以是答案文本在篇章文本中的位置对应的位置标识。指定语言是指基于初始多语言阅读理解模型进行指定的语言,指定语言是指初始多语言阅读理解模型可以识别的语言,指定语言是出参考语言之外的语言,比如,参考语言为英语、法语等,则指定语言可以为中文、俄语等。参考语言是指训练初始多语言阅读理解模型的样本篇章文本和样本问题文本对应的语言。
[0254]
初始多语言阅读理解模型是指预先基于参考语言的样本篇章文本和样本问题文本对初始多语言预训练模型进行训练得到的模型,初始多语言阅读理解模型天然具有识别多语言的能力,且经过参考语言的样本篇章文本和样本问题文本进行训练,也拥有了进行文本阅读理解的能力,其中,多语言预训练模型可以是多语言transformer模型,样本篇章文本和样本问题文本是指对初始多语言预训练模型进行训练获得多初始语言阅读理解模型的文本,在利用参考语言的样本篇章文本和样本问题文本训练得到多语言阅读理解模型
的过程中使用的损失函数可以是交叉熵损失函数。
[0255]
微调是指对模型中的模型参数进行微调,比如,对初始多语言阅读理解模型中的模型参数进行微调,获得多语言阅读理解模型,其中,对初始多语言阅读理解模型进行微调可以是基于指定语言的测试篇章文本和测试问题文本进行微调。测试篇章文本和测试问题文本是指对初始多语言阅读理解模型进行训练获得多语言阅读理解模型中的样本,样本有对应的标签信息。标签信息是指对模型在基于测试篇章文本和测试问题文本获得测试篇章文本和测试问题文本对应的测试结果之后,利用测试结果与标签信息,对初始多语言阅读理解模型的模型参数进行微调,其中测试篇章文本和测试问题文本的标签信息是基于第一测试结果和第二测试结果得到,第一测试结果为将测试篇章文本和测试问题文本输入初始多语言阅读理解模型得到,第二测试结果为将译文篇章文本和译文问题文本输入初始多语言阅读理解模型并将模型输出译为指定语言得到,译文篇章文本和译文问题文本为将测试篇章文本和测试问题文本译为参考语言得到。
[0256]
第一测试结果是指指定语言的测试篇章文本和测试问题文本经过初始多语言阅读理解模型进行阅读理解,得到的测试结果,其中,测试结果的文本形式可以是位置标识也可以是文本,比如在阅读理解场景中,测试篇章文本和测试问题文本为测试篇章文本和测试问题文本,测试结果可以是测试问题文本对应的测试结果文本,也可以是测试结果文本在测试篇章文本中的位置标识。第二测试结果是指将参考语言的译文篇章文本和译文问题文本输入初始多语言阅读理解模型进行阅读理解,并将输出译为指定语言的测试结果,其中,测试结果的文本形式可以是位置标识也可以是文本,比如在阅读理解场景中,测试篇章文本和测试问题文本为测试篇章文本和测试问题文本,测试结果可以是测试问题文本对应的测试结果文本,也可以是测试结果文本在测试篇章文本中的位置标识。译文篇章文本和译文问题文本是指将指定语言的测试篇章文本和测试问题文本进行翻译获得的参考语言的译文篇章文本和译文问题文本。
[0257]
将篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果的实现方式,可以是将篇章文本和问题文本输入多语言阅读理解模型,经过多语言阅读理解模型的阅读理解,多语言阅读理解模型输出篇章文本和问题文本对应的目标阅读理解结果;还可以是将篇章文本和问题文本输入多语言阅读理解模型,多语言阅读理解模型输出篇章文本和问题文本中各字符作为目标阅读理解结果中起始字符的起始概率和结尾字符的结尾概率;根据各字符对应的起始概率和结尾概率,从篇章文本和问题文本中截取篇章文本和问题文本对应的目标阅读理解结果。
[0258]
根据各字符对应的起始概率和结尾概率,从篇章文本和问题文本中截取篇章文本和问题文本对应的目标阅读理解结果的实现方式,可以是获取各字符在篇章文本和问题文本中所处的位置,基于各字符在篇章文本和问题文本中的位置,从篇章文本和问题文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始目标阅读理解结果;基于各初始目标阅读理解结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标阅读理解结果中确定目标阅读理解结果。
[0259]
基于各初始目标阅读理解结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标阅读理解结果中确定目标阅读理解结果的实现方式,可以是基于各初始目标阅读理解结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标阅
读理解结果中确定起始概率和结尾概率均满足概率阈值的目标阅读理解结果;还可以是基于各初始目标阅读理解结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始目标阅读理解结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的目标阅读理解结果。
[0260]
应用本说明书实施例的方案,通过将获取的篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果,多语言阅读理解模型是基于测试篇章文本和测试问题文本对初始多语言阅读理解模型进行微调得到的,也即微调后的多语言阅读理解模型的具备对各语言的篇章文本和问题文本进行文本阅读理解的能力,使得生成的篇章文本和问题文本对应的目标阅读理解结果是准确的。
[0261]
下述结合附图7,以本说明书图3提供的文本处理方法在阅读理解的应用为例,应用于指定语言场景,对所述文本处理方法进行进一步说明。其中,图7示出了本说明书一个实施例提供的一种文本处理方法的处理过程流程图。
[0262]
获取中文的问题和篇章,其中,包括三个篇章:和两个问题
[0263]
将三个篇章和两个问题输入多语言阅读理解模型,获得三个篇章中各字符作为第一处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end);根据各字符作为第一处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end),选定中文top k答案;
[0264]
将中文的三个篇章和两个问题进行中英翻译zh-en transflator;获得英文的和两个问题也即英文question和passage;将英文的三个篇章和两个问题输入多语言阅读理解模型,获得英文的三个篇章中各字符作为第二处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end);根据各字符作为第二处理结果中起始字符的起始概率p(begin)和结尾字符的结尾概率p(end),选定英文top 1答案;对英文top 1答案进行英中翻译en-zh translator,获得“中文的top 1答案”;
[0265]
分别计算各中文top k答案与“中文的top 1答案”之间的相似度,也即计算相似度;根据各相似度,从中文top k答案中选定中文最终答案。
[0266]
应用本说明书实施例的方案,获取指定语言的初始文本和多语言处理模型,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。通过将初始文本译为训练多语言处理模型的样本文本相同语言的目标文本,并将目标文本输入多语言处理模型,将获得的输出译为第二处理结果,使得可以根据初始文本经过多语言处理模型获得的第一处理结果和目标文本经过多语言处理模型并进行翻译得到的第二处理结果,确定初始文本对应的目标处理结果,保证了获得的目标处理结果的准确性。
[0267]
下述结合附图8,以本说明书图5提供的文本处理方法在阅读理解的应用为例,对所述文本处理方法进行进一步说明。其中,图8示出了本说明书一个实施例提供的另一种文
本处理方法的处理过程流程图,具体包括以下步骤。
[0268]
步骤802:获取初始文本,其中,初始文本包括篇章文本和问题文本。
[0269]
步骤804:获取指定语言的测试篇章文本和测试问题文本和初始多语言阅读理解模型。
[0270]
步骤806:将测试篇章文本和测试问题文本输入初始多语言阅读理解模型,获得至少一个第一测试结果。
[0271]
步骤808:将译文篇章文本和译文问题文本输入初始多语言阅读理解模型,并将初始多语言阅读理解模型的输出译为指定语言的第二测试结果,其中,译文篇章文本和译文问题文本为将测试篇章文本和测试问题文本译为参考语言得到。
[0272]
步骤810:分别计算第二测试结果与各第一测试结果之间的测试相似度。
[0273]
步骤812:基于各测试相似度,从至少一个第一测试结果中确定测试篇章文本和测试问题文本的标签信息。
[0274]
步骤814:基于测试篇章文本和测试问题文本的标签信息及第一测试结果,计算损失值。
[0275]
步骤816:根据损失值,对初始多语言阅读理解模型中的模型参数进行微调,获得微调后的多语言阅读理解模型。
[0276]
步骤818:将篇章文本和问题文本输入多语言阅读理解模型,获得篇章文本和问题文本对应的目标阅读理解结果。
[0277]
应用本说明书实施例的方案,通过将获取的初始文本输入多语言处理模型,获得初始文本对应的目标处理结果,多语言处理模型是基于测试文本对初始多语言处理模型进行微调得到的,也即微调后的多语言处理模型的具备对各语言的初始文本进行文本处理的能力,使得生成的初始文本对应的目标处理结果是准确的。
[0278]
与上述图3所示方法实施例相对应,本说明书还提供了文本处理装置实施例,应用于指定语言场景,图9示出了本说明书一个实施例提供的一种文本处理装置的结构示意图。如图9所示,该装置包括:
[0279]
第一获取模块902,被配置为获取指定语言的初始文本和多语言处理模型,其中,多语言处理模型基于参考语言的样本文本训练得到;
[0280]
第一获得模块904,被配置为将初始文本输入多语言处理模型,获得至少一个第一处理结果;
[0281]
第一输入模块906,被配置为将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,其中,目标文本为将初始文本译为参考语言得到;
[0282]
第一确定模块908,被配置为基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。
[0283]
可选地,第一获得模块904,进一步被配置为将初始文本输入多语言处理模型,获得初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从初始文本中截取至少一个第一处理结果。
[0284]
可选地,第一获得模块904,进一步被配置为获取各字符在初始文本中所处的位置;基于各字符在初始文本中所处的位置,从初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果;基于各初始第一处理结果中起始字符的起始
概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的至少一个第一处理结果。
[0285]
可选地,第一确定模块908,进一步被配置为分别计算第二处理结果与各第一处理结果之间的相似度;基于各相似度,从至少一个第一处理结果中确定初始文本对应的目标处理结果。
[0286]
可选地,第一确定模块908,进一步被配置为确定目标第一处理结果和第二处理结果的交集,其中,目标第一处理结果为至少一个第一处理结果中的任一个;计算交集在目标第一处理结果和第二处理结果中出现的第一占比和第二占比;基于第一占比和第二占比,确定目标第一处理结果和第二处理结果之间的相似度。
[0287]
可选地,获取目标第一处理结果中起始字符的起始概率和结尾字符的结尾概率,其中,目标第一处理结果为至少一个第一处理结果中的任一个;根据起始概率、结尾概率以及目标第一处理结果与第二处理结果之间的相似度,确定目标第一处理结果与第二处理结果之间的总相似度;基于各第一处理结果与第二处理结果之间的总相似度,确定目标总相似度对应的第一处理结果为目标处理结果。
[0288]
应用本说明书实施例的方案,获取指定语言的初始文本和多语言处理模型,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。通过将初始文本译为训练多语言处理模型的样本文本相同语言的目标文本,并将目标文本输入多语言处理模型,将获得的输出译为第二处理结果,可以以目标文本经过多语言处理模型并进行翻译得到的第二处理结果为基准,从根据初始文本经过多语言处理模型获得的至少一个第一处理结果中确定一个第一处理结果作为初始文本对应的目标处理结果,使得确定得到的目标处理结果是基于基准的第二处理结果对至少一个第一处理结果进行筛选得到的,保证了确定的目标处理结果的准确性。
[0289]
上述为本实施例的一种文本处理装置的示意性方案。需要说明的是,该文本处理装置的技术方案与上述图3所示的文本处理方法的技术方案属于同一构思,文本处理装置的技术方案未详细描述的细节内容,均可以参见上述图3所示的文本处理方法的技术方案的描述。
[0290]
与上述图4所示方法实施例相对应,本说明书还提供了文本阅读理解装置实施例,应用于指定语言场景,图10示出了本说明书一个实施例提供的一种文本阅读理解装置的结构示意图。如图10所示,该装置包括:
[0291]
第二获取模块1002,被配置为获取指定语言的初始文本和多语言阅读理解模型,其中,初始文本包括篇章文本和问题文本,多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到;
[0292]
第二获得模块1004,被配置为将篇章文本和问题文本输入多语言阅读理解模型,获得至少一个第一阅读理解结果;
[0293]
第二输入模块1006,被配置为将目标篇章文本和目标问题文本输入多语言阅读理解模型,并将多语言阅读理解模型的输出译为指定语言的第二阅读理解结果,其中,目标篇
章文本和目标问题文本为将篇章文本和问题文本译为参考语言得到;
[0294]
第二确定模块1008,被配置为基于第一阅读理解结果和第二阅读理解结果,确定篇章文本和问题文本对应的目标阅读理解结果。
[0295]
应用本说明书实施例的方案,通过将初始文本中的篇章文本和问题文本译为训练多语言阅读理解模型的样本篇章文本和样本问题文本相同语言的目标篇章文本和目标问题文本,并将目标篇章文本和目标问题文本输入多语言阅读理解模型,将获得的输出译为第二阅读理解结果,使得可以根据初始文本中的篇章文本和问题文本经过多语言阅读理解模型获得的第一阅读理解结果和目标篇章文本和目标问题文本经过多语言阅读理解模型并进行翻译得到的第二阅读理解结果,确定初始文本中篇章文本和问题文本对应的目标阅读理解结果,保证了获得的目标阅读理解结果的准确性。
[0296]
上述为本实施例的一种文本阅读理解装置的示意性方案。需要说明的是,该文本阅读理解装置的技术方案与上述图4所示的文本阅读理解方法的技术方案属于同一构思,文本阅读理解装置的技术方案未详细描述的细节内容,均可以参见上述图4所示的文本阅读理解方法的技术方案的描述。
[0297]
与上述图5所示方法实施例相对应,本说明书还提供了文本处理装置实施例,图11示出了本说明书一个实施例提供的另一种文本处理装置的结构示意图。如图11所示,该装置包括:
[0298]
第三获取模块1102,被配置为获取初始文本;
[0299]
处理结果获得模块1104,被配置为将初始文本输入多语言处理模型,获得初始文本对应的目标处理结果,其中,多语言处理模型基于指定语言的测试文本对初始多语言处理模型微调得到,初始多语言处理模型基于参考语言的样本文本训练得到,微调过程中测试文本的标签信息基于第一测试结果和第二测试结果得到,第一测试结果为将测试文本输入初始多语言处理模型得到,第二测试结果为将译文文本输入初始多语言处理模型并将模型输出译为指定语言得到,译文文本为将测试文本译为参考语言得到。
[0300]
可选地,文本处理装置还包括微调模块,被配置为获取指定语言的测试文本和初始多语言处理模型;将测试文本输入初始多语言处理模型,获得至少一个第一测试结果;将译文文本输入初始多语言处理模型,并将初始多语言处理模型的输出译为指定语言的第二测试结果,其中,译文文本为将测试文本译为参考语言得到;基于第一测试结果和第二测试结果,确定测试文本的标签信息;基于测试文本的标签信息及第一测试结果,对初始多语言处理模型进行模型微调,获得微调后的多语言处理模型。
[0301]
可选地,微调模块,进一步被配置为分别计算第二测试结果与各第一测试结果之间的测试相似度;基于各测试相似度,从至少一个第一测试结果中确定测试文本的标签信息。
[0302]
可选地,微调模块,进一步被配置为基于测试文本的标签信息及第一测试结果,计算损失值;根据损失值,对初始多语言处理模型中的模型参数进行微调。
[0303]
应用本说明书实施例的方案,通过将获取的初始文本输入多语言处理模型,获得初始文本对应的目标处理结果,多语言处理模型是基于测试文本对初始多语言处理模型进行微调得到的,也即微调后的多语言处理模型的具备对各语言的初始文本进行文本处理的能力,使得生成的初始文本对应的目标处理结果是准确的。
communication)。
[0312]
在本说明书的一个实施例中,计算设备1300的上述部件以及图13中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图13所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0313]
计算设备1300可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或个人计算机(pc,personal computer)的静止计算设备。计算设备1300还可以是移动式或静止式的服务器。
[0314]
其中,处理器1320用于执行如下计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本处理方法、文本阅读理解方法方法的步骤。
[0315]
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的文本处理方法、文本阅读理解方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述文本处理方法、文本阅读理解方法的技术方案的描述。
[0316]
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现上述文本处理方法、文本阅读理解方法的步骤。
[0317]
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的文本处理方法、文本阅读理解方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述文本处理方法、文本阅读理解方法的技术方案的描述。
[0318]
本说明书一实施例还提供一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述文本处理方法、文本阅读理解方法的步骤。
[0319]
上述为本实施例的一种计算机程序的示意性方案。需要说明的是,该计算机程序的技术方案与上述的文本处理方法、文本阅读理解方法的技术方案属于同一构思,计算机程序的技术方案未详细描述的细节内容,均可以参见上述文本处理方法、文本阅读理解方法的技术方案的描述。
[0320]
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0321]
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内
容可以根据专利实践的要求进行适当的增减,例如在某些地区,根据专利实践,计算机可读介质不包括电载波信号和电信信号。
[0322]
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
[0323]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0324]
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。

技术特征:
1.一种文本处理方法,应用于指定语言场景,所述方法包括:获取指定语言的初始文本和多语言处理模型,其中,所述多语言处理模型基于参考语言的样本文本训练得到;将所述初始文本输入所述多语言处理模型,获得至少一个第一处理结果;将目标文本输入所述多语言处理模型,并将所述多语言处理模型的输出译为所述指定语言的第二处理结果,其中,所述目标文本为将所述初始文本译为所述参考语言得到;基于所述第一处理结果和所述第二处理结果,确定所述初始文本对应的目标处理结果。2.根据权利要求1所述的方法,所述将所述初始文本输入所述多语言处理模型,获得至少一个第一处理结果,包括:将所述初始文本输入所述多语言处理模型,获得所述初始文本中各字符作为第一处理结果中起始字符的起始概率和结尾字符的结尾概率;基于各字符对应的起始概率和结尾概率,从所述初始文本中截取至少一个第一处理结果。3.根据权利要求2所述的方法,所述基于各字符对应的起始概率和结尾概率,从所述初始文本中截取至少一个第一处理结果,包括:获取各字符在初始文本中所处的位置;基于各字符在初始文本中所处的位置,从所述初始文本中截取起始字符的位置位于结尾字符的位置之前的至少一个初始第一处理结果;基于各初始第一处理结果中起始字符的起始概率和结尾字符的结尾概率,从至少一个初始第一处理结果中确定起始概率和结尾概率的乘积满足概率乘积阈值的至少一个第一处理结果。4.根据权利要求1所述的方法,所述基于所述第一处理结果和所述第二处理结果,确定所述初始文本对应的目标处理结果,包括:分别计算所述第二处理结果与各第一处理结果之间的相似度;基于各相似度,从至少一个第一处理结果中确定所述初始文本对应的目标处理结果。5.根据权利要求4所述的方法,所述分别计算所述第二处理结果与各第一处理结果之间的相似度,包括:确定目标第一处理结果和所述第二处理结果的交集,其中,所述目标第一处理结果为至少一个第一处理结果中的任一个;计算所述交集在所述目标第一处理结果和第二处理结果中出现的第一占比和第二占比;基于所述第一占比和所述第二占比,确定目标第一处理结果和第二处理结果之间的相似度。6.根据权利要求4所述的方法,所述基于各相似度,从至少一个第一处理结果中确定所述初始文本对应的目标处理结果,包括:获取目标第一处理结果中起始字符的起始概率和结尾字符的结尾概率,其中,所述目标第一处理结果为至少一个第一处理结果中的任一个;根据所述起始概率、所述结尾概率以及所述目标第一处理结果与所述第二处理结果之
间的相似度,确定所述目标第一处理结果与所述第二处理结果之间的总相似度;基于各第一处理结果与所述第二处理结果之间的总相似度,确定目标总相似度对应的第一处理结果为目标处理结果。7.一种文本阅读理解方法,应用于指定语言场景,所述方法包括:获取指定语言的初始文本和多语言阅读理解模型,其中,所述初始文本包括篇章文本和问题文本,所述多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到;将所述篇章文本和所述问题文本输入所述多语言阅读理解模型,获得至少一个第一阅读理解结果;将目标篇章文本和目标问题文本输入所述多语言阅读理解模型,并将所述多语言阅读理解模型的输出译为所述指定语言的第二阅读理解结果,其中,所述目标篇章文本和所述目标问题文本为将所述篇章文本和问题文本译为所述参考语言得到;基于所述第一阅读理解结果和所述第二阅读理解结果,确定所述篇章文本和所述问题文本对应的目标阅读理解结果。8.一种文本处理方法,包括:获取初始文本;将所述初始文本输入多语言处理模型,获得所述初始文本对应的目标处理结果,其中,所述多语言处理模型基于指定语言的测试文本对初始多语言处理模型微调得到,所述初始多语言处理模型基于参考语言的样本文本训练得到,所述微调过程中所述测试文本的标签信息基于第一测试结果和第二测试结果得到,所述第一测试结果为将所述测试文本输入所述初始多语言处理模型得到,所述第二测试结果为将译文文本输入所述初始多语言处理模型并将模型输出译为所述指定语言得到,所述译文文本为将所述测试文本译为所述参考语言得到。9.根据权利要求8所述的方法,在所述将所述初始文本输入多语言处理模型,获得所述初始文本对应的目标处理结果之前,还包括:获取指定语言的测试文本和初始多语言处理模型;将所述测试文本输入所述初始多语言处理模型,获得至少一个第一测试结果;将译文文本输入所述初始多语言处理模型,并将所述初始多语言处理模型的输出译为所述指定语言的第二测试结果,其中,所述译文文本为将所述测试文本译为所述参考语言得到;基于所述第一测试结果和所述第二测试结果,确定所述测试文本的标签信息;基于所述测试文本的标签信息及所述第一测试结果,对所述初始多语言处理模型进行模型微调,获得微调后的多语言处理模型。10.根据权利要求9所述的方法,所述基于所述第一测试结果和所述第二测试结果,确定所述测试文本的标签信息,包括:分别计算所述第二测试结果与各第一测试结果之间的测试相似度;基于各测试相似度,从所述至少一个第一测试结果中确定所述测试文本的标签信息。11.根据权利要求9所述的方法,所述基于所述测试文本的标签信息及所述第一测试结果,对所述初始多语言处理模型进行模型微调,包括:
基于所述测试文本的标签信息及所述第一测试结果,计算损失值;根据所述损失值,对所述初始多语言处理模型中的模型参数进行微调。12.一种文本阅读理解方法,包括:获取初始文本,其中,所述初始文本包括篇章文本和问题文本;将所述篇章文本和问题文本输入多语言阅读理解模型,获得所述篇章文本和问题文本对应的目标阅读理解结果;其中,所述多语言阅读理解模型基于指定语言的测试篇章文本和测试问题文本对初始多语言阅读理解模型微调得到,所述初始多语言阅读理解模型基于参考语言的样本篇章文本和样本问题文本训练得到,所述微调过程中所述测试篇章文本和所述测试问题文本的标签信息基于第一测试结果和第二测试结果得到,所述第一测试结果为将所述测试篇章文本和测试问题文本输入所述初始多语言阅读理解模型得到,所述第二测试结果为将译文篇章文本和译文问题文本输入所述初始多语言阅读理解模型并将模型输出译为所述指定语言得到,所述译文篇章文本和译文问题文本为将所述测试篇章文本和所述测试问题文本译为所述参考语言得到。13.一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。14.一种计算机可读存储介质,其存储有计算机可执行指令,该计算机可执行指令被处理器执行时实现权利要求1至12任意一项所述方法的步骤。

技术总结
本说明书实施例提供文本处理方法、文本阅读理解方法,其中文本处理方法,应用于指定语言场景,包括获取指定语言的初始文本和多语言处理模型,多语言处理模型基于参考语言的样本文本训练得到;将初始文本输入多语言处理模型,获得至少一个第一处理结果;将目标文本输入多语言处理模型,并将多语言处理模型的输出译为指定语言的第二处理结果,目标文本为将初始文本译为参考语言得到;基于第一处理结果和第二处理结果,确定初始文本对应的目标处理结果。通过将初始文本译为目标文本输入多语言处理模型,将获得的输出译为第二处理结果,使得可以根据第一处理结果和第二处理结果,确定初始文本对应的目标处理结果,保证了获得的目标处理结果的准确性。处理结果的准确性。处理结果的准确性。


技术研发人员:谭传奇 张珍茹 黄松芳
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:2023.06.09
技术公布日:2023/10/7
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐