事件处理方法、装置及设备、存储介质与流程

未命名 10-19 阅读:109 评论:0


1.本公开涉及但不限于信息技术领域,尤其涉及一种事件处理方法、装置及设备、存储介质。


背景技术:

2.随着信息技术的发展,人们在日常生活和工作中可以方便地获取到各种事件信息。在一些场景下,可以通过提取事件之间的顺承关系,来对多个事件进行排序,以便于更好地满足用户对事件的分析或查看等需求。但是,相关技术中事件之间的顺承关系通常是由人工提取的,需要耗费大量的人力,并且提取的顺承关系准确性不够高,导致事件的排序不够准确。


技术实现要素:

3.有鉴于此,本公开实施例至少提供一种事件处理方法、装置及设备、存储介质,能够对从文本语料中抽取的事件自动进行排序、减少对人工的依赖,并能提高事件排序的准确性。
4.本公开实施例的技术方案是这样实现的:
5.本公开实施例提供一种事件处理方法,所述方法包括:
6.获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;
7.针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成;
8.基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
9.本公开实施例提供一种事件处理装置,所述装置包括:
10.第一获取模块,用于获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;
11.第一分类模块,用于针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成;
12.排序模块,用于基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
13.本公开实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
14.本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。
15.本公开实施例中,首先获取通过对文本语料进行事件抽取得到的事件列表;然后针对至少一个事件对,对该事件对进行顺承关系分类,得到该事件对中两个事件之间的顺承关系类别,其中,事件对由事件列表中两个不同的事件构成;最后基于该至少一个事件对分别对应的顺承关系类别,对该事件列表中的各事件进行排序,得到排序后的事件列表。这样,一方面可以对从文本语料中抽取的事件自动进行排序,减少对人工的依赖;另一方面通过对事件列表中至少一个事件对分别进行顺承关系分类,并根据每一事件对对应的顺承关系类别,对事件列表中的各事件进行排序,可以提高排序的准确性。
16.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开的技术方案。
附图说明
17.此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
18.图1a为本公开实施例提供的一种事件处理方法的实现流程示意图;
19.图1b为本公开实施例提供的一种事件抽取模型的组成结构示意图;
20.图2为本公开实施例提供的一种事件处理方法的实现流程示意图;
21.图3为本公开实施例提供的一种事件处理方法的实现流程示意图;
22.图4为本公开实施例提供的一种事件处理方法的实现流程示意图;
23.图5a为本公开实施例提供的一种出行路线的生成方法的实现流程示意图;
24.图5b为本公开实施例提供的一种图数据库中存储的出行路线的示意图;
25.图6为本公开实施例提供的一种事件处理装置的组成结构示意图;
26.图7为本公开实施例提供的一种计算机设备的硬件实体示意图。
具体实施方式
27.为了使本公开的目的、技术方案和优点更加清楚,下面结合附图和实施例对本公开的技术方案进一步详细阐述,所描述的实施例不应视为对本公开的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本公开保护的范围。
28.在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
29.所涉及的术语“第一/第二/第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一/第二/第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本公开实施例能够以除了在这里图示或描述的以外的顺序实施。
30.除非另有定义,本文所使用的所有的技术和科学术语与属于本公开的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本公开的目的,不是旨在限制本公开。
31.相关技术中,事件之间的顺承关系可以是由人工提取的,这种方案需要耗费大量人力,并且由于人工提取的事件之间的顺承关系的准确性依赖提取者的经验以及提取过程
中的专注度,容易出现经验不足或失误导致的错误,影响事件排序的准确性。
32.有鉴于此,本公开实施例提供一种事件处理方法,该方法可以由计算机设备的处理器执行。其中,计算机设备指的可以是服务器、笔记本电脑、平板电脑、台式计算机、智能电视、机顶盒、移动设备(例如移动电话、便携式视频播放器、个人数字助理、专用消息设备、便携式游戏设备)等具备数据处理能力的设备。图1a为本公开实施例提供的一种事件处理方法的实现流程示意图,如图1a所示,该方法可以包括如下步骤s101至步骤s103:
33.步骤s101,获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件。
34.这里,文本语料可以是任意合适的文本数据。在实施时,文本语料可以包括但不限于游记、旅游攻略、乘车指南、日程安排信息、工作计划、课程信息等中的至少之一。
35.在一些实施方式中,文本语料可以是包含出行信息的文本数据。
36.在一些实施方式中,文本语料可以是从社交平台、旅行网站、备忘录和/或行程表等中获取的。从社交平台、旅行网站、备忘录和/或行程表等中获取文本语料的方式可以包括但不限于通过数据接口读取、通过网络爬虫工具进行抓取等中的至少之一。
37.在一些实施方式中,文本语料还可以是从杂志、报纸、书籍和/或纸质行程单等中扫描获取的。
38.在实施时,文本语料可以是预先获取后存储在数据库、磁盘、内存等存储空间中的,处理器可以从存储空间中读取该文本语料;文本语料也可以是实时获取的,本公开实施例对此并不限定。
39.对于事件列表的抽取,可以采用任意合适的事件抽取方法,从文本语料中抽取至少一个事件,以得到该事件列表。
40.在一些实施方式中,可以采用模板匹配的方式,从文本语料中抽取与预设模板匹配的至少一个事件。
41.在一些实施方式中,可以采用预先训练好的事件抽取模型,从文本语料中抽取至少一个事件。其中,事件抽取模型可以是利用已标注的样本语料进行训练得到的。
42.在一些实施方式中,在获取事件列表之前,该方法还可以包括:基于已标注的样本语料,对初始的事件抽取模型进行训练,得到训练后的事件抽取模型。
43.在一些实施方式中,已标注的样本语料包括第一样本语料,所述基于已标注的样本语料,对初始的事件抽取模型进行训练,得到训练后的事件抽取模型可以包括:基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到第一阶段训练后的事件抽取模型;利用第一阶段训练后的事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件;基于抽取出的第一样本事件,对第二样本语料进行标注,得到标注后的第二样本语料;基于标注后的第二样本语料,对第一阶段训练后的事件抽取模型进行第二阶段训练,得到第二阶段训练后的事件抽取模型。在实施时,事件抽取模型的输入可以包括文本语料,也可以同时包括文本语料以及用于对事件抽取进行提示的提示信息,本公开实施例对此并不限定。其中,提示信息可以包括但不限于事件类别、事件触发词等中的至少之一。
44.在实施时,抽取的事件可以具有任意合适的数据结构,本公开实施例对此并不限定。
45.在一些实施方式中,可以用谓词性短语表示事件。例如,可以用谓词性短语“去公
园”、“坐火车”等分别表示不同的事件。
46.在一些实施方式中,可以用由事件类别、事件触发词和事件主题构成的三元组《事件类别,事件触发词,事件主题》表示事件。例如,可以用三元组{"事件类别":"出发","事件触发词":"出发前往","事件主题":"城市a"}表示“去城市a”这一事件。其中,事件类别可以是根据实际业务场景对事件划分的类别。在一些实施方式中,可以预先将事件划分为如下8个类别:出发、返回、出行方式、预订或购买(包括车票、机票、船票、住所、景区门票等)、吃饭、游玩、娱乐项目、购物。事件触发词为表示事件发生的核心词,可以为动词或名词。在一些实施方式中,事件触发词可以包括但不限于事件类别的上位、下位概念及同义、近义词或词组等中的至少之一。事件主题为事件开展所围绕的主题。比如,对于出行方式类别的事件,所围绕的主题通常是出行采用的交通工具,因此,该事件的事件主题可以包括至少一种交通工具;对于游玩类别的事件,所围绕的主题通常是游玩的景区,因此,该事件的事件主题可以包括至少一种景区。
47.步骤s102,针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成。
48.这里,顺承关系指的是连续发生的事情或动作之间的关系,这些事情或动作有先后顺序。
49.在一些实施方式中,顺承关系类别可以包括但不限于向前顺承、向后顺承等中的至少之一。向前顺承指的是通过“在这之前”、“去之前”等向前顺承词连接的两个事件之间的顺承关系所属的类别。向后顺承指的是通过“接下来”、“然后”、“其次”、“接着”、“首先”、“第一天”、“day1”等向后顺承词连接的两个事件之间的顺承关系。
50.在一些实施方式中,可以从事件列表中选取任意两个不同的事件作为一个事件对,并对该事件对之间的顺承关系进行分类,得到该事件对之间的顺承关系类别。在实施时,可以采用任意合适的分类方式对事件对之间的顺承关系进行分类,本公开实施例对此并不限定。例如,可以通过预先设定的至少一个事件对与顺承关系类别之间的对应关系,确定与待分类的事件对匹配的顺承关系类别。又如,可以采用预先训练的分类模型,对事件对之间的顺承关系进行分类,得到该事件对之间的顺承关系类别。再如,可以获取文本语料中位于事件对中两个事件分别对应的事件触发词之间的文本段,根据该文本段中包含的顺承词,确定该事件对之间的顺承关系类别。
51.步骤s103,基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
52.这里,由于顺承关系类别可以区分具有顺承关系的两个事件之间的先后顺序,因此可以根据至少一个事件对中每一事件对之间的顺承关系类别,确定事件列表中各事件之间的前后顺序,从而可以根据各事件之间的前后顺序,对事件列表中的各事件进行排序。
53.在一些实施方式中,可以确定事件列表中每两个事件构成的事件对之间的顺承关系类别,从而根据事件列表中每两个事件构成的事件对之间的顺承关系类别,可以确定事件列表中各事件之间的先后顺序。
54.在一些实施方式中,可以确定事件列表中部分事件对之间的顺承关系类别,并根据该部分事件对之间的顺承关系类别,推导出事件列表中各事件之间的前后顺序。
55.例如,在事件列表中包括事件1、事件2和事件3的情况下,可以先确定事件1与事件
2之间的顺承关系类别、以及事件2与事件3之间的顺承关系类别。在事件1与事件2之间的顺承关系类别表征事件1位于事件2之前、且事件2与事件3之间的顺承关系类别表征事件2位于事件3之前的情况下,可以确定事件1、事件2和事件3的顺序是由前往后发生的,此时,可以不用再确定事件1与事件3之间的顺承关系类别。而在事件1与事件2之间的顺承关系类别表征事件1位于事件2之前、且事件2与事件3之间的顺承关系类别表征事件2位于事件3之后的情况下,还需要再确定事件1与事件3之间的顺承关系类别,并结合事件1与事件3之间的顺承关系类别,才能确定事件1、事件2和事件3之间的先后顺序。
56.本公开实施例中,首先获取通过对文本语料进行事件抽取得到的事件列表;然后针对至少一个事件对,对该事件对进行顺承关系分类,得到该事件对中两个事件之间的顺承关系类别,其中,事件对由事件列表中两个不同的事件构成;最后基于该至少一个事件对分别对应的顺承关系类别,对该事件列表中的各事件进行排序,得到排序后的事件列表。这样,一方面可以对从文本语料中抽取的事件自动进行排序,减少对人工的依赖;另一方面通过对事件列表中至少一个事件对分别进行顺承关系分类,并根据每一事件对对应的顺承关系类别,对事件列表中的各事件进行排序,可以提高排序的准确性。
57.在一些实施例中,上述步骤s101可以包括:步骤s101a,获取包含文本语料;步骤s101b,对所述文本语料进行事件抽取,得到事件列表。
58.在一些实施例中,上述步骤s101b可以包括如下步骤s111至步骤s112:
59.步骤s111,对所述文本语料进行长句切分,得到至少一个长句。
60.步骤s112,对每一所述长句进行事件抽取,得到所述事件列表。
61.这里,长句是指结构复杂、词语较多的句子。文本语料可以包括至少一个长句。在文本语料中,长句通常以“?”、“?”、“!”、“!”、“。”、“\n”、“\r”、
“…”
、“.”、“·”等符号结尾,因而可以通过设定的至少一个符号对文本语料进行切分,得到至少一个长句。
62.在一些实施方式中,可以利用预设的匹配模板(如正则匹配式“[??!!。\n\r

.
·
]”),对文本语料进行匹配,以匹配的符号作为分隔符,将文本语料切分至少一个长句。例如,可以将文本语料“青春不是画笔,是颜料,随意挥洒,潇洒肆意,自成一幅画。不负青春所以来一场y城之旅,在湖畔看看我们的海鸥,游古城,乘坐游船,看理想邦,看雪山,游古镇。天气晴朗适合出游。”且分为长句“青春不是画笔,是颜料,随意挥洒,潇洒肆意,自成一幅画”、“不负青春所以来一场y城之旅,在湖畔看看我们的海鸥,游古城,乘坐游船,看理想邦,看雪山,游古镇”和“天气晴朗适合出游”。
[0063]
在一些实施方式中,针对每一长句,可以采用模板匹配的方式,从该长句中抽取与预设模板匹配的至少一个事件。
[0064]
在一些实施方式中,可以采用预先训练好的事件抽取模型,从每一长句中抽取至少一个事件。其中,该事件抽取模型可以是利用已标注的样本长句进行训练得到的。
[0065]
上述实施例中,通过将文本语料切分为至少一个长句,并分别对每一长句进行事件抽取,可以简化事件抽取的复杂度,并提高事件抽取的准确性。
[0066]
在一些实施例中,所述事件列表中包括至少一个表征行为的第一事件;上述步骤s101可以包括如下步骤s121至步骤s122:
[0067]
步骤s121,针对设定的事件类别集中的每一事件类别,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件。
[0068]
步骤s122,基于每一所述第一事件,确定所述事件列表。
[0069]
这里,第一事件可以为表征行为的事件,例如,写作业、看书、开会、出发去某地、游玩某景区、或者乘坐某交通工具等等。在一些实施方式中,在文本语料包含出行信息的情况下,第一事件可以为表征出行行为的事件,例如,出发去某地、游玩某景区、或者乘坐某交通工具等等。
[0070]
事件类别集中可以包括预先设定的多个事件类别。例如,事件类别集中可以包括出发、返回、出行方式、预订或购买、吃饭、游玩、娱乐项目、购物等中的至少之一。
[0071]
在一些实施方式中,可以预先设定至少一种事件类别与至少一个事件触发词之间的对应关系,针对事件类别集中的每一事件类别,可以确定与该事件类别对应的事件触发词,并在该文本语料中包含该事件触发词的情况下,基于该事件触发词,从文本语料中提取与该事件触发词对应的事件主题,从而根据该事件类别、该事件触发词和该事件主题确定一个第一事件。
[0072]
可以理解的是,在一些实施方式中,可以在将文本语料切分为多个长句后,针对每一事件类别,从每一长句中分别抽取与该事件类别对应的第一事件。
[0073]
上述实施例中,针对设定的事件类别集中的每一事件类别,从文本语料中抽取出与该事件类别对应的至少一个第一事件,基于每一第一事件,确定事件列表。这样,根据预先设定的事件类别,可以更加快捷准确地从文本语料中抽取第一事件,从而可以进一步提高事件排序的准确性和效率。
[0074]
在一些实施例中,步骤s121中所述的从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件,可以包括如下步骤s131至步骤s132:
[0075]
步骤s131,以所述事件类别作为提示信息,从所述文本语料中抽取与所述事件类别对应的事件触发词和事件主题。
[0076]
步骤s132,基于所述事件类别、所述事件触发词和所述事件主题,确定与所述事件类别对应的第一事件。
[0077]
这里,可以采用任意合适的事件抽取模型,以事件类别作为提示信息,从文本语料中抽取与该事件类别对应的事件触发词和事件主题。
[0078]
在实施时,事件抽取模型的输入可以是事件类别和文本语料。在一些实施方式中,该事件抽取模型可以是采用提示学习的方式预先训练的。
[0079]
上述实施例中,以事件类别作为提示信息,可以快捷准确地从文本语料中抽取与该事件类别对应的事件触发词和事件主题,从而可以基于事件类别、事件触发词和事件主题,确定更加准确的第一事件,进而可以进一步提高事件排序的准确性和效率。
[0080]
在一些实施例中,在步骤s121之前,所述方法还包括:
[0081]
步骤s141,基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到所述第一阶段训练后的所述事件抽取模型。
[0082]
这里,事件抽取模型可以是任意合适的自然语言模型,本公开实施例对此并不限定。例如,事件抽取模型可以包括但不限于基于转换器的双向编码(bidirectional encoder representation from transformers,bert)网络、指针网络(pointer network,ptr-nets)等中的至少之一。
[0083]
第一样本语料可以具有预先标注的事件标签,且该第一样本语料中包括作为提示
信息的事件类别样本。在实施时,本领域技术人员可以根据实际情况采用任意合适的标注方式为第一样本语料标注事件标签,例如,可以采用人工标注的方式,也可以基于预先配置的模板对第一样本语料进行标注,还可以采用开源的打标工具对第一样本语料进行标注。
[0084]
例如,在事件具有事件类别、事件触发词和事件主题的情况下,第一样本语料可以为:{"id":"0","cont":"下午集合出发前往k市,首先去了历史名山西山森林公园,西山位于滇池湖畔,远看似一位纤纤美女卧于湖面,所以也叫睡美人山","events":[{"事件类别":"出发","事件触发词":"出发前往","事件主题":"昆明"},{"事件类别":"景区游玩","事件触发词":"去了","事件主题":"西山森林公园"}]。其中,id为第一样本语料的标识,cont为待进行事件抽取的文本,events为标注的事件标签集合。
[0085]
在一些实施方式中,可以采用提示学习的方式对事件抽取模型进行训练。在实施时,可以将第一样本语料的一个事件标签中的事件类别作为提示信息,将该提示信息与第一样本语料中待进行事件抽取的文本共同输入事件抽取模型,事件抽取模型可以基于提示信息,从待进行事件抽取的文本中抽取事件触发词和事件主题,利用抽取的事件触发词和事件主题、与该事件标签中的事件触发词和事件主题之间的损失,对该事件抽取模型的模型参数进行更新,如此,利用至少一个第一样本语料对事件抽取模型的模型参数进行至少一次更新,直至事件抽取模型的输出结果稳定或者更新次数达到设定的次数阈值为止,训练结束。训练结束后的事件抽取模型即为第一阶段训练后的事件抽取模型。可以理解的是,在利用事件抽取模型进行事件抽取的过程中,事件类别作为提示信息,从而可以实现对事件抽取模型的提示学习,进而可以充分利用第一样本语料中的事件标签数据,以使得可以利用较少的训练数据对事件抽取模型进行低资源的训练。
[0086]
在一些实施方式中,事件抽取模型为bert+ptr-nets,事件抽取模型的输入可以为:[cls]事件类别[sep]待进行事件抽取的文本[sep]。
[0087]
图1b为本公开实施例提供的一种事件抽取模型的组成结构示意图,如图1b所示,该事件抽取模型包括bert网络11和ptr-nets网络12,该事件抽取模型的输入为文本“[cls]出发[sep]下午集合出发前往k市,首先去了历史名山西山森林公园,西山位于滇池湖畔,远看似一位纤纤美女卧于湖面,所以也叫睡美人山[sep]”,其中,“出发”为作为提示信息的事件类别,“下午集合出发前往k市,首先去了历史名山西山森林公园,西山位于滇池湖畔,远看似一位纤纤美女卧于湖面,所以也叫睡美人山”为待进行事件抽取的文本,利用bert网络11和ptr-nets网络12依次对该输入的文本进行处理,可以得到抽取的事件触发词对应的词嵌入e1,以及事件主题对应的词嵌入e2;根据词嵌入e1和词嵌入e2,可以分别得到抽取的事件触发词和事件主题。
[0088]
步骤s142,利用所述第一阶段训练后的所述事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件。
[0089]
这里,可以针对预先设定的事件类别集中的每一事件类别,利用第一阶段训练后的事件抽取模型,以该事件类别作为提示信息,从未标注的第二样本语料中抽取出与该事件类别对应的第一样本事件。
[0090]
步骤s143,基于抽取出的所述第一样本事件,对所述第二样本语料进行标注,得到标注后的所述第二样本语料。
[0091]
这里,在一些实施方式中,可以直接将抽取出的第一样本事件标注为该第二样本
语料的一个事件标签。
[0092]
在一些实施方式中,抽取出的第一样本事件具有第一置信度,可以在第一置信度大于设定的第一置信度阈值的情况下,将该第一样本事件标注为该第二样本语料的一个事件标签。
[0093]
步骤s144,基于标注后的所述第二样本语料,对第一阶段训练后的所述事件抽取模型进行第二阶段训练,得到第二阶段训练后的所述事件抽取模型。
[0094]
这里,步骤s144对应于前述步骤s141,在实施时可以参照前述步骤s141的实施方式。
[0095]
上述步骤s121中所述的从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件,可以包括如下步骤s145:
[0096]
步骤s145,利用第二阶段训练后的所述事件抽取模型,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件。
[0097]
上述实施例中,基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到第一阶段训练后的事件抽取模型;利用第一阶段训练后的事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件;基于抽取出的第一样本事件,对第二样本语料进行标注,得到标注后的第二样本语料;基于标注后的述第二样本语料,对第一阶段训练后的事件抽取模型进行第二阶段训练,得到第二阶段训练后的事件抽取模型。这样,由于对事件抽取模型进行第二阶段训练的过程中,采用的第二样本语料是基于第一阶段训练后的事件抽取模型抽取的第一样本事件进行标注得到的,从而可以降低对预先标注的第一样本语料的数量需求,进而减少对人工的依赖。
[0098]
在一些实施例中,所述事件列表中还包括至少一个表征时间实体的第二事件;上述步骤s101还可以包括如下步骤s151至步骤s152:
[0099]
步骤s151,从所述文本语料中抽取至少一个时间实体。
[0100]
步骤s152,针对每一所述时间实体,生成对应于所述时间实体的第二事件。
[0101]
这里,时间实体可以用于表征一个特定的时间。例如,时间实体可以是第一天、3月1日、或星期四等。
[0102]
时间实体可以作为顺承词用于进行顺承关系的识别。由于时间实体的特征通常都比较明显,因此,在一些实施方式中,可以采用模板匹配的方式,从文本语料中抽取时间实体。
[0103]
在一些实施方式中,可以采用预先训练的时间实体抽取模型,从所述文本语料中抽取至少一个时间实体。这里的时间实体抽取模型可以是任意合适的自然语言处理模型。
[0104]
对于抽取的每一时间实体,可以将该时间实体看成一个事件,并生成一个表征该时间实体的第二事件。在一些实施方式中,可以根据第一事件的格式,对时间实体进行封装,得到与第一事件的格式一致的第二事件。例如,在第一事件具有事件类别、事件触发词和事件主题的情况下,第二事件也可以具有事件类别、事件触发词和事件主题,可以将第二事件中的事件类别、事件触发词和事件主题的取值均设置为该时间实体,以得到表征该时间实体的第二事件。
[0105]
上述步骤s122可以包括如下步骤s153:
[0106]
步骤s153,基于每一所述第一事件、以及每一所述时间实体分别对应的第二事件,
确定所述事件列表。
[0107]
上述实施例中,从文本语料中抽取至少一个时间实体;针对每一时间实体,生成对应于该时间实体的第二事件;基于每一第一事件、以及每一时间实体分别对应的第二事件,确定事件列表。这样,由于时间实体可以作为顺承词用于进行顺承关系的识别,因此,在事件列表中增加表征时间实体的第二事件,可以进一步提升顺承关系分类的准确性,进而可以进一步提升事件排序的准确性。
[0108]
在一些实施例中,上述步骤s151可以包括如下步骤s161:
[0109]
步骤s161,按照设定的时间模板,对所述文本语料进行多模式串匹配处理,得到至少一个与所述时间模板匹配的时间实体。
[0110]
这里,时间模板可以是本领域技术人员根据实际业务需求预先设定的。多模式串匹配可以包括但不限于ac自动机(aho-corasick automaton)匹配、散列函数匹配等中的至少之一。
[0111]
例如,可以预先设定至少一种时间模板,并利用预先设定的时间模板,采用ac自动机匹配的方式,从文本语料中抽取至少一个与时间模板匹配的时间实体。其中,时间模板可以包括但不限于以下至少之一:day x、dx、x月x日、20xx年x月x日、20xx/xx/xx。
[0112]
上述实施例中,按照设定的时间模板,对文本语料进行多模式串匹配处理,可以快速准确地从文本语料中抽取出至少一个与时间模板匹配的时间实体。
[0113]
本公开实施例提供一种事件处理方法,该方法可以由计算机设备的处理器执行。图2为本公开实施例提供的一种事件处理方法的实现流程示意图,如图2所示,该方法可以包括如下步骤s201至步骤s204:
[0114]
步骤s201,获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件。
[0115]
步骤s202,针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成。
[0116]
这里,上述步骤s201至步骤s202分别对应于前述实施例中的步骤s101至步骤s102,在实施时,可以参照前述步骤s101至步骤s102的实施方式。
[0117]
步骤s203,针对所述至少一个事件对中的每一事件对,基于所述事件对对应的顺承关系类别,确定所述事件对中的第三事件与第四事件之间的顺序。
[0118]
这里,由于顺承关系类别可以区分具有顺承关系的两个事件之间的先后顺序,因此可以根据事件对中第三事件与第四事件之间的顺承关系类别,确定第三事件与第四事件之间的先后顺序。
[0119]
步骤s204,基于每一事件对中第三事件和第四事件之间的顺序,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
[0120]
在一些实施方式中,可以确定事件列表中每两个事件之间的顺承关系类别,从而根据事件列表中每两个事件之间的顺承关系类别,可以确定事件列表中各事件之间的先后顺序,进而可以根据事件列表中各事件之间的先后顺序对事件列表中的各事件进行排序。
[0121]
在一些实施方式中,可以确定事件列表中部分事件对分别对应的顺承关系类别,并根据该部分事件对分别对应的顺承关系类别,推导出事件列表中各事件之间的前后顺序,进而可以根据事件列表中各事件之间的先后顺序对事件列表中的各事件进行排序。
[0122]
本公开实施例中,针对至少一个事件对中的每一事件对,基于该事件对对应的顺承关系类别,确定该事件对中的第三事件与第四事件之间的顺序;基于每一事件对中第三事件和第四事件之间的顺序,对该事件列表中的各事件进行排序,得到排序后的事件列表。这样,可以基于pair-wise思想,简单快速地得到排序后的事件列表。
[0123]
在一些实施例中,每一事件对对应的顺承关系类别包括向前顺承或向后顺承;上述步骤s203中所述的基于所述事件对之间的顺承关系类别,确定所述事件对中的第三事件与第四事件之间的顺序,可以包括以下步骤s211或步骤s212:
[0124]
步骤s211,在所述事件对中的第三事件与第四事件之间的顺承关系类别为向前顺承的情况下,确定所述第三事件位于所述第四事件之后。
[0125]
步骤s212,在所述事件对中的第三事件与第四事件之间的顺承关系类别为向后顺承的情况下,确定所述第三事件位于所述第四事件之前。
[0126]
上述实施例中,每一事件对对应的顺承关系类别包括向前顺承或向后顺承,这样,基于事件对对应的顺承关系,可以简单快速地确定事件对中第三事件与第四事件之间的先后顺序。
[0127]
本公开实施例提供一种事件处理方法,该方法可以由计算机设备的处理器执行。图3为本公开实施例提供的一种事件处理方法的实现流程示意图,如图3所示,该方法可以包括如下步骤s301至步骤s303:
[0128]
步骤s301,获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件。
[0129]
这里,上述步骤s301对应于前述实施例中的步骤s101,在实施时,可以参照前述步骤s101的实施方式。
[0130]
步骤s302,针对至少一个事件对,基于所述事件对中的第三事件和第四事件分别对应的第一事件触发词和第二事件触发词,确定所述文本语料中位于所述第一事件触发词和所述第二事件触发词之间的文本段,并基于所述文本段,确定所述事件对之间的顺承关系类别。
[0131]
其中,每一事件对由事件列表中两个不同的事件构成。
[0132]
对于每一事件对,该事件对中的两个事件分别为第三事件和第四事件。每一事件具有相应的事件触发词。可以根据事件对中第三事件对应的第一事件触发词和第四事件对应的第二事件触发词,从文本语料中确定位于该第一事件触发词与该第二事件触发词之间的文本段。
[0133]
在一些实施方式中,可以采用设定的顺承词模板,对事件对对应的文本段中的顺承词进行识别,得到识别结果;根据该识别结果,可以确定该事件对之间的顺承关系类别。例如,在识别到文本段中包括至少一个顺承词的情况下,可以根据该至少一个顺承词,确定该事件对之间的顺承关系类别为向前顺承或向后顺承。又如,在文本段中未识别到顺承词的情况下,可以将该事件对之间的顺承关系设置为空。
[0134]
在一些实施方式中,可以采用预先训练好的分类模型,基于文本段,对该文本段对应的事件对之间的顺承关系进行分类,得到该事件对之间的顺承关系类别。
[0135]
步骤s303,基于所述至少一个事件对中每一事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
[0136]
这里,上述步骤s303对应于前述实施例中的步骤s103,在实施时,可以参照前述步骤s103的实施方式。
[0137]
本公开实施例中,基于事件对中的第三事件和第四事件分别对应的第一事件触发词和第二事件触发词,确定文本语料中位于第一事件触发词和第二事件触发词之间的文本段,并基于该文本段,确定该事件对之间的顺承关系类别。这样,可以快速准确地确定事件对之间的顺承关系类别。
[0138]
在一些实施例中,在上述步骤s302之前,所述方法还包括如下步骤s311至步骤s313:
[0139]
步骤s311,从所述事件列表中确定至少一个第一样本事件对。
[0140]
这里,第一样本事件对可以是根据实际情况从事件列表中选取的。
[0141]
例如,可以将事件列表中的每一对事件均确定为第一样本事件对,也可以从事件列表中随机选取至少一对事件作为第一样本事件对。
[0142]
步骤s312,针对每一所述第一样本事件对,基于所述第一样本事件对中的第一样本事件和第二样本事件分别对应的第三事件触发词和第四事件触发词,确定所述文本语料中位于所述第三事件触发词和所述第四事件触发词之间的文本段,并基于所述文本段和设定的顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签。
[0143]
这里,可以根据第一样本事件对中第一样本事件对应的第三事件触发词和第二样本事件对应的第四事件触发词,从文本语料中确定位于该第三事件触发词与该第四事件触发词之间的文本段。
[0144]
在一些实施方式中,可以采用预设的顺承词模板,对第一样本事件对对应的文本段中的顺承词进行识别,得到识别结果;根据该识别结果,可以确定该第一样本事件对之间的顺承关系类别。例如,在识别到文本段中包括至少一个顺承词的情况下,可以根据该至少一个顺承词,确定该第一样本事件对之间的顺承关系类别为向前顺承或向后顺承。又如,在文本段中未识别到顺承词的情况下,可以将该第一样本事件对之间的顺承关系设置为空。
[0145]
步骤s313,基于每一所述第一样本事件对分别对应的文本段以及每一所述第一样本事件对分别对应的顺承关系类别标签,对初始的分类模型进行第一阶段训练,得到第一阶段训练后的所述分类模型。
[0146]
这里,分类模型可以用于基于对文本段,对该文本段对应的第一样本事件对之间的顺承关系进行分类,得到预测的顺承关系类别,根据预测的顺承关系类别与该第一样本事件对对应的顺承关系类别标签之间的损失值,可以对分类模型的模型参数进行更新,如此,利用至少一个第一样本事件分别对应的文本段以及每一第一样本事件对分别对应的顺承关系类别标签,可以对分类模型的模型参数进行至少一次更新,直至分类模型的输出结果稳定或者更新次数达到设定的次数阈值为止,训练结束。训练结束后的分类模型即为第一阶段训练后的分类模型。
[0147]
分类模型的模型结构可以根据实际情况确定,本公开实施例对此并不限定。在对分类模型进行第一阶段训练的过程中,可以采用任意合适的损失函数。
[0148]
在一些实施方式中,分类模型可以包括用于多文本段进行特征提取的特征提取网络、以及用于将提取的特征映射至顺承关系类别的预测网络。例如,特征提取网络可以采用但不限于bert网络等;预测网络可以包括但不限于全连接网络、softmax网络等中的至少之
一。
[0149]
由于与向前顺承这一顺承关系类别对应的第一样本事件对通常较少,因此,在一些实施方式中,还可以针对顺承关系类别为向前顺承的第一样本事件对,基于该第一样本事件对对应的文本段,生成至少一个与该文本段相似的相似文本段,并将该第一样本事件对应的顺承关系类别标签作为生成的每一相似文本段对应的顺承关系类别标签,从而可以将生成的每一相似文本段作为新增的训练样本,用于与从文本语料中确定的文本段共同对分类模型进行该第一阶段的训练。这样,可以增加训练样本中与向前顺承这一顺承关系类别对应的样本数据的数量,从而可以改善样本类别不平衡的问题。在实施时,可以采用任意合适的方式生成相似文本段。例如,可以采用统一的文本到文本转换器(transfer text-to-text transformer,t5)复述模型生成至少一个相似文本段。
[0150]
在一些实施方式中,模型训练过程中采样的损失函数可以包括交点损失(focal loss)函数,这样,由于与向前顺承这一顺承关系类别对应的第一样本事件对通常较少,而对交点损失函数可以使容易分类的样本权重降低,而对难分类的样本权重增加,从而可以进一步改善样本类别不平衡的问题。
[0151]
上述步骤s302中所述的基于所述文本段,确定所述事件对之间的顺承关系类别,可以包括如下步骤s321:
[0152]
步骤s321,利用所述分类模型,基于所述文本段,确定所述事件对之间的顺承关系类别。
[0153]
上述实施例中,从事件列表中确定至少一个第一样本事件对;针对每一第一样本事件对,基于第一样本事件对中的第一样本事件和第二样本事件分别对应的第三事件触发词和第四事件触发词,确定文本语料中位于第三事件触发词和第四事件触发词之间的文本段,并基于文本段和设定的顺承词模板,确定第一样本事件对之间的顺承关系类别标签;基于每一第一样本事件对分别对应的文本段以及每一第一样本事件对分别对应的顺承关系类别标签,对初始的分类模型进行第一阶段训练,得到第一阶段训练后的分类模型。这样,由于对分类模型进行训练的过程中采用的第一样本事件对应的顺承关系类别标签是基于文本段和设定的顺承词模板确定的,不需要进行人工标注,从而可以减少对人工的依赖。
[0154]
在一些实施例中,在上述步骤s321之前,所述方法还包括如下步骤s331至步骤s333:
[0155]
步骤s331,针对每一所述第一样本事件对,在基于所述第一样本事件对对应的文本段和所述顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签为空的情况下,将所述第一样本事件对对应的文本段确定为样本文本段。
[0156]
这里,第一样本事件对之间的顺承关系类别标签为空,表示在文本段中未识别到与顺承词模板匹配的顺承词。
[0157]
步骤s332,利用第一阶段训练后的所述分类模型,针对每一所述样本文本段,基于所述样本文本段,确定所述样本文本段对应的第一样本事件对之间的顺承关系类别标签。
[0158]
步骤s333,利用每一所述样本文本段以及每一所述样本文本段分别对应的顺承关系类别标签,对第一阶段训练后的所述分类模型进行第二阶段训练,得到第二阶段训练后的所述分类模型。
[0159]
这里,对分类模型进行第二阶段训练的过程可以参考前述步骤s313中对分类模型
的第一阶段训练。
[0160]
上述实施例中,由于对分类模型进行第二阶段训练的过程中,采用的样本文本对以及样本文本段对应的顺承关系类别标签是基于第一阶段训练后的分类模型确定的的,从而可以降低对预先标注的样本文本段的数量需求,进而减少对人工的依赖。
[0161]
本公开实施例提供一种事件处理方法,该方法可以由计算机设备的处理器执行。图4为本公开实施例提供的一种事件处理方法的实现流程示意图,如图4所示,该方法可以包括如下步骤s401至步骤s404:
[0162]
步骤s401,获取事件列表;所述事件列表通过对包含出行信息的文本语料进行事件抽取得到,包括至少一个事件。
[0163]
步骤s402,针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成。
[0164]
步骤s403,基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
[0165]
这里,上述步骤s401至步骤s403分别对应于前述实施例中的步骤s101至步骤s103,在实施时,可以参照前述步骤s101至步骤s103的实施方式。
[0166]
步骤s404,基于排序后的所述事件列表,生成出行路线。
[0167]
这里,排序后的事件列表中的各事件是按照发生的先后顺序进行排列的。在实施时,可以将排序后的事件列表中的各事件依次连接,形成出行路线。
[0168]
在一些实施方式中,还可以在生成出行路线之前,对排序后的事件列表中的各事件进行去重、和/或筛选等后处理,并将后处理后的事件列表中的各事件依次连接,形成出行路线。
[0169]
在一些实施方式中,可以将生成的出行路线存储至任意合适的数据库中,以供用户查询、或在一些应用场景中用于向用户推荐。这里的数据库可以包括但不限于图数据库、基于数据表进行存储的数据库等中的至少之一。
[0170]
本公开实施例中,首先获取从包含出行信息的文本语料中提取得到的事件列表;然后针对事件列表中的至少一个事件对,对该事件对进行顺承关系分类,得到该事件对中两个事件之间的顺承关系类别;接着基于该至少一个事件对中每一事件对之间的顺承关系类别,对该事件列表中的各事件进行排序,得到排序后的事件列表;最后基于排序后的事件列表,生成出行路线。这样,一方面可以根据包含出行信息的文本语料自动生成出行路线,减少对人工的依赖;另一方面在从文本语料中抽取到事件列表后,根据事件列表中至少一个事件对中每一事件对之间的顺承关系类别,对事件列表中的各事件进行排序,可以提高排序的准确性,从而可以提高生成的出行路线的准确性。
[0171]
在一些实施例中,每一所述事件具有事件类别和事件主题;所述方法还包括如下步骤s411至步骤s414:
[0172]
步骤s411,从所述出行路线关联的各事件中,确定事件类别为出发类别的第一目标事件、以及事件类别为游玩类别的第二目标事件。
[0173]
这里,出发类别的事件指的是表征出发去某目的地的事件。例如,出发类别的事件可以包括出发去b地区、或出发去a城市等。
[0174]
游玩类别的事件指的是表征游玩某旅游景点或景区的事件。例如,游玩类别的事
件可以包括游玩c森林公园、游玩d雪山等。
[0175]
步骤s412,基于所述第一目标事件的事件主题,确定目标城市。
[0176]
这里,由于事件主题为事件开展所围绕的主题。对于出发类别的事件,所围绕的主题通常是出发前往的目的地。目的地可以是城市、小区、酒店、车站等中的至少之一。通过对出发类别的第一目标事件的事件主题中的目的地信息进行分析,可以确定目的地对应的城市,即目标城市。
[0177]
步骤s413,基于所述第二目标事件的事件主题,确定目标景区。
[0178]
对于游玩类别的事件,所围绕的主题通常是游玩的景区。通过对游玩类别的第二目标事件的事件主题中的景区信息进行分析,可以确定目标景区。
[0179]
步骤s414,在所述目标城市与所述目标景区不匹配的情况下,确定所述出行路线存在异常。
[0180]
这里,目标城市与目标景区之间的匹配关系表征该目标景区是否位于该目标城市。在目标景区位于目标城市的情况下,可以确定该目标城市与该目标景区匹配;在该目标景区不位于该目标城市的情况下,可以确定该目标城市与该目标景区不匹配。
[0181]
在一些实施方式中,可以基于预先设定的至少一个城市与至少一个景区之间的匹配关系,确定目标城市与目标景区是否匹配。
[0182]
在一些实施方式中,可以预先构建至少一个词语与释义之间的映射关系,在该映射关系中可以查询得到目标景区的目标释义。通过对该目标释义中出现的城市进行识别,可以得到与该目标景区对应的参考城市,在该参考城市与目标城市一致的情况下,可以确定该目标景区与该目标城市匹配;在该参考城市与目标城市不一致的情况下,可以确定该目标景区与该目标城市不匹配。
[0183]
在一些实施方式中,若目标景区的目标释义中识别到多个城市,可以统计该多个城市分别在该目标释义中出现的次数,并将该多个城市中出现次数最多的城市确定为该目标景区对应的参考城市。
[0184]
本公开实施例中,从出行路线关联的各事件中,确定事件类别为出发类别的第一目标事件、以及事件类别为游玩类别的第二目标事件;基于第一目标事件的事件主题,确定目标城市;基于第二目标事件的事件主题,确定目标景区;在目标城市与目标景区不匹配的情况下,确定出行路线存在异常。这样,通过将目标城市与目标景区不匹配的出行路线确定为存在异常,可以识别出异常的出行路线,以便为用户提供更加准确的出行路线。
[0185]
在一些实施例中,所述方法还包括如下步骤s421至步骤s422:
[0186]
步骤s421,在所述目标城市与所述目标景区匹配的情况下,确定所述出行路线不存在异常。
[0187]
步骤s422,在所述出行路线不存在异常的情况下,将所述出行路线存储至设定的图数据库中,得到出行路线知识图谱。
[0188]
这里,图数据库可以包括但不限于neo4j数据库、galaxybase数据库、hugegraph数据库等中的至少之一。
[0189]
在实施时,可以根据实际情况采用任意合适的方式根据生成的出行路线构建出行路线知识图谱,本公开实施例对此并不限定。
[0190]
上述实施例中,在确定出行路线不存在异常的情况下,将出行路线存储至设定的
图数据库中,得到出行路线知识图谱。这样,可以提高出行路线知识图谱中出行路线的准确性,从而提高出行路线知识图谱的准确性。
[0191]
下面说明本公开实施例提供的事件处理方法在实际场景中的应用。以文本语料为游记文本为例,可以根据本公开实施例提供的事件处理方法,从游记文本自动挖掘出行路线,从而节约大量人力,并提高生成的出行路线的准确性。
[0192]
相关技术中,出行路线可以是由人工构建的,这种方案需要耗费大量人力,并且由于人工构建的出行路线的准确性依赖构建者的经验以及构建过程中的专注度,容易出现经验不足或失误导致的错误,影响构建出行路线的准确性。
[0193]
此外,在一些其他的相关技术中,可以基于预先设定的模板直接对出行路线进行构建。但是,该方案中采用的模板需要人工基于经验制作,同样耗费人力。而且,由于出行路线相关的经验数据通常存在长尾问题(即经验数据中少量类别的出行路线占比较大,而大量的类别仅有少量的经验数据),导致模板效果难以达到可用的预期。
[0194]
图5a为本公开实施例提供的一种出行路线的生成方法的实现流程示意图,如图5a所示,该方法包括如下步骤s501至步骤s509:
[0195]
步骤s501,获取游记文本,并将游记文本切分为至少一个长句。
[0196]
步骤s502,对事件抽取模型进行训练,得到训练后的事件抽取模型。
[0197]
这里,事件抽取模型可以包括bert网络和ptr-nets网络。
[0198]
在一些实施方式中,对事件抽取模型进行训练的过程可以包括如下步骤s511至步骤s515:
[0199]
步骤s511,设定事件类别集。
[0200]
这里,事件类别集中事件类别的种类和数量可以由实际业务情况而定。例如,可以预先定义事件类别集中包括如下8个事件类别:出发、返回、出行方式、预订或购买(包括车票、机票、船票、住所、景区门票等)、吃饭、游玩、娱乐项目、购物。
[0201]
步骤s512,获取少量已标注的第一样本语料。
[0202]
在一些实施方式中,已标注的第一样本语料对应的事件标签可以为三元组《事件类型,事件触发词,事件主题》。在实施时,可以将已标注的第一样本语料保存成js对象简谱(javascript object notation,json)格式。
[0203]
步骤s513,基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到第一阶段训练后的事件抽取模型。
[0204]
这里,由于已标注的第一样本语料数量较少,为了能充分利用标签数据,可以采用低资源的训练方法,例如采用提示学习的方式,对事件抽取模型进行第一阶段训练。
[0205]
步骤s514,利用所述第一阶段训练后的事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件,并在第一样本事件的第一置信度大于设定的第一置信度阈值的情况下,将该第一样本事件标注为该第二样本语料的一个事件标签。
[0206]
步骤s515,基于标注后的第二样本语料,对第一阶段训练后的事件抽取模型进行第二阶段训练,得到第二阶段训练后的事件抽取模型。
[0207]
这里,可以重复步骤s513至步骤s515直至第二阶段训练后的事件抽取模型的输出结果稳定或者更新次数达到设定的次数阈值为止,保存第二阶段训练后的事件抽取模型。
[0208]
步骤s503,对于每一个长句,利用第二阶段训练后的事件抽取模型,从该长句中抽
取出与事件类别对应的至少一个第一事件,并按照设定的时间模板,对该长句进行多模式串匹配处理,得到至少一个与该时间模板匹配的时间实体。
[0209]
步骤s504,根据每一第一事件和每一时间实体,得到事件列表。
[0210]
针对每一所述时间实体,可以生成对应于该时间实体的第二事件。通过将每一第一事件以及每一第二事件按照抽取出来的先后顺序(对应事件触发词在游记文本中出现的顺承)排列起来,可以得到事件列表。
[0211]
步骤s505,对分类模型进行训练,得到训练后的分类模型。
[0212]
这里,分类模型可以包括bert网络和softmax网络。
[0213]
在一些实施方式中,对分类模型进行训练的过程可以包括如下步骤s521至步骤s524:
[0214]
步骤s521,定义至少一种顺承关系类别以及顺承词模板。
[0215]
这里,定义的顺承关系类别的种类和数量可以由实际业务情况而定。例如,可以预先定义两种顺承关系类别,包括向前顺承和向后顺承。
[0216]
顺承词模板中可以包括至少一种向前顺承词、以及至少一种向后顺承词。例如,向前顺承词可以包括但不限于“在这之前”、“去之前”等中的至少之一,向后顺承词可以包括但不限于接下来”、“然后”、“其次”、“接着”、“首先”、“第一天”、“day1”等中的至少之一。
[0217]
步骤s522,利用步骤s504中确定的事件列表,抽取该事件列表中每两个事件分别对应的事件触发词之间的文本段,并基于顺承词模板为每一文本段确定相应的顺承关系类别标签。
[0218]
在一些实施方式中,可以在文本段中包含向前顺承词的情况下,确定该文本段对应的顺承关系类别标签为向前顺承;在文本段中包含向后顺承词的情况下,确定该文本段对应的顺承关系类别标签为向后顺承。
[0219]
在基于顺承词模板未识别到文本段中存在顺承词的情况下,将该文本段对应的顺承关系类别确定为空,后续不用该文本段对分类模型进行第一阶段训练。
[0220]
步骤s523,基于每一第一样本事件对分别对应的文本段以及每一第一样本事件对分别对应的顺承关系类别标签,对初始的分类模型进行第一阶段训练,得到第一阶段训练后的分类模型。
[0221]
步骤s524,针对每一第一样本事件对,在基于该第一样本事件对对应的文本段和顺承词模板,确定该第一样本事件对之间的顺承关系类别标签为空的情况下,将该第一样本事件对对应的文本段确定为样本文本段。
[0222]
步骤s525,利用第一阶段训练后的分类模型,针对每一样本文本段,基于该样本文本段,确定该样本文本段对应的第一样本事件对之间的顺承关系类别标签,并在该样本文本段对应的顺承关系类别标签的第二置信度大于设定的第二置信度阈值的情况下,将该样本文本段确定为目标样本文本段;
[0223]
步骤s526,利用每一目标样本文本段以及每一目标样本文本段分别对应的顺承关系类别标签,对第一阶段训练后的分类模型进行第二阶段训练,得到第二阶段训练后的分类模型。
[0224]
这里,可以重复步骤s523至步骤s526直至第二阶段训练后的分类模型的输出结果稳定或者更新次数达到设定的次数阈值为止,保存第二阶段训练后的分类模型。
[0225]
步骤s506,针对事件列表中的至少一个事件对,基于该事件对中的第三事件和第四事件分别对应的第一事件触发词和第二事件触发词,确定文本语料中位于该第一事件触发词和该第二事件触发词之间的文本段,并利用分类模型,基于该文本段,确定该事件对之间的顺承关系类别。
[0226]
步骤s507,基于至少一个事件对中每一事件对之间的顺承关系类别,对事件列表中的各事件进行排序,得到排序后的事件列表,并基于排序后的事件列表,生成至少一条出行路线。
[0227]
在一些实施方式中,可以采用搜索排序的pair-wise思想,两两去比较事件列表中各事件的顺序,最终得到一个总的排序,以确定排序后的事件列表。
[0228]
例如,现有事件列表[e1,e2,e3,e4,e5,e6],可以采用如下步骤s531至步骤s534的方式确定排序后的事件列表:
[0229]
步骤s531,取出游记文本中位于事件e1和事件e2分别对应的事件触发词之间的文本段t1;
[0230]
步骤s532,将文本段t1输入到分类模型,得到文本段t1对应的顺承关系类别,如果是向后顺承,说明事件e1在事件e2之前,反之事件e1在事件e2之后。
[0231]
步骤s533,比较事件e2和事件e3的顺序;若能得出事件e1、事件e2和事件e3之间的顺序,从事件列表中继续取出下两个事件进行比较;若还不能确定事件e1、事件e2、事件e3的顺序,则再比较一次事件e1和事件e3的顺序。
[0232]
步骤s534,重复上面步骤,直到得到最终的事件顺序,并根据该事件顺序得到排序后的事件列表。
[0233]
例如,以a城的游记举例,假设第一事件的格式为:事件类别#事件主题;第二事件的格式为:day x;则排序后的事件列表样例可以如下:
[0234]
["出发#大理","day1","出行方式#高铁","游玩#古城","游玩#崇圣寺三塔","游玩#三塔倒影公园","day2","游玩#蝴蝶泉","游玩#双廊古镇","day3","游玩#苍山"]。
[0235]
步骤s508,对至少一条出行路线进行数据清洗处理。
[0236]
这里,通过数据清洗处理可以清洗掉错误的出行路线(即存在异常的出行路线)。在很多游记文本中,涉及到多个城市,游记文本写的比较乱,从而可能会导致抽取出来的出行路线是错误的。例如,生成的出行路线为“出发#a城-》游玩#景区b1-》游玩#景区b2-》游玩#景区b3”,但景区b1、景区b2、景区b3并不是位于a城,则这种出行路线是错误的,通过数据清理处理可以将错误的出行路线清洗掉。
[0237]
在实施时,可以通过验证景区和出发前往的城市是否一致,来确定是否要将出行路线清洗掉。例如,可以采用如下步骤s541至步骤s548对至少一条出行路线进行数据清洗处理:
[0238]
步骤s541,构建至少一个词语与释义之间的映射关系。
[0239]
在一些实施方式中,可以基于开源的百科数据,构建至少一个词语与释义之间的映射关系。
[0240]
步骤s542,确定一条待清洗的出行路线。
[0241]
步骤s543,从清洗的出行路线关联的各事件中,确定事件类别为出发类别的第一目标事件、以及事件类别为游玩类别的第二目标事件,并基于第一目标事件的事件主题确
processor,dsp)或现场可编程门阵列(field programmable gate array,fpga)等。
[0257]
图6为本公开实施例提供的一种事件处理装置的组成结构示意图,如图6所示,事件处理装置600包括:第一获取模块610、第一分类模块620和排序模块630,其中:
[0258]
第一获取模块610,用于获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;
[0259]
第一分类模块620,用于针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成;
[0260]
排序模块630,用于基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
[0261]
在一些实施例中,事件列表中包括至少一个表征出行行为的第一事件;第一获取模块还用于:针对设定的事件类别集中的每一事件类别,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件;基于每一所述第一事件,确定所述事件列表。
[0262]
在一些实施例中,第一获取模块还用于:以所述事件类别作为提示信息,从所述文本语料中抽取与所述事件类别对应的事件触发词和事件主题;基于所述事件类别、所述事件触发词和所述事件主题,确定与所述事件类别对应的第一事件。
[0263]
在一些实施例中,所述装置还包括:第一训练模型,用于基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到所述第一阶段训练后的所述事件抽取模型;第一抽取模块,用于利用所述第一阶段训练后的所述事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件;第一标注模块,用于基于抽取出的所述第一样本事件,对所述第二样本语料进行标注,得到标注后的所述第二样本语料;第二训练模块,用于基于标注后的所述第二样本语料,对第一阶段训练后的所述事件抽取模型进行第二阶段训练,得到第二阶段训练后的所述事件抽取模型;第一获取模块还用于:利用第二阶段训练后的所述事件抽取模型,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件。
[0264]
在一些实施例中,所述事件列表中还包括至少一个表征时间实体的第二事件;第一获取模块还用于:从所述文本语料中抽取至少一个时间实体;针对每一所述时间实体,生成对应于所述时间实体的第二事件;基于每一所述第一事件、以及每一所述时间实体分别对应的第二事件,确定所述事件列表。
[0265]
在一些实施例中,第一获取模块还用于:按照设定的时间模板,对所述文本语料进行多模式串匹配处理,得到至少一个与所述时间模板匹配的时间实体。
[0266]
在一些实施例中,排序模块还用于:针对所述至少一个事件对中的每一事件对,基于所述事件对对应的顺承关系类别,确定所述事件对中的第三事件与第四事件之间的顺序;基于每一事件对中第三事件和第四事件之间的顺序,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。
[0267]
在一些实施例中,每一事件对对应的顺承关系类别包括向前顺承或向后顺承;排序模块还用于以下之一:在所述事件对中的第三事件与第四事件之间的顺承关系类别为向前顺承的情况下,确定所述第三事件位于所述第四事件之后;在所述事件对中的第三事件与第四事件之间的顺承关系类别为向后顺承的情况下,确定所述第三事件位于所述第四事件之前。
[0268]
在一些实施例中,第一分类模块还用于:基于所述事件对中的第三事件和第四事件分别对应的第一事件触发词和第二事件触发词,确定所述文本语料中位于所述第一事件触发词和所述第二事件触发词之间的文本段;基于所述文本段,确定所述事件对之间的顺承关系类别。
[0269]
在一些实施例中,所述装置还包括:第一确定模块,用于从所述事件列表中确定至少一个第一样本事件对;第二确定模块,用于:针对每一所述第一样本事件对,基于所述第一样本事件对中的第一样本事件和第二样本事件分别对应的第三事件触发词和第四事件触发词,确定所述文本语料中位于所述第三事件触发词和所述第四事件触发词之间的文本段,并基于所述文本段和设定的顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签;第三训练模块,用于基于每一所述第一样本事件对分别对应的文本段以及每一所述第一样本事件对分别对应的顺承关系类别标签,对初始的分类模型进行第一阶段训练,得到第一阶段训练后的所述分类模型;第一分类模块还用于:利用所述分类模型,基于所述文本段,确定所述事件对之间的顺承关系类别。
[0270]
在一些实施例中,所述装置还包括:第三确定模块,用于:针对每一所述第一样本事件对,在基于所述第一样本事件对对应的文本段和所述顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签为空的情况下,将所述第一样本事件对对应的文本段确定为样本文本段;第二分类模块,用于利用第一阶段训练后的所述分类模型,针对每一所述样本文本段,基于所述样本文本段,确定所述样本文本段对应的第一样本事件对之间的顺承关系类别标签;第四训练模块,用于利用每一所述样本文本段以及每一所述样本文本段分别对应的顺承关系类别标签,对第一阶段训练后的所述分类模型进行第二阶段训练,得到第二阶段训练后的所述分类模型。
[0271]
在一些实施例中,所述文本语料中包含出行信息;所述装置还包括:生成模块,用于基于排序后的所述事件列表,生成出行路线。
[0272]
在一些实施例中,每一所述事件具有事件类别和事件主题;所述装置还包括:第四确定模块,用于从所述出行路线关联的各事件中,确定事件类别为出发类别的第一目标事件、以及事件类别为游玩类别的第二目标事件;第五确定模块,用于基于所述第一目标事件的事件主题,确定目标城市;第六确定模块,用于基于所述第二目标事件的事件主题,确定目标景区;第七确定模块,用于在所述目标城市与所述目标景区不匹配的情况下,确定所述出行路线存在异常。
[0273]
在一些实施例中,所述装置还包括:第八确定模块,用于在所述目标城市与所述目标景区匹配的情况下,确定所述出行路线不存在异常;存储模块,用于在所述出行路线不存在异常的情况下,将所述出行路线存储至设定的图数据库中,得到出行路线知识图谱。
[0274]
以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上述方法实施例描述的方法,对于本公开装置实施例中未披露的技术细节,请参照本公开方法实施例的描述而理解。
[0275]
需要说明的是,本公开实施例中,如果以软件功能模块的形式实现上述的方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品
的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本公开实施例不限制于任何特定的硬件、软件或固件,或者硬件、软件、固件三者之间的任意结合。
[0276]
本公开实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的部分或全部步骤。
[0277]
本公开实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的部分或全部步骤。所述计算机可读存储介质可以是瞬时性的,也可以是非瞬时性的。
[0278]
本公开实施例提供一种计算机程序,包括计算机可读代码,在所述计算机可读代码在计算机设备中运行的情况下,所述计算机设备中的处理器执行用于实现上述方法中的部分或全部步骤。
[0279]
本公开实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序被计算机读取并执行时,实现上述方法中的部分或全部步骤。该计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一些实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一些实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0280]
这里需要指出的是:上文对各个实施例的描述倾向于强调各个实施例之间的不同之处,其相同或相似之处可以互相参考。以上设备、存储介质、计算机程序及计算机程序产品实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本公开设备、存储介质、计算机程序及计算机程序产品实施例中未披露的技术细节,请参照本公开方法实施例的描述而理解。
[0281]
需要说明的是,图7为本公开实施例中计算机设备的一种硬件实体示意图,如图7所示,该计算机设备700的硬件实体包括:处理器701、通信接口702和存储器703,其中:
[0282]
处理器701通常控制计算机设备700的总体操作。
[0283]
通信接口702可以使计算机设备通过网络与其他终端或服务器通信。
[0284]
存储器703配置为存储由处理器701可执行的指令和应用,还可以缓存待处理器701以及计算机设备700中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(flash)或随机访问存储器(random access memory,ram)实现。处理器701、通信接口702和存储器703之间可以通过总线704进行数据传输。
[0285]
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本公开的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本公开的各种实施例中,上述各步骤/过程的序号的大小并不意味着执行顺序的先后,各步骤/过程的执行顺
序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。上述本公开实施例序号仅仅为了描述,不代表实施例的优劣。
[0286]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0287]
在本公开所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
[0288]
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。另外,在本公开各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0289]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(read only memory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。
[0290]
或者,本公开上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本公开各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。
[0291]
以上所述,仅为本公开的实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。

技术特征:
1.一种事件处理方法,其特征在于,所述方法包括:获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成;基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。2.根据权利要求1所述的方法,其特征在于,所述事件列表中包括至少一个表征行为的第一事件;所述获取事件列表,包括:针对设定的事件类别集中的每一事件类别,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件;基于每一所述第一事件,确定所述事件列表。3.根据权利要求2所述的方法,其特征在于,所述从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件,包括:以所述事件类别作为提示信息,从所述文本语料中抽取与所述事件类别对应的事件触发词和事件主题;基于所述事件类别、所述事件触发词和所述事件主题,确定与所述事件类别对应的第一事件。4.根据权利要求2所述的方法,其特征在于,在所述从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件之前,所述方法还包括:基于已标注的第一样本语料,对初始的事件抽取模型进行第一阶段训练,得到所述第一阶段训练后的所述事件抽取模型;利用所述第一阶段训练后的所述事件抽取模型,从未标注的第二样本语料中抽取出第一样本事件;基于抽取出的所述第一样本事件,对所述第二样本语料进行标注,得到标注后的所述第二样本语料;基于标注后的所述第二样本语料,对第一阶段训练后的所述事件抽取模型进行第二阶段训练,得到第二阶段训练后的所述事件抽取模型;所述从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件,包括:利用第二阶段训练后的所述事件抽取模型,从所述文本语料中抽取出与所述事件类别对应的至少一个第一事件。5.根据权利要求2所述的方法,其特征在于,所述事件列表中还包括至少一个表征时间实体的第二事件;所述获取事件列表,还包括:从所述文本语料中抽取至少一个时间实体;针对每一所述时间实体,生成对应于所述时间实体的第二事件;所述基于每一所述第一事件,确定所述事件列表,包括:基于每一所述第一事件、以及每一所述时间实体分别对应的第二事件,确定所述事件列表。
6.根据权利要求5所述的方法,其特征在于,所述从所述文本语料中抽取至少一个时间实体,包括:按照设定的时间模板,对所述文本语料进行多模式串匹配处理,得到至少一个与所述时间模板匹配的时间实体。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表,包括:针对所述至少一个事件对中的每一事件对,基于所述事件对对应的顺承关系类别,确定所述事件对中的第三事件与第四事件之间的顺序;基于每一事件对中第三事件和第四事件之间的顺序,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。8.根据权利要求7所述的方法,其特征在于,每一所述事件对对应的顺承关系类别包括向前顺承或向后顺承;所述基于所述事件对对应的顺承关系类别,确定所述事件对中的第三事件与第四事件之间的顺序,包括以下之一:在所述事件对中的第三事件与第四事件之间的顺承关系类别为向前顺承的情况下,确定所述第三事件位于所述第四事件之后;在所述事件对中的第三事件与第四事件之间的顺承关系类别为向后顺承的情况下,确定所述第三事件位于所述第四事件之前。9.根据权利要求1至6中任一项所述的方法,其特征在于,所述对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别,包括:基于所述事件对中的第三事件和第四事件分别对应的第一事件触发词和第二事件触发词,确定所述文本语料中位于所述第一事件触发词和所述第二事件触发词之间的文本段;基于所述文本段,确定所述事件对之间的顺承关系类别。10.根据权利要求9所述的方法,其特征在于,在所述基于所述文本段,确定所述事件对之间的顺承关系类别之前,所述方法还包括:从所述事件列表中确定至少一个第一样本事件对;针对每一所述第一样本事件对,基于所述第一样本事件对中的第一样本事件和第二样本事件分别对应的第三事件触发词和第四事件触发词,确定所述文本语料中位于所述第三事件触发词和所述第四事件触发词之间的文本段,并基于所述文本段和设定的顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签;基于每一所述第一样本事件对分别对应的文本段以及每一所述第一样本事件对分别对应的顺承关系类别标签,对初始的分类模型进行第一阶段训练,得到第一阶段训练后的所述分类模型;所述基于所述文本段,确定所述事件对之间的顺承关系类别,包括:利用所述分类模型,基于所述文本段,确定所述事件对之间的顺承关系类别。11.根据权利要求10所述的方法,其特征在于,在所述利用所述分类模型,基于所述文本段,确定所述事件对之间的顺承关系类别之前,所述方法还包括:
针对每一所述第一样本事件对,在基于所述第一样本事件对对应的文本段和所述顺承词模板,确定所述第一样本事件对之间的顺承关系类别标签为空的情况下,将所述第一样本事件对对应的文本段确定为样本文本段;利用第一阶段训练后的所述分类模型,针对每一所述样本文本段,基于所述样本文本段,确定所述样本文本段对应的第一样本事件对之间的顺承关系类别标签;利用每一所述样本文本段以及每一所述样本文本段分别对应的顺承关系类别标签,对第一阶段训练后的所述分类模型进行第二阶段训练,得到第二阶段训练后的所述分类模型。12.根据权利要求1至6中任一项所述的方法,其特征在于,所述文本语料中包含出行信息;所述方法还包括:基于排序后的所述事件列表,生成出行路线。13.根据权利要求12所述的方法,其特征在于,每一所述事件具有事件类别和事件主题;所述方法还包括:从所述出行路线关联的各事件中,确定事件类别为出发类别的第一目标事件、以及事件类别为游玩类别的第二目标事件;基于所述第一目标事件的事件主题,确定目标城市;基于所述第二目标事件的事件主题,确定目标景区;在所述目标城市与所述目标景区不匹配的情况下,确定所述出行路线存在异常。14.根据权利要求13所述的方法,其特征在于,所述方法还包括:在所述目标城市与所述目标景区匹配的情况下,确定所述出行路线不存在异常;在所述出行路线不存在异常的情况下,将所述出行路线存储至设定的图数据库中,得到出行路线知识图谱。15.一种事件处理装置,其特征在于,所述装置包括:第一获取模块,用于获取事件列表;所述事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;第一分类模块,用于针对至少一个事件对,对所述事件对进行顺承关系分类,得到所述事件对中两个事件之间的顺承关系类别;所述事件对由所述事件列表中两个不同的事件构成;排序模块,用于基于所述至少一个事件对分别对应的顺承关系类别,对所述事件列表中的各事件进行排序,得到排序后的所述事件列表。16.一种计算机设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至14任一项所述方法中的步骤。17.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至14任一项所述方法中的步骤。

技术总结
本公开实施例提供了一种事件处理方法、装置及设备、存储介质,其中,所述方法包括:获取事件列表;该事件列表通过对文本语料进行事件抽取得到,包括至少一个事件;针对至少一个事件对,对该事件对进行顺承关系分类,得到该事件对中两个事件之间的顺承关系类别;事件对由事件列表中两个不同的事件构成;基于至少一个事件对分别对应的顺承关系类别,对事件列表中的各事件进行排序,得到排序后的事件列表。根据本公开实施例,能够对从文本语料中抽取的事件自动进行排序、减少对人工的依赖,并能提高事件排序的准确性。事件排序的准确性。事件排序的准确性。


技术研发人员:请求不公布姓名
受保护的技术使用者:摩尔线程智能科技(北京)有限责任公司
技术研发日:2023.07.17
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐