文件处理方法、装置、设备以及存储介质与流程
未命名
08-17
阅读:114
评论:0
1.本公开涉及数据处理技术领域,尤其涉及一种文件处理方法、装置、设备以及存储介质。
背景技术:
2.基于文件存储的数据采集是常用的一种数据采集和处理方式。在采集到数据后,将采集的数据存放在文件中,然后再进行流式的文件处理。但是在这个过程中,由于各类原因(如文件未及时关闭、句柄异常引用、第三方程序占用等),文件可能一直无法完成移动,造成文件滞留。滞留文件问题可能会造成处理程序卡死,甚至造成数据处理重大错误而引发的数据严重损失事故。对于这类问题往往采取人工方式进行解决,无论是效率还是处理质量都有显著的问题。
3.针对上述数据采集和处理中对滞留文件采取人工方式解决,效率较低的技术问题,目前尚未提出有效的解决方案。
技术实现要素:
4.本公开提供了一种文件处理方法、装置、设备以及存储介质。
5.根据本公开的第一方面,提供了一种文件处理方法。该方法包括:从原始数据文件夹中获取待处理原始文件;根据问题列表对待处理原始文件进行处理,其中,问题列表中记录有处理过程中出现异常的原始文件的处理信息;在对待处理原始文件的处理出现异常的情况下,在问题列表中添加或更新待处理原始文件的处理信息。
6.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,按照问题列表对待处理原始文件进行处理,包括:在问题列表中不存在待处理原始文件的处理信息,或,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理;在问题列表中存在待处理原始文件的处理信息且符合预设停止条件的情况下,停止对待处理原始文件进行处理。
7.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,预设处理流程,包括:将原始文件转换为预设格式的目标文件;在完成原始文件的转换操作的情况下,将原始文件复制到备份文件夹,并从原始数据文件夹中删除原始文件。
8.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,处理信息包括尝试转换次数、尝试复制次数、尝试删除次数和当前文件状态,文件状态包括待转换状
态、待复制状态、待删除状态、已完成状态;预设停止条件包括尝试转换次数不小于第一阈值,或,尝试复制次数不小于第二阈值,或,尝试删除次数不小于第三阈值,或,当前文件状态为已完成状态。
9.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理,包括:按照当前文件状态和预设处理流程,确定出对待处理原始文件的当前处理流程;按照当前处理流程对待处理原始文件进行处理。
10.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,处理信息还包括首次操作时间和最后操作时间;预设停止条件还包括最后操作时间与首次操作时间之间的时间间隔不小于第一时长。
11.如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理,包括:在当前时间与最后操作时间之间的时间间隔不大于第二时长的情况下,暂停按照预设处理流程对待处理原始文件进行处理。
12.根据本公开的第二方面,提供了一种文件处理装置。该装置包括:获取模块,用于从原始数据文件夹中获取待处理原始文件;处理模块,用于根据问题列表对待处理原始文件进行处理,其中,问题列表中记录有处理过程中出现异常的原始文件的处理信息;记录模块,用于在对待处理原始文件的处理出现异常的情况下,在问题列表中添加或更新待处理原始文件的处理信息。
13.根据本公开的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
14.根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本公开的第一方面的方法。
15.本公开通过在原始数据文件夹中,对于处理出现异常的文件自动在问题列表中记录处理信息,使得在后续再次处理时可以根据问题列表中的信息对文件进行自动处理,既能避免处理出现异常的文件长期滞留在文件夹中,又能节约人工处理成本,从而解决了数据采集和处理中对滞留文件采取人工方式解决导致效率较低的技术问题。
16.应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
17.结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。附图用于更好地理解本方案,不构成对本公开的限定在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了根据本公开的实施例的文件处理方法的流程图;
图2示出了根据本公开的实施例的文件流的业务逻辑示意图;图3示出了根据本公开的实施例的文件处理业务逻辑示意图;图4示出了根据本公开的实施例的文件处理装置的框图;图5示出了能够实施本公开的实施例的示例性电子设备的方框图。
具体实施方式
18.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
19.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
20.本公开中,通过在原始数据文件夹中,对处理出现异常的文件自动在问题列表中记录处理信息,使得在后续再次处理时可以根据问题列表中的信息对文件进行自动处理,避免处理出现异常的文件长期滞留在文件夹中。
21.图1示出了根据本公开的实施例的文件处理方法100的示意图。
22.如图1所示,所述文件处理方法100包括:s110:从原始数据文件夹中获取待处理原始文件;s120:根据问题列表对待处理原始文件进行处理,其中,问题列表中记录有处理过程中出现异常的原始文件的处理信息;s130:在对待处理原始文件的处理出现异常的情况下,在问题列表中添加或更新待处理原始文件的处理信息。
23.上述原始数据文件夹可以是用于存储采集到的原始数据的文件夹,在采集到数据后,将原始数据以文件的形式在原始数据文件夹中进行存储。
24.上述问题列表可以使用配置文件进行保存,列表中的可以使用路径+文件md5的形式表示原始文件。文件md5是指通过md5信息摘要算法(message-digest algorithm)产生出的散列值,用于确保信息传输完整一致。
25.可选地,在本实施例中,在对待处理原始文件的处理出现异常的情况下,若问题列表中存在待处理原始文件的处理信息,则更新该处理信息;若问题列表中不存在待处理原始文件的处理信息,则在问题列表中添加待处理原始文件的处理信息。
26.根据本公开的实施例,通过在原始数据文件夹中,对于处理出现异常的文件自动在问题列表中记录处理信息,使得在后续再次处理时可以根据问题列表中的信息对文件进行自动处理,既能避免处理出现异常的文件长期滞留在文件夹中,又能节约人工处理成本,从而解决了数据采集和处理中对滞留文件采取人工方式解决导致效率较低的技术问题。
27.在一些实施例中,按照问题列表对待处理原始文件进行处理,包括:在问题列表中不存在待处理原始文件的处理信息,或,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理;
在问题列表中存在待处理原始文件的处理信息且符合预设停止条件的情况下,停止对待处理原始文件进行处理。
28.在本实施例中,按照待处理原始文件的文件信息,可以在问题列表中查询到是否存在该待处理文件的处理信息,文件信息可以为待处理原始文件的路径和文件md5,也可以为其他可以用于唯一确定待处理原始文件的标识。
29.在本实施例中,在问题列表中不存在待处理原始文件的处理信息的情况下,说明该待处理原始文件是首次进入处理流程,直接按照预设处理流程进行处理。在问题列表中存在待处理原始文件的处理信息的情况下,说明该待处理原始文件在之前的处理中出现过异常,则需要根据已有的处理信息判断是否需要对该待处理原始文件继续处理,若该待处理原始文件的处理信息符合预设停止条件,则停止对待处理原始文件进行处理,若该待处理原始文件的处理信息不符合预设停止条件,则可以按照处理信息继续对该待处理文件进行处理。
30.上述预设停止条件可以根据实际需要设置,例如,处理信息可以包括处理出现异常的次数统计信息,预设停止条件可以为待处理原始文件处理出现异常的次数大于或等于预设次数。又如,处理信息可以包括首次处理的时间,预设停止条件可以为当前时间与首次处理时间的时间间隔大于或等于预设时长。
31.上述处理出现异常是指按照预设处理流程对原始文件进行处理的过程中,因各种原因导致没有成功完成预设处理流程。
32.上述停止对待处理原始文件进行处理是指停止对待处理原始文件的自动处理,在此情况下,依然可以通过发出提示信息,提示人工介入。
33.根据本公开的实施例,通过查询问题列表可以得知待处理原始文件的历史处理情况,根据不同的历史处理情况采取不同的处理方式,并且设定了预设停止条件,对于达到预设停止条件的待处理原始文件可以及时停止处理,避免造成处理程序卡死、数据处理出现重大错误等问题。
34.在一些实施例中,本公开的文件处理方法可以应用在基于文件存储的数据采集这一场景中,用于自动处理滞留文件。基于文件存储的数据采集是常用的一种数据采集和处理方式。在采集到数据后,将采集的数据存放在文件中,然后再通过流式的文件处理,将文件发给数据处理器,生成转换好的格式化文件,如csv(comma-separated values,逗号分隔值,也称字符分隔值,其文件以纯文本形式存储表格数据)文件,并对原始文件在处理完成后进行备份。如图2所示,为根据本公开的实施例的文件流的业务逻辑示意图。图2中的数据采集器用于采集各类关注的数据,并以特定编码表示。图2中的数据处理器用于对原始文件中的原始数据进行解析处理,并转换为预设格式。
35.在本实施例中,预设处理流程可以包括文件转换和文件备份,文件转换是指将待处理原始文件转换为预设格式的目标文件。文件备份是指将原始文件备份到备份文件夹中。
36.可选地,在本实施例中,预设处理流程包括:将原始文件转换为预设格式的目标文件;在完成原始文件的转换操作的情况下,将原始文件复制到备份文件夹,并从原始数据文件夹中删除原始文件。
37.文件备份可以包括将原始文件复制到备份文件夹的复制操作,还包括在完成复制操作的情况下从原始数据文件夹中删除原始文件的删除操作。即预设处理流程可以包含转换操作、复制操作和删除操作。
38.将原始文件转换为预设格式的目标文件是对原始文件的转换操作。例如,原始文件为xml(即可扩展标记语言)格式的文件,预设格式为csv,通过转换操作将原始文件转换为csv格式的目标文件。
39.可选地,在本实施例中,将原始文件转换为预设格式的目标文件还可以包括:在将原始文件转换为预设格式的目标文件后将目标文件存储到目标数据文件夹中。
40.可选地,在目标数据文件夹中以天为单位建立子文件夹,进行对目标文件进行分类存储。
41.可选地,在备份文件夹中以天为单位建立子文件夹,进行对备份到此的原始文件进行分类存储。
42.可选地,在其他文件处理的相关应用场景中,预设处理流程可以根据实际情况进行配置,预设处理流程可以包括转换操作、复制操作、移动操作、删除操作等。
43.根据本公开的实施例,通过在基于文件存储的数据采集这一场景中应用本公开的文件处理方法,将文件转换中的转换操作、文件备份中的复制操作和删除操作,作为预设处理流程,使得在数据处理中能够分阶段地对文件进行管理。
44.在一些实施例中,处理信息包括尝试转换次数、尝试复制次数、尝试删除次数和当前文件状态,文件状态包括待转换状态、待复制状态、待删除状态、已完成状态;预设停止条件包括尝试转换次数不小于第一阈值,或,尝试复制次数不小于第二阈值,或,尝试删除次数不小于第三阈值,或,当前文件状态为已完成状态。
45.尝试转换次数是指尝试进行转换操作的次数,尝试复制次数是指尝试进行复制操作的次数,尝试删除次数是指尝试进行删除操作的次数。
46.在对原始文件尝试转换操作,但转换操作未成功的情况下,自动记录处理信息,将尝试转换次数增加一次,将当前文件状态确定为待转换状态。
47.在对原始文件尝试复制操作,但复制操作未成功的情况下,自动记录处理信息,将尝试复制次数增加一次,将当前文件状态确定为待复制状态。
48.在对原始文件尝试删除操作,但删除操作未成功的情况下,自动记录处理信息,将尝试删除次数增加一次,将当前文件状态确定为待删除状态。
49.上述第一阈值、第二阈值、第三阈值可以根据实际需要设置。例如,第一阈值、第二阈值、第三阈值均为5,则预设停止条件为尝试转换次数大于或等于5次,或尝试复制次数大于或等于5次,或尝试删除次数大于或等于5次,或当前文件状态为已完成状态。
50.在对原始文件的多次转换操作失败,或多次复制操作失败,或多次删除操作失败的情况下,可以及时按照预设停止条件自动停止处理,避免造成处理程序卡死、数据处理出现重大错误等问题。
51.根据本公开的实施例,通过在处理信息中设置尝试转换次数、尝试复制次数、尝试删除次数和当前文件状态等信息,使得在文件处理中能够按照预设处理流程的不同阶段分别对文件进行管理,并按照不同阶段分别设置了不同的预设停止条件,可以及时按照预设停止条件自动停止处理,避免造成处理程序卡死、数据处理出现重大错误等问题,并且在人
工介入时,可以让用户从问题列表中查询得到处理异常的文件的详细信息,有利于用户快速定位处理异常的原因。
52.在一些实施例中,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理,包括:按照当前文件状态和预设处理流程,确定出对待处理原始文件的当前处理流程;按照当前处理流程对待处理原始文件进行处理。
53.在问题列表中存在待处理原始文件的处理信息的情况下,可以从处理信息中得到待处理原始文件的当前文件状态,根据当前文件状态可以确定出待处理原始文件在预设处理流程中所处的处理阶段,从而确定出当前处理流程,并按照当前处理流程对待处理原始文件进行处理。
54.例如,预设处理流程包括转换操作、复制操作、删除操作,若待处理原始文件的处理信息中当前文件状态为待删除状态,则说明该待处理原始文件已经完成转换操作、复制操作,无需再次对该待处理原始文件执行转换操作、复制操作,可以直接进行删除操作阶段,再次尝试从原始数据文件夹中删除该待处理原始文件。
55.可选地,在本实施例中,若问题列表中存在待处理原始文件的处理信息,在对所述待处理原始文件完成全部预设处理流程的情况下,将处理信息中的当前文件状态更新为已完成状态。
56.根据本公开的实施例,在待处理原始文件的处理信息未达到预设停止条件的情况下,说明需要继续对该待处理原始文件进行处理,此时可以通过处理信息,得知待处理原始文件的当前文件状态,以便按照当前文件状态确定出当前的处理阶段,从而确定当前处理流程,在继续对该待处理原始文件进行处理时无需重复整个预设处理流程。
57.在一些实施例中,处理信息还包括首次操作时间和最后操作时间;预设停止条件还包括最后操作时间与首次操作时间之间的时间间隔不小于第一时长。
58.可选地,首次操作时间为第一次尝试操作的时间,可以精确到秒;最后操作时间为最后一次尝试操作的时间,可以精确到秒。
59.例如,第一时长为5天,若待处理原始文件的处理信息中,首次操作时间为2022年1月5日12:00,最后操作时间为2022年1月10日12:00,说明该待处理原始文件经5天仍未处理完成,可以停止对待处理原始文件的处理,提示人工介入。
60.根据本公开的实施例,通过在处理信息中设置首次操作时间和最后操作时间,在待处理原始文件经长时间处理但仍未完成预设处理流程的情况下,及时停止对该待处理原始文件的处理,避免造成处理程序卡死、数据处理出现重大错误等问题。
61.在一些实施例中,在问题列表中存在待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对待处理原始文件进行处理,包括:在当前时间与最后操作时间之间的时间间隔不大于第二时长的情况下,暂停按照预设处理流程对待处理原始文件进行处理。
62.例如,第二时长为3分钟,若当前时间为2022年1月10日12:02,待处理原始文件的处理信息中,最后操作时间为2022年1月10日12:00,说明该待处理原始文件刚刚进行过一次操作,可以暂时停止对该待处理原始文件进行处理,稍后再继续处理。
63.根据本公开的实施例,通过设置第二时长作为暂停处理条件,避免在较短时间内对相同的原始文件进行多次操作,从而避免造成处理程序卡死、数据处理出现重大错误等问题。
64.在一些实施例中,除了记录问题列表外,还可以记录已完成日志,对已完成预设处理流程的原始文件按完成时间进行记录,例如,按照年月日记录已完成预设处理流程的原始文件。
65.下面以具体的实施案例来对本公开实施例的文件处理方法100进行说明:基于文件存储的数据采集是常用的一种数据采集和处理方式。在采集到数据后,将采集的数据存放在文件中,然后再通过流式的文件处理,将文件发给数据处理器,生成转换好的格式化文件(如csv)并对原始文件在处理完成后进行备份。但是在这个过程中,由于各类原因,如文件未及时关闭,句柄异常引用,第三方程序占用等原因文件可能一直无法完成移动,造成文件滞留。滞留文件问题可能会造成处理程序卡死,甚至造成数据处理重大错误而引发的数据严重损失事故。对于这类问题往往采取人工方式进行解决,无论是效率还是处理质量都有显著的问题。通过人工方式进行处理或简单的程序判断具有如下缺点:效率低下,实时性不强且处理能力弱,可能会造成业务中断,数据丢失。
66.本公开实施例提出了一种流式文件处理中的滞留文件处理方法,通过本方法能够采用多种方式分不同阶段有效地对滞留文件进行有效的管理,避免了问题事故的发生,同时具有易于实现、功能强大、可靠性高、追踪性强、实时性好等优点,可以广泛集成在流式文件处理系统中。
67.一、处理流程在流式文件处理任务中,主要包括“源文件夹:生产文件
→
转换器
→
目标文件夹:备份文件”的流程,如图2所示为根据本公开的实施例的文件流的业务逻辑示意图,其中:
①
数据采集器用于采集各类关注的数据;
②
采集:采集原始的数据,以特定编码表示;
③
原始数据文件夹:将原始数据以文件的形式在这里进行存储;
④
待处理原始文件:将原始文件发送给处理器。
68.⑤
数据处理器:将原始数据进行解析处理,转换为目标数据格式,如csv;
⑥
数据备份:将处理好的原始数据存储到备份文件夹中;
⑦
备份文件夹:用于存储已经处理过的原始文件,同时以天为单位建立子文件夹,进行对原文件进行分类存储;
⑧
已处理数据:指由
⑤
数据处理器处理后输出的格式化文件;
⑨
目标数据文件夹:用于存储已经转换好的数据文件,同时以天为单位建立子文件夹,进行对文件进行分类存储。
69.二、执行逻辑根据本公开的实施例的文件处理业务逻辑示意图如图3所示。图3中的原文件目录即为本公开中原始数据文件夹的目录。对于某些文件处理业务,文件转换可以为空,即不需要进行文件转换,图3中仅示出一种可选的文件处理业务逻辑,图3中的“从问题列表移除
→
添加记录到问题文件”表示对问题列表中的记录进行更新。图3中的“文件备份”可以包括将原始文件复制到备份文件夹的复制操作,还包括在完成复制操作的情况下从原始数据文件
夹中删除原始文件的删除操作。在完成文件备份中的复制操作和删除操作的情况下,即为备份成功,无需添加到问题列表,在备份不成功的情况下,添加记录到问题列表。
70.其中有几点注意事项:1.问题列表使用配置文件进行保存,列表中的每个文件使用路径+文件md5的形式进行表示;2.每个文件记录以下信息:(1)转换次数:尝试转换的次数,超过指定次数则提示人工介入;(2)复制次数:尝试复制的次数,每次复制5次,超过就停止;(3)删除次数:尝试删除的次数,每次尝试5次,超过就停止;(4)首次操作时间:即第一次尝试的时间,精确到秒;(5)最后操作时间:即最后一次尝试的时间,精确到秒;(6)当前状态:包括待转换、待复制、待删除和已完成四种状态。
71.3.已完成日志:按年月日进行记录根据本公开的实施例,提出了一种用于文件流式处理中滞留文件的处理方法,能够有效应对在流式文件处理的业务中的文件滞留问题,具有易于实现、功能强大、可靠性高、追踪性强、实时性好等优点,可以广泛集成在流式文件处理系统中。
72.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制,因为依据本公开,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本公开所必须的。
73.以上是关于方法实施例的介绍,以下通过装置实施例,对本公开所述方案进行进一步说明。
74.图4示出了根据本公开的实施例的文件处理装置400的框图。如图4所示,装置400包括:获取模块410,用于从原始数据文件夹中获取待处理原始文件;处理模块420,用于根据问题列表对待处理原始文件进行处理,其中,问题列表中记录有处理过程中出现异常的原始文件的处理信息;记录模块430,用于在对待处理原始文件的处理出现异常的情况下,在问题列表中添加或更新待处理原始文件的处理信息。
75.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,所述描述的模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
76.根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
77.图5示出了能够实施本公开的实施例的示例性电子设备500的方框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制
本文中描述的和/或者要求的本公开的实现。
78.电子设备500包括计算单元501,其可以根据存储在rom502中的计算机程序或者从存储单元508加载到ram503中的计算机程序,来执行各种适当的动作和处理。在ram503中,还可存储电子设备500操作所需的各种程序和数据。计算单元501、rom502以及ram503通过总线504彼此相连。i/o接口505也连接至总线504。
79.电子设备500中的多个部件连接至i/o接口505,包括:输入单元506,例如键盘、鼠标等;输出单元507,例如各种类型的显示器、扬声器等;存储单元508,例如磁盘、光盘等;以及通信单元509,例如网卡、调制解调器、无线通信收发机等。通信单元509允许电子设备500通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
80.计算单元501可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元501的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元501执行上文所描述的各个方法和处理,例如方法100。例如,在一些实施例中,方法100可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元508。在一些实施例中,计算机程序的部分或者全部可以经由rom502和/或通信单元509而被载入和/或安装到电子设备500上。当计算机程序加载到ram503并由计算单元501执行时,可以执行上文描述的方法100的一个或多个步骤。备选地,在其他实施例中,计算单元501可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法100。
81.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
82.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
83.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或
上述内容的任何合适组合。
84.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置;以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
85.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
86.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
87.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
88.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
技术特征:
1.一种文件处理方法,其特征在于,包括:从原始数据文件夹中获取待处理原始文件;根据问题列表对所述待处理原始文件进行处理,其中,所述问题列表中记录有处理过程中出现异常的原始文件的处理信息;在对所述待处理原始文件的处理出现异常的情况下,在所述问题列表中添加或更新所述待处理原始文件的处理信息。2.根据权利要求1所述的方法,其特征在于,所述根据问题列表对所述待处理原始文件进行处理,包括:在所述问题列表中不存在所述待处理原始文件的处理信息,或,在所述问题列表中存在所述待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对所述待处理原始文件进行处理;在所述问题列表中存在所述待处理原始文件的处理信息且符合预设停止条件的情况下,停止对所述待处理原始文件进行处理。3.根据权利要求2所述的方法,其特征在于,所述预设处理流程,包括:将原始文件转换为预设格式的目标文件;在完成所述原始文件的转换操作的情况下,将所述原始文件复制到备份文件夹,并从所述原始数据文件夹中删除所述原始文件。4.根据权利要求3所述的方法,其特征在于,所述处理信息包括尝试转换次数、尝试复制次数、尝试删除次数和当前文件状态,文件状态包括待转换状态、待复制状态、待删除状态、已完成状态;所述预设停止条件包括所述尝试转换次数不小于第一阈值,或,所述尝试复制次数不小于第二阈值,或,所述尝试删除次数不小于第三阈值,或,所述当前文件状态为已完成状态。5.根据权利要求4所述的方法,其特征在于,在所述问题列表中存在所述待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对所述待处理原始文件进行处理,包括:按照所述当前文件状态和所述预设处理流程,确定出对所述待处理原始文件的当前处理流程;按照所述当前处理流程对所述待处理原始文件进行处理。6.根据权利要求4所述的方法,其特征在于,所述处理信息还包括首次操作时间和最后操作时间;所述预设停止条件还包括所述最后操作时间与所述首次操作时间之间的时间间隔不小于第一时长。7.根据权利要求6所述的方法,其特征在于,在所述问题列表中存在所述待处理原始文件的处理信息且不符合预设停止条件的情况下,按照预设处理流程对所述待处理原始文件进行处理,包括:在当前时间与所述最后操作时间之间的时间间隔不大于第二时长的情况下,暂停按照预设处理流程对所述待处理原始文件进行处理。8.一种文件处理装置,其特征在于,包括:
获取模块,用于从原始数据文件夹中获取待处理原始文件;处理模块,用于根据问题列表对所述待处理原始文件进行处理,其中,所述问题列表中记录有处理过程中出现异常的原始文件的处理信息;记录模块,用于在对所述待处理原始文件的处理出现异常的情况下,在所述问题列表中添加或更新所述待处理原始文件的处理信息。9.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一权利要求所述的方法。10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1至7中任一权利要求所述的方法。
技术总结
本公开的实施例提供了一种文件处理方法、装置、设备以及存储介质。应用于数据处理技术领域,所述方法包括从原始数据文件夹中获取待处理原始文件;根据问题列表对待处理原始文件进行处理,其中,问题列表中记录有处理过程中出现异常的原始文件的处理信息;在对待处理原始文件的处理出现异常的情况下,在问题列表中添加或更新待处理原始文件的处理信息。以此方式,可以解决数据采集和处理中对滞留文件采取人工方式解决导致效率较低的技术问题。人工方式解决导致效率较低的技术问题。人工方式解决导致效率较低的技术问题。
技术研发人员:郝伟 沈传宝 刘加瑞
受保护的技术使用者:安徽华云安科技有限公司
技术研发日:2023.07.19
技术公布日:2023/8/16
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
