一种工程交付归档文件的管理方法与流程

未命名 08-06 阅读：101 评论：0

1.本发明属于文件管理技术领域，具体涉及一种工程交付归档文件的管理方法。

背景技术：

2.工程项目竣工时，需要对工程项目中涉及到的所有资料、数据进行整编交付，归档文件是工程项目的重要成果，在工厂运营期间以及后期技改中起到关键作用。因此，需要对工程交付归档文件进行有效的管理。
3.工程项目交付归档文件中会包含大量的文档、图纸、三维模型等资料和数据，涉及多个参建方，包括建设单位、设计单位、施工单位、监理单位、供应商等。每个参建方生成的相关文件格式没有统一规定，且文件数量多，导致版本管理不规范，以及文件管理困难；各项目文件的存储工作较为混乱，无法进行统一、规则化存储，文件的版本同步慢，难以跟踪有效版本；在文件传输过程中，还容易发生文件缺失和损坏，导致归档质量差，效率低，且无法保证文件的有效性；现有的大部分文档及归档记录都是手动统计和记录，归档标准不一致，人力成本投入大，且无法保障已交付归档的文件质量。

技术实现要素：

4.为了解决现有技术存在的管理困难、存储混乱，有效性差、效率低、人力成本投入大，文件交付归档质量差的问题，本发明目的在于提供一种工程交付归档文件的管理方法。
5.本发明所采用的技术方案为：
6.一种工程交付归档文件的管理方法，包括如下步骤：
7.获取工程交付归档文件，并对工程交付归档文件进行分析，得到不同类型的源数据；
8.对各类型的源数据进行数据抽取，得到格式化数据；
9.对格式化数据进行数据转换，得到数据结果；
10.对数据结果进行数据校验，若数据校验不合格，则对不合格的数据结果进行数据加载，得到对应的数据分析报表；
11.根据数据分析报表，生成异常提示，并根据异常提示，对工程交付归档文件进行修改与补充。
12.根据修改或补充的数据重复上面的所有步骤，直至数据校验合格。
13.进一步地，根据预设的文件头标识格式，对工程交付归档文件的文件头标识进行文件分析，得到对应类型的源数据；
14.源数据的类型包括文档类型、图纸类型以及三维模型。
15.进一步地，使用数据识别模型对文档类型的源数据进行数据抽取，使用图文识别模型对图纸类型的源数据进行数据抽取，使用轻量化模型对三维模型类型的源数据进行数据抽取。
16.进一步地，数据识别模型使用igwo-bp算法建立，包括如下步骤：
17.获取若干历史的文档数据，并根据若干历史的文档数据，构成数据识别模型训练样本集；
18.以数据识别的预测值与真实值的均方误差最小为优化目标，将bp神经网络的神经元个数、神经元初始连接权值以及神经元初始阈值作为igwo寻优算法的灰狼个体位置，使用circle混沌序列生成igwo寻优算法的初始灰狼种群，并计算每个灰狼个体的适应度值；
19.根据灰狼个体的适应度值，使用反向学习策略和优胜劣汰机制，更新灰狼种群；
20.若灰狼个体的适应度值或更新次数满足要求，则将当前灰狼种群中适应度值最优的灰狼个体的位置作为最优解进行输出，得到bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值；
21.根据bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值，输入数据识别模型训练样本集进行优化训练，得到数据识别模型。
22.进一步地，引入circle混沌序列初始化和动态反向学习策略对传统的灰狼寻优算法进行优化，得到igwo寻优算法；
23.circle混沌序列初始化公式为：
[0024][0025]
式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)为mod函数；i为个体指示量；j为维度指示量；
[0026]
动态反向学习策略的公式为：
[0027]
x'
ij
(t)＝k(aj(t)+bj(t))-x
ij
(t)
[0028]
式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；aj(t)、bj(t)分别为当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；
[0029]
igwo寻优算法的公式为：
[0030][0031]
式中，x(t+1)为t+1时刻人工灰狼进行猎捕活动移动的位置；x1、x2、x3、x
ω
分别为最优领导者狼α、β、δ以及随机狼ω的位置；d1、d2、d3、d
ω
分别为人工灰狼到α、β、δ、ω狼的距离；a1、a2、a3、a
ω
均为收敛影响系数向量，由收敛因子a决定；w1、w2均为位置定位系数，w1＝w
·
r，w2＝(1-w)
·
r，w为位置定位因子，根据迭代次数决定且与迭代次数负相关，且w∈(0,1]，r为[0,1]之间的随机数；i为参数指示量；t为时刻指示量。
[0032]
进一步地，图文识别模型使用ctpn-crnn算法建立，包括如下步骤：
[0033]
获取若干含有文字区域的图片数据，并根据若干含有文字区域的图片数据，构成文字定位子模型训练样本集；
[0034]
获取若干含有变形文字的图片数据，并根据若干含有变形文字的图片数据，构成文字识别子模型训练样本集；
[0035]
获取若干含有变形文字区域的图片数据，并根据若干含有变形文字区域的图片数据，构成图文识别模型训练样本集；
[0036]
根据文字定位子模型训练样本集，使用ctpn算法进行优化训练，得到文字定位子
模型；
[0037]
根据文字识别子模型训练样本集，使用crnn算法进行优化训练，得到文字识别子模型；
[0038]
将文字定位子模型和文字识别子模型进行组合，并输入图文识别模型训练样本集进行优化训练，得到图文识别模型。
[0039]
进一步地，轻量化模型使用3dl-iafsa算法对三维模型进行轻量化，包括如下步骤：
[0040]
以三维模型仿真生成的点、面个数最少为优化目标，将点、面个数作为iafsa寻优算法的人工鱼的位置，使用circle混沌序列生成iafsa寻优算法的初始人工鱼群，并计算每条人工鱼的适应度值；
[0041]
根据人工鱼的适应度值，使用反向学习策略、优胜劣汰机制以及自适应人工鱼视野范围，更新人工鱼群；
[0042]
若人工鱼的适应度值或更新次数满足要求，则将当前人工鱼群中适应度值最优的人工鱼的位置作为最优解进行输出，得到三维模型的最小的点、面个数；
[0043]
根据三维模型的最少的点、面个数，得到轻量化的三维模型。
[0044]
进一步地，引入circle混沌序列初始化、动态反向学习策略以及基于柯西分布的自适应人工鱼视野机制对传统的人工鱼群算法进行改进，得到iafsa寻优算法；
[0045]
circle混沌序列初始化公式为：
[0046][0047]
式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)为mod函数；i为个体指示量；j为维度指示量；
[0048]
动态反向学习策略的公式为：
[0049]
x'
ij
(t)＝k(aj(t)+bj(t))-x
ij
(t)
[0050]
式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；aj(t)、bj(t)分别为当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；
[0051]
基于柯西分布的自适应人工鱼视野范围更新的公式为：
[0052][0053]
式中，v(xi)为人工鱼的视野范围更新函数；v为人工鱼的原始视野范围；vc(xi)为迭代后半程人工鱼经柯西分布变换后的视野范围；xi(t)为第i条人工鱼的位置；d、d
max
分别为当前迭代次数和最大迭代次数；
[0054]
柯西分布变换后的视野范围的公式为：
[0055][0056]
式中，vc(xi)为迭代后半程人工鱼经柯西分布变换后的视野范围；f(xi)为第i条人工鱼的适应度值；f
worst
为人工鱼的最劣的适应度值；γ为尺度参数，其值越小，柯西分布概
率密度曲线越陡峭，γ＝1/(π
·vorigin
)；v
origin
为初始视野值。
[0057]
进一步地，数据转换包括空值处理、数据格式规范化处理、数据拆分处理、数据正确性验证以及数据替换处理。
[0058]
进一步地，数据校验包括合规性校验、完整性校验、空目录校验、缺失性校验、文档关联校验、文档关联校验以及p&id关联校验。
[0059]
本发明的有益效果为：
[0060]
本发明提供的一种工程交付归档文件的管理方法，采用自动化的数据仓库(extract-transform-load，etl)技术，对工程交付归档文件进行统一的数据抽取、数据转换以及数据加载，针对不同类型的源数据分别进行处理，提高了对文件数量大且文件格式不同的管理工作的适应性，提高了文件管理和存储的自动化、智能化程度，避免了人工统计和记录，减少了人力成本投入，数据抽取缩减了存储成本，并且对文件进行各项数据校验，大幅度提高文件存档的有效性，有效屏蔽不合规文档和无效版本，提高文档质量的检测效率，在线操作可达秒级回复，数据分析报表动态实时更新，大大缩短了文档差错更新提交的周期，使归档文件有溯可追，有源可依，最后生成直观、便捷的异常提示，自动通知预警，为操作人员提供了极大的便利，为文件交付归档的质量提供了一定程度的保障。
[0061]
本发明的其他有益效果将在具体实施方式中进一步进行说明。
附图说明
[0062]
图1是本发明中工程交付归档文件管理方法的流程框图。
具体实施方式
[0063]
下面结合附图及具体实施例对本发明做进一步阐释。
[0064]
实施例1：
[0065]
如图1所示，本实施例提供一种工程交付归档文件的管理方法，包括如下步骤：
[0066]
获取工程交付归档文件，并对工程交付归档文件进行分析，得到不同类型的源数据；根据预设的文件头标识格式，对工程交付归档文件的文件头标识进行文件分析，得到对应类型的源数据；
[0067]
源数据的类型包括文档类型、图纸图纸以及三维模型；
[0068]
对各类型的源数据进行数据抽取，得到格式化数据；
[0069]
使用数据识别模型对文档类型的源数据进行数据抽取，数据识别模型使用igwo-bp算法建立，包括如下步骤：
[0070]
获取若干历史的文档数据，并根据若干历史的文档数据，构成数据识别模型训练样本集；
[0071]
以数据识别的预测值与真实值的均方误差最小为优化目标，将bp神经网络的神经元个数、神经元初始连接权值以及神经元初始阈值作为igwo寻优算法的灰狼个体位置，使用circle混沌序列生成改进灰狼(improved grey wolf optimization algorithm，igwo)寻优算法的初始灰狼种群，并计算每个灰狼个体的适应度值；
[0072]
根据灰狼个体的适应度值，使用反向学习策略和优胜劣汰机制，更新灰狼种群；
[0073]
若灰狼个体的适应度值或更新次数满足要求，则将当前灰狼种群中适应度值最优
的灰狼个体的位置作为最优解进行输出，得到bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值；
[0074]
根据bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值，输入数据识别模型训练样本集进行优化训练，得到数据识别模型；
[0075]
引入circle混沌序列初始化和动态反向学习策略对传统的灰狼寻优算法进行优化，得到igwo寻优算法；
[0076]
circle混沌序列初始化公式为：
[0077][0078]
式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)为mod函数；i为个体指示量；j为维度指示量；
[0079]
相较于随机生成初始种群容易导致分布不均匀，易陷入局部最优无法跳出的问题，circle混沌序列初始化在搜索空间中均匀分布生成初始种群个体，提高了算法的收敛速度；
[0080]
动态反向学习策略的公式为：
[0081]
x'
ij
(t)＝k(aj(t)+bj(t))-x
ij
(t)
[0082]
式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；aj(t)、bj(t)分别为当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；
[0083]
动态反向学习策略在个体陷入局部最优值时，扩展搜索方向进行反向搜索，帮助跳出局部最优值，进一步提高了算法的收敛速度和识别准确性率；
[0084]
igwo寻优算法的公式为：
[0085][0086]
式中，x(t+1)为t+1时刻人工灰狼进行猎捕活动移动的位置；x1、x2、x3、x
ω
分别为最优领导者狼α、β、δ以及随机狼ω的位置；d1、d2、d3、d
ω
分别为人工灰狼到α、β、δ、ω狼的距离；a1、a2、a3、a
ω
均为收敛影响系数向量，由收敛因子a决定；w1、w2均为位置定位系数，w1＝w
·
r，w2＝(1-w)
·
r，w为位置定位因子，根据迭代次数决定且与迭代次数负相关，且w∈(0,1]，r为[0,1]之间的随机数；i为参数指示量；t为时刻指示量；
[0087]
在迭代前期，位置定位系数w1维持在较高的数值，保证了灰狼种群在全局的捕猎能力和搜索能力，在迭代后期，位置定位系数w2维持在较高的数值，保证了灰狼种群在局部的攻击能力，因此，igwo寻优算法能够提高bp神经网络的收敛性能和收敛速度，避免了bp神经网络早熟和陷入局部最优值，提高了数据识别的准确性和效率；
[0088]
使用图文识别模型对图纸类型的源数据进行数据抽取，图文识别模型使用ctpn-crnn算法建立，包括如下步骤：
[0089]
获取若干含有文字区域的图片数据，并根据若干含有文字区域的图片数据，构成文字定位子模型训练样本集；
[0090]
获取若干含有变形文字的图片数据，并根据若干含有变形文字的图片数据，构成文字识别子模型训练样本集；
[0091]
获取若干含有变形文字区域的图片数据，并根据若干含有变形文字区域的图片数据，构成图文识别模型训练样本集；
[0092]
根据文字定位子模型训练样本集，使用基于连接预选框网络的文本检测(detecting text in natural image with connectionist text proposal network，ctpn)算法进行优化训练，得到文字定位子模型；
[0093]
根据文字识别子模型训练样本集，使用卷积递归神经网络(convolutional recurrent neural network，crnn)算法进行优化训练，得到文字识别子模型；
[0094]
将文字定位子模型和文字识别子模型进行组合，并输入图文识别模型训练样本集进行优化训练，得到图文识别模型；
[0095]
ctpn算法能够提高图文识别模型对图纸类型的源数据中文字区域的定位准确率和效率，crnn算法能够提高图文识别模型对文字区域的文字识别准确率和效率，因此，图文识别模型能够准确、快速的识别出图纸类型的源数据的文字数据；
[0096]
使用轻量化模型对三维模型类型的源数据进行数据抽取，轻量化模型使用三维模型3dl-iafsa算法对三维模型进行轻量化，包括如下步骤：
[0097]
以三维模型仿真生成的点、面个数最少为优化目标，将点、面个数作为iafsa寻优算法的人工鱼的位置，使用circle混沌序列生成改进人工鱼群(improved artificial fish school algorithm，iafsa)寻优算法的初始人工鱼群，并计算每条人工鱼的适应度值；
[0098]
根据人工鱼的适应度值，使用反向学习策略、优胜劣汰机制以及自适应人工鱼视野范围，更新人工鱼群；
[0099]
若人工鱼的适应度值或更新次数满足要求，则将当前人工鱼群中适应度值最优的人工鱼的位置作为最优解进行输出，得到三维模型的最小的点、面个数；
[0100]
根据三维模型的最少的点、面个数，得到轻量化的三维模型；
[0101]
三维模型由网格和纹理构成，网格是通过物体中的点云而形成的，点云包括空间坐标信息、光线反射强度以及颜色信息，三维网格就是通过点到线、线到面、再由面构建成三维物体。越复杂的三维场景，需要点和面的数量就越多，当模型的精细复杂度达到一定程度，就会占用大量内存，造成工程交付归档文件管理流程卡顿，甚至硬件系统崩溃，因此，充分考虑到现实的需求，删除不需要的点和面，开展模型轻量化，针对三维模型的源数据占用大量内存的问题，本实施例使用3dl-iafsa算法对三维模型进行轻量化，在确保三维数据准确性的基础上，降低冗余类型，减少数据量，并加快模型的轻量化速度，提高了后续的数据转换的效率；
[0102]
引入circle混沌序列初始化、动态反向学习策略以及基于柯西分布的自适应人工鱼视野机制对传统的人工鱼群算法进行改进，得到iafsa寻优算法；
[0103]
circle混沌序列初始化公式为：
[0104][0105]
式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)为mod函数；i为个体指示量；j为维度指示量；
[0106]
动态反向学习策略的公式为：
[0107]
x'
ij
(t)＝k(aj(t)+bj(t))-x
ij
(t)
[0108]
式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；aj(t)、bj(t)分别为当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；
[0109]
基于柯西分布的自适应人工鱼视野范围更新的公式为：
[0110][0111]
式中，v(xi)为人工鱼的视野范围更新函数；v为人工鱼的原始视野范围；vc(xi)为迭代后半程人工鱼经柯西分布变换后的视野范围；xi(t)为第i条人工鱼的位置；d、d
max
分别为当前迭代次数和最大迭代次数；
[0112]
柯西分布变换后的视野范围的公式为：
[0113][0114]
式中，vc(xi)为迭代后半程人工鱼经柯西分布变换后的视野范围；f(xi)为第i条人工鱼的适应度值；f
worst
为人工鱼的最劣的适应度值；γ为尺度参数，其值越小，柯西分布概率密度曲线越陡峭，γ＝1/(π
·vorigin
)；v
origin
为初始视野值；
[0115]
对格式化数据进行数据转换，得到数据结果；数据转换包括空值处理、数据格式规范化处理、数据拆分处理、数据正确性验证以及数据替换处理；
[0116]
对数据结果进行数据校验，若数据校验不合格，则对不合格的数据结果进行数据加载，得到对应的数据分析报表；
[0117]
数据校验包括合规性校验、完整性校验、空目录校验、缺失性校验、文档关联校验、文档关联校验以及工艺管道与仪表流程图p&id关联校验；
[0118]
对应的数据分析报表包括合规性校验数据分析报表、完整性校验数据分析报表、空目录校验数据分析报表、缺失性校验数据分析报表、文档关联校验数据分析报表、文档关联校验数据分析报表以及p&id关联校验数据分析报表；
[0119]
根据数据分析报表，生成异常提示，并将异常提示通过消息推送的方式发送至操作人员的移动终端或管理中心；
[0120]
操作人员根据异常提示，对工程交付归档文件进行修改与补充，包括重新上传对应的工程交付归档文件，或者对工程交付归档文件中不合规的内容进行修改与补充，并对数据分析报表中对编辑、补充的数据分析报表进行实时更新。
[0121]
本发明提供的一种工程交付归档文件的管理方法，采用自动化的etl技术，对工程交付归档文件进行统一的数据抽取、数据转换以及数据加载，针对不同类型的源数据分别进行处理，提高了对文件数量大且文件格式不同的管理工作的适应性，提高了文件管理和存储的自动化、智能化程度，避免了人工统计和记录，减少了人力成本投入，数据抽取缩减了存储成本，并且对文件进行各项数据校验，大幅度提高文件存档的有效性，有效屏蔽不合规文档和无效版本，提高文档质量的检测效率，在线操作可达秒级回复，数据分析报表动态实时更新，大大缩短了文档差错更新提交的周期，使归档文件有溯可追，有源可依，最后生成直观、便捷的异常提示，自动通知预警，为操作人员提供了极大的便利。
[0122]
本发明不局限于上述可选的实施方式，任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制，本发明的保护范围应当以权利要求书中界定的为准，并且说明书可以用于解释权利要求书。

技术特征：
1.一种工程交付归档文件的管理方法，其特征在于：包括如下步骤：获取工程交付归档文件，并对工程交付归档文件进行分析，得到不同类型的源数据；对各类型的源数据进行数据抽取，得到格式化数据；对格式化数据进行数据转换，得到数据结果；对数据结果进行数据校验，若数据校验不合格，则对不合格的数据结果进行数据加载，得到对应的数据分析报表；根据数据分析报表，生成异常提示，并根据异常提示，对工程交付归档文件进行修改与补充。2.根据权利要求1所述的一种工程交付归档文件的管理方法，其特征在于：根据预设的文件头标识格式，对工程交付归档文件的文件头标识进行文件分析，得到对应类型的源数据；所述的源数据的类型包括文档类型、图纸类型、三维模型。3.根据权利要求2所述的一种工程交付归档文件的管理方法，其特征在于：使用数据识别模型对文档类型的源数据进行数据抽取，使用图文识别模型对图纸类型的源数据进行数据抽取，使用轻量化模型对三维模型类型的源数据进行数据抽取。4.根据权利要求3所述的一种工程交付归档文件的管理方法，其特征在于：所述的数据识别模型使用igwo-bp算法建立，包括如下步骤：获取若干历史的文档数据，并根据若干历史的文档数据，构成数据识别模型训练样本集；以数据识别的预测值与真实值的均方误差最小为优化目标，将bp神经网络的神经元个数、神经元初始连接权值以及神经元初始阈值作为igwo寻优算法的灰狼个体位置，使用circle混沌序列生成igwo寻优算法的初始灰狼种群，并计算每个灰狼个体的适应度值；根据灰狼个体的适应度值，使用反向学习策略和优胜劣汰机制，更新灰狼种群；若灰狼个体的适应度值或更新次数满足要求，则将当前灰狼种群中适应度值最优的灰狼个体的位置作为最优解进行输出，得到bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值；根据bp神经网络最优的神经元个数、神经元初始连接权值以及神经元初始阈值，输入数据识别模型训练样本集进行优化训练，得到数据识别模型。5.根据权利要求4所述的一种工程交付归档文件的管理方法，其特征在于：引入circle混沌序列初始化和动态反向学习策略对传统的灰狼寻优算法进行优化，得到所述的igwo寻优算法；circle混沌序列初始化公式为：式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)为mod函数；i为个体指示量；j为维度指示量；动态反向学习策略的公式为：x'
ij
(t)＝k(a
j
(t)+b
j
(t))-x
ij
(t)式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；a
j
(t)、b
j
(t)分别为
当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；igwo寻优算法的公式为：式中，x(t+1)为t+1时刻人工灰狼进行猎捕活动移动的位置；x1、x2、x3、x
ω
分别为最优领导者狼α、β、δ以及随机狼ω的位置；d1、d2、d3、d
ω
分别为人工灰狼到α、β、δ、ω狼的距离；a1、a2、a3、a
ω
均为收敛影响系数向量，由收敛因子a决定；w1、w2均为位置定位系数，w1＝w
·
r，w2＝(1-w)
·
r，w为位置定位因子，根据迭代次数决定且与迭代次数负相关，且w∈(0,1]，r为[0,1]之间的随机数；i为参数指示量；t为时刻指示量。6.根据权利要求3所述的一种工程交付归档文件的管理方法，其特征在于：所述的图文识别模型使用ctpn-crnn算法建立，包括如下步骤：获取若干含有文字区域的图片数据，并根据若干含有文字区域的图片数据，构成文字定位子模型训练样本集；获取若干含有变形文字的图片数据，并根据若干含有变形文字的图片数据，构成文字识别子模型训练样本集；获取若干含有变形文字区域的图片数据，并根据若干含有变形文字区域的图片数据，构成图文识别模型训练样本集；根据文字定位子模型训练样本集，使用ctpn算法进行优化训练，得到文字定位子模型；根据文字识别子模型训练样本集，使用crnn算法进行优化训练，得到文字识别子模型；将文字定位子模型和文字识别子模型进行组合，并输入图文识别模型训练样本集进行优化训练，得到图文识别模型。7.根据权利要求3所述的一种工程交付归档文件的管理方法，其特征在于：所述的轻量化模型使用3dl-iafsa算法对三维模型进行轻量化，包括如下步骤：以三维模型仿真生成的点、面个数最少为优化目标，将点、面个数作为iafsa寻优算法的人工鱼的位置，使用circle混沌序列生成iafsa寻优算法的初始人工鱼群，并计算每条人工鱼的适应度值；根据人工鱼的适应度值，使用反向学习策略、优胜劣汰机制以及自适应人工鱼视野范围，更新人工鱼群；若人工鱼的适应度值或更新次数满足要求，则将当前人工鱼群中适应度值最优的人工鱼的位置作为最优解进行输出，得到三维模型的最小的点、面个数；根据三维模型的最少的点、面个数，得到轻量化的三维模型。8.根据权利要求7所述的一种工程交付归档文件的管理方法，其特征在于：引入circle混沌序列初始化、动态反向学习策略以及基于柯西分布的自适应人工鱼视野机制对传统的人工鱼群算法进行改进，得到iafsa寻优算法；circle混沌序列初始化公式为：式中，x
i+1,j+1
为circle混沌映射种群初始位置；x
i,j
为随机生成种群初始位置；mod(
·
)
为mod函数；i为个体指示量；j为维度指示量；动态反向学习策略的公式为：x'
ij
(t)＝k(a
j
(t)+b
j
(t))-x
ij
(t)式中，x'
ij
(t)、x
ij
(t)分别为第i个体第j维的反向位置和正向位置；a
j
(t)、b
j
(t)分别为当前种群第j维的上界和下界；k为递减惯性因子，k＝0.9-0.5d/d
max
；d、d
max
分别为当前迭代次数和最大迭代次数；t为时刻指示量；基于柯西分布的自适应人工鱼视野范围更新的公式为：式中，v(x
i
)为人工鱼的视野范围更新函数；v为人工鱼的原始视野范围；v
c
(x
i
)为迭代后半程人工鱼经柯西分布变换后的视野范围；x
i
(t)为第i条人工鱼的位置；d、d
max
分别为当前迭代次数和最大迭代次数；柯西分布变换后的视野范围的公式为：式中，v
c
(x
i
)为迭代后半程人工鱼经柯西分布变换后的视野范围；f(x
i
)为第i条人工鱼的适应度值；f
worst
为人工鱼的最劣的适应度值；γ为尺度参数，其值越小，柯西分布概率密度曲线越陡峭，γ＝1/(π
·
v
origin
)；v
origin
为初始视野值。9.根据权利要求1所述的一种工程交付归档文件的管理方法，其特征在于：所述的数据转换包括空值处理、数据格式规范化处理、数据拆分处理、数据正确性验证以及数据替换处理。10.根据权利要求1所述的一种工程交付归档文件的管理方法，其特征在于：所述的数据校验包括合规性校验、完整性校验、空目录校验、缺失性校验、文档关联校验、文档关联校验以及p&id关联校验。

技术总结
本发明属于文件管理技术领域，公开了一种工程交付归档文件的管理方法。所述的方法包括如下步骤：获取工程交付归档文件，并对工程交付归档文件进行分析，得到不同类型的源数据；对各类型的源数据进行数据抽取，得到格式化数据；对格式化数据进行数据转换，得到数据结果；对数据结果进行数据校验，若数据校验不合格，则对不合格的数据结果进行数据加载，得到对应的数据分析报表；根据数据分析报表，生成异常提示，并根据异常提示，对工程交付归档文件进行修改与补充。本发明解决了现有技术存在的管理困难、存储混乱，有效性差、效率低、人力成本投入大，文件交付归档质量差的问题。文件交付归档质量差的问题。文件交付归档质量差的问题。

技术研发人员：袁磊林云霞龚力军唐吉梅武益博曹瑞郭亚雯尤嘉庆张利勇陈蒙王光耀蔡爱华殷婕韩轩张蕴平
受保护的技术使用者：宝钢工程技术集团有限公司
技术研发日：2023.03.22
技术公布日：2023/7/25

版权声明

本文仅代表作者观点，不代表航空之家立场。
本文系作者授权航家号发表，未经原创作者书面授权，任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时，须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的，航空之家将依法追究其法律责任。（航空之家官方QQ：2926969996）

飞行汽车 https://www.autovtol.com/

一种工程交付归档文件的管理方法与流程

版权声明

航空之家

相关推荐

文章排行

最近发表

标签列表

一种工程交付归档文件的管理方法与流程

版权声明

相关文章

航空之家

相关推荐

文章排行

最近发表

标签列表