钻孔柱状图处理方法及装置、电子设备和存储介质与流程
未命名
07-26
阅读:124
评论:0
1.本公开涉及信息处理技术领域:
:,尤其涉及一种钻孔柱状图处理方法及装置、电子设备和存储介质。
背景技术:
::2.地质数据的标准化管理和三维地质建模是地质信息系统建设的重要工作,而将大量钻孔信息通过表格的形式存储至数据库,是地质数据标准化管理的重要工作之一,也是三维地质建模的基础。技术实现要素:3.有鉴于此,本公开提出了一种钻孔柱状图处理方法及装置、电子设备和存储介质的技术方案。4.根据本公开的一方面,提供了一种钻孔柱状图处理方法,包括获取待处理钻孔柱状图,提取图像信息,其中,所述图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;根据所述单行文字信息和所述多行文字信息,确定文字信息列表;根据所述直线信息和所述多段线信息,确定直线信息列表;根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格。5.在一种可能的实现方式中,所述获取待处理钻孔柱状图,提取图像信息,包括:将所述待处理钻孔柱状图转化为dxf格式的钻孔柱状图;根据所述dxf格式的钻孔柱状图,提取所述图像信息。6.在一种可能的实现方式中,所述根据所述单行文字信息和所述多行文字信息,确定文字信息列表,包括:获取所述多行文字信息,去除所述多行文字信息中的无效信息,确定处理后的多行文字信息;根据所述单行文字信息和所述处理后的多行文字信息,确定所述文字信息列表。7.在一种可能的实现方式中,所述根据所述直线信息和所述多段线信息,确定直线信息列表,包括:获取所述多段线信息,确定多段线的折线顶点坐标;根据所述折线顶点坐标,将所述多段线拆分为拆分直线,确定所述拆分直线的拆分直线信息;根据所述直线信息和所述拆分直线信息,对直线和所述拆分直线进行分割及去重,确定所述直线信息列表。8.在一种可能的实现方式中,所述根据所述直线信息和所述拆分直线信息,对直线和所述拆分直线进行分割及去重,确定所述直线信息列表,包括:根据所述直线信息和所述拆分直线信息,确定所述直线和所述拆分直线的角度;根据所述直线和所述拆分直线的角度,确定所述直线和所述拆分直线中的水平线、竖直线和斜线;根据所述直线信息和所述拆分直线信息,确定水平线信息、竖直线信息和斜线信息;根据所述水平线信息和所述竖直线信息,对所述直线和所述拆分直线进行分割及去重,确定所述直线信息列表。9.在一种可能的实现方式中,所述根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格,包括:根据所述直线信息列表,确定待处理钻孔柱状图中多个单元格的范围信息;根据所述文字信息列表,获取表头和表项文字,确定所述表头和表项文字的坐标;根据所述多个单元格的范围信息和所述表头和表项文字的坐标,生成所述待处理钻孔柱状图对应的电子表格。10.在一种可能的实现方式中,所述单元格包括矩形单元格和梯形单元格,所述根据所述多个单元格的范围信息和所述表头和表项文字的坐标,生成所述待处理钻孔柱状图对应的电子表格之前,所述方法还包括:根据所述斜线信息,将所述梯形单元格拉伸为矩形。11.在一种可能的实现方式中,该方法还包括:根据所述文字信息列表,获取基础信息文字,确定所述基础信息文字的坐标;根据所述基础信息文字的坐标,对所述基础信息文字进行排序;将排序后的基础信息文字填入所述电子表格。12.在一种可能的实现方式中,所述文字信息列表包括文字内容、文字坐标、字体和颜色信息中的至少一项;所述直线信息列表包括直线的端点坐标、直线长度、直线形状和颜色信息中的至少一项。13.根据本公开的另一方面,提供了一种钻孔柱状图处理装置,包括:提取模块,用于获取待处理钻孔柱状图,提取图像信息,其中,所述图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;文字信息处理模块,用于根据所述单行文字信息和所述多行文字信息,确定文字信息列表;直线信息处理模块,用于根据所述直线信息和所述多段线信息,确定直线信息列表;电子表格生成模块,用于根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格。14.根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现上述方法。15.根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。16.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。17.在本公开实施例中,获取待处理钻孔柱状图,提取图像信息,其中,图像信息包括文字信息,多行文字信息,直线信息和多段线信息;根据文字信息和多行文字信息,确定文字信息列表;根据直线信息和多段线信息,确定直线信息列表;根据文字信息列表和直线信息列表,生成待处理钻孔柱状图对应的电子表格。本公开实施例基于钻孔柱状图中的信息类型,自动提取钻孔信息,适用于多种文件格式和图像模板的钻孔柱状图,具有较强的通用性,并可以批量处理钻孔柱状图的信息,提高信息提取的效率,节省时间成本,将提取出的钻孔信息,以电子表格的形式存储有利于后续检索查看以及使用。18.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。附图说明19.包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面,并且用于解释本公开的原理。20.图1示出根据本公开实施例的一种钻孔柱状图处理方法的流程图;21.图2示出根据相关技术中的一种dxf文件中单行文字相关信息的示意图;22.图3示出根据相关技术中的一种dxf文件中直线相关信息的示意图;23.图4示出根据相关技术中的一种dxf文件中多段线相关信息的示意图;24.图5示出根据相关技术中的一种钻孔柱状图的局部的示意图;25.图6示出根据相关技术中的一种钻孔柱状图的局部的示意图;26.图7示出根据本公开实施例的一种钻孔柱状图处理装置的框图;27.图8示出根据本公开实施例的一种电子设备的框图。具体实施方式28.以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。29.在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。30.本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。31.另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。32.地质数据的标准化管理和三维地质建模是地质信息系统建设的重要工作,而将大量钻孔信息通过表格的形式存储至数据库,是地质数据标准化管理的重要工作之一,也是三维地质建模的基础。钻孔信息通常以钻孔柱状图的形式记录和显示,钻孔柱状图是根据对钻孔岩(矿)芯(或岩屑、岩粉)的观察鉴定、取样分析及在钻孔内进行的各种测试所获取资料而编制成的一种基础图件,通过钻孔柱状图可以形象地表示出钻孔通过的岩层、矿体及其相互关系,是编制地质剖面图、综合类地质图件和三维地质建模的基础。钻孔柱状图通常是人工绘制的纸质图件,或是将原始数据根据预设模板,经过专业软件制作生成的电子图件,为了能够深入分析和应用钻孔信息,需要将钻孔柱状图中的钻孔信息提取出来,输入至结构化的表格中进行存储和管理。33.相关技术中,提取钻孔柱状图的信息主要依赖于人工的方式,通过人工将钻孔柱状图中的信息分条录入或复制至表格,再将表格中的信息提取出来,整理并导入数据库。这种方式工作量较大,且人工操作容易发生录入错误。34.相关技术中,可以针对特定的钻孔柱状图模板,使用特定专业软件进行提取。这种方式,只适用于特定模板的钻孔柱状图或特定的专业软件,通用性较差,适用性不强。35.本公开实施例提供了一种钻孔柱状图处理方法,可以应用于上述提取钻孔柱状图的信息的场景,获取待处理钻孔柱状图后可以批量、自动提取钻孔信息,适用于各种格式和预设图像模板的钻孔柱状图,具有较强的通用性,能够提高信息提取的效率,节省时间成本,以电子表格的形式存储提取到的钻孔信息,以便于后续检索查看以及应用。36.下面对本公开实施例提供的钻孔柱状图处理方法进行详细说明。37.图1示出根据本公开实施例的一种钻孔柱状图处理方法的流程图。该钻孔柱状图处理方法可以由终端设备或服务器等电子设备执行,终端设备可以为用户设备(userequipment,ue)等,该缺陷检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。或者,可通过服务器执行该钻孔柱状图处理方法。如图1所示,该钻孔柱状图处理方法包括:38.在步骤s11中,获取待处理钻孔柱状图,提取图像信息,其中,图像信息包括单行文字信息,多行文字信息,直线信息和多段信息。39.这里的待处理钻孔柱状图是需要进行提取钻孔信息的钻孔柱状图,待处理钻孔柱状图可以是基于各种图像模板、使用专业软件绘制的各种文件格式的图像文件,例如使用autocad等绘图软件绘制的dwg、dws、dwx、dxf等文件格式的图像,本公开对此不做具体限定。40.待处理钻孔柱状图由图形和文字构成,其中,图形由不同的线形绘制形成,可以将待处理钻孔柱状图中提取的图像信息,分为文字信息和线形信息两种,其中,文字信息包括单行文字信息和多行文字信息,线形信息包括直线信息和多段线信息,可以根据图像信息的类型,在待处理钻孔柱状图中提取图像信息。后文会结合本公开可能的实现方式,对提取图像信息的具体过程进行详细描述,此处不做赘述。41.待处理钻孔柱状图的数量上限,取决于执行该钻孔柱状图处理方法的电子设备的性能限制,本公开对此不做具体限定。42.在步骤s12中,根据单行文字信息和多行文字信息,确定文字信息列表。43.待处理钻孔柱状图中的文字,可以包括单行文字和多行文字。其中,单行文字的文字内容只有一行,所有文字的字体、颜色等格式都相同;多行文字的文字内容可以由任意数目的文字行或者段落组成,多行文字的字体、颜色等格式可以不同。44.根据文字的类型,可以将待处理钻孔柱状图中的文字信息分为单行文字信息和多行文字信息,根据提取到的单行文字信息和多行文字信息,可以确定文字信息列表。后文会结合本公开可能的实现方式,对确定文字信息列表的具体过程进行详细描述,此处不做赘述。45.在步骤s13中,根据直线信息和多段线信息,确定直线信息列表。46.待处理钻孔柱状图线形可以包括直线和多段线。其中,直线有且仅有两个端点,同一条直线的线宽相同;多段线可以包括直线和曲线,其中,曲线在autocad绘制的图纸中,表现为由多条短直线连接构成的折线,多段线具有多个顶点,可以根据顶点将多段线拆分为多条短直线,同一条多段线的线宽可以不同。47.根据线形的类型,可以将待处理钻孔柱状图中的线形信息分为直线信息和多段线信息,根据提取到的直线信息和多段线信息,可以确定直线信息列表。后文会结合本公开可能得实现方式,对确定直线信息列表的具体过程进行详细描述,此处不做赘述。48.在步骤s14中,根据文字信息列表和直线信息列表,生成待处理钻孔柱状图对应的电子表格。49.根据文字信息列表和直线信息列表,可以确定待处理钻孔柱状图中的全部图像信息,将文字信息列表中的文字信息,与直线信息列表中的直线信息进行匹配,可以生成电子表格。后文会结合本公开可能得实现方式,对生成电子表格的具体过程进行详细描述,此处不做赘述。50.在本公开实施例中,基于待处理钻孔柱状图中的信息类型,可以自动提取钻孔信息,适用于各种格式和预设图像模板的钻孔柱状图,具有较强的通用性,并可以自动批量处理钻孔柱状图,能够提高信息提取的效率,节省时间成本,以电子表格的形式存储提取到的钻孔信息,便于后续检索查看以及使用。51.在一种可能的实现方式中,获取待处理钻孔柱状图,提取图像信息,包括:将待处理钻孔柱状图转化为dxf格式的钻孔柱状图;根据dxf格式的钻孔柱状图,提取图像信息。52.dxf(drawinginterchangeformat/drawingexchangeformat,绘图交换文件)格式的图像文件,通过组代码和关联值的组合描述图形数据。dxf文件的内容包括:标题段(header)包括有关图形的常规信息;类段(classes)包括有关autocad应用程序定义的类的信息;表段(tables)包括多个不同表的定义,每个表中包括多个不同的符号条目,例如线性表(ltype)定义了dxf文件中的破折号、点、文本和符号的样式以及缩放比例;块段(blocks),包括构成图形中每个块参考的图像对象和图形实体;实体段(entities)包括图形的实际对象数据(图元)和图形实体,例如定义直线的数据为起始点坐标和终点坐标;对象段(objects)包括图像中的非图形对象,例如图元、符号记录表以及符号表以外的其他对象。53.dxf格式的文件中,每个组代码和对应的关联值各占一行,根据组代码和关联值的组合,能够解析对应的信息。如上所述,图像中的图形实体的信息主要记录在实体段中,通过解析实体段的组代码和关联值,能够获取待处理钻孔柱状图的图像信息,包括单行文字信息、多行文字信息、直线信息和多段线信息。54.示例性的,图2示出根据相关技术中的一种dxf文件中单行文字相关信息的示意图,如图2所示,“text”指示当前部分信息为单行文字信息,组代码“10”指示该单行文字的x坐标,其关联值指示x坐标的具体值,该单行文字的x坐标为34.450001774057;组代码“20”指示该单行文字的y坐标,其关联值指示y坐标的具体值,该单行文字的y坐标为18.29187530910667;组代码“30”指示该单行文字的z坐标,其关联值指示z坐标的具体值,该单行文字的z坐标为0.0;组代码“40”指示该单行文字的高度,其关联值指示高度的具体值,该单行文字的高度为3.0;组代码“62”指示该单行文字的颜色,其关联值指示颜色的编码,该单行文字的颜色编码为7;组代码“1”指示该单行文字的文字内容,其关联值指示具体的文字内容,该单行文字的文字内容为“a2”。55.dxf格式的文件中,“mtext”指示对应部分信息为多行文字信息,多行文字信息的解析方式与上述单行文字信息的解析方式相同。56.图3示出根据相关技术中的一种dxf文件中直线相关信息的示意图,如图3所示,“line”指示当前部分信息为直线信息,组代码“10”指示该直线起始点的x坐标,其关联值指示起始点x坐标的具体值,该直线起始点的x坐标为51.8000066757202;组代码“20”指示该直线起始点的y坐标,其关联值指示起始点y坐标的具体值,该直线起始点的y坐标为-118.2699999809265;组代码“30”指示该直线起始点的z坐标,其关联值指示起始点z坐标的具体值,该直线起始点的z坐标为0.0;组代码“11”指示该直线终点的x坐标,其关联值指示终点x坐标的具体值,该直线终点的x坐标为51.8000066757202;组代码“21”指示该直线终点的y坐标,其关联值指示终点y坐标的具体值,该直线终点的y坐标为-118.2699999809265;组代码“31”指示该直线终点的z坐标,其关联值指示终点z坐标的具体值,该直线终点的z坐标为0.0;组代码“62”指示该直线的颜色,其关联值指示颜色的编码,该直线的颜色编码为7。57.图4示出根据相关技术中的一种dxf文件中多段线相关信息的示意图,如图4所示,“lwpolyline”指示当前部分信息为多段线信息,组代码“10”指示该多段线中一个节点的x坐标,其关联值指示该节点的x坐标的具体值,其中一个节点的x坐标为52.07523879408836;组代码“20”指示该多段线中一个节点的y坐标,其关联值指示该节点的y坐标的具体值,其中一个节点的y坐标为-117.9828571251461;组代码“62”指示该多段线的颜色,其关联值指示颜色的编码,该多段线线的颜色编码为7。58.获取待处理钻孔柱状图后,可以将待处理钻孔柱状图转化为dxf格式的钻孔柱状图。可以通过文档的形式,直接读取dxf格式的钻孔柱状图的组代码和关联值,自动解析读取到的组代码和关联值,从而获取钻孔柱状图中的图像信息,也可以通过其他方式读取,本公开对此不做具体限定。59.在一种可能的实现方式中,文字信息列表包括文字内容、文字坐标、字体和颜色信息中的至少一项;直线信息列表包括直线的端点坐标、直线长度、直线形状和颜色信息中的至少一项。60.文字信息列表可以包括具体的文字内容,表示文字在待处理钻孔柱状图中位置的文字坐标,文字的字体和颜色信息,也可以包括其他与文字相关的信息,本技术对此不做具体限定。61.直线信息列表可以包括每一条直线的两个端点坐标,直线长度,直线形状(例如线宽、样式等)和颜色等信息,也可以包括其他与直线相关的信息,本技术对此不做具体限定。62.在一种可能的实现方式中,根据单行文字信息和多行文字信息,确定文字信息列表,包括:获取多行文字信息,去除多行文字信息中的无效信息,确定处理后的多行文字信息;根据单行文字信息和处理后的多行文字信息,确定文字信息列表。63.在dxf格式的钻孔柱状图提取获得的多行文字信息中,多行文字内容中除了在钻孔柱状图中显示的有效信息,还包括仅用于表示多行文字格式的无效信息,例如提取到的多行文字内容为:\a1;泥岩,其中,泥岩为显示在待处理钻孔柱状图中的实际内容,\a1为格式编码,格式编码属于无效信息。64.去除多行文字内容中的无效信息后,将单行文字信息和多行文字信息,根据文字内容、文字坐标、字体和颜色等信息的分类,整理确定文字信息列表。文字信息列表中的每一项可对应一个表头,或者一个表项的文字内容。65.在一种可能的实现方式中,根据直线信息和多段线信息,确定直线信息列表,包括:获取多段线信息,确定多段线的折线顶点坐标;根据折线顶点坐标,将多段线拆分为拆分直线,确定拆分直线的拆分直线信息;根据直线信息和拆分直线信息,对直线和拆分直线进行分割及去重,确定直线信息列表。66.多段线具有多个顶点,可以通过顶点将多段线拆分成多条较短的拆分直线,根据提取获得的多段线信息,可以确定每一条多段线中包含的多个顶点坐标,将顶点坐标作为拆分后确定的拆分直线的端点坐标,将多段线拆分成多条拆分直线。67.确定拆分直线后,可以根据顶点坐标以及多段线信息,确定每一条拆分直线对应的拆分直线信息。68.将直线信息和拆分直线信息,根据端点坐标、直线长度、直线形状和颜色等信息的分类,整理确定直线信息列表,后文会结合本公开可能得实现方式,对确定直线信息列表的具体过程进行详细描述,此处不做赘述。69.在一种可能的实现方式中,根据直线信息和拆分直线信息,对直线信息和拆分直线信息进行分割及去重,确定直线信息列表,包括:根据直线信息和拆分直线信息,确定直线和拆分直线的角度;根据直线和拆分直线的角度,确定直线和拆分直线中的水平线、竖直线和斜线;根据直线信息和拆分直线信息,确定水平线信息、竖直线信息和斜线信息;根据水平线信息和竖直线信息,对直线和拆分直线进行分割和去重,确定直线信息列表。70.根据直线信息和拆分直线信息,可以确定每一条直线或拆分直线的两个端点坐标,根据两个端点坐标可以确定对应的直线或拆分直线的斜率,进而确定对应的直线或拆分直线的角度。71.确定所有直线和拆分直线的角度后,根据直线和拆分直线的角度,可以将直线或拆分直线分为水平线、竖直线和斜线三种类型。根据直线信息和拆分直线的信息,可以确定水平线信息、竖直线信息和斜线信息,其中,水平线信息可以包括水平线两个端点坐标,竖直线信息可以包括竖直线的两个端点坐标。72.示例性的,直线a的两个端点坐标分别为a1(100,120)和a2(200,120),可以确定直线a的斜率为0,进而可以确定直线a的角度为0°,直线a对应为水平线a,将直线a的直线信息作为水平线a的水平线信息;直线b的两个端点坐标分别为b1(110,100)和b2(110,140),可以确定直线b的斜率为不存在,进而可以确定直线b的角度为90°,直线b对应为竖直线b,将直线b的直线信息作为竖直线b的竖直线信息;直线c的两个端点坐标分别为c1(500,500)和c2(600,600),可以确定直线c的斜率为1,进而可以确定直线c的角度为45°,直线c对应为斜线c,将直线c的直线信息作为斜线c的斜线信息。73.根据水平线信息和竖直线信息,以水平线为基准,依次与竖直线进行比较,可以确定每一条水平线与竖直线之间的交点坐标。根据交点坐标,将水平线分割成多条分割后直线。完成分割后,还可以根据水平线信息,对分割后的直线和拆分直线进行去重,去除直线和拆分直线中重叠的部分。74.以上述水平线a与竖直线b为例,水平线a的两个端点坐标分别为a1(100,120)和a2(200,120),竖直线b的两个端点坐标分别为b1(110,100)和b2(110,140),根据坐标的位置关系,可以确定水平线a与竖直线b相交,交点坐标为(110,120),根据交点坐标可以将水平线a分割为水平线a1和水平线a2,其中水平线a1的两个端点坐标分别为a11(100,120)和a12(110,120),水平线a2的两个端点坐标分别为a21(110,120)和a22(200,120)。75.示例性的,另有水平线d,其两个端点的坐标分别为d1(160,120)和d2(260,120),由此可知,水平线d与水平线a2在d1(160,120)到a22(200,120)之间的部分重叠,将重叠部分去除后,确定去重后的水平线d1,水平线d1的两个端点坐标分别为a22(200,120)和d2(260,120)。76.完成对直线和拆分直线的分割及去重处理后,确定处理后的直线和拆分直线信息,根据端点坐标、直线长度、直线形状和颜色等信息的分类,整理确定直线信息列表。77.在一种可能的实现方式中,根据文字信息列表和直线信息列表,生成待处理钻孔柱状图对应的电子表格,包括:根据直线信息列表,确定待处理钻孔柱状图中多个单元格的范围信息;根据文字信息列表,获取表头和表项文字,确定表头和表项文字的坐标;78.根据经过分割及去重处理后确定的直线信息列表,可以确定每条直线的端点坐标,根据直线的端点坐标可以确定多个单元格的顶点坐标,进而确定待处理钻孔柱状图中每个单元格的最小坐标范围。79.示例性的,可以在直线信息列表中,确定水平线e的两个端点坐标分别为e1(100,150)和e2(120,150),在直线信息列表中,获取与水平线e的两个端点e1、e2横坐标相同的其他水平线f和水平线g,水平线f的两个端点坐标分别为f1(100,200)和f2(120,200),水平线g的两个端点坐标分别为g1(100,500)和g2(120,500),根据水平线f和水平线g的纵坐标,确定水平线f与水平线e之间的竖直距离为50,水平线g与水平线e之间的数值距离为350,可以确定水平线f与水平线e之间的竖直距离最小,将水平线e和水平线f的端点作为单元格顶点,根据四个端点e1、e2、f1和f2的坐标,可以确定一个坐标范围最小的单元格a。也可以通过其他可能的方式,根据直线信息列表确定单元格的坐标范围,本技术对此不做具体限定。80.根据文字信息的文字内容,可以将待处理钻孔柱状图中的文字,分为基础信息文字、表头文字和表项文字。其中,基础信息文字包括钻孔标题、钻孔基本信息和用户自定义信息等内容,例如钻机机型及编号、机长、记录组长、地质员等;表头文字包括指明待处理钻孔柱状图每一列(或每一行)意义的内容,例如分层厚度、岩土描述等;表项文字包括待处理钻孔柱状图每一列(或每一行)的具体内容,例如每层岩土的具体描述。81.图5示出根据相关技术中的一种钻孔柱状图的局部的示意图,如图5所示,在待处理钻孔柱状图中,501部分所示文字为基础信息文字,502部分所示文字为表头文字,503部分所示文字为表项文字。82.通过上述过程,可以根据直线信息列表,可以确定待处理钻孔柱状图的所有单元格及其对应坐标范围。根据单元格的坐标范围,与待处理钻孔柱状图中的文字的坐标进行比较,如果某一文字的坐标,在某个单元格的坐标范围内,确定该文字为表头文字或表项文字,并且与该单元格匹配;如果该文字的坐标,不在任何一格单元格的坐标范围内,确定该文字为基础信息文字。83.以上述单元格a为例,一段文字a的坐标为(110,175),由此可知文字a在单元格a的坐标范围中,确定文字a为表头文字或表项文字,将文字a与单元格a匹配,表示在待处理钻孔柱状图中,文字a填充在单元格a中。一段文字b的坐标为(6555,6555),根据与所有单元格的坐标范围的比较结果,文字b不在任何一格单元格的坐标范围中,确定文字b为基础信息文字。84.将匹配成对的表头或表项文字与单元格,根据表头和表项文字的坐标,可以逐一绘制生成电子表格,对于生成电子表格的具体方式,本技术不做具体限定。85.示例性的,根据单元格与表头和表项文字的坐标,确定单元格与表头和表项文字的位置关系,可以在execl表格中绘制单元格边框,将表头和表项文字填充至匹配的单元格中;也可以在word文件中绘制表格,将表头和表项文字填充至匹配的单元格中。86.在一种可能的实现方式中,单元格包括矩形单元格和梯形单元格,根据多个单元格的范围信息和表头和表项文字的坐标,生成待处理钻孔柱状图对应的电子表格之前,该方法还包括:根据斜线信息,将梯形单元格拉伸为矩形。87.在待处理钻孔柱状图中,由于岩层或矿体的柱状,与对应的文字内容之间的高度可能无法准确对齐,导致存在斜线,从而产生斜对应的梯形单元格,图6示出根据相关技术中的一种钻孔柱状图的局部的示意图,如图6所示,601部分所示文字为单行文字,602部分所示文字为多行文字,603部分所示为由于无法对齐产生的斜线。88.根据直线信息列表中的斜线信息,可以确定斜线的两个端点坐标,通过调整斜线的端点坐标,将梯形单元格拉伸变形成矩形。89.以上述斜线c为例,斜线c的两个端点坐标分别为c1(500,500)和c2(600,600),以端点c1(500,500)为基准,可以调整端点c2的坐标为(600,500),实现将斜线c拉伸为直线。也可以通过其他可能的方式,将斜线对应的梯形单元格拉伸成矩形,本技术不做具体限定。90.在一种可能的实现方式中,该方法还包括:根据文字信息列表,获取基础信息文字,确定基础信息文字的坐标;根据基础信息文字的坐标,对基础信息文字进行排序;将排序后的基础信息文字填入电子表格。91.通过上述过程,根据文字信息列表,可以获取钻孔柱状图的基础信息文字,并确定对应的坐标,根据基础文字信息的横坐标,将基础信息文字水平排序,将排序后的基础信息文字填入电子表格中。92.可以理解,本公开提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本公开不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。93.此外,本公开还提供了钻孔柱状图处理装置、电子设备、计算机可读存储介质、程序,上述均可用来实现本公开提供的任一种钻孔柱状图处理方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。94.图7示出根据本公开实施例的一种钻孔柱状图处理装置的框图。如图7所示,钻孔柱状图处理装置700包括:95.提取模块701,用于获取待处理钻孔柱状图,提取图像信息,其中,图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;96.文字信息处理模块702,用于根据单行文字信息和多行文字信息,确定文字信息列表;97.直线信息处理模块703,用于根据直线信息和所述多段线信息,确定直线信息列表;98.电子表格生成模块704,用于根据文字信息列表和直线信息列表,生成待处理钻孔柱状图对应的电子表格。99.在一种可能的实现方式中,提取模块701,包括:100.格式转化子模块,用于将待处理钻孔柱状图转化为dxf格式的钻孔柱状图;101.图像信息提取子模块,用于根据dxf格式的钻孔柱状图,提取图像信息。102.在一种可能的实现方式中,文字信息列表包括文字内容、文字坐标、字体和颜色信息中的至少一项;直线信息列表包括直线的端点坐标、直线长度、直线形状和颜色信息中的至少一项。103.在一种可能的实现方式中,文字信息处理模块702,包括:104.预处理子模块,用于获取多行文字信息,去除多行文字信息中的无效信息,确定处理后的多行文字信息;105.文字信息列表生成子模块,用于根据单行文字信息和处理后的多行文字信息,确定文字信息列表。106.在一种可能的实现方式中,直线信息处理模块703,包括:107.折线顶点确定子模块,用于获取多段线信息,确定多段线的折线顶点坐标;108.多段线拆分子模块,用于根据折线顶点坐标,将多段线拆分为拆分直线,确定拆分直线的拆分直线信息;109.直线信息列表生成子模块,用于根据直线信息和拆分直线信息,对直线和拆分直线进行分割及去重,确定直线信息列表。110.在一种可能的实现方式中,直线信息列表生成子模块,包括:111.分类子单元,用于根据直线信息和拆分直线信息,确定直线和拆分直线的角度;根据直线和拆分直线的角度,确定直线和拆分直线中的水平线、竖直线和斜线;112.信息确定子单元,用于根据直线信息和拆分直线信息,确定水平线信息、竖直线信息和斜线信息;113.生成子单元,用于根据水平线信息和竖直线信息,对直线和拆分直线进行分割和去重,确定直线信息列表。114.在一种可能的实现方式中,电子表格生成模块304,包括:115.单元格确定子模块,用于根据直线信息列表,确定待处理钻孔柱状图中多个单元格的范围信息;116.文字坐标确定子模块,根据文字信息列表,获取表头和表项文字,确定表头和表项文字的坐标;117.电子表格生成子模块,根据多个单元格的范围信息和表头和表项文字的坐标,生成待处理钻孔柱状图对应的电子表格。118.在一种可能的实现方式中,单元格包括矩形单元格和梯形单元格,单元格确定子模块,包括:119.矩形化子单元,用于根据斜线信息,将梯形单元格拉伸为矩形。120.在一种可能的实现方式中,电子表格生成模块704,还包括:121.基础信息文字获取子模块,用于根据文字信息列表,获取基础信息文字,确定基础信息文字的坐标;122.基础信息文字填充子模块,用于根据基础信息文字的坐标,对基础信息文字进行排序;将排序后的基础信息文字填入电子表格。123.在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。124.本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。125.本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现上述方法。126.本公开实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当所述计算机可读代码在电子设备的处理器中运行时,所述电子设备中的处理器执行上述方法。127.图8示出根据本公开实施例的一种电子设备的框图。例如,装置1900可以被提供为一服务器或终端设备。参照图8,装置1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。128.装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理,一个有线或无线网络接口1950被配置为将装置1900连接到网络,和一个输入输出(i/o)接口1958。装置1900可以操作基于存储在存储器1932的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。129.在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。130.本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。131.计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。132.这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。133.用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。134.这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。135.这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。136.也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。137.附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。138.以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本
技术领域:
:的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本
技术领域:
:的其它普通技术人员能理解本文披露的各实施例。当前第1页12当前第1页12
技术特征:
1.一种钻孔柱状图处理方法,其特征在于,包括:获取待处理钻孔柱状图,提取图像信息,其中,所述图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;根据所述单行文字信息和所述多行文字信息,确定文字信息列表;根据所述直线信息和所述多段线信息,确定直线信息列表;根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格。2.根据权利要求1所述的方法,其特征在于,所述获取待处理钻孔柱状图,提取图像信息,包括:将所述待处理钻孔柱状图转化为dxf格式的钻孔柱状图;根据所述dxf格式的钻孔柱状图,提取所述图像信息。3.根据权利要求1或2所述的方法,其特征在于,所述根据所述单行文字信息和所述多行文字信息,确定文字信息列表,包括:获取所述多行文字信息,去除所述多行文字信息中的无效信息,确定处理后的多行文字信息;根据所述单行文字信息和所述处理后的多行文字信息,确定所述文字信息列表。4.根据权利要求1至3任意一项所述的方法,其特征在于,所述根据所述直线信息和所述多段线信息,确定直线信息列表,包括:获取所述多段线信息,确定多段线的折线顶点坐标;根据所述折线顶点坐标,将所述多段线拆分为拆分直线,确定所述拆分直线的拆分直线信息;根据所述直线信息和所述拆分直线信息,对直线和所述拆分直线进行分割及去重,确定所述直线信息列表。5.根据权利要求4所述的方法,其特征在于,所述根据所述直线信息和所述拆分直线信息,对直线和所述拆分直线进行分割及去重,确定所述直线信息列表,包括:根据所述直线信息和所述拆分直线信息,确定所述直线和所述拆分直线的角度;根据所述直线和所述拆分直线的角度,确定所述直线和所述拆分直线中的水平线、竖直线和斜线;根据所述直线信息和所述拆分直线信息,确定水平线信息、竖直线信息和斜线信息;根据所述水平线信息和所述竖直线信息,对所述直线和所述拆分直线进行分割及去重,确定所述直线信息列表。6.根据权利要求1至5任意一项所述的方法,其特征在于,所述根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格,包括:根据所述直线信息列表,确定待处理钻孔柱状图中多个单元格的范围信息;根据所述文字信息列表,获取表头和表项文字,确定所述表头和表项文字的坐标;根据所述多个单元格的范围信息和所述表头和表项文字的坐标,生成所述待处理钻孔柱状图对应的电子表格。7.根据权利要求6所述的方法,其特征在于,所述单元格包括矩形单元格和梯形单元格,
所述根据所述多个单元格的范围信息和所述表头和表项文字的坐标,生成所述待处理钻孔柱状图对应的电子表格之前,所述方法还包括:根据所述斜线信息,将所述梯形单元格拉伸为矩形。8.根据权利要求1至7任意一项所述的方法,其特征在于,所述方法还包括:根据所述文字信息列表,获取基础信息文字,确定所述基础信息文字的坐标;根据所述基础信息文字的坐标,对所述基础信息文字进行排序;将排序后的基础信息文字填入所述电子表格。9.根据权利要求1所述的方法,其特征在于,所述文字信息列表包括文字内容、文字坐标、字体和颜色信息中的至少一项;所述直线信息列表包括直线的端点坐标、直线长度、直线形状和颜色信息中的至少一项。10.一种钻孔柱状图处理装置,其特征在于,包括:提取模块,用于获取待处理钻孔柱状图,提取图像信息,其中,所述图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;文字信息处理模块,用于根据所述单行文字信息和所述多行文字信息,确定文字信息列表;直线信息处理模块,用于根据所述直线信息和所述多段线信息,确定直线信息列表;电子表格生成模块,用于根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格。11.一种电子设备,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为在执行所述存储器存储的指令时,实现权利要求1至9中任意一项所述的方法。12.一种非易失性计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至9中任意一项所述的方法。
技术总结
本公开涉及一种钻孔柱状图处理方法及装置、电子设备和存储介质,该方法包括:获取待处理钻孔柱状图,提取图像信息,其中,所述图像信息包括单行文字信息,多行文字信息,直线信息和多段线信息;根据所述单行文字信息和所述多行文字信息,确定文字信息列表;根据所述直线信息和所述多段线信息,确定直线信息列表;根据所述文字信息列表和所述直线信息列表,生成所述待处理钻孔柱状图对应的电子表格。本公开实施例可以自动批量提取钻孔柱状图中的信息,并录入至电子表格。并录入至电子表格。并录入至电子表格。
技术研发人员:张占军 李斌 程涛 钟丹平 樊红杰 张勇 郝治朝 王栋
受保护的技术使用者:北京瑞华高科技术有限责任公司
技术研发日:2023.04.20
技术公布日:2023/7/25
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
