字符笔画粗细的调整方法、装置、电子设备及存储介质与流程

未命名 10-19 阅读:157 评论:0


1.本发明涉及图像处理技术领域,尤其涉及一种字符笔画粗细的调整方法、装置、电子设备及存储介质。


背景技术:

2.在教育数字化高速发展的今天,一个庞大且全面的题库是很多项目及应用的基础。
3.在题库录入题目时,目前采用的方法通常是人工录入、ocr识别以及扫描纸质书三种方法,其中人工录入效率低且费用高,好处是所录入信息的准确性有保证,ocr识别的方式效率高,费用低,缺点是录入精度有限。尤其对于带有公式、图表的题,采用ocr识别方法录入精度更差。扫描纸质书的方法能完整保留书本信息且效率较高,是目前比较主流的一种录入方法,但该方法录入的信息为图像信息。
4.在实际中,由于不同纸质教辅书文字排版风格(如文字笔画粗细不同)差别较大,如果将来自不同教辅书的题目图像在同一个页面中展示,如果教辅图像中的字体风格区别较大,将影响用户体验。


技术实现要素:

5.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种字符笔画粗细的调整方法、装置、电子设备及存储介质。
6.根据本公开的一方面,提供了一种字符笔画粗细的调整方法,包括:
7.获取第一图像,所述第一图像包括多个目标字符;
8.对所述第一图像进行二值化处理,得到二值化图像;
9.确定所述二值化图像中所述目标字符的实际笔画宽度值;
10.基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设差值范围内。
11.根据本公开的另一方面,提供了一种字符笔画粗细的调整装置,包括:
12.第一图像获取模块,用于获取第一图像,所述第一图像包括多个目标字符;
13.二值化处理模块,用于对所述第一图像进行二值化处理,得到二值化图像;
14.实际笔画宽度值确定模块,用于确定所述二值化图像中所述目标字符的实际笔画宽度值;
15.笔画宽度调整模块,用于基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设范围内。
16.根据本公开的另一方面,提供了一种电子设备,包括:
17.处理器;以及
18.存储程序的存储器,
19.其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行如上所述的方法。
20.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
21.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
22.本技术实施例中提供的一个或多个技术方案,可以实现将第一图像中目标字符的笔画宽度值调整为与预设笔画宽度值趋于一致的目的,进而达到统一来源于不同纸质教辅书的扫描图像中的文字排版风格的技术效果。
附图说明
23.在下面结合附图对于示例性实施例的描述中,本公开的更多细节、特征和优点被公开,在附图中:
24.图1为本公开实施例提供的一种字符笔画粗细的调整方法的流程图;
25.图2为本公开实施例提供的一种实现s130的方法的流程图;
26.图3-图6为本公开实施例提供的一种确定目标笔画的过程中图像变化示意图;
27.图7为本公开实施例提供的一种字符笔画粗细的调整装置的结构框图;
28.图8示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
29.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
30.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
31.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
32.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
33.以下参照附图描述本公开的方案。
34.图1为本公开实施例提供的一种字符笔画粗细的调整方法的流程图。本实施例可适用于客户端中对不同图像中字符的排版风格进行统一的情况,该方法可以由字符笔画粗
细的调整装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如终端,具体包括但不限于智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。或者,本实施例可适用于服务端中对不同图像中字符的排版风格进行统一的情况,该方法可以由字符笔画粗细的调整装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如服务器。
35.参见图1,该字符笔画粗细的调整方法,包括:
36.s110、获取第一图像,第一图像包括多个目标字符。
37.目标字符是需要对其笔画粗细进行调整的字符。目标字符具体可以包括文字、类字形单位或符号。在一个实施例中,目标字符包括汉字、字母、数字、运算符号以及标点符号中的至少一种。
38.第一图像例如可以是需要对其所包括的目标字符的笔画粗细进行调整的图像。示例性地,第一图像为对纸质书扫描后得到的扫描图像。第一图像中可以包括一个或多个题目,每个题目包括多个目标字符,题目中的每一个文字、类字形单位或符号分别为一个目标字符。
39.本公开对第一图像中所包括的目标字符的数目不作限制。
40.s120、对第一图像进行二值化处理,得到二值化图像。
41.二值化处理是指,利用图像处理技术将第一图像中的每个像素点的灰度值设置为0或255,使得二值化处理后的整个图像(即二值化图像)呈现出明显的只有黑和白的视觉效果。示例性地,二值化图像中构成文字、公式、图表等的像素点的颜色为黑色,构成背景的像素点的颜色为白色(此种情况,下文简称“白底黑字”)。或者,二值化图像中构成文字、公式、图表等的像素点的颜色为白色,构成背景的像素点的颜色为黑色(此种情况,下文简称“黑底白字”)。
42.可选地,在s120之前,还可以对第一图像去模糊处理,去模糊处理的目的是使得目标字符中每个笔画的边缘是清晰的。
43.可选地,可以使用分割模型对第一图像进行去模糊处理以及二值化处理,得到二值化图像。
44.s130、确定在二值化图像中目标字符的实际笔画宽度值。
45.本步骤的实现方法有多种,本技术对此不作限制。示例性地,本步骤的实现方法还包括:基于二值化图像,从目标字符中提取目标笔画;确定目标笔画的宽度值;基于目标笔画的宽度值,确定在二值化图像中目标字符的实际笔画宽度值。
46.目标笔画例如可以是用于确定笔画宽度的笔画。本技术对目标笔画具体指代何种笔画不作限制。示例性地,目标笔画为横或竖。设置目标笔画为横或竖,易于从目标字符中提取出目标笔画,以及易于确定目标字符的实际笔画宽度值。
47.二值化图像中目标字符的实际笔画宽度值是指,是笔画粗细调整前目标字符的实际笔画宽度值。二值化图像中目标字符的实际笔画宽度值等于第一图像中目标字符的实际笔画宽度值。
48.s140、基于实际笔画宽度值和预设笔画宽度值,对二值化图像进行处理,得到第二图像,其中,第二图像中目标字符的笔画宽度值与预设笔画宽度值的差值在预设差值范围内。
49.预设笔画宽度值例如可以是对目标字符的笔画粗细调整后,希望目标字符所呈现的宽度值。预设笔画宽度值是预先指定的,本公开对预设笔画宽度值具体取何值不作限制。
[0050]“对二值化图像进行处理”具体可以为对二值化图像进行膨胀或腐蚀处理。
[0051]
由于二值化图像中仅包括颜色为黑色的像素点和颜色为白色的像素点,对二值化图像进行膨胀处理,是增加颜色为白色的像素点的个数,减少颜色为黑色的像素点的个数。此种方法适用于二值化图像为白底黑字,二值化图像中实际笔画宽度值大于目标笔画宽度值的情况,以及二值化图像为黑底白字,二值化图像中实际笔画宽度值小于目标笔画宽度值的情况。
[0052]
类似地,由于二值化图像中仅包括颜色为黑色的像素点和颜色为白色的像素点,对二值化图像进行腐蚀处理,是减少颜色为白色的像素点的个数,增加颜色为黑色的像素点的个数。此种方法适用于二值化图像为白底黑字,二值化图像中实际笔画宽度值小于目标笔画宽度值的情况,以及二值化图像为黑底白字,二值化图像中实际笔画宽度值大于目标笔画宽度值的情况。
[0053]
本步骤的实现方法有多种,本技术对此不作限制。示例性地,本步骤的实现方法包括:确定二值化图像中目标字符的实际笔画宽度值与预设笔画宽度值的差值的绝对值;基于目标字符的实际笔画宽度值与预设笔画宽度值的差值的绝对值,对二值化图像进行膨胀或腐蚀处理,得到第二图像。
[0054]
其中,目标字符的实际笔画宽度值与预设笔画宽度值的差值的绝对值的作用有二:一是确定需要对二值化图像进行膨胀处理还是腐蚀处理;二是对二值化图像进行膨胀或腐蚀处理的处理尺度进行确定。对二值化图像进行膨胀处理的处理尺度,可以理解为对二值化图像膨胀多少个像素点,有多少个像素点的颜色需要改变。对二值化图像进行腐蚀处理的处理尺度,可以理解为对二值化图像腐蚀多少个像素点,有多少个像素点的颜色需要改变。
[0055]
进一步地,“基于目标字符的实际笔画宽度值与目标笔画宽度值的差值的绝对值,对二值化图像进行膨胀或腐蚀处理,得到第二图像”,包括:基于目标字符的实际笔画宽度值与预设笔画宽度值的差值的绝对值,确定第二卷积核尺寸;利用卷积核尺寸与第二卷积核尺寸一致的第二图像形态学处理模型,对二值化图像进行膨胀或腐蚀处理,得到第二图像。
[0056]
示例性地,若实际笔画宽度值为m,预设笔画宽度值为n,计算m和n的差值的绝对值s,s=|m-n|。基于s,确定第二卷积核的尺寸为s*s。
[0057]“利用卷积核尺寸与第二卷积核尺寸一致的第二图像形态学处理模型,对二值化图像进行膨胀或腐蚀处理,得到第二图像”的具体实现方法为现有技术,此处不再赘述。
[0058]
需要说明的是,若实际笔画宽度值与预设笔画宽度值相等,即不需要对二值化图像进行膨胀处理,也不需要对二值化图像进行腐蚀处理,可以直接将该二值化图像作为第二图像。
[0059]
上述技术方案通过对第一图像进行二值化处理,得到二值化图像;确定二值化图像中目标字符的实际笔画宽度值;基于实际笔画宽度值和预设笔画宽度值,对二值化图像进行处理,得到第二图像,其中,第二图像中目标字符的笔画宽度值与预设笔画宽度值的差值在预设差值范围内,其可以实现将第一图像中目标字符的笔画宽度值调整为目标笔画宽
度值的目的,进而达到统一来源于不同纸质教辅书的扫描图像中的文字排版风格的目的,提高用户体验。
[0060]
在上述技术方案的基础上,可选地,s130的具体实现方法有多种,本技术对此不做限制。图2为本公开实施例提供的一种实现s130的方法的流程图。参见图2,该方法包括:
[0061]
s131、基于二值化图像,从目标字符中提取候选笔画,候选笔画的延伸方向与预设方向的夹角小于或等于设定角度阈值。
[0062]
候选笔画为与目标笔画形状相近的笔画。示例性地,若目标笔画为横,由于笔画横可视作为沿水平方向延伸的一条线段,预设方向为水平方向,候选笔画为延伸方向与水平方向的夹角小于或等于设定角度阈值的线段。若目标笔画为竖,由于笔画竖可视作为沿竖直方向延伸的一条线段,预设方向为竖直方向,候选笔画为延伸方向与竖直方向的夹角小于或等于设定角度阈值的线段。
[0063]
设定角度阈值是预先设置的参数,其用于作为筛选出候选笔画的依据。
[0064]
本步骤的实现方法有多种,本技术对此不作限制。示例性地,本步骤的实现方法包括:对二值化图像中的目标字符进行框选处理,得到与目标字符对应的字符框;基于字符框的尺寸,确定第一卷积核尺寸;利用卷积核尺寸与第一卷积核尺寸一致的第一图像形态学处理模型,对每一个字符框进行处理,得到候选笔画。
[0065]
对二值化图像中的目标字符进行框选处理,是指利用线框(如矩形框)包围目标字符,得到能够包围目标字符的最小尺寸的线框。
[0066]
示例性地,若字符框的高度为h,宽度为w,若目标笔画为竖,第一卷积核尺寸为1*h/2。其中,h/2按四舍五入取整。若目标笔画为横,第一卷积核尺寸为w/2*1。其中,w/2按四舍五入取整。
[0067]“利用卷积核尺寸与第一卷积核尺寸一致的第一图像形态学处理模型,对每一个字符框进行处理”为现有技术,此处不再赘述。
[0068]
需要说明的是,在实际中,若二值化图像中包括多个目标字符,此处需要分别对各个目标字符进行框选处理,得到与各目标字符对应的字符框。此种情况下,在“基于字符框的尺寸,确定第一卷积核尺寸”时,可以计算所有字符框的平均高度和所有字符框的平均宽度,基于所有字符框的平均高度和/或所有字符框的平均宽度,确定第一卷积核尺寸。或者,在“基于字符框的尺寸,确定第一卷积核尺寸”时,可以统计所有字符框的尺寸,确定频数最高的字符框的高度和频数最高的字符框宽度;基于频数最高的字符框的高度和/或频数最高的字符框宽度,确定第一卷积核尺寸。
[0069]
s132、从候选笔画中确定目标笔画。
[0070]
本步骤的实质是对候选笔画中挑选出目标笔画。
[0071]
本步骤的实现方法有多种,本技术对此不作限制。示例性地,本步骤的实现方法包括:对候选笔画进行连通域检测,确定目标连通域,目标连通域的高与宽之比处于目标阈值范围内;将目标连通域对应的笔画作为目标笔画。
[0072]
目标阈值范围为预先设置的参数,用于作为从候选笔画中筛选出目标笔画需要使用的参数。
[0073]
示例性地,若目标笔画为竖,目标阈值范围可以设置为[5,∞),在执行本步骤时,分别对各候选笔画进行连通域检测,得到与各候选笔画对应的连通域。若一连通域的高与
宽之比为6,满足“高与宽之比处于[5,∞)中”这一条件,确定该连通域为目标连通域,该目标连通域对应的候选笔画为目标笔画。若一连通域的高与宽之比为3,不满足“高与宽之比处于[5,∞)中”这一条件,确定该连通域不是目标连通域,该连通域对应的候选笔画不是目标笔画。
[0074]
s133、确定目标笔画的宽度值。
[0075]
本步骤的具体实现方法有多种,本技术对此不作限制。示例性地,可以沿目标笔画的宽度方向,对目标笔画经过的像素点的数量进行统计,基于像素点的数量统计结果和像素点的尺寸,确定目标笔画的宽度值。
[0076]
s134、基于目标笔画的宽度值,确定目标字符的实际笔画宽度值。
[0077]
本步骤的具体实现方法有多种,本技术对此不作限制。
[0078]
若共确定了一个目标笔画,可以将该目标笔画的宽度值作为目标字符的实际笔画宽度值。
[0079]
若共确定了两个或两个以上目标笔画,可以将各目标笔画的宽度值的平均值作为目标字符的实际笔画宽度值;或者,对各目标笔画的宽度值进行统计,将频数最高的目标笔画的宽度值作为目标字符的实际笔画宽度值。
[0080]
图3-图7为本公开实施例提供的一种确定目标笔画的过程中图像变化示意图。图3中为二值化图像。图3中的所有文字、数值、数学符号以及标点均为目标字符。图4为从目标字符中提取的所有候选笔画的图像。图5中椭圆形线圈圈出的是从候选笔画中确定的所有目标笔画。图6中为对图3中的二值化图像进行膨胀处理后,得到的第二图像。与图3相比,图6中的目标字符的笔画宽度变细。
[0081]
上述技术方案通过设置基于二值化图像,从目标字符中提取候选笔画;从候选笔画中确定目标笔画;确定目标笔画的宽度值;基于目标笔画的宽度值,确定目标字符的实际笔画宽度值,给出了一种简便地,易于实现确定目标字符的实际笔画宽度值的方法。
[0082]
在上述各技术方案的基础上,可选地,s150之后,还包括:对第二图像中的目标字符进行颜色填充。
[0083]
通过设置对第二图像中的目标字符进行颜色填充,可以从颜色角度,进一步统一不同纸质教辅书文字排版风格。此外,还可以通过颜色填充对目标字符中的部分字符进行突出显示,以提高用户对颜色填充的字符的关注度。
[0084]
其中,“对第二图像中的目标字符进行颜色填充”的具体实现方法有多种,本技术对此不作限制。示例性地,“对第二图像中的目标字符进行颜色填充”的具体实现方法包括:确定目标颜色的像素值;对构成第二图像中的目标字符的第二像素点的像素值进行设置,得到第三图像;第三图像中目标字符的像素值与目标颜色的像素值一致。
[0085]
对第二图像中的目标字符进行颜色填充后,目标字符所呈现的颜色例如可以与第一图像中目标字符的颜色一致,也可以不与第一图像中目标字符的颜色不一致。
[0086]
若对第二图像中的目标字符进行颜色填充后,目标字符所呈现的颜色与第一图像中目标字符的颜色一致,可选地,对二值化图像进行处理,得到第二图像之后,还包括:确定第二图像中的有效像素区域,有效像素区域为目标字符对应的像素区域;在第一图像中确定与有效像素区域对应的彩色像素点;利用第一图像中与有效像素区域对应的彩色像素点的像素值替换有效像素区域中的像素点的像素值。
[0087]
有效像素区域具体可以为第二图像中展示目标字符的区域。
[0088]“在第一图像中确定与有效像素区域对应的彩色像素点”的具体实现方法有多种,本技术对此不作限制。示例性地,确定在第一图像中与有效像素区域对应的所有备选像素点;逐一判断各备选像素点是否为彩色像素点,从而在第一图像中确定与有效像素区域对应的彩色像素点。
[0089]
判断各备选像素点是否为彩色像素点的方法有多种,示例性地,可以借助下述条件1和条件2来判断各备选像素点是否为彩色像素点。条件1:(255-r)+(255-g)+(255-b)《15,和条件2:(r-0)+(g-0)+(b-0)《15。若一备选像素点不满足条件1和条件2,认为该像素点为彩色像素点。
[0090]
在上述各技术方案的基础上,可选地,该方法还包括:利用第一图像和第二图像,对笔画调整神经网络模型进行训练。这样设置可以使得训练完毕的笔画调整神经网络模型能够自动完成对不同图像中字符排版风格进行统一的工作。可以降低工作人员的工作量。
[0091]
可选地,还可以设置利用第一图像和第三图像,对笔画调整神经网络模型进行训练。这样设置除了可以对不同图像中字符的笔画粗细进行统一,还可以对颜色进行调整。
[0092]
需要说明的是,在实际中,在对笔画调整神经网络模型进行训练的场景中,要求所使用的内容相同的两个图像中目标字符笔画宽度值不同。在实际中,可能存在第一图像中目标字符实际笔画宽度值与目标笔画宽度值相等的情况,此种情况下,可以执行如下步骤:对第一图像进行二值化处理,得到二值化图像;对二值化图像进行膨胀或腐蚀处理,得到第四图像,在第四图像中目标字符的实际笔画宽度值不等于第一图像中目标字符的实际笔画宽度值。
[0093]
图7为本公开实施例提供的一种字符笔画粗细的调整装置的结构框图。参见图3,00,包括:
[0094]
第一图像获取模块310,用于获取第一图像,所述第一图像包括多个目标字符;
[0095]
二值化处理模块320,用于对所述第一图像进行二值化处理,得到二值化图像;
[0096]
实际笔画宽度值确定模块330,用于确定所述二值化图像中所述目标字符的实际笔画宽度值;
[0097]
笔画宽度调整模块340,用于基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设范围内。
[0098]
进一步地,所述实际笔画宽度值确定模块330,用于:
[0099]
基于所述二值化图像,从所述目标字符中提取目标笔画;
[0100]
确定所述目标笔画的宽度值;
[0101]
基于所述目标笔画的宽度值,确定在所述二值化图像中所述目标字符的实际笔画宽度值。
[0102]
进一步地,实际笔画宽度值确定模块330,用于:
[0103]
基于所述二值化图像,从所述目标字符中提取候选笔画,所述候选笔画的延伸方向与预设方向的夹角小于或等于设定角度阈值;所述预设方向为水平方向或竖直方向;
[0104]
从所述候选笔画中确定目标笔画。
[0105]
进一步地,实际笔画宽度值确定模块330,用于:
[0106]
对所述二值化图像中的目标字符进行框选处理,得到与所述目标字符对应的字符框;
[0107]
基于所述字符框的尺寸,确定第一卷积核尺寸;
[0108]
利用卷积核尺寸与所述第一卷积核尺寸一致的第一图像形态学处理模型,对每一个所述字符框进行处理,得到所述候选笔画。
[0109]
进一步地,实际笔画宽度值确定模块330,用于:
[0110]
对所述候选笔画进行连通域检测,确定目标连通域,所述目标连通域的高与宽之比处于目标阈值范围内;
[0111]
将所述目标连通域对应的笔画作为目标笔画。
[0112]
进一步地,笔画宽度调整模块340,用于:
[0113]
确定二值化图像中所述目标字符的实际笔画宽度值与所述预设笔画宽度值的差值的绝对值;
[0114]
基于所述绝对值,对所述二值化图像进行膨胀或腐蚀处理,得到第二图像。
[0115]
进一步地,笔画宽度调整模块340,用于:
[0116]
基于所述绝对值,确定第二卷积核尺寸;
[0117]
利用卷积核尺寸与所述第二卷积核尺寸一致的第二图像形态学处理模型,对所述二值化图像进行膨胀或腐蚀处理,得到第二图像。
[0118]
进一步地,该装置还包括颜色调整模块,用于对所述二值化图像进行处理,得到第二图像之后,确定第二图像中的有效像素区域,所述有效像素区域为目标字符对应的像素区域;
[0119]
在所述第一图像中确定与所述有效像素区域对应的彩色像素点;
[0120]
利用所述第一图像中与所述有效像素区域对应的彩色像素点的像素值替换所述有效像素区域中的像素点的像素值。
[0121]
本公开示例性实施例还提供一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器。所述存储器存储有能够被所述至少一个处理器执行的计算机程序,所述计算机程序在被所述至少一个处理器执行时用于使所述电子设备执行根据本公开实施例的方法。
[0122]
本公开示例性实施例还提供一种存储有计算机程序的非瞬时计算机可读存储介质,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
[0123]
本公开示例性实施例还提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被计算机的处理器执行时用于使所述计算机执行根据本公开实施例的方法。
[0124]
参考图8,现将描述可以作为本公开的服务器或客户端的电子设备800的结构框图,其是可以应用于本公开的各方面的硬件设备的示例。电子设备旨在表示各种形式的数字电子的计算机设备,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0125]
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储电子设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0126]
电子设备800中的多个部件连接至i/o接口805,包括:输入单元806、输出单元807、存储单元808以及通信单元809。输入单元806可以是能向电子设备800输入信息的任何类型的设备,输入单元806可以接收输入的数字或字符信息,以及产生与电子设备的用户设置和/或功能控制有关的键信号输入。输出单元807可以是能呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端、振动器和/或打印机。存储单元808可以包括但不限于磁盘、光盘。通信单元809允许电子设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据,并且可以包括但不限于调制解调器、网卡、红外通信设备、无线通信收发机和/或芯片组,例如蓝牙tm设备、wifi设备、wimax设备、蜂窝通信设备和/或类似物。
[0127]
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理。例如,在一些实施例中,字符笔画粗细的调整方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到电子设备800上。在一些实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行字符笔画粗细的调整方法。
[0128]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0129]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0130]
如本公开使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读
介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
[0131]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0132]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0133]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

技术特征:
1.一种字符笔画粗细的调整方法,包括:获取第一图像,所述第一图像包括多个目标字符;对所述第一图像进行二值化处理,得到二值化图像;确定所述二值化图像中所述目标字符的实际笔画宽度值;基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设差值范围内。2.根据权利要求1所述的方法,其中,所述确定所述二值化图像中所述目标字符的实际笔画宽度值,包括:基于所述二值化图像,从所述目标字符中提取目标笔画;确定所述目标笔画的宽度值;基于所述目标笔画的宽度值,确定在所述二值化图像中所述目标字符的实际笔画宽度值。3.根据权利要求2所述的方法,其中,所述基于所述二值化图像,从所述目标字符中提取目标笔画,包括:基于所述二值化图像,从所述目标字符中提取候选笔画,所述候选笔画的延伸方向与预设方向的夹角小于或等于设定角度阈值;所述预设方向为水平方向或竖直方向;从所述候选笔画中确定目标笔画。4.根据权利要求3所述的方法,其中,所述基于所述二值化图像,从所述目标字符中提取候选笔画,包括:对所述二值化图像中的目标字符进行框选处理,得到与所述目标字符对应的字符框;基于所述字符框的尺寸,确定第一卷积核尺寸;利用卷积核尺寸与所述第一卷积核尺寸一致的第一图像形态学处理模型,对每一个所述字符框进行处理,得到所述候选笔画。5.根据权利要求3所述的方法,其中,所述从所述候选笔画中确定目标笔画,包括:对所述候选笔画进行连通域检测,确定目标连通域,所述目标连通域的高与宽之比处于目标阈值范围内;将所述目标连通域对应的笔画作为目标笔画。6.根据权利要求1所述的方法,其中,所述对所述二值化图像进行处理,得到第二图像,包括:确定二值化图像中所述目标字符的实际笔画宽度值与所述预设笔画宽度值的差值的绝对值;基于所述绝对值,对所述二值化图像进行膨胀或腐蚀处理,得到第二图像。7.根据权利要求6所述的方法,其中,所述基于所述绝对值,对所述二值化图像进行膨胀或腐蚀处理,得到第二图像,包括:基于所述绝对值,确定第二卷积核尺寸;利用卷积核尺寸与所述第二卷积核尺寸一致的第二图像形态学处理模型,对所述二值化图像进行膨胀或腐蚀处理,得到第二图像。8.根据权利要求1所述的方法,其中,所述对所述二值化图像进行处理,得到第二图像
之后,还包括:确定第二图像中的有效像素区域,所述有效像素区域为目标字符对应的像素区域;在所述第一图像中确定与所述有效像素区域对应的彩色像素点;利用所述第一图像中与所述有效像素区域对应的彩色像素点的像素值替换所述有效像素区域中的像素点的像素值。9.一种字符笔画粗细的调整装置,包括:第一图像获取模块,用于获取第一图像,所述第一图像包括多个目标字符;二值化处理模块,用于对所述第一图像进行二值化处理,得到二值化图像;实际笔画宽度值确定模块,用于确定所述二值化图像中所述目标字符的实际笔画宽度值;笔画宽度调整模块,用于基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设范围内。10.一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行根据权利要求1-8中任一项所述的方法。11.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。

技术总结
本公开提供一种字符笔画粗细的调整方法、装置、电子设备及存储介质,方法包括:获取第一图像,所述第一图像包括多个目标字符;对所述第一图像进行二值化处理,得到二值化图像;确定所述二值化图像中所述目标字符的实际笔画宽度值;基于所述实际笔画宽度值和预设笔画宽度值,对所述二值化图像进行处理,得到第二图像,其中,所述第二图像中目标字符的笔画宽度值与所述预设笔画宽度值的差值在预设差值范围内。其可以实现将第一图像中目标字符的笔画宽度值调整为目标笔画宽度值的目的,进而达到统一来源于不同纸质教辅书的扫描图像中的文字排版风格的技术效果。字排版风格的技术效果。字排版风格的技术效果。


技术研发人员:王翔
受保护的技术使用者:深圳市星桐科技有限公司
技术研发日:2023.06.30
技术公布日:2023/10/15
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐