一种医学图像分割任务的数据增强方法

未命名 07-20 阅读:157 评论:0


1.本发明涉及医学图像处理技术领域,更具体地,涉及一种医学图像分割任务的数据增强方法。


背景技术:

2.深度学习已经在包括医疗等众多图像分析子领域取得了进展。数据作为深度学习的基础,模型的目标是从大量的数据中学习,以便能够做出准确的预测和决策。对于医疗诊断这样具有丰富专业知识的图像分析场景,高质量的临床数据与大量的监督标注需要大量的专业医生,耗时耗力。数据扩增技术旨在不改变数据标签的情况下增加数据量和多样性。在深度学习中数据扩增是一种常用的预处理技术,通过对原始数据进行一系列变换和增强,从而生成更多的训练数据,以提高模型的泛化能力和鲁棒性。
3.在脑肿瘤分割任务中,常用的数据扩增技术包含传统数据扩增方法,如旋转、缩放、颜色变换等。此外,随着深度学习发展应运而生了新型数据扩增技术,如copy paste(dwibedi d,misra i,hebert m.cut,paste and learn:surprisingly easy synthesis for instance detection.in iccv,2017:1301-1310.)和mixup(zhang h,cisse m,dauphin y n,et al.mixup:beyond empirical risk minimization[j].arxiv preprint arxiv:1710.09412,2017.)等方法,这些扩增技术不仅帮助深度学习模型变得更加准确和稳健,而且显著促进了深度学习在脑肿瘤分割领域的发展。
[0004]
传统的数据扩增方法常被应用于模型的学习过程中,因为它们容易实现、不会浪费算力,并且参数易于控制。然而,需要注意的是,对原始图像的图像变换操作都会改变其结构或者像素值分布,例如,对于弹性变换而言,它会改变原有的脑成像拓扑结构,而伽马变换会使图像的分布与原始数据产生较大的差异。相比于其他的新型数据扩增方法,copy paste是一种独特的面向病灶实例的方式,该方法首先将实例与背景分开,然后分别对实例和背景进行不同的传统数据变换操作,最后将二者进行融合,这样可以产生大量的扩增数据。然而,对于医学图像中实例与背景融合,要在直观的基础上确保临床解剖结构的正确定义,所以对copy paste算法的应用要求更高。如图1所示,直观对比不同融合方式在皮肤癌和超声乳腺癌数据集上的效果,可以看出,泊松编辑通过消耗医学病灶的信息来实现自然的粘贴效果,这会严重导致临床信息的错误,而高斯模糊不能很好地平滑粘贴对象的边缘,也不能模拟真实的医学病灶。


技术实现要素:

[0005]
本发明的目的是克服上述现有技术的缺陷,提供一种医学图像分割任务的数据增强方法。该方法包括以下步骤:
[0006]
针对待处理的医学图像,对标注掩码进行平滑掩膜操作,获得平滑掩膜soft mask,其中所述平滑掩膜soft mask基于距离来度量边缘信息和病灶之间的相关性;
[0007]
利用所述平滑掩膜soft mask将病灶与背景进行分离,得到病灶集和背景集;
[0008]
对所述背景集和所述病灶集分别进行随机的数据变换,获得增强背景集和增强病灶集;
[0009]
随机挑选所述增强背景集和所述增强病灶集中的元素,通过平滑复制操作将背景与病灶进行融合,得到合成图像作为新的扩增数据,其中所述平滑复制操作用于将生成的病灶实例粘贴到背景上。
[0010]
与现有技术相比,本发明的优点在于,所提出的医学图像分割任务的数据增强方法是copy paste(复制粘贴)算法的改进方法(或称soft copy paste),既保留了病变信息,又将病灶粘贴得更接近真实图像。相比于现有技术,本发明提出了泛化性更强的copy paste融合方式,在多个不同模态的医学图像数据集上都有明显的提升效果。并且根据数据集的特性优化实例与背景的扩增算法,减少了算力负担并保证了算法运行的可靠性。此外,还显著提升了医学图像中病灶与背景的融合效果,保证了扩增数据的临床知识正确性。
[0011]
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
[0012]
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
[0013]
图1是根据本发明一个实施例的不同融合方式的比较示意图;
[0014]
图2是根据本发明一个实施例的医学图像分割任务的数据增强方法的流程图;
[0015]
图3是根据本发明一个实施例的soft copy-paste数据扩增方法的框架图;
[0016]
图4是根据本发明一个实施例的soft mask与trimap示意图;
[0017]
图5是根据本发明一个实施例的soft copy-paste病灶位置扩充示意图;
[0018]
图6是根据本发明一个实施例的brats20不同模态的soft copy-paste扩增示意图;
[0019]
图7是根据本发明一个实施例的soft copy-paste不同成像模态的数据扩增示意图;
[0020]
图8是根据本发明一个实施例的不同数据扩增方法对模型性能的影响示意图。
具体实施方式
[0021]
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0022]
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
[0023]
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0024]
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0025]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一
个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0026]
结合图2和图3所示,本发明提供的医学图像分割任务的数据增强方法包括以下步骤:
[0027]
步骤s110,对标注掩码进行soft mask操作,获得平滑掩膜soft mask。
[0028]
在一个实施例中,soft mask利用输入的掩模图,基于设置的腐蚀次数k
erode
、膨胀次数k
dilate
和衰减系数α获得。例如,参见表1,soft mask操作的主要过程包括:对输入的掩码图进行腐蚀得到腐蚀图m;对腐蚀图m进行k
dilate
次单步膨胀算法并且结合衰减函数α得到平滑掩膜soft mask。
[0029]
表1soft mask算法流程
[0030][0031][0032]
在表1中,m
soft
代表具有x功能的函数,如f
erode
=cv2.erode()。
[0033]
步骤s120,利用平滑掩膜soft mask将病灶与背景进行分离,得到病灶集和背景集。
[0034]
步骤s130,对背景集和病灶集分别进行随机的数据变换以增加各自的多样性,获得增强的背景集和增强的病灶集。
[0035]
步骤s140,随机挑选增强背景集和增强病灶集中的元素,进行soft paste操作,将背景与病灶进行融合,得到新的扩增数据。
[0036]
图3展示了以脑肿瘤分割数据集brats20为例的soft copy paste数据增强方法的总体框架,该方法可应用于具有标签的全监督学习语义分割任务。
[0037]
由图3可知,在soft copy paste算法框架所示的三个步骤中,核心内容包含:1)soft mask:该操作是保证病灶与背景融合的更加自然,保护了正确的病灶临床信息;2)图像变换:该操作是为了增加病灶与背景的多样性,使得最后扩增数据内容更加丰富。在下文中,将具体介绍soft mask操作和图像变换操作的具体方式。
[0038]
一、关于soft copy和soft paste
[0039]
soft copy(平滑复制)是通过平滑掩模(soft mask)边缘来获得病灶周围的信息,这与直接使用掩模复制图像中的病灶并忽略病变周围信息不同。最类似于soft mask的是经典的静态抠图算法trimap。如图4所示,trimap将给定的图像分为三个区域:1)包含明确的前景像素区域;2)包含明确的背景信息;3)混合区域,此区域含有与两个区域的不确定成分。而这这些区域分开是抠图任务中非常重要的先验知识。
[0040]
相比之下,soft mask通过距离度量边缘信息和病灶之间的相关性。具体来说,soft mask根据病变的距离分配不同的权重。例如,距离病灶边缘越远,周围背景信息对病变的相关性就越小。如图4所示,以二值掩模为例,trimap中的未知区域(图4中的灰色区域)像素值是单一值,而soft mask随着距离病灶的增加而减小。soft mask乘以源图像生成包含病灶和其周围信息的“软化实例”,这个操作被称为soft copy。对于多类别语义分割的脑肿瘤数据,soft copy可以是三个类别中的任意组合,也即可以复制一个类别或者多个。
[0041]
soft mask中边缘变化的坡度反映了边缘信息和病灶之间的相关性,离病灶越远其边缘信息占比越小。在一个实施例中,可以使用常见的衰减函数描述该变化,例如采用简单的幂指数函数进行描述,表示为:
[0042]ei
=α
i (0<α<1,i∈z
+
)
ꢀꢀꢀ
(1)
[0043]
其中,α为衰减系数,可以根据不同数据集来选取值的大小,一般选择α=0.95即可,i表示扩增数据中病灶周围环境离病灶边缘的像素距离,z
+
表示像素距离集。可以结合膨胀腐蚀的形态学方法获得soft mask,参见表1。
[0044]
soft paste(平滑粘贴)是将由soft copy生成的病灶实例粘贴到背景上。例如,根据下式得到合成图像i
syn
和对应的掩码m
syn

[0045]isyn
=tr
img
(tr
inst
(m
softisrc
)+tr
img
((1-m
soft
)i
tgt
))
ꢀꢀ
(2)
[0046]msyn
=m
src
∪m
tgt
ꢀꢀꢀ
(3)
[0047]
其中tr
inst
表示实例级变换,tr
img
表示图像级变换,m
soft
是由原始掩码生成的soft mask,m
src
与m
tgt
分别表示复制实例i
src
与目标图i
tgt
的掩码,二者取并集得到合成图的最终掩码标签。
[0048]
二、关于图像变换
[0049]
大部分的医学病灶(例如肿瘤或炎症)的结构与位置在某种程度上是随机的,而不是完全可预测的。这是因为许多疾病的发生涉及到复杂的生物过程,其中许多因素都可能会对病灶的位置产生影响。这些因素可能包括遗传因素、环境因素、生活方式选择、生物化学过程等。此外,对于同一患者,在不同型号和环境下的成像结果也存在差异,同一病灶在
采用不同的成像方法和参数情况下产生不同的成像值。例如,mri的成像值可以受到扫描参数、序列选择和扫描时使用的磁场强度等因素的影响。同样地,ct成像值可以受到扫描参数、x射线辐射剂量和成像算法等因素的影响。
[0050]
上述结构和强度差异这两个客观因素是医学数据扩增的现实基础,soft copy paste中采用的图像变换就是模型病灶位置和像素分布的多样性。本发明将传统的数据增强与soft copy paste相结合,以增加合成图像的多样性。如图3所示,实例级变换保证了病灶的多样性,图像级变换保证了背景和合成图像的多样性。
[0051]
在实例级变换中,主要包括结构变换和强度变换。例如,根据数据集的特征,将位置(结构)的多样性变换分为两种,如图5所示,一种是以脑成像为代表的具有明显解剖结构约束的数据,在实例的位置变换过程中采用镜像翻转即可。另一种是超声乳腺癌为代表的数据,这些数据成像的视野较小,在成像范围内病灶的位置具有很大的随机性,可以在图像的任意位置,在实例的位置变换中采用更加多样化的变换,如旋转、平移等。对于强度变换,采用像素级的γ变换和直方图均衡等方法来改变整幅图像的亮度、对比度和色调等视觉特征。
[0052]
在图像级变换中,如图3所示,在背景集和合成数据的步骤都采用了图像级的变换,主要包含以旋转为主的结构变换和以高斯模糊、γ变换和直方图均衡为主的强度变换,强度变换的参数被控制在一定合理的范围之内,例如范围取值为原始数据集值的[0.75,1.25]之间,不能改变病灶的临床判断。此外,通过随机排列组合能够有效地增加变换的多样性。以实例级变换为例,结构变换:[无、翻转、旋转、缩放、平移],强度变换:[无、伽马、高斯-n、高斯-b],分别从结构变换和强度变换中随机有放回地选择两个变换,用随机顺序进行采样,得到一个实例级转换,例如[旋转、翻转、高斯、无]。这种多重随机级联式的变换极大的增加了扩增数据的多样性。
[0053]
为进一步验证本发明的效果,进行了实验。表2是不同成像模态的数据扩增方法评估结果。图6是brats20不同模态的soft copy-paste扩增示意图。图7是soft copy-paste不同成像模态的数据扩增示意图,以brats20数据集为例。图8是不同数据扩增方法对模型性能的影响示意图。实验结果表明,本发明的数据增强方法提升了数据的多样性,进而提升了合成图像的清晰度,有利于准确高效的分割合成图像。
[0054]
表2:不同成像模态的数据扩增方法评估结果
[0055][0056]
综上所述,本发明提出了一种可控、可信且有效的用于医学病灶语义分割的数据增强方法,可用于在线与离线扩增,并且实现简单。
[0057]
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
[0058]
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
[0059]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0060]
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的
任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++、python等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
[0061]
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0062]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0063]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0064]
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
[0065]
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐