基于晶圆缺陷知识库的构建及检索方法、设备及介质与流程
未命名
07-13
阅读:181
评论:0
1.本发明涉及半导体制造技术领域,具体涉及一种基于晶圆缺陷知识库的构建及检索方法、设备及介质。
背景技术:
2.在半导体芯片加工生产过程中,随着芯片制造水平的不断提高,目前半导体器件的尺寸越来越偏向小型化,小型化这一过程有着相当多的技术指标和要求。然而在生产过程中,无法避免会出现各种各样的晶圆缺陷,晶圆经过电性测试过后可以得到晶圆图,富有经验的工程师对晶圆图进行检测和识别可以确定晶圆的缺陷类别,并进一步分析推测出生产过程中导致这一缺陷产生的机理。
3.目前,计算机技术飞速发展,已经有越来越多的企业利用神经网络、深度学习等方法自动对晶圆缺陷进行识别。其中基于分类的方法实现较为简单,但是该方法难以对新的缺陷进行判别;基于检索的方法可以实现新类别的识别,但是晶圆产量巨大,制造商每月产能都是以万(十万/百万)片为单位,随着检索库的迭代更新,检索库内样本数量越来越多,影响检索效率。
4.因此,本发明提供一种新的缺陷知识库构建方法以及对应检索分析方法,以准确识别晶圆缺陷类别的同时保证识别效率成为本领域需要解决的问题。
技术实现要素:
5.本发明提出的一种基于晶圆缺陷知识库的构建及检索方法、设备及介质,以解决现有缺陷检索技术当中检索效率低以及新类别检索准确率低的技术问题。
6.为实现上述目的,本发明采用了以下技术方案:一种基于晶圆缺陷知识库的构建及检索方法,包括以下步骤,s01:获取晶圆电性测试结果;s02:根据电性测试结果,将晶圆上失效状态的die与正常状态的die统计出来,并将失效die所在位置灰度值设置为255,正常die所在位置灰度值设置为127,不在wafer区域的灰度值设置为0,生成晶圆图,并对图片进行标注;s03:依据专家知识对已有晶圆图数据进行标注,并将其当作训练数据用于神经网络训练,神经网络经过多轮迭代训练学习缺陷的特征,待其收敛过后保存当前的网络参数得到最终的网络模型;s04:使用上述s03得到的神经网络模型提取s02处理后数据的特征,得到训练图像数据的向量表示;s05:将所有训练数据特征向量存入全量数据库,同时记录对应晶圆缺陷所属类别;s06:使用聚类算法,获取全量库当中同一类缺陷数据里具有代表性的样本,存入知识库;
所需要提取的代表性样本数量可根据聚类中心数量进行调整设置;若初始时某一类缺陷全量样本数量少于设定的聚类数量,则将该类所有样本全存入知识库当中;s07:使用上述s03的神经网络模型提取待检测数据的特征,得到待检测图像数据的向量表示,计算当前待检测数据的特征向量与知识库内样本特征向量的相似度。
7.进一步地,若当前样本与知识库内任一样本的相似度高于阈值0.5,则认为当前样本属于与它相似度最高的知识库样本所属的类别,并将当前样本存入全量库。
8.进一步地,若当前样本与知识库内所有样本的相似度都低于0.5,则切换检索库为全量数据库,计算当前待检测数据的特征向量与全量数据库内样本特征向量的相似度。
9.进一步地,若当前样本与全量数据库内所有样本的相似度都低于0.5,则判断当前样本为新缺陷类型,并将当前样本存入知识库和全量数据库。
10.进一步地,步骤s03中神经网络的输出特征向量维度为1024;进一步地,步骤s05中知识库构建具体流程为典型特征样本的筛选:利用kmeans对同一类数据进行聚类,得到n个聚类中心,选择离聚类中心欧式距离最近的样本作为典型样本,存入知识库。
11.又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
12.再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
13.由上述技术方案可知,本发明针对晶圆图像缺陷检索,构建了一种知识库-全量库两级检索结构,通过晶圆图的特征向量筛选出每一类当中具有典型特征的样本,相较于直接在全量数据检索,本发明所提出的流程大大减少了检索的复杂度,提高了检索效率;相较于固定检索库的方式,本发明提出的流程能够实时对知识库、全量库更新,保证检索准确性,本发明是一种同时兼顾检索速度和检索性能的检索库构建方式和检索方法。
14.具体的说,本发明的基于晶圆缺陷知识库的构建及检索方法,具备以下有益效果:(1)本发明所提出的缺陷检索库的构建方法构建了知识库-全量库的两级检索结构,知识库当中囊括了晶圆缺陷的典型样本,在第一级检索过程中,检索速度相较于在全量库当中检索可提升数倍。
15.(2)本发明提供的检索流程同时兼顾典型样本与普通样本,在确保新缺陷特征与现有样本特征差异大于设定阈值时将其归类为新的缺陷类型,而且对知识库和全量库实时更新,后续再遇到相同类别缺陷,能够很好地识别,为后续根因分析提供高质量的数据。
附图说明
图1为本发明实施例的方法原理示意图;图2为本发明实施例当中神经网络提取图像特征的流程图;图3为本发明实施例中知识库构建示意图;图4为本发明实施例中检索规则示意图。
具体实施方式
16.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
17.如图1所示,本实施例所述的基于晶圆缺陷知识库的构建及检索方法,包括以下步骤:s1:获取晶圆电性测试结果。
18.s2:根据电性测试结果,将晶圆上失效状态的die与正常状态的die统计出来,并将失效die所在位置灰度值设置为255,正常die所在位置灰度值设置为127,不在wafer区域的灰度值设置为0。
19.具体地,转换得到晶圆图的灰度图之后,还包括对晶圆图进行缩放,保证所有图像尺寸相同,并且对缩放后的图像进行归一化处理,归一化方式如下式所示。
20.其中,代表图像坐标(x,y)处的灰度值、代表归一化过后图像坐标(x,y)处的值。
21.s3:依据专家知识对已有晶圆图数据进行标注,并将其当作训练数据用于神经网络训练,神经网络经过多轮迭代训练学习缺陷的特征,待其收敛过后保存当前的网络参数得到最终的网络模型。
22.s4:神经网络提取特征的流程如图2所示,输入图像经过s2所述预处理过后送入神经网络,经过一系列卷积、归一化、激活层过后,取最终分类层的输入作为晶圆图的特征。
23.具体地,s4提取到的晶圆图像特征为1024维,对1024维的特征向量进行归一化操作。不同数据、不同场景的最佳维度有所不同。
24.s5:保存所有已知数据的特征向量到全量数据库,同时记录对应晶圆缺陷所属类别。
25.s6:知识库的构建流程对应图3,所述流程包括同类数据筛选、同类缺陷特征聚类、聚类结束后统计全部聚类中心、筛选与聚类中心距离最近的样本,作为典型样本,将典型样本的特征向量以及对应缺陷类别存入知识库。
26.所述聚类中心与样本之间的距离可通过欧氏距离、余弦距离进行计算。
27.若初始时存在某一类别的缺陷数据数量少于s6所述聚类中心数量,则将该类别所有样本均存入知识库当中。
28.s7:检索规则对应图4,其中待检测晶圆样本预处理方式和流程与s2所述一致、神经网络提取晶圆图像特征向量的方式流程与s3所述一致,不再赘述。
29.进一步地,提取到待测晶圆样本的特征向量,通过相似度计算公式计算当前特征向量与知识库内所有特征向量的相似度,若当前样本与知识库内任一样本的相似度高于阈值0.5,则认为当前样本属于与它相似度最高的知识库样本所属的类别,并将当前样本存入全量库。
30.进一步地,若当前样本与知识库内所有样本的相似度都低于阈值0.5,则切换检索库为全量数据库,计算当前待检测数据的特征向量与全量数据库内所有样本特征向量的相
似度;若当前样本与全量数据库内任一样本的相似度高于阈值0.5,则认为当前样本属于与它相似度最高的全量数据库样本所属的类别,并将当前样本存入全量库。
31.进一步地,若不存在相似度高于阈值0.5的匹配项,则将当前样本判定为一种新的缺陷类型,将其存入知识库和全量数据库。
32.在生产识别过程中,本发明所述的知识库以及全量数据库在不断更新迭代,能够紧跟产品的变化,优选地,知识库可根据具体生产产量、工艺变化定期更新,以保证知识库内样本的典型性。
33.本发明目前有一项目当中包含大约10万条数据,整体检索耗时约为0.19s,经过提取典型样本构建知识库后,知识库包含约2000条数据,检索耗时约0.003s。
34.综上所述,本发明实施例针对晶圆图像缺陷检索,构建了一种知识库-全量库两级检索结构,通过晶圆图的特征向量筛选出每一类当中具有典型特征的样本,相较于直接在全量数据检索,本发明所提出的流程大大减少了检索的复杂度,提高了检索效率;相较于固定检索库的方式,本发明提出的流程能够实时对知识库、全量库更新,保证检索准确性,本发明是一种同时兼顾检索速度和检索性能的检索库构建方式和检索方法。
35.又一方面,本发明还公开一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述方法的步骤。
36.再一方面,本发明还公开一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。
37.在本技术提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一基于晶圆缺陷知识库的构建及检索方法。
38.可理解的是,本发明实施例提供的系统与本发明实施例提供的方法相对应,相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。
39.本技术实施例还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述基于晶圆缺陷知识库的构建及检索方法。
40.上述电子设备提到的通信总线可以是外设部件互连标准(英文:peripheral component interconnect,简称:pci)总线或扩展工业标准结构(英文:extended industry standard architecture,简称:eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
41.通信接口用于上述电子设备与其他设备之间的通信。
42.存储器可以包括随机存取存储器(英文:random access memory,简称:ram),也可以包括非易失性存储器(英文:non-volatile memory,简称:nvm),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
43.上述的处理器可以是通用处理器,包括中央处理器(英文:central processing unit,简称:cpu)、网络处理器(英文:network processor,简称:np)等;还可以是数字信号
处理器(英文:digital signal processing,简称:dsp)、专用集成电路(英文:application specific integrated circuit,简称:asic)、现场可编程门阵列(英文:field-programmable gate array,简称:fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
44.在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solid state disk (ssd))等。
45.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
46.本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
47.以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种基于晶圆缺陷知识库的构建及检索方法,其特征在于,包括以下步骤,s01:获取晶圆电性测试结果;s02:根据电性测试结果,将晶圆上失效状态的die与正常状态的die统计出来,并将失效die所在位置灰度值设置为255,正常die所在位置灰度值设置为127,不在wafer区域的灰度值设置为0,生成晶圆图,并对图片进行标注;s03:依据专家知识对已有晶圆图数据进行标注,并将其当作训练数据用于神经网络训练,神经网络经过多轮迭代训练学习缺陷的特征,待其收敛过后保存当前的网络参数得到最终的网络模型;s04:使用上述s03得到的神经网络模型提取s02处理后数据的特征,得到训练图像数据的向量表示;s05:将所有训练数据特征向量存入全量数据库,同时记录对应晶圆缺陷所属类别;s06:使用聚类算法,获取全量库当中同一类缺陷数据里具有代表性的样本,存入知识库;所需要提取的代表性样本数量可根据聚类中心数量进行调整设置;若初始时某一类缺陷全量样本数量少于设定的聚类数量,则将该类所有样本全存入知识库当中;s07:使用上述s03的神经网络模型提取待检测数据的特征,得到待检测图像数据的向量表示,计算当前待检测数据的特征向量与知识库内样本特征向量的相似度。2.根据权利要求1所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:提取到待测晶圆样本的特征向量,通过相似度计算公式计算当前特征向量与知识库内所有特征向量的相似度,若当前样本与知识库内任一样本的相似度高于阈值0.5,则认为当前样本属于与它相似度最高的知识库样本所属的类别,并将当前样本存入全量库。3.根据权利要求1所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:若当前样本与知识库内所有样本的相似度都低于0.5,则切换检索库为全量数据库,计算当前待检测数据的特征向量与全量数据库内样本特征向量的相似度。4.根据权利要求3所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:若当前样本与全量数据库内所有样本的相似度都低于0.5,则判断当前样本为新缺陷类型,并将当前样本存入知识库和全量数据库。5.根据权利要求1所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:所述步骤s02中转换得到晶圆图的灰度图之后,还包括对晶圆图进行缩放,保证所有图像尺寸相同,并且对缩放后的图像进行归一化处理,归一化方式如下式所示:其中,代表图像坐标(x,y)处的灰度值、代表归一化过后图像坐标(x,y)处的值。6.根据权利要求1所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:步骤s04中使用上述s03得到的神经网络模型提取s02处理后数据的特征,得到训练图像数据的向量表示,具体包括,输入图像经过s02预处理过后送入神经网络,经过一系列卷积、归一化、激活层过后,取
最终分类层的输入作为晶圆图的特征。7.根据权利要求6所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:s04提取到的晶圆图像特征为1024维,对1024维的特征向量进行归一化操作。8.根据权利要求1所述的基于晶圆缺陷知识库的构建及检索方法,其特征在于:知识库的构建包括同类数据筛选、同类缺陷特征聚类,聚类结束后统计全部聚类中心,筛选与聚类中心距离最近的样本,作为典型样本,将典型样本的特征向量以及对应缺陷类别存入知识库;所述聚类中心与样本之间的距离可通过欧氏距离、余弦距离进行计算。9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。
技术总结
本发明的一种基于晶圆缺陷知识库的构建及检索方法、设备及介质,包括获取晶圆电性测试结果;设置失效及有效区,并对图片进行标注;将处理过后的数据训练图像识别神经网络,使用得到的神经网络模型提取处理后数据的特征,得到训练图像数据的向量表示;将所有训练数据特征向量存入全量数据库;使用聚类算法,获取具有代表性的样本,存入知识库;使用上述神经网络模型提取待检测数据的特征,得到待检测图像数据的向量表示,计算当前待检测数据的特征向量与知识库内样本特征向量的相似度。本发明通过晶圆图的特征向量筛选出每一类当中具有典型特征的样本,相较于直接在全量数据检索,本发明所提出的流程大大减少了检索的复杂度,提高了检索效率。高了检索效率。高了检索效率。
技术研发人员:刘东昀 赵文政 刘林平 谢箭
受保护的技术使用者:合肥喆塔科技有限公司
技术研发日:2023.06.12
技术公布日:2023/7/12
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:一种磨刀设备用导电环的制作方法 下一篇:一种基于低代码控制器的低压继电保护方法
