基于N型和P型铁电场效应晶体管实现通用内容可寻址存储器的方法
未命名
08-15
阅读:123
评论:0
基于n型和p型铁电场效应晶体管实现通用内容可寻址存储器的方法
技术领域
1.本发明涉及新型存储与计算技术领域,具体涉及一种基于n型和p型铁电场效应晶体管的通用内容可寻址存储器设计。
背景技术:
2.内容可寻址存储器(cam)可以高效且并行地执行搜索操作,被广泛应用在路由器、数据库搜索、存内计算以及神经形态计算等高效机器学习模型中。cam是一种用于并行搜索的特殊类型的存储器,其除了具有常规存储器的读操作和写操作之外,还可以执行独特的搜索操作。cam最初是用于加速网络路由器中的数据包转发和分类等相关的查表操作,由于cam可以在一个时钟周期内完成整个搜索操作,相较于其他基于硬件或软件的搜索系统具有显著的加速效果,在cam的基础上进一步发展了具有存储掩码“x”状态能力的三态内容可寻址存储器(tcam),tcam可以实现精确匹配或者模糊匹配,提高查表效率。在大数据时代,由于cam可以在一个搜索周期内完成输入向量(query)与所有存储向量(entry)的匹配操作,并根据不匹配程度进行基于距离度量的特征检索,在处理模式匹配、视频与图像处理等边缘端机器学习任务中具有极大的吸引力。
3.基于传统静态随机存取存储器(sram)的cam设计占用巨大的单元面积,限制了其对于计算密集型算法映射的存储密度,并且由此带来的较大寄生电容还会进一步增大搜索延时与功耗。基于各种新兴的非易失性存储器,例如电阻式随机存取存储器(rram)、相变存储器(pcm)以及铁电场效应晶体管(fefet)等,设计的cam具有降低的单元面积以及搜索延时和能耗。此外,进一步利用新兴非易失性存储器的多值存储能力设计的多值内容可寻址存储器(mcam)和模拟内容可寻址存储器(acam),不仅可以提高cam的存储密度,还可以基于acam独特的范围匹配操作用于决策树、深度随机森林等更加广泛的应用场景。
4.但是目前基于新兴非易失性存储器的各种cam设计所需的硬件开销不同,并且mcam和acam设计需要通过额外的硬件开销实现,即通过额外的控制晶体管或者附加外围复杂电路,实现模拟或多值输入与存储范围之间的匹配操作,相应的编程以及搜索方式也更加的复杂。因此,在不需要额外硬件代价下同时实现紧凑并且操作简洁的tcam、mcam和acam设计,对于进一步提高cam的密度并扩展功能性具有十分显著的意义。
技术实现要素:
5.针对以上现有技术中存在的问题,本发明提出了一种基于n型和p型fefet的通用cam设计,利用n型fefet和p型fefet的互补特性,在不需要额外硬件开销的前提下可以同时实现tcam、macm和acam的功能,并且具有更加简洁的搜索操作,提高了cam的存储密度和搜索能效,扩展了cam的应用场景。
6.本发明的技术方案如下:
7.一种基于互补fefet实现通用cam的方法,其特征在于,
8.1)cam单元由两个并联的fefet组成,其中一个是n型fefet,一个是p型fefet,两个fefet的漏极连接作为cam的匹配线(ml),用于检测搜索操作中搜索query与存储entry是否匹配,两个fefet的源极共同接地,两个fefet的栅极在编程时分别连接两条位线,在搜索时连接同一条搜索线(sl),用于施加与搜索query相应的搜索电压;
9.2)在编程cam存储entry的阶段,分别对n型fefet和p型fefet的栅极施加一定的编程电压,将其编程为不同的阈值电压状态,在器件的转移特性曲线上体现为沿栅极电压平移,漏极电流最小时对应的栅极电压称为v
off
。对于entry 0,将两个fefet编程为v
off0
状态,对于entry 1,将两个fefet编程为v
off1
状态;
10.3)在搜索阶段,对于query 0,对sl施加电压v
sl0
=v
off0
,对于query 1,对sl施加电压v
sl1
=v
off1
。因此,只有当query与entry匹配时,每个cam单元的两个fefet都处于截止状态,具有很低的漏极电流,表示匹配;否则,会有一个fefet处于导通状态,具有较高的漏极电流,表示不匹配。对于entry x,将p型fefet编程为v
off0
状态,将n型fefet编程为v
off1
状态,则对于任意搜索query,两个fefet均为截止状态,表示匹配。
11.进一步,通过将所述cam单元的两个fefet编程为相同的多个v
off
状态,即可以将其量化为mcam单元,多个v
off
状态代表多级分立的存储entry,量化的搜索query的v
sl
等于相应的v
off
。在搜索时,根据搜索query对sl施加相应的搜索电压v
sl
,只有当搜索query与存储entry一致时,v
sl
与v
off
相等,两个fefet处于截止状态。进一步将mcam单元的n型fefet编程和p型fefet编程为不同的v
off
状态,则处于两个v
off
状态之间的v
sl
对应的搜索query均是匹配的,进一步实现entry压缩的功能。
12.进一步,通过将所述cam单元的n型fefet和p型fefet的阈值电压分别编程为v
thn
和v
thp
,其中v
thn
》v
thp
,即可以实现acam单元的功能。acam单元存储entry的匹配范围是[v
thp
,v
thn
],其对应的漏极电流为i
ref
。在搜索阶段,对sl施加一定的电压v
sl
,其大小与搜索query对应,只有当v
sl
在匹配范围之内,才可以使得acam单元的ml电流小于i
ref
,表示搜索query与存储entry范围匹配。当v
sl
小于匹配范围的下边界v
thp
时,会使p型fefet的电流大于i
ref
,当v
sl
大于匹配范围的上边界v
thn
时,会使n型fefet的电流大于i
ref
,即ml的电流大于i
ref
,表示搜索query与存储entry范围不匹配,实现acam单元的搜索操作。
[0013]
进一步,若干个cam单元构成阵列,每行cam单元共享ml,根据输入query向量,同时对所有的sl端施加相应的模拟搜索电压,根据搜索query向量与存储entry向量的不同不匹配情况,每一个cam单元会有与该位不匹配程度正相关的电流,而cam阵列的每一行ml将每一个cam单元的电流累加,该电流大小与搜索query和存储entry向量的不匹配程度正相关,根据该电流大小可以实现距离度量等应用。
[0014]
综上所述,利用n型fefet和p型fefet的互补且对称的转移特性可以在不需要额外硬件开销下实现tcam、具有entry压缩的mcam以及acam功能,基于cam阵列可以进一步实现距离度量等应用。
[0015]
本发明提出的基于n型和p型fefet的通用cam设计,其中的铁电材料需要采用hfo2掺zr(hzo)、hfo2掺al(hfalo)等各类hfo2掺杂型多畴铁电材料,器件栅叠层可以基于mfmis、mfis、mfs等多种结构。
[0016]
本发明的技术效果如下:
[0017]
1、本发明提出的基于n型和p型fefet的通用cam设计,利用n型fefet和p型fefet的
互补且对称的转移特性实现tcam单元,并且在不需要额外硬件开销下实现了mcam单元和acam单元,提高了cam的存储密度和搜索能效,扩展了cam的应用场景。
[0018]
2、本发明提出的基于n型和p型fefet的通用cam设计,在量化为存储多级entry状态的mcam时,还具有压缩entry状态的能力,使其可以进一步提高cam的存储密度,对于基于cam的查表搜索操作具有重要意义。
附图说明
[0019]
图1为本发明基于n型和p型fefet的通用cam设计的单元结构示意图;
[0020]
图2为本发明基于n型和p型fefet的通用cam用于tcam时的功能原理图;
[0021]
图3为本发明基于n型和p型fefet的通用cam用于mcam时的功能原理图;
[0022]
图4为本发明基于n型和p型fefet的通用cam用于acam时的功能原理图。
具体实施方式
[0023]
下面结合附图,通过具体实施例,进一步清楚、完整地阐述本发明。
[0024]
本发明基于n型和p型fefet的通用cam设计的单元结构示意图如图1所示,cam单元由并联的一个n型fefet和一个p型fefet组成,两个并联的fefet的漏极连接ml,用于检测搜索操作中是query与entry是否匹配,两个并联的fefet的源极接地,两个fefet的栅极在编程操作时分别连接两条位线,用于施加编程电压;两个fefet的栅极在搜索操作时连接同一条sl,用于施加与query相应的搜索电压。图2为本实施例的基于n型和p型fefet的通用cam用于tcam时的功能原理图,在编程阶段,分别对n型fefet和p型fefet施加一定的编程电压,对于entry 0,将两个fefet编程为v
off0
状态,对于entry 1,将两个fefet编程为v
off1
状态,对于entry x,将p型fefet编程为v
off0
状态,将n型fefet编程为v
off1
状态。在搜索阶段,对于query 0,对sl施加电压v
sl0
=v
off0
,对于query1,对sl施加电压v
sl1
=v
off1
。因此只有当搜索query与存储entry一致时,两个fefet均为截止状态,表示匹配。
[0025]
图3为本实施例基于n型和p型fefet的通用cam用于mcam时的功能原理图,以2-bit mcam为例,通过将所述cam单元编程为4个不重叠的匹配范围,分别代表2-bit mcam单元的entry“00”、“01”、“10”和“11”,搜索query为对应entry存储范围的中心电压值。在搜索时,根据query施加相应的搜索电压,只有当搜索query与存储entry一致时,v
sl
才位于匹配范围之内表示匹配,否则v
sl
会位于匹配范围之外,ml端会检测到较大的电流,表示不匹配。进一步可以将mcam单元的entry“00”和“01”编程为一个匹配范围,则该存储状态代表entry“0x”,即对于搜索query“00”和“01”,entry“0x”均可以匹配,同样的将mcam单元的entry“10”和“11”编程为一个匹配范围,则该存储状态表示entry“1x”,对于搜索query“10”和“11”,entry“1x”均可以匹配。此外,可以将“0x”和“10”编程为一个匹配范围,并且可以同tcam中entry x类似,编程为“xx”状态,表示对所有的搜索query都匹配。
[0026]
图4为本实施例基于n型和p型fefet的通用cam用于acam时的功能原理图,在编程阶段,分别对n型fefet和p型fefet施加一定的编程电压,将n型fefet的阈值电压编程为v
thn
,将p型fefet的阈值电压编程为v
thp
,需要保证v
thp
《v
thn
,表示该acam单元被编程为匹配范围为[v
thp
,v
thn
]的状态,其对应的漏极电流为i
ref
。在搜索阶段,对sl施加一定的电压v
sl
,其大小与搜索query对应,只有当v
sl
在匹配范围之内,才可以使得acam单元的ml电流小于iref
,表示搜索query与存储entry范围匹配。当v
sl
小于匹配范围的下边界v
thp
时,会使p型fefet的电流大于i
ref
,当v
sl
大于匹配范围的上边界v
thn
时,会使n型fefet的电流大于i
ref
,即ml的电流大于i
ref
,表示搜索query与存储entry范围不匹配。
[0027]
本实施例完整、详细地阐述了基于n型和p型fefet的通用cam单元的在不需要额外硬件开销下实现tcam、mcam和acam功能,扩展了cam的应用场景
[0028]
最后,需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
技术特征:
1.一种基于n型和p型铁电场效应晶体管实现通用内容可寻址存储器的方法,其步骤包括:1)内容可寻址存储器cam单元由两个并联的fefet组成,其中一个是n型fefet,一个是p型fefet,两个fefet的漏极连接作为cam单元的匹配线,用于检测搜索操作中搜索query与存储entry是否匹配,两个fefet的源极共同接地,两个fefet的栅极在编程时分别连接两条位线,在搜索时连接同一条搜索线,用于施加与搜索query相应的搜索电压;2)在编程cam单元存储entry的阶段,分别对n型fefet和p型fefet的栅极施加一定的编程电压,将其编程为不同的阈值电压状态,在器件的转移特性曲线上体现为沿栅极电压平移,漏极电流最小时对应的栅极电压称为v
off
,对于entry 0,将两个fefet编程为v
off0
状态,对于entry 1,将两个fefet编程为v
off1
状态,对于entry x,将p型fefet编程为v
off0
状态,将n型fefet编程为v
off1
状态;3)在搜索阶段,对于query 0,对sl施加电压v
sl0
=v
off0
,对于query 1,对sl施加电压v
sl1
=v
off1
,当query与entry匹配时,cam单元的两个fefet处于截止状态,表示匹配;否则,会有一个fefet处于导通状态,表示不匹配。2.如权利要求1所述的方法,其特征在于,将所述cam单元的两个fefet编程为相同的多个v
off
状态,即实现量化为mcam单元,多个v
off
状态代表多级分立的存储entry,量化的搜索query的v
sl
等于相应的v
off
,在搜索时,根据搜索query对sl施加相应的搜索电压v
sl
,只有当搜索query与存储entry一致时,v
sl
与v
off
相等,两个fefet处于截止状态。3.如权利要求2所述的方法,其特征在于,将mcam单元的n型fefet编程和p型fefet编程为不同的v
off
状态,则处于两个v
off
状态之间的v
sl
对应的搜索query均是匹配的,实现entry压缩的功能。4.如权利要求1所述的方法,其特征在于,将所述cam单元的n型fefet和p型fefet的阈值电压分别编程为v
thn
和v
thp
,其中v
thn
>v
thp
,实现acam单元的功能,acam单元存储entry的匹配范围是[v
thp
,v
thn
],其对应的漏极电流为i
ref
,在搜索阶段,对sl施加一定的电压v
sl
,其大小与搜索query对应,当v
sl
在匹配范围之内,acam单元的ml电流小于i
ref
,表示搜索query与存储entry范围匹配;当v
sl
小于匹配范围的下边界v
thp
时,p型fefet的电流大于i
ref
,当v
sl
大于匹配范围的上边界v
thn
时,n型fefet的电流大于i
ref
,即ml的电流大于i
ref
,表示搜索query与存储entry范围不匹配。5.如权利要求1所述的方法,其特征在于,若干个cam单元构成阵列,每行cam单元共享ml,根据输入query向量,同时对所有的sl端施加相应的模拟搜索电压,根据搜索query向量与存储entry向量的不同不匹配情况,每一个cam单元会有与该位不匹配程度正相关的电流,阵列的每一行ml将每一个cam单元的电流累加,该电流大小与搜索query和存储entry向量的不匹配程度正相关,根据该电流大小实现距离度量应用。
技术总结
本发明提供了一种基于N型和P型铁电场效应晶体管实现通用内容可寻址存储器的方法,属于新型存储与计算技术领域。本发明利用了N型FeFET和P型FeFET的互补特性,在不需要额外硬件开销的前提下可以同时实现TCAM、MACM和ACAM的功能,并且具有更加简洁的搜索操作,提高了CAM的存储密度和搜索能效,且在量化为存储多级entry状态的MCAM时,还具有压缩entry状态的能力,使其可以进一步提高CAM的存储密度,对于基于CAM的查表搜索操作具有重要意义。基于CAM的查表搜索操作具有重要意义。基于CAM的查表搜索操作具有重要意义。
技术研发人员:黄芊芊 徐伟凯 黄如
受保护的技术使用者:北京大学
技术研发日:2023.05.26
技术公布日:2023/8/14
版权声明
本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
飞行汽车 https://www.autovtol.com/
上一篇:锁附治具及装配系统的制作方法 下一篇:一种饲料加工用切削装置及其切削方法与流程
