SRAM阵列的数据选择装置、存储系统和系统级芯片的制作方法

未命名 10-18 阅读:90 评论:0

sram阵列的数据选择装置、存储系统和系统级芯片
技术领域
1.本发明属于数据存储领域,特别是静态随机存取存储器(static random-access memory,sram)阵列的数据选择装置、存储系统和系统级芯片。


背景技术:

2.sram是芯片设计中常用的存储装置。受限于sram制造工艺,单块sram 容量通常有限。系统级芯片 (system on chip,soc)对sram 需求空间大,通常使用多组sram实现大空间存储。sram的输出数据距离控制逻辑较远,走线较长,导致输出数据出现时序延迟(timing delay),会给后端的时序收敛带来困难。举例:sram依据一定的时序输出数据(比如,在时钟信号的上升沿时输出),由于走线距离等原因导致输出数据出现时序延迟,从而接收端基于该时序不能正常接收数据。
3.目前,在前端设计时,通常在每个sram数据输出端口上直接连接d触发器,在d触发器处清除输出数据的时序延迟,以切断时序路径,便于时序收敛。然而,这种处理方式需要布置大量的d触发器,具有资源成本问题,而且不利于精简硬件结构。


技术实现要素:

4.本发明实施方式提出sram阵列的数据选择装置、存储系统和系统级芯片。
5.本发明实施方式的技术方案如下:一种sram阵列的数据选择装置,包括:多路复用器(mux)阵列,包含多个mux;包含多个d触发器的d触发器阵列,布置在所述mux阵列的内部;所述mux阵列的输入端与sram阵列的输出端连接,所述mux阵列的输出端与总线连接;所述mux阵列,用于选择所述sram阵列中的存储数据的输出通路;布置在所述输出通路上的d触发器,用于截断所述输出通路的时序路径。
6.在一个实施方式中,所述mux阵列包括多级的mux;所述多个d触发器,并行布置在所述mux阵列中的相邻级之间的相同位置,或并行布置在所述mux阵列中的不同位置。
7.在一个实施方式中,所述mux阵列包括多级的mux;所述d触发器阵列包括第一部分和第二部分;其中所述第一部分,并行布置在所述mux阵列中的相邻级之间的相同位置;所述第二部分,并行布置在所述mux阵列中的不同位置。
8.在一个实施方式中,在沿着从所述sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。
9.在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,任
意两个最接近的d触发器之间的时序延迟小于所述时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。
10.一种存储系统,包括:sram阵列,所述sram阵列包含多个sram组,每个sram组包含多个sram;mux阵列,包含多个mux;包含多个d触发器的d触发器阵列,布置在所述mux阵列的内部;其中每个mux的输入端与对应的sram组的输出端连接,所述mux阵列的输出端与总线连接;所述mux阵列,用于选择所述sram阵列中的存储数据的输出通路;布置在所述输出通路上的d触发器,用于截断所述输出通路的时序路径。
11.在一个实施方式中,所述mux阵列包括多级的mux;所述多个d触发器,并行布置在所述mux阵列中的相邻级之间的相同位置,或并行布置在所述mux阵列中的不同位置。
12.在一个实施方式中,所述mux阵列包括多级的mux;所述d触发器阵列包括第一部分和第二部分;其中所述第一部分,并行布置在所述mux阵列中的相邻级之间的相同位置;所述第二部分,并行布置在所述mux阵列中的不同位置。
13.在一个实施方式中,在沿着从所述sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。
14.在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,任意两个最接近的d触发器之间的时序延迟小于所述时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。
15.一种系统级芯片,包括如上任一项所述的存储系统或如上任一项所述的sram阵列的数据选择装置。
16.从上述技术方案可以看出,在本发明实施方式中,数据选择装置包括:mux阵列,包含多个mux;包含多个d触发器的d触发器阵列,布置在mux阵列的内部;mux阵列的输入端与sram阵列的输出端连接,mux阵列的输出端与总线连接;mux阵列,用于选择sram阵列中的存储数据的输出通路; 布置在输出通路上的d触发器,用于截断输出通路的时序路径。因此,基于mux阵列与d触发器阵列的协同配合,可以改善时序延迟,还节约了d触发器资源,简化了硬件结构。
附图说明
17.图1是sram阵列的示范性结构图。
18.图2是本发明实施方式的sram阵列的数据选择装置的示范性结构图。
19.图3是本发明实施方式的sram阵列与mux阵列的示范性结构图。
20.图4是本发明实施方式的在mux阵列中布置d触发器阵列的示范性示意图。
实施方式
21.为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。
22.为了描述上的简洁和直观,下文通过描述若干代表性的实施方式来对本发明的方案进行阐述。实施方式中大量的细节仅用于帮助理解本发明的方案。但是很明显,本发明的技术方案实现时可以不局限于这些细节。为了避免不必要地模糊了本发明的方案,一些实施方式没有进行细致地描述,而是仅给出了框架。下文中,“包括”是指“包括但不限于”,“根据
……”
是指“至少根据
……
,但不限于仅根据
……”
。由于汉语的语言习惯,下文中没有特别指出一个成分的数量时,意味着该成分可以是一个也可以是多个,或可理解为至少一个。
23.sram阵列通常包含多个sram组,每个sram组中包含多个sram。图1是sram阵列的示范性结构图。如图1所示的sram阵列包含n个sram组,分别为sram组0、sram组1、sram组2
……
sram组(n-1)。每个sram组中分别包含n个sram。因此,sram阵列总共包含n*n个sram。
24.当总线对sram阵列进行读操作时,选择其中一个sram组的数据进行输出。在现有技术中,针对每个sram组,分别在该组的数据输出端口上直接连接d触发器,以切断该组数据传输的时序路径,从而便于时序收敛。因此,sram阵列总共需要连接至少n个d触发器。
25.本发明实施方式利用mux能从多个输入数据中选择数据并将其转发的功能,将mux与d触发器相互结合,实现能从多个模拟或数字输入信号中选择某个信号并将其转发一种在mux阵列内部中利用d触发器阵列消除sram输出数据的时序延迟的方法,可以在解决时序收敛问题的同时,降低对d触发器的资源需求。
26.图2是本发明实施方式的sram阵列的数据选择装置的示范性结构图。在图2中,sram阵列的数据选择装置包括:mux阵列,包含多个mux;包含多个d触发器的d触发器阵列,布置在mux阵列的内部;mux阵列的输入端与sram阵列的输出端连接,mux阵列的输出端与总线连接;mux阵列,用于选择sram阵列中的存储数据的输出通路;布置在该输出通路上的d触发器,用于截断输出通路的时序路径。
27.mux阵列中的每个mux都可以从sram阵列的多个输出通道中选择输出通路。当总线对sram阵列进行读操作时,mux阵列选择sram阵列中的一个sram组的输出数据,通过mux阵列的输出端输出到总线。
28.d触发器是具有记忆功能且具有两个稳定状态的信息存储器件,是构成多种时序电路的基本逻辑单元。在触发边沿到来时,d触发器将输入端的值存入其中,并且这个值与当前存储值无关。在两个有效的脉冲边沿之间,d触发器的输入端d跳转不会影响触发器存储的值。基于d触发器的上述特性,可以利用d触发器截断数据传输的时序路径,从而有利于芯片的时序收敛。
29.在本发明实施方式中,通过将d触发器阵列布置在mux阵列的内部,而不是为每个sram组的数据输出端口直接连接d触发器,可以显著减少d触发器的部署数量。而且,结合了mux的多路复用功能的d触发器,可以截断输出到总线的每个输出通路的时序路径,因此还保证了时序收敛。
30.在一个实施方式中,mux阵列包括多级的mux;d触发器阵列中的多个d触发器,并行
布置在mux阵列中的相邻级之间的相同位置。在这里,考虑到每个输出通路的时序延迟特性通常相同或类似,通过将多个d触发器并行布置在mux阵列中的相邻级之间的相同位置,可以降低布置难度。
31.在一个实施方式中,mux阵列包括多级的mux;d触发器阵列中的多个d触发器,并行布置在mux阵列中的不同位置。在这里,考虑到各个输出通路的时序延迟特性可能不同(比如,各个输出通路的传输路径长度可能会有差异),需要将多个d触发器并行布置在mux阵列中的不同位置,以截断每个输出通路的时序路径。
32.在一个实施方式中,mux阵列包括多级的mux;d触发器阵列包括第一部分和第二部分;其中第一部分,并行布置在mux阵列中的相邻级之间的相同位置;第二部分,并行布置在mux阵列中的不同位置。在这里,针对时序延迟特性相同的输出通路,将第一部分并行布置在mux阵列中的相邻级之间的相同位置,从而既可以截断这些时序延迟特性相同的输出通路的时序路径,还可以降低布置难度;针对时序延迟特性不同的输出通路,将第二部分并行布置在mux阵列中的不同位置,从而能够截断这些时序延迟特性不同的输出通路的时序路径。
33.在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值。
34.在这里,第一个d触发器的布置位置同时满足:(1)使得到达第一个d触发器的时序延迟小于预定的时序延迟门限值;(2)使得到达第一个d触发器的时序延迟与时序延迟门限值之间的差值小于预定的差值门限值。
35.其中:时序延迟门限值可以是固定值,也可以是可调值。类似地,差值门限值可以是固定值,也可以是可调值。优选地,时序延迟门限值是基于sram阵列的最大工作频率所确定的。比如,假定sram阵列的最大工作频率为250mhz,则时序延迟门限值可以为1/250mhz=4纳秒(ns)。因此,针对第一个d触发器的这种布置方式,既可以保证到达第一个d触发器后的时序收敛,还可以保证第一个d触发器的布置位置尽量远离sram阵列的输出端(从而尽量减少d触发器的部署数目)。比如,可以利用时序延迟测量工具(举例,prime time)测量到达第一个d触发器的时序延迟。
36.在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,任意两个最接近的d触发器之间的时序延迟小于时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值。
37.在这里,任意两个最接近的d触发器的布置位置同时满足:(1)使得任意两个最接近的d触发器之间的时序延迟小于预定的时序延迟门限值;(2)使得任意两个最接近的d触发器之间的时序延迟与时序延迟门限值之间的差值小于预定的差值门限值。
38.其中:时序延迟门限值可以是固定值,也可以是可调值。类似地,差值门限值可以是固定值,也可以是可调值。优选地,时序延迟门限值是基于sram阵列的最大工作频率所确定的。比如,假定sram阵列的最大工作频率为250mhz,则时序延迟门限值可以为1/250mhz=4纳秒(ns)。因此,既可以保证时序收敛,还可以保证任意两个最接近的d触发器之间的距离
尽量远(从而尽量减少d触发器的部署数目)。比如,可以利用时序延迟测量工具(举例,prime time)测量到达任意两个最接近的d触发器之间的时序延迟。
39.本发明实施方式还提出了一种存储系统。存储系统包括:sram阵列,sram阵列包含多个sram组,每个sram组包含多个sram;mux阵列,包含多个多路复用器;包含多个d触发器的d触发器阵列,布置在mux阵列的内部;其中每个mux的输入端与对应的sram组的输出端连接,mux阵列的输出端与总线连接;mux阵列,用于选择sram阵列中的存储数据的输出通路; 布置在输出通路上的d触发器,用于截断输出通路的时序路径。
40.在一个实施方式中,mux阵列包括多级的mux;多个d触发器,并行布置在mux阵列中的相邻级之间的相同位置,或并行布置在mux阵列中的不同位置。
41.在一个实施方式中,mux阵列包括多级的多路复用器;d触发器阵列包括第一部分和第二部分;其中第一部分,并行布置在mux阵列中的相邻级之间的相同位置;第二部分,并行布置在阵列中的不同位置。
42.在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值。在一个实施方式中,在沿着从sram阵列的输出端到总线的每一个输出通路中,任意两个最接近的d触发器之间的时序延迟小于时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值。
43.图3是本发明实施方式的sram阵列与mux阵列的示范性结构图。
44.在图3中,sram阵列包含n个sram组,分别是sram组0、sram组1、sram组2、sram组3
……
sram组(n-1)。
45.mux阵列包含(m+1)级,分别为位置2处的第1级mux(mux_l0_0、mux_l0_1、mux_l0_2、mux_l0_3
……
mux_l0_(n/2-1)),位置4处的第2级mux(mux_l1_0、mux_l1_1
……
mux_l1_(n/4-1)),位置6处的第3级mux(mux_l2_0、mux_l2_1
……
mux_l1_(n/8-1)),等等。
46.本实施例中,mux阵列中的每个mux都实施为二选一的mux,即具有两个数据输入端和一个数据输出端。第1级mux中的mux的两个数据输入端分别连接sram阵列中的对应的两个sarm组,中间级mux的数据输出端分别连接下一级mux的数据输入端,最后一级mux的数据输出端连接总线。
47.可以利用时序延迟测量工具(举例,prime time)测量从sram组-》各级mux-》总线的所有输出通路中的各段路径的时序延迟参数。然后,在输出通路中找出能满足时序延迟门限值的最右侧位置(即尽量靠近总线),并在该位置插入d触发器,在此位置插入d触发器的资源代价最小。其中:若插入d触发器后的右侧路径的时序延迟仍然不满足时序延迟门限值,可以在右侧路径中继续插入d触发器。
48.d触发器的具体插入方式可以包括:(1)可以在位置3(即位置2的mux级与位置4的mux级之间,其中位置2的mux级与位置4的mux级是相邻级)、位置5(即位置4的mux级与位置6的mux级之间,其中位置4的mux级与位置6的mux级是相邻级)、位置7(即位置6的mux级与位置8的mux级之间,其中位置6的mux级与位置8的mux级是相邻级)等位置,并行插入多个d触发器(d触发器对应于前一个相邻级中的mux,因此d触发器数量等同于前一个相邻级中的mux数量)。这些插入的d触发器共同形成d触发器阵列。
49.假定如现有技术那样在位置1处插入d触发器需占用的d触发器资源为a比特,则依据本发明实施方式采用二选一mux时,在位置3处插入d触发器需占用a/2比特,在位置5处插入d触发器需占用a/4比特,在位置7处插入d触发器需占用a/8比特,可见本发明实施方式显著降低了d触发器资源。
50.(2)可以在多路复用器阵列中的任意位置处插入d触发器。此时需要满足:

在沿着从sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值;

任意两个最接近的d触发器之间的时序延迟小于时序延迟门限值且与时序延迟门限值之间的差值小于预定的差值门限值。基于这种方式插入的d触发器,可以良好匹配每个输出通道的自身状况。当输出通道的时序延迟较大时,可以在该输出通道中插入较多的d触发器;当输出通道的时序延迟较小时,可以在该输出通道中插入较少的d触发器。
51.下面以一个存储系统实例描述本发明实施方式。针对5mb的存储系统,假定一个sram的存储容量为4098(深度)*128(位宽)=64(kb)。每4个sram组成一个sram组,sram组的总容量为4098*128*4=256(kb)。
52.图4是本发明实施方式的在mux阵列中布置d触发器阵列的示范性示意图。
53.在图4中,mux阵列中的mux都实施为二选一mux,即每个mux具有两个数据输入端和一个数据输出端。
54.mux阵列包含5级,分别为第1级mux(mux_l0_0、mux_l0_1、mux_l0_2、mux_l0_3
……
mux_l0_9),第2级mux(mux_l1_0、mux_l1_1
……
mux_l1_4),第3级mux(mux_l2_0、mux_l2_1),第4级mux(mux_l3_0)及第5级mux(mux_l4_0)。mux_l4_0的输出端连接总线。
55.在第2级mux(mux_l1_0、mux_l1_1
……
mux_l1_4)与第3级mux(mux_l3_0)之间,分别并行布置有形成d触发器阵列的5个d触发器。相比较现有技术中为每组sram插入d触发器的处理方式(共需插入20*128*4=10240bit),图4的d触发器阵列的总资源为20*128*4/4=2560bit,因此本发明实施方式在解决时序问题的同时,还兼顾了资源的消耗量。
56.在图4中,以二选一mux为例对mux阵列进行示范性说明。实际上,mux还可以实施为三选一mux、四选一mux或八选一mux等等,本发明实施方式对此并无限定。当mux的输入端越多时(即n选一mux中的n越大时),可以减少mux阵列中的mux数量,降低成本。而且,mux阵列中所采用的mux可以实施为同等类型的mux(比如,都是四选一mux),也可以实施为不同类型的mux(比如,一部分采用四选一mux,另一部分采用八选一mux,等等),本发明实施方式对此并无限定。
57.可以将上述sram阵列的数据选择装置和存储系统应用于系统级芯片。本发明实施方式还提出一种系统级芯片,包括如上任一项所述的存储系统或如上任一项所述的sram阵列的数据选择装置。
58.以上,仅为本发明的较佳实施方式而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术特征:
1.一种sram阵列的数据选择装置,其特征在于,包括:多路复用器阵列,包含多个多路复用器;包含多个d触发器的d触发器阵列,布置在所述多路复用器阵列的内部;所述多路复用器阵列的输入端与sram阵列的输出端连接,所述多路复用器阵列的输出端与总线连接;所述多路复用器阵列,用于选择所述sram阵列中的存储数据的输出通路;布置在所述输出通路上的d触发器,用于截断所述输出通路的时序路径。2.根据权利要求1所述的装置,其特征在于,所述多路复用器阵列包括多级的多路复用器;所述多个d触发器,并行布置在所述多路复用器阵列中的相邻级之间的相同位置,或并行布置在所述多路复用器阵列中的不同位置。3.根据权利要求1所述的装置,其特征在于,所述多路复用器阵列包括多级的多路复用器;所述d触发器阵列包括第一部分和第二部分;其中所述第一部分,并行布置在所述多路复用器阵列中的相邻级之间的相同位置;所述第二部分,并行布置在所述多路复用器阵列中的不同位置。4.根据权利要求1所述的装置,其特征在于,在沿着从所述sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。5.根据权利要求1所述的装置,其特征在于,在沿着从sram阵列的输出端到总线的每一个输出通路中,任意两个最接近的d触发器之间的时序延迟小于所述时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。6.一种存储系统,其特征在于,包括:sram阵列,所述sram阵列包含多个sram组,每个sram组包含多个sram;多路复用器阵列,包含多个多路复用器;包含多个d触发器的d触发器阵列,布置在所述多路复用器阵列的内部;其中每个多路复用器的输入端与对应的sram组的输出端连接,所述多路复用器阵列的输出端与总线连接;所述多路复用器阵列,用于选择所述sram阵列中的存储数据的输出通路;布置在所述输出通路上的d触发器,用于截断所述输出通路的时序路径。7.根据权利要求6所述的存储系统,其特征在于,所述多路复用器阵列包括多级的多路复用器;所述多个d触发器,并行布置在所述多路复用器阵列中的相邻级之间的相同位置,或并行布置在所述多路复用器阵列中的不同位置。8.根据权利要求7所述的存储系统,其特征在于,所述多路复用器阵列包括多级的多路复用器;所述d触发器阵列包括第一部分和第二部分;
其中所述第一部分,并行布置在所述多路复用器阵列中的相邻级之间的相同位置;所述第二部分,并行布置在所述多路复用器阵列中的不同位置。9.根据权利要求6所述的存储系统,其特征在于,在沿着从所述sram阵列的输出端到总线的每一个输出通路中,到达第一个d触发器的时序延迟小于预定的时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。10.根据权利要求6所述的存储系统,其特征在于,在沿着从sram阵列的输出端到总线的每一个输出通路中,任意两个最接近的d触发器之间的时序延迟小于所述时序延迟门限值且与所述时序延迟门限值之间的差值小于预定的差值门限值。11.一种系统级芯片,其特征在于,包括如权利要求6-10中任一项所述的存储系统或如权利要求1-5中任一项所述的sram阵列的数据选择装置。

技术总结
本发明实施方式提出SRAM阵列的数据选择装置、存储系统和系统级芯片。数据选择装置包括:多路复用器阵列,包含多个多路复用器;包含多个D触发器的D触发器阵列,布置在所述多路复用器阵列的内部;所述多路复用器阵列的输入端与SRAM阵列的输出端连接,所述多路复用器阵列的输出端与总线连接;所述多路复用器阵列,用于选择所述SRAM阵列中的存储数据的输出通路;布置在所述输出通路上的D触发器,用于截断所述输出通路的时序路径。节约了D触发器资源,还简化了硬件结构。简化了硬件结构。简化了硬件结构。


技术研发人员:吕永志 范志军 寿建能 杨作兴
受保护的技术使用者:深圳比特微电子科技有限公司
技术研发日:2023.09.01
技术公布日:2023/10/11
版权声明

本文仅代表作者观点,不代表航空之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

飞行汽车 https://www.autovtol.com/

分享:

扫一扫在手机阅读、分享本文

相关推荐