MRAM 在速度、耐久性、功耗这些方面具有不可替代的优越性。因此,MRAM 是实现存算一体的理想存储器之一。
随着物联网应用和诸如机器学习、计算机视觉、自然语言处理等人工智能应用的兴起,处理器需要更加频繁地对存储器进行访问与数据传输。传统的冯诺依曼计算机体系架构依赖总线进行存储器与处理器之间数据传输,在面对这类数据密集型应用时往往难以兼顾低延时与高能效。这一数据传输瓶颈现象常被描述为“内存墙”和“功耗墙”。存内计算技术通过更紧密地将处理器与存储器进行结合,有望克服这一性能瓶颈。
近年来,新型非易失性存储器(NVM)技术的出现,克服了基于早期存储器存内计算方案在易失性、集成度、成本效益等问题,极大地提升了存内计算处理的性能。磁性随机存储器(MRAM)作为新型NVM的一种,具有接近零的静态功耗,较高的读写速度,与互补金属氧化物半导体(CMOS)工艺相兼容等优点,在车用电子与穿戴设备等领域已实现商业化应用,被认为是最有希望的下一代存储器之一。STT-MRAM和SOT-MRAM已在各种PIM架构中得到利用,目前MRAM技术的发展趋向于在先进技术节点提供更高的写入速度和更低的功耗。
MRAM的历代发展
磁性随机存储器(MRAM)是一种基于自旋电子学的新型信息存储器件,其核心结构由一个磁性隧道结和一个访问晶体管构成。MTJ 呈现“三明治”结构,两层磁性固定层和自由层之间夹着一层隧穿层。这其中,铁磁层材料一般使用 CoFeB,隧穿层材料则为 MgO。固定层的磁化方向是不变的,而自由层的磁化方向可以被改变。当固定层和自由层磁化方向一致时,称为“平行状态”,MTJ 的隧道磁阻(Tunnel Magnetoresist-ance,TMR) 为低; 当磁化方向不一致时,称为“反平行状态”,TMR 为高。数据的写入通过切换自由层的磁化方向实现,读取则通过使电流通过结来测量磁阻大小实现。访问晶体管的栅极与字线相连,形成“1T1M”的结构来实现存储单元的选择。由于 MTJ 翻转电流的不对称性,晶体管的写入驱动电流也有不对称性。它具有极快的开关速度、近乎为零的泄露功耗、极高的可靠性等显著优点,是实现存算一体化技术的理想器件之一。
与大部分其它半导体存储器技术不同,MRAM中的数据以一种磁性状态(而不是电荷)存储,并且通过测量电阻来感应,不会干扰磁性状态。采用磁性状态存储有两个主要优点:(1)磁场极性不像电荷那样会随着时间而泄漏,因此即使在断电的情况下,也能保持信息;(2)在两种状态之间转换磁场极性时,不会发生电子和原子的实际移动,这样也就不会有所谓的失效机制。在MRAM中使用的磁阻结构非常类似于在硬盘中使用的读取方式。
MRAM结构图
在 1972 年,MRAM的基本概念首次被提出,其存储单元是利用各向异性磁阻的特性(AMR:Anisotropic Magneto- resistance)制作出的三层结构。受当时技术的限制,还不具备实用性价值,到了 1988 年,巨磁阻效应( GMR:GiantMagneto- resistance)的发现,MRAM 的实用性才得以实现。但由于 GMR 材料和 MOS 管串联的链路中,阻抗低,分压能力低,靠提高尺寸来增大写性能对面积的要求非常高,这导致 GMR 在实际应用中仍然存在困难。直到 1995 年,提出了隧穿磁阻效应(TMR:Tunneling Magneto- resistance),读写速度和集成度才得以提高,将MRAM推向了实用性。依据两种不同的写入方式可以将 MRAM 技术划分为两代。
第一代 MRAM 的写入方式是磁场写入式。它利用导体中流过的正反两个电流方向产生磁化感应,使得 STT 存储单元的 MTJ 自由层相对固定层磁化方向为同向和反向两个方向,从而表现出高低两种大小的阻抗状态用于存取数字逻辑“1”和“0”。由于这种写入方式需要足够强的磁场感应,因此需要足够大的写入电流,即需要利用高压来进行写,这导致了功耗的增大。同时随着工艺尺寸的缩减以及MTJ 结尺寸的降低,相邻 STT 存储单元的可靠性问题变得严重,通过增大间距减小相互干扰则会降低MRAM 的集成度。因此,可靠性和集成度之间是一对矛盾。
第二代 MRAM 的写入方式是自旋转移矩写入式。它是利用自旋转移矩(spin - transfer torque)效应诱导磁性材料发生磁化翻转,即利用流过隧道结中不同方向的自旋极化电流,驱动软磁体磁化方向的改变,实现 MTJ 结高低阻抗状态的写入。这种写入方式的存储器,称之为自旋转移矩磁随机存储器(STT-MRAM:Spin Transfer Torque MRAM)。与第一代 MRAM 依靠磁场写入的方式不同,这种方式是依靠自旋转移矩效应,它利用电流来完成磁性薄膜的磁化方向翻转,继而实现不同的阻抗状态。这种方式,最大的优势是降低了对写电压的要求,从而也降低了功耗,并且避免了磁场感应引起的串扰问题,有效提高了集成度。因此对磁存储器研究自然的过渡到了对自旋转移矩磁随机存储器的研究。
第三代MRAM的自旋道矩磁随机存储器(SOT-MRAM),电流通过底层重金属,产生自旋流并注入到自由层中,利用自旋轨道矩使自由层的磁化方向产生扰动,并结合多种方式让磁化方向产生确定性的翻转。相比于自旋转移矩的存储技术,基于自旋轨道矩的存储技术具有对称的读写能力、分离可优化的读写路径、亚纳秒的快速操作速度和低写入功耗等优点。
MRAM在存算一体上展现出的优势
到目前为止,多种存储器介质被研究用于构建存算一体系统,包括基于电荷存储原理的传统存储器和基于电阻存储原理的新型存储器。传统存储器主要包括 SRAM、DRAM和 Flash。其中 SRAM 和 DRAM 是易失性器件,频繁的刷新并不利于降低功耗。而 Flash 虽然是非易失性的,但是随着读写次数增加,浮栅氧化层会逐渐失效,反复读写可靠性很低。因此,各种基于电阻改变的新型存储器是实现存算一体的有效载体。
这其中主要包括相变存储器 ( Phase Change Memory,PCM )、电阻记忆存储器 ( Resistive Random Access Memory,RRAM)和磁性随机存储器 ( Magnetic Random Access Memory,MRAM) 。PCM 和 RRAM 基于原子层级重构来改变阻值,优点是有较大的阻值窗口,而缺点则是读写速度和读写可靠性要劣于MRAM。MRAM则是基于对电子“自旋”的控制,可以达到理论上的零静态功耗,同时具有高速和非易失性以及近乎无限的写入次数。MRAM 在速度、耐久性、功耗这些方面具有不可替代的优越性。因此,MRAM 是实现存算一体的理想存储器之一。
MRAM当前的应用及未来预估
随着自旋转移矩 MRAM (STT-MRAM) 的发明,MRAM 迈出了商业化的重要一步。
第一个商业化的磁随机存储器产品是飞思卡尔半导体公司(FreescaleSemiconductor)于2006 年生产 的4 Mb 容量Toggle-MRAM ,该部门是Everspin 的前身。之后Everspin 公司推出了具有SRAM 速度和 闪存结构的非易失的Toggle-MRAM ,其16 位32Mb并行MRAM 具有最高35 ns 的写入周期时间,工作温度范围为-40~125°C ,适用于工业和汽车应用。Everspin 在 2012 年就生产出了首个商业级的 64Mbit 的 STT-MRAM 存储器芯片并在2017年大批量生产了256Mb DDR3 STT-MRAM,并于2017年集成了40 nm CMOS,并在2019年批量生产了28 nm CMOS上的1Gb DDR4 STT-MRAM。
霍尼韦尔(Honeywell)和Cobham(前身为Aeroflex)等其他公司也推出了自己的MRAM 产品,它们同样使用Toggle-MRAM 单元和SRAM 结构。其中霍尼韦尔采用特殊抗辐照的150 nm 绝缘体上硅(silicon oninsulator,SOI)CMOS 技术,使其MRAM 产品在卫星和其他航天应用中具有很高的可靠性和辐射抗性。
东芝公司在 2014 年的美国檀香山开幕的国际会议上“2014 Symposia on VLSI Technology and Circuits(以下称 VLSI Symposia)”用 STT-MRAM 代替 SRAM,使得微处理器中的高速缓存功耗降低了近 60%。日本超低压元器件技术研究联盟(LEAP)在 VLSI Symposia 上同样实现了用 STT-MRAM 对传统 SRAM的替换。传统的 STT-MRAM 单纯采用蚀刻技术来制造,但这种技术会由于 MTJ尺寸的偏差导致性能偏差。因此,为解决 MTJ 制造工艺中的尺寸偏差问题,LEAP研究出了全新的蚀刻技术,显著降低了 MTJ 制造过程中尺寸不均匀的问题。
高通正在加速研究 STT-MRAM 技术。2015 年项目研究员 Seung H. Kang 发布了一款 8Mbit 混合 STT-MRAM 的SOC 芯片 。在没有软错误的情况下,工作频率可以达到 500MHZ。在 40nm 工艺下,适用于混合STT-MRAM 的 SOC,若工艺尺寸可以降到 28nm,那么其性能可以与SRAM 相媲美。
2017-2020年的MRAM的公开芯片情况
在过去几年里,包括台积电、英特尔、三星、SK海力士等晶圆代工厂和IDM,相继大力投入MRAM 研发。
此外不少创新公司,如 Everspin,Avalanche, Crocus, Spin Transfer Technology 也已能够提供 MRAM 样品。整体上,STT-MRAM 已经在 2×nm 节点的嵌入式存储市场准备就绪。
华为与 SNIA(全球网络存储工业协会)在2015 年共同举办的存储技术峰会上,Albert Fert(2007 年诺贝尔物理学奖获得者)表示:在存储技术底层是依靠核心技术和理论突破存储瓶颈。自旋转移矩技术取得了重大突破,基于 DMI 效应的方式使得 STT-MRAM 存储单元可以缩放到几纳米,显著的提高了磁存储器的集成度和性能。
特邀作者: 刘家伦北京航空航天大学 集成电路科学与工程学院