时间:2024-07-28
黄阳棋
(中国电子信息产业发展研究院,北京 100048)
为满足对海量信息的高速处理需求,同时兼顾系统功耗和成本,当前信息系统中所使用的存储器已经发展出了一套由不同特性存储器组成的多级存储架构。一般而言,这一存储架构由靠近计算端的内核存储器、承上启下的主存储器,以及靠近数据端的外部存储器组成。
多级存储器中每一级存储器在容量、速度、价格、功耗这4个方面均有不同的取舍[1]。
内核存储器,又称为缓存(Cache),主要使用嵌入式存储,属于中央处理器(CPU)结构中的一部分,速度在三级存储中最快但容量最小,且造价高昂、功耗也较高,只能用于存放计算过程中的临时数据。主存储器主要使用动态随机存储器(Dynamic Random Access Memory,DRAM),速度只有缓存的1/4,但容量是缓存的1 000倍,造价和功耗也相对内核存储更低,主要用于存储运行中的程序及数据。外部存储器早期使用机械硬盘(Hard Disk Drive,HDD),近年来采用与非型闪存(NAND Flash)组成的固态硬盘(Solid State Disk,SSD)正在成为主流,其速度只有DRAM内存的几百分之一,但容量是内存的1 000倍以上,造价低廉,且具备非易失的低功耗特性,用于长期存储海量信息。
由于内核存储器、主存储器、外部存储器之间均存在较大的读写速度差距,形成了制约整个系统性能的“存储墙”[2](见图1)。而随着处理器速度和核数的持续增长,存储墙对系统性能的限制愈发明显。同时,物联网、智能传感器、人工智能等特定应用的发展也对极低功耗的高性能存储器提出了新的产业化需求。新型存储器采用与现有DRAM和NAND Flash等成熟存储器截然不同的存储原理,能够满足未来更加多样化的存储需求[3]。同时,经过数十年的科学探索,新型存储器已经初步具备了产业化的研究基础,台积电、三星、英特尔等越来越多的产业巨头开始将其推向产业化应用。
目前,新型存储领域较为成熟的技术路线主要有相变存储器(PCM)、磁变存储器(MRAM)以及阻变存储器(RRAM)3种。PCM通过相变材料相态的变化获得不同的电阻值,主要用于独立式存储;MRAM通过磁性材料中磁筹的方向变化改变电阻,主要用于嵌入式存储;RRAM则利用阻变材料中导电通道的产生或关闭实现电阻变化,目前主要用于物理不可克隆芯片(Physical Unclonable Function,PUF),也被看好用于人工智能硬件。
2.1.1 新型存储器未来应用的机遇
在独立式存储应用领域,存储级内存(Storage Class Memory,SCM)将会是新型存储应用的重要领域[4]。2017年,英特尔推出了基于PCM的SCM应用存储器傲腾(Optane),在内存与外部存储之间提供了一个容量、速度均介于二者的非易失SCM,能够显著提升整体的数据传输性能。
在嵌入式存储应用领域,新型存储将在多种智能仪表、传感器、可穿戴设备中获得应用,逐步取代嵌入式Flash、DRAM和SRAM。三星和台积电均在嵌入式存储领域推出了MRAM的代工业务。
在未来可能的新存储架构领域,面向人工智能等应用的新计算架构的出现将为新型存储的应用提供机遇。例如,RRAM凭借类似神经突触的可塑特性,将可能应用于存算一体、类脑等领域。
2.1.2 新型存储产业化发展的挑战
新型存储的制造工艺还需要进一步完善,当前产品成本过高。当前新型存储的制造工艺还没有解决不同存储单元之间的一致性问题,良率不高,单位容量成本很高,存储密度优势不显著。在嵌入式存储领域,MRAM的单位容量成本是当前方案NOR Flash的10倍以上,在存储密度上仅有微弱优势;在独立式存储领域,作为外部存储的PCM的单位容量成本是NAND Flash的10倍以上,存储密度仅为NAND Flash的1/5。
新型存储需要开发新的软硬件配套。当前的成熟计算架构是基于DRAM和NAND Flash为基础构建,硬件电路和软件驱动均是根据传统存储的特点设计。新型存储在物理特性上迥异于传统存储,需要开发新的辅助芯片和对应的软件程序才能发挥性能。以使用基于PCM的英特尔傲腾SCM的百度Feed-Cube数据库为例,两家公司针对系统硬件、操作系统、内核等组建都进行了相应优化,包括选择支持傲腾的处理器、加入支持傲腾的BIOS驱动、增添Linux内核的相关补丁等一系列配套优化[5]。这些额外的投入都增加了用户使用新型存储器的成本。
PCM目前产业化进展最快,主要用于独立式存储领域。英特尔和美光联合研发的3D Xpoint存储器是目前唯一大规模商用的PCM产品。英特尔为推广这一产品将其加入了相应CPU的支持,同时还提供了配套的各类驱动程序,使得其数据访问速度得到显著提升,目前已应用于百度信息流服务数据中心[5]。
技术方面,英特尔与美光优势显著,IBM与三星也有一定技术积累。英特尔与美光联合研发了PCM相关技术,并于2015年率先量产了具有商业化价值的128 Gb 3D Xpoint芯片,这也是目前唯一商用的PCM产品。IBM从2006年开始研发PCM,技术路线与英特尔、美光不同,拥有完整的专利布局。三星目前仅实现了小容量PCM样片,技术路线与英特尔、美光相同,处于跟随状态。
产业方面,英特尔已经在SCM领域形成封闭生态,未来在通用领域将面临美光的竞争。英特尔的3D Xpoint存储器2020年销售收入约5.5亿美元,主要用于SCM领域。但由于SCM是英特尔自身定义的一种存储架构,需要相应的CPU、芯片组、配套驱动和软件支持,其他企业难以进入这一封闭生态。2019年,美光结束与英特尔在PCM领域的合作,独立发展出了基于PCM的SSD产品X100。未来英特尔仍将主导SCM应用的PCM市场,但在SSD等通用市场会面临美光的竞争。
MRAM已经进入产业化阶段,主要用于嵌入式存储。三星的嵌入式MRAM已经大规模应用于华为GT 2智能手表的卫星定位模块中,能够有效地降低功耗,延长待机时间。MRAM也有少量独立式存储应用,主要利用其抗辐射性能,用于航空航天等特殊市场,如空客A350飞机使用MRAM作为机上存储器。
技术方面,美国Everspin公司和格罗方德公司在独立式存储上遥遥领先,三星和台积电将发力嵌入式存储。美国Everspin公司与格罗方德公司合作,是目前独立式MRAM技术的领头羊,已经量产了三代MRAM产品,包括全球容量最大的1 Gb第三代自旋转移矩磁变存储器(STT-MRAM)。三星和台积电已经开始将MRAM应用于嵌入式存储中,如三星在2019年为索尼代工的卫星定位模块中使用MRAM技术,已随华为GT 2手表出货超过100万套。台积电在2020年集成电路设计领域最高级别的国际会议ISSCC上发布了32 Mb嵌入式STT-MRAM。此外,专利方面,日本东芝位列全球MRAM专利第一,专利总数几乎是第二名三星的两倍,高通、索尼、IBM等企业也拥有大量MRAM专利。
产业方面,独立式MRAM市场较小,三星、台积电等企业将大力推动嵌入式市场。一方面,Everspin公司的产品是目前唯一实现商业化应用的独立式MRAM,2019年市场销售总额约为0.4亿美元,应用于航空航天、计算加速卡等特定市场,市场容量小,国际龙头不愿意在这样的小市场中投入研发。另一方面,MRAM在嵌入式领域具有显著的功耗优势,最多能够降低系统超过90%的功耗。三星、台积电等龙头代工企业纷纷在该领域布局,三星已经实现了最早的商业化应用。随着系统集成度要求的提高,MRAM的嵌入式系统将会应用在更加广泛的领域。
RRAM目前尚无大规模商用。由于RRAM的读写方式与人工神经网络中的计算节点读写方式类似,在实验室中被大量研究用于人工智能相关应用,尤其是作为存算一体计算架构中的存储单元[6]。相关企业主要包括以色列的Weebit Nano和美国的CrossBar。2021年,CrossBar已经将RRAM应用于PUF、多次可编程芯片(Multi-Time-Programmable,MTP)、少次可编程芯片(Few-Time Programmable,FTP)和一次性可编程芯片(One-Time-Programmable,OTP)中。Weebit Nano在2022年2月完成了独立式RRAM芯片的原型验证,未来将可能推出相关芯片产品替代NOR Flash,或应用于存算一体和人工智能领域。
PCM将向更高层数的三维集成发展。目前,唯一商用的PCM产品英特尔傲腾存储器第一代仅仅实现了二层三维集成,2020年发布的第二代也仅仅做到了四层堆叠。PCM在随机读写速度和寿命方面相比于NAND Flash都有数量级上的优势,三维集成层数是制约其容量快速发展的主要瓶颈。英特尔已经在着手研发相关三维制造技术。
MRAM将更加广泛地运用于嵌入式系统中。目前独立式的MRAM由于容量难以进一步增长,成本较高,市场应用空间有限。未来MRAM将主要针对嵌入式市场,逐步替代现有的嵌入式闪存技术,将成为嵌入式系统中的主流存储器。
RRAM将与神经网络计算深度结合发展全新的计算架构。RRAM在传统存储领域优势并不明显,新的存储架构将会是RRAM的发展机会。例如,将RRAM作为神经网络中突触节点的权重存储单元,或是应用于存算一体架构,从而大幅度提升神经网络芯片的性能并降低功耗。
本文主要讨论了相变存储、磁变存储和阻变存储等新型存储器的应用特点、机遇与挑战、产业发展现状、未来产业发展趋势等方面内容。希望本文能有助于进一步推动产业界对新型存储器的认识,并为未来的技术变革作好相应的准备。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!