你真的懂3D NAND闪存?|半导体行业观察
来源:内容由 微信公众号 半导体行业观察 (ID:icbank) 综合自「非凡创芯力」,谢谢。
从新闻到市场分析报告,我们看到很多关于 3D NAND 的报道,国内这几年投资兴建许多12吋半导体工厂,其中大多是晶圆代工或 DRAM 厂,排除外资所投资的半导体厂,长江存储 (YMTC) 的武汉新芯 (XMC) 是目前唯一即将量产 3D NAND 的国内厂家。武汉新芯已研发出 32 层 3D NAND 芯片,预计年底量产,不过据消息指出,截至九月底武汉新芯已有约 2,000 片产能。
本篇文章将带大家初步了解 3D NAND 是什么、为何发展 3D NAND 技术、3D NAND 有哪些技术发展,以及,它所带来的影响。
NOR Flash及NAND Flash
在开始之前,我们先来科普一下ㄧ些 Flash Memory 的基本知识。在半导体存储器领域,NAND 是 NAND Flash Memory 的简称,Flash Memory 在国内翻译为快闪存储器,简称闪存,是ㄧ种非易失性存储器 (Non-Volatile Memory,NVM),也就是说当电源关掉,它所存储的数据不会消失。与之对应,大家常听到的 DRAM、SRAM 则是易失性存储器 (Volatile Memory, VM),电源关掉,所存储的数据会消失。
闪存依存储单元 (Memory Cell) 结构的不同区分为 NOR Flash及 NAND Flash 二种,对于这二种闪存的差异,技术细节我们不在此细说,读者只需知道:(请参考下表)
NOR Flash: 有较快的读取速度,但写入及擦除则较慢,其容量也远小于 NAND Flash,但 NOR Flash 可存取至任何选定的字节。ㄧ般 IC 内之嵌入式闪存 (Embedded Flash) 均为 NOR Flash,主要用于存储行动装置及计算机内之启动、应用程序、操作系统和就地执行 (eXecute-in-Place,XIP) 的代码。NOR Flash 存储单元大小比 NAND Flash大很多,也由于存储单元的结构,NOR Flash 在本质上比 NAND Flash可靠。
NAND Flash: 读取速度稍慢,但写入及擦除则相对较 NOR Flash 快很多,IC 容量可达 128GB 以上,但它无法存取至特定的字节,而是以小块 (Page) 方式处理数据。NAND Flash 通常被用来作为大量数据存储器,现在市面上 GB (Gigabyte) 级的 U 盘 (USB Flash Drive) 及 SSD 固态硬盘 (Solid State Drive/Disk) 均使用 NAND Flash。
图片来源 : Created by Author
闪存缩放限制
(Flash Memory Scaling Limit)
小存储单元尺寸 (Cell Size)、高性能 (Performance) 以及低功耗 (Power Consumption) 一直是存储器业者持续追求的目标。越来越小的尺寸让每片晶圆可以生产更多的 die,高性能才能符合高速运算的需求,低耗电才能改善行动装置电池充电频率及数据中心系统散热的问题。而芯片工艺的每一次提升 (24nm → 14nm → 10nm…) ,带来的不仅仅是元件尺寸的缩小,同时也带来性能的增强和功耗的降低。
有个词称为 ”闪存的缩放限制” (Flash Memory Scaling Limit),指出无论芯片上的元件能缩小多少,闪存都无法跟上步伐。这个限制过去十多年ㄧ直都没实现,然而,14nm 以下,半导体工艺迁移到 Fin-FET (Fin Field-Effect Transistor,鳍式场效应晶体管) 结构,一种新的晶体管,让这个 ”闪存缩放限制” 问题正式浮出水面,因为这技术无法直接套用在既有的闪存元件上。嵌入式 NOR Flash 在这方面目前似乎无解,幸好过去几年,ㄧ些新的存储器元件技术已被开发出来,嵌入式 NOR Flash 被取代应该只是时间早晚的问题,相反的,NAND Flash 业者却早已找到ㄧ些因应之道。
为了打破 ”闪存的缩放限制” 枷锁,确保能持续提供高容量、低成本的 NAND Flash,相关业者多年前就开始研发解决之道。主要的方向有:
3D NAND Flash : 把存储单元立体化
多层单元 (Multi-Level Cell) : 让每个存储单元不只存储ㄧ个 bit
硅穿孔技术 (TSV,Through Silicon Via) : 让多颗闪存晶粒可以直接堆叠封装
很多文章将第ㄧ项及第三项混淆在ㄧ起,下面我们将ㄧㄧ介绍,协助大家了解。
3D NAND Flash
那到底什么是 3D NAND ? 它指的是 NAND 闪存的存储单元是 3D 的。我们之前使用的闪存多属于平面闪存 (Planar NAND),而 3D NAND,顾名思义,就是它是立体的。Intel 用高楼大厦为例演释 3D NAND,如果平面闪存是平房,那 3D NAND 就是高楼大厦。把存储单元立体化,这意味着每个存储单元的单位面积可以大幅下降。下图为 Samsung Planar NAND 发展至 3D NAND (V-NAND) 的示意图。
图片来源 : Samsung V-NAND technology White Paper (Modi
左边二个是 Planar NAND,只是存储单元结构不同,由浮动栅结构 (Floating Gate) 迁移至电荷撷取闪存,亦即上图之 2D CTF (Charge Trap Flash)。然后是将 2D CTF 存储单元 3D 化变成 3D CTF 存储单元 (上图之 3D CTF),最后通过工艺技术提升逐渐往上增加存储单元的 Layer 数,把存储单元像盖大楼ㄧ样越做越多层。Samsung 的 3D V-NAND 存储单元的层次 (Layer) 由 2009 年的 2-layer 逐渐提升至 24-layer、64-layer,再到今年 (2018) 之 96-layer。
图片来源 : Samsung V-NAND technology White Paper (Modi
近几年来许多大厂纷纷投入 3D NAND 的研发,但目前只有 Samsung、Toshiba/SanDisk/WD、SK Hynix、Micron/Intel 四组公司能够量产。各家的 3D NAND 存储单元及技术都不相同,也几乎每家公司都已宣布开发出 96 层 3D NAND,但目前量产的大多为 64 到 72 层的 3D NAND。
3D NAND 闪存工艺复杂,难度极高,因此厂商并非以最先进的工艺来研发生产 3D NAND。目前最先进的逻辑芯片工艺已来到 7nm,许多大厂目前量产的是 14nm,Planar NAND 也多使用 14nm 工艺生产,而 3D NAND 则大多使用 20nm 以上的工艺。下图是 Tech Insights 2018 最新整理的 NAND Flash Roadmap,包含 2D (Planar) NAND 及 3D NAND,注意到没,前面提到即将量产的长江存储 (武汉新芯) 已被纳入图表中,成为第五家有能力生产 3D NAND 的厂家。
图片来源 : Tech Insights NAND Flash Memory Technology/
多层单元
(Multi-Level Cell)
一般正常的存储单元,不管是 DRAM、SRAM、FLASH、ROM 等等,都只存储ㄧ个比特 (Bit) 的资料 (称为 SLC,Single-Level Cell)。为能更缩小存储单元尺寸,除了运用工艺持续做小及将存储单元 3D 化外,各厂商也将脑筋动到增加每存储单元能存储的 bit 数目上。简单的算数,当ㄧ个存储单元可以存储二个 bit 时 (称为 MLC,Multi-Level Cell),其存储单元尺寸等同于减少ㄧ半 ; 存储三个 bit (称为 TLC,Triple-Level Cell),则尺寸等同于原有的 1/3 ; 四个 bit (称为 QLC,Quad-Level Cell),则存储单元尺寸只剩原有的 1/4。(注: 也许当年在定义 2-Level Cell 时没想之后还会有 TLC 及 QLC,因此以 MLC 代表 2-Level Cell)。
SLC 存储ㄧ个 bit 数据,也就是二个状态 (0,1) ; MLC 存储二个 bit 数据,所以是四个状态 (00,01,10,11) ; TLC 三个 bit,八个状态 (000,001,010,011,100,101,110,111) ; QLC 四个 bit,十六个状态 (0000,0001,…. 1111),如下图所示。
图片来源 : Micron Official Website (Modified by Author
当然天下没有白吃的午餐,鱼与熊掌不可兼得,存储单元尺寸降低的代价是设计难度的提高以及性能的降低。为什么会如此?又是ㄧ个简单的算数问题。假设存储单元电压是 1.8V,对 SLC 而言,ㄧ个 bit 有二个状态,平均分配 1.8V 电压,每个状态可以分到 0.9V。对 MLC 而言,四个状态平均分配电压,每个状态可以分到 0.45V,以此类推,TLC 每个状态只可以分到 0.225V,而 QLC 更惨,每个状态只可以分到 0.1125V。在这么小的电压下,这么多的状态以极小的电压区隔,电压区隔越小越难控制,干扰也越复杂,而这些问题都会影响 TLC 或 QLC 闪存的性能、可靠性及稳定性,因而可以想见设计的难度有多高了。
另外如同上图所示,越往右,存储单元相对尺寸越小,因而成本越低。但其编程/擦除周期 (Program/Erase Cycle,简称 P/E Cycle,也有人称为擦写次数) 会大幅降低,同时读、写及擦除所需的时间也会增加 (性能降低)。擦写次数的降低为这项技术带来相当大的争议,因为擦写次数代表这闪存的寿命长短。如同上图所示,从 SLC 到 QLC,擦写次数由 10 万次降到只有ㄧ千次,吓坏ㄧ大堆人。
厂商当然也知道,他们用系统设计来弥补这项缺点。系统会控制平均分摊每一个区块的擦写次数,故障的区块也会被尚未使用的区块替换,以确保了闪存能持续运行。因为如此,即使每个存储单元只有ㄧ千次擦写次数,整颗闪存仍然可以从容的应付我们日常使用的需求。当然,这样的结果使得 TLC 或 QLC 只适用于消费者个人使用 (例如 SSD),它是无法满足 Data Center 之类的企业需求的,因为商用,例如资料处理中心 (Data Processing Center),的存储设备,其插写频率是相当相当高的。
硅穿孔技术
(TSV,Through Silicon Via)
硅穿孔技术其实与 3D NAND 工艺无关,严格来说,它属于ㄧ种封装技术。会拿出来讲主要是ㄧ方面它可让 3D NAND 闪存更上层楼,容量加大好几倍。另ㄧ个原因是因为有些人把它跟 3D NAND 存储单元的 layer 层数混淆了,他们把 32、64 或 96-layer 3D NAND 描述为把 32、64 或 96 个晶粒 (Die) 堆叠在ㄧ起,这是很大的误解。
TSV 技术已普遍用于 DRAM及 Flash 产品。以往ㄧ个 IC 芯片 (Chip) 只封装ㄧ颗晶粒,渐渐地为了降低成本、节省主机板空间及提高性能,多芯片封装 (MCP,Multi-Chip Package) 开始盛行 (如下图左方图示)。TSV 则是以工艺方式将 IC 基板 (Substrate) 穿孔,填入金属,让上下晶粒直接相导通 (如下图右方图示),不仅省去像左方图示所显示封装打线 (Bonding),更能进ㄧ步提升 DRAM 或 Flash 单颗芯片的容量、讯号品质、传输性能,以及降低传导杂讯干扰。
图片来源 : 3D NAND Flash Memory - Toshiba (Modified by
目前各家量产的 3D NAND 芯片大多只以 TSV 堆叠到 8 或 16 层 3D NAND 晶粒 (Die)。下表范例为 Toshiba 的 512GB (Gigabyte)/1TB (Terabyte) 闪存产品介绍,你可以清楚看到它使用 48-layer 的 3D NAND 存储工艺制造出容量为 512 Gb (Gigabit) 的闪存晶粒,再以 TSV 技术分别堆叠 8 或 16 个 die (在下表中是以 Number of Stacks 来表示堆叠数目) 来做出 512 GB (512Gb x 8) 或 1TB (512Gb x 16) 的闪存芯片。(注 : 小写的 b 代表 bit (比特),大写 B 代表 byte (字节),ㄧ个 byte 等于 8 个 bits)。
图片来源 : AnandTech Post : Toshiba Weds 3D NAND and T
所以,ㄧ个 NAND 闪存的晶粒 (die),运用 3D NAND 技术,可以把多达 96-layer 的存储单元堆叠在一起,像盖摩天大楼ㄧ样。而为了增加每个封装芯片 (Chip) 的容量,厂商再把8个或16个晶粒 (die) 以TSV 的技术叠在ㄧ起去封装成芯片。这样应该清楚了吧!
结语
半导体工艺来到 14nm 以下,Fin-FET 技术让 NAND 及 NOR 闪存的发展碰到瓶颈。半导体大厂运用三项技术,亦即 3D NAND 存储单元技术、多层单元 (MLC/TLC/QLC) 技术,以及,硅穿孔 (TSV) 技术,让 NAND 闪存得以持续发展,许多大厂都已开发出 96 层 TLC 甚至是 QLC 的 3D NAND 闪存。
NAND 闪存芯片的容量在这几年快速提升,因而使得 NAND 闪存芯片成为行动装置及计算机内之大量数据存储器芯片。SSD 固态硬盘的容量已可做到 1TB (Terabyte) 等级,逼近 HDD 传统硬盘 (Hard Disk Drive)。虽然在未来几年 HDD 仍然有些许价格上的优势 (SSD 每 GB 的单价约为 $0.2~$0.3,是 HDD 的10 倍),但由于 SSD 不像 HDD 有机械动作,速度、噪音及耗电也都比 HDD 好,已普遍受到ㄧ般消费者的欢迎,然而由于低擦写次数等限制,使得 3D NAND SSD 无法取代 HDD 在商用市场上的地位。
许多新型态的非易失性存储器已研发出来 (我们将另文介绍),未来或许能取代现有的 DRAM/SRAM/Flash 存储器。在此之前,3D NAND 闪存应该仍可保有它的市场地位ㄧ段时间。
最后,附带ㄧ提,这个月初 (2018 年 8 月),长江存储发表其称之为 Xtacking 的突破性技术。它将为其 3D NAND 闪存带来前所未有的 I/O 高性能、高存储密度,以及更短的产品上市周期。依据其新闻稿,Xtacking 技术只需一个处理步骤就可通过数百万根金属 VIA (Vertical Interconnect Accesses,垂直互联通道) 将二片晶圆键合接通电路 (注意是二片晶圆而非二颗晶粒),其中一片晶圆是负责数据 I/O 及存储单元操作的外围电路,另一片晶圆则是 3D NAND 存储单元。这样的方式有利于 I/O 及控制电路以及 3D NAND Flash 各自选择其最合适的先进逻辑工艺,这 Xtacking 技术可以让其 NAND I/O 速度得以提升到 3.0Gbps (目前世界上最快的 3D NAND I/O 速度的目标值是 1.4Gbps), 与 DRAM DDR4 的 I/O 速度相当,这即将量产的国产 3D NAND 闪存值得期待。
长江存储128层TLC闪存拆解:存储密度高达848Gbmm²,远超三星等
去年4月,国产存储芯片厂商长江存储(YMTC)宣布其128层3D NAND 闪存研发成功。包括拥有业界最高单位面积存储密度,最高I/O传输速度和最高单颗NAND 闪存芯片容量的1.33Tb 128层QLC 3D NAND闪存,以及512Gb 128层TLC闪存。
近日,国外权威研究机构Tech Insights对长江存储的128层TLC 3D闪存进行了芯片级的拆解,发现其存储密度达到了目前业界最高的8.48 Gb/mm²,远高于三星、美光、SK海力士等一线NAND芯片大厂。
据介绍,Tech Insights拆解的是Asgard(阿斯加特)的PCIe4.0 NVMe1.4 AN4 1TB SSD,其内部采用的正是长江存储的128层TLC 3D NAND 闪存芯片,这也意味着长江存储128层TLC 3D NAND 闪存芯片已量产。该SSD硬盘的PCB上总共四颗256GB NAND闪存,单个封装内是4颗芯片,也就是说单颗芯片容量为512Gb。该NAND闪存的型号为YMN09TC1B1HC6C(日期代码:2021 9W)。
△长江存储512 Gb 128层3D TLC NAND 芯片的外观,型号为YMN09TC1B1HC6C
根据长江存储此前公布的数据显示,在传统3D NAND架构中,外围电路约占芯片面积的20~30%,这也使得芯片的存储密度大幅降低。而随着3D NAND技术堆叠到128层甚至更高,外围电路所占据的芯片面积或将达到50%以上。而Xtacking技术则是将外围电路置于存储单元之上,从而实现比传统3D NAND更高的存储密度。
所以,长江存储512Gb 128层Xtacking 2.0 TLC芯片同样也是采用了两个晶圆来集成3D NAND,因此拆解后可以找到两个die,一个用于NAND阵列的die,另一个用于CMOS外围电路的die。
△长江存储512 Gb 128层Xtacking 2.0 3D TLC NAND die标记 ( CDT1B)
△长江存储512 Gb 128层Xtacking 2.0 3D TLC NAND芯片COMS外围的die标记(CDT1A 或 CDT1B)
作为对比,上一代的64层 Xtacking 1.0架构的TLC NAND die标记为(Y01-08 BCT1B) 和 CMOS外围电路die 标记为(Y01A08 BCT1B)。
根据Tech Insights的实测,长江存储512Gb 128层Xtacking 2.0 TLC的die尺寸为60.42mm²,这也意味着其单位密度增加到了8.48 Gb/mm2, 比 256Gb 64层的Xtacking 1.0 die 高出了92% 。读取速度达到了7500 MB/s,写入速度也高达5500 MB/s。
△长江存储512Gb 128层Xtacking 2.0 TLC NAND的die平面图
CMOS外围电路die则集成了页缓冲器、列解码器、电荷泵、全局数据通路和电压发生器/选择器。
△长江存储512Gb 128层Xtacking 2.0 TLC NAND芯片的CMOS外围电路die平面图
Tech Insights称,长江存储128层Xtacking 2.0单元体系结构由两个通过层接口缓冲层连接的层组成,这与KIOXIA 112L BiCS 3D NAND结构的过程相同。单元大小、CSL间距和9孔VC布局与以前的64L Xtacking 1.0单元保持相同的设计和尺寸(水平/垂直方向间距)。门的总数为141(141T),包括用于TLC操作的选择器等。
△垂直方向的长江存储3D NAND单元结构,以及注释为32L(T-CAT带39T)、64L(Xtacking 1.0带73T)和128L(Xtacking 2.0带141T)的门的总数。
Tech Insights表示,长江存储128层Xtacking 2.0上层有72个钨闸门,下层有69个闸门。包括BEOL Al、NAND die和外围逻辑管芯在内的金属层总数为10,这意味着与64L Xtacking 1.0工艺集成相比,外围逻辑管芯中增加了两个铜金属层。通道VC孔高度增加一倍,为8.49µm。
△长江存储三代3D NAND的比较:Gen1(32L)、Gen2(64L,Xtacking 1.0)和Gen3(128L,Xtacking 2.0)。
与三星 (V-NAND)、美光 (CTF CuA) 和 SK海力士(4D PUC) 的现有128层512 Gb 3D TLC NAND 芯片的die尺寸相比,长江存储512Gb 128层Xtacking 2.0 TLC NAND芯片的die尺寸更小,单位密度最高。
长江存储128层TLC NAND die平面布置图和两层阵列结构与美光和SK海力士相同,但长江存储的每个字符串的选择器和虚拟WL数为13,小于美光和SK 海力士(两者均为147T)。由于长江存储所采用的Xtacking混合键合方法,使得其使用的金属层数量远高于其他产品。
△128层512 Gb 3D TLC NAND产品的比较,包括刚刚发布的YMTC 128L Xtacking 2.0 3D NAND。
从上面的对比数据来看,长江存储512Gb 128层Xtacking 2.0 TLC NAND芯片的单位存储密度达到了8.48b/mm²,远高于三星的6.91Gb/mm²、美光的7.76Gb/mm2、SK海力士的8.13Gb/mm²,达到了目前业界最高单位存储密度。
目前长江存储Xtacking 2.0架构的512Gb 128层TLC NAND芯片已量产。虽然三星、SK海力士、美光等厂商也在致力于开发176层3D NAND闪存芯片,但是他们目前最先进的量产产品还是128层。
作为一家成立仅数年的国产NAND Flash闪存芯片厂商,长江存储在国外巨头已领跑数十年的存储技术领域,能够在如此短的时间内追赶上来,并且取得技术上的领先,实属不易。
编辑:芯智讯-浪客剑 资料来源:Tech Insights
相关问答
威刚s11 pro 用什么颗粒?威刚S11+Pro使用的是ADATA自主研发的3DNAND闪存颗粒。这种颗粒具有高稳定性、高耐写性和快速读写速度等特点,能够满足用户对于数据存储的需求。同时,...
pciegen4传输速度?作为大华存储推出的新一代NVMeSSD旗舰产品,大华C970PRO系列采用国产英韧高性能的PCIeGen4.0控制器IG5236,搭配原厂优质DDR4缓存和3DNANDFlash闪存芯片,...
美光打算何时量产基于RG新架构的128层 3D NAND闪存 ?美光在二季度财报电话会议上透露,该公司即将开始基于全新RG架构的第四代3DNAND存储器的量产工作。按照计划,美光将于2020Q3采集开始生产,并于Q4像...
华为mate 30 pro 5g 闪存 规格?华为Mate30Pro5G采用一块容量为128GB的固态硬盘,支持最高1TB的存储容量。闪存规格方面,它采用了基于3DNAND闪存的解决方案,能够带来更快速的数据...
闪迪2TB版Extreme Pro NVMe 3D SSD有怎样的特点?西部数据(WD)旗下的闪迪(SanDisk)存储产品线,刚刚迎来了ExtremeProNVMe3DSSD更新。从市场认知度来看,消费者对SanDisk品牌还是很买账的。所以西数......
华为的麒麟处理器为什么不外售?1.华为海思麒麟芯片成本高,售价贵,别的手机企业用不起。连华为自己的手机都只有高端机再用海思麒麟芯片,低端机还得用进口芯片。2.华为麒麟芯...写到这里就能...
慧荣的PCIe 4.0 x4固态硬盘主控,将于何时到来?未来几个月,我们有望见到一系列支持PCIe4.0标准的产品,比如慧荣(SiliconMotion)的新款SSD主控。【慧荣PCIe4.0SSD主控有望在几个季度后到来,题......
nand闪存 是什么颗粒?NandFlash闪存颗粒中根据存储密度的差异可分为SLC、MLC、TLC和QLC四种,按照存储方式划分,NAND闪存已经发展了四代:第一代SLC(Single-LevelCell)每单元可.....
铠侠与西部数据的UFS 3.1存储器新品有怎样的特点?距离JEDEC正式发布UFS3.1规范还不到一个月,铠侠(Kioxia)和西部数据(WD)就已经推出了首款适用于智能手机的UFS3.1兼容存储器。前者将很快把相关样品...
Greenliant新推出的工业级ArmourDrive M.2 SSD有何特点?周三的时候,Greenliant宣布已开始出货工业级ArmourDriveM.2SSD新品。其具有增强的耐用性,标称工作温度范围也较商用SKU要宽泛得多。除了NVMe,还可选...