「收藏」Flash闪存颗粒和工艺知识深度解析
[收藏] Flash闪存颗粒和工艺知识深度解析
原创: Hardy 架构师技术联盟 5天前
Wafer即晶圆,是半导体组件“晶片”或“芯片”的基材,从沙子里面高温拉伸生长出来的高纯度硅晶体柱(Crystal Ingot)上切下来的圆形薄片称为“晶圆”。采用精密“光罩”通过感光制程得到所需的“光阻”,再对硅材进行精密的蚀刻凹槽,继续以金属真空蒸着制程,于是在各自独立的“晶粒”(Die)上完成其各种微型组件及微细线路。对晶圆背面则还需另行蒸着上黄金层,以做为晶粒固着(Die Attach) 于脚架上的用途。
以上流程称为Wafer Fabrication。早期在小集成电路时代,每一个6吋的晶圆上制作数以千计的晶粒,现在次微米线宽的大型VLSI,每一个8吋的晶圆上也只能完成一两百个大型芯片。我们NAND Flash的Wafer,目前主要采用8寸和12寸晶圆,一片晶圆上也只能做出一两百颗NAND Flash芯片来。
NAND Flash Wafer
Wafer的制造虽动辄投资数百亿,但却是所有电子工业的基础。晶圆的原始材料是硅,而地壳表面有用之不竭的二氧化硅。二氧化硅矿石经由电弧炉提炼,盐酸氯化,并经蒸馏后,制成了高纯度的多晶硅,其纯度高达99.99%以上。晶圆制造厂再将此多晶硅融解,再在融液里种入籽晶,然后将其慢慢拉出,以形成圆柱状的单晶硅晶棒,由于硅晶棒是由一颗晶面取向确定的籽晶在熔融态的硅原料中逐渐生成,此过程称为“长晶”。硅晶棒再经过切段,滚磨,切片,倒角,抛光,激光刻,封装后,即成为集成电路工厂的基本原料——硅晶圆片,这就是“晶圆”。
下图是NAND Flash生产简要流程:
Die 就是芯片未封装前的晶粒,是从硅晶圆(Wafer)上用激光切割而成的小片(Die)。每一个Die就是一个独立的功能芯片,它无数个晶体管电路组成,但最终将被作为一个单位而被封装起来成为我们常见的闪存颗粒,CPU等常见芯片。
什么是ink Die
在晶圆制造过程中,会对Wafer中的每个Die进行严格测试,通过测试的Die,就是Good Die,未通过测试的即为Ink Die。这个测试过程完成后,会出一张Mapping图,在Mapping里面会用颜色标记出不良的Die,故称Ink Die。
Flash芯片封装分类
目前NAND Flash封装方式多采取TSOP、FBGA与LGA等方式,由于受到终端电子产品转向轻薄短小的趋势影响,因而缩小体积与低成本的封装方式成为NAND Flash封装发展的主流趋势。
TSOP: (Thin smaller outline package )封装技术,为目前最广泛使用于NAND Flash的封装技术,首先先在芯片的周围做出引脚,采用SMT技术(表面安装技术)直接附着在PCB板的表面。TSOP封装时,寄生参数减小,因而适合高频的相关应用,操作方便,可靠性与成品率高,同时具有价格便宜等优点,因此于目前得到了极为广泛的应用。
BGA: (Ball Grid Array也称为锡球数组封装或锡脚封装体 )封装方式,主要应用于计算机的内存、主机板芯片组等大规模集成电路的封装领域,FBGA 封装技术的特点在于虽然导线数增多,但导线间距并不小,因而提升了组装良率,虽然功率增加,但FBGA能够大幅改善电热性能,使重量减少,信号传输顺利,提升了可靠性。
采用FBGA新技术封装的内存,可以使所有计算机中的内存在体积不变的情况下容量提升数倍,与TSOP相比,具有更小的体积与更好的散热性能,FBGA封装技术使每平方英寸的储存量有很大的提升,体积却只有TSOP封装的三分之一,与传统TSOP封装模式相比,FBGA封装方式有加快传输速度并提供有效的散热途径,FBGA封装除了具备极佳的电气性能与散热效果外,也提供内存极佳的稳定性与更多未来应用的扩充性。
LGA: (Land Grid Array ) 触点陈列封装,亦即在底面制作有数组状态坦电极触点的封装,装配时插入插座即可,现有227 触点(1.27mm中心距)和447 触点(2.54mm 中心距)的陶瓷LGA,应用于高速逻辑 LSI 电路,由于引线的阻电抗小,对高速LSI 相当适用的,但由于插座制作复杂,成本较高,普及率较低,但未来需求可望逐渐增加。
Flash芯片封装叠Die(Stack Die)
由于NAND Flash单颗Die的容量有限,为了实现更高的容量,需要在一个封装片内堆叠几个Die。在Wire Bond的时候,用金线互连。
目前单颗Die的容量最高的为Micron公司的MLC 4GB,目前最先进的堆叠技术可以叠8层,因此理论上MLC单颗封装片可以做到32GB。Micron公司计划在09年Q4推出此容量的封装片。
Flash芯片TSOP封装和BGA封装的内部结构
TSOP封装只需要一个引脚框架,把NAND FLASH Die的Pad打线(Wire Bond)连接到引进框架上面即可。封装技术简单,成本低。但其打线方式只能从两边打线,因此stack die就比较困难。
BGA封装与TSOP封装不同在于其采用了Substrate,用电路板来对引脚走线,因此可以进行四面打线,这样在进行叠die的时候,就变得更加容易操作。但成本会比TSOP要高。
Flash芯片封装的尺寸,一些封装方式尺寸比较:
NAND Flash出货有两种产品样式:
一种是Wafer,即晶圆出货,这种产品样式一般客户采购回去需要再测试和COB封装等,这种客户多为闪存卡大客户。
一种是封装片出货,NAND Flash目前最普遍采用的是48TSOP1的封装方式,现货市场均为TSOP的封装片。
NAND Flash按工艺可分为SLC与MLC
SLC英文全称(Single Level Cell)即单层式单元储存。SLC技术特点是在浮置闸极与源极之中的氧化薄膜更薄,在写入数据时通过对浮置闸极的电荷加电压,然后透过源极,即可将所储存的电荷消除,通过这样的方式,便可储存1个信息单元,这种技术能提供快速的程序编程与读取,不过此技术受限于Silicon efficiency的问题,必须要用较先进的流程强化技术,才能向上提升SLC制程技术。
MLC英文全称(Multi Level Cell)即多层式单元储存。Intel在1997年9月最先开发成功MLC,其作用是将两个单位的信息存入一个Floating Gate(闪存存储单元中存放电荷的部分),然后利用不同电位(Level)的电荷,通过内存储存的电压控制精准读写。MLC通过使用大量的电压等级,每一个单元储存两位数据,数据密度比较大。SLC架构是0和1两个值,而MLC架构可以一次储存4个以上的值。因此,MLC架构可以有比较高的储存密度。
TLC英文全称(Triple Level Cell)即一个单元可以存储单元可以存储3bit,因此需要8个等级的电位进行编码解码才能实现。其实TLC是属于MLC的一种。
SLC和MLC的基本特性表
Flash坏块的形成
NAND Flash的存储原理是,在写入(Program)的时候利用F-N隧道效应(Tunnel Injection隧道注入)的方法使浮栅充电,即注入电荷;在擦除(Erase)的时候也是是利用F-N隧道效应(Tunnel Release隧道释放)将浮栅上的电荷释放。
隧道注入和隧道释放的产生都需要十几伏的瞬间高电压条件,这对浮栅上下的氧化层会造成一定损伤,因此这样重复的操作(P/E Cycle)是有限的。SLC大概是100K次,MLC大概是10K次。达到读写寿命极限的时候存储单元就会出现失效,然后就会造成数据块擦除失效,以及写入失效,于是就会被标记起来,作为坏块,并将这个标记信息存放在Spare Area里面,后续操作这个Block时,需要Check一下这个信息。
Flash固有坏块
由于制造工艺的原因,通常普通的NAND FLASH从出厂开始就有坏块了,一般在2‰以下。一般芯片原厂都会在出厂时都会将坏块第一个page的spare area的第6个byte标记为不等于0xff的值。
NAND Flash的存储单元是有使用寿命的
NAND Flash的存储原理是,在写入(Program)的时候利用F-N隧道效应(Tunnel Injection隧道注入)的方法使浮栅充电,即注入电荷;在擦除(Erase)的时候也是是利用F-N隧道效应(Tunnel Release隧道释放)将浮栅上的电荷释放。隧道注入和隧道释放的产生都需要20V左右瞬间高电压条件,这对浮栅上下的氧化层会造成一定损伤,因此这样重复的操作(P/E Cycle)是有限的。SLC大概是100K次,MLC大概是10K次。
三星估算的SSD硬盘的寿命
如果每天对SSD写入4.8GB的数据,假设SSD总容量为16GB,那么,你至少需要3.34天才能对整个SSD的每个单元擦写一次;如果此SSD为擦写次数为100K的SLC单元,那么,你至少需要3.34×100K天才能使这个SSD完全失效;3.34×100K天=913年,因此16G的SSD可以使用913年 。那么,如果是MLC的话,也至少可以使用91.3年。
晶圆制程工艺发展历史
芯片制程工艺是指晶圆内部晶体管之间的连线间距。按技术述语来说,也就是指芯片上最基本功能单元门电路和门电路间连线的宽度。
主流厂商的晶圆制程工艺以及下一代制程工艺的情况,如下表。
芯片制造工艺在1995年以后,从0.5微米、0.35微米、0.25微米、0.18微米、0.15微米、0.13微米、90纳米、75纳米、65纳米一直发展到目前最新的34纳米。
一步步印证了摩尔定律的神奇。以90纳米制造工艺为例,此时门电路间的连线宽度为90纳米。我们知道,1微米相当于1/60头发丝大小,经过计算我们可以算出,0.045微米(45纳米)相当于1/1333头发丝大小。可别小看这1/1333头发丝大小,这微小的连线宽度决定了芯片的实际性能,芯片生产厂商为此不遗余力地减小晶体管间的连线宽度,以提高在单位面积上所集成的晶体管数量。采用34纳米制造工艺之后,与65纳米工艺相比,绝对不是简单地令连线宽度减少了31纳米,而是芯片制造工艺上的一个质的飞跃。
目前最先实现34nm工艺的是Intel和Micron联合投资的IM,此技术被最先应用在了NAND FLASH上面,可见NAND FLASH的制程工艺跳跃是所有IC中最快的。
晶圆技术的发展都是受生产力驱动,必须向更小的制程间距和更大的晶圆尺寸发展。制程从2.0um、0.5um、0.18um、90nm一直到目前的34nm,晶圆尺寸从最初的5英寸发展到目前的12英寸,每次更迭都是一次巨大的技术跳跃,凝聚了人类科技的结晶,也一次次印证了摩尔定律的神奇。
晶圆尺寸的大约每9年切换一次。而晶圆制程由最初的几年更迭一次,到目前的基本上每年都能更迭一次。
更多内容和“闪存技术、产品和发展趋势全面解析”全面的闪存技术电子书,请点击“了解更多”查阅。
35k高分屏不要怂,从显卡到SSD武装到牙齿
过去,1080P已经称为高清了,而4k现在流行的称呼是超清。高分辨率带来更好的视觉体验,更好的冲击感和沉浸感。但是,由于分辨率提高,对于整机,尤其是显卡的要求就越来越高了。
现在大屏幕高分辨率显示器的价格不高,然而很多人担心,高分辨率会不会对配置要求很高。很可惜,这的确是事实。高分辨率自然需要更高性能的硬件才能相配。比方说,HKC C340的分辨率就达到3440X1440,也就是3.5K分辨率
来看看,我的3.5K高分屏用什么配置
Ryzen锐龙平台,GTX1070显卡,建兴T11 pci-E 界面 M.2 SSD 256GB,这配置,你怎么看呢?
Ryzen 1700X,多核心运算性能已经和X99的中高端cpu相近,价格倒是和i7 7700K相差不远
毕竟是8核心16线程,硬指标不俗,可惜就是频率比不上intel
Ryzen平台同样也支持SLI和CF,同样也支持32Gbps高速的Ultra M.2技术。
有意思的是,Ryzen平台的pci-E通道是显卡和M.2那边是独立核算的,也就是说,显卡就是16X,M.2那边是4x。遗憾的是,只有第一条M.2是pci-E 3.0 4X带宽,另外一条是pci-E 2.0 4X。所以,如果打算玩M.2 RAID0,建议还是Intel平台合适
值得一说,X370 Killer SLI还有第三个M.2接口,那个是预留给M.2接口无线网卡或者蓝牙卡的
Ryzen平台同样也有USB3.1接口,同时我用的华擎X370 Killer SLI还自带无线网卡,现在哪怕是台式机,也不想拖着那条长长的网线了
显卡方面,GTX1070仅仅是起点而已,3.5K高分屏不仅仅对于显存要求高,主要还是对于显卡芯片本身的性能要求高
HKC C340显示器是一款电竞高分屏显示器,能支持100MHz刷新率。但是不能用DVI或者HDMI接口输出,只能DP。如果用DP以外的老接口,刷新率仅仅60MHz,太浪费了
不过,中高端显卡基本上不会没有DP口的,这一点大可以放心
映众GTX1070 冰龙超级版具备三个DP,一个HDMI接口。两种接口形状差很远,有防呆设计,不会插错的
刚好赶上了建兴的新品T11,特意尝一下螃蟹
和之前T10一样,这个也是支持nvme协议,pci-E界面的M.2 SSD
T11的包装以及配件和T10的新装一样,也是附带安装工具而且还有螺丝
遗憾的是,m.2 ssd的螺丝始终是不通用的。以我手上华擎,技嘉,华硕三个品牌主板来说,三个的螺丝均不一样,为啥不能统一一下呢?
外表来看,这个也是一块2280规格的M.2 SSD
然而,翻过来以后才发现完全不是那么回事
这仅仅是一张2242规格的m.2 SSD
同样的规格,长度暴降50%,考虑到主控,缓存是不变的,那么就是闪存的集成度提升了
闪存是东芝的企业级eTLC, TSOP封装的Toggle NAND
相信东芝的用户可能会知道,最早用企业级eTLC的就是东芝自家的A100
但是从集成度来说差距很大,过去A100 256GB是4颗粒;而建兴T11仅仅2颗粒,也就是单颗128GB,估计是工艺进步的产物
主控是群联的PS5008,这款主控今年CES上才发布,40nm工艺打造的4核心8通道NVMe SSD控制器,采用PCI-E 3.0 x2通道,论性能而言,PS5008比不上PS5007,但定位和售价自然会比PS5007更加亲民!而且发热量也随即大大降低。
至于海力士的缓存,这个不是重点,聪明的大家估计早就看到了
T11并不是T10的升级版,更应该说是建兴用来狙击入门级市场的产品
闪存,主控以及接口均不一样
T11的接口是B&M-key而非M-key接口,两者速度上有所不同
T11保留PCI-E 3.0 2X,理论速度也有15GBps左右,速度还是非常不错
随便吐槽一个,这散热片貌似比起T10的给力
建议还是插在Ultra M.2的插槽
GTX1070玩太多了,先上T11的测试暖场如何。为了让大家方便理解,特意用市面上常见的Intel 600P陪跑
1.AS ssd benchmark
上面的是T11,下面的是600P
很明显,600P除了持续读取一项,其他无论是持续写入性能还是4k性能都大比分落败
总分差距近一倍,万万想不到
2.Crystaldiskmark 5.0
CDM的测试结果和ASS SSD benchmark接近,600P继续被打败
其他测试方面,建兴T11的性能同样值得称道
热身完毕,来看看3.5K高分屏下面,GTX1070能不能不辱使命完成任务?
一、古墓丽影10
DX12模式,特效全开,只有27帧左右。一张GTX1070是不够的,建议再来一张或者上GTX1080TI吧
GTX1070建议压低一档特效
二、灰烬燃尽
DX12模式,特效全开还有近47帧,考虑到这个是RTS游戏,这帧速绝对够了
三、杀手6
杀手6的DX12有点奇怪,我还是习惯用DX11测试
特效全开,轻轻松松71帧
四、彩虹六号
特效全开,舒舒服服有80帧,无压力
五、怪物猎人
这个虽然是网游,但是是基于Cryengine引擎,也就是孤岛危机3的引擎,画质非常好,要求也是极高
但是还是轻松47帧左右,当然了,如果组队,建议还是降一档特效
六、神偷4
特效全开,帧数接近60帧,稳了
七、古墓丽影9
特效全开,包括海飞丝,一样有82帧左右,可以放心玩了
整体而言,3.5k分辨率比起4k的要求还是低很多的,一张GTX1070稍微设置一下还是轻轻松松就能扛下常见的3A大作
高分辨率,曲面带来的沉浸感更好。考虑到显示器是几乎不坏不换的配件,建议别过于担心显卡,有条件就挑一个自己最舒服的显示器
至于显卡?等新品嘛,一步一步升级
相关问答
迪斯科音乐与复古音乐之间是等号关系吗?早年他们签约在澳大利亚的唱片公司,一直到65年他们首发了专辑TheBeeGeesSingandPlay14BarryGibbSongs,没啥影响和销量。直到签约环球唱片旗下Polyd...