UFS 30快到原地飞起 关于存储的二三事
上月底,微电子行业标准发展的全球领导者——固态技术协会JEDEC发布了UFS v3.0标准,单通道带宽提升到11.6Gbps,是HS-G3(UFS 2.1)性能的2倍。而由于UFS支持双通道双向读写,所以UFS 3.0的接口带宽最高可达23.2Gbps,也就是2.9GB/s。
UFS 3.0快到原地飞起 关于存储的二三事
前几天这条新闻见诸各大科技媒体,但不少朋友都看的一脸蒙圈:UFS3.0是什么鬼?23.2Gbps的带宽在手机上意味着什么?UFS3.0都用啥用?用在手机上会给我们带来哪些提升?所以本期发烧学堂,我们就来聊聊UFS 3.0存储技术,给大家答疑解惑。
从UFS说起的手机存储
某品牌发布会上,台上说:我们用的是UFS2.1存储!
旁边大哥一声尖叫吓我一跳。我跟该大哥搭话——
我:我说大哥你尖叫个啥,不会是厂商花钱雇来的托儿吧?不就是个存储么?
某大哥一脸鄙夷:听说过固态硬盘SSD不?着UFS就是手机上的SSD!传输速度更快!
我:那为啥叫UFS不叫SSD?不就是更快么,有个X用?下小电影会更快么?
某大哥瞬间脸色变黑......
(PS:别学我,容易没朋友)
其实这大哥说的没错,现在的UFS存储确实要比以前的eMMC存储传输速度更快。但为啥更快?它们之间又有哪些区别?手机存储经历了哪些发展?我们一起来梳理一下:
eMMC和UFS都是个啥?
准确的说,应该是技术标准,而不是芯片硬件本身。由于存储芯片在封装时运用了这些技术标准,所以习惯上都会用这些字母缩写来称呼这些芯片的类型。
eMMC全称为“embedded Multi Media Card”,即嵌入式的多媒体存储卡 ,由MMC协会所订立。从eMMC4.3一路发展到4.4、4.5直到现在的5.0、5.1,传输速度也从50MB/s一路狂飙到最新eMMC5.1的600MB/s,而常见于手机上的eMMC5.1实际读取速度不会超过300MB/s。
由于单通道的结构性质,eMMC不能同时读写数据,不支持多线程,想提升这种存储单元的性能,只有不断改进eMMC的总线接口,也就是我们刚才说的eMMC的版本升级。这也注定了eMMC存储不会有太高的提升空间。
两种标准的通道区别(图片引自网络)
UFS全称为“Universal Flash Storage”,即通用闪存存储 ,由固态技术协会JEDEC订立。相比于eMMC,其优势就在于使用高速串行接口替代了并行接口,改用了全双工方式,收发数据可以同时进行。
之前厂商们大力宣传的UFS 2.0规范分为两种,强制标准为HS-G2,可选标准为HS-G3。HS-G2 1Lane最高读写速度为2.9Gbps(约为360MB/s),2Lane最高读写速度为5.8Gbps(约为725MB/s)。可选标准HS-G3 1Lane最高读写速度为5.8Gbps(约为725MB/s),2Lane最高读写速度为11.6Gbps(约为1.45GB/s)。
UFS 2.1的闪存存储标准速度标准没有任何变化,主要是在设备健康、性能优化、安全保护三个方面进行了升级。
在文初我们说的UFS3.0在这一个基础上再次升级,带宽是UFS 2.1的2倍,理论的接口最大带宽为23.2Gbps,即传输速度为2.9GB/s。相比于最新eMMC5.1标准,理论上有着接近5倍的性能优势。
苹果用的是哪种协议的存储?
我们经常会听到这样一个说法,苹果的存储特别特别快,所以手机流畅。那么iPhone用的是UFS吗?其实并不是。从iPhone 6s开始,苹果在手机上用的是使用NVMe(Non-Volatile Memory express)接口协议 ,这种协议在电脑的SSD上比较常见。
在当时,iPhone 6s的闪存实际性能就达到了连续读取速度402MB/s,连续写入速度164MB/s的水准。发展到iPhone 8这一代,性能也有了进一步的提升。iPhone 8 Plus实测读取速度为1131MB/s 。而目前除了少数国际旗舰的UFS2.1读取速度能达到1100MB/s以上外,主流安卓机上用的UFS 2.1实际读取速度一般700MB/s出头 ,所以大多读取性能不如iPhone也理所当然。
不同类型的存储价格差异大吗?
既然UFS存储的性能这么牛X,那是不是比eMMC贵上很多?还真不是,其原因要从存储芯片的封装说起。
不同标准的存储价格(数据来源全球半导体观察网)
我们提及存储时,都在说有多大多大容量,事实上,手机储存容量、固态硬盘、U盘和SD卡等使用的都是一种叫做NAND的储存介质,NAND闪存是一种非易失性存储技术,即断电后仍能保存数据。我们刚才所说的存储,都是在NAND存储芯片的基础上,再加上了控制芯片,接入标准接口,进行标准封装而成的。
这样封装的好处就在于可以使结构高度集成化,而且当手机客户选用封装好的存储芯片进行手机硬件堆叠时,不需要处理其它繁琐的NAND Flash兼容性和管理问题。
之前苹果的存储内存混用一事闹得沸沸扬扬,其原因就在于NAND闪存颗粒也有不同。根据单元存储密度的差异,闪存分为SLC、MLC、TLC三种类型:
SLC(单层式存储) ,单层电子结构,写入数据时电压变化区间小,寿命长,读写次数在10万次以上,但造价高。
MLC(多层式存储) ,使用高低电压构建的双层电子结构,寿命长,造价可接受,读写次数在5000左右。
TLC(三层式存储) ,是MLC闪存延伸,存储密度最高,容量是MLC的1.5倍。 造价成本最低,但使命寿命低,读写次数在1000~2000左右。
所以,采用eMMC和UFS标准虽然对价格有一定影响,但并不是所有原因,还要看闪存颗粒的类型。据悉,采用UFS3.0标准的存储芯片价格会更高一些。当然,苹果的NVMe接口协议的存储芯片价格也不低。
传输速度会给我们带来哪些影响
说可这么多,相信大家最关心的问题还是存储芯片的传输速度会给我们带来哪些影响。其实这个问题不难回答。相信给电脑加装过SSD的朋友都会有这样的体验:以前机械硬盘开机少说也得三十多秒,用了SSD后,开机时间不到10秒了;加载大型游戏能够明显感觉快出很多。在手机上用高速的存储芯片道理是相同的,就是让手机加载更快。
举个大家都有认知的例子:同时代的iPhone游戏加载速度回明显优于安卓手机,其中原因除了处理器性能和软件系统优化外,很大一部分原因就来自于苹果NVMe接口协议存储芯片的高读取速度。当然,得益于此的还有应用的加载速度。
喜欢用手机拍照的朋友,在以前肯定都有这样的烦恼:拍照时手机反应慢,按快门后得等很长一段时间才能拍摄成功;手机里存的照片太多,照片加载特别慢,稍微一滑动手机就会卡到爆。其原因除了手机处理器和软件的优化外,就是因为存储的写入和读取速度太慢造成的。
所以,在不考虑处理器和软件的情况下,存储拥有了更高写速,拍照片就可以更快响应。另外,也允许了像素更高、帧数更多的视频录制;存储读速更高,多张照片和超高质量视频加载得就更快,操作和播放的卡顿就更少。
另外,相比于eMMC,UFS的优势还在于采用了全双工方式,收发数据可以同时进行。打个比方来说,eMMC就相当于一条只允许一辆车经过的通道,对面的车要等通道内的车出来以后才能进入通道。而UFS则是双向车道,允许来往车辆同时运行。即用UFS存储的手机在执行多任务时,无需等待上一进程结束,效率自然提升不少。
那么UFS3.0会给我们带来什么?
刚才提到有更快的加载速度、允许画面质量更高、帧数更多的视频拍摄和播放。除了这些,还能给安卓手机带来什么呢?
首先,UFS 3.0的接口带宽最高可达23.2Gbps,也就是理论传输速度可达2.9GB/s。当然实际速度会有所折损,但应该不会低于2GB/s,这就远远高于iPhone 8 Plus实际读取速度1131MB/s。所以如果苹果的存储方案没有大幅度升级的话,下一代产品将被采用UFS3.0存储的手机超越,iPhone在游戏加载速度上将不具有优势。
我们即将进入网速更快的5G时代(图片来自网络)
另外,我们也将进入5G时代。5G网络最高理论速率可达20Gbps,也就是2.5GB/s左右,按照理论数据一瞬间就可以下载一部高清电影。但问题就在于市面上的手机存储芯片都没有这么高的写入速度。所以,以后制约下载速度的将不再是网速,而是存储。UFS3.0的大带宽显然与5G的高网速更般配。
但近一年内,UFS3.0应该不会投入手机市场。因为麒麟970、骁龙845、Exynos9810等研发较早,暂时没有信息证明这三款旗舰处理器支持UFS3.0标准,所以大概只有等到2019年才能在手机上见到。
写在最后
看到这里,相信大家已经对手机存储有了一定的了解。最后,我们来说一下如何鉴别储存芯片类型:下载一款名为AndroBench,进行速度测试。
标准顺序读取(Sequential Read)MB/s顺序写入(Sequential Write)MB/s eMMC 5.1250 125 eMMC 5.0 250 90 eMMC 4.5140 50eMMC实际测试参考数值
eMMC速度可以参照表格,一般来说顺序读取速度不超过300MB/s的芯片均为eMMC标准芯片。现在见于主流机型上的UFS标准芯片顺序读取速度在700MB/s左右。当然,如果你碰到顺序读取速度到1100MB/s,那可以说该手机厂商十分良心了。
内存技术发展史
作者 | 金捷幡
来源 | 金捷幡(ID:jin-jiefan)
《内存的故事》主要是三年前写的。趁这个假期写一个短续,枯燥地鸟瞰一下这几年内存行业的一些近况。
内存领域的现阶段问题是什么?
内存是个不太好的俗称,其主要用途是两个:作为程序运行的空间(DRAM等)和存储数据的空间(NAND等)。
NAND进入3D时代以后,基本上容量就没有天花板了,所以这个我们放到最后再说。
现阶段的主要问题是DRAM:单位价格的容量增长缓慢和速度跟不上CPU。这个问题在商用领域特别明显,比如数据中心、高性能计算和运营商网络等。
此外DRAM能耗过高,因为它要在每个时钟周期给小电容们重新充电。
电费是商业用户的成本大头。在移动设备上,DRAM也是电池的死敌。
历史上DRAM为了增加带宽只能不断增加延时,那么把缓存加大如何呢?问题是,SRAM和CPU你中有我一样贵,而且六个晶体管才能存一个比特。Intel至强处理器的Cache,也只有DRAM的千分之一。
宇宙无敌的IBM Power 9 CPU配24个核也就120MB L3,代价是它的die size近700mm2,是苹果A13处理器的七倍!
Power9中L2/L3占这么大面积才100多M
内存行业的主要核心问题是日益增长的容量速度功耗需求和DRAM的技术瓶颈无法匹配。
DDR5
由于DRAM本身的局限性,它的技术进步一直很痛苦。DDR3到DDR4的小进步花了五年;DDR4从2012年发布第一版到今天DDR5还没有发布(注:显存GDDR5只是DDR3的变种)。
DRAM标准由JEDEC JC-42工作组制订。虽然有投票机制,但DRAM的节奏其实一直由英特尔主导。
原因很简单,英特尔确定PC路线图:CPU或北桥芯片决定什么时间支持新标准内存。
得益于半导体工艺的进步,DDR5的核心电压从DDR4的1.2V下降到1.1V,这有望节省20%的功耗。
DDR5可以使系统通道数再翻倍,图:Mircon
DDR5的Burst Length和Prefetch (预读取)从DDR4的8n增加到16n,这样在时钟频率不变的情况下带宽翻倍。为了控制高速带来的各种信号干扰和抖动问题,DDR5还引入了核心时钟的各种优化调整。新的On-die ECC功能也是对服务器的大利好。
但这些这也将带来更多的设计、测试和兼容挑战,需要CPU(含内存控制器)的很大改动,从目前看大概要等到2022年。
LPDDR5
低功耗LPDDR5单独拿出来因为从LPDDR4开始已经和标准DDR分道扬镳了。
虽然LPDDR5和DDR5使用的新技术很多是共通的,但着眼点有很大不同。LPDDR5是功耗第一速度第二,而DDR5追求速度第一功耗第二。
因为LPDDR4已经是16n预读取,LPDDR5主要靠Bank group访问实现速度提升。它追求的是超低功耗,所以供电电压和核心电压比DDR5都更低。
x86领域的技术进步被英特尔带慢了节奏,但在手机领域则不同。
激烈的竞争和每年一次的旗舰产品发布使得各家不断比拼最新的技术。
LPDDR5就是个例子。
小米10率先使用LPDDR5确实是个big thing,这显示了高通激进的产品策略。一加8和三星S20的跟进基本上定了今年高端的调子。
华为则面临比较尴尬的处境,因为美商Micron是目前LPDDR5的主要供应商。三星估计优先供应自己,而Hynix似乎在标准DDR5更用心。在LPDDR5供应困难的情况下,华为要不要在下一代麒麟提供支持,从产品规划上是个两难。
HBM
对于迫切需要高带宽的应用,比如游戏和高性能计算,高带宽内存(HBM)则是绕过DRAM传统IO增强模式演进的优秀方案。
图:AMD
HBM直接和处理器封装的方式不再受限于芯片引脚,突破了IO带宽的瓶颈。另外DRAM和CPU/GPU物理位置的接近使得速度进一步提升。
在尺寸上,HBM也使整个系统的设计大大缩小成为可能。
在目前,HBM2在很大程度上是GDDR6的竞争对手。不过根据最新消息,Xbox Series X和索尼PS5仍旧选择了GDDR6,也许因为HBM2高昂的成本吧。
不过从长远看,DRAM仍有很强的3D化需求。因为2D在制造上(昂贵的10nm瓶颈)接近天花板。
NVDIMM
现在云计算虚拟机和各种内存数据库大行其道,服务器对大容量内存非常饥渴。但是由于DRAM成本很难进一步降低,如何低成本配置高容量内存变成一个难题。
混搭的NVDIMM被提了出来。
NVDIMM-F是直接用NAND颗粒替代DRAM做成内存条,好处是极其便宜,但它速度太慢而且并不能突破系统对DRAM总容量的访问限制。
NVDIMM-N是在内存条上加上NAND做DRAM的镜像存储,防止服务器意外断电丢失内存数据。但NAND并不能扩容内存而且占了一些通道带宽。
JEDEC NVDIMM-N示意图
最终的方案是NVDIMM-P,它允许巨大的容量比如1T内存,并允许用各种新式芯片比如NAND、RRAM、MRAM等替代DRAM。
目前还没有看到JEDEC NVDIMM-P的标准出来。但英特尔已经发布了3D-Xpoint为基础的Optane DIMM,自己平台支持自己是个巨大的优势,也是给竞争对手的一个大门槛。
3D-Xpoint和其它NV内存
3D-Xpoint是很有意思一个话题,号称速度比NAND快1000倍。
英特尔和Micron对3D-Xpoint的技术原理一直讳莫如深,甚至一丁点都不透露。开始有人猜它是3D NOR,后来大家认为它是相变内存(PCM)或RRAM。
市面上也没有看到有人剥开这颗芯片分析内部。
直到一个案卷中,让我们看到当代爱迪生Stanford Ovshinsky是其发明人。清算公司认为英特尔和Micron在Ovshinsky去世后公司破产处理中隐瞒了关键信息。
和Micron分家后,英特尔的3D-Xpoint将转到大连厂独家生产,不知道未来是否能有更多的小道消息。
3D-Xpoint技术在服务器领域增长潜力很大,但如何降低制造成本是关键。
MRAM、FRAM等其它NV类内存则在物联网、汽车和工业等领域寻找机会。
MRAM的工艺和传统MOS半导体工艺类似,这有助于其扩大生产而降低成本,最终有机会在一些嵌入式应用取代部分NOR、SRAM或DRAM。
那么速度更快的PCM和RRAM是否能取代NAND呢?似乎短期不会实现,因为存储数据的速度要求一般没那么高,而3D NAND的低成本容量暴增实在是太成功了。
图:对比不同内存的成本和速度
3D NAND
对于3D NAND来讲,单个cell缩小变得没有意义,因此不再需要最尖端的半导体制程技术。Hynix最近说,3D NAND未来可以叠800层。
盖楼过程光刻环节减少了,而沉积和蚀刻等工序大大增加,蚀刻之王泛林成为最大赢家。
这导致的另一个影响是DRAM和NAND的产线和产能不再能灵活互补。
蚀刻下图这种楼梯达百层和以及蚀刻长孔是有挑战性的。楼梯是连接位线的,长孔则是著名的充电陷阱(Charge Trap)。
记得英飞凌/奇梦达是最早用以色列Saifun公司技术量产Charge Trap闪存的。但当时技术不成熟,擦写寿命只有Floating Gate的1/10。Jim Handy说Charge Trap蚀刻孔的工艺来源自Trench技术。
在内存 60 年变迁史里提到过当初IBM、英飞凌、东芝和AMD是早期半导体技术结盟的,后来奇梦达用Trench独战群雄最后败北。但Charge Trap蚀刻技术倒是延续了下来:AMD的后代Spansion把它用在了NOR Flash上,而东芝则做出领先的BiCS 3D NAND。
现在坚守Floating Gate的只剩英特尔一家了。我的理解是FG每层都需要光刻,这样的工艺复杂度会导致其失去竞争力,退出市场可能是难以避免的。
前些天看长江存储发布的128层Xtacking技术很有意思,它把存储阵列和控制电路分开。这样可以大大降低开发和革新周期,但对量产挑战不小。看到的具体技术细节不多,如果是wafer-to-wafer bonding,即使不考虑bonding良率,成品良率是两片晶圆良率相乘的关系。
3D NAND的延续和DDR5标准的难产则对于目前正在起步的中国内存业则是个非常好的追赶良机。
很高兴看到长鑫存储已经开始量产主流的DDR4,而其在知识产权和专利上的远见布局也令人赞叹。
脚踏实地和志存高远大概是内存行业的不二法门吧。
参考阅读:
《内存的故事》
《内存的故事》-Rambus
《内存的故事》-金士顿
声明:本文系作者独立观点,不代表CSDN立场。
☞Ruby 之父:编程要给程序员带来乐趣
☞Zoom 是如何击败科技巨头的?
☞视频 | 你不知道的"开源"60年秘史
☞GitHub标星10,000+,Apache项目ShardingSphere的开源之路
☞阿里技术专家告诉你,如何画出优秀的架构图?
☞加拿大API平台如何做到30%为中国明星项目?创业老兵这样说……
相关问答
nand写入 量有必要看吗?应该看NAND写入量,host写入量是指本机系统需要硬盘写入的总数据量,而NAND写入量是硬盘进行写操作时实际的数据写入量。NAND写入量大于host写入量是因为存在写...
nand 闪存不能低于多少纳米?从技术上讲,nand闪存不能低于20纳米。随着技术的不断发展,nand闪存的制程技术在近年来已经逐渐迈入了16nm、14nm甚至更小的节点。这是因为随着nand闪存芯片的...
nand 版本和emmc版本区别?1.nand版本和emmc版本有一些区别。2.nand版本是一种闪存技术,它使用了非易失性存储器来存储数据。它的读取速度相对较快,但写入速度较慢。而emmc版本则是一...
为什么USB3.1的优盘插在USB3.0接口上 写入 单个大文件速度只有20M/s?时速三、台式机最好直接插主板上的3.0接口上,有的机箱比较差一点也许前置的根本就没有接在主板的3.0接口上。还有一种可能就是你买的是个假USB3.1的优盘。...
三星计划何时量产基于100层V- NAND 闪存的SSD产品?三星电子刚刚宣布,其已开始生产业界首批100层V-NAND闪存,并计划在企业级PCSSD上采用。这家韩国科技巨头称,基于256Gb3-bitV-NAND闪存的SSD,已开.....
SSD的存储原理是什么?1、固态硬盘原理是一种主要以闪存(NANDFlash)作为永久性存储器的计算机存储设备,此处固态主要相对于以机械臂带动磁头转动实现读写操作的磁盘而言,NAND或者其...
为何我的固态硬盘 写入 非常慢?-ZOL问答这个要看你的SSD使用的Nandflash是哪种了,要是SLC/MLC,恭喜你,你买到不错的东东,要是TLC的,这个就不好说了,TLC寿命比较短,真的没用几年,容量就没了。有用(0)...
问一下SSD问题?用认真的态度与专业的情怀倾注于存储,欢迎关注我,与我交流哦!答案是肯定的。系统安装完成后才发现未4K对齐,依然是可以补救的。在给出4K对齐补救方式之前,...
今年CES大展上,Mushkin都推出了哪些硬件产品?Helix-L的容量提供250GB、500GB和1TB版本,最快版本的连续读取速度达到1710MB/s,连续写入速度为1500MB/s。随机读取速度高达235KIOps,随机写入速度达到272K。...
Nandflash和norflash的区别?nandflash和norflash的区别如下:1、开发的公司不同:NORflash是intel公司1988年开发出了NORflash技术。NOR的特点是芯片内执行(XIP,eXecute...