扯一扯西数冷数据掉速是啷个回事?
最近存储圈有个事,说大不大但是也不能算小,就是西数硬盘的“冷数据”门事件,大痣在11月月底,有网友爆出西数固态硬盘在打开/复制较长时间没有打开的文件速度变慢,甚至只有几十M/S。最初看到的时候因为对于这类产品特性有所了解,所以觉得并不奇怪,不过考虑到不是所有人都能理解这个事,所以就写一篇文章,解释下为啥这样。
首先,最初看到西数“冷数据”的事情,我第一反应就是类似的事情在5年前就已经上演过一次,当时的主角还是三桑,也是存在老旧文件访问速度低,经过几个月多次的固件更新,三星“解决”了这次的问题,而如今换了家厂商,问题还是那个问题。
因为两次事情是相同的原因造成,并且三星已经“解决”问题了,所以这次文章会有一些关于三星的内容,然后是关于原理部分的解释。
要理解这次事情,首先需要了解几个东东。
1.写入放大
图片来源于自用建兴S960 512G固态信息截图
写入放大其实很好解释,就是 主机对硬盘的写入 * 写入放大倍率=实际固态硬盘对NAND写入 ,原理是因为固态硬盘在写入文件之前需要将已有旧数据清除后才可写入(机械硬盘可以直接覆写,你电脑删除的文件只是在系统层面【软件】删除,实际硬盘只是将数据段标记为“删除”,待下次写入或者主控空闲时进行删除作业),而实际擦除的部分是要高于写入部分,请求写入的次数也会增加,最终导致写入数据过多。
而写入放大也并非没有解决方法,代价是会牺牲写入的速度(直说就是表面数据不好看了,不能忽悠消费者了,无视写入放大才能顺应消费主义),例如采用了压缩型主控SF2281的英特尔520,就拥有极佳的写入放大,最佳状态为0.14倍(相当于写入缩小,我之前的520写入放大倍率为0.75,图中的建兴S960写入放大倍率为43,我摸过的固态,最大倍率为143倍)。
关于写入放大部分,MLC时代还比较OK,虽然个别固态能出现上百倍的写入放大,但是仰仗MLC的寿命,基本上问题不大,但是TLC时代,问题会比较严峻(和SLC Cache有关),而TLC时代的大部分固态,因为这部分数据难看主控直接屏蔽了对NAND写入量的检测。
2.SLC Cache
图片来源于自测英特尔傲腾H10 1T测试截图
SLC Cache是目前几乎所有TLC/QLC固态必备(MLC固态选配,企业级TLC选配但最好没有),简单地说:
SLC状态为0和1,一个单元拥有两种电平状态,恢复极快、读写极快;
MLC状态为00、10、01和11,一个单元有四种电平状态,恢复较快,写入较快;
TLC状态为000、100、110、111、011、001、101和010,一个单元有八种电平状态,恢复一般、写入一般;
QLC状态为0000、1000、1100·····和1111,一个单元拥有十六种电平状态,恢复慢、写入慢。
PLC依次类推,越往后电子排布方式越复杂,因而主控在读写数据时需要更长的时间定位数据和准确识别数据,同理需要更长的时间清除数据(并且放大倍率会更大),所以实际写入速度也是依次递减(读取速度影响不太大),SLC>MLC>TLC>QLC,而在进入TLC时代后,SLC Cache的设计被广泛接受了,简单地说就是将TLC颗粒的一个单元以SLC模式运行,既写入时只写入0和1,而非TLC模式的八种电平状态,在写入完成或者超出SLC Cache容量后回归TLC模式,再将SLC Cache容量内的数据再次写回颗粒中。在写入过程中,因为电平状态的关系,实际上SLC Cache会几倍的消耗颗粒寿命,同样也需要几倍的空间才能实现SLC Cache;
MLC颗粒实现1G SLC Cache需要2G以上MLC空间,并且产生2倍以上写入放大;
TLC颗粒实现1G SLC Cache需要3G以上TLC空间,并且产生3倍以上写入放大;
QLC颗粒实现1G SLC Cache需要4G以上QLC空间,并且产生4倍以上写入放大;
SLC Cache产生的写入放大倍率,与本身写入放大倍率并存,SLC Cache容量内文件需要经过多次写入才能被存储。
而SLC Cache的加入,让TLC/QLC固态表面数据变得好看(忽悠人警告!),但是对于主控的算法等又提出了更高的要求,在840EVO旧文件掉速的事件中,就有840EVO第一批老用户表示,第一批并没有出现这么严重的掉速,而新版加入了SLC Cache的840EVO才出现了比较严重掉速/丢文件现象。
目前有一些企业级的TLC固态并没有采用SLC Cache的设计(例如东芝XD-5),主要是为了避免SLC Cache内数据转移至TLC颗粒过程中出现断电等特殊情况,会提高数据丢失的风险,所以没有采用。
对于企业级产品来说,稳定才是重中之重,表面数据是不需要的。
3.LDPC/ECC等纠错校验码
图片来源于知乎专栏,作者为@Trustintreth
这里不解释具体的原理,只说明最终结果,因为这个过程太复杂,我们只需要知道作用就可以了。
综12两点,不论是写入放大还是SLC Cache都会造成过多的写入,而LDPC和ECC等纠错编码的作用就是在写入的同时,去校验数据是否写入正确,以避免重复写入,从而优化寿命,读取时也能够用来校验数据是否正确,有一定的容错率。
一句话来说就是纠错,LDPC目前为主流,纠错能力优秀,编码简单(目前主控基本必备)。
4.西数“冷数据”事件和三星840EVO 旧文件掉速BUG事件
图片来源于:自行拍摄英特尔 傲腾H10 1T和西数SN550 1T
由于NAND闪存特殊结构决定了其用于存储数据的电子会随着时间的变化而产生电子丢失或者界限模糊的情况,换言之是所有的NAND闪存(固态)都存在的现象(傲腾除外)。
这么说可能不太好理解,以电池举例,正常状态下电池会有一个自然放电的过程,只要时间够久,即使你未曾使用,一块电池也会从满电变成亏电,同理在NAND闪存内部也发生着“自然放电”的过程,只是“电池”数量会多得多,放电过程进度不一。
而日常使用中,电池会因为设备的使用而放电和充电,等于定期会刷新电量,所以并不会短期内就“自然放电”至亏电状态,转换到NAND闪存内同样存在,如果定期读写数据,那么这个数据会被校准电压状态,等于完成一次“充电”,刷新了一次,重置了丢失电子的进度条。
而没有定期访问,或者说长时间没有读写的数据,就属于“冷数据”,就处于“自然放电”的过程中,随着“自然放电”的进度加深,读取的速度就会变慢,最终可能出现数据完全丢失的情况。而变慢的原因其实很简单,因为部分数据缺失,需要利用LDPC等纠错码进行纠错,运算后才能得出缺失的部分数据,所以对于冷数据的读取就会变慢。
简单地说就是套公式运算需要时间,在LDPC编码容错率允许的范围内,丢失数据越多则运算时间越长,读取速度越慢。
由于TLC/QLC颗粒复杂的电平状态,所以电子丢失导致数据模糊/数据丢失的情况,在TLC和QLC颗粒中出现的概率和严重程度会高于SLC/MLC颗粒,对于主控算法要求也更高,目前TLC能够维持较高的寿命也是极大的依赖于高超的主控算法,拥有极佳的“国师”才能扶得起那些阿斗,而如今QLC还没有遍地开花,其中一个原因就是主控还没有优化到那个程度。
至于解决方法,其实也简单,在固件中设置固态硬盘定期刷新数据就可以,需要主控定期将冷数据重新写入即可完成一次数据刷新,在下一次电子严重丢失之前再次刷新就可以解决,代价就是会徒增NAND写入量,降低使用寿命,不过也是没有办法的办法,而三星的解决方案大致如此,其实并不能算解决,只算缓兵之计。
实际上由于数据在存储的时候有一定的随机性,存储的文件大小不一,用户访问写入时间不一,再结合“均衡写入”等技术,对于一般固态而言,尽管用户没有进行读写操作,主控本身依旧可能会根据算法去改变数据存储位置,变相也在完成数据刷新。
而对于近期的西数“冷数据”掉速门事件来说,消费者等待西数官方更新固件就可以,或者说无视这个事情就好(所有NAND都存在这个现象,看淡就好),如果实在不放心,在固件更新之前,隔上几个月全盘复制一遍或者重要文件定期复制一次就可以解决问题了。
对于重要数据,重中之重就是多备份,备份才是王道!!!
文章有些部分解释的比较复杂,可能存在错误,欢迎指正~~~
说起来我那个吃灰多年的512G MLC的盘就存在老文件掉速的问题,甚至个别文件已经打不开了~~~
后记
图片来源于:搜狐科技区文章截图
其实冷数据这件事,归根到底我觉得还是消费者对于产品本身并没有多少了解,而消费主义时代,很多东西都没有被解释或者说曲解,当然消费者也未必有兴趣了解,这里也给自己挖个坑,以后有机会写篇文章,看看我觉得什么样的固态算是好固态。
至于上面截图,大家看着乐吧,还记得三星是最先爆出的问题吧?关于这次西数冷数据的问题,某些人就这样说起了三星~~~ 手 动 白 眼
镁光西数与谁争锋?DRAM短缺日益严重,利好NAND市场供需
在5G手机,云计算服务器,电动汽车和个人计算机等应用中,由于供应紧张和对存储芯片的需求不断增长,存储器价格正在上涨。
直至昨日下午美股收盘,镁光股价有明显变动,下跌3.57%,至90.90美元,道琼斯工业平均指数下跌0.46%至31,391.52。
与一些竞争对手相比,西部数据下跌了3.7%,意法半导体下跌了3.02%,英特尔下跌了2.61%.
Evercore机构将镁光目标价由105美元一股上调至135美元,分析师CJ Muse表示,DRAM短缺现象越来越严重,这会利好NAND市场。
BARRONS杂志的分析师埃里克·萨维兹(Eric J.Savitz)表示,由于DRAM市场的供应紧张,存储器市场价格正在上涨,需要加强更多的需求促进NAND市场和DRAM市场的供需环境的调和。
Wedbush分析师Matt Bryson在一份研究报告中写道:“尽管美国存储器公司也应该受益于NAND基本面的改善,但更新的前景主要与DRAM有关。”
由于华尔街分析师看到越来越多的证据表明,对NAND闪存和DRAM存储器芯片的需求增加表示看好。
NAND市场的战略意义
镁光和西数都是存储器和数据存储市场的大厂品牌,镁光主要以DRAM和NAND为主,西数以NAND为主。
在2019年,由于智能手机和PC制造商的出货量低迷导致芯片全球供过于求,镁光和西数两家公司也因芯片价格下降而苦苦挣扎,直至2020年逐渐趋于稳定逐渐复苏。
在2021年,镁光受益于疫情期间PC销量的增长,新型5G智能手机 和游戏机的生产以及数据中心客户的强劲订单,营收有所增长,在2021年第一季度,这些顺风顺水的推动其收入和调整后收益分别增长了12%和63%,其DRAM收入同比增长了17%,NAND收入增长了11%。
而西数由于疲软的NAND价格压低了闪存部门的利润,而其硬盘利润继续萎缩,其调整后的收益暴跌了37%。在截至2020年7月才增长了1%,达到167亿美元。即使到了2021年,西数的命运也没被改变,在这六个月中,WD的收入同比下降5%至79亿美元,这是因为其HDD业务疲软抵消了闪存收入的反弹。
由此可以看出,NAND市场的战略意义。如果西数当初没有收购闪迪,与铠侠合作,NAND市场的这杯羹难以分得一勺。
国内局势虽以DRAM市场最火热,但距离NAND市场的涨潮期不远了。
DRAM大厂目前仅一位有空?
业界人DRAM原厂以三星,SK海力士,镁光,南亚科和合肥长鑫为主,目前国外大厂中镁光和SK海力士产能受到影响,三星在德州奥斯汀的工厂也由于自然灾害停产,要到4月才恢复正常运营,最近宣布调整今年的DRAM投资计划,提高韩国平泽P2工厂第一季度12英寸晶圆的投片量,从3万/月提升至4万/月,年度DRAM投片量即将从6万片增加到7万片。
同时,三星计划扩张代工产能,将平泽P2工厂的5纳米生产线规模从现有的2.8万片增加到4.3万片。值得一提的是,三星将原本引入的计划用于DRAM制造的EUV光刻机改为代工使用,以因应5纳米代工迅速增长的需求。目前三星在中国西安工厂的计划尚未放出,但增加产能刻不容缓。
相关问答
如何看待 西数 认为中国厂商在 NAND 市场上的威胁意义不大?在NAND闪存市场上,三星、东芝、西数、美光、SKHynix及英特尔这六家公司占据了绝大多数份额,不过NAND闪存也是中国近年来发力追赶的重要领域,尤其是紫光旗下的...
西数 发布96层3D NAND UFS 2.1存储,你怎么看?2018年NAND闪存价格下跌,智能手机的存储容量也越来越大,今年皇帝版手机容量提升到了512GB,锤子科技的坚果R1还首发了1TB存储,中低端手机容量也达到了64GB,12...2...
三星980固态和西部sn570哪个好?升级版的SN570依然沿用SN550系列的产品设计风格,也是期待能像后者一样成为消费者攒机新选择。在主控和颗粒方面,SN570选用搭载西部数据自研主控和NAND闪存颗...
西数 sata绿盘固态怎么样?西数sata绿盘硬盘比较实用,性价比也比较高,支持sata3.0接口,数据传输速度也比较快。最高顺序读取速度能达到545兆每秒,比原有的机械硬盘快很多。这款硬盘还有...
东芝和 西部数据 现正研发128层3D NAND ,对此你觉得如何? 映众固态和 西数 固态哪个好?西数固态好。西数是数据存储业的排头兵,硬盘业的领头羊。在2015年的时候收购了闪迪以后,可以自己生产NAND颗粒,就保证了西数固态的闪存芯片都是原厂颗粒,品...
比QLC闪存还“渣”的PLC闪存即将浮出水面:用户还能接受吗?NAND闪存从SLC到MLC再到TLC,可以说一步步降低了成本,提升了容量,这是它们得以普及的关键。现在QLC闪存在这一年中发展迅猛,大有抢TLC风头的意味,而更渣的PLC...N...
如何看待英特尔失去全球最大半导体公司宝座?英特尔公司几年前宣称他们是世界上工艺最先进的半导体公司,工艺领先对手三年,这点有谁不服吗?英特尔靠着这一点在过去25年中垄断了全球第一半导体公司的宝座。...
长江存储能否顺利跻身全球 NAND Flash的「第一梯队」?NANDFlash全名为FlashMemory,属于非易失性存储设备(Non-volatileMemoryDevice),数据存储在这类设备中,即使断电也不会丢失。广泛用于eMMC/eMCP...
内存是金士顿好还是 西数 好?西数。在固态硬盘领域,肯定是西数的实力更强一些金士顿名气也很大,实力也很强,但是金士顿在NAND上多是自行切割与封装的,所以在闪存上都打着金士顿的...西...