报价
HOME
报价
正文内容
nand write坏块 固态硬盘进阶知识:专业名词篇(二)
发布时间 : 2025-02-23
作者 : 小编
访问数量 : 23
扫码分享至微信

固态硬盘进阶知识:专业名词篇(二)

前言——

在前段时间小编曾经发布了:固态硬盘知识进阶:专业名词篇。文内介绍了各类固态硬盘中可能会出现的比较晦涩和深入的名词,而很多朋友可能没听说过这些名词。如FTL、LBA、GC等。。。今天我们将剩下的一些名词再来说一下,给大家解读一下。

下面就来为大家解读这些名词。

目录:

一、预留空间(Over-provisioning,OP)

二、Trim

三、写入放大(Write amplification,WA)

四、坏块管理(Bad block management,BBM)

五、ECC - 校验和纠错

六、Interleaving - NAND 交叉存取技术

正文开场:

一、 预留空间(Over-provisioning,OP)

预留空间一般是指用户不可操作的容量,为实际物理闪存容量减去用户可用容量。这块区域一般被用来做优化,包括磨损均衡,GC和坏块映射。

第一层为固定的7.37%,这个数字是如何得出的哪?我们知道机械硬盘和SSD的厂商容量是这样算的,1GB是1,000,000,000字节(10的9 次方),但是闪存的实际容量是每GB=1,073,741,824,(2的30次方) ,2者相差7.37%。所以说假设1块128GB的SSD,用户得到的容量是128,000,000,000字节,多出来的那个7.37%就被主控固件用做OP了。

第二层来自制造商的设置,通常为0%,7%和28%等,打个比方,对于128G颗粒的SandForce主控SSD,市场上会有120G和100G两种型号卖,这个取决于厂商的固件设置,这个容量不包括之前的第一层7.37%。

第三层是用户在日常使用中可以分配的预留空间,像Fusion-IO公司还给用户工具自己调节大小来满足不同的耐用度和性能,而用户也可以自己在分区的时候,不分到完全的SSD容量来达到同样的目的。

预留空间虽然让SSD的可用容量小了,但是带来了减少写入放大,提高耐久,提高性能的效果。

二、 Trim

TRIM是一个ATA指令,由操作系统发送给SSD主控制器,告诉它哪些数据占的地址是”无效“的。

要明白什么是Trim和为什么它很重要,需要先知道一点文件系统的知识。

当你在电脑里删除一个文件的时候,操作系统并不会真正的去删除它。操作系统只是把这个文件地址标记为“空”,可以被再次使用,这意味着这个文件占的地址已经是“无效”的了。这就会带来一个问题,硬盘并不知道操作系统把这个地址标记为”空“了,机械盘的话无所谓,因为可以直接在这个地址上重新覆盖写入,但是到了SSD上问题就来了。

NAND需要先擦除才能再次写入数据,要得到空闲的NAND空间,SSD必须复制所有的有效页到新的空闲块里,并擦除旧块(垃圾回收)。如果没有Trim,意味着SSD主控制器不知道这个页是”无效“的,除非再次被操作系统要求覆盖上去。

这里要强调下,Trim只是条指令,让操作系统告诉SSD主控制器这个页已经“无效”就算完了,并没有任何其它多余的操作,对Trim后的优化其实是垃圾回收在干活。Trim能够减少写入放大,因为主控制器不需要复制已经被操作系统定义为“无效”的页(没Trim的话,主控就因为不知道,而认为这个页“有效”)到“空白块”里,这同时代表复制的“有效”页变少了,垃圾回收的效率提高了,SSD性能下降的问题也减弱了。

所以说Trim的奥秘在于它能大量减少“有效”页的数量,大大提升垃圾回收的效率。

相对于企业级市场,在消费级的SSD里,Trim显得更为重要,企业级的SSD大部分都带有相当大的OP(备用空间)空间,能够提升一部分的垃圾回收效率。而消费级SSD一般OP都比较小,所以需要Trim来保证垃圾回收的效率。

Trim指令只有在操作系统进行删除、格式化等操作时候才会发送。Trim指令目前还不支持发送给RAID阵列中的SSD。(操作系统下进行的软件RAID可以支持)。

Trim的支持需要3个要素:

1.SSD主控制器和当前搭配的固件需要支持Trim命令接收。

2.当前操作系统需要支持Trim指令发送。(Win7/2008R2及后续版本)

3.当前使用的磁盘驱动程序必须支持Trim命令传输。

只有同时满足以上3个条件,才能做到系统Trim命令发送,驱动传输Trim命令,SSD固件接收到传输来的Trim命令。

Trim目前不支持以下几种情况:(可能还有更多)

1. Trim目前不支持RAID阵列中的SSD。(操作系统下进行软件RAID除外)

2. Trim目前不支持磁盘镜像文件内操作。(VM等虚拟机软件使用的虚拟磁盘文件)

3. Trim目前不支持加密的文件系统。(以防止暴露加密文件系统信息)

三、 写入放大(Write amplification,WA)

因为闪存必须先擦除才能写入(我们也叫“编程“),在执行这些操作的时候,移动(或覆盖)用户数据和元数据(metadata)不止一次。这些多次的操作,不但增加了写入数据量,减少了SSD的使用寿命,而且还吃光了闪存的带宽(间接地影响了随机写入性能)。

早在2008年,Intel公司和Silicon Systems公司(2009 年被西部数字收购)第一次提出了写入放大并在公开稿件里用到这个术语。他们当时的说法是,写入算法不可能低于1,但是这种说法在2009年被 SandForce打破,SandForce说他们的写入放大是0.55。

最简单的例子,比如我要写入一个4KB的数据,最坏的情况就是,一个块里已经没有干净空间了,但是有无效数据可以擦除,所以主控就把所有的数据读到缓存,擦除块,缓存里更新整个块的数据,再把新数据写回去,这个操作带来的写入放大就是: 我实际写4K的数据,造成了整个块(1024KB)的写入操作,那就是256倍放大。同时带来了原本只需要简单的写4KB的操作变成闪存读取 (1024KB),缓存改(4KB),闪存擦(1024KB),闪存写(1024KB),造成了延迟大大增加,速度慢是自然了。所以说写入放大是影响 SSD随机写入性能和寿命的关键因素。

用100%随机4KB来写入SSD,目前的大多数SSD主控,在最坏的情况下写入放大可以达到20以上。如果是100%持续的从低LBA写到高LBA的话,写入放大可以做到1,实际使用中写入放大会介于2者之间。用户还可以设置一定的预留空间来减少写入放大,假设你有个128G的SSD,你只分了64G 的区使用,那么最坏情况下的写入放大就能减少约3倍。

影响写入放大的因素

许多因素影响SSD的写入放大。下面我列出了主要因素,以及它们如何影响写放大。

1. 垃圾回收(GC) Garbage collection ---

虽然增加了写入放大(被动垃圾回收不影响,闲置垃圾回收影响),但是速度有提升。这个比较特殊的算法用来整理,移动,合并,擦除闪存块来提升效率。

2. 预留空间(OP) Over-provisioning ---

减少写入放大,好。(预留空间越大,写入放大越低)在SSD的闪存上划出一部分空间留给主控做优化,用户不能操作的空间。

3. TRIM ---

开启后可以减少写入放大,好。一个ATA指令,由操作系统发送给SSD主控,告诉主控哪些数据是无效的并且可以不用做垃圾回收操作。

4. 可用容量 ---

减少写入放大,好。(可用空间越大,写入放大越低)用户使用中没有用到的空间,需要有Trim支持,不然不会影响写入放大。 (某些主控制器算法只支持对OP区垃圾回收,这样就不会影响)

5. 安全擦除Secure Erase ---

减少写入放大,好。清除所有用户数据和相关元数据,让SSD重置到初始性能。

6. 持续写入Sequential write ---

减少写入放大,好。理论上来说,持续写入的写入放大为1,但是某些因素还是会影响这个数值。

7. 随机写入Random writes ---

提高写入放大,不好。随机写入会写入很多非连续的LBA,将会大大提升写入放大。

8. 磨损平衡(WL) Wear Leveling ---

直接提高写入放大,不好。确保闪存的每个块被写入的次数相等的一种机制。

四、 坏块管理(Bad block management,BBM)

不管磨损平衡算法如何聪明,在运作中都会碰到一个头痛的问题,那就是坏块,所以一个SSD必须要有坏块管理机制。何谓坏块?

一个NAND块里包含有不稳定的地址,不能保证读/写/擦的时候数据的准确性。坏块分出厂坏块和使用过程中出现的坏块,和机械盘的坏块表一样(P表和G表),SSD也有坏块表。

出厂坏块的话,在坏块上会有标记,所以很容易就能被识别,后期使用中出现的坏块就要靠主控制器的能力了,一般来说,越到NAND生命的后期(P/E数开始接近理论最大值),坏块就会开始大量出现了。

一般来说NAND出厂都包含坏块,不过厂商有个最小有效块值(NvB-minimum number of valid blocks),拿Intel的34nm MLC L63B来说,1个die上4,096个块里至少要有3,936个块是好的,从这上面可以知道,虽然出厂的NAND可能有坏块,但是厂商保证在正常生命周期里,好块数不会低于3936个块。而且每个die的第一个块地址(00h)在出厂时是必须保证好的(ECC后,这个块必须有效)。

NAND出厂前都会被执行擦除操作,厂商会在出货前会把坏块标记出来(厂商会在坏块的第一个页的SA区上打上标记。) 这样坏块管理软件就能靠监测SA区标记来制作坏块表。

SA区(页中4096~4319的区域,用户不可访问,主要用来存放ECC算法,坏块信息,文件系统资料等。)由于在使用中会产生坏块,所以SSD的每次编程/擦除/复制等操作后都要检查块的状态。对颗粒的ECC要求也要达到厂商的标准以上(主控强不强,看ECC能力也是一个参考)。坏块管理和平衡磨损算法是必须的。

五、 ECC - 校验和纠错

ECC的全称是Error Checking and Correction,是一种用于Nand的差错检测和修正算法。由于NAND Flash的工艺不能保证NAND在其生命周期中保持性能的可靠,因此,在NAND的生产中及使用过程中会产生坏块。

为了检测数据的可靠性,在应用 NAND Flash的系统中一般都会采用一定的坏区管理机制,而管理坏区的前提是能比较可靠的进行坏区检测。

如果操作时序和电路稳定性不存在问题的话,NAND Flash出错的时候一般不会造成整个Block或是Page不能读取或是全部出错,而是整个Page中只有一个或几个bit出错,这时候ECC就能发挥作用了。

不同颗粒有不同的基本ECC要求,不同主控制器支持的ECC能力也不同,理论上说主控越强ECC能力越强。

六、 Interleaving - NAND 交叉存取技术

Nand Flash的访问操作过程包括三项:

访问操作 = 命令输入操作+I/O操作+Array传输操作

第一项的操作时间所占比例很小,在性能估算中可以忽略。

所以,通常认为:访问时间 = I/O时间+ Array传输时间

在上一代NANDFlash中,第一项占的比例最大,是第二项的4-5倍。

每一个Plane对应一个Page大小的缓冲(dataregister)和一个Page大小的缓存(cacheregister)。数据写入的顺序是:I/O-> cache register -> data register ->Plane(数据读出的顺序刚好相反)。

缓冲(dataregister)与缓存(cacheregister)之间的数据传输速度很快,dataregister可以把I/O操作和Array操作分隔开,形成I/O操作和Array操作的“两级流水线”。

4个Plane对应4组缓冲与缓存,每一组可以分别操作。2个Plane交替操作,可以实现“乒乓操作”,达到2倍的Array访问带宽。4个Plane交替操作,可以实现“乒乒乓乓操作”,达到4倍的Array访问带宽。

交错操作可以成倍提升NAND的传输率,因为NAND颗粒封装时候可能有多Die,多Plane(每个plane都有4KB寄存器),Plane操作时候可以交叉操作(第一个plane接到指令后,在操作的同时第二个指令已经发送给了第二个plane,以此类推),达到接近双倍甚至4倍的传输能力。

结语:

到这里,名词篇就结束了,后面小编会为大家介绍固态硬盘和机械硬盘的接口这方面的知识,为很多迷糊的小伙伴梳理一下什么是SATA,什么是NVM-e,什么是PCI-E,什么又是ACHI、IDE等等。敬请期待哦~!

对于本文你有什么看法或建议呢?欢迎留言哦~!

非易失性的存储介质(flash)——存储器

Flash是一种非易失性的存储介质,主要分为Nor和Nand两种。其中Nor Flash又分为Series(串行)和Parallel(并行)两种。SPI Flash就是Series Nor Flash。Nor Flash主要用于存储容量小的场景。其特点是读取速度快,擦除与写操作慢;Nand Flash容量大,读写与擦除速度快,主要用于需要大容量存储的场景。

1 Nand Flash

1.1Nand Flash的特点

由于Nand Flash生产工艺的原因,出厂芯片中会随机出现坏块。坏块在出厂时已经被初始化,并在特殊区域中标记为不可用,在使用过程中如果出现坏块,也需要进行标记。芯片厂商保证出厂时,Block 0不为坏块,但在使用过程中可能损坏。对于坏块而言,存储的信息可能会丢失,不能正常使用。另外在Nand Flash擦除或者编程过程中,出现操作失败后,表示该块不能正常使用,也应标记成坏块。所以在一般情况下,在操作NAND Flash之前,先要检查一下要操作的是否是坏块,以免坏块标记被破坏。此外,为了保证存储信息的可靠性,从Nand Flash中读取的数据还可以引入ECC校验,ECC码一般存放在该页的spare区。

1.2 Nand Flash的空间结构

NAND FLASH是一种多维的空间结构,一般由block,page等结构组成。所以在有的文件系统中就衍生出各种分区信息和扇区信息等。Nand Flash的page中包含有spare区。一般用于存储坏块信息,如芯片出厂时的坏块标志,或者使用过程中产生的ECC等。

1.3 Nand Flash的坏块处理

常见的坏块处理方式为跳过坏块(Skip bad block)

2 Nor Flash

2.1 Nor Flash的特点

Nor Flash的特点是读取速度快,擦写操作慢,不存在坏块,数据保存安全。

3经验案例

3.1 Nor Flash中不要使用memcpy而要使用flash read接口

原因:尽量使用统一接口操作flash,避免出现数据不一致的情况。

3.2 使用cramfs/squashfs做根分区,有些机器不能正常启动

原因:使用Nand Flash时,必须考虑坏块的因素。某些文件系统,如cramfs、squashfs,本身不带有坏块处理,在遇到根文件分区有坏块时,就不能正常启动。解决方法:在Linux驱动层增加针对cramfs、squashfs的坏块处理补丁。

3.3 使用Nand Flash其中存储数据概率性被破坏

原因:Nand Flash容易出现位反转,当反转的数据超过ECC所能纠正的范围后,数据就无法恢复。解决方法:1)确认使用的Nand Flash支持的ECC bit数,确保CPU支持。2)在某些平台(STH237系列),使用硬件ECC算法,需要增加特别补丁,来支持squash等文件系统。3)使用UBI文件系统,UBI针对nand flash的支持较好,本身也有针对坏块的处理。

3.4 EMMC需考虑分区表

常规flash通常采用类似下面的命令更新uboottftp 82000000 u-boot.bin;mmc write 0 82000000 0 8000对于emmc,采用上面的命令后, 重启后发现无法启动盒子, 原因是需要给分区表预留512字节, 所以采用下面的命令:tftp 82000000 u-boot.bin;mmc write 0 82000000 1 7fff3.5 MT8637 EN9高温开关机出现死机问题

3.5 东芝Flash与镁光Flash差异

目前,公司所用到的4GB的Nand Flash有Toshiba:4701-T58BG0-0480Micon: 479B-M29BG2-0480在设计时需要注意第38脚,东芝工程师确认38Pin需要接3.3V上拉,否则有可能引起不稳定,导致片内很多坏块;而镁光规格书里的38pin是DO NOT USED,不能使用的。因此,在BOM中这两个物料不能作为替代料,如果BOM中两颗料都有的话,需要通过选择条件进行区分开。

相关问答

我的u盘是TOSHIBA TRANSMEMORY 8GB的 “磁盘被写保护” 不能...

2、查看HKEY_LOCAL_MACHINE\SYSTEM\ControlSet002\Control\与HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Contro...

U 盘肿么去掉写保护,前提是U盘上没有带锁键,肿么用软件去掉-Z...

如果U盘没有物理的写保护开关,但又提示无法写入文件,那你就要考虑U盘是否已经损坏了。有没有保护锁?没有的话就去低级格式化我用的是HA-LLFTOOL...

固态硬盘该如何挑选?

金泰克S300120GBSSD参考价:299元质保期:三年质保推荐理由:价格便宜、国产老牌子金泰克S300120GBSSD采用业界流行的全金属设计,通体金属,能够较大...除.....

oracle数据库打不开遇到ora-00600[4193]错误要怎么处理呢?-ZO...

ORA-600[4193]的成因与ORA-600[4194]类似,是ORACLE发现redo重做记录与rollback/undo回滚/撤销数据不匹配。当进程在校验undoblock中的undo...

把exe文件的打开方式改为Symantec Ghost Explorer怎么还原

在菜单中点击Local(本地)项,在右面弹出的菜单中有3个子项,其中Disk表示备份整个硬盘(即克隆)、Partition表示备份硬盘的单个分区、Check表示检...

 山田信夫  那女人作词那男人作曲 
王经理: 180-0000-0000(微信同号)
10086@qq.com
北京海淀区西三旗街道国际大厦08A座
©2025  上海羊羽卓进出口贸易有限公司  版权所有.All Rights Reserved.  |  程序由Z-BlogPHP强力驱动
网站首页
电话咨询
微信号

QQ

在线咨询真诚为您提供专业解答服务

热线

188-0000-0000
专属服务热线

微信

二维码扫一扫微信交流
顶部