硬件 nand ecc 神奇的ECC，可将内存的成本进一步降低

神奇的ECC，可将内存的成本进一步降低

高端消费产品、网络和工业系统等内存密集型应用程序正面临着成本压力，这促使工程师寻找在提高性能的同时降低系统成本的新方法。错误码校正(ECC)是NAND闪存中维护可靠性和延长内存寿命的关键技术。为了在市场上实现基于NAND闪存的系统有更好的效率，与集成ECC的架构相比，开发人员更加倾向于在主机MCU中实现ECC架构。

本文将探讨集成的和基于主机的ECC之间的差异，比较一下每种方法对系统性能、可靠性和最终成本的影响。

ECC

简单说一下什么叫ECC。ECC内存即纠错内存，简单的说，其具有发现错误，纠正错误的功能，一般多应用在高档台式电脑/服务器及图形工作站上，这将使整个电脑系统在工作时更趋于安全稳定。

内存在其工作过程中难免会出现错误，而对于稳定性要求高的用户来说，内存错误可能会引起致命性问题。内存错误根据其原因还可分为硬错误和软错误。硬件错误是由于硬件的损害或缺陷造成的，因此数据总是不正确，此类错误是无法纠正的；软错误是随机出现的，例如在内存附近突然出现电子干扰等因素都可能造成内存软错误的发生。

当为一个系统选择闪存时，开发人员可以在NAND和NOR技术之间进行选择。NAND单元比NOR单元小，所以NAND的每位成本比NOR内存低。这反过来导致NAND闪存比NOR闪存可用的密度更高。此外，与NAND相比，NOR单元背后的物理原理导致了更长的程序擦除(P/E)时间。由于这些优点，NAND正以越来越快的速度被采用。

传统上NAND闪存的缺点是耐久性和读取性能较慢。随着时间的推移，NAND单元磨损或失去保持程序值的能力，将影响内存位转换状态。当一个块（Block）开始磨损时，它的数据可以转移到另一个块。随着单元的退化，为了防止数据丢失，我们便采用ECC技术。

ECC使用冗余来验证存储的数据是否与写入到内存的数据相匹配。此外，当检测到错误时，为了确保更高的数据完整性，ECC可以对每个块的错误数量进行修正。当超过某个错误阈值时，数据被移动到一个新块上。废弃的块被标记为“bad”，再也不会使用。因此，NAND闪存与ECC结合就可以提供高可靠性应用程序所需的完整性水平。

然而，由于ECC生成和检查需要时间过程，因此它会影响吞吐量和系统成本，这取决于它是如何实现的。通常，ECC可以与内存本身集成或由主机处理器在外部管理。集成方法有两种配置:

一种是单模方法，其中ECC是内存die的一部分，另一种是双模方法，其中控制器IC(具有串行接口和ECC)与内存die合并。在基于主机的方式下，ECC支持MCU NAND flash控制器去访问NAND。内存制造商提供的这三个选项允许OEM为他们的应用程序选择最佳的折衷方案。

一种灵活的ECC方法

将ECC集成到NAND闪存，具备了直接由存储器芯片本身管理ECC的优势。然而，尽管这种方法在某种程度上简化了系统设计，但代价是较高的内存成本和较低的读取性能。与主机处理器中使用的更高的内部时钟频率相比，闪存中较慢的内部时钟导致了读取性能的降低。

集成了ECC之后就增加了NAND闪存设备的大小和复杂性，因此内存成本会更高。考虑到一个8位ECC的硬件实现有大约50K。这表示对一个简单内存控制器的门数（gate count）(3000K)有~1.7%的影响。然而，如果集成在NAND存储器上，影响会在10-15%之间，并且会使存储器的成本增加更多。对于使用多内存设备的大内存需求系统，将ECC与NAND内存集成意味着要多次支付额外成本，而不是基于主机MCU一次性支付ECC。

此外，读取性能也有所下降，因为集成ECC会增加延迟，每个内存读取的时钟率低于主机控制器可以处理ECC检查的时钟率。下图显示了NOR flash、集成ECC的NAND flash以及基于主机的ECC的NAND flash的读取吞吐量比较。可以看出，集成ECC的NAND闪存的性能不到NOR闪存的一半。然而，当ECC是基于主机的时候，NAND闪存的读取性能几乎翻倍，几乎与NOR闪存持平。

当检测到错误(并纠正错误)时，基于主机的ECC提供了更好的性能。下图显示了错误对读取第一数据时间(RFDT)的影响。通过集成ECC, RFDT从45微秒增加到70微秒。对于基于主机的ECC, RFDT要好得多，仅从35微秒增加到45微秒。

闪存芯片NOR Flash、NAND Flash傻傻分不清楚 ICMAX帮你搞定

通过前天的文章介绍，我们知道eMMC 是 Flash Memory 的一类，eMMC的内部组成是NAND flash+主控IC，那什么是Flash Memory、NOR Flash、NAND Flash，宏旺半导体就和大家好好捋一捋它们几者之间的关系。

Flash Memory 是一种非易失性的存储器。在嵌入式系统中通常用于存放系统、应用和数据等。在 PC 系统中，则主要用在固态硬盘以及主板 BIOS 中。另外，绝大部分的 U 盘、SDCard 等移动存储设备也都是使用 Flash Memory 作为存储介质。

1. Flash Memory 的主要特性

与传统的硬盘存储器相比，Flash Memory 具有质量轻、能耗低、体积小、抗震能力强等的优点，但也有不少局限性，主要如下：

需要先擦除再写入

Flash Memory 写入数据时有一定的限制，它只能将当前为 1 的比特改写为 0，而无法将已经为 0 的比特改写为 1，只有在擦除的操作中，才能把整块的比特改写为 1。

块擦除次数有限

Flash Memory 的每个数据块都有擦除次数的限制（十万到百万次不等），擦写超过一定次数后，该数据块将无法可靠存储数据，成为坏块。

为了最大化的延长 Flash Memory 的寿命，在软件上需要做擦写均衡（Wear Leveling），通过分散写入、动态映射等手段均衡使用各个数据块。同时，软件还需要进行坏块管理（Bad Block Management，BBM），标识坏块，不让坏块参与数据存储。（注：除了擦写导致的坏块外，Flash Memory 在生产过程也会产生坏块，即固有坏块。）

读写干扰

由于硬件实现上的物理特性，Flash Memory 在进行读写操作时，有可能会导致邻近的其他比特发生位翻转，导致数据异常，这种异常可以通过重新擦除来恢复，Flash Memory 应用中通常会使用 ECC 等算法进行错误检测和数据修正。

电荷泄漏

存储在 Flash Memory 存储单元的电荷，如果长期没有使用，会发生电荷泄漏，导致数据错误，不过这个时间比较长，一般十年左右，此种异常是非永久性的，重新擦除可以恢复。

2. NOR Flash 和 NAND Flash

根据硬件上存储原理的不同，Flash Memory 主要可以分为 NOR Flash 和 NAND Flash 两类。主要的差异如下所示：

· NAND Flash 读取速度与 NOR Flash 相近，根据接口的不同有所差异；

· NAND Flash 的写入速度比 NOR Flash 快很多；

· NAND Flash 的擦除速度比 NOR Flash 快很多；

· NAND Flash 最大擦次数比 NOR Flash 多；

· NOR Flash 支持片上执行，可以在上面直接运行代码；

· NOR Flash 软件驱动比 NAND Flash 简单；

· NOR Flash 可以随机按字节读取数据，NAND Flash 需要按块进行读取。

· 大容量下 NAND Flash 比 NOR Flash 成本要低很多，体积也更小；

（注：NOR Flash 和 NAND Flash 的擦除都是按块块进行的，执行一个擦除或者写入操作时，NOR Flash 大约需要 5s，而 NAND Flash 通常不超过 4ms。）

2.1 NOR Flash

NOR Flash 根据与 CPU 端接口的不同，可以分为 Parallel NOR Flash 和 Serial NOR Flash 两类。

Parallel NOR Flash 可以接入到 Host 的 SRAM/DRAM Controller 上，所存储的内容可以直接映射到 CPU 地址空间，不需要拷贝到 RAM 中即可被 CPU 访问，因而支持片上执行。Serial NOR Flash 的成本比 Parallel NOR Flash 低，主要通过 SPI 接口与 Host 连接。

图片： Parallel NOR Flash 与 Serial NOR Flash

鉴于 NOR Flash 擦写速度慢，成本高等特性，NOR Flash 主要应用于小容量、内容更新少的场景，例如 PC 主板 BIOS、路由器系统存储等。

2.2 NAND Flash

NAND Flash 需要通过专门的 NFI（NAND Flash Interface）与 Host 端进行通信，如下图所示：

图片：NAND Flash Interface

NAND Flash 根据每个存储单元内存储比特个数的不同，可以分为 SLC（Single-Level Cell）、MLC（Multi-Level Cell）和 TLC（Triple-Level Cell）三类。其中，在一个存储单元中，SLC 可以存储 1 个比特，MLC 可以存储 2 个比特，TLC 则可以存储 3 个比特。

NAND Flash 的一个存储单元内部，是通过不同的电压等级，来表示其所存储的信息的。在 SLC 中，存储单元的电压被分为两个等级，分别表示 0 和 1 两个状态，即 1 个比特。在 MLC 中，存储单元的电压则被分为 4 个等级，分别表示 00 01 10 11 四个状态，即 2 个比特位。同理，在 TLC 中，存储单元的电压被分为 8 个等级，存储 3 个比特信息。

图片： SLC、MLC 与 TLC

NAND Flash 的单个存储单元存储的比特位越多，读写性能会越差，寿命也越短，但是成本会更低。下图中，给出了特定工艺和技术水平下的成本和寿命数据。

相比于 NOR Flash，NAND Flash 写入性能好，大容量下成本低。目前，绝大部分手机和平板等移动设备中所使用的 eMMC 内部的 Flash Memory 都属于 NAND Flash，PC 中的固态硬盘中也是使用 NAND Flash。

3. Raw Flash 和 Managed Flash

由于 Flash Memory 存在按块擦写、擦写次数的限制、读写干扰、电荷泄露等的局限，为了最大程度的发挥 Flash Memory 的价值，通常需要有一个特殊的软件层次，实现坏块管理、擦写均衡、ECC、垃圾回收等的功能，这一个软件层次称为 FTL（Flash Translation Layer）。

在具体实现中，根据 FTL 所在的位置的不同，可以把 Flash Memory 分为 Raw Flash 和 Managed Flash 两类。

图片： Raw Flash 和 Managed Flash

Raw Flash

在此类应用中，在 Host 端通常有专门的 FTL 或者 Flash 文件系统来实现坏块管理、擦写均衡等的功能。Host 端的软件复杂度较高，但是整体方案的成本较低，常用于价格敏感的嵌入式产品中。通常我们所说的 NOR Flash 和 NAND Flash 都属于这类型。

Managed Flash

Managed Flash 在其内部集成了 Flash Controller，用于完成擦写均衡、坏块管理、ECC校验等功能。相比于直接将 Flash 接入到 Host 端，Managed Flash 屏蔽了 Flash 的物理特性，对 Host 提供标准化的接口，可以减少 Host 端软件的复杂度，让 Host 端专注于上层业务，省去对 Flash 进行特殊的处理。eMMC、SD Card、UFS、U 盘等产品是属于 Managed Flash 这一类。

看完这篇文章，相信对Flash memory都会有一个全面的了解，无论是其原理，还是NOR Flash 和 NAND Flash、Raw Flash 和 Managed Flash 之间的异同，欢迎关注宏旺半导体，会持续带来存储领域更专业的文章。