从Nand特性谈其烧录关键点
为什么烧录Nand Flash经常失败?为什么烧录成功了,一部分Nand芯片贴板之后系统却运行不起来?…,等等,问了那么多为什么,那我反问一个问题:你了解Nand Flash的特性及其烧录关键点吗?
一、Nand flash的特性
1、位翻转
在 NAND 闪存是通过对存储单元(Cell)进行充电来完成数据存储的,存储单元的阈值电压就对应着数据值。当读取的时候,通过将它的阈值电压与参考点对比来获得其数据值。对SLC 而言,就只有两种状态和一个参考点。而对于2-Bits 的MLC 而言,它有4 种状态和三个参考点。TLC就更多状态和参考点。当读出的数据值与编程时数据值对应的阈值电压不相匹配时,表明数据发生了位翻转,就带来了可靠性问题。导致位翻转的最常见原因是“编程干扰”导致的阈值电压漂移。
2、存储结构
Nand 闪存由多个Block组成,每一个Block又由多个Page组成,Page的大小一般为512+16Bytes 、2K+64Bytes以及4096+128Bytes,Page是读取和编程的基本单位,而擦除的基本单位是Block。
NAND Flash的页,包含主区(Main Area)和备用区(Spare Area)两个域,“主区”也常称作数据区,备用区是保留区域,一般用来标记坏块(bad block)和存放ECC的值,当然有些文件系统使用备用区记录擦除次数、文件组织数据等。
图1.1 为页大小为2048+64的闪存存储结构
3、坏块及ECC
位翻转的发生是随机的,且比特误码的数量会随着擦写次数的增加而增加。但是只要比特误码的数量在ECC 能够纠正的范围内,数据的完整性就始终有保障。在有些点,每页的比特误码有可能很接近ECC 所能纠正的极限,NAND 的控制系统必须严防比特误码超过可纠错的范围,否则,就可能造成数据丢失或者系统无法正常工作。因此,这些块必须要标记为坏块。坏块永远不应该再用来存储数据。由于坏块的产生是不可避免的,NAND 制造商在对裸片测试时会选择对某些块进行坏块标记,而不是放弃整个裸片,所以大多数NAND 在出厂时就已经存在标记为坏块的块。如果一个NAND 的块被标记为坏块,那么NAND 的容量就永久性的减小了。
二、Nand系统裸片量产烧录的关键点
由于Nand flash芯片的特性,以其作为存储介质时必须对这些特性进行恰当处理,这样系统才能正常运行。系统设定各分区数据在Nand芯片的存储布局,并且在存储驱动层对Nand进行位纠错、坏块管理等处理,这些信息需要系统/驱动工程师明确。
研发阶段或小批量生产阶段,常采用在板烧录的方式,原理是将boot通过串口下载到内存跑起来,由boot从SD卡或网络将内核镜像、文件系统镜像等数据烧录到Nand flash芯片。
为了提高生产效率或别的方面考虑,会使用烧录器对Nand flash裸片进行量产烧录,由于烧录器厂家并不知道存储驱动层对Nand各种特性的处理方式,所以不加正确配置就进行烧录的话,往往出现以下情况:1. 烧录失败,经常是校验通不过;2. 烧录通过,但是部分芯片贴板之后系统运行不起来,或者运行起来某些模块出现一些错误与异常。这些大多不是烧录器本身的问题,而是裸片烧录Nand系统时几个重要的关键点没有处理好,或者说没有和目标系统相关处理一致。这些关键点包括:
1) 坏块处理策略
2) 分区(Partition)
3) 纠错码(Error Correction Codes,ECC)
当然,影响烧录的还有其他因素,比如备用区的使用情况、未用好快的格式化以及动态元数据等,但我们这里只讨论上面几个比较普遍的因素。
1、坏块处理策略
坏块一般是根据芯片的坏块标记位置进行识别的,而坏块处理策略定义了在遇到坏块时算法应该如何处理。策略算法负责将本来应该写到坏块的内容写到其它可选的好块中。最常用的坏块处理策略是跳过坏块,其他典型的还有带BBT的跳过坏块及预留块区等。
跳过坏块的处理策略是最基本最常用的坏块替换策略。当烧录中遇到坏块时,算法简单地跳过坏块,而将数据写入下一个好块。它会造成物理数据和逻辑数据的位置偏移,这通常需要分区来解决这个问题。
2、分区(Partition)
采用类跳过坏块的处理策略的Nand系统,常常会把存储区分成若干个不同的物理区域,这就是我们说的分区,概念上很像电脑硬盘的分区。使用分区使得你有能力确保你的数据可以存到预先指定的物理块区内,即便在这之前发现了一些坏块。这对一些底层软件组件比如启动引导程序和某些必须很容易定位的文件系统驱动程序来说,是非常有帮助的。
当使用跳过坏块的替换策略时,坏块会导致数据顺移到下一个好块。如果设置了分区,就可以指导烧录器确定数据的边界,确保数据文件不会侵占邻近的分区。
图2.2.1就是典型的嵌入式Linux系统的分区情况。
图2.2.1 典型的嵌入式Linux系统分区情况
3、纠错码(Error Correction Codes,ECC)
针对不同工艺、容量的NAND存储系统采用适当的ECC算法是应该的,要保证系统的可靠性,甚至是必须的。ECC纠错码一般存放在备用区中,对一整页或将页分成若干节的数据进行计算而得。数据烧录之前需要准备好ECC(硬件ECC除外),如果是纯数据则需要使用ECC算法来生成。Nand裸片量产中,知道ECC算法的纠错能力(纠错位数)是很重要的,因为要保证生产效率,烧录器如果采用ECC来进行校验数据是不实际的,而通过简单数据比对就可以知道数据的位翻转个数,如果翻转个数范围在ECC算法的纠错范围之内,则认为校验应该是通过的。
三、烧录定制
对于以上关键点或其它特殊部分,如果烧录器软件没有支持的相应的方案,需要联系原厂进行相关算法的定制,比如坏块处理方案、ECC方案等。
加入微信
更多内涵 你懂的 !
搜索微信公众号:电子产品世界
如何用SmartPRO 6000纠正NAND Flash烧录过程位反转?
摘要:关于使用烧录器烧录Nand Flash,一直都是很多用户头疼的难点,他们强调已经使用了正确的坏块管理方案,也制定了规范的操作流程,但是烧录的良品率还是无法提高,只能每天眼睁睁看着一盘盘“废品”被烧录器筛选出来!
近日某电子科技有限公司的客户邮件反馈:使用我们的SmartPRO 6000F-Plus烧录MICRON厂家的TSOP48封装的Nand Flash MT29F2G08ABAEA,不良率比较高,甚至达到了10%的烧录不良率,而烧录SAMSUNG厂家的TSOP48封装的K9F1G08U0E这颗芯片就不会有这种状况,由此可以确定烧录器与烧录座本身固件是没有问题的,所以客户怀疑应该是芯片算法有问题,需要我们重新优化下。
烧录器的功能很简单、很专一,那就是把数据完完整整、重复地复制到每一颗芯片上,复制成功了就提示Pass,复制失败了就提示Fail;SmartPRO 6000F-Plus是一台全心专注于高品质、高效率的Flash专用烧录编程器;目前为止,有广泛的、优秀的烧录客户群,软件、硬件和算法都是客户批量生产验证过的,非常成熟。
那问题究竟出在哪里呢,让我们继续看吧!
先友情提醒一下,我们的烧录软件做有一个监控“电子眼”(操作日记),时刻记录着客户对每颗芯片的烧录情况;客户有任何违规操作或者烧录异常现象,我们都可以迅速重返到“案发现场”,找到问题的根源;
我们第一时间让客户把操作日记发过来,从操作日记上看,客户反馈的现象确实存在,日志也帮助我们很快找到了这种异常:
但是这种现象并不是因为烧录器造成,而是芯片本身存在的工艺差异原因导致的;可能有人就会马上反驳,明显地出现如此高的烧录不良率,编程器原厂就没有任何责任,而是一句话就把问题推到芯片原厂?不要着急,继续往下看。
首先,我们普及一下Nand Flash的一个特性:位反转;Nand Flash由于本身硬件的内在特性,会导致(极其)偶尔的出现位反转的现象。所谓的位反转(bit flip),指的是原先Nand Flash中的某个位变化了,即要么从1变成0了,要么从0变成1了。而出现这种怪异的现象因素很多,主要是由以下一些原因或者效应所导致的:漂移效应(Drifting Effects)、编程干扰所产生的错误(Program-Disturb Errors)、读操作干扰产生的错误(Read-Disturb Errors);所以芯片原厂都是要求用户使用对应的ECC校验去解决这些位反转问题。
这种偶尔随机出现的位反转现象,对使用烧录器烧录Nand Flash的用户确实带来了头痛的麻烦,因为只要对芯片完成烧录之后,紧接着进行校验处理,若校验数据与源数据不同,烧录器立马就会提示报错,造成的直接后果就是不良品率一直居高不下;拿我们客户的案例分析,打开芯片数据手册查询到:MT29F2G08ABAEAWP需求ECC纠错算法:Minimum required ECC,4-bit ECC per 528 bytes;K9F1G08U0E需求ECC纠错算法:ECC regnirement,1 bit / 528bytes。所以这两个都有一定的概率出现位反转现象,而MT29F2G08ABAEAWP不良率较高,是因为MT29F2G08ABAEAWP出现偶尔随机的位反转的概率比K9F1G08U0E高好几倍。
对于专业的烧录厂家,对位反转现象当然也有专业的处理办法,今天就介绍一下我们SmartPRO 6000F-Plus特殊处理位反转的办法:“允许容错位”。
在对芯片作校验的时候,如果出现的位翻转的位数少于或者等于在“允许容错位”设置的数值,则烧录器认为校验正常,提示烧录成功;当然,用户设置的数值也必须是在自己使用的ECC计算方案纠正位数之内。提高烧录良品率,只需在烧录器上设置一个数值即可解决;后来客户反馈烧录一切正常,良品率也大大提高了,甚至几乎达到了100%,解决了大批量生产上的问题!
加入微信
更多内涵 你懂的 !
搜索微信公众号:电子产品世界
或用微信扫描二维码:
Copyright ©2000-2015 ELECTRONIC ENGINEERING & PRODUCT WORLD. All rights reserved.
相关问答
麻烦各位好基友你们谁清楚,福田IC 烧录 代工为您解决ic 烧录 难...[回答]编程仿真的时候说简单点其实是用PC机来模仿单片机那你要是做个电子时钟出来总不能带台PC机吧编好的程序编译过后会出现一个.HEX文件,这个就是烧录程...
860K点不亮肿么刷主板BIOS-ZOL问答2短内存ECC校验错误,在CMOSSetup中将内存关于ECC校验的选项高为Disabled就可以解决,如果不能,更换内存。3短系统基本内存(检查失败。更换内存4短系统时钟...
为什么我的目的端口是2304去百科看看2.光盘防盗版技术简介由于CD-ROM的档案结构是遵循ISO-9660的标准所制定的,而ISO-9660的档案结构不但公开且过于简单,因此很难加以保护...
赶集网租呗贷款通过了,但是点击提现就显示服务器接...- 汇财...[回答]建议您选择正规渠道办理,如:银行渠道。申请低于5万元的小额贷款,可先登录招行手机银行,点击“我的”-“全部”-“贷款”-“我要借钱”通过此界面尝...