多维度深入剖析QLC SSD硬件延迟的来源
之前谈到QLC的背景和SSD延迟相关的话题:
PLC SSD虽来但远,QLC SSD火力全开
如何快速debug定位SSD延迟问题?
本文主要针对QLC SSD本身硬件底层延迟来源进行剖析,看看是否有新奇的发现。
如之前文章的介绍,目前NAND已经从SLC发展到PLC,但是PLC离大规模上市还有一段距离,我们暂时先略过。市面上主要流通的就是4种NAND类型:SLC、MLC、TLC、QLC。随着每个寿命从高到低依次是SLC>MLC>TLC>QLC.
随着单个cell含有的bit数越多,NAND的可靠性也会有所降低。同时写延迟也在不断地增加。SLC写延迟在0.5ms级别,到QLC写延迟达到10-20ms,40倍的差距。这也导致QLC SSD性能出现很大的下降。
在评价SSD性能指标的时候,我们通常会提到顺序读写带宽,随机读写IOPS,这些指标与NAND之间的关系是怎么样的呢?延迟的来源有哪些?
(1)NAND Read Page时间影响SSD读性能
Host从SSD读数据,最终数据的来源也是要从NAND die上读取,对NAND die发送Read Page操作,数据返回。这个过程的耗时直接决定了SSD读性能的好坏。下图是某个比较老的NAND SPEC相关读操作的示意图,仅供参考。
(2)NAND Program Page时间影响SSD写性能
Host向SSD写入数据,数据最终的归宿是NAND die。数据写入NAND的时间依赖NAND Channel和Plane的设计,更重要的是需要依赖NAND die本身program page的时间,这个过程的耗时直接决定了SSD写性能的好坏。下图是某个比较老的NAND SPEC相关写操作的示意图,仅供参考。
比如下图是在去年ISSCC展示的不同场景QLC SSD性能的对比。其中,我们可以关注到Program Latency(tPROG)的时间,跟Program Throughput写带宽有直接的关系。同样的Plane配置下,Program Latency(tPROG)的时间越小,Program Throughput写带宽就会越大 。
(3)NAND Block Erase的时间也会影响SSD读写性能
下图是SSD写入page的简单示意图。当数据以4KB大小随机写入时,最左边的die的第一个block已经写满了,包括了有用数据或者invalid无效数据。
在SSD FW内部GC启动的策略下,最左边die的第一block的有效数据被搬迁到空闲的数据块block。同时该block开始执行Erase操作。此时,如果我们要读取在这个die的数据A的时候,因为同一颗die正在进行erase操作,就会导致A数据读操作无法执行(同时,如果同一个die或者plane有读操作进行,此时读取同一个die和plane,也会产生冲突,影响读性能),需要等待erase操作完成。最终导致读的延迟里面有多了一个erase block的操作,读性能就会看到一个抖动。
在GC的另外一种状态,SSD内部没有空闲的block,需要等待GC搬迁数据和擦除数据,腾出空闲的数据块,这个过程,erase的操作也影响到写性能。假如我要写入一个4KB的数据Z覆盖A,并恰好目标块没有空余的页区,需要进行GC回收。这个时候就需要把B、C、D、E、F五分数据都搬走,然后擦除整个数据块,擦除完成后再整体写入6个数据页。这个整个过程,Host虽然只写了4KB的数据,但实际过程中,由于GC的问题,NAND最终写入了24KB。那么写放大WAF=24KB/4KB=6. 这整个过程写延迟和写放大都受到了很大的影响。
扩展阅读:SSD写放大的优化策略要统一标准了吗?
(4)NAND其他特性对SSD读写性能的影响
比如要增加写性能,做法是在NAND array Bit Line方向增加plane的并发度,多个page一起写。另外,也可以通过减少Bit line的长度来降低RC延迟,这样可以提升读的性能。
同时,NAND ONFI接口的速率也会影响性能,目前常见的接口速率2400MT/s, 3200MT/s, 3600MT/s。
(5) ECC纠错对SSD读性能的影响
在host读取数据过程中,最理想的情况是一个Page Read Time的时间就可以直接返回数据。但现实情况是,我们可能会因为一些不想看到的问题,导致性能受损。
比如读写之间的温度差、Data Retention、读干扰、写干扰等。导致出现数据翻转,需要启动Read Retry重读机制、LDPC纠错、RAID纠错等修复机制。这个过程就会导致性能出现跌落或者延迟抖动。
在QLC SSD中,因为Vt level之间的电压差更狭小,访问同一个区域的扫描电压影响会更大,更容易引发读干扰的问题。
同样的,Data Retention也比较明显,读写温度差异对QLC NAND的更加敏感。
扩展阅读:SSD可靠性分析前传之NAND闪存可靠性概览
(6) 3D-NAND工艺对SSD性能的影响
目前业内3D-NAND工艺架构主要分为两个阵营,一个阵营,以Solidigm(Intel NAND卖给海力士后新成立的公司)为首,采用Floating Gate(FG)浮栅,另外一个阵营三星/WD等,采用Change Trap Flash。FG浮栅将电荷存储在导体中,而CTF将电荷存储于绝缘体中,这消除了单元之间的干扰,提高了读写性能,同时与浮栅技术相比减少了单元面积。不过,FG浮栅对read disturb和program disturb的抗干扰比CTF要好。
FG浮栅架构在Program过程,采用4-16 program算法,这个过程可以减少program disturb写干扰。
CTF架构,或者叫做RG架构,采用16-16 progam算法,两次program都要求所有page直接写入NAND,第一次program电压是放置在最终电压附近。CTF的Data Retention相对比较严重。
在写性能方面的对比,不同的架构有不同的表现。
在TLC NAND中,CTF架构tPROG比FG浮栅低18%,所以在TLC SSD中,CTF架构TLC NAND SSD的性能比FG架构TLC NAND SSD性能要好。在QLC NAND中,由于program算法差异的影响,FG浮栅表现更好,FG架构QLC NAND SSD性能比CTF架构QLC NAND SSD性能要好。再搬出这个QLC SSD性能对比图,同样4plane的QLC SSD,采用FG架构的Intel QLC SSD写延迟tPROG=1.63ms比采用CTF架构的SK Hynix写延迟tPROG=2.15ms要低。
不同的NAND工艺架构,在不同的维度各有千秋,对维度对比,供大家参考。
扩展阅读:3D-NAND向500层进发,天花板在哪里?
结语
不同的FW架构设计、FTL算法设计、NAND die plane/速率等的差异,都会直接影响SSD的性能与延迟,设计一块性能优越且稳定的SSD,是一项繁琐但具有很强艺术性的工程 。
精彩推荐:
漫谈固态硬盘SSD全生命周期的质量管理如何快速debug定位SSD延迟问题?汽车存储SSD面临的挑战与机遇超大规模云数据中心对存储的诉求有哪些?SSD写放大的优化策略要统一标准了吗?阿里云Optane+QLC存储实践案例分享“后Optane时代”的替代存储方案有哪些?浅析数据中心存储发展趋势浅析PCIe链路LTSSM状态机浅析Relaxed Ordering对PCIe系统稳定性的影响实战篇|浅析MPS对PCIe系统稳定性的影响浅析PCI配置空间浅析PCIe系统性能PLC SSD虽来但远,QLC SSD火力全开Backblaze2022中期SSD故障质量报告解读最全电脑固态硬盘SSD入门级白皮书存储随笔《NVMe专题》大合集及PDF版正式发布!加权循环仲裁WRR特性对NVME SSD性能有什么影响?Linux NVMe Driver学习笔记之9: nvme_reset_work压轴大戏NAS入坑难、门槛高?遇到问题难解决?—威联通NAS入门指南
本内容来源于@什么值得买APP,观点仅代表作者本人 |作者:Looklike
创作说明
近年来我发现NAS越来越普及,更多的玩家也选择入坑NAS来组建自己的私人服务器。NAS虽然能带来不少方便,但它的使用确实是有一定门槛的,而且不少新玩家在安装使用的过程中多多少少都会遇到这样那样的问题。我本人也是威联通NAS用户,发现论坛之类相关问题解答对比其他产品还是比较少,本次就罗列几个安装使用过程中可能会用(遇)到的小知识、问题及解决方法,希望能为大家提供方便!
创作态度
希望大家快速上手,帮助大家找到NAS使用过程中疑难杂症的解决办法,轻松建立属于私人的小型服务器。
创作目录
1.在同一局域网内Qfinder 无法搜索到NAS
2.常见系统安装失败故障情况
3.admin密码忘记或有admin密码但是登录不上
4.关于静态卷-存储池-卷的概念
5.Raid迁移
6.创建高速缓存加速
创作正文
本文以威联通TS-453D为例,为大家讲解以上各个应用的使用技巧。TS-453D是威联通的2020旗舰,作为一款4盘位NAS,它的性能十分强悍,处理器为 Intel Celeron J4125四核心2.0GHz处理器,DDR4内存容量可扩展至8GB(两个SO-DIMM插槽),拥有2个USB 3.2 Gen.1和3个USB 2.0和一个HDMI 2.0,支持4K 60hz视频输出。该系列均有一个PCIe2.0插槽,玩家可弹性选择万兆网卡、M.2 SATA SSD、M.2 NVMe SSD、无线网卡以及独立显卡等拓展卡进行配置。
我用的硬盘是希捷的酷狼2T硬盘,为什么选这个盘呢?它是为多用户环境和高工作负荷率而设计, 健康管理、持续监控和用户警报功能让酷狼的可靠性风评不错,而且系统扩展性也很好。
而且2020年9月1日起,希捷酷狼全产品线标配3年的原厂数据救援服务,说白了就是万一出了问题,希捷提供免费救数据的服务。只要出厂日期在2020.1.1之后的盘都能享受,希捷那边还会安排人员上门取货。感觉希捷还是信心十足,不然也不会提供如此服务。
以下正式进入内容:
1.在同一局域网内Qfinder 无法搜索到NAS
Qfinder搜索到NAS,除了电脑 和 NAS 需要在同一个局域网内之外,还需要在同一个网段(IP的前三位数要一样,最好让电脑和NAS接在同一个交换机或路由器); 如果有安装杀毒软件或防火墙,请先关闭杀毒软件和防火墙,比如360之类。
再者就是有可能是某个程序占用了Qfinder必要的8097 port了,可以用这个指令 :netstat -aon -b | find /i "8097" ,找到port 8097 对应的PID
需要以管理员的身份运行cmd,在cmd中运行指令,复制-切换到cmd-Ctrl+v-回车,即可出现以下界面:
这里port 8097 对应的PID 是 9060
接下来打开任务,管理器,点击详细信息,找到9060对应的进程
找到占用port 8097的进程,关掉占用port 8097的程序即可。因为我这台电脑Qfinder 是可以正常搜索到NAS 的所以 PID 9060 对应的程式 是 Qfinder 。
如果还是搜索不到,开启路由器的DHCP、换一个路由器或交换机、安装一个低版本的Qfinder、尝试用其他电脑看是否可以用Qfinder搜索到NAS,都可以试一试,还不行的话那可能就真的有问题了。
2.常见系统安装失败故障情况
⑴ 浏览器通过IP 地址登录 NAS 后,页面是白色的,没有看到下一步按钮。
处理建议:浏览器兼容性问题,建议使用谷歌或火狐浏览器;如果浏览器有极速模式(比如360浏览器),可以将当前的浏览器切换为极速模式也可以。
⑵ 系统安装完成NAS重启后仍提示需要初始化安装
处理建议:在电脑上安装一个putty软件,通过ssh 连接登录NAS ,下 dmesg 命令,看是否有报硬盘I/O错误,如果有抓到硬盘I/O错误,说明是硬盘问题导致的系统安装失败,就需要更换硬盘了;也有新硬盘就有问题的
[ 384.930259] Buffer I/O error on dev sda1, logical block 530116, async page read
[ 384.937749] Buffer I/O error on dev sda1, logical block 530117, async page read
[ 384.945238] Buffer I/O error on dev sda1, logical block 530118, async page read
[ 384.952723] Buffer I/O error on dev sda1, logical block 530119, async page read
[ 385.509891] Buffer I/O error on dev sdb1, logical block 530116, async page read
[ 385.517397] Buffer I/O error on dev sdb1, logical block 530117, async page read
[ 385.524898] Buffer I/O error on dev sdb1, logical block 530118, async page read
[ 385.532388] Buffer I/O error on dev sdb1, logical block 530119, async page read
⑶ 确定硬盘是好的或者硬盘之前是在电脑上用过的,系统安装完成NAS重启后仍提示需要初始化安装
在电脑上安装一个putty软件,通过ssh 连接登录NAS ,下 fdisk -l 命令 ,发现这颗硬盘的分区格式还是之前的NTFS格式,不是 NAS 所需要的 ext4/ext3 格式。
处理建议:直接用命令删除硬盘上的分区,fdisk –d all /dev/sdx (慎用),看容量大小,就可以知道哪颗盘对应哪个/dev/sdx,删除完成后,关机NAS,取下硬盘,先无盘开机 ,开机完成后,再热插回硬盘,开始安装系统;或将这颗硬盘接回电脑,计算机-管理-磁盘管理,删除这颗硬盘上的所有分区,然后接回NAS,再开始安装系统。
3.admin密码忘记或有admin密码但是登录不上
⑴ reset复位(3秒)
每台机器后面都有一个reset孔,(用细铁丝/回形针或牙签)按3秒“嘀~”一声然后松开,会初始化admin密码, 为默认的密码和网络设定 ,其他设定都不变。
注意:长按10秒除了保留所有的数据,NAS会重置所有的系统设置
⑵ reset 3秒 后 还是无法登录
关机NAS ,拔掉所有的硬盘(硬盘顺序做好标记),然后空开机(就是不插任何硬盘开机)
开机完成后,用SSH工具登录NAS(默认密码)
Windows 电脑,可以在电脑上安装一个Putty SSH工具,如果是Mac ,Mac上自带terminal SSH终端
⑶ 热插上所有硬盘
⑷ 执行挂载命令 /etc/init.d/init_lvm.sh
⑸ 执行复位 账号档/密码档 命令
注意:这2条命令下去后,之前建立的其他账号全部被清空,只剩下admin账号了
⑹ 重启NAS,重启完成后就可以用默认账户密码进行登陆了。
4.关于静态卷-存储池-卷的概念
硬盘在NAS中,必须要建立好静态卷或存储池,就是我们常说的要先做好磁盘分区,才能在卷上建立共享文件夹,才能存放资料。
⑴ 静态卷和存储池的区别(我们是直接建立静态卷 还是要先建立存储池?)
1. 直接建立静态卷的读写速度性能要高于存储池。
2. 静态卷上只能有一组RAID,而存储池可以由多个RAID组成。
3. 静态卷上不能建立快照,如果有快照需求的必须用存储池,而且需要预留快照空间。
4.静态卷建立完成后,直接在静态卷上建立共享文件夹即可;而建立好存储池后,还需要在存储池上建立厚卷或精简卷,在厚卷或精简卷上再建立共享文件夹。
♦考虑到今后容量扩充和快照需要,一般建议建立存储池
⑵ 厚卷和精简卷的区别
厚卷:此为预设选项,相比静态卷速度约慢5~10%,立即配置,VM相关建议使用此格式,兼具弹性及效能
精简卷:相较Static volume约慢30%,可弹性配置容量,建议纯存储使用
厚卷: 可用空间=总空间-已经配置规划的空间
精简卷 : 可用空间=总空间-已实际使用空间
厚卷,已经配置的空间就不能用于其他地方了,可用空间就会马上减少,即使没有用完,也不能作为其他配置使用,比如1T的存储池,建立了一个500G的厚卷,那么再建立厚卷时,可用空间是1T-500G=500G
精简卷,比如1T的存储池,建立了一个500G的精简卷,那么再建立精简卷时,可用空间是1T。如果之前建立的500G的精简卷里已经放了100G的数据,那么那么再建立精简卷时,可用空间是1T-100G=900G
基于简单不复杂,一般习惯性使用厚卷
如果只想建立一个厚卷,这里可以调至最大
⑶ 三种卷类型简单区分
静态卷:随机文件访问性能最佳,最多比厚卷快百分之二十左右.推荐一般家用户或者中小型企业选择.
厚卷:具备快照功能(主要目的防止勒索病毒,或者恶意删除),调整卷容量方便.常规用途都可以选择.
精简卷:精简卷按需要使用空间,即只有将数据写入时才占用存储池空间.需要注意的是,不能在精简卷上创建基于文件的LUN.(一般使用此种卷类型较少.相对静态卷与厚卷优势并不明显)
5.Raid迁移
注意:
♦为避免raid迁移过程中发生意外,比如停电、硬盘突然损坏等情况,可能会造成数据丢失或者损坏,建议raid 迁移之前先备份数据。
♦raid迁移所选硬盘会进行初始化,所以一定要再三确认所选硬盘数据不需要或者完全新盘。
♦raid迁移只支持raid升级,不支持降级.比如:单盘情况可以迁移为raid 1,raid 1可以迁移到raid5等,而raid 5不支持迁移到raid1,单盘也不可以直接升级到raid 5,只能先迁移到raid 1之后,再迁移到raid 5。
♦raid迁移所选单块硬盘容量不可以低于当前raid阵列中单块硬盘的最小容量。
⑴ 打开控制台-存储与快照总管-存储空间-存储/快照,选中需要raid迁移的存储池或者静态卷,鼠标右键点击管理
⑵ 在新操作页面打开:管理-迁移
⑶ 在新操作页面选中迁移硬盘,然后应用(会提示所选硬盘会被初始化并清除所选硬盘数据,原有卷或存储池数据不受影响)
6.创建高速缓存加速
1 打开 存储与快照总管-存储空间-高速缓存加速
2 点击 “+”开始创建向导
⑶ 直接进入下一步
选择组建高速缓存加速的ssd磁盘-高速缓存类型(raid类型为单独则选择”只读高速缓存,”raid类型为其他raid 1等可选择读写高速缓存).
选择完成后进入下一步,为需要的卷启用高速缓存加速即可。
总结
NAS是个好东西,还是不太希望因为一些小问题导致玩家放弃或者被拒之门外。
我也会继续更新一些相关文章,希望能够帮助到更多的朋友~(觉着用得上或者感兴趣的朋友劳烦您小手一抬点个关注收藏再走 )
以上,我们下次再见!
相关问答
【 page 怎么读】作业帮[最佳回答]page生词本高频词,一定要记住哦!英[peɪdʒ]美[pedʒ]n.页;(计算机的)页面;年史;重要事件vt.标记…的页数;翻页;喊出名字以寻找;(在公共传...
【"readthefollowingpassageandtranslatetheunderlinedsente...[回答]阅读下面的段落,并翻译划线的句子.
【Readthepassage的意思】作业帮[回答]阅读文章阅读这篇文章阅读这篇文章passage['psd]Read1.读取readthepassage读篇文章readthepassage的意思是阅读文章阅...
Google Assistant的 Read It新功能有何特点?谷歌于今日宣布了一项名叫“阅读”(Readit)的GoogleAssistant增强技能。顾名思义,它可以帮助用户大声朗读网页文章、博客、或者短篇小说。在浏览相关网页...
英语翻译讲课时用的口语.下面请将报纸翻到第N版,你们将有N分...[回答]Now,plsturntopageN,andfinishthereadinginNminutes.Plsreaditcarefully,Ihavesomequestio...
【中文翻译英文简从书架上拿了一本杂志,开始东一页西一页地随...[回答]JaneCongshujiashangtookamagazine,startedtheEast1West1tocasuallyread.
英语翻译我想把这句话写在新买的书上,来提醒自己要坚持读书...[回答]IsweareverynightIreadtenpagesIwillnotgotobedEverynightIswearIdonotread10-pageb...
后面还有更多精彩内容,请翻页.英文翻译_作业帮[回答]TherewillbemoreandmoreWonderfulcontent,pleasepaging.
sds- page 和 page 的异同点?一、主体不同1、sds-page:是以聚丙烯酰胺凝胶作为支持介质的一种常用电泳技术。2、PAGE:是在不加入SDS和巯基乙醇等变性剂的条件下,对保持活性的蛋白质进行...
网页出现error怎么解决?重启浏览器1关闭当前浏览的网页。2关闭网页后,同时也关闭浏览器,并把网页的地址复制下。3再次打开浏览器,输入我们刚才浏览的网面地址,查看是否解决。END利...