快讯
HOME
快讯
正文内容
nand设备算法 前景可观的存算一体技术,到底有多难商用?
发布时间 : 2025-02-25
作者 : 小编
访问数量 : 23
扫码分享至微信

前景可观的存算一体技术,到底有多难商用?

没有一家公司的存算一体技术解决方案受到广泛的市场认可。

最近,随着5G商用和云计算需求的迅猛增长,建设新一代适用各类AI场景的大规模数据中心成为各大运营商和巨头公司接下来的工作重点,其中,提升性能和降低成本是大家最为关心的话题之一。

今年年初阿里达摩院发布了2020年十大科技趋势,它认为存算一体是突破AI算力瓶颈的关键技术。 因为利用存算一体技术,设备性能不仅能够得到提升,其成本也能够大幅降低。

然而尽管存算一体技术方向广受认可,英特尔、Arm、微软等公司也均参与到该技术方向的投资,也有多家公司给出了可行的存算一体解决方案,但有一个不争的事实是,没有一家公司的存算一体技术解决方案受到广泛的市场认可。

简单来说,虽然“存算一体”概念很容易理解,即计算与存储两个模块的融合设计以实现对数据的高效处理,但落到场景和商业发展推进过程中,它面临的产业矛盾和难处远超业内的想象。

存算一体技术有多复杂?

存算一体技术虽然极具前景,但其实非常复杂,因此很多大公司都选择投资初创公司来完成这件事,而不是自己从头去开发。

如美国著名的存算一体AI芯片初创公司Mythic,因其在存内计算芯片(IPU)有显著的研究进展,在2019年刚刚结束的B+轮融资中,它就受到了软银、美光等投资者的支持,此前它还获得了美国国防部的资金支持。此外,美国另一家专注于语音识别的存算一体AI芯片初创公司Syntiant,它的背书者们——微软、英特尔、亚马逊、博世等,也是广泛分布在计算和存储领域的巨头公司,甚至高通也邀请Syntiant来做可穿戴设备芯片的语音解决方案。

在国内,现在在这一领域有所探索的,包括知存科技、闪亿半导体、忆芯科技等,也都是初创公司。

可以看见,大公司更倾向于选择“站队”,在巨头们中,除了下游大力推进基于ReRAM的存内计算方案的台积电,IBM是唯一公开自己存算一体技术布局的公司。

在相变存内计算方面,IBM已经有了多年的技术积累,因此它也可以代表整个存算一体技术产业的先进水平。但尽管在核心部件PCM器件上有了十余年的研究积累,并且IBM在2016年就透露了其关于存内计算的研发计划,提出了混合精度内存计算的新概念,至今为止,IBM也只发布了基于该项技术的8位模拟芯片,定位是处理深度神经网络。

与传统芯片相比,该芯片在成本和功耗上有非常显著的改进,包括存储与计算模块之间的通信成本也大大降低了,但是它的弱点也很明显:因为AI训练需要保持梯度计算的保真度和权重更新,现有AI芯片大多在16位精度以上,8位的精度看起来是没有办法广泛使用的。

这也很让人怀疑,费了大力气研发出来的全新架构芯片,到底能不能走出实验室?

不得不直面的“困境”

存算一体技术商用真的那么难?

受计算机冯·诺依曼计算机体系架构影响,计算和存储一直以来是相互分离的设计。但是随着大数据时代的到来,以数据为中心的数据密集型技术成为主流系统设计思路,我们的关注点也不再仅限于数据的计算和加工,而更为看重的是对数据的“搬运”,即从根本上消除不必要的数据流动,这催生了计算与存储的融合(存算一体)。

简单来说,在传统计算机的设定里,存储模块是为计算服务的,因此设计上会考虑存储与计算的分离与优先级。但是如今,存储和计算不得不整体考虑,以最佳的配合方式为数据采集、传输和处理服务。这里面,存储与计算的再分配过程就会面临各种问题,而它们主要体现为存储墙、带宽墙和功耗墙 问题。

以存储墙问题为例,因为计算与存储各自独立演进,且传统的观点认为计算系统性能受限于计算能力,因而过去几十年产业界在计算方面的投入巨大。有数据显示,过去二十年,处理器性能以每年大约55%的速度提升,内存性能的提升速度每年只有10%左右。结果长期下来,不均衡的发展速度造成了当前的存储速度严重滞后于处理器的计算速度,内存瓶颈导致高性能存储器难以发挥应有的功效,遭遇了所谓的存储墙问题。

因此,存算一体技术的提出不仅仅要打破人们对传统存储和计算的认知,它还要解决这些已有的“历史遗留”问题,实现存算之间更加低成本的“无缝对接”。

目前,业内提出了几种可行的技术解决方向,其中计算型存储、存内计算、3D堆叠和类脑计算 颇受关注,但究竟哪一种可行,众说纷纭。

图 | 3D堆叠

以现在最为火热的存内计算技术来说,为了推动这项技术的发展,近两年的芯片设计顶会ISSCC已经为其设立了专门的议程,同时2019年电子器件领域顶级会议IEDM有三个专门的议程共二十余篇存内计算相关的论文。

其实存内计算的核心思想很简单,就是把带权重加乘计算的权重部分存在内存单元中,然后在内存的核心电路上做修改,从而让读出的过程就是输入数据和权重在模拟域做点乘的过程,相当于实现了输入的带权重累加,即卷积运算。而同时,由于卷积运算是深度学习算法中的核心组成部分,因此存内计算非常适合AI,对未来AI芯片的存算一体和算力突破都有帮助。

但是不同于传统的数字电路计算,存内计算是用模拟电路做计算,这对存储器本身和存内计算的设计者都是一个全新的、需要探索的领域,IBM所研究的正是这个方向,里面的难度可想而知。

不仅如此,随着数据量的加大,功耗、存算之间的通信等方面都需要变革,以通信的硬件实现工艺来看,是采用光互联技术还是采用3D堆叠的新型封装实现高性能互联,这就是一个大问题,因为采用不同的技术将会导致整体解决方案天壤之别。

AI芯片公司还是存储芯片公司,存算一体技术应该由谁来做?

可以说,现在对于业内而言,树在大家面前的首要问题就是达成技术方向上的共识,而想要达成技术共识之前,可能大家首先要解决的是,存算一体到底由AI芯片公司来做还是由存储公司来做?

由AI芯片公司来做,技术方向更多偏向于计算型存储或类脑计算,而由存储公司来做,存内计算方向则会更容易被发展和推动。

上文介绍的存内计算是从存储的角度去做计算上的融合,尤其伴随SSD产品(由NAND flash构成)的兴起,因嵌入了ARM核和DRAM,NAND flash、ARM和DRAM、控制器和内部总线实际上构成了一个计算机系统,这让存储产品本身就可以做计算任务,因此也为存算一体提供了发展平台。国内就有诸多初创公司在探索这个方向,尤其是由于AI的引入,各种数据的Key-Value只要直接存储在硬盘里,AI需要的数据就可以自动完成分类,可以显著提升非关系数据库的性能。

而计算型存储则是将存储做到计算芯片上,如现在很多处理器公司都在做片上存储这件事,IBM设计的Blue Gene Active Storage(BGAS)结点就是一种‘存储上的计算’系统,每一个BGAS结点包含32个处理器,每个处理器通过PCIe接口连接2TB的SLC NAND非易失闪存介质,大致就是这样一个思路 。

当然不仅仅如此,超越冯·诺依曼架构之上,人的大脑就是一个典型的存储计算系统,而仿照人脑的仿生系统也被认为是最有可能颠覆现有技术的终极发展方向。

作为电子复兴计划的一部分,DAPRA看中的就是这个更高级的系统——通过将电子元件编程为离散阻值状态并将不同权重的电子元件相互卷积以建立一个类似突触和神经元的系统,即神经拟态计算,又被称为类脑计算。此前,国内清华大学类脑计算团队打造的“天机芯”就是被称为异构融合类脑计算芯片,复旦大学也在单晶体管逻辑架构上有突破性的进展,为存算一体发展奠定了技术基础。然而需要指出的是,DAPRA团队在这项研究上已经涉及了超过1800种混合材料,其难度之高可想而知,而后面架构搭建等都是商用道路上必须要迈过去的坎,因此可以说,类脑的存算一体系统遥不可及。

尽管类脑遥不可及,退回到现有的芯片设计上,存算一体的挑战也是十分之多,如器件方面,现有的浮栅器件存储就不适合存内计算;在芯片的工艺上,存算一体的设计和流片周期都将会很长,甚至连现有的EDA工具,目前尚没有支持存算一体设计的。

总体来看,存算一体有IBM、知存科技等数十家大大小小企业在投入和探索,它们广泛分布在存储、计算等领域里,几大技术方向也都在发展中。但是因可探索的方向很多,且没有人知道哪一种是最适合商用的方向,可以说整个市场还处在早期的百家争鸣状态。

降低成本,市场驱动存算一体

说到这里,可以发现存算一体的未来商用发展前景是极其不明晰的。但看向应用端,存算一体的市场发展驱动却是非常强烈的。

以数据中心为例,百亿亿次(E级)的超级计算机成为各国比拼算力的关键点,为此美国能源部启动了“百亿亿次计算项目(Exascale Computing Project)”,希望于2021年至少交付一台E级超算;中国则联合国防科大、中科曙光和国家并行计算机工程技术研究中心积极开展相关研究,计划于2020年推出首台E级超算。但要想研制E级超算,科学家面临的挑战之中首当其冲的就是功耗过高问题。

随着速度和性能要求的不断提高,如果按现有设计方法,通过不断增加处理器数量来研制超算,其体型和规模会越来越大,数据在存储器和处理器之间进出所耗费的功率会越来越多。以现有技术研制的E级超算功率高达千兆瓦,需要一个专门的核电站来给它供电,而其中50%以上的功耗都来源于数据的“搬运”, 本质上就是冯·诺依曼计算机体系结构计算与存储的分离设计所致。

如何降低功耗成为超算中心必须要解决的问题,各国科学家都在致力于降低超算功率,其中一些可行的技术方案包括让存储器更靠近计算器,减少数据行进距离;让高性能存储器向三维扩展而不是朝二维延伸;超算与闪存的结合等,而这些都隶属于存算一体的技术方向。

另一方面,在边缘计算和物联网端,因存算一体能够大幅提升性能和降低功耗, 因此也被大家寄予厚望。

当然,不仅仅是成本,如阿里达摩院在发布的技术报告所言,AI的出现与存内计算格外匹配,存算一体也将会改善现有的AI算力瓶颈。

更多优质内容,请持续关注镁客网~

新增NAND写入算法:跳过坏块并重建坏块表

宝剑锋从磨砺出,梅花香自苦寒来;

博观而约取,厚积而薄发。

有心的小伙伴可能在最新的软件版本里会看到,写入NAND时增加了一个新的算法:跳过坏块并重建坏块表

以海信5079板,MSD6A801芯片方案为例,先给大家演示RT809H写入NAND新算法。

先找一片坏块较多的Nand芯片,按方向放入RT809H编程器,锁好锁紧座。

点智能识别,选择NAND Falsh,稍等会自动识别到相同ID的芯片型号。

识别出两个芯片型号,选择跟芯片型号一致的K9K8G08U0D@TSOP48。

我们先点一下坏块检测,看看此芯片的坏块分布(坏块检测会破坏NAND芯片内数据,谨慎使用)。

检测到23个坏块,严格来说,基本算是残次品。

点设置,出现三个选项,硬拷贝;跳过坏块并重组数据;跳过坏块并重建坏块表。此板请选择“跳过坏块并重建坏块表 ”。

点写入,选择备份文件,开始自动写入。

可以看到界面上已经显示算法为“跳过坏块并重建坏块表”。

开始写入,耐心等待。。。

写入完成,接下来对写入后的NAND芯片进行验证,先把NAND芯片装回电视板卡。

连接上串口,同时监控打印信息。

通电,看到正常进入系统。同时监控显示画面,直到启动完成。

操作遥控,各项功能正常!

由于NAND使用领域的多样性和NAND自身的特殊性,坏块管理都不尽相同,就拿电视主板来说,我们通过大量板卡测试,和大量时间做了深入研究,发现不同的电视厂家,使用的坏块管理算法都不同,我们特此汇总了三种不同的算法,经过测试已经解决了目前在中国能够见到的电视主板NAND写入问题

NAND_AUTO读写芯片时,符合ONFI标准的芯片,读写成功率较高,比如海力士、镁光、ST、华邦等,而三星、东芝等厂商未加入此标准化组织,所以有可能参数识别错误导致读写后不能用,请提交NAND_AUTO读取得到的ID给我们,添加对应的芯片型号即可解决问题

国外用户如果遇到NAND读写问题,请提供好的板卡给我们测试。

没有哪种算法可以解决所有NAND复制问题,只能是遇到问题再研究新算法来解决问题。iFix爱修一直致力于为维修行业解决难题。

最近发现大家都在问一个比较实际的问题:RT809H以后会不会想其他编程器厂家一样,相同封装、不同型号的NAND芯片,使用不同的转接座?转接座的写入次数是多少?

这里是正式回答:RT809H编程器写入所有TSOP48封装的NAND芯片,只需要TSOP48通用座就可以了,永远不会限制写入次数!

视频演示,腾讯视频网址: https://v.qq.com/x/page/h0737szc7xu.html

学习课程已更新,欢迎大家进入学习。

入口:公众号首页-精选-案例直播;

目前课程观看已使用专属APP,

支持苹果、安卓手机以及电脑,

微信授权登录即可,

详见微信及QQ通知。

相关问答

固态硬盘上的3D NAND 是什么?-ZOL问答

3DNAND是相较于2DNAND而言的,而2DNAND其实也就是闪存颗粒,又称闪存,是一种非易失性存储器,即在断电的情况下依旧可以保存已经写入的数据,而且是以固定的区块...

slc是什么意思?

作...不过,由于每个MLC存储单元中存放的资料较多,结构相对复杂,出错的几率会增加,必须进行错误修正,这个动作导致其性能大幅落后于结构简单的SLC闪存。存储...

如何看待三星宣布量产eMRAM?

eMRAM是eFlash的替代者eFlash(嵌入式闪存)从SLC、MLC、TLC一路发展到OLC,密度越来越高,寿命越来越短,全靠主控和算法进行复杂度越来越高的补偿为其续命。...eF...

华为新手机拆解出来什么?

2.屏幕:包括显示器驱动电路、触控层、显示器接口等。3.摄像头模块:包括摄像头芯片、光学元件、滤光片等。4.指纹识别模块:包括指纹传感器和指纹识别算法等...

980pro和980有什么区别?

三星980固态硬盘没有采用旗舰980PRO所采用的最新PCIe4.0接口,但主控采用全新设计,支持NVMe1.4协议、闪存使用和980PRO同款的新一代1xx层堆叠V-NAND闪存,利用...

如何评价慧荣发布最新的主控SM2271?

SM2271具备先进的闪存管理算法和数据完整性保护,可确保SSD的可靠性和耐久度,它支持端到端数据路径保护和SRAM/DRAM的ECC,高级数据处理器固件/软件可保护数据...

如何根据u盘固件相关主控参数对译码表修复u盘,提取数据 - 15...

U盘数据恢复软件的详细步骤如下:1)准备:先将U盘通过数据线连接电脑,显示可移动硬盘。2)打开【互盾数据恢复软件】,选择逗U盘手机相机卡恢复地功能按...

三星SSD 850PRO性能-ZOL问答

NAND的寿命差别巨大,主控的算法上性能优化、寿命优化都不是一回事而EVO被人诟病的是TLC卖MLC的价格!所以本来不算差的产品口碑根本不行有用(0)回复三星的8...

华为的技术为什么领先世界这么多?

从网上报道的资讯来看,华为在全世界手握多项领先世界的技术,比如5G、芯片等,至于原因,主要和任正非早期的明确战略布局有很大关系,因为任正非很清楚,企业要...与...

长江存储的3D NAND FLASH量产了吗?

虽然赵伟国昨日刚刚辞去清华紫光集团旗下紫光控股与紫光国芯两家子公司董事长及董事职务,但是他仍然是紫光集团董事长。今日(4月9日)赵伟国公开亮相于中国深圳...

 香港暴徒  痔血胶囊 
王经理: 180-0000-0000(微信同号)
10086@qq.com
北京海淀区西三旗街道国际大厦08A座
©2025  上海羊羽卓进出口贸易有限公司  版权所有.All Rights Reserved.  |  程序由Z-BlogPHP强力驱动
网站首页
电话咨询
微信号

QQ

在线咨询真诚为您提供专业解答服务

热线

188-0000-0000
专属服务热线

微信

二维码扫一扫微信交流
顶部