北京2017年4月14日电 /美通社/ -- 2017年3月,英特尔发布的面向台式机的英特尔® 傲腾™ 内存模块(16GB和32GB),将从4月24日起上市。在半导体技术驱动下,计算机性能沿着摩尔定路突飞猛进,然而,仍旧逃离不开“存储”的瓶颈制约,拖累整个系统性能提升缓慢。使用闪存(NAND)加速的想法一直都在,Wintel都有尝试,今天,傲腾(Optane)将有机会改变这一切。
虽然已经有了数十年的历史,但是冯·诺依曼1946年提出的计算机体系架构,仍是现在乃至可见的未来,计算机所遵循的基本架构体系:存储和计算。CPU是大家所熟悉的计算核心,但是并非冯·诺依曼体系中的计算核心,按照大学计算机原理课老师所说,CPU非常笨,它只会做“1+1”这一件事,而且只会从A、B寄存器取数、结果放到C寄存器,冯·诺依曼体系中的计算是指ALU(数逻运算单元)而存储是寄存器。当然,这是最狭义的冯·诺依曼体系理解,不过也从侧面说出了计算和存储相依相存的特殊关系。
速度快当然是王道,但是非常遗憾,半导体技术发展到今天,仍然不能解决容量和性能的根本矛盾,考虑到成本和实现因素,最终的产品都是性能向成本的妥协。历史上看,谁能将两者的平衡点向性能或容量任一端推动,定将带来世界的巨大改变。SRAM到DRAM、闪存盘对软盘/光盘、SSD对HDD,以及刚刚面世的Optane。
快慢设备的衔接
“多点润滑、少点摩擦”,这是海湾战争期间的著名润滑油广告。而对于计算机来说,高速和低俗设备之间,对获取数据方面的摩擦一直没有停止过,解决这种数据冲突的方式也在革新。
以速度最快的ALU为例,与之进行数据交换的寄存器有着相同速度的寄存器,除去在相邻周期里循环存取的时间周期不算,两者实际上是同频同步工作的。寄存器有着动辄数GHz的运行速度,只能集成在离ALU最近的地方,但代价是成本高昂、容量以字节为单位精打细算,这就是为什么如AVX 2.0中的256位指令/数据寄存器,英特尔更壕一些,直接放入256位长,而AMD抠门些,旗舰的Ryzen 7 1800X只有128位寄存器,256位数据需要两个周期读入和写出,性能折损极大。当然,处理器厂商们早已注意到这个问题,n年前就大肆引入Cache结构作为从寄存器到内存的梯级缓冲,用数量和逐渐提高的速度解决计算单元从内存获取数据的性能落差。L1、L2、L3 Cache容量通常为数十KB、数百KB和数MB,对应容量提升一个级别,速度也降低一个级别,以匹配慢速的GB级别内存。为了保证速度,Cache通常会采用SRAM(静态内存)制作,而内存虽然用了DRAM速度低了不少,但当年正是DRAM的出现,让配有64KB内存的PC有机会诞生,要知道同容量的SRAM当时价格超过2500美元,而第一台PC的不过1999美元。
类似的情况也出现在“存储”设备上,虽然以硬盘(HDD)为代表的存储设备已经是外设“矬子里面的将军”,但是它和PC系统之间的性能落差仍然很大,其性能包括了带宽和响应延迟等两个维度的速度。于是另一种缓存,Buffer出现了。别看中文都是“缓存”,但是在计算机词汇中,Cache和Buffer是两个不同世界的速度,相比多采用SRAM的Cache,Buffer多使用廉价的DRAM以缓解I/O接口两侧的速度不匹配,最常见的情形是Buffer容量作为HDD的重要参数标识产品档次。无论是哪种缓冲,都能在响应时间和带宽上同时匹配两端性能,两端都认为对方迁就了自己的性能水准,而没有察觉到缓冲的加入,此现象就叫透明。
容量与性能的分歧
经过多级缓冲,DRAM的速度已经远远落后于CPU,但即便如此,它仍远远高于主流的存储设备。更具体点说,单通道DDR4-2400内存带宽已近20GB/s、延迟为30ns左右,而容量已突破10TB的HDD,对应的性能水准只略微增长到150MB/s~200MB/s带宽,延迟则停留在3~4ms(接口)+7~8ms(平均寻道)的10年前水平,明显不能满足当下电脑系统的需求。于是这才有了近几年最有效的升级已经从增加内存变为了更换HDD为SSD。SSD综合性能较HDD已经有了质的飞跃,主流产品接口带宽突破1GB/s水平、延迟下降到μs量级,但与之伴随的就是10倍的价格差异。
无论是容量还是性能,对使用体验的影响都是显而易见的。在预算有限的前提下,考虑到时间可以换取性能而容量不行,更多数消费者都倾向于容量更大而非性能更高,这也就是为何仍有超过85%的台式电脑选择HDD作为唯一存储设备的原因。但凡预算宽裕一些,或者性能的需求稍占上风,双硬盘就成为更为理想的搭配。现实是很残酷的,艰难的预算增加,并不能带来如一的性能体验,频繁使用的数据固然可以手动放置到SSD中,但是相对较小的容量被占满后,越是大量的数据,越会深刻体会到“慢”的熬人,小容量SSD对此无能为力。
能够弥合电脑与HDD性能落差、解决SSD与HDD容量落差的Optane来了。
横空出世
SSD的出现,可谓是近年来存储领域最大的技术革新。以高速旋转的磁碟片为基础的HDD,数十年来维持在温彻斯特架构下几乎没有变化,无论是体积缩小还是容量增加,都不能很好地解决速度问题,哪怕是即将到来的热辅助磁存储技术,也只是帮助容量大幅提升而对性能的提升仍是隔靴搔痒,机械原理限制了HDD性能质的升级。SSD核心的改变正在于以半导体取代机械,ms进入μs、MB/s提升到GB/s。按下葫芦起来瓢,SSD让成本和耐久性问题浮出水面,NAND的存储介质可谓“万恶之源”。
NAND是闪存(Flash)中最主要的类别,具有读写耐久性随制程提升下降、性能随制程提升下降等固有特性,特别是为了在有限的晶圆(成本)上获得更大容量,制程和单元结构升级一直没有停止过,如今NAND已经进入10nm时代、TLC渐成主流,反观其耐久性艰难维持在2000次左右,延迟和介质性能改进缓慢。
2015年,英特尔正式发布了名为3D XPoint的全新非易失性存储技术,这就是横空出世的Optane傲腾;与英特尔合作生产相关产品的美光,则将其命名为QuantX。3D XPoint或者说Optane与NAND/NOR等Flash完全不同,而更接近于内存,延迟、耐擦写性、介质速度等几个关键指标也优于NAND几个数量级,未来发展潜力巨大,英特尔的目标是用其扩大仅有5%左右的SSD市场份额。
Optane的非易失性和性能优势,使其可在计算机系统中扮演多种甚至是任何存储角色:内存、存储和缓存,分别对应Optane DIMM、Optane SSD和Optane Memory,从而改变整个计算机存储发展进程。目前后两类产品已经上市。
为了获得极速的存储,一种名为RAMDisk的产品已经问世多年。它采用单位容量昂贵的DRAM为存储介质,使系统用访问硬盘的方式访问它,性能当然是内存水平的,而容量也是内存水平的数GB。显然,这样的容量水平对PC都不够用,何况这样的“硬盘”还要面临掉电数据丢失(易失性)的问题,使用时先要从硬盘读取数据、关机前人工将数据写回硬盘,可用性不佳。今天,Optane SSD已经具有了RAMDisk的性能却有着数TB的超大容量和非易失性,后者已经没有继续存在的意义。
Optane Memory则是比NAND更为理想的缓存材料,更高的耐久性和ns级的响应速度,比当年英特尔涉足缓存领域的TurboMemory所使用的SLC NAND表现优1~3个数量级,更别提如今漫天的TLC产品了。性能改善之余,32GB的超大容量早已突破系统缓冲的需求,甚至作为超高性能的SSD也不为过(想想Optane SSD的表现),它更大的作用是为Windows以外的更多应用和数据进行缓冲和优化,实用性远超当年512MB的TurboMemory产品。只要用上英特尔200系列的芯片组和7代酷睿处理器,Optane Memory的延迟水平直逼DRAM。想象一下有否体验过内存的延迟水平或速度不足,没有吧?未来“硬盘”也不会再有今天烦人的等待,与内存同速。
关键词: