电子工程专辑
UBM China

GDDR5X显存技术规范转正,A/N中端卡带宽问题有救了

上网日期: 2016年01月27日 ?? 作者: Luffy整理 ?? 我来评论 字号:放大 | 缩小 分享到:sina weibo tencent weibo tencent weibo


打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

1.扫描左侧二维码
2.点击右上角的分享按钮
3.选择分享给朋友

关键字:GDDR5X? 显存技术规范? JESD232?

JEDEC固态技术协会日前正式发布了JESD232 GDDR5X SGRAM显存标准规范。这意味着,美光研发的这种过渡性显存规格正式成为行业通用技术。

虽然全新GDDR6的研发工作好多年前就开始了,但是因为技术、市场各方面的原因,仍然遥遥无期,于是美光通过简单粗暴地把数据预取位宽从8-bit翻番到16-bit,就得到了更高的带宽,初期即可达10-12Gbps,后期能提升至16Gbps。相比之下,GDDR5现在最高也才7Gbps。

美光研发的GDDR5X《电子工程专辑》

GDDR5X选择采用双管齐下的方式来提升显存带宽。首先,它的总线从DDR(双倍数据倍率)升级到了QDR (四倍数据倍率)。

SDR、DDR和QDR之间的数据传输速率差异《电子工程专辑》
SDR、DDR和QDR之间的数据传输速率差异

需要说明的是,SDR(单倍数据倍率)即只利用时钟信号的上沿来传输数据;而DDR(双倍数据倍率)则同时利用了时钟信号的上沿和下沿来传输数据,这意味着系统可以在同样的时间内、同一时钟频率下将传输数据的速率提升一倍;而QDR(四倍数据倍率)则在DDR的基础上,进一步提供独立的写入接口和读取接口,以此达到四倍之于SDR的数据传输速率。

JEDEC公布的规范中,GDDR5X目前的带宽为10-14Gbps,搭配256-bit位宽的话总带宽就会有320-448GB/s,而当前的第一代HBM带宽为512GB/s。

传输速率的提升再加上显存位宽的提升,相当于在提高车速的基础上又拓宽了车道数量。

简单举个例子吧:NVIDIA的Maxwell 2.0架构显卡目前普遍使用的是7Gbps的GDDR5显存,GM204核心位宽是256bit,总带宽带宽224GB/s,如果用了12Gbps的GDDR5X显存,那么位宽就是384GB/s,如果GDDR5X实现了14Gbps的速度,那么带宽就是448GB/s,翻了一倍。如果能实现美光许诺的16Gps速度,那么带宽就是512GB/s,达到了目前HBM一代的水平。

同时,GDDR5X将沿用成熟的准漏极开路(pseudo-open-drain/POD)信号机制,保持向下兼容,封装也不变,很容易升级。

JEDEC日前还公布了第二代HBM2标准JESD235A,单颗容量可达8GB,带宽256GB/s,三星也开始投产4GB HBM2,下半年翻番至8GB。不过HBM显存成本依然很高,不可能短时间内用到全部显卡上。

AMD、NVIDIA都会在各自的旗舰卡上使用HBM2,同时在一些中高端型号上使用GDDR5X,性能有保障还经济实惠。这样以来就会形成如下产品序列:

旗舰显卡:4096bit等效位宽,16-32GB HBM2显存,带宽1TB/s

中高端显卡:256/384bit位宽,4-8GB GDDR5X显存,带宽384-512GB/s

入门到中端显卡:128bit/256bit位宽,2-4GB GDDR5显存,带宽>100GB/s

但是外媒MonitorInsider从GDDR5X的技术标准层面上剖析了它与GDDR5的不同之处,他们在文中提到,使用GDDR5X显存技术时可能无法完美适配Nvidia的GPU。

因为16-Bit数据预取位宽意味着每次预取都将包含有64字节的数据,而Nvidia的GPU所使用的是32-Bit标准,所以每当N卡访问L2高速缓存时,DRAM都将获取到两倍之于L2高速缓存中的数据量。

不过为了保持与GDDR5的兼容性,方便厂商升级,GDDR5X显存引入了一项名为“伪独立存储器访问”(Pseudo independent Memory Accesses)的新技术,这应该能够帮助解决这一问题。

GDDR5X并没有解决GDDR5的核心缺陷

既然JEDEC已经正式公布了GDDR5X的技术标准,那么AMD和Nvidia很有可能在未来应用这项技术。鉴于HBM和HBM2在量产上的技术难度,以及有别于平面结构的3D TSV立体硅穿孔技术,导致业内很多人士都认为实际上GDDR5X是更佳的长期选择。

平心而论,RDRAM、Larrabee和安腾处理器都过于超前了,因为目前来说这些技术仍不成熟,相对而言成本过于昂贵。而事实也证明,这些超前的新技术分别被改进多次之后的DDR内存、光栅和AMD的x86-64所替代。

但为什么HBM却得到了一个不同的结局呢?

原因就在于,HBM和HBM2的改进不仅仅停留在提高内存带宽上。这两个技术标准都不仅大幅削减了VRAM功耗还显著提高了显存性能。此外,HBM2所提供的VRAM密度是GDDR5X所无法比拟的。

举个例子,就在1月19日,三星宣布基于HBM2技术的业内首个4GB DRAM显存颗粒已经开始批量生产,4GB HBM2封装下面是缓冲芯片,上面是4个8GB(1GB)容量的HBM2 DRAM芯片。

不仅如此,三星还计划今年推出8GB HBM2,容量在此基础上再翻一倍,一颗就能满足高端显卡的需求,从而比GDDR5节省95%的电路板空间。

而反观当下的镁光生产的GDDR5显存最高也只能达到单芯片1GB。即使假设镁光能够在未来将其提升到2GB,也仍需16颗芯片才能追上三星,而且这16个芯片都需要各自独立的寻迹路由,物理上的面积需求也是一个大问题。虽然GDDR5X能够把信号电压降低到1.35v,但这仍不足以抵消芯片数量的增加所带来的整体功耗提升。

这张图片显示出在平面结构上无限叠加RAM所带来的问题:GDDR5X下单个32GB的GPU需要更多的芯片《电子工程专辑》
这张图片显示出在平面结构上无限叠加RAM所带来的问题:GDDR5X下单个32GB的GPU需要更多的芯片

在2D平面上进行颗粒叠加也存在技术瓶颈,而且还会进一步增加发热量和功耗,最终的研发和生产成本甚至并不亚于HBM2。上面的这张幻灯片就是AMD在一次演讲中所述,它同样也适用于Nvidia。

  规范文档下载:

  http://www.jedec.org/standards-documents/results/GDDR5X

JEDEC固态技术协会日前正式发布了JESD232 GDDR5X SGRAM显存标准规范《电子工程专辑》

《电子工程专辑》
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。







我来评论 - GDDR5X显存技术规范转正,A/N中端卡带宽问题有救了
评论:
*? 您还能输入[0]字
分享到: 新浪微博 qq空间
验证码:
????????????????
?

关注电子工程专辑微信
扫描以下二维码或添加微信号“eet-china”

访问电子工程专辑手机网站
随时把握电子产业动态,请扫描以下二维码

?

5G网络在提供1Gbps至10Gbps吞吐量方面具有很好的前途, 并且功耗要求比今天的网络和手机都要低,同时还能为关键应用提供严格的延时性能。本期封面故事将会与您分享5G的关键技术发展,以及在4G网络上有怎样的进步。

?
?
有问题请反馈
推荐到论坛,赢取4积分X