正如同PCI发展到PCI-Express,IDE发展至SATA一样,从RDRAM开始,Rambus公司坚持的串行发展路线,在今天终于得到了有利的印证。XDR2正是串行通信技术得到了长足发展的产物。
简单来说,串行是用窄位宽高频率来传输数据,就像两车道的高速公路,车速可以高达300km/s;并行是用宽位宽和较低频率来传输数据,相当于6车道的城市公交,速度虽然只有300km/h,但是一次可以开六辆车。
目前正式发布的XDR2内存芯片的标准设计位宽为16-bit,目前传输速率高为8Gbps,单颗
XDR2芯片的数据带宽就将达到16GB/s(8×16÷8=16GB/s)。从整体结构来看,XDR2在内部架构的设计上和XDR非常类似。大的革新莫过于XIO2(第二代X DR2 IO控制器)以及XMC2(第二代
XDR2存储控制器)。
图3
从图3可以看到,每一颗存储芯片通过五条总线和XIO2以及XMC2直接相连。其中RQ总线用于传输寻址和控制命令,DQ总线用于数据传输。
根据Rambus披露的相关资料来看,XDR2基本沿用了XDR的设计思路,在为影响传输速度和带宽的频率方面,XDR2做出了如下调整:
1.XDR2在内部传输速度上比XDR更进一步,比如XDR2的总线频率比XDR提升了25%,达到
500MHz。
2.RQ总线的速度更是提升了2.5倍,由XDR的800MHz提升至2GHz。更高频率有助于降低整个系统的潜伏时间,提升响应速度。
3.为关键的数据传输DQ总线,XDR2提升到了16倍传输速度,高可以达到每总线
12.8Gbps的传输速度,这是整个XDR2技术提升速度的关键性因素。
当然,上述技术仅仅是表面上描述XDR2终性能提升的数值。辉煌的表面数据背后都是复杂的技术研究。那么XDR2有哪些法宝达到这么强悍的性能呢?我们分为下面五大技术解决方案:
对于存储设备来说,我们为关心的是它的速度。没错,我们反复强调,16倍的数据传输速率是XDR2核心和关键的技术进步(图4)。在串行总线中,如果无法维持更多的一次传输数据量,那么只有依靠极高的频率在同样的时间内尽可能多地传输数据。
图4
在每个时钟周期内,XDR采用了16倍传输速度。在同样的技术点上,GDDR只能在同时钟周期内传输2次,GDDR2则是4次、GDDR5也只有8次。但是GDDR系列先天的并行总线令其难以持续扩展频率,数据信号也会在高频下会变得非常脆弱,进一步发展比较困难。
XDR2的DQ总线的实际运行频率仅为800MHz,但是其经过16倍“增速”之后,名义运行速度高达12.8GHz,不过高频运行并不是单纯的提升速度就可以完成的,为了保证16倍数据传输速度的成功运行,XDR2还采用了众多辅助技术。
图5:未采用信号纠正技术时杂乱无章
从理论来说,更高的传输速度要求更低的错误率。比如在12.8Gbps的传输速度下,每传输15个单位的数据,数据错误多只能有一个。但实际传输过程中,数据信号不可能时刻运行在理想位置。特别是在高频运行的情况下,信号会更为脆弱(如信号的振幅、相位、位宽等都会由于干扰而产生变化)并导致严重的数据错误(图5)。为了避免这样的错误产生,XDR2采用了几种信号纠正技术来保证数据正确率(图6)。
图6:综合使用各种信号纠正技术后,信号清晰有序
Rambus宣称在XDR2中至少使用了6种技术来减少传输中的误差。其中比较重要的是
Enhanced FlexPhase时序调整技术,有关Enhanced FlexPhase的内容,我们将本文的另一部分详细叙述。除此之外,降低相位杂讯,并提供比目标资料传输率更多的频率倍数。其它如减少缓冲大小、管理电路信号,降低敏感电路的杂讯、减少由供电带来的杂讯并降低能耗等,都被用于保证高频率下数据传输的有效性。
总的来说,在应用了16倍数据传输技术后,XDR2能够在每个时钟周期内传输更多的数据,弥补串行传输的先天不足,并且简化了芯片的布线、针脚设计等问题。需要说明的是,作为XDR2速度提升技术的核心,16倍数据传输技术并非单独的一个技术,它是更多的技术综合运用的结果。