当代多处理器系统纵览2003-02-09 18:22:00·
shawn·
天极商务应用
上一页 1 2 3 4 5 6 7 8 9 10 11 8-way Sun UltraSPARC-III 服务器
芯片组构架:Sun公司的8-way UltraSPARC-III工作组服务器(Sun Fire V880)采用了与2-way系统相同的芯片组(从CPU的层面上说),但从系统的层面上说则引进了许多新特性。Sun公司的整条UltraSPARC-III系统生产线也是建立在同样基本芯片组的基础上。系统分布在4块CPU/memory卡上,每块卡支持最高2块CPU和16GB内存(目前),而每个CPU能控制8个DIMM。4块CPU/memory卡通过一条backplane连接(Fireplane interconnect)。4块CPU/memory卡和2条I/O系统连接之间还有一个6端口的crossbar switch(矩阵交换)。不幸的是,官方文档对于许多细节都没有说得太清楚―但文档上说芯片组采用了4个ASIC来进行Fireplane interconnect(建立在一个256位,150MHz的点对点连接构架的基础上),不过没有具体构造的情况。虽然2-way系统采用了6个单独的ASIC来保障2颗CPU和本地内存间的连接,Sun Fire V880 系统的CPU/memory卡则拥有8个ASIC,不过没有具体细节资料。
带宽和延迟:在2-way系统中,一个CPU要控制8个DIMM,最高的内存带宽为4.8GB/秒。在8-way系统(也有可能4-way系统)或者更高级的系统中,每个CPU要控制8个DIMM,但每个只能获得2.4GB/秒的带宽,所以8-way系统的总带宽将达到19.2GB/秒。本地内存(同一块CPU/memory卡上的)的延迟应该与2-way系统的相类似。一个非本地的请求(不在同一块CPU/memory卡上的)将会增加几个循环的延迟(150MHz的时候)。每块CPU/memory卡与中央Fireplane interconnect连接的带宽都是4.8GB/秒(持续不变的)。Fireplane interconnect总共能维持8.6GB/秒的数据传输带宽。
可扩展性:从可扩展性的角度看,一个使问题变得更复杂的情况就是当遇到基本上采用随机内存读取模式(平均地从各个分散的内存控制器中读取数据)的应用程序和8颗CPU的时候,仅有八分之一的内存请求会发往CPU自己的内存控制器,另外八分之一将发往与之配成一对的CPU的内存控制器,而剩下的则会在其他的内存控制器间平均分布。如果所有的内存请求都是本地的(位于同一块CPU/memory卡),理论上最大带宽将达到19.2GB/秒(当8颗CPU都处于激活的状态的时候)。但当内存请求是分散的时候,带宽将会受到9.6GB/秒的backplane带宽的限制。
不过因为每颗CPU拥有8M cache,可能只有技术性计算用途的应用程序才会需要持续的高内存带宽(高到使9.6GB/秒的backplane成为带宽的瓶颈)。采用软件优化来增加本地内存请求发生的机率将使所有的应用程序从中受益,因为这样不但能降低延迟还能增加最大带宽。不过假设遇到这样的系统设计的时候(本地延迟和远程延迟没有太大差别,而且通过中央switch中转后的带宽不会成为系统瓶颈),那样的软件优化带来的性能提升将会很小。
I/O:I/O系统以与CPU/内存卡接近的速度与backplane相连,并且支持4条PCI通道,包括两条64位 66MHz 通道和两条64位 33MHz通道,以及总共9块PCI卡。这些PCI卡还可以随时添加和使用,不会导致系统停机。
CPU和cache:整个UltraSPARC-III系列的系统都采用了相同CPU和 SRAM cache设计,所以它和2-way系统的设计没有太大的差别。不过和2-way工作站系统不同的是,目前还没有1050MHz速度的CPU,预计要到2002年第三季度才能实现。
评论:很难将它的内存延迟与当前的基于Intel芯片的8-way系统相比较,但是因为拥用更多cache,更快的CPU核心,更大的内存带宽以及基于switch的构架,Sun公司的系统拥有明显的性能优势。虽然只有相对很少数量的针对v880的benchmark软件被发布,它的性能已经要优于最新的8-way Pentium 系统。不幸的是,目前还没有太多优秀的跨平台的服务器benchmark软件。
当Sun Fire V880系统2001年八月发布的时候,它的价格与类似配置的8-way 900 Pentium 3 Xeon系统相似,并因此变得十分受欢迎。实际上它的受欢迎的程度就是它的4-way版本(Sun Fire V480)推迟面市的原因,而本来这款4-way系统是预计正好本文发行之前面市。V480系统与V880系统基本上是一致的,除了V480系统只有2块CPU/Memory卡以及较低的I/O能力。而这两款系统都难以销售的区域就是那些完全采用基于Windows系统的客户。这些客户显然不太可能已经拥有管理Unix系统的员工,所以对他们来说,购买一台Sun公司的服务器会导致巨大的额外花销,因为需要一名额外的受过训练的员工支持它。
参考:
Sun Fire V880 系统构架
IDC 关于 Sun Fire V480的白皮书 - 只有很少的关于4-way系统的文档,不过这篇文章有一些有用的关于整体服务器市场的数据。
最后
这一次我们就讲到这里,在下一篇文章里我们会涉及一些2003年即将面市的新技术和经过改良的技术,如集成了北桥芯片和内存控制器的芯片组,通过单晶片多处理器(CMP)和采用纯消除多线程技术(fine-grained multithreading)而实现的线程级并行运算。请感兴趣的朋友继续关注。 上一页 1 2 3 4 5 6 7 8 9 10 11 |