当代多处理器系统纵览2003-02-09 18:22:00·
shawn·
天极商务应用
上一页 1 2 3 4 5 6 7 8 9 10 11 下一页 2-way Sun UltraSPARC-III 系统
芯片组构架:这款芯片组看起来相当的复杂(画起来肯定也很费劲),而Sun公司的文档对于芯片组的布局与运行方式也介绍得不够,所以上面也只是设想中的图形。每颗UltraSPARC-III处理器都拥有一个on-die内存控制器并具有直接address最高4个bank的2条SDRAM DIMM的能力。Sun公司把这些DIMM叫做"NG-DIMM"(next generation下一代的),因为他们虽然使用了普通SDRAM芯片,但都是128位的。4个bank每个都拥有一个连接到6个单独ASIC(这6个ASIC组成了联合处理器内存转换器,CPMS)。这款芯片组还有一定程度的冗余(实际上系统仅仅需要6个CPMS中的4个就行了),设想中的具体实施过程已经展示在上图中了-内存模块与Switch2和Switch5的连接是用虚线表示的,这个意味着这两条连接是可选的,可能当Switch1或者Switch3出故障的时候,Switch2能够接管他们的工作,依此类推。
每个switch ASIC都有两条单独的与总线类似的连接通道,一条与2颗CPU相连,另一条与主I/O芯片相连。任何一个单独的ASIC都能同时对1颗或2颗处理器读或写数据,而且通过一条单独的总线来在switch ASIC间传输数据。每个ASIC 都能轮流来传输从内存到CPU的数据,而当一个ASIC往CPU传输数据的时候,其他的也可以同时往CPU中传输数据(这点上Sun公司的文档没有说得太清楚)。CPU之间的数据传输也得通过这些ASIC,虽然address请求是由CPU与主I/OASIC共享的总线发出的,这样要比通过一个switch ASIC发送请求获得更低的延迟-address请求需要的带宽比数据请求少得多,这样就更为实用。在采用的双UltraSPARC-III处理器Sun系统中,只有一颗CPU被用来处理内存请求(也许为了降低成本),而且采用共享address总线来初始化请求。
带宽和延迟:每颗UltraSPARC-III处理器都拥有一条独立的128位 150MHz与芯片组的连接通道(2.4GB/秒的带宽),芯片组支持最高4.8GB/秒的内存带宽以及1.2GB/秒的I/O带宽。拥有一个on-die 内存控制器以及一个很短的数据传输通道,系统延迟将比其他的采用同样的75MHzSDRAM内存的解决方案要低,或许能达到采用100MHz SDRAM内存的简单北桥设计所能带来的延迟水平。
可扩展性:芯片组拥有一条共享address总线,一条专用数据总线。这种设计与Pentium 系统的共享总线和Athlon系统的点对点专用总线相比,算是一个复合型的设计。Address总线是共享的并有1个时钟循环的延迟,但因为是用在2-way系统上,即使依赖于带宽的应用程序也不能通过cache snoop和内存请求而占满整个address总线。因为每颗CPU拥有一条单独的数据总线,cache snoop 数据,内存数据和I/O数据能够同时出现,这能帮助提高带宽的可扩展性。
I/O:芯片组支持1条64位66MHz PCI 总线,2条64位33MHz PCI总线以及2块UPA64S图形卡(Sun公司的与AGP图形卡类似的产品)。
CPU cache:UltraSPARC-III处理器带有8M的外置 cache,cache使用256位,最高能达到350MHz的SRAM,能提供11GB/秒带宽。更新一些的UltraSPARC-III Cu处理器替代了速度较慢的UltraSPARC-III处理器(它的SRAM速度仅为150MHz)。处理器核心拥有90KB的 tag-RAM来作为外置cache(用来缓存数据address记录),64KB,2个循环延迟的L1 数据cache,32KB,2个循环延迟的指令cache,2KB的pre-fetch(预读取)cache(仅为浮点数据使用)以及2KB的写cache。
CPU核心:CPU核心拥有9条阶段性管线来发布整数指令,而内存请求,指令分流和浮点运算总共使用14条阶段性管线。而一个特殊的替补指令分流缓冲区能将指令分流预测错误的惩罚降低至4个循环。最初的1988的SPARC指令集构架大部分都是建立在最初的RISC-1设计上,并在1995年发展到采用64位的UltraSPARC-I处理器。UltraSPARC-III处理器和UltraSPARC-II处理器一样,采用in-order 4-way issue的设计,但在cache性能和指令分流预测系统上取得了显著进步。CPU核心运行在1.6V的电压下,在1050MHz的时候能耗为75W。
评论:近10年来Sun公司都是RISC/Unix工作站系统的最大的供货商,主要从事高端系统的研究,并且和SGI公司不同,他们很少涉及3D 动画行业。虽然在写作本文的时候,Sun公司的Blade 2000服务器取得了第二高的2-way SPECfp_rate峰值测试结果,它的性价比与基于x86构架的系统相比还是差很多。此外,Sun公司内的图形卡的开发速度相当的慢,虽然他们最新的XVR-1000比起上一代的图形卡要快了3倍多,它的性能仍显得落后并且价格昂贵,即使它拥有许多高级的视觉特性。
需要64位addressing能力和大量内存的工作站系统在工作站市场上占的比例每年都在增加,而且许多高端的工作站市场的附加软件和软件包都只能运行在UltraSPARC和HP的PA-RISC系统上(这两种系统是采用64位构架的工作站系统中最先进的)。此外,对于高端的工作站任务,软件的花销可能是巨大的,而且任何的软件故障带来的损失更是显著的。即使是昂贵的工作站系统都没法这些损失相比。这些因素可能就是高端的RISC工作站市场仍然有利可图的原因。随着HP转向采用Itanium处理器,AMD致力开发64位 的扩展性x86构架的系统,高端工作站市场的竞争将会变得白热化,也会使产品的价格降低。对于有些工作站任务,如EDA(集中于CPU运算和内存性能上,但对图形运算要求很低),Sun公司已经开始转向采用一种服务器的模式,由低端工作站或者瘦客户机来共享一个计算场(compute farm)的资源。
Sun公司的服务器版的双UltraSPARC-III系统(Sun Fire280R和Netra20)都是rack-mount的系统,却采用了4U的机箱。虽然对这些系统进行web-serving之类的benchmark测试表明他们的性能能够与高端的基于x86构架的2-way 系统相比,Sun公司的产品对于这一类的大多数产品都显得过于昂贵,而且大多数的web服务器并不需要超过4GB的内存以及高等级的内存带宽。鉴于许多基于x86构架的2-way系统都采用的1U机箱,Sun公司采用4U机箱的系统并没有良好的性能密度比(而4-way Sun Fire V480采用的是5U机箱),虽然Sun公司已经开始研究更为“苗条的”模型。然而,任务繁重的应用服务器以及低端的数据库服务器将能从它的额外的内存和高速而且大容量cache中获得好处。但2-way UltraSPARC-III系统的价格几乎是2-way Pentium 系统的2倍,在这点上Sun公司的竞争力很差。
参考:
Sun Blade 1000 and 2000 技术白皮书
Sun Fire 280R 技术白皮书
UltraSPARC-III 用户手册
下一页>>8路Sun UltraSPARC-III 服务器上一页 1 2 3 4 5 6 7 8 9 10 11 下一页 |