CPU全接触（三） - CPU DIY专区硬件天地 - 电脑硬件

AMD

　　AMD是一家值得敬佩的公司，要不是它紧紧咬住Intel不放，我们现在就不能买到如此便宜的CPU了。Intel一直想把AMD扼杀掉。 Intel在486之后就再也没有出过以阿拉伯数字命名的CPU，而是推出了一个拉丁文的Pentium，AMD也随即推出了自己设计并且生产的K5 CPU。K5系列CPU的频率一共有六种：75MHz/90 MHz /100 MHz /120 MHz /133 MHz /166 MHz，总线的频率和Pentium差不多，都是60 MHz或者66MHz。作为一款与Pentium竞争的产品，AMD的确做得非常出色，虽然在浮点运算方面比起Intel的来说是略逊一筹，但是在整数运算方面却一点也不比Intel差，由于K5系列CPU都内置了32KB的一级缓存，比Pentium内置的16KB多出了一倍，再加上它的体系结构一直比Intel的先进一些，因此在整数运算和系统整体性能方面甚至要比同样时钟频率的Pentium要高。

　　K6： K6这款CPU的设计指标是相当高的，具有MMX技术、更多的片上一级高速缓存（32K指令、32K数据）和更深的流水线，可以并行地处理更多的指令，并运行在更高的时钟频率上。在整数运算方面，AMD无疑是做得非常成功的。由于K6具有更大的L1缓存，所以随着频率的增长，它能获得比Pentium MMX更显著的性能提升。K6稍微落后的地方是在运行需要使用到MMX或FP（浮点指令）的应用程序方面，比起同样频率的Pentium MMX，甚至没有MMX的奔腾都要差许多，这样就使K6在某些3D游戏方面的表现远不如Intel的出色了。另外，AMD的MMX单元一次只能处理一条指令，而Intel的MMX单元能够处理两条指令。因此K6 在执行MMX指令和浮点指令时性能要差一些。

　　AMD的K6在处理某些MMX操作的时候具有比Intel的CPU更短的处理周期，但单个操作的吞吐量是一样的，而且较短的处理周期并不能弥补K6不能同时处理两个MMX指令的不足。虽然Intel的MMX CPU可以同时处理两个MMX指令，但它的MMX单元只含有一个乘法单元和一个移位单元，所以它不能同时进行这些关键操作。而且同时只能有一个MMX指令操作内存和整数寄存器在浮点处理方面起作用，因此K6在某些操作上的处理周期仍比Intel的短，但它每两个时钟周期才能开始一个操作，而Intel的芯片可以每个周期开始一个。最终的结果是对于许多浮点操作来说，AMD的芯片的吞吐量只能达到Intel芯片的一半。

　　K6系列CPU一共有五种频率，分别是：166 MHz /200 MHz /233 MHz /266 MHz /300 MHz，五种型号都采用了66 MHz外频，但是后来推出的233 MHz /266 MHz /300 MHz已经可以通过升级主板的BIOS而支持100 MHz外频，是CPU的性能得到了一个飞跃。在倍频方面，K6系列是从2.5~4.5不等，核心电压则是有2.9V，3.2V，2.2V三种，特别值得一提的是他们的一级缓存都提高到了64KB，比MMX足足多了一倍，这也是K6的整数性能为什么要比MMX好的缘故了。

　　1998年中，AMD最新K6-2处理器正式推出。这是首款采用3Dnow！技术的微软视窗操作系统兼容型X86微处理器。它采用了全新的硅晶体制造技术（C4倒装），这是由IBM开发的技术，将硅晶精度提高到了0.25微米，硬是将原来K6晶体面积（Die size）的168mm2降到了现在的68mm2，同时晶体数量也增加了50万个（成为930万个），其余结构基本同K6相同，L1 CACHE仍是64KB，但它的面积也比以前的小了，仅有原来的1/2大。此外它的工作电压也从2.9V/3.2V降到了2.2V。AMD在推出K6-2 CPU时，就率先加入3Dnow！浮点／3D加速技术，64位双路浮点缓存器，21条全新的3Dnow！指令集，加入单指令多数据指令（SIMD：Single Instruction,MultiDatas）。而AMD的3Dnow！技术，也随着K6-2的推出，立刻获得游戏厂商、软件厂商和图形卡驱动程序的支持，成为一项重要的工业标准。

　　K6-3处理器采用0.25微米线程，由二千一百三十万个晶体管组成。K6-3处理器是三层高速缓存（TriLevel）结构设计，K6-3处理器核心内建有64K的第一级高速缓存（Level 1）及256K的第二层高速缓存（Level 2），主机板上则配置第三级高速缓存（Level 3）。K6-3处理器的第一与第二层高速缓存总共320K，全部内建在处理器芯片核心内，与处理器的时钟频率相同，此高速缓存的执行速度与处理器同速运作（Full Speed）。K6-3的三层高速缓存（TriLevel）结构设计，可再支持配备在主机板上的1024K第三级高速缓存，在Super 7结构的主机板上，第三层高速缓存的时钟频率是100MHz。相较于Pentium Ⅱ仅具有32K第一层高速缓存与512K半速的第二层高速缓存，AMD的三层高速缓存结构能加大系统的高速缓存容量，以提升系统整体效能。

　　K6-3处理器支持3D Now！指令集。3D Now！指令集与英特尔的KNI（Katmai New Instruction）指令集的功能类似，都是采用增加指令的方法加快3D绘图等多媒体处理及需要运用大量浮点运算的应用程序的运算速度。

　　由于成本上和成品率方面的问题，K6-3处理器在台式机市场上并不是很成功，因此它将逐渐从台式机市场消失，将逐步转进笔记本市场。AMD将推出专供笔记型计算机使用的K6-3+版本处理器，K6-3+采0.18微米线程，芯片内建第二级高速缓存，除此，笔记型K6-3+将拥有自动升降电压的双模式功能（AMD代号为Gemini），类似于英特尔下一步将推出的笔记本型处理器。使用室内交流电供电时，K6-3+处理器拥有较高的时钟频率；若使用电池供电，则K6-3+处理器将自动降速，以延长电池的寿命。

CPU全接触（三）

　　真正让AMD扬眉吐气的是原来代号K7的Athlon处理器。Athlon具备超标量、超管线、多流水线的Risc核心（3Way SuperScalar Risc core），采用0.25μ微米工艺，集成2,200万个晶体管，管芯面积为184mm，目前已经推出了更先进的0.18μ微米工的Athlon。下一步就是采用铜配线技术，AMD在制造工艺上向来就不落后于Intel。（图片athlon.jpg）

　　Athlon包含了三个解码器，三个整数执行单元（IEU），三个地址生成单元（AGU），三个多媒体单元（就是浮点运算单元），Athlon可以在同一个时钟周期同时执行三条浮点指令，每个浮点单元都是一个完全的管道。K7包含3个解码器，由解码器将解码后的macroOPS指令（K7把X86指令解码成macroOPS指令，把长短不一的X86指令转换成长短一致的macroOPS指令，可以充分发挥RISC核心的威力）送给指令控制单元，指令控制单元能同时控制（保存）72条指令。再把指令送给整数单元或多媒体单元。整数单元可以同时调度18条指令。每个整数单元都是一个独立的管道，调度单元可以对指令进行分支预测，可以乱序执行。K7的多媒体单元（也叫浮点单元）有可以重命名的堆栈寄存器，浮点调度单元同时可以调度36条指令，浮点寄存器可以保存88条指令。在三个浮点单元中，有一个加法器，一个乘法器，这两个单元可以执行MMX指令和3DNow指令。还有一个浮点单元负责数据的装载和保存。由于K7强大的浮点单元，使AMD处理器在浮点上首次超过了Intel的处理器。

　　Athlon内建128KB全速高速缓存（L1 Cache），芯片外部则是1／2时频率、512KB容量的二级高速缓存（L2 Cache），最多可支持到8MB的L2 Cache，大的缓存可进一步提高服务器系统所需要的庞大数据吞吐量。
Athlon的封装和外观跟Pentium Ⅱ的SECC卡匣相似，但Athlon采用的是Slot A接口规格。Slot A接口源于Alpha EV6Bus，时钟频率高达200MHz，使峰值带宽达到1.6GB/S，在内存总线上仍然兼容传统的100MHz总线，现在的PC-100 SDRAM还是可以用的，这样就保护了用户的投资，也降低了成本。今后还可以采用性能更高的DDRSDRAM，这和Intel力推的800MHz RAMBUS的数据吞吐量差不多。EV6总线最高可以支持到400MHz，可以完善的支持多处理器。所有具有天生的优势，要知道Slot1只支持双处理器而SlotA可支持4处理器。SlotA外观看起来跟传统 242pin的Slot1插槽很像，就像Slot1插槽倒转180度一样，但两者在电气规格、总线协议是完全不兼容的。Slot 1／Socket370的CPU，是无法安装到Slot A插槽的Athlon主板上，反之亦然。
AMD为了进一步扩大3Dnow！软件平台的支持范围，同时拉近原先3Dnow！与SSE之间的差距，在Athlon处理器中提供了Enhanced 3Dnow！技术，新添加了24条指令。其中19条控制指令，刚好跟Intel在PentiumⅢ的SSE指令中，针对现有的64位MMX缓存器所添加的视频运算、内存快速预先读取指令是完全兼容的，因此针对PentiumⅢ的SSE指令集开发的软件，只需少许修改就能顺利转移到Athlon上，发挥强悍的MMX缓存器的SIMD加速性能。另一方面，Athlon增加5条新指令，可以使CPU像DSP芯片一样直接处理模拟／数字信号的转换工作。它可以运用在软调制解调器（Soft Modem）、ADSL网络转换传输及Dolby AC-3的解码上，而Intel的CPU到目前为止，还未提供类似功能的指令。显然在新一代处理器指令集的开发中，AMD又再度发挥了创新精神。

　　讲了这么多，Athlon处理器实际效能如何呢？以同样是600MHz的Athlon与600MHz PentiumⅢ相比较（Xeon目前只到550MHz而已），Athlon的整数性能（CPUMark99、WinStone99），比同频的PentiumⅢ快了10％左右；而浮点性能更是Athlon扬眉吐气之处，WinBench99的FPUmark测试值虽然仅仅快了8％左右，但是以跨平台工业评估标准的SPECfp_base95的测试结果，则快了约38％；在3D性能方面， 3D WinBench的3D Winmark以及3DMark 99 Max等软件的测试下，均领先36～38％。在运行3D Studio Max R3.0时， Athlon平台在着色处理（Rendering）的速度，大约比PentiumⅢ快了33％。由于PentiumⅢ与PentiumⅢ Xeon的差别在于L2缓存的容量与速度（Xeon为全速L2缓存），如果拿只有512KB L2缓存的入门级Xeon处理器来比较，跑大多数软件时，Xeon只有整数性能比PentiumⅢ快一点，浮点性能两者完全相同。因此在Athlon vs PentiumⅢ&Xeon的实测结果，1/2频率的L2 Cache设计的Athlon，在任何软件的表现上都击败全速L2 Cache设计的Xeon处理器。

　　最近AMD又推出了800MHz的Athlon；Athlon 800MHz处理器仍是SlotA结构，不过新款式的Athlon处理器皆是K75核心，800MHz的Athlon处理器即已采用0.18微米铝工艺，晶圆面积为102平方厘米，比起采用0.25微米线程制造的旧款式Athlon处理器，800MHz款式发热更低。

　　由AMD公布的Athlon处理器与Pentium Ⅲ处理器效能测试数据显示，在Business Winstone 99（Windows NT 4.0）部分，Athlon 800MHz的测试值是42.5，Athlon 750MHz是41.4，Pentium Ⅲ 733MHz是41.3；在WinBench 99CPUmark 99部分，Athlon 800MHz的测试值是71.9，Athlon 750MHz是67.9，而Pentium Ⅲ 733MHz是65.8；在WinBench 99 FPU WinMark部分，Athlon 800MHz的测试值为4,370，Athlon 750MHz为4,103.3，Pentium Ⅲ 733MHz为3,890。

　　因此AMD把Athlon处理器的定位，锁定在Xeon的等级，在价位上则定位在Xeon到PentiumⅢ之间，希望能打入商业、高阶工作站、服务器的市场，这应该是很具竞争力的市场策略。