本文主要介绍大型机的产生和发展,并从技术上同其它类型的计算机作一对比。大型机的优秀特质:高靠性、高可用性、高服务性,正因为这些特点,使众多公司选择它,依靠它。
大型机(mainframe)这个词,大多数时候它是指自system/360开始的一系列的IBM计算机。这个词也可以用来指由其他厂商,如Amdahl, Hitachi Data Systems (HDS),EMC,HP 制造的兼容的系统。另外大型机也不仅仅是一个硬件上的概念,它是硬件和专属软件的一个有机整体,是一套密不可分的封闭系统,大型机使用专门为其量身定做的专用软件包括操作系统,编译系统以及其它系统软件以及上层应用软件,这种封闭系统在为大型机系统带来了高可靠性和安全性的同时也使得一般的计算机从业人员难以进入这一领域。
IBM于1964年花费50亿美金开发出了IBM SYSTEM/360大型机,1964年IBM为美国Airlines提供SABRE系统;1966年IBM为社会保障管理机构提供管理系统;在1969年Apollo 11登月计划中,IBM S/360更是大显身手。
1990年9月5日,IBM召开了一次25年来最大的产品发布会,推出了S/390。
2000年10月,IBM推出经过全新设计的大型机eServer z900。z系统列的意思是永不宕(dang)机(zero),这是 IBM 第一款以电子商务为目的打造的企业级大型机。它以无以伦比的可靠性和安全性将大型机的性能和连接能力再次推至新高。为了更好的满足客户的不可预测性,业务的灵活性,以及高效的电子商务需求,eServer z900 拥有 HiperSockets 高速互连技术。提供了行业第一个能够实现线速度每秒钟 1GB的全新的、更高性能的千兆位以太网功能。更重要的是它具有自优化和自恢复功能,可以有效的对资源进行管理,充分满足您电子商务的目标。IBM eServer z900对众多平台和操作系统地支持更是为客户选择、创建和部署自己所需的应用提供完美的灵活性。
IBM zSeries机器有五种型号:800, 890, 900, 990和z9。
2003年5月IBM又推出了IBM eServer家族旗舰产品eServer z990。该产品的扩展能力可将随需应变的优势赋予不同规模的企业,可以帮助您根据需要定制系统规模,让您更好地控制您的IT成本。同时,eServer z990还拥有行业领先的虚拟、自动化、可扩展性、安全性和可靠性特性。
2004年4月IBM又推出了拥有高端技术和诱惑力价格的eServer z890,它是传承了eServer z990 的主要技术,并保持与eServer z990 同步的技术更新。与eServer z990相比eServer z 890 提供了主机前所未有更大的灵活性。虽然它与eServer z800一样是面向中型企业,但是eServer z 890的处理能力却是eServer z 800的两倍,而价格是历史最低的20万美元。显然,eServer z890能为客户创建随需应变的基础设施,并进一步降低成本。
IBM经过三年研发,投入12亿美元,在2005年夏季推出z9,该机可以虚拟化数百种软件应用程序,每天可以处理10亿笔交易,可以按需扩容,最大可扩大到54路,它使用16-芯片的IBM Multichip Module作为处理器。其被称为LPAR的逻辑分区,可用来运行多个操作系统,包括 z/OS, z/OS.e, OS/390, Linux on zSeries, z/VM, TPF, VSE/ESA, zVSE和TPF。所有的主流数据库和企业事务处理环境均可在该大型机上运行,包括CICS, IMS, WebSphere Application Server, DB2和Oracle。
z9同其先驱者z990相比,性能加倍,达到600 MIPS,内存达到512 GB,分区数也是原来的两倍,达到60。
按照IBM的说法,大型机有S/390,中型机有AS/400,小型机有RS/6000。S/390运行z/OS或者Linux/390,AS/400主要应用在银行和制造业,还有用于Domino,主要的技术在于TIMI,单级存储,有了TIMI技术可以做到硬件与软件相互独立。RS/6000比较常见,用于科学计算,事务处理。
当然上面那个说法是比较旧的说法了,现如今那些系统估计也在用,但是最新的系统已经不是它们了,从IBM的官方网站上可以看到它们的服务器领域除了大型机服务器以外还有BladeCenter 刀片服务器,群集服务器,UNIX 服务器,Linux 服务器,OpenPower 服务器,POWER 处理器的服务器,基于英特尔架构的服务器,基于 AMD 架构的服务器。(NND,这么多!) 具体起来又在IBM的eServer服务器家族中分为system z(Mainframe servers (formerly zSeries®)),system i(Integrated business servers (formerly iSeries™)),system p(AIX 5L and Linux servers (formerly pSeries®)),system x(Intel processor-based servers for IBM System x (formerly xSeries))。这么多系列每个系列里面又有那么多东西!我晕倒。
大型机本来并不是以处理能力见长,各种排行榜如TPCC上,很少看到大型机,IO/RAS的优势现在也不明显了,以前EMC、HDS的存储都是用于大型机的,现在它们的主要市场都在小型机上,100000IOPS已经不稀奇了。
在CPU/内存容量/IO带宽方面,相对小型机里面的旗舰级产品如Sun15K,HP Superdome, IBM P690,没有优势。
大型机技术上还有很多领先的地方,但是性价比不敢恭维。一台要近百万美元,不过它积累了很多行业应用,一大堆非关系数据库/Cobol程序之类,这些东东没法移植,成为大型机吃老本的资本。
大型机系统得以长盛不衰的主要原因(特点)是:RAS,I/O处理能力以及ISA。
RAS
RAS(Reliability, Availability, Serviceability 高可靠性、高可用性、高服务性)是一个IBM常用来描绘它的大型机的词。到70年代早期为止,IBM已经认识到商业用途系统市场远比科研计算机系统市场有利可图。他们也知道IBM商用系统的一个重要的卖点就是高可靠性。如果他们的商业客户准备采用IBM计算机来开展极其重要的商业业务,客户就得确认他们可以在任何时间都可以正常使用(IBM的机器)。所以,最近30多年来,IBM致力于使每一个新系列的系统比前一代更加可靠。这就导致了今天的系统变得如此可靠,以至于几乎没听说过有任何因为硬件问题导致的系统灾难。这些大型机系统内集成了相当高程度的冗余和错误检查(技术),这样就能防止系统发生灾难性的问题。每个CPU die装有2个完全的执行管道(execution pipelines)来同时执行每一条指令。如果这两条管道得出的结果不相同,CPU的状态就会复原,然后这条指令被重新执行。如果重新执行后结果还是不一致,最初的CPU状态就被记录下来,然后一个空闲的CPU被激活并装入存储的状态数据。这颗CPU继续做最初那颗CPU的工作。记忆芯片、内存总线、I/O通道、电源等等,都要么有冗余的设计,或者有相应的备用品并可以随时投入使用。这些(设备的)小错误可能会导致性能的一些小损失,但他们决不会导致系统中任何任务的失败。
当很罕见地出现错误的时候,高服务性就用得上了。许多组件都可以在系统运行的同时被更换(热插拔);甚至微码(microcode)的升级也可以在系统运行的同时进行。对于那些不能被同时更换的部件,如CPU,备用品的存在就保证了能够客户方便的时候安排系统停机。
除了系统设计中的固有可靠性,IBM也创立了一个紧密联结的集群技术,叫做Parallel Sysplex,这项技术支持由最多32个系统作为一个系统镜像运行。在一个合理部署的Parallel Sysplex系统上,即使一个独立系统遭受了毁灭性损失,整个系统也不会受太大影响,而且不会导致任何工作的损失。任何在那台遭受损失的系统的上进行的工作,都可以自动地在剩下的系统上重新开始。另一个Parallel Sysplex的优势是一台(或多台)系统可以从整个系统中移出以进行硬件或软件的维护工作(例如在非工作时间),而其余的单独系统可以继续处理工作。当维护工作完成后,系统又回归加入Sysplex系统中继续工作。充分利用这一特点就可以升级整个Sysplex系统软件(一次一个单独的系统),而不会导致任何应用程序的暂停使用。
正因为拥有所有这些功能,真正100%的系统可用性是非常实用的,并且已经在许多地方开始实施。
I/O 吞吐量(I/O Throughput)
这些通道实际上就是I/O处理器,他们执行通道程序。这些程序包含了成串的I/O指令,其中就包含有最原始的分流功能。这些通道极大地降低了CPU在I/O操作中的工作量,使得CPU可以更加高效地工作。每一个通道都能同时处理许多I/O操作和控制上千个设备。
在360和370系列构架上,操作系统会创建一个通道程序并在一个已连接到所需设备的通道上执行这个程序。如果这个通道或控制单元十分忙碌,起始I/O指令就会失败,然后操作系统就会尝试在另一个已连接到不同控制单元的通道上重新开始通道程序。如果所有的道路都是繁忙的,操作系统就会把这个请求列入队列留在以后再试。XA系列里面出现的一个显著的改进就是创立了通道子系统的概念,这个子系统可以协调并安排系统里所有通道的活动。现在操作系统只需要创立通道程序,然后把程序转交给通道子系统,通道子系统就会处理所有的通道/控制单元以及队列问题。这样就使大型机具有了更加强大的I/O吞吐量并使CPU能更有效地工作,因为只有在所有的I/O操作都完成的时候才需要CPU的介入。
目前z900大型机的I/O吞吐能力是最低每秒24GB(这是字节数,不是“位”数。)虽然我没有亲自测试这些最新系统的机会,但即使理论上的数字可能不太准确,如果说z900大型机达到了每秒100,000 次I/O,我也不会感到太吃惊。
The ISA (IBM System Architecture)
这些年虽然IBM大型机的整体指令集有了显著改进,IBM保持了惊人的对应用程序的向后兼容。许多最为显著的构架上的变化已经影响了一些只能直接被操作系统调用,而不能被应用程序调用的设备(如I/O子系统)。IBM已经花费了巨大的努力来保证它的客户们不必重写或重编译他们的程序来在新系统上运行。这样,客户要采用新的硬件就更为容易,客户只需要拔下旧系统,换上新系统,而不需要做额外的软件测试工作。对于只有拥有一台大型机的公司来说,只需要花几个小时就可以对旧系统进行升级,而不需要在投入正式使用前对新系统进行测试。这特别适合那些在升级前后使用同一种操作系统的客户,他们只需要将操作系统升级到所需要的版本就行了。例如,客户可以在新安装的z900系统上仍然运行31位的操作系统,然后在一个单独的LPAR上安装并测试一个64位的操作系统,然后再把全部运行的业务转移到64位的操作系统上。 |