itanium 9000

Transcrição

itanium 9000
Enterprise Computing
Prof. Dr.-Ing. Wilhelm G. Spruth
WS 2011/12
Teil 3
Mainframe Hardware
Mainframe Alternativen
IBM System z, z/OS
Hersteller
Name
Microprocessor
Betriebssystem
Fujitsu / Sun
Sunfire, M9000
Sparc
Solaris
HP
Superdome
Itanium
HP-UX
IBM
System p
PowerPC
AIX
Mehrere Hersteller (Dell, HP, IBM, Unisys, andere) stellen große Konfigurationen mit x86
und Windows/Linux her.
Die Firma Unisys produziert in kleinen Stückzahlen Großrechner, mit dem OS2200
Betriebssystem , welches auf die UNIVAC 1100/2200-Serie zurückgeht, sowie Rechner mit
dem Master Control Program (MCP) Betriebssystem, welches auf die Burroughs-B5000Produktlinie zurückgeht.
Hewlett Packard Betriebssysteme
Die Firma Hewlett Packard (HP) vertreibt neben dem hauseigenen HP-UX (Unix) mehrere
weitere Betriebssysteme, die zum Teil aus der Übernahme mehrerer anderer Computer
Firmen stammen:
• MPE/iX ist eine HP-eigene entwicklung, die 2010 eingestellt wurde.
• Tru64 UNIX wurde von der Firma digital Equipment entwickelt und läuft auf “Alpha”
Microprozessoren. Es wird nicht weiterentwickelt, und HP stellt die Unterstützung Ende
2012 ein.
• HP NonStop stammt von der Firma Tandem Computers und läuft auf Itanium
Microprozessoren.
• Das Virtual Memory System (VMS) Betriebssystem wurde von der Firma Digital
Equipment Corporation (DEC) entwickelt und läuft ebenfalls auf Itanium
Microprozessoren. Microsoft benutzte VMS als Basis für die entwicklung von Windows
2000.
Viele Hardware Produkte der Firma HP unterstützen Windows und Linux.
Hardware für betriebswirtschaftliche Großrechner
Die meisten Implementierungen von betriebswirtschaftlichen Großrechnern verwenden die
gleichen oder ähnlichen Technologien, wie sie auch für Arbeitsplatzrechner oder kleine
Server eingesetzt werden. Dies hat den Vorteil, die Entwicklungskosten auf eine größere
Stückzahl verteilen zu können. Es hat den Nachteil, dass die verwendeten Komponenten
(Commodity Parts) nicht für den Einsatz in einem betriebswirtschaftlichen Großrechner
optimiert wurden. Zwei Beispiele sind:
• Zuverlässigkeit und Verfügbarkeit richtet sich nach ökonomischen Kriterien , die für
den PC Bereich etabliert werden. Durch zusätzliche Einrichtungen versucht man
Verbesserungen zu erreichen, die dann aber ins Geld gehen.
• Ein/Ausgabe (I/O) Einrichtungen sind z.B. für den Ansschluss von 5 Plattenspeichern
optimiert, nicht aber für 5 000 oder 50 000 Plattenspeicher
Dennoch sind betriebswirtschaftlichen Großrechner alles andere als billig, wie das
folgende Beispiel eines führenden Herstellers, der Firma Sun, zeigt:
Das kleinste Modell der Sun 25k Serie hatte 4 „System Boards“ mit je 4 Dual Core SPARC
CPUs, oder insgesamt 16 CPUs. Spätere Modelle benutzten Quad Core CPU Chips. Die
System Boards (auch als Prozessor Boards bezeichnet) sind eine evolutionäre
Weiterentwicklung der Sun 15k und Sun 10k Serie.
4x4
Hauptspeicher
DIMMS
(Dual Inline
Memory
Module)
4 Multicore
Sparc Chips
+ Kühler
4 I/O Adapter Cards
Sun E 10 000 System Board
HewlettPackard
Superdome
Cell Board
4 Multicore
Itanium
Chips
Hauptspeicher
2 x 16 DIMMs
6 I/O Adapter Cards
Plattenspeicher
Fibre Channel SCSI
I/O Adapter
Cards
PCIe Bus
System Board
Cell Board
PCIe Card
I/O Cage
Sun Fire, Superdome Konfiguration
PCIe Cards in getrenntem I/O Cage mit PCIe Steckplätzen.
Multi-Chip Module eines z9 Rechners
z9 Multi Chip
Module (MCM)
PU 2
PU 1
6 quad core CPU
chips (labeled PU) for
a total of 24CPUs
PU 0
S00
S10
SC 0
SC 1
S01
S11
PU 3
PU 4
PU 5
2 L4 cache chips
labeled SC
4 EPROM chips
labeled S00, S01, S10
und S11. Sie dienen
derPersonalisierung
(characterization)
jedes einzelnen
MCMs.
z 196 Multi Chip Module (MCM)
Das MCM besteht aus einem 96 x 96 mm großem Multilagen-Glas-Keramik-Träger mit 103
Verdrahtungslagen.
Layout des z 196 CPU Chips
Jedes CPU chip hat 1.4 Milliarden (109) Transistoren. 23,5 x 21,8 mm.
1134 Signal Anschlüsse, 8093 Power Anschlüsse (C4)
z196 Microprozessor CPU
Each core is a superscalar, out of order processor with these characteristics:
•
•
•
•
•
•
•
•
•
•
•
~1000 instructions
211 complex instructions cracked into multiple internal operations
246 of the most complex z/Architecture instructions are implemented via microcode
Six execution units
2 fixed point (integer), 2 load/store, 1 binary floating point, 1 decimal floating point
Up to three instructions decoded per cycle
Up to five instructions/operations executed per cycle
Execution can occur out of (program) order
Memory address generation and memory accesses can occur out of (program) order
Special circuitry to make execution and memory accesses appear in order to software
Each core has 3 private caches
64KB 1st level cache for instructions, 128KB 1st level cache of data
1.5MB L2 cache containing both instructions and data
Hauptspeicher
Hauptspeicher
L4
L3
L2
z10 Mainframe
L3
L2
L1
L1
CPU
CPU
z196 Mainframe
Mainframe Cache Hierarchien
Heutige Mainframes haben eine drei- oder vier-stufige Cache Hierarchie.
z196
Cache Hierarchy
CPU Chip
CPU Chip
CPU Chip
CPU Chip
CPU Chip
CPU Chip
Vier oder acht Cores pro Chip ?
Embedded DRAM (eDRAM)
Designed for on-die use with CPUs, eDRAM is nearly as fast as the SRAM currently used
for on-die CPU caches, but uses far less processor real estate—about half as much in
some cases.
Zusätzliche
Eigenschaften des
z9 CPU Chips
Recovery Unit
Wenn eine Maschinen-befehlswiederholung nicht erfolgreich ist (z.B. ein permanenter
Fehler existiert), wird ein Relocation Process gestartet. Dieser bewirkt, dass die
Prozessausführung auf einem anderen CPU Core fortgesetzt wird. Das ist möglich, weil die
R.Unit in jedem Augeblick den vollständigen Architekturstatus der CPU in ihrer R-Unit
zwischenspeichert, wobei diese Zwischenspeicherung wiederum über Hamming
Fehlerkorrekturcodes abgesichert ist.
L4 Cache (SC) Chip
24,4 x 19,6 mm, 1,5 Milliarden (109) Transistoren,
1 Milliarde dynamische Speicherzellen, Cache Controller, 96 MByte/Chip.
z9 MCM
z196 MCM
2 (z9) bzw. 4 (z196) Cores/CPU Chip, 40 (z9) bzw. 196 (z196) MByte Shared Cache.
Modell z9, Juli 2005
Modell z10, Februar 2008
Modell z196, Juli 2010
z9 Multi-Chip Module
Multichip Module (MCM) benutzen die
Multilagen Ceramic (MLC)
Technologie. Ein MLC Module ihat
etwa 100 Verdrahrungslagen und ist
wenige mm dick. Gezeigt ist das
Einpassen eines z9 MCM in eine
Halterung.
Das MCM wird zusammen mit
Hauptspeicher DIMMs und
zusätzlichen Cards auf ein Printed
Circuit Board aufgelötet.
Die MLC Module Technology hat sich
seit 1987 evolutionär weiter
entwickelt. Weniger und dafür
größere Chips. Die Anzahl der
Transistoren/Chip wuchs um etwa
einen Faktor 106 .
Die Rückseite des Multichip Modules Modules
System z196
Multichip
Module
Kontaktstifte durch 7356
Kontaktpunkte (Lands)
ersetzt.
96 x 96 mm MLC Modul,
103 Verdrahtungslagen.
1800 W max. Power
Thermal Conduction Module
Ein Thermal Conduction Module (TCM) ist eine Baugruppe, welche ein Multilayer Ceramic
(MLC) Multichip Module (MCM) enthält, und die für die Energieabfuhr (Kühlung)
erforderliche Hardware enthält.
Besonders kurze Signallaufzeit zwischen den Chips eines MCM.
z196 TCM hat eine Kühlleistung von 1,8 KWatt.
Mainframe Multichip Multilayer Ceramic Module mit 121 Chip Sites aus den 80er Jahren
MCM Module
mit 133 Chips pro
Module.
Thermal Conduction Module (TCM)
1987 TCM, 133 Chips/MCM, 704 circuits/chip. Multiple Modulespro single CPU.
Multilayer Ceramic Technologie
Querschnitt durch ein MCM
Die 103 Verdrahtungsebenen des z196 Multilayer Ceramic Technologie (MLC) Multichip
Modules ermöglichen effektive Verbindungen der CPU und Cache Chips.
In dem 96 x 96 mm-Modul sind Leiterbahnen mit einer gesamten Länge von mehr als 500
Meter untergebracht.
Eine sehr ähnliche Packungstechnologie hat sich in der Hochfrequenztechnik bewährt.
Die Glas-Keramik-Technologie steht im Gegensatz zu den normalerweise in Printed Circuit
Boards (PCB) verwendeten organischen Materialien und Wirebond Peripheral InterconnectVerfahren mit Lead Frame- oder Pin Grid Array (PGA)-Verbindungen. Diese haben
schmalbandige induktive Diskontinuitäten (Drähte, Pins, Leads) und lange Netze mit
erhöhter Laufzeitverzögerung.
MLC Literatur
[ BUR ] W. G. Burger, C. W. Weigel: Multi-Layer Ceramics Manufacturing. IBM Journal of Research and Development,
Volume: 27 No.1,
Jan. 1983, p. 11 - 19
[ KAT ] G. A. Katopis et al. : MCM technology and design for the S/390 G5 system. IBM Journal of Research and
Development, Vol. 43, Nos. 5/6, 1999, p. 621.
A. J. Blodgett, D. R. Barbour: Thermal Conduction Module: A High-Performance Multilayer Ceramic Package.
Volume 26, Number 1, 1982, Page 30.
Thermal
Conduction
Module
Aluminium-Kühlstempel,
Konus Radius:
mehrere 100 Meter.
Die Wärmeleitfähigkeit von
Helium ist größer als die
jeder anderen bekannten
Substanz.
TCM Wärmeübergang
Der 1995 von Intel herausgebrachte Pentium Pro Microprozessor verwendete ein 387 Pin
Multi Layer Ceramic (MLC) Multi Chip Module (MCM) und hatte eine überdurchschnittliche
Leistung.
Cache Struktur eines z 196 Multichip Modules
z 196 Multichip Module hat
sechs CPU Chips (CP0
..CP5) sowie zwei L4 Cache
Chips.
Jedes CPU Chip ist mit
beiden L4 Cache Chips
direkt verbunden Außerdem
sind die CPU Chips direkt
mit den Hauptspeicher
DIMMs verbunden.
Ein z 196 System kann 4 als
Books bezeichnete
Baugruppen enthalten.
Jedes Book beinhaltet ein
Multichip Module.
Die L4 Cache Chips aller
Books sind miteinander
(FCB) verbunden und bilden
einen gemeinsam genutzten
Cache.
z196 Multichip Module
Alle Books sind in einer Punkt zu Punkt Topologie miteinander verbunden.
Daten Transfer zwischen den Books über L4 (z196) bzw. L2 (z9) Cache
L4 (z196) bzw. L2 (z9) Cache wird von allen CPUs aller Books gemeinsam genutzt.
NUMA Cache (Non Uniform Memory Architecture)
MCM
MCM
MCM
MCM
Die vier L4 Caches der Books mit je 24 CPU Cores sind mittels einer Punkt zu Punkt
Topologie direkt miteinander verbunden. Direkter Datenaustausch zwischen den vier L4
Caches.
Alle 4 x 24 = 96 Cores greifen auf die L4 Caches aller Books direkt zu.
In den Mainframe Rechnern erfolgt der Datentransfer zwischen Plattenspeicher und Cache.
Damit sind wesentlich höhere Datenraten möglich.
Book
8 Fanout
Card
Anschüsse
2 pro
Fanout Card
single
Book
FSP
Flexible
Service Processor
STP
server time protocol
Alle Books (besonders deren Distributed Converter Assembly Stromversorgungen, DCAs),
alle I/O Cages und zwei redundat ausgelegte Stromversorgungen beinhalten eine Flexible
Support Processor (FSP) Card, die über ein Ethernet Kabel mit dem Support Element
(einem Thinkpad Laptop) verbunden sind.
Hardware System Area
HSA
Hauptspeicher
• Minimal Configuration 32 GByte
• Maximal Configuration . 3 056 GByte
3 056 + 16 = 3 072
256 x 4 x 3 = 3 072
Zusätzlich enthält jeder Mainframe Rechner einen als HSA (Hardware System Area)
bezeichneten Speicherbereich, der in dem gleichen physischen Speicher wie der
Hauptspeicher untergebracht ist.
Die HSA ist für den Programmierer nicht zugänglich und enthält „Firmware“ Code und
zugehörige Daten.
Firmware ist Code, der mit der Hardware ausgeliefert wird, und Betriebssystem unabhängig
arbeitet. Beispiele für Firmware Code:
• Diagnostics
• Hardware Fehler-Behandlung
• PR/SM Hypervisor
System Frame
Infiniband
Struktur eines z9, z10 oder z196 Mainframe Systems.
Bis zu 28 I/O Adapter Cards pro I/O Cage, für Verbindungen zu Plattenspeichern,
Magnetbändern und anderen I/O Geräten.
Ein System z Rechner besteht
aus 2 meinstens nebeneinander
aufgestellten Rahmen, (Z Frame“
und A Frame)“
Z Frame
A Frame
Ein System z Rechner hat ein Minimum von 1 Book und ein Maximum von 4 Books.
Ein minimales System hat nur ein A Frame und einen einzigen I/O Cage. Das z Frame hat
Platz für 2 weitere I/O Cages.
Ein Support Element (regulärer Thinkpad Laptop) steuert das System
Geöffneter z196 Rechner (ohne Türen).
Alle I/O Geräte, besonders auch Plattenspeicher, sind in getrennten Gehäusen
untergebracht.
Z Frame und A Frame eines älteren z990 Mainframe.
Ein z9 Modell sieht nur geringfügig anders aus.
Ein fast leerer I/O Cage mit 5 gesteckten I/O Adapter Cards
Gezeigt ist ein Entwicklungsingenieur, wie er gerade ein Book aus einem z9 Rechner entfernt.
Plattenspeichereinheit
Enterprise Storage Server
Mainframe
Glasfaserkabel
z Frame + A Frame
Magnetbandeinheit
Roboter
I/O Einheiten, besonders auch für Plattenspeicher, befinden sich grundsätzlich in externen
Gehäusen. Eine Mainframe Konfiguration besteht mindestens aus dem Mainframe selbst
und einer externen Plattenspeichereinheit.
I/O Einheiten werden über Glasfaserkabel mit dem Mainframe verbunden. Die
Datenübertragung erfolgt mittels der FICON Version des Fibre Channel Protokolls. Fibre
Channel wird auch von Unix Großrechnern für den Anschluss von Plattenspeichern und
anderen I/O Geräten benutzt.
FICON
Adapter Card
4 Glasfaser
Anschlüsse
Mainframe Earthquake Test
Die hohe Verfügbarkeit der Mainframes beruht auf einer sehr großen Anzahl einzelner
Maßnahmen und Eigenschaften der Hardware, Software oder einer Kombination von
beiden.
Ein Beispiel ist der „Erdbebentest“. Gefordert ist, dass bei einem Erdbeben mit dem Wert
9,0 auf der Richterskala der Mainframe Rechner dies ungestört überlebt, und dass
spezifisch alle Software unbeeinträchtigt und ohne Absturz, (während des Bebens und
hinterher) weiterläuft.
Das Video
http://www.informatik.uni-leipzig.de/cs/Literature/esiisup/earthquake.html
zeigt einen „Erdbebentest“, durchgeführt in der IBM Fabrik in Poughkeepsie, N.Y. Während
des Testes laufen z/OS und alle anderen Subsysteme und Anwendungsprogramme
ungestört weiter.

Documentos relacionados