SPARC Enterprise T5120 und T5220 Server

Transcrição

SPARC Enterprise T5120 und T5220 Server
SPARC® Enterprise
T5120 und T5220 Server –
Produkthinweise
Handbuch-Code C120-E458-04DE
Teilenr. 875-4277-14
Oktober 2008, Version A
Copyright 2008 Sun Microsystems, Inc., 4150 Network Circle, Santa Clara, Kalifornien 95054, USA. Alle Rechte vorbehalten.
FUJITSU LIMITED stellte für Teile dieses Dokuments technische Informationen zur Verfügung.
Sun Microsystems, Inc. und Fujitsu Limited besitzen oder überwachen die Rechte am geistigen Eigentum für die in diesem Dokument
beschriebenen Produkte und Technologien. Diese Produkte, Technologien und dieses Dokument sind durch Gesetze zum Urheberrecht,
Gesetze zum Patentschutz und weitere Gesetze zum geistigen Eigentum und durch internationale Verträge geschützt. Die Rechte am geistigen
Eigentum von Sun Microsystems, Inc. und Fujitsu Limited in Bezug auf diese Produkte, Technologien und dieses Dokument umfassen ohne
Einschränkung eines oder mehrere der in den Vereinigten Staaten angemeldeten Patente, die unter http://www.sun.com/patents aufgelistet
sind, sowie eines oder mehrere zusätzliche Patente bzw. anhängige Patentanmeldungen in den Vereinigten Staaten und anderen Ländern.
Die Bereitstellung dieses Dokuments und der dazugehörigen Produkte sowie der Technologien erfolgt im Rahmen von Lizenzen, nach welchen
deren Verwendung, Vervielfältigung, Verbreitung und Dekompilierung Einschränkungen unterliegt. Ohne eine vorherige schriftliche
Genehmigung von Fujitsu Limited und Sun Microsystems, Inc. und gegebenenfalls deren Lizenzgeber darf kein Teil des Produkts oder dieses
Dokuments in irgendeiner Form reproduziert werden. Die Bereitstellung dieses Dokuments überträgt weder ausdrücklich noch
stillschweigend jegliche Rechte oder Lizenzen an den darin beschriebenen Produkten oder Technologien. Dieses Dokument stellt keine
Verpflichtung seitens Fujitsu Limited oder Sun Microsystems, Inc. oder deren Tochterunternehmen dar.
Dieses Dokument und die darin beschriebenen Produkte oder Technologien können das geistige Eigentum von Drittfirmen enthalten, für das
Fujitsu Limited und/oder Sun Microsystems, Inc. das Urheberrecht oder Lizenzen erworben haben. Hierzu können auch Software und
Schrifttechnologien gehören.
Eine Kopie des von der GPL oder LGPL überwachten Quellcodes wird dem Endbenutzer gemäß den Bedingungen der GPL oder LGPL zur
Verfügung gestellt. Bitte wenden Sie sich an Fujitsu Limited oder Sun Microsystems, Inc.
Diese Produktausgabe kann von Drittanbietern entwickelte Bestandteile enthalten.
Teile dieses Produkts können auf Berkeley BSD-Systemen basieren, die von der University of California lizenziert werden. UNIX ist in den USA
und in anderen Ländern eine eingetragene Marke, die ausschließlich durch X/Open Company, Ltd., lizenziert wird.
Sun, Sun Microsystems, das Sun-Logo, Java, Netra, Solaris, Sun StorEdge, docs.sun.com, OpenBoot, SunVTS, Sun Fire, SunSolve, CoolThreads
und J2EE sind in den USA und anderen Ländern Marken oder eingetragene Marken von Sun Microsystems Inc.
Fujitsu und das Fujitsu-Logo sind eingetragene Marken von Fujitsu Limited.
Alle SPARC-Marken werden unter Lizenz verwendet und sind in den USA und anderen Ländern Marken oder eingetragene Marken von
SPARC International, Inc. Produkte, die das SPARC-Markenzeichen tragen, basieren auf einer von Sun Microsystems Inc. entwickelten
Architektur.
SPARC64 ist eine Marke von SPARC International, Inc., die unter Lizenz von Fujitsu Microelectronics, Inc. und Fujitsu Limited verwendet wird.
OPEN LOOK und die grafische Benutzeroberfläche von Sun™ wurde von Sun Microsystems, Inc., für seine Benutzer und Lizenznehmer
entwickelt. Sun anerkennt dabei die von Xerox geleistete Forschungs- und Entwicklungsarbeit auf dem Gebiet der visuellen und grafischen
Benutzeroberflächen für die Computerindustrie. Sun ist Inhaber einer nicht ausschließlichen Lizenz von Xerox für die grafische
Benutzeroberfläche von Xerox. Diese Lizenz gilt auch für die Lizenznehmer von Sun, die mit den OPEN LOOK-Spezifikationen
übereinstimmende Benutzerschnittstellen implementieren und sich an die schriftlichen Lizenzvereinbarungen mit Sun halten.
Haftungsausschluss: Die einzigen Garantien, die von Fujitsu Limited, Sun Microsystems, Inc. oder deren Tochterunternehmen in Bezug
auf dieses Dokument oder die darin beschriebenen Produkte oder Technologien übernommen werden, sind ausdrücklich in der
entsprechenden, mit dem Produkt oder der Technologie ausgelieferten Lizenzvereinbarung aufgeführt. SOFERN NICHT
AUSDRÜCKLICH IN EINER SOLCHEN LIZENZVEREINBARUNG ANGEGEBEN, GEBEN FUJITSU LIMITED, SUN MICROSYSTEMS,
INC. UND DEREN TOCHTERUNTERNEHMEN WEDER AUSDRÜCKLICHE NOCH STILLSCHWEIGENDE ZUSICHERUNGEN ODER
GEWÄHRLEISTUNGEN IN BEZUG AUF DAS PRODUKT ODER DIE TECHNOLOGIE ODER DIESES DOKUMENT. PRODUKTE,
TECHNOLOGIEN UND DOKUMENTE WERDEN „IN DER VORLIEGENDEN FORM“ BEREITGESTELLT UND ALLE AUSDRÜCKLICHEN
ODER STILLSCHWEIGENDEN BEDINGUNGEN, ZUSICHERUNGEN UND GARANTIEN, EINSCHLIESSLICH EINER
STILLSCHWEIGENDEN GARANTIE DER HANDELSÜBLICHEN QUALITÄT, DER EIGNUNG FÜR EINEN BESTIMMTEN ZWECK ODER
DER NICHTVERLETZUNG VON RECHTEN WERDEN IM RECHTLICH ZULÄSSIGEN UMFANG AUSGESCHLOSSEN. Sofern nicht
ausdrücklich in einer solchen Vereinbarung angegeben und im rechtlich zulässigen Umfang haften Fujitsu Limited, Sun Microsystems, Inc.
oder eines ihrer Tochterunternehmen gegenüber Dritten keinesfalls für den Verlust von Umsätzen oder Gewinnen, den Verlust und die
Unbrauchbarkeit von Daten, eine Geschäftsunterbrechung oder für indirekte, spezielle, Begleit- oder Folgeschäden, auch wenn die Möglichkeit
solcher Schäden angezeigt wurde.
DIE DOKUMENTATION WIRD „IN DER VORLIEGENDEN FORM“ BEREITGESTELLT UND ALLE AUSDRÜCKLICHEN ODER
STILLSCHWEIGENDEN BEDINGUNGEN, ZUSICHERUNGEN UND GARANTIEN, EINSCHLIESSLICH EINER STILLSCHWEIGENDEN
GARANTIE DER HANDELSÜBLICHEN QUALITÄT, DER EIGNUNG FÜR EINEN BESTIMMTEN ZWECK ODER DER
NICHTVERLETZUNG VON RECHTEN WERDEN IN DEM RECHTLICH ZULÄSSIGEN UMFANG AUSGESCHLOSSEN.
Bitte
wiederverwerten
Inhalt
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
Technischer Support und Dokumentation
Technischer Support
Dokumentation
2
2
2
Unterstützte Betriebssystem- und Firmwareversionen
Systemfirmware
3
3
Vorinstallierte und vorab geladene Software
Solaris 10 OS und Solaris Live Upgrade
4
5
Zusätzliche Software für Ihren Server – Cool Tools
Logische Domänen
6
6
Dienstprogramm Sun Explorer
7
Sun Studio C, C++ & Fortran Compiler und Tools
Sun Java Enterprise System
7
8
Informationen zu obligatorischen Patches
▼
1
So laden Sie Patches herunter
Patches für Erweiterungskarten
9
10
10
Installieren der 4 Gbps Fibre-Channel-Karte
11
iii
Allgemeine Funktionseinschränkungen
Verschlüsselungsfunktion
RAID-Funktion
11
11
11
Kabelführungsarm
12
Identifizieren von Prozessoren
Aktuelle Informationen
13
15
Probleme mit Hardware und Mechanik
16
L2 Cache-Fehlermeldungen erzeugen möglicherweise eine unberechtigte
Hauptspeicher-Fehlermeldung (CR 6592272) 19
Irrtümlich gemeldete Netzteilfehler (CR 6614432)
20
Ein nicht montierter integrierter Lüfter wurde irrtümlich als fehlerhaft
gemeldet (CR 6636098) 21
Bei der Durchführung von POST wird mit dem Befehl showfaults ein
Fehler erkannt, doch POST wird normal beendet (CR 11210193) 22
Nach dem Beenden von POST wird die Eingabeaufforderung ok nicht
angezeigt (CR 11215994) 22
Probleme mit der Ethernet-Schnittstelle
24
Das Aufrufen von modunload bei laufendem nxge-Port kann einen
Systemabsturz verursachen (CR 6551509) 26
▼
So deaktivieren Sie die Schnittstellen vor dem Entladen des
Treibers 26
Zeitweiliger PCIe-Verbindungsfehler beim Booten führt später zu
schwerwiegendem Fehler (CR 6553515) 27
Jumbo-Frames-Durchsatz von nxge sinkt auf 30 Mbit/s, weil Pakete
verworfen werden (CR 6554478) 29
▼
So legen Sie eine MTU-Größe von 8172 fest
29
Ierrs-Fehler werden generiert, wenn die Option „Forced Speed/Duplex“ in
der e1000g.conf-Datei auf 100 Mbit/s und Vollduplex gesetzt wird
(CR 6555486) 31
Das Einstellen von Eigenschaften für nxge-Geräte kann fehlschlagen
(CR 6561389) 32
iv
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Server in nxge_start stürzt ab, wenn dupb fehlschlägt (CR 6567838)
▼
So deaktivieren Sie Jumbo-Frames
▼
So legen Sie eine kleinere MTU-Größe fest
33
33
Probleme mit Firmware, ILOM, POST und Service-Prozessor
34
Die PCIe-Verbindung arbeitet nicht mit 8 Kanälen (CR 6556505)
▼
So identifizieren Sie das Problem
▼
So beheben Sie den Fehler
32
45
45
46
Der break-Befehl für Terminalserver an der seriellen Leitung des ServiceProzessors funktioniert nicht (CR 6577528) 46
Der Befehl showfaults zeigt die Hauptplatine anstelle des DIMMs als
fehlerhaft an (CR 6582853) 48
Die Befehle uadmin 2 0 und reboot lesen alte Boot-Modus-Einstellungen ein
(CR 6585340) 49
Ein Kommunikationskanal kann sich zwischen der primären Domäne und
dem Service-Prozessor aufhängen (CR 6583567) 50
▼
Wiederherstellung nach einem Domänenabsturz
51
Zurücksetzen des Service-Prozessors erzeugt irreführende Warnmeldungen
(CR 6585292) 52
Domänen-ETM und LDC sperren sich gegenseitig, wenn die
Übertragungswarteschlange voll ist (CR 6594506) 53
Irreführende PIU-Fehlermeldungen (CR 6598381)
55
Die Diagnoseroutine, die beim Programmstart (IBIST) ausgeführt wird, trennt
eventuell die Memory Controller Unit (MCU) (CR 6618773) 56
Fehlermeldungen der Ultra320 SCSI-Karte
56
Fehlermeldung: MCU möglicherweise in DIMM-Modul getrennt
(CR 6656116) 57
Probleme mit dem Betriebssystem Solaris
58
Server stürzen aufgrund eines Fehlers im PCIe-Root-Complex eventuell ab
(CR 6555956) 64
Informationen zur physikalischen Plattform fehlen in der prtpicl- und
prtdiag-Ausgabe (CR 6586624) 65
Inhalt
v
Beim Booten des Betriebssystems Solaris von einem externen USB-DVDROM-Laufwerk kann es zu einem Absturz kommen (CR 6588452) 66
Der Befehl prtdiag -v weist Formatierungsprobleme auf (CR 6587389)
PSH-Ereignisse werden nicht mehr ausgetauscht (CR 6594506)
67
67
Im Sun Explorer ist die Erfassung von ILOM-Informationen nicht möglich
(Tx000) (CR 6718841) 69
Probleme im Zusammenhang mit LDoms
Dokumentations-Errata
70
73
SPARC Enterprise T5120 und T5220 Server – Überblick
73
Die Angaben zur Advanced ECC-Technologie im Abschnitt
„Fehlerkorrektur und Paritätsprüfung” auf Seite 12 sind
unvollständig. 73
SPARC Enterprise T5120 and T5220 Servers Installation Guide
73
Die Legende zu den Abbildungen 1-4 und 1-6 ist falsch.
SPARC Enterprise T5120 und T5220 Server – Wartungshandbuch
73
74
Die Angaben unter „Hauptspeicher” in TABELLE 1 sind
unvollständig. 74
Die Angaben im Abschnitt „1.2.1 Eingebaute Karten und Platinen” auf
Seite 1-9 sind falsch. 74
Die Angaben im Abschnitt „2.1.1 Behandlung von Speicherfehlern” auf
Seite 2-8 sind falsch. 75
Die Angaben im Abschnitt „5.6 Wartungsarbeiten am SCC-Modul” auf
Seite 5-24 sind falsch. 75
Die Angaben im Abschnitt „5.7 Wartungsarbeiten an der
Hauptplatinenbaugruppe” auf Seite 5-26 sind unvollständig.
SPARC Enterprise T5120 und T5220 Server – Systemverwaltungshandbuch
76
77
Der Befehl zum Einschalten der Such-LED unter den Abbildungen 2-1
und 2-2 ist falsch. 77
In Tabelle 2-5 sind falsche Gerätekennungen aufgeführt.
Liste mit den Standardeinstellungen in Tabelle 2-4
vi
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
78
77
Integrated Lights Out Manager 2.0 – Ergänzungshandbuch für SPARC Enterprise
T5120 und T5220 Server 78
Falscher Standardwert unter „So legen Sie mit der CLI die
Diagnoseteststufe fest” 78
Die Befehlsoption für keyswitch_state ist falsch.
78
In diesem Handbuch nicht beschriebene ILOM-Eigenschaften
78
Das Beispiel der ALOM-kompatiblen Befehlszeilenschnittstelle im
Abschnitt „Neuer Commit-Schritt” auf Seite 38 ist unvollständig.
79
Argumentliste zum Zurücksetzen des Service-Prozessors auf werkseitige
Standardwerte ist falsch. 79
Probleme beim Anschließen mit ILOM
79
Informationen zu Befehlen der ALOM CMT-Shell
Integrated Lights Out Manager 2.0 Benutzerhandbuch
80
80
Im Abschnitt „Bearbeiten eines SNMP-Benutzerkontos mithilfe der CLI”
auf Seite 190 ist ein falscher Befehl angegeben. 80
In mehreren SPARC T5120 und T5220 Server-Handbüchern
80
Logische Gerätenamen für Festplatten sind nicht konsistent
80
Inhalt
vii
viii
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
KAPITEL
1
Wichtige Informationen zu den SPARC
Enterprise T5120 und T5220 Servern
Dieses Kapitel enthält wichtige Informationen zu den SPARC Enterprise T5120 und
T5220 Servern.
Folgende Themen werden behandelt:
■
„Technischer Support und Dokumentation“ auf Seite 2
■
„Unterstützte Betriebssystem- und Firmwareversionen“ auf Seite 3
■
„Vorinstallierte und vorab geladene Software“ auf Seite 4
■
„Informationen zu obligatorischen Patches“ auf Seite 9
■
„Allgemeine Funktionseinschränkungen“ auf Seite 11
■
„Identifizieren von Prozessoren“ auf Seite 13
1
Technischer Support und Dokumentation
In diesem Abschnitt erfahren Sie, wo Sie technischen Support, Software und
Dokumentation erhalten.
Technischer Support
Bei technischen Fragen oder Problemen, die nicht in der Dokumentation zum
SPARC Enterprise T5140 bzw. T5240 Server behandelt werden, setzen Sie sich bitte
mit einem unserer Vertragshändler oder einem zertifizierten Kundendiensttechniker
in Verbindung.
Dokumentation
Anweisungen zur Installation, Verwaltung und Bedienung der Server finden Sie in
der Dokumentation zum SPARC Enterprise T5120 und T5220 Server. Der gesamte
Dokumentation steht auf folgenden Websites zum Download bereit:
Globale Site
http://www.fujitsu.com/sparcenterprise/manual/
Nordamerikanische Site
https://download.computers.us.fujitsu.com/
Japanische Site
http://primeserver.fujitsu.com/sparcenterprise/manual/
Hinweis – Informationen in diesen Produkthinweisen ersetzen die entsprechenden
Informationen in der Dokumentation zum SPARC Enterprise T5120 und T5220 Server.
2
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Unterstützte Betriebssystem- und
Firmwareversionen
In TABELLE 1-1 sind die unterstützten, mindestens erforderlichen und vorinstallierten
Versionen des Betriebssystems Solaris und der Systemfirmware für den SPARC
Enterprise T5120 und T5220 Server aufgeführt.
Auf dem Server sind Betriebssystem, Patches und Firmware vorinstalliert. Sie können
aber dieselbe nochmals oder eine andere unterstützte Version neu installieren.
Beachten Sie bitte, dass für einige Betriebssystemversionen obligatorische Patches
installiert werden müssen. Näheres dazu finden Sie in „Informationen zu
obligatorischen Patches“ auf Seite 9.
Wenn Sie das Betriebssystem installieren, haben Sie keinen Zugriff auf die werkseitig
installierte Zusatzsoftware. Lesen Sie dazu „Vorinstallierte und vorab geladene
Software“ auf Seite 4.
TABELLE 1-1
Unterstützte, mindestens erforderliche und vorinstallierte Betriebssystem- und
Firmwareversionen
Unterstützte Versionen
Mindestens erforderliche Version
Vorinstallierte Version*
Betriebssystem
• Solaris 10 8/07 OS und Patches
• Solaris 10 5/08 OS und Patches
Solaris 10 8/07 OS
Solaris 10 8/07 OS
Firmware
• System Firmware 7.0.3
• System Firmware 7.1.0.g (in Patch
136932-01 zur Verfügung gestellt)
System Firmware 7.0.3
System Firmware 7.1.0.g
* Die in der Spalte mit den vorinstallierten Versionen aufgeführten Betriebssystem- und Firmwareversionen sind die zum Zeitpunkt der
Veröffentlichung dieses Dokuments gültigen Versionen. Die vorinstallierten Versionen ändern sich jedoch im Lauf der Zeit. Je nach
Kaufdatum sind auf Ihrem Server daher möglicherweise andere als in der Tabelle genannte Versionen vorinstalliert.
Systemfirmware
Die Systemfirmware steuert bestimmte Aspekte des Hosts und des ServiceProzessors. Sie besteht aus den folgenden Einzelkomponenten:
■
Integrated Lights Out Manager (ILOM) 2.0-Firmware
■
OpenBoot™-Firmware
■
POST-Firmware
■
Hypervisor-Firmware
■
VBSC-Firmware
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
3
Updates der Systemfirmware können von folgender Website als Patch-Releases
heruntergeladen werden:
http://www.fujitsu.com/global/services/computing/server/sparcent
erprise/downloads/firmware/
Beim Aktualisieren der Systemfirmware werden alle Einzelkomponenten
aktualisiert. Die Firmwarekomponenten können nicht einzeln aktualisiert werden.
Weitere Informationen zum Aktualisieren der Serverfirmware finden Sie im SPARC
Enterprise T5120 and T5220 Servers Installation Guide.
Vorinstallierte und vorab geladene
Software
In diesem Abschnitt wird Folgendes beschrieben:
TABELLE 1-2
■
Vorinstallierte Software (TABELLE 1-2), die unmittelbar eingesetzt werden kann.
■
Vorab geladene Software (TABELLE 1-3), die vor der ersten Verwendung installiert
werden muss.
Vorinstallierte Software
Software
Speicherposition
Funktion
Solaris 10 8/07 OS
Die root-Partition (/) ist auf dem Bereich (Slice) 0
installiert. Der Betriebssystemkern befindet sich
auf dem Slice 3 und dient als alternative BootUmgebung (ABE) für Live Upgrade.
Betriebssystem und alternative
Boot-Umgebung.
Näheres dazu finden Sie in „Solaris
10 OS und Solaris Live Upgrade“
auf Seite 5.
Cool Tools GCC
v. 4.0.4
/opt/gcc und /opt/SUNW0scgfss
GCC-Compiler für SPARC-Systeme.
Näheres dazu finden Sie in
„Zusätzliche Software für Ihren
Server – Cool Tools“ auf Seite 6.
LDoms Manager
1.0.1
LDoms Manager:
• /opt/LDoms_Manager-1_0_1-RR/Produkt
• /opt/SUNWldm
LDoms MIB:
• /opt/ldoms_mib
• /opt/SUNWldmib
Verwaltung logischer Domänen.
Näheres dazu finden Sie in
„Logische Domänen“ auf Seite 6.
4
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 1-2
Vorinstallierte Software (Fortsetzung)
Software
Speicherposition
Funktion
Sun Explorer
/opt/SUNWexplo
Dienstprogramm zur
Datensammlung.
Näheres dazu finden Sie in
„Dienstprogramm Sun Explorer“
auf Seite 7.
Sun Studio 12
Werkzeuge für
Entwickler
/opt/SUNWspro/extra/bin
/opt/SUNWspro
Sun Studio-Entwicklungstools.
Näheres dazu finden Sie in „Sun
Studio C, C++ & Fortran Compiler
und Tools“ auf Seite 7.
TABELLE 1-3
Vorab geladene Software
Software
Speicherposition
Funktion
Sun Java Enterprise
System 5 U1
/var/spool/stage/JES5/Solaris_sparc
Eine Software, die MiddlewareServices bereitstellt, um
Netzwerkanwendungen zu
optimieren.
Solaris 10 OS und Solaris Live Upgrade
Das Betriebssystem Solaris 10 ist vollständig auf Ihrem System installiert. Dazu zählen
alle Optionen, die über „Gesamte Distribution einschließlich OEM-Support“
installiert werden. Diese Software enthält alle von dieser Solaris-Version unterstützten
Gebietsschemata. Darüber hinaus sind einige Patches auf Ihrem Server vorinstalliert.
Näheres dazu finden Sie in „Informationen zu obligatorischen Patches“ auf Seite 9.
Hinweis – Bestimmte Software, die mit dem Solaris 10 8/07 Medien-Kit bereitgestellt
wird, ist noch nicht auf Ihrem System installiert. Falls Sie diese zusätzliche Software
verwenden möchten, beschaffen Sie sich das vollständige Medien-Kit für diese SolarisVersion und installieren Sie die Software von den im Lieferumfang enthaltenen
Datenträgern. Bestellen Sie das entsprechende Medien-Kit für die Version, die auf
Ihrem System vorinstalliert ist.
Ihr Server ist mit einer liveupgrade-Partition auf Slice 3 konfiguriert,
die ein Duplikat des Betriebssystems Solaris (nur Betriebssystemkern) enthält.
Die liveupgrade-Partition wird auch als alternative Boot-Umgebung (ABE)
bezeichnet. Dank dieser Technologie kann das Betriebssystem Solaris ganz normal
ausgeführt werden, während in einer inaktiven Boot-Umgebung ein Upgrade oder
normale Wartungsarbeiten ausgeführt werden.
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
5
Weitere Informationen zu Solaris Live Upgrade finden Sie hier:
http://www.sun.com/software/solaris/liveupgrade
Je nachdem, welche Version des Betriebssystems Solaris Sie installieren oder
aufrüsten, müssen Sie unter Umständen eine andere Version von Solaris Live
Upgrade installieren. Informationen zur Installation der richtigen Version von
Solaris Live Upgrade finden Sie hier:
http://www.sun.com/software/preinstall
Zusätzliche Software für Ihren Server – Cool Tools
Cool Tools enthalten eine Sammlung kostenlos erhältlicher Tools, mit denen Sie
optimal konfigurierte Softwarelösungen auf CoolThreads™-Servern schnell und
effizient entwickeln und bereitstellen können. Diese Tools verbessern die Leistung
von und Entwicklungszeiten für Anwendungen auf diesen Servern erheblich.
Eine Übersicht der Cool Tools und eine vollständige Dokumentation finden Sie unter:
http://www.sun.com/servers/coolthreads/overview/cooltools.jsp
Nicht alle auf der Cool Tools-Website aufgeführten Cool Tools sind auf Ihrem Server
installiert. Auf der Cool Tools-Website finden Sie Informationen zu weiteren Tools,
die Sie herunterladen und auf diesen Servern installieren können.
Logische Domänen
Eine logische Domäne ist eine diskrete logische Gruppierung mit eigenem
Betriebssystem, Ressourcen und einer Identität innerhalb eines bestimmten
Computersystems. Logische Domänen lassen sich unabhängig voneinander
erstellen, löschen, neu konfigurieren und neu starten, ohne dass dazu der Server
aus- und wieder eingeschaltet werden muss. Durch die Ausführung verschiedener
Anwendungen in unterschiedlichen logischen Domänen haben Sie die Möglichkeit,
die Anwendungen aus Leistungs- und Sicherheitsgründen voneinander getrennt zu
halten.
Mithilfe logischer Domänen (LDoms) lassen sich Auslastung, Effizienz und
Investitionsrendite von Servern steigern und die Stellfläche verringern. Mit LDoms
Manager können Sie logische Domänen erstellen und verwalten und logische
Domänen physikalischen Ressourcen zuordnen.
6
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Hinweis – Die LDoms-MIB muss vor der Verwendung konfiguriert werden. Eine
README-Datei mit Konfigurationsanweisungen befindet sich im LDoms-MIBInstallationsverzeichnis /opt/ldoms_mib.
Weitere Informationen zu LDoms finden Sie hier:
http://www.fujitsu.com/global/services/computing/server/sparcent
erprise/products/software/ldoms/
Dienstprogramm Sun Explorer
Sun Explorer ist ein Tool zur Erfassung von Diagnosedaten und umfasst ShellSkripte und einige binäre ausführbare Dateien. Sun Explorer wird unter dem
Betriebssystem Solaris ausgeführt.
Die SPARC Enterprise T5120 und T5220 Server werden vom
Datenerfassungsdienstprogramm Sun Explorer 5.10 (oder höher), nicht aber von
früheren Versionen des Dienstprogramms unterstützt. Mit der Installation der
Software Sun Cluster oder Sun Net Connect aus dem vorinstallierten Java ESPackage wird automatisch auch eine frühere Version des Dienstprogramms auf dem
System installiert. Ermitteln Sie nach der Installation von Java ES-Software, ob eine
ältere Version von Sun Explorer auf dem System installiert wurde. Geben Sie hierzu
Folgendes ein:
# pkginfo -l SUNWexplo
Ist eine frühere Version vorhanden, deinstallieren Sie diese und installieren
stattdessen Version 5.10 oder höher. Version 5.10 können Sie hier herunterladen:
http://www.sun.com/sunsolve
Sun Studio C, C++ & Fortran Compiler und Tools
Sun Studio bietet eine bessere Leistung, indem es C-, C++- und Fortran-Compiler für
das Betriebssystem Solaris bei Multicore-Systemen optimiert.
Einen Überblick und Dokumentation finden Sie hier:
http://developers.sun.com/sunstudio/index.jsp
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
7
Sun Java Enterprise System
Die Sun Java Enterprise System-Software enthält einen vollständigen Satz an
Middleware-Services, um Unternehmensanwendungen zu unterstützen, die über
eine Netzwerk- oder Internet-Umgebung verteilt sind. Die Java EnterpriseSystemkomponenten, die die Serviceleistungen zur Verfügung stellen, werden
mithilfe eines allgemeinen Installationsprogramms installiert, mit gemeinsam
genutzten Bibliotheken synchronisiert und in einem integrierten Benutzeridentitätsund Sicherheitsverwaltungssystem freigegeben.
Die Sun Java Enterprise System-Software stellt die folgenden Services bereit:
■
Portal-Services – Portal-Server, Portal-Server Secure Remote Access, Access
Manager, Directory Server, Anwendungsserver oder Webserver
■
Kommunikations- und Kollaborationsservices – Messaging Server, Calendar Server,
Instant Messaging, Access Manager, Directory Server, Anwendungsserver oder
Webserver
■
Netzwerk-Identitätsservices – Access Manager, Directory Server, Webserver
■
Web- und Anwendungsservices – Anwendungsserver, Message Queue,
Webserver
■
Verfügbarkeitsservices – Sun Cluster, Sun Cluster-Agents
Eine Übersicht und weitere Dokumentation finden Sie auf den folgenden Websites:
http://www.sun.com/service/javaes/index.xml
http://docs.sun.com/app/docs/prod/entsys.5
Wenn die Software erneut geladen werden muss, finden Sie Anweisungen zum
Herunterladen und zur Installation auf der folgenden Website:
http://www.sun.com/software/preinstall
Hinweis – Beim Herunterladen einer neuen Kopie der Software enthält diese
möglicherweise nicht alle für den Server obligatorischen Patches. Schlagen Sie nach
der Installation der Software unter „Informationen zu obligatorischen Patches“ auf
Seite 9 nach, wie Sie ermitteln können, welche Patches auf dem System vorhanden
sind.
8
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Informationen zu obligatorischen Patches
Patches sind auf folgenden Websites erhältlich:
Globale Site
http://www.fujitsu.com/global/support/software/security/products-s/patch-info/
Japanische Site
http://software.fujitsu.com/jp/security/products-others/unix/
Nordamerikanische Site
https://download.computers.us.fujitsu.com/
Bevor Sie sich an den Support wenden, vergewissern Sie sich bitte, dass alle
obligatorischen Patches auf dem Server installiert wurden. Über die Installation des
periodisch herausgegebenen PTF hinaus empfiehlt es sich, die oben genannten
Websites regelmäßig auf das Erscheinen neuer Patches zu überprüfen.
TABELLE 1-4 führt die obligatorischen Patches für Ihren Server auf.
Diese Patches sind in einigen Versionen der auf dem Server vorinstallierten und
vorab auf dem Server geladenen Software möglicherweise nicht enthalten. Wenn auf
dem Server Patches fehlen, laden Sie sie wie unter „So laden Sie Patches herunter“
auf Seite 10 beschrieben herunter.
TABELLE 1-4
Obligatorische Patches für beide Server für alle unterstützten
Betriebssystemversionen
Patch-IDs
Beschreibung
127753-01
oder höher
Systemabsturz mit n2cp- Diese Patches stellen eine Korrektur für
Ausrichtungsfehler
Änderungsanfrage (Change Request, CR) 6590132
dar: Systemabsturz (n2cp-Ausrichtungsfehler) bei
IPsec-Tests.
127741-01
oder höher
Datenintegrität im nxge- Korrektur für in Sun-Warnung 103076 gemeldete
Treiber
Probleme.
127745-01
oder höher
IPsec-Leistung
Korrekturen
Korrigiert CR 6568352: IPsec-Leistung lässt sich
mit Hardwareverschlüsselungs-Providern nicht
skalieren.
Wie Sie ermitteln können, ob ein Patch vorhanden ist, wird unter „So laden Sie
Patches herunter“ auf Seite 10 beschrieben.
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
9
▼ So laden Sie Patches herunter
1. Stellen Sie fest, ob die Patches bereits auf dem System installiert sind.
Verwenden Sie hierzu beispielsweise den Befehl showrev für jede Patchnummer:
# showrev -p | grep "Patch: 127753"
■
Wenn das erforderliche Patch aufgeführt wird und die letzten zwei Stellen der
Patchnummer mit der erforderlichen Version übereinstimmen oder höher als
diese sind, ist das richtige Patch bereits auf dem System installiert und es ist kein
weiteres Vorgehen erforderlich.
Ist beispielsweise Patch 127753-01 oder höher bereits installiert, verfügt das System
über die erforderliche Version dieses Patches.
■
Wenn das erforderliche Patch nicht aufgeführt ist oder die Endung kleiner als die
benötigte Version ist, fahren Sie mit Schritt 2. fort.
Sollte beispielsweise keine Version von Patch 127753 angezeigt werden, müssen
Sie dieses Patch herunterladen und installieren.
Die letzten zwei Ziffern der Patch-ID stellen die Version des Patches dar.
2. Gehen Sie auf die oben genannte Website, um die Patches herunterzuladen.
3. Befolgen Sie die Installationsanleitung in der README-Datei des jeweiligen
Patches.
Patches für Erweiterungskarten
Wenn Sie Erweiterungskarten in den Server einbauen, lesen Sie bitte in der
Dokumentation und den README-Dateien zu den einzelnen Karten nach, ob
weitere Patches installiert werden müssen.
10
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Installieren der 4 Gbps Fibre-Channel-Karte
Für die Installation der 4 Gbps Fibre-Channel-Karte (SE0X7F11X, SE0X7F12X) wird
der unten genannte Patch benötigt. Gehen Sie auf die oben genannte Website, um
den Patch herunterzuladen. Befolgen Sie die Installationsanleitung in der READMEDatei des Patches.
Optionale Karten
4 Gbps Einkanal-Fibre-Channel-Karte (SE0X7F11X)
4 Gbps Zweikanal-Fibre-Channel-Karte (SE0X7F12F)
Erforderlicher Patch
FUJITSU PCI Fibre Channel 4.0: 914583-04 oder höher
Allgemeine Funktionseinschränkungen
In diesem Abschnitt werden die für diese Version der SPARC Enterprise T5120 und
T5220 Server bekannten allgemeinen Probleme beschrieben.
Verschlüsselungsfunktion
Die IPsec-Fähigkeit der On-Chip-Verschlüsselungsbeschleunigung auf dem
UltraSPARC T2-Mehrkernprozessor kann nur verwendet werden, wenn das IPsecAktivierungspaket installiert wurde. Da das IPsec-Aktivierungspaket derzeit nicht
von Fujitsu unterstützt wird, kann die IPsec-Funktion auf Servern von Fujitsu nicht
verwendet werden.
RAID-Funktion
Die SPARC Enterprise T5120 und T5220 Server verfügen standardmäßig über eine
Hardware-RAID-Funktion. Aufgrund prinzipieller Überlegungen im Hinblick auf
Datenschutz, Zuverlässigkeit und Wartungsfähigkeit wird diese Funktion von
Fujitsu jedoch nicht unterstützt.
Fujitsu empfiehlt stattdessen die Verwendung von Software-RAID-Funktionen für
interne Festplatten, wie im Folgenden erläutert:
■
PRIMECLUSTER GDS
■
Solaris Volume Manager (Bestandteil des Betriebssystems Solaris)
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
11
Kabelführungsarm
Der SPARC Enterprise T5120 Server unterstützt den Kabelführungsarm (CMA) nicht.
Folgende Einschränkungen gelten bei der Verwendung des Kabelführungsarms mit
dem SPARC Enterprise T5220 Server:
■
Der Kabelführungsarm ist für ca. 2 Wechselstromkabel und 6 RJ45-Kabel ausgelegt.
■
Der Kabelführungsarm ist nicht für optische Kabel geeignet. Führen Sie solche
Kabel durch den Freiraum oberhalb des Kabelführungsarms.
■
Der Kabelführungsarm ist nicht für Kabel mit Kabelseele (z. B. SCSI-Kabel)
geeignet. Führen Sie solche Kabel durch den Freiraum oberhalb des
Kabelführungsarms.
Um optionale Produkte mit folgender Strukturbeschränkung zu installieren,
muss zunächst der Kabelführungsarm deinstalliert und entfernt werden.
■
12
Kabel mit großen Anschlüssen (z. B. für eine XVR-300- oder SAS-Karte)
müssen am obersten PCIe-Steckplatz angeschlossen werden.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Identifizieren von Prozessoren
Prozessor-IDs beginnen u. U. nicht bei 0 oder sind nicht fortlaufend.
Unterschiedliche Plattformen und Plattformen des gleichen Modells weisen
eventuell unterschiedliche Prozessor-IDs für identische Konfigurationen auf.
Beispielsweise beginnen auf UltraSPARC® T1 CPU-basierten Plattformen ProzessorIDs mit der Prozessorkennung 0, aber andere Plattformen, einschließlich den auf der
UltraSPARC T2 CPU basierenden, weisen eventuell keine Prozessorkennung 0 auf.
Der Solaris-Befehl psrinfo zeigt für Plattformen, die auf dem UltraSPARC T2Prozessor basieren, möglicherweise eine Ausgabe ähnlich der Folgenden an:
8
9
16
17
on-line
on-line
on-line
on-line
since
since
since
since
09/18/2007
09/18/2007
09/18/2007
09/18/2007
21:26:25
21:26:30
21:26:30
21:26:30
Die Prozessor-IDs sind von Bedeutung, wenn Sie LDoms ausführen. Bei einer
Plattform, auf der ein Manager für virtuelle Computer mehrere Gastdomänen
verwaltet, kann es sich bei den in eine Gastdomäne exportierten Prozessor-IDs um
eine virtuelle Abstraktion handeln. Innerhalb jeder Gastdomäne ist jede für die
Software sichtbare Prozessor-ID ein eindeutiger, ganzzahliger Wert.
Software, die in unterschiedlichen Gastdomänen auf dem gleichen physischen
Computer ausgeführt wird, sieht entweder den gleichen oder einen
unterschiedlichen Satz virtueller Prozessor-IDs. Wenn der Server LDoms ausführt,
sind die virtuellen Prozessor-IDs und physische Prozessor-IDs niemals gleich.
Weitere Informationen über die Zuordnung von virtuellen und physischen CPUNummern finden Sie im Logical Domains (LDoms) 1.0.2 Administration Guide.
Prozessor-IDs sind einmalige ganze Zahlen in der Domäne, in der die Software
ausgeführt wird. Die ganzzahligen Werte passen auf den Typ processorid_t.
Lesen Sie hierzu auch die Manpage p_online(2).
Kapitel 1
Wichtige Informationen zu den SPARC Enterprise T5120 und T5220 Servern
13
14
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
KAPITEL
2
Aktuelle Informationen
Diese Produkthinweise enthalten wichtige und aktuelle Informationen über die
SPARC® Enterprise T5120 und T5220 Server.
Dieses Dokument enthält die folgenden Abschnitte:
■
„Probleme mit Hardware und Mechanik“ auf Seite 16
■
„Probleme mit der Ethernet-Schnittstelle“ auf Seite 24
■
„Probleme mit Firmware, ILOM, POST und Service-Prozessor“ auf Seite 34
■
„Probleme mit dem Betriebssystem Solaris“ auf Seite 58
■
„Probleme im Zusammenhang mit LDoms“ auf Seite 70
■
„Dokumentations-Errata“ auf Seite 73
15
Probleme mit Hardware und Mechanik
TABELLE 2-1 enthält eine Liste der aktuellen Informationen zu Problemen mit
Hardware und Mechanik. Weitere Informationen zu bestimmten
Änderungsanforderungen (Change Requests, CR) finden Sie im Anschluss an die
Tabelle.
TABELLE 2-1
Probleme mit Hardware und Mechanik
CR
Beschreibung
Abhilfe
6579358
Das DVD/USB-Modul wurde eventuell versehentlich
aus dem Gehäuse entfernt.
Hinweis - Dieses Problem betrifft nur Server,
bei denen sich eine Aussparung für Finger an der
Unterseite des DVD/USB-Moduls befindet.
Bei Servern mit einer DVD-Ziehlasche tritt dieses
Problem nicht auf.
Üben Sie beim Trennen eines USB-Geräts
Gegendruck auf die DVD-Baugruppe aus.
Darüber hinaus sollten Sie ein USB-Gerät
nicht entfernen, solange ein Medium
eingelegt ist und aktiv betrieben wird.
n. v.
Bei im laufenden Betrieb austauschbaren
Lüftermodulen muss beim Ausbau des Lüfters
besonders vorsichtig vorgegangen werden.
Halten Sie beim Ausbauen eines
Lüftermoduls das benachbarte Lüftermodul
fest, damit sich dieses nicht versehentlich
löst.
n. v.
Alle Festplatten-LEDs leuchten etwa alle 16 Sekunden Das Blinken der LEDs ist ein Normalzustand.
gleichzeitig auf, wenn ein RAID-Volumen erstellt
wird.
6550166
Komponenten der Hauptplatine sind zu heiß zum
Anfassen.
16
Falls Komponenten in einem Systemgehäuse
ausgetauscht werden sollen, warten Sie, bis
die Komponenten abgekühlt sind (etwa eine
Minute), bevor Sie mit der Arbeit beginnen.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-1
Probleme mit Hardware und Mechanik (Fortsetzung)
CR
Beschreibung
Abhilfe
6574127
Falls eine Festplatte in einer RAID 0- oder RAID 1Konfiguration ausfällt, besteht die Möglichkeit, dass
keine Fehlermeldungen auf der Konsole oder in den
Protokolldateien angezeigt wird.
Wenn in RAID 0- oder RAID 1Konfigurationen Festplatten ausfallen und
folgende Situation eintritt, müssen die Platten
ausgetauscht werden:
• An einer Festplatte, die zu einem RAID 0oder RAID 1-Volume gehört, leuchtet die
Fehler-LED.
• Die Fehlerbedingung kann auch von einem
entfernten System aus angezeigt werden.
Führen Sie dazu den Befehl
showenvironment auf dem ServiceProzessor aus.
• Für die Festplatte, deren Fehler-LED
leuchtet, wird der Status Failed angezeigt
und die entsprechende Wartungs-LED
leuchtet.
Ersetzen Sie das Festplattenlaufwerk mit der
leuchtenden Fehler-LED.
6592272
Nach einem nicht korrigierbaren L2Rückschreibfehler wird möglicherweise eine
unberechtigte Hauptspeicherfehlermeldung
(SUN4V-8000-E2) an der Konsole ausgegeben.
Näheres dazu finden Sie in „L2 CacheFehlermeldungen erzeugen möglicherweise
eine unberechtigte HauptspeicherFehlermeldung (CR 6592272)“ auf Seite 19.
6614432
Irrtümlich gemeldete Netzteilfehler
Ein Beispiel finden Sie unter „Irrtümlich gemeldete
Netzteilfehler (CR 6614432)“ auf Seite 20.
Bei manchen Servern wird gemeldet, dass die
Wechselstrom-Eingangsspannung zu niedrig ist,
wenn die Eingangsspannung zwischen 90 und 94 V
Wechselstrom liegt. Dieser Grenzwert ist falsch.
Ein Fehler bei der Wechselstrom-Eingangsspannung
sollte erst gemeldet werden, wenn diese unter 90 V
fällt.
Vergewissern Sie sich, dass beide Netzteile
des Servers in Betrieb sind. Solange beide
Netzteile in Betrieb sind, bleibt der Server
während und nach irrtümlich gemeldeten
Fehlern eingeschaltet.
6616209
Ein Netzteil-Lüfterfehler führt eventuell nicht zu
einer Fehlermeldung.
Hinweis - Dieses Problem tritt nur bei
Lüfterausfällen im Netzteil 0 auf. Ein Lüfterausfall
im Netzteil 1 erzeugt eine Fehlermeldung.
Die beiden Netzteile müssen an
unterschiedliche Stromkreise angeschlossen
werden, um fortlaufenden Betrieb während
eines möglichen Netzteil-Lüfterausfalls
sicherzustellen.
6616232
Fehler an Netzteillüftern werden nicht automatisch
behoben.
Wenn an einem Netzteillüfter ein Fehler erkannt
wird, wird die Fehleranzeige nach Behebung des
Fehlers nicht automatisch gelöscht.
Schalten Sie das Netzteil, für das der
Lüfterfehler gemeldet wird, aus und wieder
ein, um die Fehlermeldung zu löschen.
Kapitel 2
Aktuelle Informationen
17
TABELLE 2-1
Probleme mit Hardware und Mechanik (Fortsetzung)
CR
Beschreibung
Abhilfe
6636098
Wenn irrtümlicherweise an einem nicht montierten
integrierten Lüfter ein Fehler festgestellt und an die
Enhanced Support Facility-Software gemeldet wird,
wird eine Fehlermeldung angezeigt.
Beispiele dieses Fehlers finden Sie unter „Ein nicht
montierter integrierter Lüfter wurde irrtümlich als
fehlerhaft gemeldet (CR 6636098)“ auf Seite 21.
Dieses Problem lässt sich durch ein Upgrade
der Systemfirmware auf Version 7.1.0.g
beheben. Da sich diese Fehlermeldungen
jedoch nicht auf den Systembetrieb
auswirken, können sie gefahrlos ignoriert
werden.
6674290
Wenn beim SPARC Enterprise T5220 Server eine
XAUI- und eine PCIe-Karte auf derselben RiserKartenbaugruppe installiert sind, schlägt POST für
die XAUI-Karte möglicherweise fehl, so dass die
Karte beim Booten des Servers deaktiviert wird.
Installieren Sie möglichst keine PCIe-Karte in
derselben Riser-Kartenbaugruppe wie eine
XAUI-Karte.
11210180
Wenn ein AC-Netzkabel an dieses Gerät
angeschlossen wird oder der Server eingeschaltet
wird, leuchten eventuell alle LEDs an der
Gerätevorderseite auf. Dieses Problem betrifft
ausschließlich die LED-Anzeige und nicht den
Systembetrieb. Darüber hinaus wird der
Systemstatus bei Eingabe eines der ILOMStatusbefehle (z. B. dem Befehl showenvironment)
korrekt angezeigt.
Keine. Wenn dieses Problem auftritt, fahren
Sie den Host herunter, schließen Sie das ACNetzkabel erneut an das System an und
schalten Sie den Host wieder ein.
11210193
Tritt während der Durchführung von POST ein
Fehler auf, wird eventuell die Meldung „Fault
Sensor VCORE_POK at /SYS/MB deasserted”
angezeigt, wenn der Systemstatus mit dem ALOM
CMT-kompatiblen Befehl showfaults abgerufen
wird. In diesem Fall wird POST dennoch normal
beendet.
Ein Beispiel finden Sie unter „Bei der Durchführung
von POST wird mit dem Befehl showfaults ein
Fehler erkannt, doch POST wird normal beendet
(CR 11210193)“ auf Seite 22.
Keine. Sollte dieses Problem auftreten,
verwenden Sie den ALOM CMT-kompatiblen
Befehl resetsc, um das Protokoll zu löschen
und die LED-Anzeige zurückzusetzen.
11215994
In seltenen Fällen wird die Eingabeaufforderung ok
nach dem Beenden von POST nicht angezeigt.
Näheres dazu finden Sie in „Nach dem
Beenden von POST wird die
Eingabeaufforderung ok nicht angezeigt
(CR 11215994)“ auf Seite 22.
n. v.
Beim Trennen eines RJ45-Kabels vom RJ45-Anschluss Halten Sie diesem Fall die Laschen des RJ45einer im SPARC Enterprise T5120 Server montierten Anschlusses (z. B. mit einer Kunststoffkarte)
Ethernet-Karte können Probleme auftreten.
gedrückt, während Sie das Kabel trennen.
18
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-1
Probleme mit Hardware und Mechanik (Fortsetzung)
CR
Beschreibung
Abhilfe
(Bug ID
6581309)
Um die XVR-300 als Konsole für die SPARC
Enterprise T5xx0 Server zu verwenden, muss Patch
137111-01 oder eine neuere Version installiert sein.
Wird der Patch installiert, nachdem die OBP-Variable
für die Verwendung der XVR-300 als Konsole
bearbeitet wurde, wird die Konsolenausgabe bei der
Solaris-Bootsequenz auf die Standard-ILOMKonsolenausgabe zurückgesetzt.
Um die XVR-300 als Konsole zu verwenden,
muss Patch 137111-01 oder eine neuere
Version im Solaris-Betriebssystem installiert
sein, bevor die OBP-Variable verändert wird.
Alternativ können Sie auch das SolarisBetriebssystem (neu) installieren, so dass
ILOM als Konsole angegeben ist, und dann
den Patch installieren.
Währenddessen ist keine grafische
Benutzeroberfläche verfügbar.
Nach der Installation des Patches kann die
XVR-300 als Konsole gewählt werden, indem
die OBP-Variable bearbeitet wird.
L2 Cache-Fehlermeldungen erzeugen
möglicherweise eine unberechtigte
Hauptspeicher-Fehlermeldung (CR 6592272)
Nach einem nicht korrigierbaren L2-Rückschreibfehler wird möglicherweise eine
unberechtigte Hauptspeicherfehlermeldung (SUN4V-8000-E2) an der Konsole
ausgegeben. Beispiel:
SUNW-MSG-ID: SUN4V-8000-E2, TYPE: Fault, VER: 1, SEVERITY:
Critical
EVENT-TIME: Wed Sep 5 18:49:35 EDT 2007
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: cpumem-diagnosis, REV: 1.6
EVENT-ID: 59bf6418-5dcb-c1b0-b06a-f26fa18e4ee7
DESC: The number of errors associated with this memory module has
exceeded acceptable levels. Refer to http://sun.com/msg/SUN4V8000-E2
for more information.
AUTO-RESPONSE: Pages of memory associated with this memory module
are
being removed from service as errors are reported.
IMPACT: Total system memory capacity will be reduced as pages are
retired.
Kapitel 2
Aktuelle Informationen
19
Abhilfe: Geben Sie den Befehl fmdump -eV -u UUID mit der UUID aus der
Konsolenmeldung ein. So können Sie ermitteln, ob der Hauptspeicherfehler
gerechtfertigt ist. Beispiel:
# fmdump -eV -u 59bf6418-5dcb-c1b0-b06a-f26fa18e4ee7 | grep dram-esr
dram-esr = 0x1000000000008221
Wenn für dram-esr der Wert 0x1000000000008221 ausgegeben wird, ist das in
CR 6592272 beschriebene Problem aufgetreten. Der Speicherfehler kann ignoriert
werden. Es ist nicht erforderlich, ein Speichermodul auszutauschen. Beheben Sie den
unberechtigten Hauptspeicherfehler mit dem Befehl fmadm repair UUID.
Wird für dram-esr ein abweichender Wert angezeigt, lassen Sie das betroffene
Hauptspeichermodul austauschen. Identifizieren Sie das Modul mithilfe des Befehls
fmdump -v -u Ereignis-ID.
Irrtümlich gemeldete Netzteilfehler (CR 6614432)
Bei manchen SPARC Enterprise T5120 Servern wird gemeldet, dass die
Wechselstrom-Eingangsspannung zu niedrig ist, wenn die Eingangsspannung
zwischen 90 und 94 V Wechselstrom liegt. Dieser Grenzwert ist falsch. Ein Fehler bei
der Wechselstrom-Eingangsspannung sollte erst gemeldet werden, wenn diese unter
90 V fällt.
Beispiele für irrtümliche Fehlermeldungen:
sc> showlogs
Oct 09
Oct 09
Supply
Oct 09
Supply
Oct 09
Supply
14:13:17: Chassis | major: "Host is
14:36:10: IPMI
|minor
: "ID =
: /PS1/DC_POK : State Deasserted"
14:36:11: IPMI
|minor
: "ID =
: /PS1/AC_POK : State Deasserted"
14:36:14: IPMI
|minor
: "ID =
: /PS1/FAIL : State Asserted"
running"
264 : 10/09/2007 : 14:36:10 : Power
265 : 10/09/2007 : 14:36:11 : Power
266 : 10/09/2007 : 14:36:14 : Power
Abhilfe: Vergewissern Sie sich, dass beide Netzteile des Servers in Betrieb sind.
Solange beide Netzteile in Betrieb sind, bleibt der Server während und nach
irrtümlich gemeldeten Fehlern eingeschaltet.
20
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Ein nicht montierter integrierter Lüfter wurde irrtümlich
als fehlerhaft gemeldet (CR 6636098)
Wenn irrtümlicherweise an einem integrierten Lüfter ein Fehler festgestellt und an
die Enhanced Support Facility-Software gemeldet wird, wird folgende
Fehlermeldung angezeigt:
FJSVmadm:A:FANBD0/FM0/F0/TACH:FJSVmadm:Detected failure on the fan
-----------------(Position eines integrierten Lüfters. Die Ausgabe kann abweichen.)
Bei Eingabe eines der ILOM-Statusbefehle (z. B. dem Befehl showenvironment)
wird der Systemstatus jedoch korrekt angezeigt.
Wird ein tatsächlicher Fehler in einem integrierten Lüfter erkannt, wird eine
Fehlermeldung ähnlich der folgenden angezeigt.
Bei irrtümlicher Erkennung eines integrierten Lüfters als fehlerhaft wird die
folgende Meldung nicht angezeigt.
sc> showfaults
Last POST Run: Fri May 16 14:27:39 2008
Post Status: Passed all devices
ID FRU Fault
1 /SYS/FANBD0/FM0 SP detected fault: TACH at /SYS/FANBD0/FM0/F0 has
exceeded low non-recoverable threshold.
Abhilfe: Dieser Fehler kann ignoriert werden.
Kapitel 2
Aktuelle Informationen
21
Bei der Durchführung von POST wird mit dem Befehl
showfaults ein Fehler erkannt, doch POST wird normal
beendet (CR 11210193)
Tritt während der Durchführung von POST ein Fehler auf, wird eventuell die
Meldung „Fault Sensor VCORE_POK at /SYS/MB deasserted”angezeigt,
wenn der Systemstatus mit dem ALOM CMT-kompatiblen Befehl showfaults
abgerufen wird. In diesem Fall wird POST dennoch normal beendet.
sc> showfaults -v
Last POST Run: Sun Apr 20 17:53:36 2008
Post Status: Passed all devices
ID Time
FRU
Class
1 Apr 19 06:41:14 /SYS/MB
VCORE_POK at /SYS/MB
deasserted
sc>
Fault
SP detected fault: Fault Sensor
Abhilfe: Keine. Sollte dieses Problem auftreten, verwenden Sie den ALOM CMTkompatiblen Befehl resetsc, um das Protokoll zu löschen und die LED-Anzeige
zurückzusetzen.
Nach dem Beenden von POST wird die
Eingabeaufforderung ok nicht angezeigt (CR 11215994)
In seltenen Fällen wird die Eingabeaufforderung ok nach dem Beenden von POST
nicht angezeigt.
Abhilfe: Sollte dieses Problem auftreten, verwenden Sie den ALOM CMTkompatiblen Befehl showfaults -v, um den POST-Status zu überprüfen.
Wenn unter „Last POST Run” das Datum und die Uhrzeit der aktuellen POSTDurchführung korrekt angezeigt wird und unter „POST Status” die Anzeige
„Passed all devices” erscheint, weist dies darauf hin, dass POST korrekt bis
22
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
zum Ende durchgeführt wurde. Geben Sie zunächst den ALOM CMT-kompatiblen
Befehl resetsc und anschließend die ALOM CMT-kompatiblen Befehle poweroff
und poweron ein (in dieser Reihenfolge).
2008-04-29 17:10:35.407 0:0:0>........
2008-04-29 17:10:57.749 0:0:0>End : Block Mem Test
2008-04-29 17:10:57.757 0:0:0>INFO:
2008-04-29 17:10:57.766 0:0:0>
POST Passed all devices.
2008-04-29 17:10:57.783 0:0:0>POST:
Return to VBSC.
2008-04-29 17:10:57.795 0:0:0>Master set ACK for vbsc runpost
command and spin...
/
sc>
sc> showfaults -v
Last POST Run: Tue Apr 29 17:10:58 2008
Post Status: Passed all devices
No failures found in System
sc>
Kapitel 2
Aktuelle Informationen
23
Probleme mit der Ethernet-Schnittstelle
TABELLE 2-2 enthält eine Liste der aktuellen Probleme mit der Ethernet-Schnittstelle.
Weitere Informationen zu bestimmten Änderungsanforderungen (Change Requests,
CR) finden Sie im Anschluss an die Tabelle.
TABELLE 2-2
Probleme mit der Ethernet-Schnittstelle
CR
Beschreibung
Abhilfe
6551509
Das Ausführen von modunload bei laufendem
nxge-Port kann einen Systemabsturz
verursachen.
Deaktivieren Sie die Schnittstellen vor dem
Entladen des Treibers. Näheres dazu finden Sie
in „Das Aufrufen von modunload bei
laufendem nxge-Port kann einen Systemabsturz
verursachen (CR 6551509)“ auf Seite 26.
6553515
Wenn während des Boot-Vorgangs oder zu
Wenn das System aufgrund dieses Problems
einem späteren Zeitpunkt ein zeitweiliger PCIe- nicht gebootet wird, führen Sie den BootNetzwerkfehler auftritt, arbeitet das System
Vorgang erneut aus.
möglicherweise nicht ordnungsgemäß.
Wenn die Verbindung wieder zur Verfügung
steht, bevor die Steuerung von der Firmware
übernommen wird, ist der Fehler auf ein
Problem mit der Handhabung des verbleibenden
Status in der Firmware zurückzuführen. Ein
Beispiel des Fehlers finden Sie unter
„Zeitweiliger PCIe-Verbindungsfehler beim
Booten führt später zu schwerwiegendem Fehler
(CR 6553515)“ auf Seite 27.
6554478
Setzen Sie die MTU-Größe gemäß der
Der Empfang von Jumbo-Frames senkt die
Leistung der Ethernet-Schnittstelle aufgrund des Beschreibung in „Jumbo-Frames-Durchsatz von
nxge sinkt auf 30 Mbit/s, weil Pakete verworfen
Paketabwurfs auf 30 Mbit/s.
werden (CR 6554478)“ auf Seite 29 auf 8172.
6555486
Ierrs-Fehler werden generiert, wenn die
Option „Forced Speed/Duplex“ in der
e1000g.conf-Datei auf 100 Mbit/s und
Vollduplex gesetzt wird.
Diese Ierrs-Fehler werden durch den
Parameter Forced Speed/Duplex verursacht.
Wenn für den Port 100 Mbit/s und Vollduplex
mit automatischer Aushandlung konfiguriert
sind, treten keine Ierrs-Fehler auf. Näheres
dazu finden Sie in „Ierrs-Fehler werden
generiert, wenn die Option „Forced
Speed/Duplex“ in der e1000g.conf-Datei auf
100 Mbit/s und Vollduplex gesetzt wird
(CR 6555486)“ auf Seite 31.
24
Lassen Sie die Link Speed/Duplex-Parameter
in der Datei e1000g.conf mithilfe der
automatischen Aushandlung festlegen. Wenn Sie
z. B. für ein e1000g0-Gerät 100 Mbit/s und
Vollduplex einstellen möchten, ändern Sie die
Einstellungen in der Datei e1000g.conf.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-2
Probleme mit der Ethernet-Schnittstelle (Fortsetzung)
CR
Beschreibung
Abhilfe
6561389
Das Einstellen von Eigenschaften für NIU-nxgeGeräte (Network Interface Unit) kann
fehlschlagen.
Ein Beispiel des Fehlers finden Sie unter
„Das Einstellen von Eigenschaften für nxgeGeräte kann fehlschlagen (CR 6561389)“ auf
Seite 32.
Verwenden Sie in der Datei nxge.conf
die globale Deklaration ohne den Gerätepfad.
Fügen Sie z. B. die folgende Zeile in die Datei
nxge.conf ein:
accept_jumbo = 1;
6567838
Der Server kann in nxge_start abstürzen,
wenn dupb fehlschlägt.
Wenn Jumbo-Frames aktiviert sind, kann
es aufgrund eines NULL-Zeigerverweises
theoretisch zu einem Systemabsturz kommen.
Dieses Problem kann jedoch nur bei FrameGrößen von über 4076 auftreten. Bei JumboFrames mit MTU=9194 ist kein Systemabsturz
aufgetreten.
Hinweis - Dieses Szenario ist selten und tritt
nur mit Frames über einer Größe von 4076 auf.
Deaktivieren Sie die Verwendung von JumboFrames. Dies hat jedoch negative Auswirkungen
auf die Systemperformance. Sie sollten diese
Abhilfemaßnahme nur dann anwenden, wenn
dieses Problem auf Ihrem Server auftritt. Weitere
Informationen zu dieser Abhilfemaßnahme
finden Sie unter „Server in nxge_start stürzt
ab, wenn dupb fehlschlägt (CR 6567838)“ auf
Seite 32.
6599334
XAUI-Schnittstellen werden eventuell nicht
vorschriftsmäßig deaktiviert.
In der Regel gilt, wenn eine CPUNetzwerkschnittstelle (NIU) deaktiviert wird
(entweder aufgrund von beim POST erkannten
Fehlern oder manuell), wird die zugehörige
XAUI-Schnittstelle ebenfalls deaktiviert
(sofern installiert). Dies geschieht jedoch nicht.
Nehmen Sie dieses Problem zur Kenntnis.
6606950
Wichtige /etc/system-Einstellung für
10-Gigabit-Ethernet-Leistung.
Hinweis - Das vorinstallierte Betriebssystem
Solaris enthält den richtigen Eintrag in der Datei
/etc/system.
Sollten Sie Solaris jedoch erneut installieren,
müssen Sie die folgende Zeile in die Datei
/etc/system einfügen:
set ip:ip_soft_rings_cnt=16
Mit dieser /etc/system-Einstellung
gewährleisten Sie die optimale Leistung der
10-Gigabit-Ethernet-Schnittstellen.
Kapitel 2
Aktuelle Informationen
25
Das Aufrufen von modunload bei laufendem
nxge-Port kann einen Systemabsturz verursachen
(CR 6551509)
Wenn Sie den Befehl modunload für den nxge-Treiber ausführen, während dieser
aktiv ist, kann das System abstürzen. Aufgrund eines Problems im nxge-Treiber
kann der nxge-Treiber während eines Systemneustarts einen Systemabsturz
verursachen, wenngleich dies sehr unwahrscheinlich ist. Ein solcher Systemabsturz
tritt auf, wenn das System beim Herunterfahren noch erhebliche Mengen an
Netzwerkdaten über eine nxge-Schnittstelle überträgt. Unter normalen Umständen
ist es sehr unwahrscheinlich, dass dieser Fall eintritt.
Die Absturzmeldung lautet in diesem Fall mutex_enter: bad mutex, ...
Bei einem solchen Absturz enthält der Stapel zwei Funktionen des nxge-Treibers,
nämlich nxge_freeb() und nxge_post_page().
Sollte ein solcher Absturz auftreten, wird das System wiederhergestellt und normal
weiter gestartet. Das System und die nxge-Schnittstellen werden ohne weitere
Abstürze wieder hochgefahren.
Abhilfe: Deaktivieren Sie die Schnittstellen vor dem Entladen des Treibers.
▼ So deaktivieren Sie die Schnittstellen vor dem Entladen
des Treibers
Normalerweise ist es nicht erforderlich, einen Treiber aus einem laufenden Kernel
zu entladen, aber in den seltenen Fällen, in denen dies nötig ist, müssen Sie alle
Treiberinstanzen deaktivieren, bevor Sie sie entladen.
1. Ermitteln Sie zunächst, welche nxge-Instanzen aktiviert sind. Dazu verwenden
Sie den Befehl ifconfig:
# ifconfig -a
lo0: flags=2001000849<UP,LOOPBACK,RUNNING,MULTICAST,IPv4,VIRTUAL>
mtu 8232 index 1
inet 127.0.0.1 netmask ff000000
bge0: flags=201000843<UP,BROADCAST,RUNNING,MULTICAST,IPv4,CoS>
mtu 1500 index 2
26
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
inet 129.153.54.82 netmask ffffff00 broadcast 129.153.54.255
ether 0:14:4f:2a:9f:6a
nxge2: flags=201000843<UP,BROADCAST,RUNNING,MULTICAST,IPv4,CoS>
mtu 1500 index 19
inet 129.153.54.175 netmask ffffff00 broadcast 129.153.54.255
ether 0:14:4f:6c:85:aa
nxge3: flags=201000803<UP,BROADCAST,MULTICAST,IPv4,CoS> mtu 1500
index 20
inet 129.153.54.171 netmask ffffff00 broadcast 129.153.54.255
ether 0:14:4f:6c:85:ab
2. Deaktivieren Sie dann alle aktiven Ports (alle Ports mit dem Namen nxge und
einer Instanznummer, z. B. nxge2, nxge3, . . .). Beispiel:
# ifconfig nxge2 unplumb
# ifconfig nxge3 unplumb
3. Wenn Sie ifconfig -a erneut ausführen, sehen Sie, dass keine aktiven nxgeSchnittstellen mehr vorhanden sind. Beispiel:
# ifconfig -a
lo0: flags=2001000849<UP,LOOPBACK,RUNNING,MULTICAST,IPv4,VIRTUAL>
mtu 8232 index 1
inet 127.0.0.1 netmask ff000000
bge0: flags=201000843<UP,BROADCAST,RUNNING,MULTICAST,IPv4,CoS>
mtu 1500 index 2
inet 129.153.54.82 netmask ffffff00 broadcast 129.153.54.255
ether 0:14:4f:2a:9f:6a
Jetzt kann der nxge-Treiber problemlos entladen werden.
Zeitweiliger PCIe-Verbindungsfehler beim Booten
führt später zu schwerwiegendem Fehler
(CR 6553515)
Wenn während des Boot-Vorgangs oder zu einem späteren Zeitpunkt ein
zeitweiliger PCIe-Verbindungsfehler auftritt, arbeitet das System möglicherweise
nicht ordnungsgemäß. Wenn die Verbindung wieder zur Verfügung steht, bevor die
Kapitel 2
Aktuelle Informationen
27
Steuerung von der Firmware übernommen wird, ist der Fehler auf ein Problem
mit der Handhabung des verbleibenden Status in der Firmware zurückzuführen.
Das folgende Beispiel zeigt eine solche Fehlermeldung:
{0} ok 4000 dload users/bog/rustn2obp_0502
Boot device:
/pci@0/pci@0/pci@1/pci@0/pci@2/network@0:,users|bog|rustn2obp_0502 File
and args:
FATAL: /pci@0/pci@0/pci@1/pci@0/pci@2/network@0: Last Trap: NonResumable Error
TL:
1
%TL:1 %TT:7f %TPC:f0238978 %TnPC:f023897c
%TSTATE:820001600 %CWP:0
%PSTATE:16 AG:0 IE:1 PRIV:1 AM:0 PEF:0 RED:0 MM:0 TLE:0 CLE:0 MG:0 IG:1
%ASI:20 %CCR:8 XCC:nzvc
ICC:Nzvc
%TL:2 %TT:3f %TPC:f024327c %TnPC:f0243280
%TSTATE:14414000400 %CWP:0
%PSTATE:4 AG:0 IE:0 PRIV:1 AM:0 PEF:0 RED:0 MM:0 TLE:0 CLE:0 MG:0 IG:0
%ASI:14 %CCR:44 XCC:nZvc
ICC:nZvc
Normal
GL=1
0:
0
0
1:
f0200000
0
2:
f0200000
0
3:
fff78000
0
4:
fec320fc
3ffe60000
5:
f02833e4
3ffe60000
6:
fee826c8
3ffe60600
7:
fee817d8
f02432bc
%PC f0238978 %nPC f023897c
%TBA f0200000 %CCR 8200016 XCC:nzvC
ICC:nZVc
{0} ok
Abhilfe: Wenn das System aufgrund dieses Problems nicht gebootet wird, führen Sie
den Boot-Vorgang erneut aus.
28
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Jumbo-Frames-Durchsatz von nxge sinkt auf
30 Mbit/s, weil Pakete verworfen werden
(CR 6554478)
Die Empfangsleistung des nxge-Treibers sinkt erheblich, wenn die folgenden zwei
Bedingungen vorliegen:
■
Jumbo-Frames sind aktiviert, weil die folgende Zeile in der Datei nxge.conf
vorhanden ist und nicht als Kommentar gekennzeichnet wurde:
accept_jumbo=1
Die Datei nxge.conf befindet sich bei sun4v-Systemen im Verzeichnis
/platform/sun4v/kernel/drv und bei sun4u-Systemen im Verzeichnis
/platform/sun4u/kernel/drv.
■
Für die Maximalübertragungseinheit (MTU) ist ein Wert über 8172 eingestellt.
Bei aktivierten Jumbo-Frames wird die MTU auf den Standardwert 9194
eingestellt.
Hinweis – Nähere Informationen zur jeweiligen Komponente finden Sie im Sun
Quad GbE UTP x8 PCIe ExpressModule User’s Guide, im Sun Dual 10GbE XFP PCIe
ExpressModule User’s Guide, im Sun x8 Express Dual 10 Gigabit Ethernet Fiber XFP Low
Profile Adapter User’s Guide oder im Sun x8 Express Quad Gigabit Ethernet UTP Low
Profile Adapter User’s Guide.
▼ So legen Sie eine MTU-Größe von 8172 fest
Falls Jumbo-Frames aktiviert sind, verwenden Sie dieses Verfahren, um die MTU auf
einen Wert von 8172 festzulegen.
Dieses Verfahren verwendet als Beispiel port1.
1. Erstellen oder bearbeiten Sie eine Datei /etc/hosts und fügen Sie die
folgende Zeile in die Datei ein:
99.99.9.1 nxge-port1
Dabei ist nxge-port1 der Name, den Sie der Schnittstelle zugewiesen haben und
99.99.9.1 die IP-Adresse, die der Schnittstelle zugewiesen werden soll.
Kapitel 2
Aktuelle Informationen
29
2. Erstellen oder bearbeiten Sie eine Datei /etc/hostname.nxge1 und fügen
Sie die folgenden zwei Zeilen in die Datei ein:
nxge-port1
nxge-port1 mtu 8172
3. Wenn die Netzmaske des Systems automatisch auf einen bestimmten Wert
eingestellt werden soll, fügen Sie die folgende Zeile in die Datei
/etc/netmasks ein. Hier ein Beispiel für die Netzmaske FFFFFF00:
99.99.9.1 255.255.255.0
4. Starten Sie das System neu.
In diesem Beispiel wird die Schnittstelle nxge1 automatisch mit der IP-Adresse
99.99.9.1, dem MTU-Wert 8172 und der Netzmaske ffffff00 aktiviert.
5. Führen Sie ifconfig -a aus, um die Konfiguration zu bestätigen:
# ifconfig -a
nxge1: flags=1201000802<BROADCAST,MULTICAST,IPv4,CoS,FIXEDMTU>
mtu 8172 index 3
inet 99.99.9.1 netmask ffffff00 broadcast 99.255.255.255
ether 0:14:4f:6c:88:5
Wenn Sie für weitere Schnittstellen Parameter dauerhaft einstellen möchten,
erstellen Sie wie oben erläutert die Dateien /etc/hostname.nxge0,
/etc/hostname.nxge2 und /etc/hostname.nxge3. Fügen Sie die
entsprechenden Kombinationen aus Name und IP-Adresse in dieselbe /etc/hostsDatei ein. Fügen Sie außerdem die entsprechenden Netzmasken in dieselbe
/etc/netmasks-Datei ein.
30
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Ierrs-Fehler werden generiert, wenn die Option
„Forced Speed/Duplex“ in der e1000g.confDatei auf 100 Mbit/s und Vollduplex gesetzt wird
(CR 6555486)
Ierrs-Fehler können durch den ForcedSpeedDuplex-Parameter verursacht
werden. Die folgende Codeausgabe zeigt ein Beispiel für das Implementieren der
Abhilfemaßnahme in der Datei e1000g.conf. In diesem Beispiel ist das e1000g0Gerät für 100MB Vollduplex unter Verwendung der automatischen Aushandlung
konfiguriert.
ForceSpeedDuplex=7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7;
# This will force Speed and Duplex for following settings
for a typical instance.
# 1 will set the 10 Mbps speed and Half Duplex mode.
# 2 will set the 10 Mbps speed and Full Duplex mode.
# 3 will set the 100 Mbps speed and half Duplex mode.
# 4 will set the 100 Mbps speed and Full Duplex mode.
# 7 will let adapter autonegotiate.
AutoNegAdvertised=8,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0;
# This parameter determines the speed/duplex options that
will be
# advertised during auto-negotiation. This is a bitmap with
the
# following settings.
# Bit
| 7 | 6 |
5
|
4
| 3
| 2
| 1 | 0
# Setting| N/A | N/A | 1000F | N/A | 100F | 100H | 10F | 10H
#
# For example:
# To advertise 10 Half only AutoNegAdvertised = 1
# To advertise 10 Full only AutoNegAdvertised = 2
# To advertise 10 Half/Full AutoNegAdvertised = 3
#
#
#
#
#
To
To
To
To
To
advertise
advertise
advertise
advertise
advertise
100 Half only AutoNegAdvertised = 4
100 Full only AutoNegAdvertised = 8
100 Half/Full AutoNegAdvertised = 12
1000 Full only AutoNegAdvertised = 32
all speeds AutoNegAdvertised
= 47
Kapitel 2
Aktuelle Informationen
31
Das Einstellen von Eigenschaften für nxge-Geräte
kann fehlschlagen (CR 6561389)
Eigenschaften für einen nxge-Geräteknoten lassen sich möglicherweise nicht richtig
einstellen. Hier ein Beispiel:
name="SUNW,niusl" parent="/niu@80" unit-address="0" accept_jumbo=1;
name="SUNW,niusl" parent="/niu@80" unit-address="1" accept_jumbo=1;
Entries from /etc/path_to_inst:
/niu@80" 0 niumx
/niu@80/network@0" 0 nxge
/niu@80/network@1 1 nxge
Entries from /etc/driver_aliases:
niumx "SUNW,niumx
nxge "SUNW,niusl
Abhilfe: Verwenden Sie in der Datei nxge.conf die globale Deklaration ohne den
Gerätepfad. Fügen Sie z. B. die folgende Zeile in die Datei nxge.conf ein.
accept_jumbo = 1;
Server in nxge_start stürzt ab, wenn dupb
fehlschlägt (CR 6567838)
Wenn Jumbo-Frames aktiviert sind, kann es aufgrund eines NULL-Zeigerverweises
theoretisch zu einem Systemabsturz kommen. Dieses Problem kann jedoch nur bei
Frame-Größen von über 4076 auftreten. Bei Jumbo-Frames mit MTU=9194 ist kein
Systemabsturz aufgetreten.
Abhilfe: Deaktivieren Sie Jumbo-Frames oder verwenden Sie eine kleinere MTUGröße. Dies wird in den folgenden Verfahren beschrieben.
32
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
▼ So deaktivieren Sie Jumbo-Frames
Das Deaktivieren von Jumbo-Frames oder das Verwenden von Jumbo-Frames mit
einer kleineren MTU wirkt sich negativ auf die Systemperformance aus. Führen Sie
die folgenden Schritte nur dann aus, wenn das System aufgrund von Jumbo-Frames
abstürzt.
1. Bearbeiten Sie die Datei /platform/sun4v/kernel/drv/nxge.conf und
achten Sie darauf, alle Zeilen mit accept_jumbo=1; als Kommentar zu
kennzeichnen.
2. Löschen Sie gegebenenfalls auch den Eintrag set
nxge:nxge_jumbo_enable=1 aus der Datei /etc/system.
▼ So legen Sie eine kleinere MTU-Größe fest
Wenn Sie Jumbo-Frames verwenden möchten, können Sie die folgende
Abhilfemaßnahme anstelle der Deaktivierung von Jumbo-Frames verwenden. In
diesem Verfahren wird die MTU auf einen Wert gleich oder kleiner 4076 gesetzt. Im
folgenden Beispiel wird port1 verwendet.
Hinweis – Durch Ausführen der folgenden Schritte werden die MTU-Werte
permanent übernommen. Alternativ können Sie den Befehl ifconfig nxgeX mtu
4076 ausführen (dabei ist X die Instanzanzahl), aber der MTU-Wert nimmt nach
einem Neustart wieder den Standardwert an.
1. Erstellen oder bearbeiten Sie eine Datei /etc/hosts und fügen Sie die
folgende Zeile in die Datei ein:
99.99.9.1 nxge-port1
Hierbei ist nxge-port1 der Name, den Sie der Schnittstelle geben. 99.99.9.1 ist die
IP-Adresse, die der Schnittstelle zugewiesen werden soll.
2. Erstellen Sie eine Datei /etc/hostname.nxge1 und fügen Sie die folgenden
zwei Zeilen in die Datei ein:
nxge-port1
nxge-port1 mtu 4076
Kapitel 2
Aktuelle Informationen
33
Probleme mit Firmware, ILOM, POST
und Service-Prozessor
TABELLE 2-3 enthält eine Liste mit aktuellen Informationen zu Problemen mit Firmware,
ILOM (einschließlich der ALOM-kompatiblen Befehlszeilenschnittstelle), POST und
Service-Prozessor. Weitere Informationen zu bestimmten Änderungsanforderungen
(Change Requests, CR) finden Sie im Anschluss an die Tabelle.
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor
CR
Beschreibung
Abhilfe
6237994
Die Registrierung bei der DMI schlägt fehl und die
Fehlermeldung err=831 wird angezeigt.
Abhilfe: Deaktivieren Sie den DMI-Dienst beim
Systemstart. Beispiel:
% mv /etc/rc3.d/S77dmi
/etc/rc3.d/_S77dmi
6510082
Benutzer, die über Erfahrung mit ALOM CMT und
der ALOM CMT-kompatiblen
Befehlszeilenschnittstelle (CLI) verfügen, können
die Boot- und die Run-Option in der Hilfe zum
Befehl consolehistory nutzen. Beide Optionen
führen zu derselben Ausgabe, da ILOM nicht
zwischen Run- und Boot-Puffern unterscheidet.
6541482
Der POST (Power On Self-Test, Systemselbsttest
nach dem Einschalten) startet immer mit der
niedrigsten verfügbaren Bank, selbst wenn diese
Bank deaktiviert ist.
Wenn Prozessorbank 0 des ersten verfügbaren
physikalischen Kerns deaktiviert ist, wird im
Rahmen des Initialisierungsprozesses eine neue
Master-Bank ausgewählt und die deaktivierte Bank
außer Betrieb gesetzt. Die Liste der deaktivierten
Geräte kann mit dem Befehl showcomponent
aufgerufen werden. Die deaktivierte Prozessorbank
wird jedoch bei der Systeminitialisierung und der
Ausführung von POST verwendet, da Einschaltung
und Zurücksetzung immer auf Bank 0 des ersten
verfügbaren physikalischen Kerns starten.
In diesem Fall werden die Diagnoseroutinen
möglicherweise nicht ausgeführt und der BootVorgang kann auf unvorhersehbare Art und Weise
fehlschlagen. Die erforderlichen Firmware- und
Softwarekomponenten werden deshalb unter
Umständen nicht gestartet.
34
Wenn Sie wissen, dass Bank 0 des ersten
physikalischen Kerns keine Fehler aufweist,
kann sie aktiviert werden, indem Sie zunächst
den ALOM CMT-kompatiblen Befehl
enablecomponent und anschließend die
ALOM CMT-kompatible Befehlsfolge zum
Neustarten des Systems eingeben (poweroff,
gefolgt von poweron).
Wenn Sie wissen, dass Bank 0 des ersten
physikalischen Kerns Fehler aufweist, gibt es
keine Abhilfe. Die Hauptplatine muss ersetzt
werden.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6549028
Der Befehl netsc_commit kann dazu führen, dass
sich das System aufhängt.
Über eine serielle Verbindung ist das Netzwerk
möglicherweise nicht sichtbar.
Starten Sie das System neu.
Wenn der Service-Prozessor durch den
Neustart nicht zurückgesetzt wird, müssen Sie
das System aus- und wieder einschalten, um
den Normalzustand des Service-Prozessors
wiederherzustellen. Aktive Domänen gehen
dabei jedoch verloren.
6556505
Die PCIe-Verbindung arbeitet nicht mit 8 Kanälen. Abhilfemaßnahmen finden Sie unter „Die PCIeDieses Problem tritt während des Einschaltens oder Verbindung arbeitet nicht mit 8 Kanälen
(CR 6556505)“ auf Seite 45.
des Zurücksetzens auf, wenn die E/A-Brücke
(PCIe-Root-Complex) der UltraSPARC T2 CPU
nicht korrekt mit der PCIe-Schnittstelle
zusammenarbeitet.
6568750
Skripten, die eine Anmeldung beim ServiceFalls Sie Skripten für die Anmeldung beim
Prozessor durchführen, laufen eventuell schon nach Service-Prozessor verwenden, sollten Sie sich
60 Sekunden ab.
dieses Problems bewusst sein.
In diesem Fall wird die folgende Fehlermeldung
angezeigt:
Logging out after 60 seconds.
Hinweis - Dieser Fehler tritt nicht bei der
normalen Anmeldung, sondern nur bei der
Anmeldung mit einem Skript auf.
6571886
POST erkennt möglicherweise intermittierende
POST-PIU0-Verknüpfungsfehler bei den Tests zum
Aus- und wieder Einschalten.
Schalten Sie das System folgendermaßen aus
und wieder ein (in der ALOM CMTkompatiblen Befehlszeilenschnittstelle):
sc> poweroff -fy
sc> clearasrdb
sc> poweron -c
6573354
Die Methode zum Löschen von POST-Ergebnissen
(die mit dem Befehl showfaults angezeigt
werden) hat sich geändert.
Diese Statusmeldung wird nach der Ausführung
von POST in der Ausgabe von showfaults
angezeigt. Die Statusmeldung lässt sich nur mit
dem Befehl setdefaults löschen. Bei ALOM
CMT konnte die Statusmeldung bislang mit dem
Befehl resetsc gelöscht werden.
Zum Löschen der POST-Ergebnisse verwenden
Sie den ALOM CMT-kompatiblen Befehl
setdefaults.
Kapitel 2
Aktuelle Informationen
35
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6577528
Ein Terminalserver-Befehl break funktioniert nicht
am seriellen Anschluss des Service-Prozessors.
Wenn Sie mit einem Terminalserver (z. B. der Cisco
ASM-Serie) über Telnet eine Verbindung zur
seriellen Leitung des Service-Prozessors herstellen
und ein Break-Signal an den Solaris-Host senden,
funktioniert der Befehl break nicht und wird vom
Service-Prozessor ignoriert. Ein Beispiel für die
Ausgabe finden Sie unter „Der break-Befehl für
Terminalserver an der seriellen Leitung des ServiceProzessors funktioniert nicht (CR 6577528)“ auf
Seite 46.
Führen Sie den break-Befehl vom ServiceProzessor aus (entweder der ILOM oder ALOM
CMT-kompatible Befehle), um ein Break-Signal
an den Solaris-Host zu senden.
Weitere Informationen finden Sie im Dokument
Integrated Lights Out Management (ILOM) Ergänzungshandbuch für SPARC Enterprise T5120
und T5220 Server.
6579390
Nach dem Deaktivieren eines DIMM zeigt das
OpenBoot PROM-Banner keine Reduzierung des
Hauptspeichers an.
Werden bei eingeschaltetem Host beliebige
CPU- oder Speicherressourcen manuell mit den
ASR-Befehlen deaktiviert, so wird die
Ressource erst nach dem Aus- und Einschalten
des Hosts tatsächlich deaktiviert.
Nach dem Aus- und Einschalten wird die
Ressource deaktiviert und im Banner werden
die korrekten Werte angezeigt.
6581309
Das Konsolenverhalten ist inkonsistent, wenn eine
Grafikkarte und eine Tastastur für die Verwendung
mit der Konsole angegeben werden.
Dieses Problem tritt auf, wenn für die OpenBootVariablen input-device und output-device
ein anderer als der Standardwert virtualconsole eingestellt ist.
Wenn die Kontrolldomäne so eingestellt ist, werden
manche Konsolenmeldungen an die grafische
Konsole, andere an die virtuelle Konsole gesendet.
Die angezeigten Informationen sind daher an
beiden Konsolen unvollständig. Wird zudem das
System angehalten oder ein Break-Signal an die
Konsole gesendet, so wird die Steuerung an die
virtuelle Konsole übergeben, was Tastatureingaben
über die virtuelle Konsole erforderlich macht. Die
grafische Konsole scheint sich also aufgehängt zu
haben.
Wenn sich die grafische Konsole scheinbar
aufgehängt hat, stellen Sie für die
erforderlichen Eingaben vom Systemprozessor
aus eine Verbindung zur virtuellen Konsole her.
Drücken Sie auf der Tastatur der virtuellen
Konsole einmal die Eingabetaste, damit die
Ausgabe an der virtuellen Konsole angezeigt
wird. Wenn sich das Problem mit den oben
beschriebenen Abhilfemaßnahmen nicht
beheben lässt, wenden Sie sich bitte an den
Sun-Kundendienstsm.
36
Ergreifen Sie eine der folgenden
Abhilfemaßnahmen, um das Problem zu
vermeiden:
• Installieren Sie Patch 137111-01 (oder höher).
• Verwenden Sie ausschließlich die virtuelle
Konsole. Vergewissern Sie sich, dass der
Standardwert virtual-console für die
Variablen input-device und outputdevice eingestellt ist.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6582340
Wenn bei einer Verbindung zur virtuellen Konsole
versucht wird, mit der Escape-Sequenz (.#)
zur Befehlszeilenschnittstelle (CLI) des ServiceProzessors zu wechseln, werden möglicherweise
zwei Fehlermeldungen ausgegeben, bevor die CLIEingabeaufforderung erscheint:
read: Connection reset by peer
Write to vbsc: Illegal seek
Diese Situation tritt ein, wenn die Ausgabe über die
Konsole sehr umfangreich ist. Es entsteht der
Eindruck, dass die Konsole verwendet wird,
obwohl dies nicht der Fall ist.
Wenn Sie auch beim nächsten Versuch, mit dem
Konsolenbefehl eine Verbindung herzustellen,
keinen Schreibzugriff erhalten, können Sie den
Lese- und Schreibzugriff mit dem Befehl
console -f erzwingen.
6582853
Der ALOM CMT-kompatible Befehl showfaults
meldet die Hauptplatine anstelle des tatsächlich
defekten DIMM bzw. der defekten PCIe-Karte als
defekt.
Verwenden Sie die StörungsmanagementDienstprogramme, die in den Predictive SelfHealing (PSH) Knowledge-Artikeln
beschrieben sind. Diese finden Sie unter
folgender Adresse:
http://www.sun.com/msg/MSGID
(MSGID ist die PSH Meldungs-ID).
Weitere Informationen finden Sie unter
„Der Befehl showfaults zeigt die
Hauptplatine anstelle des DIMMs als fehlerhaft
an (CR 6582853)“ auf Seite 48.
6583567
Ein Kommunikationskanal kann sich zwischen der
primären Domäne und dem Service-Prozessor
aufhängen und die Kommunikation über den Kanal
unmöglich machen.
Näheres dazu finden Sie in
„Ein Kommunikationskanal kann sich zwischen
der primären Domäne und dem ServiceProzessor aufhängen (CR 6583567)“ auf
Seite 50.
6585114
Bei automatisierten Tests kann es auf dem Service- Schalten Sie das System aus und wieder ein.
Prozessor zu Problemen mit den Befehlen useradd
und usershow kommen. Wenig später schlagen
dann alle Anmeldeversuche fehl.
6585292
In der Ausgabe des ILOM-Befehls reset /SP und Ignorieren Sie solche irreführenden
des Befehls resetsc der ALOM CMT-kompatiblen Warnmeldungen.
Befehlszeilenschnittstelle sind überflüssige und
irreführende Warnmeldungen enthalten.
Einen Auszug der irreführenden Fehlermeldungen
finden Sie unter „Zurücksetzen des ServiceProzessors erzeugt irreführende Warnmeldungen
(CR 6585292)“ auf Seite 52.
6585340
Die Befehle uadmin 2 0 und reboot lesen alte
Boot-Modus-Einstellungen ein.
Näheres dazu finden Sie in „Die Befehle
uadmin 2 0 und reboot lesen alte BootModus-Einstellungen ein (CR 6585340)“ auf
Seite 49.
Kapitel 2
Aktuelle Informationen
37
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6587869
Das Verwenden des Befehls consolehistory -e
mit einem Wert über 1000 kann dazu führen, dass
der Service-Prozessor unbrauchbar wird.
Um das gesamte consolehistory-Protokoll
anzuzeigen, verwenden Sie die Option -v.
Wenn Sie bei Problemen wiederherstellen
müssen, die durch das Ausführen des Befehls
consolehistory mit mehr als 1000 Zeilen
verursacht werden, starten Sie den ServiceProzessor neu.
6587919
Wenn show /SYS das erste Mal nach dem
Einschalten ausgeführt wird, wird (none) als
Produktname angezeigt.
Geben Sie den Befehl show /SYS erneut ein,
und der korrekte Produktname wird angezeigt.
6588999
Wenn mit SSH eine Verbindung zur ILOMBefehlszeilenschnittstelle des Service-Prozessors
hergestellt wurde und der Service-Prozessor
zurückgesetzt wird, erscheint möglicherweise eine
Fehlermeldung wie die Folgende:
Performing hard reset on /SP failed
reset: Transport error - check errno for
transport error
Dieser Fehler kann ignoriert werden.
Tatsächlich wird der Befehl erfolgreich
ausgeführt und der Service-Prozessor
zurückgesetzt. Beim Zurücksetzen des ServiceProzessors geht die SSH-Verbindung zum
Service-Prozessor verloren.
6589043
Bei weniger als 21 Einträgen im Ereignisprotokoll
wird in der Ausgabe des Befehls showlogs keines
dieser Ereignisse angezeigt.
Dazu kann es in folgenden Situationen kommen:
• Nach einer Erstinstallation eines neu gekauften
Systems enthält das Ereignisprotokoll des
Service-Prozessors wahrscheinlich weniger als 21
Einträge.
• Wenn das Ereignisprotokoll des ServiceProzessors mit der browserbasierten
Benutzeroberfläche (BI) oder der ILOMBefehlszeilenschnittstelle (CLI) gelöscht wurde,
werden in der Ausgabe des ALOM CMTkompatiblen Befehls showlogs erst dann
Ereignisse angezeigt, wenn mindestens 21 neue
Ereignisse protokolliert wurden.
Geben Sie die Option showlogs -v ein, um die
Protokolle anzuzeigen. Sobald mindestens 21
Ereignisse in der Protokolldatei enthalten sind,
können Sie den Befehl showlogs wieder ohne
Option verwenden.
6591367
Informationen zu den DIMM-FRUs im System
können nicht mit dem Dienstprogramm ipmitool
abgerufen werden.
Verwenden Sie zum Abrufen von
Informationen zu DIMM-FRUs die ALOM
CMT-kompatible Befehlszeilenschnittstelle des
Service-Prozessors (Befehl showfru) oder die
ILOM-Befehlszeilenschnittstelle des ServiceProzessors (Befehl show FRU-Name). Weitere
Informationen finden Sie im Dokument
Integrated Lights Out Management (ILOM) Ergänzungshandbuch für SPARC Enterprise T5120
und T5220 Server.
38
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6593547
Ein unberechtigter Watchdog Reset-Fehler tritt auf.
Falls dieser Fehler auftritt, schließt das System die
Bootsequenz nicht vollständig ab. Beim Booten
kann der folgende Fehler in der E/A- oder der
Kontrolldomäne auftreten und die boot-Sequenz
wird abgebrochen:
„ERROR: Last Trap: Watchdog Reset”.
Diese Ereignisse sind unberechtigt und können
ignoriert werden.
Geben Sie zum Fortfahren den Befehl boot an
der Eingabeaufforderung OK ein.
6593801
Wenn sämtliche Identitätsprüfungen der Plattform
fehlschlagen, sollte das Einschalten des Systems
verhindert werden. Ab einer gewissen Anzahl
fehlerhafter FRUs kann das System seine Identität
nicht mehr bestimmen, so dass bestimmte
Komponenten ausfallen und zu einem
Serverabsturz führen können.
6594506
Domänen-ETM und LDC sperren sich gegenseitig,
wenn die Übertragungswarteschlange voll ist.
Beispiele finden Sie unter „Domänen-ETM und
LDC sperren sich gegenseitig, wenn die
Übertragungswarteschlange voll ist (CR 6594506)“
auf Seite 53.
6595955
Wenn eine Komponente physisch nicht im System
vorhanden ist (z. B. ein Lüftermodul), so ist das
Statusfeld in der Ausgabe des Befehls prtdiag -v
(Abschnitt „Environmental Status”) leer und zeigt
keinen Wert an.
6596430
Beim Austausch eines gesockelten EEPROMs (SCC)
liest der Service-Prozessor (SP) manchmal nicht alle
SP-Eigenschaften aus dem neuen EEPROM.
Wenn die SP-Konfigurationsvariable
sc_backupuserdata auf false gesetzt ist,
werden die folgenden Benutzerkonfigurationswerte
nicht im gesockelten EEPROM gesichert:
if_emailalerts, mgt_mailhost,
mgt_mailalert, sc_customerinfo,
sc_powerondelay, sc_powerstatememory,
sc_backupuserdata
Lesen Sie dazu „Domänen-ETM und LDC
sperren sich gegenseitig, wenn die
Übertragungswarteschlange voll ist
(CR 6594506)“ auf Seite 53.
Kopieren Sie diese Benutzereinstellungen
manuell, bevor Sie die Hauptplatine im
laufenden Betrieb austauschen. Nach dem
Austausch müssen Sie die Benutzerparameter
manuell einstellen.
Kapitel 2
Aktuelle Informationen
39
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6596594
Geänderte OBP-NVRAM -Parameter werden nach Nach dem Ändern der Variablen setzen Sie die
einem resetsc nicht wirksam.
Kontrolldomäne mit dem Befehl reset-all
zurück.
Wenn der Service-Prozessor zurückgesetzt wird,
während sich die Kontrolldomäne auf der Ebene
der Eingabeaufforderung ok befindet, können bis
zum Zurücksetzen des Hosts mit OpenBoot PROM
keine LDoms-Variablen oder Sicherheitsschlüssel
mehr im nicht flüchtigen Speicher abgelegt werden.
Gastdomänen sind von diesem Problem nicht
betroffen. Versuche, LDoms-Variablen oder
Sicherheitsschlüssel zu aktualisieren, führen zu
folgenden Warnmeldungen:
WARNING: Unable to update LDOM Variable
WARNING: Unable to store Security key
6598381
Diese Ereignisse sind harmlos und können
In seltenen Fällen gibt die PCIeSchnittstelleneinheit (PCI Interface Unit, PIU) einen ignoriert werden.
irreführenden Fehler-Interrupt aus.
Beispiel finden Sie unter „Irreführende PIUFehlermeldungen (CR 6598381)“ auf Seite 55.
6599333
Die ASR-Datenbank unterstützt das Deaktivieren
von XAUI-Geräten nicht. Wenn ein XAUI-Gerät
deaktiviert wird (über die ILOMBefehlszeilenschnittstelle mit dem Befehl set
NACName component_state=disabled oder mit
dem ALOM CMT-kompatiblen Befehl
disablecomponent) oder wenn POST einen
Fehler erkennt, bleibt das entsprechende
Netzwerkgerät dennoch über die OpenBootFirmware verfügbar.
6601900
Wenn die OpenBoot PROM-Variable auf inputdevice=keyboard gesetzt ist, werden beim
Einschalten oder Zurücksetzen des Systemhosts
möglicherweise Warnmeldungen angezeigt:
Verwenden Sie keine USB-Tastaturen.
Verwenden Sie stattdessen eine virtuelle
Konsole, indem Sie die Variable inputdevice auf virtual-console setzen.
No keyboard support found
Eine US-Tastatur wird ordnungsgemäß
funktionieren. Internationale Tastaturen
(Französisch, Deutsch usw.) verhalten sich
eventuell wie US-Tastaturen.
6602913
40
Das Aus- und Einschalten über IPMI kann
fehlschlagen.
Versuchen Sie, das System über IPMI erneut
aus- und wieder einzuschalten. Oder
verwenden Sie zum Aus- und Einschalten des
Systems eine der anderen verfügbaren
Schnittstellen.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6604305
Während der Systeminitialisierung wird der
Schalten Sie den Host aus, setzen Sie den
Hauptspeicher eventuell nicht erkannt und die
Service-Prozessor zurück und schalten Sie den
folgende Fehlermeldung angezeigt:
Host wieder ein.
ERROR: MB/CMP0/BR3/CH0/D0 must be
populated.
Selten schlägt das Abfragen der DIMMs fehl, weil
ILOM zum gleichen Zeitpunkt die DIMMInformationen aktualisiert. Wenn die DIMM-Tests
fehlschlagen, startet der Host mit einer reduzierten
Speicherkonfiguration oder gar nicht. Diese
Situation tritt wahrscheinlich nicht auf, wenn der
Service-Prozessor (SP) zurückgesetzt wird, da
DIMMs abgefragt werden, bevor ILOM die
dynamischen fruid-Aktualisierungen durchführt.
Dieses Problem tritt wahrscheinlich dann auf, wenn
der Host wiederholt aus- und eingeschaltet wird,
ohne den Service-Prozessor zurückzusetzen.
6612687
Wiederholte Versuche, die Eigenschaften für den
seriellen Anschluss des Hosts anzuzeigen oder
einzustellen, können dazu führen, dass sich die
ILOM-Befehlszeilenschnittstelle aufhängt und nicht
mehr reagiert.
Konfigurieren Sie die Eigenschaften für den
seriellen Anschluss des Hosts nicht über den
Service-Prozessor. Stellen Sie die Eigenschaften
stattdessen über das Betriebssystem Solaris ein.
Falls die ILOM-Befehlszeilenschnittstelle nicht
mehr reagiert, müssen Sie das System
zurücksetzen, indem Sie die Stromversorgung
aus- und wieder einschalten.
6613212
Obwohl „user-reset” oder „all-reset” auf
/Host/diag/trigger gesetzt ist, wird POST
beim Durchführen des Neustarts mit dem Befehl
reset /SYS nicht durchgeführt.
Fügen Sie „all-resets” oder „power-onreset” zu /HOST/diag/trigger hinzu.
6614568
Im ILOM-Modus wird die Eingabeaufforderung ok Derzeit keine. Dieser Fehler wird dem nächsten
nicht angezeigt, wenn der break-Befehl an das
Firmware-Update behoben.
Betriebssystem gesendet wird.
-> set /HOST send_break_action=break
Set 'send_break_action' to 'break'
Folgende Meldung wird an der Konsole des
Betriebssystems angezeigt, doch keine der
Optionen ruft die Eingabeaufforderung ok auf.
# Debugging requested; hardware watchdog
suspended.
c)ontinue, s)ync, r)eboot, h)alt?
Kapitel 2
Aktuelle Informationen
41
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6614576
Falsche Hilfemeldung in der browserbasierten
ILOM-Benutzeroberfläche
Die auf der Registerkarte „Configuration Serial
Port“ in der browserbasierten ILOMBenutzeroberfläche angezeigte
Informationsmeldung erwähnt einen DB-9Anschluss, gemeint ist aber der RJ-45-Anschluss.
Nehmen Sie dieses Problem zur Kenntnis.
6616693
Beim Abrufen von Informationen mit IPMI
werden Daten wie die „Product Part Number”
(Teilenummer) des Servers nicht korrekt angezeigt.
Melden Sie sich bei ILOM an und rufen
Sie z. B. die Informationen unter /SYS ab.
6617506
Wiederholte Versuche, die Eigenschaften für den
seriellen Anschluss des Hosts anzuzeigen oder
einzustellen, können dazu führen, dass sich die
ILOM-Befehlszeilenschnittstelle aufhängt und nicht
mehr reagiert.
Außerdem kann der serielle Anschluss nicht über
die browserbasierte Benutzeroberfläche von ILOM
konfiguriert werden.
Konfigurieren Sie die Eigenschaften für den
seriellen Anschluss des Hosts nicht über den
Service-Prozessor. Stellen Sie die Eigenschaften
stattdessen über das Betriebssystem Solaris ein.
Konfigurieren Sie außerdem die Eigenschaft
„External” des seriellen Anschlusses über die
Befehlszeilenschnittstelle.
6618773
Die Diagnoseroutine, die beim Programmstart
(IBIST) ausgeführt wird, trennt eventuell die
Memory Controller Unit (MCU). Dies führt zu
Fehlermeldungen.
Beispiele dieses Fehlers finden Sie unter
„Die Diagnoseroutine, die beim Programmstart
(IBIST) ausgeführt wird, trennt eventuell die
Memory Controller Unit (MCU) (CR 6618773)“ auf
Seite 56.
Installieren Sie Patch 127580-04 oder höher, und
aktualisieren Sie die Systemfirmware auf
Version 7.0.9 oder höher.
6622444
Wenn mit PRIMECLUSTER GDS das SystemFühren Sie den Boot-Befehl erneut aus, um das
Volume gespiegelt wurde und beim Lesen des Boot- Betriebssystem zu starten, sobald der Prozess
Blocks der Boot-Platte ein Fehler erkannt wird,
zur Eingabeaufforderung ok zurückgekehrt ist.
lässt sich der Boot- Pfad nicht wechseln. Daraufhin
erscheint die folgende Fehlermeldung und der
Prozess kehrt zur Eingabeaufforderung ok zurück.
Boot load failed.
The file just loaded does not appear to be
executable.
{0} ok
6623454
SSH wird als deaktiviert angezeigt, auch wenn es
über die Registerkarte „SSH Server” der
browserbasierten Benutzeroberfläche aktiviert
wurde.
42
Die Einstellung für SSH wurde in „Enable”
geändert. Verwenden Sie die
Aktualisierungsfunktion der browserbasierten
Benutzeroberfläche.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6624658
Solange das System nicht über den ServiceProzessor gestoppt wurde, schaltet es sich beim
nächsten Einschalten der Netzstromversorgung
automatisch ein, und zwar auch dann, wenn
HOST_LAST_POWER_STATE in /SP/policy auf
„enabled” gesetzt ist.
Gleiches gilt, wenn die Eigenschaft
HOST_AUTO_POWER_ON auf enabled gesetzt, das
System aber nicht über den Service-Prozessor
gestoppt wurde.
Führen Sie zum Stoppen des Systems den
entsprechenden Befehl auf dem ServiceProzessor aus.
Wenn Sie die Eigenschaft
HOST_AUTO_POWER_ON auf „enabled” setzen,
müssen Sie außerdem auch
HOST_POWER_ON_DELAY auf „enabled”
setzen.
6624699
Wenn Sie mit der Option „Active Directory” der
browserbasierten Benutzeroberfläche als Rolle
„Administrator/Operator” einstellen, wird unter
„Role” nichts angezeigt.
Melden Sie sich bei ILOM an und überprüfen
Sie die Eigenschaft defaultrole von
/SP/clients/activedirectory.
6624705
Wenn eine Komponente mit der Option
„Component Management” in der
browserbasierten Benutzeroberfläche deaktiviert
wurde, erscheint auf dem
Benutzeranmeldebildschirm im ALOM-Modus eine
Fehlermeldung, die eigentlich angezeigt werden
sollte, wenn der Befehl über die
Befehlszeilenschnittstelle ausgeführt wird.
Fault | critical: SP detected fault at
time Wed Jul 18 09:37:15 2007.
/SYS/MB/GBE1 Disabled by CLI action.
6627396
Wenn Sie auf dem Service-Prozessor, bei dem Sie
angemeldet sind, einen Befehl immer wieder
ausführen, verlangsamt sich die Befehlsausführung.
Zudem können Fehler auftreten.
6628377
Wird der TTYA-Anschluss mit dem entsprechenden
ILOM-Befehl deaktiviert, ist der Anschluss danach
immer noch aktiviert und die Anmeldung beim
Betriebssystem ist weiterhin möglich.
6643177
Das Einschalten des Systems mit dem ALOM CMTkompatiblen Befehl poweron kann fehlschlagen,
wobei folgende Fehlermeldung angezeigt wird:
sc> poweron
Host poweron failed.
poweron error: Internal error
Wenn ILOM mindestens einmal verwendet
wurde, melden Sie sich bei ILOM ab.
Schalten Sie das System aus und wieder ein,
wenn das Problem auftritt.
Es existiert kein valides Verfahren zur
Vermeidung dieses Problems. Es lässt sich aber
durch ein Upgrade der Systemfirmware auf
Version 7.1.0.g beheben.
sc> poweron
Error reading keyswitch value
Kapitel 2
Aktuelle Informationen
43
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6662997
Wenn Sie Firmwarevariablen ändern (z. B. autoboot?), behalten Sie eine Aufzeichnung Ihrer
Änderungen.
Sollte die Hauptplatine ersetzt werden, nehmen die
meisten Service-Prozessor-Variablen die
Standardwerte an.
Das Wartungshandbuch gibt an, dass durch die
Übernahme des SCC-Moduls auf eine neue
Hauptplatine die benutzerdefinierten Variablen
beibehalten werden. Dies ist jedoch
nicht der Fall, da nicht alle Variablen auf dem SCCModul gespeichert sind.
Die folgenden Variablen sind auf dem SCC-Modul
gespeichert und werden beibehalten, wenn das
SCC-Modul auf eine neue Hauptplatine
übernommen wird:
• Host-ID
• MAC-Adressen
Alle anderen Variablenwerte werden auf die
Standardwerte zurückgesetzt.
Machen Sie Aufzeichnungen aller geänderten
Firmware-Variablen.
Falls die Hauptplatine ersetzt wird, verwenden
Sie Ihre Aufzeichnungen der
benutzerdefinierten Variablen, um die
Firmware-Variablen auf der neuen
Hauptplatine manuell zu modifizieren.
6610861
und
6613564
Eingabeaufforderung und Zeichensequenz für den
Wechsel zu u-boot sind anders als bei früheren
Plattformen.
Beim Booten des Service-Prozessors wird 5
Sekunden lang die Eingabeaufforderung Hit any
key to stop autoboot angezeigt. Wird in
dieser Zeit eine Taste gedrückt, wird der ServiceProzessor gestoppt und die Eingabeaufforderung
u-boot angezeigt.
Geben Sie den Befehl boot ein, damit die BootSequenz des Service-Prozessors fortgesetzt
wird.
6676309
und
6667409
Bei der Verwendung von NTP-Diensten unter
Solaris kann es zu einem Scheitern der
Zeitkorrektur mit NTP und zu einer
Zeitverzögerung kommen.
Dieses Problem lässt sich durch ein Upgrade
der Systemfirmware auf Version 7.1.0.g
beheben. Wird kein Update der Firmware
durchgeführt, fügen Sie den Einstellungen in
der Datei /etc/system den entsprechenden
Befehl aus der folgenden Auswahl hinzu und
starten Sie das Betriebssystem neu.
Der NTP-Korrekturmodus ist auf slew gesetzt
• und die Prozessorgeschwindigkeit beträgt
1,2 GHz:
set sys_tick_freq=1165379275
• und die Prozessorgeschwindigkeit beträgt
1,4 GHz:
set sys_tick_freq=1415103392
44
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-3
Probleme mit Firmware, ILOM, POST und Service-Prozessor (Fortsetzung)
CR
Beschreibung
Abhilfe
6656116
Bei einem Ausfall des DIMM-Moduls wird die
MCU getrennt und es wird eventuell eine
Fehlermeldung auf der Konsole angezeigt.
Ein Beispiel dieser Fehlermeldung finden Sie unter
„Fehlermeldung: MCU möglicherweise in DIMMModul getrennt (CR 6656116)“ auf Seite 57.
Identifizieren und ersetzen Sie das fehlerhafte
DIMM-Modul.
Die PCIe-Verbindung arbeitet nicht mit 8 Kanälen
(CR 6556505)
Am System könnte ein Problem auftreten, wenn bei einer Einschalt- oder
Rücksetzsequenz die E/A-Brücke (PCIe-Root-Complex) der UltraSPARC-T2-CPU
nicht funktioniert oder mit weniger als 8 Kanälen arbeitet und kein Fehler generiert
wird, um den Benutzer auf das Problem hinzuweisen.
▼ So identifizieren Sie das Problem
Auch wenn kein Fehler gemeldet wird, erkennen Sie das Problem leicht daran, dass
im System keine PCIe-E/A-Geräte zur Verfügung stehen. In diesem Fall wird ein
Fehler wie der Folgende angezeigt, wenn Sie nach dem Einschalten des Systems oder
dem Zurücksetzen der Domäne von einer Platte oder einem Netzwerkgerät booten:
{0} ok boot disk
Boot device: /pci@0/pci@0/pci@2/scsi@0/disk@0
ERROR: boot-read fail
File and args:
Can't locate boot device
{0} ok
1. Geben Sie den Befehl show-devs an der Eingabeaufforderung ok ein.
2. Überprüfen Sie die Ausgabe auf PCIe-Geräte.
Wenn keine PCIe-Geräte angezeigt werden, ist dieses Problem am Server
aufgetreten.
Hinweis – Alle PCIe-Geräte fangen mit dem Pfad /pci@0/pci@0 an.
Kapitel 2
Aktuelle Informationen
45
▼ So beheben Sie den Fehler
1. Fahren Sie alle Domänen herunter und schalten Sie das System aus.
2. Führen Sie dann einen POST (Systemselbsttest nach dem Einschalten) aus.
So können Sie ermitteln, ob es sich um einen dauerhaften Fehler handelt.
Zum Aktivieren von POST verwenden Sie den Befehl setsc der ALOM CMTkompatiblen Befehlszeilenschnittstelle und stellen Sie die höchste POST-Stufe ein.
Beispiel:
sc> setsc diag_mode normal
sc> setsc diag_level max
3. Schalten Sie das System ein.
POST überprüft die CPU, Hauptspeicher und die E/A-Untersysteme. Bei einem
dauerhaften Problem meldet POST, dass die Tests für den PCIe-Root-Complex
fehlgeschlagen sind, und deaktiviert die Komponente /SYS/MB/PCIE.
4. Falls POST dieses Problem erfasst, ersetzen Sie die Hauptplatine.
Der break-Befehl für Terminalserver an der
seriellen Leitung des Service-Prozessors
funktioniert nicht (CR 6577528)
Wenn Sie mit einem Terminalserver (z. B. der Cisco ASM-Serie) über Telnet
eine Verbindung zur seriellen Leitung des Service-Prozessors herstellen und ein
Break-Signal an den Solaris-Host senden, funktioniert der Befehl break nicht
und wird vom Service-Prozessor ignoriert. Geben Sie den break-Befehl über die
Befehlszeilenschnittstelle des Service-Prozessors ein, um ein Break-Signal an den
Solaris-Host zu senden.
Im folgenden Beispiel wird über die ALOM CMT-kompatible Befehlszeilenschnittstelle
ein Break-Signal an den Solaris-Host gesendet:
1. Melden Sie sich mit dem Befehl console beim Host an.
sc> console
2. Wechseln Sie mit #. zurück zur Eingabeaufforderung des Hosts.
sc> #.
Solaris-host-prompt>
46
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
3. Wechseln Sie mit der Escape-Sequenz #. zur ALOM CMT-kompatiblen
Befehlszeilenschnittstelle des Service-Prozessors. Die Escape-Sequenz wird
nicht am Bildschirm angezeigt.
Solaris-host-prompt> #.
sc>
4. Geben Sie den Befehl break ein.
sc> break -c -y
5. Kehren Sie mit #. zur ALOM CMT-kompatiblen Befehlszeilenschnittstelle des
Service-Prozessors zurück.
sc> #.
c)ontinue, s)ync, r)eboot, h)alt?
Im folgenden Beispiel wird über die ILOM-Befehlszeilenschnittstelle des ServiceProzessors ein Break-Signal an den Solaris-Host gesendet:
1. Melden Sie sich mit dem ILOM-Konsolenbefehl beim Host an.
-> start /SP/console
Are you sure you want to start /SP/console (y/n)? y
Serial console started. To stop, type #.
Solaris-host-prompt>
2. Wechseln Sie mit #. zur ILOM-Befehlszeilenschnittstelle des ServiceProzessors. Die Escape-Sequenz wird nicht am Bildschirm angezeigt.
Solaris-host-prompt> #.
->
3. Geben Sie den Befehl break wie folgt ein.
-> set /HOST send_break_action=break
->
Melden Sie sich mit dem Befehl console erneut beim Solaris-Host an.
-> start /SP/console
Are you sure you want to start /SP/console (y/n)? y
Serial console started. To stop, type #.
c)ontinue, s)ync, r)eboot, h)alt?
Weitere Informationen zur Verwendung des break-Befehls von den
Befehlszeilenschnittstellen des Service-Prozessors aus finden Sie im Integrated Lights
Out Manager 2.0 Benutzerhandbuch und dem Integrated Lights Out Management (ILOM)
Ergänzungshandbuch für SPARC Enterprise T5120 und T5220 Server.
Kapitel 2
Aktuelle Informationen
47
Der Befehl showfaults zeigt die Hauptplatine
anstelle des DIMMs als fehlerhaft an (CR 6582853)
Wenn die PSH-Software (Predictive Self-Healing) auf dem Host DIMMs oder PCIeAdapter in einem System als fehlerhaft erkannt hat, wird in der Ausgabe des
ALOM-Befehls showfaults die fehlerhafte FRU als Hauptplatine (/SYS/MB),
nicht als DIMM oder PCIe-Adapter angezeigt. Dieses Problem tritt bei den
folgenden PSH-Meldungs-IDs (MSGID) auf:
■
SUN4V-8000-E2
■
SUN4V-8000-D
■
SUN4-8000-4P
■
SUN4-8000-A2
■
SUN4-8000-75
■
SUN4-8000-9J
■
SUN4-8000-D4
■
PCIEX-8000-0A
■
PCIEX-8000-DJ
■
PCIEX-8000-HS
Das folgende Beispiel aus der ALOM CMT-kompatiblen Befehlszeilenschnittstelle
veranschaulicht das Problem. In diesem Beispiel wird die Hauptplatine (/SYS/MB)
als fehlerhafte FRU angezeigt, jedoch liegt eigentlich ein Fehler an einem SpeicherDIMM vor.
sc> showfaults -v
Last POST Run: Jul. 13 18:32:11 2007
Post Status: Passed all devices
ID Time
FRU
Class
Fault
0 Jul 13 19:31:34
/SYS/MB
Host detected fault, MSGID:
SUN4V-8000-DX UUID: 7b471945-ceef-eea0-c3ad-85ca140be5b2
Darüber hinaus gibt es ein Problem mit der Ausgabe, die von dem Befehl
show /SYS/faultmgmt (ILOM-Befehlszeilenschnittstelle) angezeigt wird.
Die Eigenschaft fault_state der Komponenten, und die auf der Registerkarte
„Fault Management“ in der browserbasierten ILOM-Benutzeroberfläche
aufgeführten fehlerhaften Komponenten entsprechen nicht den oben aufgeführten
PSH-Nachrichten-IDs. Außerdem leuchtet die Fehler-LED des FB-DIMMs nicht
und für die FRUID der Hauptplatine wird ein Fehler aufgezeichnet.
48
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Abhilfe: Suchen Sie die Position fehlerhafter DIMMs oder PCIe-Adapter mit den
Störungsmanagement-Dienstprogrammen auf dem Host. Anweisungen zur
Verwendung der Dienstprogramme für solche Fehler finden Sie in den KnowledgeArtikeln zu Predictive Self-Healing unter: http://www.sun.com/msg/MSGID
MSGID ist eine der oben aufgezählten PSH-Meldungs-IDs, die vom ALOM-Befehl
showfaults ausgegeben wird.
Bei fehlerhaften DIMMs können Sie die DIMM-Position anhand des DIMMAufklebers auf der Luftführung oder der Systemabdeckung ermitteln.
Nachdem die fehlerhaften DIMMs ausgetauscht und die PSH-Fehler bereinigt
wurden, werden der Eintrag in der Ausgabe von showfaults und der für die
Hauptplatinen-FRUID aufgezeichnete Fehler gelöscht.
Die Befehle uadmin 2 0 und reboot lesen alte
Boot-Modus-Einstellungen ein (CR 6585340)
Sie können die LDoms-Variablen auf drei Arten ändern: mit dem OpenBoot-Befehl
setenv in der Kontrolldomäne, mit dem Solaris-Befehl eeprom in der
Kontrolldomäne oder mit der ILOM-Option bootmode bootscript. Mit den
Befehlen setenv und eeprom vorgenommene Änderungen werden sofort wirksam.
Mit dem Befehl bootmode vorgenommene Änderungen sollten beim nächsten
Zurücksetzen in Kraft treten, ganz gleich, auf welche Art das System zurückgesetzt
wird.
Auf eine der drei genannten Arten vorgenommene Änderungen sollten wirksam
bleiben, bis erneut Änderungen vorgenommen werden. Das heißt, es spielt keine
Rolle, wie der Wert einer LDoms-Variablen geändert wird. Einmal geändert, bleibt
der Wert wirksam, bis die Variable erneut geändert wird.
Tatsächlich werden mit dem Befehl bootmode vorgenommene Änderungen jedoch
erst nach einem Power-on-Reset wirksam. Danach setzen die neuen Werte bei jedem
weiteren Zurücksetzen (mit Ausnahme eines Power-on-Reset) alle zwischenzeitlich
mit den Befehlen setenv und eeprom vorgenommenen Änderungen außer Kraft.
Wenn Änderungen mit dem Befehl bootmode vorgenommen werden, muss also ein
Power-on-Reset ausgeführt werden, damit diese wirksam werden. Mit dem Befehl
setenv oder eeprom vorgenommene Änderungen bleiben nur bis zum nächsten
Zurücksetzen wirksam. Danach gelten für geänderte Variablen wieder die mit dem
letzten bootmode-Befehl eingestellten Werte. Die bootmode-Einstellung bleibt
wirksam, bis der Computer aus- und wieder eingeschaltet wird. Nach dem Aus- und
Einschalten wird nicht wieder die vorherige bootmode-Einstellung in Kraft gesetzt.
Alle nachfolgenden Änderungen, die mit dem Befehl setenv oder eeprom
vorgenommen werden, bleiben jetzt auch beim Zurücksetzen des Systems wirksam,
zumindest, bis der nächste bootmode-Befehl ausgeführt und das System dann ausund wieder eingeschaltet wird.
Kapitel 2
Aktuelle Informationen
49
Abhilfe: Starten Sie die Kontrolldomäne sofort nach Ausführung des Befehls
bootmode mit einem Power-on-Reset neu und führen Sie nochmals einen Neustart
aus, sobald die Kontrolldomäne bis zu OpenBoot oder Solaris gebootet wurde.
Mit dem ersten Power-on-Reset wird der Befehl bootmode in Kraft gesetzt und mit
dem zweiten Power-on-Reset vermeiden Sie, dass die bootmode-Einstellung beim
Zurücksetzen immer wieder in Kraft gesetzt wird.
Die Kontrolldomäne kann mit dem Befehl powercycle der ALOM CMTkompatiblen Befehlszeilenschnittstelle durch einen Power-on-Reset zurückgesetzt
werden. Sobald die Kontrolldomäne bis zum Betriebssystem Solaris gebootet wurde,
müssen Sie das Betriebssystem ordnungsgemäß herunterfahren, bevor Sie den Befehl
powercycle ausführen.
Ein Kommunikationskanal kann sich zwischen
der primären Domäne und dem Service-Prozessor
aufhängen (CR 6583567)
In seltenen Fällen kann es vorkommen, dass sich ein Kommunikationskanal
zwischen der primären Domäne und dem Service-Prozessor aufhängt und die
Kommunikation über den Kanal nicht mehr möglich ist.
Abhilfen:
50
■
Wenn der Kanal nicht nur vom Störungsmanagement-Daemon (fmd), sondern
auch von anderen Diensten oder Anwendungen der primären Domäne verwendet
wird, also z. B. vom LDoms Manager ldmd, werden möglicherweise Warn- oder
Fehlermeldungen zu Kommunikationsfehlern angezeigt. In diesem Fall kann der
Kanal durch einen Neustart des jeweiligen Dienstes bzw. der Anwendung wieder
aktiviert werden.
■
Wird der Kanal von fmd verwendet, werden keine Warn- oder Fehlermeldungen
angezeigt. Es werden keine Fehlerberichte (ereports) an fmd übermittelt und die
Fehler werden nicht diagnostiziert.
■
Wird der Kanal vom Betriebssystem (Solaris) zur Kommunikation mit dem
Service-Prozessor verwendet, so werden möglicherweise Warn- oder
Fehlermeldungen angezeigt, dass der Primärmultiplexanschluss (PRI) nicht
angesprochen werden konnte, dass der Zugriff auf ASR-Daten fehlgeschlagen ist,
dass LDoms-Variablen nicht gesetzt werden konnten oder dass in der SNMPKommunikation Fehler aufgetreten sind. In diesem Fall kann der Kanal durch das
Zurücksetzen des Service-Prozessors wieder aktiviert werden. Starten Sie nach
dem Zurücksetzen des Service-Prozessors fmd auf der primären Domäne neu.
Wenn sich der Kanal durch das Zurücksetzen des Service-Prozessors nicht wieder
aktivieren lässt, müssen Sie eventuell auch die primäre Domäne neu starten.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
■
Wenn eine Domäne abstürzt oder ein Dienst spontan neu gestartet wird, ohne
dass entsprechende Fehlermeldungen ausgegeben werden, müssen Sie zum
Wiederherstellen wie unten beschrieben vorgehen, um einen Verlust der
Fehlertelemetrie weitgehend zu vermeiden.
▼ Wiederherstellung nach einem Domänenabsturz
1. Starten Sie fmd in der primären Domäne neu.
2. Warten Sie 30 Sekunden.
3. Setzen Sie den Service-Prozessor mit einem der folgenden Befehle zurück:
-> reset /SP [ILOM-Befehlszeilenschnittstelle]
ODER
sc> resetsc -y [ALOM CMT-kompatible Befehlszeilenschnittstelle]
4. Starten Sie fmd in der primären Domäne neu.
Geben Sie vom Betriebssystem Solaris aus den folgenden Befehl ein:
# svcadm restart svc:/system/fmd:default
Kapitel 2
Aktuelle Informationen
51
Zurücksetzen des Service-Prozessors erzeugt
irreführende Warnmeldungen (CR 6585292)
Der folgende Auszug zeigt die irreführenden Meldungen, die ignoriert werden können.
sc> resetsc [ähnliche Meldungen werden auch für den Befehl reset /SP angezeigt]
...
Linux version 2.4.22 (kbellew@sanpen-rh4-0) (gcc version 3.3.4) #2 Wed
Jul 18 19:25:18 PDT 2007 r21410
Loading modules: fpga Warning: loading
/lib/modules/2.4.22/misc/fpga/fpga.o will taint the kernel: non-GPL
license - Proprietary
See http://www.tux.org/lkml/#export-tainted for information about
tainted modules
...
Module fpga loaded, with warnings
fpga_flash Warning: loading
/lib/modules/2.4.22/misc/fpga_flash/fpga_flash.o will taint the kernel:
no license
See http://www.tux.org/lkml/#export-tainted for information about
tainted modules
Module fpga_flash loaded, with warnings
immap Warning: loading /lib/modules/2.4.22/misc/immap/immap.o will taint
the kernel: no license
Refer to: http://www.tux.org/lkml/#export-tainted for information about
tainted modules
Module immap loaded, with warnings
...
EXT3-fs warning: maximal mount count reached, running e2fsck is
recommended
EXT3 FS 2.4-0.9.19, 19 August 2002 on tffs(100,1), internal journal
EXT3-fs: mounted filesystem with ordered data mode.
kjournald starting. Commit interval 5 seconds
EXT3-fs warning: maximal mount count reached, running e2fsck is
recommended
...
ipt_recent v0.3.1: ... < ... >. http://snowman.net/projects/ipt_recent/
arp_tables: (C) 2002
802.1Q VLAN Support v1.8 ... < ... >
All bugs added by ...
52
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Domänen-ETM und LDC sperren sich gegenseitig, wenn
die Übertragungswarteschlange voll ist (CR 6594506)
Nach bestimmten Hardwarefehlern werden möglicherweise keine PSH-Ereignisse
mehr zwischen dem Service-Prozessor und der Domäne ausgetauscht (CR 6594506).
Dieses Problem tritt in folgenden Szenarios auf:
■
Nicht wiederherstellbare Fehler in der Solaris-Domäne einer ohne LDoms
verwalteten Umgebung
■
Nicht wiederherstellbare Fehler in der Kontrolldomäne einer mit LDoms
verwalteten Umgebung
■
Schwerwiegende Systemfehler in einer mit oder ohne LDoms verwalteten
Umgebung (bei einem schwerwiegenden Fehler wird das System auf HardwareEbene zurückgesetzt).
Hinweis – In einer mit LDoms verwalteten Umgebung sind nicht wiederherstellbare
Fehler in LDoms-Gastdomänen nicht von dieser Änderungsanforderung betroffen.
Im folgenden Beispiel hat ein nicht wiederherstellbarer Fehler in der Kontrolldomäne
zu einem Solaris-Absturz geführt. Die folgenden Meldungen werden an der Konsole
der Kontrolldomäne ausgegeben:
SUNW-MSG-ID: SUNOS-8000-0G, TYPE: Error, VER: 1, SEVERITY: Major
EVENT-TIME: 0x46c61864.0x318184c6 (0x1dfeda2137e)
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: SunOS, REV: 5.10 Generic_Patch
DESC: Errors have been detected that require a reboot to ensure system
integrity. See http://www.sun.com/msg/SUNOS-8000-0G for more information.
AUTO-RESPONSE: Solaris will attempt to save and diagnose the error telemetry
IMPACT: The system will sync files, save a crash dump if needed, and reboot
REC-ACTION: Save the error summary below in case telemetry cannot be saved
Wenn ein nicht wiederherstellbarer Fehler zu einem Abbruch der HypervisorSoftware führt und Sie bei der Konsole der ALOM CMT-kompatiblen
Befehlszeilenschnittstelle angemeldet sind, werden Meldungen wie die Folgende an
die Konsole des Service-Prozessors gemeldet:
Aug 17 22:09:09 ERROR: HV Abort: <Unknown?> (228d74) - PowerDown
Kapitel 2
Aktuelle Informationen
53
Nach der Wiederherstellung der Kontrolldomäne werden Diagnosetests ausgeführt.
Die an der Konsole angezeigten Meldungen geben Aufschluss über die Ursache des
nicht wiederherstellbaren Fehlers. Beispiel:
SUNW-MSG-ID: SUN4V-8000-UQ, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: Fri Aug 17 18:00:57 EDT 2007
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: cpumem-diagnosis, REV: 1.6
EVENT-ID: a8b0eb18-6449-c0a7-cc0f-e230a1d27243
DESC: The number of level 2 cache uncorrectable data errors has exceeded
acceptable levels. Refer to http://sun.com/msg/SUN4V-8000-UQ for more
information.
AUTO-RESPONSE: No automated response.
IMPACT: System performance is likely to be affected.
REC-ACTION: Schedule a repair procedure to replace the affected resource,
the identity of which can be determined using fmdump -v -u <EVENT_ID>.
Zu diesem Zeitpunkt ist möglicherweise das Problem CR 6594506 aufgetreten.
Dieses Problem verhindert, dass zukünftige PSH-Ereignisse (z. B. weitere
korrigierbare oder nicht korrigierbare Hardwarefehler) an die Domäne übermittelt
und ordnungsgemäß diagnostiziert werden.
Abhilfe: Setzen Sie den Service-Prozessor zurück, sobald die Domäne wiederhergestellt
und die Diagnosemeldung an die Solaris-Konsole ausgegeben wurde:
sc> resetsc -y [ALOM CMT-kompatible Befehlszeilenschnittstelle]
ODER
-> reset /SP [ILOM-Befehlszeilenschnittstelle]
Sobald der Service-Prozessor neu gestartet wurde und Sie sich als admin-Benutzer
anmelden können (alle Dämonen also bereit sind), führen Sie in der SolarisKontrolldomäne die folgenden Befehle aus:
# fmadm unload etm
# fmadm load /usr/platform/sun4v/lib/fm/fmd/plugins/etm.so
54
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Irreführende PIU-Fehlermeldungen (CR 6598381)
In seltenen Fällen gibt die PIU (PCIe-Schnittstelleneinheit) einen irreführenden
Fehler-Interrupt aus.
Das Folgende ist ein Beispiel für ein nach einer Diagnose gemeldetes Ereignis:
SUNW-MSG-ID: FMD-8000-0W, TYPE: Defect, VER: 1, SEVERITY: Minor
EVENT-TIME: Mon Aug 27 10:07:33 EDT 2007
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: xxxxxxx
SOURCE: fmd-self-diagnosis, REV: 1.0
EVENT-ID: dd9a4415-9be4-cb55-d061-8804b8009d3c
Das Folgende ist ein Beispiel für ein nach Eingabe des Befehls fmdump gemeldetes
Ereignis:
# fmdump -eV -u dd9a4415-9be4-cb55-d061-8804b8009d3c
TIME
CLASS
Aug 27 2007 10:06:15.496599680 ereport.fm.ferg.invalid
nvlist version: 0
class = ereport.fm.ferg.invalid
ena = 0xd4e233fe480002
info = DMU Core and Block Error Status(0): No bits set
raw-data = 0x2 0x1a62441a01d844 0x30000000000005 0x4b63c07df9ff
0x3e002421030607 0x
3e 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0 0x0
__ttl = 0x0
__tod = 0x46d2da57 0x1d998280
Diese Ereignisse sind harmlos und können ignoriert werden.
Kapitel 2
Aktuelle Informationen
55
Die Diagnoseroutine, die beim Programmstart
(IBIST) ausgeführt wird, trennt eventuell die
Memory Controller Unit (MCU) (CR 6618773)
In einigen Fällen wird die MCU von den zugehörigen DIMM-Modulen und CPUKernen getrennt und die folgenden Meldungen auf der Konsole angezeigt.
Beispiel:
Chassis | major: Host has been powered on
Chassis | major: Dec 19 08:45:11 ERROR: MB/CMP0/MCU2 Failed IBIST,
disabled
Fault | critical: SP detected fault at time Wed Dec 19 08:45:12
2007. /SYS/MB/CMP0/MCU2 Forced fail (IBIST)
Chassis | major: Dec 19 08:45:13 ERROR: MB/CMP0/MCU3 unused because
MB/CMP0/MCU2 is not configured
Chassis | major: Dec 19 08:45:13 ERROR: MB/CMP0/L2_BANK4,
MB/CMP0/L2_BANK5 unused because MB/CMP0/MCU2 is not configured
Chassis | major: Dec 19 08:45:13 ERROR: MB/CMP0/L2_BANK6,
MB/CMP0/L2_BANK7 unused because MB/CMP0/MCU3 is not configured
Chassis | major: Dec 19 08:45:13 ERROR: Degraded configuration:
system operating at reduced capacity
Chassis | major: Dec 19 08:45:13 ERROR: System DRAM Available:
008192 MB
Chassis | major: Dec 19 08:45:13 ERROR: Only 4 cores, up to 32 cpus
are configured because some L2_BANKS are unusable
Abhilfe: Installieren Sie Patch 127580-04 oder höher, und aktualisieren Sie die
Systemfirmware auf Version 7.0.9 oder höher.
Fehlermeldungen der Ultra320 SCSI-Karte
Beim Booten von einem Gerät, das an die Ultra320 Zweikanal-SCSI-Karte
(SE0X7SC2F, SE0X7SC2X) angeschlossen ist, werden folgende Meldungen angezeigt.
Da sich diese Fehlermeldungen nicht auf den Systembetrieb auswirken, können sie
gefahrlos ignoriert werden.
SCSI command timeout occurred
SCSI interrupts not occur
56
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Fehlermeldung: MCU möglicherweise in DIMMModul getrennt (CR 6656116)
Bei einem Ausfall des DIMM-Moduls wird die MCU getrennt und es wird eventuell
folgende Fehlermeldung auf der Konsole angezeigt.
Beispiel:
Meldung
Jun 04 06:11:22: Chassis | major: "Jun 4 06:11:22 ERROR: MCU2
initialization failed: DRAM init, disabled"
Jun 04 06:11:23: Fault | critical: "SP detected fault at time Wed
Jun 4 06:11:23 2008. /SYS/MB/CMP0/MCU2 Forced fail (DRAM init)"
Jun 04 06:11:24: Chassis | major: "Jun 4 06:11:24 ERROR:
MB/CMP0/MCU3 unused because MB/CMP0/MCU2 is not configured"
Jun 04 06:11:24: Chassis | major: "Jun 4 06:11:24 ERROR:
MB/CMP0/L2_BANK4, MB/CMP0/L2_BANK5 unused because MB/CMP0/MCU2 is
not configured"
Jun 04 06:11:24: Chassis | major: "Jun 4 06:11:24 ERROR:
MB/CMP0/L2_BANK6, MB/CMP0/L2_BANK7 unused because MB/CMP0/MCU3 is
not configured"
Jun 04 06:11:24: Chassis | major: "Jun 4 06:11:24 ERROR: Degraded
configuration: system operating at reduced capacity"
Jun 04 06:11:24: Chassis | major: "Jun 4 06:11:24 ERROR: System
DRAM Available: 002048 MB"
showfaults, Befehl
Last POST Run: Wed Jun 4 06:14:17 2008
Post Status: Passed all devices
ID FRU Fault
1 /SYS/MB
SP detected fault: /SYS/MB/CMP0/MCU2 Forced
fail (DRAM init)
Abhilfe: Identifizieren und ersetzen Sie das fehlerhafte DIMM-Modul.
Kapitel 2
Aktuelle Informationen
57
Probleme mit dem Betriebssystem
Solaris
TABELLE 2-4 enthält aktuelle Informationen zu Problemen bei der Ausführung des
Betriebssystems Solaris auf SPARC Enterprise T5120 und T5220 Servern. Weitere
Informationen zu bestimmten Änderungsanforderungen (Change Requests, CR)
finden Sie im Anschluss an die Tabelle.
Hinweis – Darüber hinaus finden Sie allgemeine aktuelle Informationen zum
Betriebssystem Solaris in den Solaris 10-Versionshinweisen.
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris
CR
Beschreibung
Abhilfe
6479347
Der Solaris-Befehl prtdiag zeigt die Gerätepfade für
die e1000g-Treibergeräte falsch an.
Erzwingen Sie das Laden aller Instanzen
des e1000g-Treibers und starten Sie dann
den Daemon picld wie folgt neu:
# devfsadm -i e1000g
# svcadm restart
svc:/system/picl
Stattdessen können Sie auch beim Booten
oder erneuten Booten des Systems die
Option -r verwenden.
6519290
Große E/A-Datenaufkommen bei Swap-Geräten können Ein das System überforderndes E/Adurch eine Überlastung des E/A-Systems dazu führen, Datenaufkommen kann verschiedene
dass sich das System aufzuhängen scheint.
Ursachen haben: Unzureichender
Speicherplatz, übermäßige Verwendung
von /tmp, etc.
Fügen Sie die folgende Zeile in die Datei
/etc/system ein und starten Sie dann
Solaris neu.
set maxfastscan=0x2000
6527622
Nach einem Absturz des Betriebssystems stoppt der
Server möglicherweise an der Eingabeaufforderung ok
und zeigt folgende Meldungen an.
WARNING: promif_ldom_setprop: ds response
timeout
WARNING: unable to store boot command for use
on reboot
6536482
Zurzeit können mit cpummem keine fbr/fbu-Fehler
diagnostiziert werden.
58
Setzen Sie auto-boot?=true oder
starten Sie den Server manuell mit dem
Befehl boot.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris (Fortsetzung)
CR
Beschreibung
Abhilfe
6552999
Das Drücken von Strg-C während der Ausführung
des Befehls prtdiag -v führt bei einer erneuten
Ausführung zu leeren Datenfeldern für die Umgebung.
Die fehlende Ausgabe bleibt bestehen, bis der SMFDienst picld neu gestartet wird.
Wenn keine Umgebungsdaten in der
Ausgabe des Befehls prtdiag enthalten
sind, starten Sie den SMF-Dienst picld in
der Kontrolldomäne mit dem folgenden
Befehl neu:
# svcadm restart picl
6554813
Wenn Sie bei der Übertragung mit dem GLDv3kompatiblen (Generic LAN Driver Version 3) EthernetTreiber den Befehl ifconfig mit der Option modlist
(modinsert/modremove) ausführen, kann das SoftwareAnrufverfahren des GLDv3-Moduls eine gegenseitige
Sperrung verursachen.
Abhilfe: Fügen Sie folgende Einstellung in
die Datei /etc/system ein und booten
Sie das System neu.
set ip:ip_soft_rings_cnt=0
6555956
Server stürzen eventuell aufgrund eines Fehlers im
PCIe-Root-Complex ab.
Während des Neustarts kann es zu einem Absturz mit
der folgenden Meldung kommen:
„Fatal error has occurred in: PCIe root
complex.”
Der Absturz tritt nur beim Neustart auf. Beim Neustart
nach einem solchen Absturz ist dieser Fehler nie
aufgetreten. Der Absturz kann auch dann auftreten,
wenn keine externen USB-Geräte an den Server
angeschlossen sind.
Falls Ihr Server in solchen Fällen abstürzt,
führen Sie die unter „Server stürzen
aufgrund eines Fehlers im PCIe-RootComplex eventuell ab (CR 6555956)“ auf
Seite 64 beschriebenen
Abhilfemaßnahmen durch.
6564180
Der Befehl locator des Betriebssystems Solaris
funktioniert nicht auf diesem Server.
Verwenden Sie stattdessen den ILOModer ALOM CMT-kompatiblen Befehl
locator.
• Über die ILOMBefehlszeilenschnittstelle:
-> show /SYS/LOCATE/
-> show /SYS/LOCATE/ value=off
-> show /SYS/LOCATE/ value=on
• Über die ALOM CMT-kompatible
Befehlszeilenschnittstelle:
sc> showlocator
sc> setlocator on
sc> setlocator off
Kapitel 2
Aktuelle Informationen
59
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris (Fortsetzung)
CR
Beschreibung
Abhilfe
6566442
Die Ausgabe des Befehls prtdiag ist möglicherweise
falsch.
• Informationen zum Hauptspeicher werden links
ausgerichtet angezeigt.
• Obwohl die CPU-Threads auf disabled gesetzt
wurden, wird als FRU-Status „All FRUs are
enabled” angezeigt.
• Informationen zu einem bei laufendem Betrieb
ausgetauschten Lüfter (FAN) werden nicht angezeigt.
• Einige der Informationen zur
Hauptspeicherkonfiguration werden nicht angezeigt.
Derzeit keine.
6572985
Bei langen Testläufen der SunVTS-Software kann der
SunVTS-Test cryptotest gelegentlich mit einer
Fehlermeldung wie der Folgenden fehlschlagen:
Installieren Sie das SunVTS-Patch 12729401 (oder höher).
„cryptotest.FATAL n2rng0: SUNW_RANDOM
generate failed: values generated fall
outside statistical tolerance”
6578410
Wenn eine Infiniband-HBA-Karte eingebaut ist, kann
sich der Server beim Booten aufhängen.
Fügen Sie folgende Einstellung in die
Datei /etc/system ein:
set tavor:tavor_iommu_bypass =
0
6586624
Die Solaris-Befehle prtdiag und prtpicl zeigen
eventuell nicht die vollständigen Informationen an.
• Wenn der Befehl prtdiag -v (ausführliche Ausgabe)
verwendet wird, werden möglicherweise die
Firmwareversion und die Gehäuseseriennummer
nicht angezeigt.
• Die Ausgabe des Solaris-Befehls prtpicl enthält
darüber hinaus u. U. nicht den Abschnitt zur
physikalischen Plattform.
Verwenden Sie die unter „Informationen
zur physikalischen Plattform fehlen in der
prtpicl- und prtdiag-Ausgabe
(CR 6586624)“ auf Seite 65 beschriebenen
alternativen Methoden, um die
gewünschten Informationen anzuzeigen.
6586847
Der Solaris-Befehl prtdiag ohne die Option -v weist
dieses Fehlverhalten in der Ausgabe nicht auf.
Verwenden Sie immer die Option -v,
wenn Sie den Befehl prtdiag ausführen.
6587380
Der Solaris-Befehl prtdiag -v zeigt nicht
spannungsbezogene Daten im Abschnitt mit den
Angaben zur Spannung an.
Die spannungsbezogenen und
nicht spannungsbezogenen Daten
(z. B. PS0/TEMP_FAULT) sind korrekt
und geben den aktuellen Status der
Komponenten wieder.
60
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris (Fortsetzung)
CR
Beschreibung
Abhilfe
6587389
Der Solaris-Befehl prtdiag -v zeigt Daten eventuell
ohne Leerzeichen an, wodurch die Daten schwer lesbar
sind.
Verwenden Sie stattdessen den Befehl
showenvironment über die ALOM CMTkompatible Befehlszeilenschnittstelle:
sc> showenvironment
Weitere ausführliche Informationen hierzu
finden Sie unter „Der Befehl prtdiag -v
weist Formatierungsprobleme auf
(CR 6587389)“ auf Seite 67.
6588452
Beim Booten des Betriebssystems Solaris von einem
externen USB-DVD-ROM-Laufwerk kann es zu einem
Absturz kommen, wodurch das Booten fehlschlägt
Weitere Informationen zu diesem Thema finden Sie
unter „Beim Booten des Betriebssystems Solaris von
einem externen USB-DVD-ROM-Laufwerk kann es zu
einem Absturz kommen (CR 6588452)“ auf Seite 66.
Verwenden Sie ein integriertes DVDLaufwerk oder ein Laufwerk, dessen
Unterklasse nicht 2, 3 oder 4 ist.
6588499
Beim Herunterfahren des Betriebssystems Solaris bleibt
das System hängen und es stehen weniger
Systemdienste zur Verfügung.
In seltenen Fällen kann das Herunterfahren des
Betriebssystems Solaris direkt nach dem Hochfahren
dazu führen, dass sich das System aufhängt. Dies wird
dadurch verursacht, dass manche Systemdienste
angehalten werden, während andere noch starten.
In solchen Fällen wird eine Meldung ähnlich der
Folgenden angezeigt:
svc.startd: The system is coming down. Please
wait
svc.startd: 74 system services are now being
stopped
Starten Sie das System neu, indem Sie den
Service-Prozessor abwerfen. Dann
schalten Sie das Hostsystem mithilfe einer
der folgenden Methoden aus und wieder
ein:
• Über die ILOMBefehlszeilenschnittstelle:
-> stop /SYS
-> start /SYS
• Über die ALOM CMT-kompatible
Befehlszeilenschnittstelle:
sc> poweroff
sc> poweron
sc> powercycle
6588550
Der Solaris-Befehl prtdiag -v reagiert auf SPARC
Enterprise T5120 Servern nur langsam.
Eventuell dauert es bis zu 5 Minuten, bis die Ausgabe
des Befehls angezeigt wird. Es scheint, als ob das
System nicht mehr reagiert.
Nehmen Sie diese Verzögerung zur
Kenntnis und warten Sie auf die Ausgabe.
Drücken Sie nicht die Tasten Strg-C.
6589612
Der Befehl raidctl -l gibt wiederholt die folgende
Ausgabe aus:
Beenden Sie die Ausgabe mit den Tasten
Strg-C.
# raidctl -l
Controller: 1
Volume:c1t0d0
Volume:c1t2d0
Disk: 0.0.0
Disk: 0.0.0
...
Kapitel 2
Aktuelle Informationen
61
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris (Fortsetzung)
CR
Beschreibung
Abhilfe
6592238
RAID 1-Volume kann nach der Erstellung von RAID 1- Installieren Sie das Patch 126434-05
und RAID 0-Volumes nicht gelöscht werden.
(oder höher).
Wenn Sie über einen integrierten SAS-Controller
(oder einen anderen Controller, der den mpt-Treiber
verwendet) zwei Volumes erstellen, können Sie mit dem
Dienstprogramm raidctl eines der RAID-Volumes
nicht mehr löschen und auch nicht die korrekten
Platteninformationen anzeigen. In diesem Fall wird eine
Meldung ähnlich der Folgenden angezeigt:
# raidctl -l
Device record is invalid.
Nach bestimmten Hardwarefehlern werden
möglicherweise keine Solaris PSH-Ereignisse mehr
zwischen dem Service-Prozessor und der Domäne
ausgetauscht.
Beispiel finden Sie unter „PSH-Ereignisse werden nicht
mehr ausgetauscht (CR 6594506)“ auf Seite 67.
Lesen Sie dazu „PSH-Ereignisse werden
6596503
Wenn Sie den Solaris-Befehl prtpicl mit der Option -v
eingeben, werden in der Ausgabe CPU-Kerne und Bänke möglicherweise als enabled angezeigt, obwohl
die Kerne und Bänke gar nicht vorhanden sind.
Verwenden Sie stattdessen den Befehl
dprtdiag oder prtpicl -c cpu. In der
Ausgabe dieser Befehle werden die
richtigen Informationen angezeigt.
6607315
Die Anmeldeaufforderung wird fünf Sekunden nach
dem Booten des Betriebssystems Solaris zurückgesetzt.
Dies tritt nur dann auf, wenn eine lokale Tastatur als
Eingabegerät verwendet wird (input-device=
keyboard). Bei der virtuellen Konsole (virtual-console)
tritt dieses Problem nicht auf.
Verwenden Sie die virtuelle Konsole als
Eingabegerät.
n. v.
Die Ausgabe des Befehls raidctl -h und die
Manpage raidctl zeigen einige nicht unterstützte
Informationen an.
Die SPARC Enterprise T5120 und T5220
Server unterstützen zurzeit nur RAID 0
und RAID 1, wenn der integrierte SASController verwendet wird. RAID 0- und
RAID 1-Volumes können mit dem
Dienstprogramm raidctl erstellt und
gelöscht werden. Weitere Informationen
zu unterstützten RAID-Informationen
finden Sie im SPARC Enterprise T5120 and
T5220 Servers Administration Guide.
6617544
Der Befehl prtdiag zeigt die fjgi-Informationen zu
einer Karte von Fujitsu nicht an.
Derzeit keine.
6617549
Bei einem PSU-Fehler gibt das Betriebssystem die
Meldung aus, aber das letzte Zeichen wird nicht
angezeigt.
Derzeit keine.
6594506
62
nicht mehr ausgetauscht (CR 6594506)“
auf Seite 67
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-4
Probleme mit dem Betriebssystem Solaris (Fortsetzung)
CR
Beschreibung
Abhilfe
6581309
Wird in der Auswahl r)eboot, o)k prompt,
h)alt? an der Betriebssystem-Konsole die Option „o”
gewählt, erscheint eine der folgenden Meldungen.
Beispiel 1:
r)eboot, o)k prompt, h)alt? o
WARNING: promif_ldom_setprop: ds response
timeout
Beispiel 2:
r)eboot, o)k prompt, h)alt? o
WARNING: promif_ldom_setprop: ds response
timeout
WARNING: LDOMs Variable Update request failed!
NOTICE: Unable to complete Domain Service
protocol version handshake
WARNING: Unable to connect to Domain Service
providers
WARNING: Unable to update LDOM Variable
Diese Meldungen wirken sich nicht auf
den Serverbetrieb aus.
Installieren Sie das Patch 137111-01 (oder
höher).
6601028
Die LEDs „TX” (Datenübertragung) und „RX”
(Datenempfang) auf der XAUI-Karte zeigen nicht den
korrekten Status der Datenübermittlung an.
Ignorieren Sie die Anzeige dieser LEDs.
6722640
Beim Booten werden Meldungen ähnlich der Folgenden Dieses Problem wirkt sich nicht auf den
angezeigt. Eventuell sind manche Sensorwerte bei der
Serverbetrieb aus, sofern SNMP nicht
Verwendung von SNMP nicht verfügbar.
verwendet wird.
picld[xxx]: PICL snmpplugin:
sunPlatSensorClass 0 unsupported
6718841
Im Sun Explorer ist die Erfassung von ILOMInformationen nicht möglich (Tx000).
Erfassen Sie ILOM- und ALOMInformationen und senden Sie sie
zusammen mit der Ausgabe des Sun
Explorer ein.
Welche Informationen zu erheben sind,
erfahren Sie unter „Im Sun Explorer ist die
Erfassung von ILOM-Informationen nicht
möglich (Tx000) (CR 6718841)“ auf
Seite 69.
Kapitel 2
Aktuelle Informationen
63
Server stürzen aufgrund eines Fehlers im PCIeRoot-Complex eventuell ab (CR 6555956)
Während des Neustarts kann es zu einem Absturz mit der folgenden Meldung
kommen:
„Fatal error has occurred in: PCIe root complex.”
Der Absturz tritt nur beim Neustart auf. Beim Neustart nach einem solchen Absturz
ist dieser Fehler nie aufgetreten. Der Absturz kann auch dann auftreten, wenn keine
externen USB-Geräte an den Server angeschlossen sind.
Abhilfen:
Wenn Ihr Server in solchen Fällen abstürzt, führen Sie die im Folgenden
beschriebenen Abhilfemaßnahmen durch.
■
Um sicherzustellen, dass das System nach einem Absturz neu gestartet wird und
weiter arbeitet, konfigurieren Sie den Server so, dass er automatisch neu gestartet
wird. Dazu haben Sie folgende Möglichkeiten:
■
Über die ILOM-Befehlszeilenschnittstelle:
-> set /HOST/bootmode script="setenv auto-boot? true"
-> set /HOST/bootmode script="setenv auto-boot-on-error? true"
■
Über die ALOM CMT-kompatible Befehlszeilenschnittstelle:
sc> bootmode bootscript="setenv auto-boot? true"
sc> bootmode bootscript="setenv auto-boot-on-error? true"
■
Um die Möglichkeit eines Systemabsturzes von vornherein auszuschließen,
deaktivieren Sie die USB-Geräte (führen Sie diese Lösungsmöglichkeit nur dann
durch, wenn Sie die USB-Geräte nicht verwenden. Hierzu gehört auch ein
integriertes DVD-Laufwerk):
■
Über die ILOM-Befehlszeilenschnittstelle:
-> set /SYS/MB/PCIE-IO/USB component_state=Disabled
■
Über die ALOM CMT-kompatible Befehlszeilenschnittstelle:
sc> disablecomponent /SYS/MB/PCIE-IO/USB
Es werden alle USB-Geräte deaktiviert, einschließlich des DVD-Laufwerks.
Der Service-Prozessor wird eine Fehlermeldung erzeugen und die Fehler-LED
einschalten.
64
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Wenn Sie die USB-Geräte aktivieren müssen, verwenden Sie die folgenden Befehle:
■
Über die ILOM-Befehlszeilenschnittstelle:
-> set /SYS/MB/PCIE-IO/USB component_state=Enabled
■
Über die ALOM CMT-kompatible Befehlszeilenschnittstelle:
sc> enablecomponent /SYS/MB/PCIE-IO/USB
Informationen zur physikalischen Plattform
fehlen in der prtpicl- und prtdiag-Ausgabe
(CR 6586624)
Umgebungs- und FRU-Status werden mit dem Solaris-Befehl prtdiag eventuell
nicht angezeigt. Wenn die Option -v (ausführliche Ausgabe) verwendet wird,
werden möglicherweise Firmwareversion und Gehäuseseriennummer nicht
angezeigt.
Die Ausgabe des Solaris-Befehls prtpicl enthält darüber hinaus u. U. nicht den
Abschnitt zur physikalischen Plattform.
Wählen Sie eine der folgenden alternativen Methoden, um die fehlenden
Informationen anzuzeigen:
■
Alternative für den Befehl prtdiag – Verwenden Sie die folgenden Befehle der
ALOM CMT-kompatiblen Befehlszeilenschnittstelle:
sc>
sc>
sc>
sc>
■
showenvironment - Umgebungsstatus des Systems
showfru component NAC - FRU-Status einer Komponente
showplatform - Gehäuseseriennummer
showhost - Firmwareversion
Alternative für den Befehl prtpicl – Durchlaufen Sie die Ziele des Befehls show
SYS mit der ILOM-Befehlszeilenschnittstelle und der grafischen Benutzeroberfläche
von ILOM. Näheres dazu finden Sie im Integrated Lights Out Manager (ILOM) 2.0
Benutzerhandbuch.
Kapitel 2
Aktuelle Informationen
65
Beim Booten des Betriebssystems Solaris von
einem externen USB-DVD-ROM-Laufwerk kann
es zu einem Absturz kommen (CR 6588452)
Wenn das Betriebssystem Solaris 10 von einem externen USB-DVD-ROM-Laufwerk
gebootet wird, kann es zu einem Serverabsturz kommen, wodurch das Booten des
Betriebssystems fehlschlägt. Das ist darauf zurückzuführen, dass das Gerät im
Betriebssystem Solaris den Namen storage@1, in der Systemfirmware jedoch den
Namen cdrom@1 erhält.
In der OpenBoot-Firmware und im Betriebssystem Solaris werden Knoten nach den
1275-USB-Bindungsregeln benannt. Beispiel:
TABELLE 2-5
1275-USB-Bindungsregeln für die Benennung von Knoten
bInterface-Klasse
bInterface-Unterklasse
bInterface-Protokoll
Name
0x08
1
Beliebig
storage
0x08
2
Beliebig
cdrom
0x08
3
Beliebig
tape
0x08
4
Beliebig
floppy
0x08
5
Beliebig
storage
0x08
6
Beliebig
storage
0x08
Beliebig
Beliebig
storage
Im Betriebssystem Solaris 10 erhält der Knoten immer den Namen storage@n.
Ein Speichergerät mit der Unterklasse 2, 3 oder 4 (bei den SPARC Enterprise T5120
und T5220 Servern ist Unterklasse 2 zwingend) kann daher nicht von der Solaris 10DVD booten.
Abhilfe: Verwenden Sie ersatzweise ein Laufwerk mit einer anderen Unterklasse als
2, 3 oder 4.
66
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Der Befehl prtdiag -v weist
Formatierungsprobleme auf (CR 6587389)
Manche der vom Dienstprogrammprtdiag (1M) ausgegebenen Informationen sind
schwer zu lesen, wenn die Option -v verwendet wird. In dem Bericht fehlen die
Leerzeichen zwischen dem ersten und dem zweiten Feld.
Die folgenden Formatierungsprobleme können in der Ausgabe des Befehls
prtdiag -v auftreten:
■
Lüftersensoren – Zwischen den Spalten „Location” und „Sensor” fehlen Leerzeichen.
■
Temperatursensoren – Bei DIMMs fehlen Leerzeichen zwischen den Spalten
„Location” und „Sensor”.
■
LEDs – Bei SERVICE, LOCATE, ACT, PS_FAULT, TEMP_FAULT und FAN_FAULT
DIMMs fehlt die Angabe „Location”. Zwischen „Location“ und „LED“ fehlen
Leerzeichen.
■
Die Positionsangaben der Sensoren sind am Anfang abgeschnitten, so dass für
bestimmte Elemente wie die Systemstatus-LEDs keine Positionsangaben angezeigt
werden.
Verwenden Sie den Befehl showenvironment in der ALOM CMT-kompatiblen
Befehlszeilenschnittstelle, um die Informationen ohne Formatfehler anzuzeigen.
sc> showenvironment - Umgebungsstatus des Systems
PSH-Ereignisse werden nicht mehr ausgetauscht
(CR 6594506)
Nach bestimmten Hardwarefehlern werden möglicherweise keine PSH-Ereignisse
mehr zwischen dem Service-Prozessor und der Domäne ausgetauscht. Dieses Problem
tritt in folgenden Szenarios auf:
■
In einer ohne LDoms verwalteten Umgebung ist in einer Solaris-Domäne ein
nicht wiederherstellbarer Fehler aufgetreten.
■
In einer mit LDoms verwalteten Umgebung ist in der Kontrolldomäne ein nicht
wiederherstellbarer Fehler aufgetreten.
■
In einer mit oder ohne LDoms verwalteten Umgebung ist in einem System ein
schwerwiegender Fehler aufgetreten (bei einem schwerwiegenden Fehler wird
das System auf Hardware-Ebene zurückgesetzt).
Hinweis – In einer mit LDoms verwalteten Umgebung sind nicht wiederherstellbare
Fehler in LDoms-Gastdomänen nicht von dieser Änderungsanforderung betroffen.
Kapitel 2
Aktuelle Informationen
67
Im folgenden Beispiel hat ein nicht wiederherstellbarer Fehler in der Kontrolldomäne
zu einem Solaris-Absturz geführt. Folgende oder ähnliche Meldungen werden an der
Konsole der Kontrolldomäne ausgegeben:
SUNW-MSG-ID: SUNOS-8000-0G, TYPE: Error, VER: 1, SEVERITY: Major
EVENT-TIME: 0x46c61864.0x318184c6 (0x1dfeda2137e)
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: SunOS, REV: 5.10 Generic_Patch
DESC: Errors have been detected that require a reboot to ensure system
integrity. See http://www.sun.com/msg/SUNOS-8000-0G for more information.
AUTO-RESPONSE: Solaris will attempt to save and diagnose the error telemetry
IMPACT: The system will sync files, save a crash dump if needed, and reboot
REC-ACTION: Save the error summary below in case telemetry cannot be saved
Wenn ein nicht wiederherstellbarer Fehler zu einem Abbruch der Firmware führt
und Sie bei der Konsole der ALOM CMT-kompatiblen Befehlszeilenschnittstelle
angemeldet sind, werden Meldungen wie die Folgenden an die Konsole des ServiceProzessors gemeldet:
Aug 17 22:09:09 ERROR: HV Abort: <Unknown?> (228d74) - PowerDown
Nach der Wiederherstellung der Kontrolldomäne werden Diagnosetests ausgeführt.
Die an der Konsole angezeigten Meldungen geben Aufschluss über die Ursache des
nicht wiederherstellbaren Fehlers. Beispiel:
SUNW-MSG-ID: SUN4V-8000-UQ, TYPE: Fault, VER: 1, SEVERITY: Critical
EVENT-TIME: Fri Aug 17 18:00:57 EDT 2007
PLATFORM: SUNW,SPARC-Enterprise-T5220, CSN: -, HOSTNAME: wgs48-100
SOURCE: cpumem-diagnosis, REV: 1.6
EVENT-ID: a8b0eb18-6449-c0a7-cc0f-e230a1d27243
DESC: The number of level 2 cache uncorrectable data errors has exceeded
acceptable levels. Refer to http://sun.com/msg/SUN4V-8000-UQ for more
information.
AUTO-RESPONSE: No automated response.
IMPACT: System performance is likely to be affected.
REC-ACTION: Schedule a repair procedure to replace the affected resource,
the identity of which can be determined using fmdump -v -u <EVENT_ID>.
Zu diesem Zeitpunkt ist möglicherweise das beschriebene Problem aufgetreten.
Dies Problem verhindert, dass zukünftige PSH-Ereignisse (z. B. weitere korrigierbare
oder nicht korrigierbare Hardwarefehler) an die Domäne übermittelt und
ordnungsgemäß diagnostiziert werden.
68
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Abhilfe: Setzen Sie den Service-Prozessor zurück, sobald die Domäne wiederhergestellt
und die Diagnosemeldung an die Solaris-Konsole ausgegeben wurde:
sc> resetsc -y [ALOM CMT-kompatible Befehlszeilenschnittstelle]
ODER
-> reset /SP [ILOM-Befehlszeilenschnittstelle]
Sobald der Service-Prozessor neu gestartet wurde und Sie sich als admin-Benutzer
anmelden können (alle Dämonen also bereit sind), führen Sie in der SolarisKontrolldomäne die folgenden Befehle aus:
# fmadm unload etm
# fmadm load /usr/platform/sun4v/lib/fm/fmd/plugins/etm.so
# prtdiag -v
Im Sun Explorer ist die Erfassung von ILOMInformationen nicht möglich (Tx000) (CR 6718841)
Im Sun Explorer ist die Erfassung von ILOM-Informationen nicht möglich (Tx000).
Abhilfe: Erfassen Sie ILOM- und ALOM-Informationen und senden Sie sie
zusammen mit der Ausgabe des Sun Explorer ein.
Erheben Sie folgende Informationen zu ILOM:
show /SP/users
show /SP/users/admin
show /HOST
Erstellen Sie einen ALOM-kompatiblen Benutzer zur Erhebung folgender
Informationen zu ALOM:
consolehistory -v
showcomponent
showdate
showenvironment
showfaults -v
showfru
showhost
showkeyswitch
showlogs -v -g 0 -p p
shownetwork
showplatform -v
showsc
showsc version -v
showusers
Kapitel 2
Aktuelle Informationen
69
Kehren Sie nach dem Erheben dieser Informationen zu ILOM zurück.
reset /SP
-> reset /SP
Are you sure you want to reset /SP (y/n)? y
Performing hard reset on /SP
Probleme im Zusammenhang mit
LDoms
TABELLE 2-6 enthält eine Liste der aktuellen Probleme im Zusammenhang mit LDoms.
Weitere Informationen zu bestimmten Änderungsanforderungen (Change Requests,
CR) finden Sie im Anschluss an die Tabelle.
TABELLE 2-6
CR
Probleme im Zusammenhang mit LDoms
Beschreibung
Abhilfe
6540368 In der Logical Domains 1.0.1-Software bleiben die
aktualisierten Variablen in manchen Fällen nicht
erhalten.
Weitere Informationen finden Sie in den
Logical Domains (LDoms) 1.0.1 Release Notes
(Versionshinweisen).
6543749 Das Herunterladen wanboot miniroot für eine
Gastdomäne dauert über 30 Minuten.
Bei Boot- oder Installationsvorgängen über ein WAN
(Wide Area Network) kann das Herunterladen der
Miniroot deutlich länger dauern, wenn ein virtuelles
Netzwerkgerät verwendet wird.
Dieser Leistungsabfall ist nur beim Booten oder
Installieren über ein WAN unter Verwendung eines
virtuellen Netzwerkgeräts zu beobachten. Ein
ähnlicher Boot- oder Installationsvorgang unter
Verwendung eines physikalischen Netzwerkgeräts
funktioniert wie erwartet, ebenso wie Boot- oder
Installationsvorgänge über ein lokales Netzwerk unter
Verwendung eines virtuellen Netzwerkgeräts.
nehmen Sie zur Kenntnis, dass das Booten
oder Durchführen von Installationen über ein
Wide Area Network mit einem virtuellen
Netzwerkgerät recht lange dauert.
70
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
TABELLE 2-6
CR
Probleme im Zusammenhang mit LDoms (Fortsetzung)
Beschreibung
Abhilfe
6567748 Der Domänenstatus wird nicht korrekt gemeldet.
So kann es vorkommen, dass als Status einer Domäne
Running angezeigt wird, obwohl das Betriebssystem
nicht läuft.
Dieses Problem wurde beobachtet, wenn der
Domänenstatus von ILOM (über die browserbasierte
Benutzeroberfläche oder die Befehlszeilenschnittstelle)
und vom ALOM CMT-kompatiblen Befehl
showplatform gemeldet wird.
Auch in der ILOM-Kontroll-MIB, nicht jedoch in der
Entitäts-MIB der Sun-Plattform, sind solche unklaren
Informationen enthalten. Der unklare Domänenstatus
ist daher möglicherweise auch für
Systemüberwachungsprogramme anderer Hersteller
sichtbar, wenn diese den entsprechenden Eintrag
überwachen.
Ignorieren Sie alle über die
Befehlszeilenschnittstelle oder die
browserbasierte Benutzeroberfläche
abgerufenen Informationen zum
Domänenstatus sowie die entsprechenden
Informationen aus dem
Domänenstatuseintrag in der ILOM-KontrollMIB. Rufen Sie den tatsächlichen Status der
Domäne über die Domänenkonsole ab.
6592934 In dem unwahrscheinlichen Fall, dass POST aufgrund
einer Zeitüberschreitung beendet wird, bevor der
Testzyklus abgeschlossen ist, gibt die Firmware die
folgende Meldung an der Konsole aus:
Wenn der oben erläuterte Fehler während des
Boot-Vorgangs an der Konsole ausgegeben
wird, schalten Sie das System aus und wieder
ein. Vergewissern Sie sich, dass POST
vollständig ausgeführt wird.
Sie können das System auch starten, ohne
POST auszuführen.
ERROR: POST timed out. Not all system
components tested.
Der Boot-Vorgang des Systems wird fortgesetzt,
das System arbeitet jedoch nicht einwandfrei.
Während des Boot-Vorgangs werden die folgenden
Fehlermeldungen angezeigt:
WARNING: Unable to connect to Domain
Service providers
WARNING: Unable to get LDOM Variable
Updates
WARNING: Unable to update LDOM
Variable
Alle Programme oder Dienste, für die ein LDC-Kanal
benötigt wird, arbeiten nicht einwandfrei oder gar
nicht. Zu den Programmen, die von LDC abhängen,
gehören ldmd, fmd und eeprom.
6593132 Änderungen an OpenBoot-PROM-Variablen bleiben
bei nicht standardmäßigen LDoms-Konfigurationen
nicht erhalten.
Wenn eine LDoms-Variable auf einen anderen als den
Standardwert gesetzt ist, die entsprechende LDomsKonfiguration im Service-Prozessor gespeichert wird
und für die Variable später wieder der Standardwert
eingestellt wird, geht der Standardwert beim Ausund Einschalten des Systems verloren.
Speichern Sie die Service-ProzessorKonfiguration nach dem Ändern einer LDomVariablen. Beispiel:
# ldm remove-spconfig my-newconfig
# ldm add-spconfig my-new-config
Kapitel 2
Aktuelle Informationen
71
TABELLE 2-6
CR
Probleme im Zusammenhang mit LDoms (Fortsetzung)
Beschreibung
Abhilfe
6594395 Mit dem Befehl ldm set-variable können
Weitere Informationen finden Sie in den
beliebige Zeichenfolgen für LDoms-Variablen
Logical Domains (LDoms) 1.0.1 Release Notes
angegeben werden. Wenn für eine LDoms-Variable ein (Versionshinweisen).
ungültiger Wert angegeben wird, gibt die OpenBootFirmware während des Boot-Vorgangs eine
Warnmeldung mit einer Liste der richtigen Werte aus,
nicht jedoch den Namen der jeweiligen Variablen.
6597815 Nach anfänglicher LDoms-Konfiguration
hinzugefügte XAUI- und CPU-Ressourcen stehen im
LDoms Manager nicht zur Verfügung.
Wenn Sie auf einem Server, auf dem logische
Domänen konfiguriert sind, CPU- oder
XAUI-Ressourcen hinzufügen, müssen Sie
die werkseitige Standardkonfiguration
wiederherstellen, damit der LDoms Manager
diese Ressourcen Gastdomänen zuweisen
kann.
6597761 rm-io, gefolgt von mehreren set-vcpu-Vorgängen
kann einen Abbruch der Firmware oder ldmdSpeicherabzug verursachen.
Versuchen Sie während einer verzögerten
Rekonfiguration nicht, CPUs zu einer Domäne
hinzuzufügen, wenn während derselben verzögerten
Rekonfiguration zuvor CPUs entfernt wurden.
Brechen Sie die verzögerte Rekonfiguration
ab, sofern dies möglich ist, oder bestätigen
Sie sie durch einen Neustart der Zieldomäne,
bevor Sie CPUs hinzufügen.
Wird diese Einschränkung nicht beachtet,
gibt die Firmware unter bestimmten
Umständen einen Parsing-Fehler an den
LDoms Manager zurück und der LDoms
Manager wird daraufhin abgebrochen.
Wurden darüber hinaus VIO-Geräte während
des gleichen verzögerten
Neukonfigurationsprozesses entfernt,
erkennt der LDoms Manager beim Neustart
nach dem Abbruch fälschlich eine
Notwendigkeit zum Ausführen eines
Wiederherstellungsprozesses. Diese Situation
führt zu einer beschädigten Konfiguration,
gefolgt vom einem Herunterfahren.
72
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Dokumentations-Errata
Dieser Abschnitt enthält bekannte Fehler in der Dokumentation zu den SPARC
Enterprise T5120 und T5220 Servern und die entsprechenden Korrekturen.
SPARC Enterprise T5120 und T5220 Server –
Überblick
Die Angaben zur Advanced ECC-Technologie im
Abschnitt „Fehlerkorrektur und Paritätsprüfung” auf
Seite 12 sind unvollständig.
Dieser Abschnitt erläutert die erweiterte ECC-Technologie für FB-DIMMS.
Die SPARC Enterprise T5120 und T5220 Server unterstützen die erweiterte ECCTechnologie jedoch nicht für 1 GB FB-DIMMs.
Die erweiterte ECC-Technologie unterstützt 2 GB und 4 GB FB-DIMMs.
SPARC Enterprise T5120 and T5220 Servers
Installation Guide
Dieses Dokument enthält Anweisungen zur Verwendung des Kabelführungsarms
(CMA). Der SPARC Enterprise T5120 Server unterstützt den Kabelführungsarm
jedoch nicht.
Das Handbuch enthält Beschreibungen der logischen Gerätenamen. Je nach Anzahl
und Typ der installierten zusätzlichen Festplattencontroller weichen die logischen
Gerätenamen auf Ihrem System möglicherweise hiervon ab.
Die Legende zu den Abbildungen 1-4 und 1-6 ist falsch.
Die folgende Legende ist nicht richtig:
„1 System Status Indicators: Top to bottom: Power Button, Power OK LED, Service
Required LED, Locator LED Button”
Kapitel 2
Aktuelle Informationen
73
Diese Angaben sollten folgendermaßen ersetzt werden:
„1 System Status Indicators: Top to bottom: Locator LED Button, Service Required
LED, Power OK LED, Power Button”
SPARC Enterprise T5120 und T5220 Server –
Wartungshandbuch
Das Handbuch enthält Beschreibungen der logischen Gerätenamen. Je nach Anzahl
und Typ der installierten zusätzlichen Festplattencontroller weichen die logischen
Gerätenamen auf Ihrem System möglicherweise hiervon ab.
Die Angaben unter „Hauptspeicher” in TABELLE 1 sind
unvollständig.
Die Beschreibung im Abschnitt „Hauptspeicher” ist unvollständig.
Das Hauptspeicher-Subsystem unterstützt die erweiterte ECC-Technologie
(Error Checking and Correction) nur für 2 GB und 4 GB FB-DIMMs, da die SPARC
Enterprise T5120 und T5220 Server die erweiterte ECC-Technologie für 1 GB FBDIMMs nicht unterstützen.
Die Angaben im Abschnitt „1.2.1 Eingebaute Karten und
Platinen” auf Seite 1-9 sind falsch.
Folgende Angaben im Abschnitt „Hauptplatine” unter „1.2.1 Eingebaute Karten und
Platinen” sind falsch:
„Zudem enthält sie ein austauschbares SCC-Modul, in dem alle Mac-Adressen,
die Host-ID und ILOM- sowie OpenBoot™ PROM-Konfigurationsdaten gespeichert
werden. Beim Austauschen der Hauptplatine kann das SCC-Modul in die neue
Platine eingesteckt werden, so dass die Systemkonfigurationsdaten erhalten bleiben.”
Diese Angaben sollten folgendermaßen ersetzt werden:
„Zudem enthält sie ein austauschbares SCC-Modul, in dem alle MAC-Adressen,
die Host-ID und ILOM-Daten gespeichert werden. Beim Austauschen der
Hauptplatine kann das SCC-Modul in die neue Platine eingesteckt werden, so dass
die Systemkonfigurationsdaten erhalten bleiben. Werden die OpenBoot PROMVariablen jedoch im System-NVRAM gespeichert, sollten Sie alle Änderungen an
OpenBoot PROM-Variablen notieren. Falls die Hauptplatine ersetzt wird, verwenden
Sie Ihre Aufzeichnungen der benutzerdefinierten Variablen, um die ServiceProzessor-Variablen auf der neuen Hauptplatine manuell zu modifizieren.”
74
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Die Angaben im Abschnitt „2.1.1 Behandlung von
Speicherfehlern” auf Seite 2-8 sind falsch.
Die folgende Beschreibung der erweiterten ECC-Technologie ist falsch:
„Der Server arbeitet mit einer erweiterten ECC-Technologie (Error Correcting Code),
die Fehler bis zu 4 Bit in Nibble-Grenzen korrigiert, sofern sie alle dasselbe DRAM
betreffen. Wenn bei 2-GB- und 4-GB-FB-DIMMs ein DRAM ausfällt, arbeitet das
DIMM weiter.”
Diese Angaben sollten folgendermaßen ersetzt werden:
„Der Server arbeitet mit einer erweiterten ECC-Technologie (Error Correcting Code),
die Fehler bis zu 4 Bit in Nibble-Grenzen korrigiert, sofern sie alle dasselbe DRAM
betreffen. Wenn bei 2 GB und 4 GB FB-DIMMs ein DRAM ausfällt, arbeitet das FBDIMM weiter.”
Die Angaben im Abschnitt „5.6 Wartungsarbeiten am
SCC-Modul” auf Seite 5-24 sind falsch.
Folgende Angaben im Abschnitt „5.6 Wartungsarbeiten am SCC-Modul” sind falsch:
„Das SCC-Modul enthält die Host-ID des Systems, die Mac-Adressen und die
Einstellungen der OpenBoot PROM- und ILOM-Konfigurationsvariablen.”
Da die OpenBoot PROM-Variablen auf der Hauptplatine gespeichert werden, sind
diese Angaben folgendermaßen zu ersetzen:
„Das SCC-Modul enthält die Host-ID des Systems, die Mac-Adressen und die
Einstellungen der ILOM-Konfigurationsvariablen. Wird das SCC-Modul auf eine
Ersatz-Hauptplatine umgesetzt, so werden die ILOM-Daten als Standardwerte
übernommen. Notieren Sie sämtliche Änderungen an Service-Prozessor-Variablen.”
Folgende Vorbereitungsschritte müssen vor dem Umsetzen des SCC-Moduls auf
eine Ersatz-Hauptplatine durchgeführt werden:
Führen Sie den Befehl showrc aus, um alle Änderungen an Service-ProzessorVariablen anzuzeigen.
Kapitel 2
Aktuelle Informationen
75
Die Angaben im Abschnitt „5.7 Wartungsarbeiten an der
Hauptplatinenbaugruppe” auf Seite 5-26 sind
unvollständig.
Folgende Vorsichtsmaßnahmen sind vor der Wartung der Hauptplatinenbaugruppe
zu beachten:
„Die OpenBoot PROM- (OBP) Konfigurationsvariablen (Umgebungsvariablen)
werden auf der Hauptplatine gespeichert. Notieren Sie vor dem Auswechseln der
Hauptplatine die Einstellungswerte der OBP-Umgebungsvariablen, da diese beim
Auswechseln der Hauptplatine zurückgesetzt werden.
Führen Sie vor dem Ausschalten des Servers folgende Schritte durch:
1. Führen Sie den Befehl showrc aus, um alle Änderungen an Service-ProzessorVariablen anzuzeigen.
2. Beenden Sie das Solaris-Betriebssystem, um die OpenBoot PROMEingabeaufforderung aufzurufen.
3. Führen Sie den Befehl printenv aus, um alle Änderungen an OpenBoot PROMVariablen anzuzeigen.
4. Schalten Sie den Server aus.
76
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
SPARC Enterprise T5120 und T5220 Server –
Systemverwaltungshandbuch
Der Befehl zum Einschalten der Such-LED unter den
Abbildungen 2-1 und 2-2 ist falsch.
Folgender Befehl ist falsch angegeben:
-> set /SYS/LOCATE value=on
Geben Sie zum Einschalten der Such-LED den folgenden Befehl ein:
-> set /SYS/LOCATE value=fast_blink
In Tabelle 2-5 sind falsche Gerätekennungen aufgeführt.
Die Gerätekennung /SYS/MB/NETAnschlussnummer muss folgendermaßen lauten:
/SYS/MB/GBEController-Nummer.
Die Gerätebeschreibung für /SYS/MB/GBEController-Nummer muss wie folgt lauten:
GBE-Controller (Nummer: 0-1)
■
GBE0 ist der Controller für NET0 und NET1
■
GBE1 ist der Controller für NET2 und NET3
Die folgende Zeile in Tabelle 2-5:
Gerätekennungen
Geräte
/SYS/MB/NETAnschlussnummer
Ethernet-Anschlüsse (Nummer: 0-3)
muss also wie folgt lauten:
Gerätekennungen
Geräte
/SYS/MB/GBEController_Nummer
GBE-Controller (Nummer: 0-1)
• GBE0 ist der Controller für NET0 und NET1
• GBE1 ist der Controller für NET2 und NET3
Kapitel 2
Aktuelle Informationen
77
Liste mit den Standardeinstellungen in Tabelle 2-4
Als Standardwert ist fälschlicherweise /HOST/diag level=min angegeben.
Der Standardwert für diag level lautet max.
Integrated Lights Out Manager 2.0 –
Ergänzungshandbuch für SPARC Enterprise T5120
und T5220 Server
Falscher Standardwert unter „So legen Sie mit der CLI
die Diagnoseteststufe fest”
Als Standardwert ist fälschlicherweise /HOST/diag level=min angegeben. Der
Standardwert für diag level lautet max.
Die Befehlsoption für keyswitch_state ist falsch.
Die Bezeichnung der Befehlsoption für keyswitch_state weist folgende Fehler auf:
Die in Tabelle 4-1 beschriebene keyswitch_state-Befehlsoption „stby” ist durch
die Befehlsoption „standby” zu ersetzen.
In Tabelle B-2 ist als Entsprechung für den ALOM CMT-Befehl setkeyswitch der
ILOM-Befehl set /SYS keyswitch_state=Wert angegeben.
Die entsprechende ILOM-Befehlsoption für die ALOM-Befehlsoption „stby” lautet
jedoch „standby”.
In diesem Handbuch nicht beschriebene ILOMEigenschaften
Die nicht beschriebenen Eigenschaften sind in der folgenden Liste aufgeführt:
78
■
/SP/network dhcp_server_ip – Die IP-Adresse des DHCP-Servers, der die
vom Service-Prozessor angeforderte dynamische IP-Adresse bereitgestellt hat.
■
/SP/network state – Der Wert dieser Eigenschaft ist entweder enabled oder
disabled. Mit dieser Eigenschaft können Sie die Netzwerkschnittstelle des
Service-Prozessors aktivieren bzw. deaktivieren.
■
/SP/policy HOST_AUTO_POWER_ON – Bewirkt, dass sich der Host nach dem
Booten des Service-Prozessors automatisch einschaltet. Wenn diese Richtlinie auf
enabled gesetzt wird, setzt der Service-Prozessor HOST_LAST_POWER_STATE
auf disabled.
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008
Das Beispiel der ALOM-kompatiblen
Befehlszeilenschnittstelle im Abschnitt „Neuer CommitSchritt” auf Seite 38 ist unvollständig.
Die Beschreibung des Befehlszeilenarguments netsc_commit der ALOMkompatiblen Shell auf Seite 38 ist unvollständig.
Der erste Satz oben auf der Seite muss das Argument true enthalten und wie folgt
lauten:
Ändern Sie stattdessen die Netzwerkkonfigurationseigenschaft und bestätigen Sie
die Änderung dann mit setsc netsc_commit true in der ALOM-kompatiblen
CLI oder mit set /SP/network commitpending in der ILOM-CLI.
Das erste Beispiel enthält Folgendes:
sc> setsc netsc_ipaddr xxx.xxx.xxx.xxx
sc> setsc netsc_commit
Das Beispiel muss jedoch den Wert true in der zweiten Zeile enthalten:
sc> setsc netsc_ipaddr xxx.xxx.xxx.xxx
sc> setsc netsc_commit true
Argumentliste zum Zurücksetzen des Service-Prozessors
auf werkseitige Standardwerte ist falsch.
Der Abschnitt mit der Bezeichnung Zurücksetzen der Einstellungen für den ServiceProzessor auf die werkseitigen Standardwerte führt drei Optionen auf, none,
configuration und all. Die Option configuration ist nicht verfügbar.
Es stehen nur folgende Optionen zur Verfügung: none und all.
Probleme beim Anschließen mit ILOM
Auf den SPARC Enterprise T5120 und T5220 Servern unterstützt ILOM maximal 5
aktive Sitzungen, einschließlich serieller, SSH (Secure Shell)- und
Webbenutzeroberflächensitzungen.
Kapitel 2
Aktuelle Informationen
79
Informationen zu Befehlen der ALOM CMT-Shell
Dieses Handbuch behandelt die grundlegende Verwendung von Befehlen der ALOM
CMT-kompatiblen Shell. Nähere Informationen zu Befehlen der ALOM CMT-Shell
entnehmen Sie bitte dem „Advanced Lights Out Management (ALOM) CMT v1.x
Guide” (C120-E386).
Integrated Lights Out Manager 2.0 Benutzerhandbuch
Im Abschnitt „Bearbeiten eines SNMP-Benutzerkontos
mithilfe der CLI” auf Seite 190 ist ein falscher Befehl
angegeben.
Folgender Befehl ist falsch angegeben:
edit /SP/services/snmp/users/Benutzername authenticationpassword=
Passwort
Geben Sie zum Bearbeiten eines SNMP v3-Benutzerkontos folgenden Befehl ein:
set /SP/services/snmp/users/Benutzername authenticationpassword=
Passwort
In mehreren SPARC T5120 und T5220 ServerHandbüchern
Logische Gerätenamen für Festplatten sind nicht konsistent
In der Dokumentation werden die logischen Gerätenamen für Festplattenlaufwerke
als c0txxxx beschrieben. Dies stimmt eventuell nicht mit den logischen Gerätenamen
auf dem Server überein, da die Gerätenamen anders lauten können. Falls das System
über ein DVD-Laufwerk verfügt, sind die logischen Namen der Festplattenlaufwerke
c1txxxx (das DVD-Laufwerk ist c0txxxx). Verfügt das System nicht über ein DVDLaufwerk, sind die logischen Namen der Festplattenlaufwerke c0txxxx.
80
SPARC Enterprise T5120 und T5220 Server – Produkthinweise • Oktober 2008

Documentos relacionados