Betriebserfahrungen und Ausblick

Transcrição

Betriebserfahrungen und Ausblick
GPFS
- Betriebserfahrungen und Ausblick -
AK-SYS Bommerholz 2006
Dipl.-Physiker Stefan Ost
Leiter der Abteilung „Rechner und Betriebssysteme“
Zentrum für Informationsverarbeitung
Westfälische Wilhelms-Universität Münster
Übersicht
•
•
•
•
•
Versionskonfusion
Erfahrungsbericht: GPFS 1.3 für Linux
Aktuell: GPFS 2.3
Ausblick: GPFS für einen Mail-Cluster?!
Alternativen?
Versionskonfusion
•
•
•
•
•
•
•
•
•
•
•
1998 GPFS V1.1 AIX (RS/6000 SP Switch)
1999 GPFS V1.3 AIX (RS/6000 SP)
2000 GPFS V1.4 AIX (HACMP, SSA-Disks)
2001 GPFS V1.1 Linux (Cluster 1300)
2001 GPFS V1.5 AIX (HACMP, FC-Disks)
2002 GPFS V2.1 AIX
12/2002 GPFS V1.3 Linux (Cluster 1350, CSM-Support)
12/2003 GPFS V2.2 AIX, Linux (Intel, pSeries)
3Q 2004 GPFS inter operability AIX and Linux
12/2004 GPFS V2.3 AIX, Linux (Intel, pSeries)
Aktuell: V2.3.0.10
GPFS für Linux 1.3
•
•
•
•
•
•
Seit 3 Jahren im Einsatz (Linux-Cluster)
RedHat 7.3, 2.4 Kernel mit proprietären Erweiterungen
Kommunikation über Myrinet
Erfahrung: Positiv, aber nicht ohne Probleme
Problemlos: TSM, Nutzer- und Gruppen-Platzquoten
Ausfallsicherheit: Take-Over und Give-Back
funktionieren wirklich
GPFS Cluster Models
•
•
•
•
•
Dedicated NSD server(s) Model
Direct Disk Attached Model
Mixed Model: NSD und Direct Disk
Joined Model: AIX und Linux
Cross-Cluster Model: auch in WANs
NSD-Model
Probleme (GPFS 1.3)
• Alle GPFS-Knoten bilden das Quorum
– RSCT ist vorausgesetzt
– Langsamer GPFS-Start und -Stopp
• Myrinet was anfangs nicht stabil
– Austausch aller HBAs und Linecards
• GPFS ist nicht stabil bei instabilen Netz!
Probleme (GPFS 1.3)
• Bei überbeanspruchten Speicher
–
–
–
–
mmfsd waren autistisch und wurden ständig neu erzeugt
Knoten stürzte ab
Eigentliche Verursacher wurde vom Linux nicht entfernt
Vermutliche Ursache: mmap-Patch des 2.4 kernels
• Ursache und Wirkung von Problemen zeitlich getrennt
–
–
–
–
Probleme wurden erst nach Tagen virulent
Erschwert die Diagnose
fsck ist dein Freund
Zu alter MicroCode der FAStT-200HA
GPFS V2.3
• Was ist aus unserer Sicht nützlich?
–
–
–
–
Nur Server bilden Quoren
RSCT wird nicht mehr benötigt
mmap-Patch unnötig (2.6 kernel)
Breitere HW-Unterstützung
• Robust gegen Server-Ausfall (getestet)
• GB-Ethernet statt Myrinet
• Wurde letzte Woche installiert und ist jetzt produktiv
GPFS im Mail-Cluster?!
•
•
•
•
•
•
Teil der DFS-Migration
GPFS skaliert mit der Anzahl der Server (Striping)
Mailbox-Format: mbox
Mailbox-Format ist praktisch unveränderbar
Mailbox-Zugriff: smtp, POP3, IMAP, perMail
Frage: Eignet sich ein ehemaliges multimediaFilesystem für Mailboxen?
• Antwort: Das hängt von den Mailbox-Größen ab
Messung der Mailboxgröße
<=500 MB
Messung der Mailboxgröße
<=100 MB
Messung der Mailboxgröße
<=1 MB
GPFS im Mail-Cluster?!
•
•
•
•
•
•
53000 Mailboxen
Durchschnittlich Größe: 2.4 MB
Etwa 20% der Mail-Accounts werden weitergeleitet.
Deshalb gibt es viele leere oder fast leere Mailboxen.
„Effektive“ (>5KB) durchschnittliche Größe: 3.3 MB
Nutzerquoten sollen erhöht werden, was die
Mailboxgröße tendenziell erhöht.
Mail-Cluster-Konfiguration
GPFS im Mail-Cluster?!
•
•
•
•
•
Test-Installation im Mai
Eingehende Mail ist frei von Viren und SPAM
Konfiguration ist skalierbar: SAN, Server, Ethernet
Etablierte SMTP-Benchmarks?
Test-Szenario
– 50000 Nutzer
– Eingehend: 1-2 Mails unterschiedlicher Größe pro Sekunde
– Ausgehend: 3 POP3-Requests pro Sekunde
Alternativen?
• NFS-V3: Vor 10 Jahren aus guten Gründen abgelöst.
• NFS-V4: Noch nicht fertig.
• AFS: Neben psychologische Problemen (man geht nicht
gerne zurück) fehlt POSIX-konformes File-Locking.
• SAMBA: Gute Frage. Nächste Frage.
• ….

Documentos relacionados