SAP Monitoring

Transcrição

SAP Monitoring
www.itnovum.de
Ein Unternehmen der MEHLER AG
SAP Monitoring
Exemplarische Projekterfahrungen
www.itnovum.de
Business Track Nagios Konferenz, 22.September 2006
Michael Kienle, Geschäftsführer it-novum GmbH
Ein Unternehmen der MEHLER AG
Agenda
•
Bedeutung & Notwendigkeit der SAP Überwachung
•
Kurze Einführung in das SAP-Monitoring-Tool: CCMS
•
www.itnovum.de
–
Möglichkeiten CCMS
–
Warum Nagios benutzen wenn es CCMS gibt?
–
Wie werden die Daten vom CCMS ins Nagios übernommen?
Auswahl und Eingrenzung: Welche Werte sollten
überwacht werden?
–
Welche Werte im CCMS sind sinnvoll?
–
Verschiedene Reaktionszeiten
–
Schwellwerte
•
CCMS vs. SAP Solution Manager
•
Fazit: Genügt eine OpenSource Plattform den
Anforderungen eines ERP-Monitorings?
Ein Unternehmen der MEHLER AG
IT-Kompetenz-Zentrum eines Konzerns
•
IT-Lösungen für den Mittelstand
–
•
Komplette Wertschöpfungskette
–
•
•
www.itnovum.de
Sichere, zuverlässige und wirtschaftliche IT
Beratung, Planung, Umsetzung, Betrieb
Am externen Markt seit 1999
–
Überwiegend Regional (FD + 150 km, ~ von KS bis F)
–
Ca. 50% externer Umsatz, Trend: steigend
–
Synergieeffekte & Innovationen durch Konzernzugehörigkeit (>2 Mrd €)
–
Partnerschaften und Zertifizierungen
Schwerpunkte & Kompetenzen:
–
Systemmanagement
–
ServerBasedComputing
–
Outsourcing/Datacenter/SAP
–
Konzepte, Analysen und Betrieb
–
Storage- und Servervirtualisierung, Konsolidierung
–
IT-Sicherheit, Datenschutz, Datensicherheit
Ein Unternehmen der MEHLER AG
Notwendigkeit des SAP Monitorings
•
Unternehmenskritische ERP-Anwendungen: Stabilität:
– Störung der Betriebsabläufe; bis zum kompletten Stillstand
– Vereinbarung SLA (Service Level Agreements)
– Daher: Kosten sind eher zu vernachlässigen
•
Das Systemmanagement sollte dementsprechend:
– die Wahrscheinlichkeit eines Ausfalles deutlich verringen
– im Fehlerfall schnellere Fehlerlokalisierung ermöglichen
– übergreifend eine “angemessene” Nutzung sicherzustellen
•
In der Praxis bedeutet dieses an Einsatzgebieten:
– Incident Management
– Performance Management: Sizing aber auch proaktive
Erweiterung
www.itnovum.de
– SLA-Reporting: Verfügbarkeiten, Antwortzeiten
Ein Unternehmen der MEHLER AG
Der Monitor Ansatz von SAP
„Die Verwaltung verteilter Client-Server-Systeme stellt hohe
Anforderungen an Systemadministratoren. Bei verteilten
Systemen, die über die Mindestkonfiguration hinausgehen,
sind
Werkzeuge
zur
Unterstützung
von
Systemadministratoren bei dieser Aufgabe unentbehrlich.“
SAP AG, Dokumentation CCMS
www.itnovum.de
Ein Unternehmen der MEHLER AG
CCMS I
•
CCMS = Computing Center Management
System
•
SAP Tool Überwachung und Verwaltung:
–
SAP-Transaktion „rz20“
–
Baumstruktur, Komplexität: >n-1.000
• If you can not control it you can not
manage it
• BUT do not measure what you will not
change
•
Praxis (Zitate):
– “leicht den Durchblick verlieren…”
– “Schwierigkeiten zu unterscheiden ob
der angezeigte Fehler wirklich ein
Problem darstellt
oder nur zur
Information, temporär…”
www.itnovum.de
Ein Unternehmen der MEHLER AG
CCMS II – Dialog Overview
www.itnovum.de
•
Durchschnitt Dialogschritt
•
Durchschnitt NetzwerkAntwortzeit FrontendApplikationserver
•
Durchschnitt 1 festgelegten
Transaktion
•
Anzahl eingeloggte User
Ein Unternehmen der MEHLER AG
CCMS III – Dialog Application Service
www.itnovum.de
•
Mittlere Zeit DispatcherWarteschlange
•
Mittlere Lade- und
Generierungszeit von
CUA-Objekte
•
Durchschnitt
Datenbankanforderung
Ein Unternehmen der MEHLER AG
CCMS IV – Operating System
www.itnovum.de
Ein Unternehmen der MEHLER AG
CCMS V - Database
•
www.itnovum.de
TableSpaces
Ein Unternehmen der MEHLER AG
Warum Nagios benutzen wenn es CCMS gibt? I
•
Ziel: Umfassende Übersicht
–
–
–
Nicht: Überwachung einer Summe von Einzelkomponenten
Sondern: vom Enduser “gefühltes” Systemverhalten
Sinnvoll: Übernahme der wichtigsten CCMS-Daten
SAP / CCMS
Umweltbedingungen
www.itnovum.de
Netzwerkkomponenten
Betriebssystem
Ein Unternehmen der MEHLER AG
Warum Nagios benutzen wenn es CCMS gibt? II
•
CCMS konzentriert sich
ausschließlich auf SAP
–
www.itnovum.de
z.B. Umweltbedingungen /RZ
oder Basissystem/Hardware
nicht berücksichtigt.
Ein Unternehmen der MEHLER AG
Warum Nagios benutzen wenn es CCMS gibt? III
•
Performance aus Anwendersicht:
– Datenbank, Applikationsserver, Netzwerkanbindung, Workstation
•
Übergreifende Überwachung notwendig
Applikations-Server
Workstation
Switch
S ta tu s
hp procurve
switch 5372xl
J4848A
R e se t
1
C le ar
2
A
B
C
D
E
F
G
H
A ct
S e lf
Te st
C o ns o le
Fa n
Fa u l t
Po we r
Mo d u le s
F Dx
Max
u se x l mo du le s on ly
L E D M od e S e le ct
J4 820A
P o wer
1
Faul t
S ta tu s
hp procurve
switch 5372xl
J4848A
R e se t
1
C le ar
2
A
B
C
D
E
F
G
Fa n
Fa u l t
Po we r
1
Mo d u le s
F Dx
J4 820A
1
2
3
4
5
6
7
8
9
10
11
12
24 p ort
6
13
hp procurve
10/10 0TX
xl Module
J4 820A
10/100TX
13
14
15
16
17
18
19
20
21
22
23
24
J4 820A
hp procurve
10/10 0TX
xl Module
J4 820A
1
7
1
2
3
4
5
6
7
8
9
10
11
12
6
12
13
19
7
12
10/100TX
J4 820A
13
14
15
16
17
18
19
20
21
22
23
24
1
18
24
hp procurve
10/10 0TX
xl Module
J4 820A
7
1
2
3
4
5
6
7
8
9
10
11
12
6
12
13
1
2
3
4
5
6
7
8
9
10
11
12
24 p ort
6
13
3
4
9
10
5
11
24 p ort
6
12
6
12
10/100TX
J4 820A
13
14
15
16
17
18
19
20
21
22
23
24
1
18
1
2
3
4
5
6
7
8
9
10
11
12
13
10/100TX
13
14
15
19
16
17
18
22
23
24
13
14
15
16
17
18
19
20
20
21
21
22
23
24
18
24
19
24 p ort
6
13
10/100TX
18
24
19
24 p ort
7
18
1
hp procurve
10/10 0TX
xl Module
J4 820A
2
u se x l m o du le s on ly
1
24 p ort
8
Max
L E D M od e S e le ct
Faul t
J4 820A
7
H
A ct
S e lf
Te st
C o ns o le
P o wer
hp procurve
10/10 0TX
xl Module
J4 820A
10/100TX
13
14
15
16
17
18
19
20
21
22
23
24
19
7
12
19
24
hp procurve
10/10 0TX
xl Module
J4 820A
7
12
19
24
18
24
Switch
Pr ocurv e Routing S witch 9308M
HP J 4138A
Pr ocurv e Routing S witch 9308M
HP J 4138A
Router
Router
z.B. MPLS
www.itnovum.de
Oracle
Datenbank
Ein Unternehmen der MEHLER AG
Warum Nagios benutzen wenn es CCMS gibt? IV
•
Überwachung sämtlicher Komponenten der IT
–
•
“Tactical Overview”
–
www.itnovum.de
Business-Prozess-orientierte Sicht vs. eher Infrastruktur-Perspektive
systemweiter Überblick, aufkommende Probleme können effizient erkannt und
gezielt beseitigt werden
Ein Unternehmen der MEHLER AG
Wie werden Daten vom CCMS ins Nagios übernommen? I
Perfomance-Problem bei CCMS-Plugin, abhängig
vom Volumen der zu überwachenden Services
Die einzelnen benötigten Werte finden sich an
verschiedenen Stellen der Baumstrucktur. Das
Plugin meldet sich für jeden abzuholenden Wert
einzeln im SAP-System an: Nagios belastet
ständig
das
SAP-System
mit
mehreren
Benutzern.
Lösung: Neuer Monitor. Hier werden dann alle
gewünschten Werte eingefügt. Dieser Knoten
wird dann komplett vom Nagios-CCMS-Plugin
abgeholt.
Alternativ: SNMP-Traps möglich
www.itnovum.de
Ein Unternehmen der MEHLER AG
Wie werden Daten vom CCMS ins Nagios übernommen? II
Ablauf bei der Datenabholung
Nagios ruft ein (selbstentwickeltes) Skript auf, dieses ruft das CCMSPlugin auf, welches den gesamten Monitor „Nagios/Allgemein“ aus
dem SAP ausliest. Diese Daten werden von dem CCMS-Plugin
zurückgegeben, welches in eine Datendatei schreibt.
Je nach Erfolg dieser Transaktion, meldet das selbstgeschriebene
Skript den Status „OK“ oder „CRITICAL“ an Nagios zurück.
Skript
CCMS-Plugin
Datendatei
www.itnovum.de
Ein Unternehmen der MEHLER AG
Wie werden Daten vom CCMS ins Nagios übernommen? III
Um die Daten möglichst übersichtlich von der Datendatei ins Nagios
zu integrieren, wurde ein eigenes Skript entwickelt, welches die
gewünschten Information aus der Datendatei holt, den Wert in einen
Graph einträgt und den Status und den Wert ans Nagios
zurückmeldet.
RRD-File
ApanSQL
Skript
Datendatei
MySQL
www.itnovum.de
Ein Unternehmen der MEHLER AG
Welche Werte im CCMS sind sinnvoll? II
Überwachen verschiedener SAPPuffer auf:
Kriterien
Space Used
Hit Ratio
Swap Auslagerungen
Pufferspeichers in Prozent
Datenbankanfragen/Cache
Swaps pro Minute
Felder
GenericKey
Program
www.itnovum.de
ganz/teilweise gepufferte DB-Tabellen
kompilierte SAP-Programme
Ein Unternehmen der MEHLER AG
Welche Werte im CCMS sind sinnvoll? III
Diverse wichtige SAP interne Speicher:
R3RollUsed Belegung des Rollbereichs
Rollbereich: Speicherbereich fester, konfigurierbaren
Größe, der zu einem Workprozess gehört; enthält
benutzerspezifische Daten und ist der erste Speicher,
den ein Workprozess erhält.
EsAct
Belegung des Erweiterungsspeichers
Der Erweiterungsspeicher enthält den größten Teil des
Benutzerkontexts. Die Seitenverwaltung dieses
Speichers erfolgt nicht durch das Betriebssystem,
sondern direkt durch das SAP-System.
HeapAct
Belegung des privaten Speichers
Einem Workprozess wird erst dann privater Speicher
zugewiesen,wenn Rollbereich und Erweiterungsspeicher
belegt sind; der Workprozess ist dann bis zum Ende der
Transaktion für den aktuellen Benutzerkontext reserviert
(PRIV-Modus). Laufen zu viele Dialog-Workprozesse im
PRIV-Modus, entstehen Performance-Probleme.
www.itnovum.de
Ein Unternehmen der MEHLER AG
Welche Werte im CCMS sind sinnvoll? IV
Spool-System:
Used Numbers Belegung der Spool-Nummern in Prozent.
(Sie müssen alte Ausgabeaufträge löschen, damit diese Zahl
nie 100 Prozent erreicht.)
www.itnovum.de
WaitTime
Wartezeit im Spool-Service in Sekunden
Utilisation
Auslastung der Spool-Workprozesse in Prozent
Ein Unternehmen der MEHLER AG
Welche Werte im CCMS sind sinnvoll? V
Allgemeine Performance-Werte:
DialogSteps mittlere Anzahl von Dialogschritten pro Minute.
Ein hoher Wert in Verbindung mit einer hohen
ResponseTime weist auf generelle Überlastung hin, ein sehr
niedriger Wert auf eine Fehlfunktion
Eine der verschiedenen Antwortzeiten
www.itnovum.de
Ein Unternehmen der MEHLER AG
Welche Werte im CCMS sind sinnvoll? VI
Die Option „AbortedJobs“ meldet alle abgebrochenen (Background-)
Jobs im SAP. Im produktiven Einsatz kommt es immer wieder zu
Jobabbrüchen, die jedoch nicht immer systemkritische Bedeutung
haben.
z.B. Fehleranalyse: Transaktion “sm37” (Dumpanalyse Background)
www.itnovum.de
Ein Unternehmen der MEHLER AG
Verschiedene Reaktionszeiten I
Dialogantwortzeit = durchschnittliche Antwortzeit zur Verarbeitung eines Dialogschritts
Bei diesem Wert kann es zu Ausreißern kommen, die meist nur
durch einen einzigen großen Prozess hervorgerufen werden.
Diese hohen Werte haben aber leider keine wirkliche Aussagekraft, da die SAP-Clients der Anwender trotz hoher Werte an
dieser Stelle, keine Performanceeinbusen erleiden.
www.itnovum.de
Ein Unternehmen der MEHLER AG
Verschiedene Reaktionszeiten II
Netzlaufzeit =
Zeit für Datentransfer zwischen Frontend und Anwendungsserver
Durchschnittswert aller Netzlaufzeiten. Es lässt erkennen das
irgendwelche SAP-Clients durch das Netzwerk
verzögert ihre Daten erhalten, aber leider nicht welche Clients
genau betroffen sind oder durch welchen Teil des Netzwerks
diese Verzögerung ausgelöst wird.
Hier sind mit weiteren Tools genauere Analyse zu erstellen.
www.itnovum.de
Ein Unternehmen der MEHLER AG
Verschiedene Reaktionszeiten III
normierte Antwortzeit =
Wie Dialogantwortzeit, nur für eine voreingestellte Standardtransaktion.
Durch das Messen der Zeit die eine immer gleiche
Standardtransaktion zur Bearbeitung im SAP benötigt,
erhählt man einen realistischen Wert, der die Performance
des SAP-Systems gut wiederspiegelt.
Das Auftreten von Spitzen deutet auf eine momentane Überlastung des
SAP-Systems hin; alle angeschlossenen SAP-Anwender werden
Performanceeinbußen erleben.
www.itnovum.de
Ein Unternehmen der MEHLER AG
Verschiedene Reaktionszeiten IV
•
Überwachung SAP-Server mit einem direkten
benachbarten Nagios nicht besonders aussagekräftig
•
Einbezug Standorte/RemoteUser („gefühlte Performance“)
•
„Simulieren“ eines Benutzers; Zeitmessung:
– Einloggen, bestimmte Ein-/Ausgaben & Transaktionen, Ausloggen
– End-2-End Performance (generisch verwendbar)
www.itnovum.de
Ein Unternehmen der MEHLER AG
Schwellwerte I
Zur effizienten Alarmierung sind im Nagios Schwellwerte zu definieren.
Falls für abgefragte Werte noch keine Erfahrungen bestehen, ist es immer
empfehlenswert, die im CCMS durch SAP vordefinierten Standardschwellwerte erst
einmal zu übernehmen und dann sukzessive anzupassen.
Schwellwerte des
Monitorattributes auf
seiner
Eigenschaftsseite
www.itnovum.de
Ein Unternehmen der MEHLER AG
Schwellwerte II
Individuelle Schwellwerte lassen sich gut über die aufgezeichneten Graphen bestimmen.
Sinnvoll aber zeitaufwändig (lange Erfahrungen/Messungen notwendig)
Als erster Schritt wurden die Schwellwerte vom CCMS übernommen. Danach erfolgt
eine längere Messung der “IST-Situation” mit abschließender Analyse der Ergebnisse
und der Neueinstellung der Schwellwerte.
CRITICAL
www.itnovum.de
WARNING
Ein Unternehmen der MEHLER AG
Screenshot
www.itnovum.de
Ein Unternehmen der MEHLER AG
CCMS vs. Solution Manager
•
•
www.itnovum.de
CCMS:
–
Stärken eher in der Infrastruktur
–
„Tunnelblick“ auf Anwendungen
Solution Manager:
–
„Bietet Kunden ein Standard Management Konzept um die BusinessProzesse in der zugrunde gelegten Systemlandschaft mit der optimalen
Verfügbarkeit, optimalen Performance und niedrigen Kosten zu betreiben.“
(SAP Solution Manager Dokumentation)
–
Zukünftige Anforderungen: Einheitliche und umfassende Überwachung in
einem Umfeld das geprägt ist durch:
• Global
• Heterogene Lösungen / Systeme
• Business Prozesse
• Neue Technologien
Ein Unternehmen der MEHLER AG
SAP Solution Manager
www.itnovum.de
Ein Unternehmen der MEHLER AG
Business Process Management
www.itnovum.de
Ein Unternehmen der MEHLER AG
Statements aus der Praxis
“Nagios entlastet mich von einem erheblichen Teil meiner turnusmäßigen
Kontrollen. Einige der per Nagios gemeldeten Alerts sind nicht sogleich
systemkritisch, zeigen aber einen evtl. vorhandenen Trend an, auf den
man dann gezielt reagieren kann. Eine komplette Ablösung von CCMS
halte ich – auch gerade da detaillierte Fehler im CCMS analysiert werden
– für verfrüht. Ich sehe den Mehrwert von Nagios eher im Bereich der
umfassenden Überwachung SAP/Infrastruktur bzw. der guten und
schnellen Benachrichtigung außerhalb des Büros und der üblichen
Dienstzeiten. Viel Know-How ist erforderlich, sowohl auf Seiten CCMS als
auch auf Seiten Nagios.”
K.K., Leiter SAP Basisysteme der Firma xxx GmbH
www.itnovum.de
Ein Unternehmen der MEHLER AG
Fazit
“Genügt eine OpenSource Plattform
den Anforderungen für ein SAP-Monitoring?””
www.itnovum.de
•
Nagios kann direkt auf das SAP eigene, integrierte Monitoring-Tool
CCMS zugreifen, dadurch ergeben sich viele Möglichkeiten.
•
Nagios kann (mit Unterstützung) kostengünstig und schnell
implementiert werden; darüber hinaus wird nicht nur den Bereich SAP
abgedeckt sondern auch andere IT-Komponenten überwacht.
•
Viel Know-How notwendig; sowohl Nagios als CCMS / SAP
•
Wir sehen das Einsatzgebiet mit dem Schwerpunkt einer breiteren und
umfassenderen Überwachung, welche “weniger in die Tiefe” geht.
•
Die Zukunft liegt klar im “Business Process Monitoring” (mySAP ERP
Solution Manager). In wie weit diese tiefgehende Integration
anderweitig sinnvoll zu realisieren ist, bleibt den zukünftigen Projekten
überlassen.
Ein Unternehmen der MEHLER AG
Danke für Ihre Aufmerksamkeit!
Michael Kienle
Geschäftsführer
[email protected]
www.itnovum.de
Ein Unternehmen der MEHLER AG

Documentos relacionados