SAP Überwachung und Leistungsprüfungen: Vollständiges Tutorial mit Tcodes
Was ist Systemüberwachung?
Die Systemüberwachung ist eine tägliche Routinetätigkeit und dieses Dokument bietet eine systematische Schritt-für-Schritt-Anleitung zur Serverüberwachung. Es gibt einen Überblick über technische Aspekte und Konzepte zur proaktiven Systemüberwachung. Einige davon sind:
- Anwendungsserver prüfen.
- Überwachung systemweiter Arbeitsprozesse.
- Überwachung von Arbeitsabläufen für einzelne Instanzen.
- Sperreinträge überwachen.
- CPU-Auslastung
- Verfügbarer Speicherplatz in der Datenbank.
- Überwachen von Update-Prozessen.
- Überwachungssystemprotokoll.
- Buffer Statistiken
Einige andere sind:
- Überwachen von Batch-Jobs
- Überwachung von Spool-Anfragen.
- Anzahl der Druckanfragen
- ABAP-Dump-Analyse.
- Datenbankleistungsmonitor.
- Datenbankprüfung.
- Überwachung von Anwendungsbenutzern.
Warum tägliche Grundprüfungen / Systemüberwachung?
Wie überwachen wir eine SAP System?
Anwendungsserver prüfen (SM51)
Mit dieser Transaktion werden alle aktiven Anwendungsserver überprüft.
Hier können Sie sehen, welche Dienste bzw. Arbeitsprozesse jeweils konfiguriert sind.
Überwachung von Arbeitsabläufen für einzelne Instanzen SM50
Zeigt alle laufenden, wartenden, gestoppten und PRIV-Prozesse an, die sich auf eine bestimmte Instanz beziehen. In diesem Schritt überprüfen wir alle Prozesse; Der Prozessstatus sollte immer wartend oder ausgeführt sein. Wenn ein Prozess einen anderen Status als „Warten“ oder „Läuft“ hat, müssen wir diesen bestimmten Prozess überprüfen und entsprechend berichten.
Diese Transaktion zeigt viele Informationen an, wie zum Beispiel:
- Status des Arbeitsprozesses (ob belegt oder nicht)
- Wenn der Arbeitsprozess ausgeführt wird, können Sie die von ihm ausgeführte Aktion möglicherweise in der Spalte „Aktion“ sehen.
- Sie können sehen, an welcher Tabelle gearbeitet wird
Einige der typischen Probleme:
- Der Benutzer braucht lange, um sich anzumelden/kann sich nicht anmelden/Online-Transaktion ist sehr langsam. Dies könnte darauf zurückzuführen sein, dass die DIA-Arbeitsprozesse vollständig ausgelastet sind. Es könnte auch das Ergebnis lang laufender Jobs sein (roter Indikator unter der Spalte „Zeit“). Bei Bedarf können Sie die Sitzung abbrechen, indem Sie die Jobs auswählen und dann zu „Verarbeiten“ > „Ohne Kern abbrechen“ gehen. Dadurch wird der Job abgebrochen und der Arbeitsprozess für andere Benutzer/Prozesse freigegeben
- Einige Benutzer haben möglicherweise den PRIV-Status unten Grund Spalte. Dies könnte daran liegen, dass die Benutzertransaktion so groß ist, dass sie mehr Speicher benötigt. In diesem Fall wird der DIA-Arbeitsprozess zum „Eigentum“ des Benutzers und kann nicht von anderen Benutzern verwendet werden. Wenden Sie sich in diesem Fall an den Benutzer und führen Sie den Job nach Möglichkeit als Hintergrundjob aus.
- Wenn im SPO-Arbeitsprozess ein langer Druckauftrag vorliegt, untersuchen Sie das Problem. Möglicherweise liegt ein Problem mit dem Druckserver oder Drucker vor.
Überwachung systemweiter Arbeitsprozesse (SM66)
Durch die Überprüfung der Arbeitsprozessauslastung mithilfe der globalen Arbeitsprozessübersicht können wir schnell die mögliche Ursache eines Systemleistungsproblems untersuchen.
Überwachen Sie die Arbeitsprozesslast auf allen aktiven Instanzen über das System
Auf dem Bildschirm Global Work Process Overview können wir auf einen Blick sehen:
- Der Status jedes Anwendungsservers
- Der Grund, warum es nicht läuft
- Ob es neu gestartet wurde
- Die CPU und die Anforderungslaufzeit
- Der Benutzer, der sich angemeldet hat, und der Client, bei dem er sich angemeldet hat
- Der Bericht, der ausgeführt wird
Anwendungsbenutzer überwachen (AL08 und SM04)
Diese Transaktion zeigt alle Benutzer aktiver Instanzen an.
Überwachen von Verbuchungsprozessen (SM13)
Führen Sie die Transaktion SM13 aus und geben Sie '*' in das Feld USER ein und klicken Sie auf .
Wenn keine lange ausstehenden Aktualisierungsdatensätze vorhanden sind oder keine Aktualisierungen durchgeführt werden, ist diese Warteschlange leer, wie im folgenden Screenshot dargestellt.
Wenn das Update jedoch nicht aktiv ist, finden Sie die folgenden Informationen:
- Ist das Update aktiv, wenn nicht, wurde es vom System oder von einem Benutzer deaktiviert?
- Klicken Sie auf
Klicken Sie auf die Schaltfläche und erhalten Sie die Informationen.
- Klicken Sie auf
Klicken Sie auf die Schaltfläche und erhalten Sie die folgenden Informationen:
- Klicken Sie auf
- Wurde ein Update abgebrochen?
- Gibt es eine lange Warteschlange ausstehender Updates, die älter als 10 Minuten sind?
Sperreinträge überwachen (SM12)
Führen Sie die Transaktion SM12 aus und geben Sie „*“ in das Feld „Benutzername“ ein
SAP Bietet einen Sperrmechanismus, um zu verhindern, dass andere Benutzer den Datensatz ändern, an dem Sie arbeiten. In manchen Situationen werden Sperren nicht freigegeben. Dies kann passieren, wenn die Benutzer beispielsweise aufgrund eines Netzwerkproblems unterbrochen werden, bevor sie die Sperre aufheben können.
Diese alten Sperren müssen gelöscht werden, da sie sonst den Zugriff oder Änderungen an den Datensätzen verhindern könnten.
Mithilfe der Sperrstatistik können wir die im System gesetzten Sperren überwachen. Wir erfassen nur die Sperreinträge, die einen Datums-/Zeitstempel vom Vortag haben.
Überwachungssystemprotokoll (SM21)
Mithilfe des Protokolls können wir auftretende Fehler im System und seiner Umgebung lokalisieren und beheben.
Wir prüfen das Protokoll des Vortages mit folgender Auswahl/Option:
- Geben Sie Datum und Uhrzeit ein.
- Wählen Sie Probleme und Warnungen mit Optionsfeldern aus
- Klicken Sie auf „Systemprotokoll erneut lesen“.
Tune-Zusammenfassung (ST02)
Schritt 1: Gehen Sie zu ST02, um die Tune-Zusammenfassung zu überprüfen.
Schritt 2: Wenn Sie in SWAPS rote Werte sehen, doppelklicken Sie darauf.
Schritt 3: Klicken Sie im folgenden Bildschirm auf die Registerkarte „Aktuelle Parameter“.
Schritt 4: Notieren Sie sich den Wert und die Profilparameter
Schritt 5: Gehen Sie zu RZ10 (um die Profilparameterwerte zu ändern)
Schritt 6: Speichern Sie die Änderungen.
Schritt 7: Starten Sie den Server neu, damit die neuen Änderungen wirksam werden.
CPU-Auslastung (ST06)
Die CPU-Auslastungsrate im Leerlauf muss 60–65 % betragen. Wenn sie diesen Wert überschreitet, müssen wir zumindest die folgenden Dinge überprüfen:
- Führen Sie Befehle auf Betriebssystemebene aus – top und prüfen Sie, welche Prozesse die meisten Ressourcen beanspruchen.
- Gehen Sie zu SM50 oder SM66. Überprüfen Sie, ob Jobs mit langer Laufzeit oder lange Aktualisierungsabfragen ausgeführt werden.
- Gehen Sie zu SM12 und überprüfen Sie die Sperreinträge
- Gehen Sie zu SM13 und überprüfen Sie den Status „Aktiv aktualisieren“.
- Suchen Sie nach Fehlern in SM21.
ABAP-Dumps (ST22)
Hier prüfen wir die Dumps vom Vortag
Spool-Auftragsüberwachung (SP01)
Führen Sie für die Überwachung von Spool-Aufträgen SP01 aus und wählen Sie Folgendes aus:
Hier erfassen wir nur die Anfragen, die mit Problemen beendet wurden.
Batch-Jobs überwachen (SM37)
Führen Sie für Überwachungs-Hintergrundjobs SM37 aus und wählen Sie Folgendes aus:
- Geben Sie „*“ in die Felder „Benutzername“ und „Jobname“ ein
- Wählen Sie unter Auftragsstatus: Geplante, stornierte, freigegebene und abgeschlossene Anforderungen aus.
Transaktionale RFC-Administration (SM58)
Transaktionaler RFC (tRFC, ursprünglich auch als asynchroner RFC) ist eine asynchrone Kommunikationsmethode, die den aufgerufenen Funktionsbaustein im RFC-Server nur einmal ausführt.
Wir müssen den Anzeigezeitraum auswählen, für den wir die tRFCs anzeigen möchten, und dann „*“ im Feld „Benutzername“ auswählen, um alle Anrufe anzuzeigen, die nicht korrekt ausgeführt wurden oder in der Warteschlange warten.
QRFC-Verwaltung (Ausgangswarteschlange-SMQ1)
Wir sollten hier den Clientnamen angeben und prüfen, ob sich ausgehende qRFCs im Warte- oder Fehlerstatus befinden.
QRFC-Verwaltung (Eingangswarteschlange-SMQ2)
Wir sollten hier den Clientnamen angeben und prüfen, ob sich eingehende qRFCs im Warte- oder Fehlerstatus befinden.
Datenbankadministration (DB02)
Nachdem Sie ausgewählt haben Aktuelle Größen Auf dem ersten Bildschirm gelangen wir zum folgenden Bildschirm, der uns den aktuellen Status aller Tablespaces im System anzeigt.
Wenn einer der Tablespaces mehr als 95 % ausmacht und die automatische Erweiterung deaktiviert ist, müssen wir eine neue Datendatei hinzufügen, damit die Datenbank nicht voll ist.
Wir können auch den Verlauf von Tablespaces ermitteln.
Wir können hier Monate, Wochen oder Tage auswählen, um die Änderungen zu sehen, die in einem Tablespace stattfinden.
Durch die Analyse dieser Werte können wir das Wachstum des Tablespace bestimmen.
Datenbanksicherungsprotokolle (DB12)
Anhand dieser Transaktion konnten wir feststellen, wann die letzte erfolgreiche Sicherung des Systems stattgefunden hat. Wir können die Backups des Vortages überprüfen und sehen, ob alles in Ordnung war oder nicht.
Wir können auch die Redo-Log-Dateien überprüfen und sehen, ob die Redo-Log-Sicherung erfolgreich war oder nicht.
Direkt Review
Tägliche Überwachungsaufgaben
- Kritische Aufgaben
- SAP System
- Database
Kritische Aufgaben
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | Überprüfen Sie, ob das R/3-System aktiv ist. | Melden Sie sich am R/3-System an | |
2 | Überprüfen Sie, ob die tägliche Sicherung fehlerfrei ausgeführt wurde | DB12 | Überprüfen Sie die Datenbanksicherung. |
SAP System
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | Überprüfen Sie, ob alle Anwendungsserver aktiv sind. | SM51 | Überprüfen Sie, ob alle Server aktiv sind. |
2 | Arbeitsabläufe prüfen (ab SM51 gestartet). | SM50 | Alle Arbeitsprozesse mit dem Status „Läuft“ oder „Warten“. |
3 | Übersicht über den globalen Arbeitsprozess | SM66 | Stellen Sie sicher, dass kein Arbeitsprozess länger als 1800 Sekunden ausgeführt wird |
3 | Suchen Sie nach fehlgeschlagenen Updates (Update wird abgebrochen). | SM13 |
|
4 | Überprüfen Sie das Systemprotokoll. | SM21 | Stellen Sie Datum und Uhrzeit auf die Zeit vor der letzten Protokollüberprüfung ein. Prüfen Auf:
|
5 | RevAnzeige stornierter Aufträge. | SM37 | Geben Sie unter Benutzer-ID ein Sternchen (*) ein. Stellen Sie sicher, dass alle kritischen Jobs erfolgreich waren. |
6 | Suchen Sie nach „alten“ Schlössern. | SM12 | Geben Sie einen Stern (*) für die Benutzer-ID ein. |
7 | Suchen Sie nach Benutzern im System. | SM04AL08 | RevAnzeige für eine unbekannte oder andere Benutzer-ID und ein anderes Terminal. Diese Aufgabe sollte mehrmals täglich durchgeführt werden. |
8 | Suchen Sie nach Spulenproblemen. | SP01 | Geben Sie für „Erstellt von“ ein Sternchen (*) ein. Suchen Sie nach Spool-Jobs, die seit mehr als einer Stunde „In Bearbeitung“ sind. |
9 | Überprüfen Sie das Jobprotokoll | SM37 | Prüfen Auf:
|
10 | RevDumps anzeigen und auflösen. | ST22 | Suchen Sie nach einer übermäßigen Anzahl von Dumps. Suchen Sie nach Mülldeponien ungewöhnlicher Art. |
11 | RevPufferstatistiken anzeigen. | ST02 | Suchen Sie nach Tauschmöglichkeiten. |
Database
Nein | Aufgabe | Transaktion | Vorgehensweise / Bemerkung |
---|---|---|---|
1 | RevSehen Sie sich das Fehlerprotokoll bei Problemen an. | ST04 | |
2 | Datenbankwachstum, fehlende Indizes | DB02 | Wenn der Tablespace zu mehr als 90 % genutzt wird, fügen Sie eine neue Datendatei hinzu. Erstellen Sie die fehlenden Indizes neu |
3 | Datenbankstatistikprotokoll | DB13 |