Incident Management | IT Process Wiki (2024)

Incident Management | IT Process Wiki (1)esta página en españolthis Page in English

Ziel: Incident Management verwaltet alle Incidents über ihren gesamten Lebenszyklus. Das primäre Ziel dieses ITIL-Prozesses besteht darin, einen IT Service für den Anwender so schnell wie möglich wieder herzustellen.

Deutsche Bezeichnung: Incident Management

Teil von: Service Operation (Servicebetrieb)

Prozess-Verantwortlicher: Incident Manager

Inhaltsverzeichnis

  • 1 ITIL 4 Incident Management
  • 2 Prozess-Beschreibung
  • 3 Teil-Prozesse
  • 4 Definitionen
  • 5 KPIs | Checklisten
  • 6 Rollen | Verantwortlichkeiten
  • 7 Demo zum Incident Management
  • 8 Anmerkungen

ITIL 4 Incident Management

Der hier beschriebene Incident-Management-Prozess (Abb. 1) folgt den Spezifikationen von ITIL V3, wo Incident Management als Prozess im Service-Betrieb (der vierten Phase im ITIL-Service-Lifecycle) definiert ist.

ITIL V4 gibt keine bestimmten Prozesse mehr vor sondern führt 34 Praktiken ("Practices") ein. Damit sind Organisationen freier bei der Definition maßgeschneiderter Prozesse.

Incident Management wird in ITIL 4 somit als Service-Management-Praktik aufgeführt, und die Empfehlungen umfassen die wichtigsten Aktivitäten, Inputs, Outputs und Rollen. Organisationen sollen auf Basis dieser Leitlinien einen detaillierten Prozess für das Managen von Incidents festlegen, der ihren individuellen Anforderungen entspricht.

Nachdem die in ITIL V3 definierten Prozesse mit der Einführung von ITIL V4 nicht ihre Gültigkeit verloren haben, können Organisationen den Incident-Management-Prozess aus ITIL V3 nach wie vor als Vorlage verwenden.

Hinweis:
In unserem YaSM Service-Management-Wiki beschreiben wir ein schlankeres Modell mit 19 Service-Management-Prozessen, das gut zu ITIL 4 passt, wo einfache und praktikable Lösungen bevorzugt werden.

Im YaSM-Prozessmodell ist ein Incident-Management-Prozess enthalten, der eine gute Ausgangsbasis für Organisationen darstellt, die ITIL 4 einführen möchten.

Prozess-Beschreibung

ITIL unterscheidet zwischen Incidents (Service-Unterbrechungen) und Service Requests (d. h. Anfragen von Anwendern, die keine Service-Unterbrechungen betreffen, wie z.B. das Zurücksetzen eines Passworts). Service-Unterbrechungen werden vom Incident-Management-Prozess behandelt, während Service-Anfragen vom Request Fulfilment bearbeitet werden.

Der Incident-Management-Prozess kann auf verschiedenen Wegen angestoßen werden: Ein Anwender, Kunde oder Supplier kann eine Störung melden, technisches Personal kann einen (drohenden oder tatsächlichen) Ausfall feststellen, oder ein Incident kann automatisch von einem Event-Monitoring-System ausgelöst werden.

Alle Incidents sollten in Incident Records festgehalten werden, so dass ihr Status verfolgt und ihr vollständiger Verlauf dokumentiert werden kann. Die initiale Kategorisierung und Priorisierung der Incidents ist ein wichtiger Schritt zur Bestimmung, wie mit dem Incident verfahren wird und wieviel Zeit für dessen Lösung verfügbar ist (vgl. Checkliste Incident-Priorität).

Falls möglich, sollten Incidents mit anderen Incidents, Problems und Known Errors verknüpft werden.

Organisationen sollten Tools zur automatischen Fehlerbehebung einsetzen und Support-Portale mit Informationen zur Selbsthilfe bereitstellen, damit die Anwender einfache Incidents selbst lösen können. Für andere Incidents ist es die Aufgabe des 1st Level Supports, die Ursachen zu analysieren und die Incidents zu beheben, in der Regel mit Hilfe von Informationen von einer Knowledge Base oder vordefinierten Incident-Modellen.

Wenn der 1st Level Support einen Incident nicht beheben kann, muss dieser an eine geeignete spezialisierte Support-Gruppe im 2nd Level Support eskaliert werden ("funktionale Eskalation"). Falls erforderlich, kann der 2nd Level Support seinerseits Supplier und Hersteller hinzuziehen (in ITIL als "3rd Level Support" bezeichnet).

ITIL definiert einen speziellen Prozess zur Behandlung von Major Incidents (Notfälle, die geschäftskritische Services beeinträchtigen und sofortiges Handeln erfordern). Major Incidents erfordern typischer Weise, dass für einen bestimmten Zeitraum ein Major Incident Team zusammengestellt wird, um eine Lösung zu bestimmen und zu implementieren.

Nach der Lösung werden die Incidents durch den 1st Level Support formal geschlossen. Dabei wird geprüft, ob die Anwender zufrieden sind und ob die Lösungshistorie vollständig dokumentiert ist (sieheIncident-Abschluss und -Auswertung). Etwaige während der Lösung des Incidents identifizierte neue Problems, Workarounds oder Known Errors werden an den Problem-Management-Prozess weitergeleitet.

Incident Management verfügt über eine Reihe von Schnittstellen mit anderen ITIL-Prozessen:

  • Vom Event Management kann ein Incident Record erstellt werden, wenn ein Monitoring-System einen Zustand feststellt, der ein Eingreifen erfordert.
  • Problem Management liefert Informationen für den Incident-Management-Prozess, wie z. B. Workarounds und Known Errors. Das Problem Management verwendet Daten zur Identifizierung von Problems, die während der Lösung von Incidents aufgezeichnet wurden.
  • Change Management wird vom Incident Management aufgerufen, wenn ein Change notwendig ist, um einen Incident zu lösen.
  • Configuration Management stellt Daten zur Verfügung, um Incidents zu kennzeichnen und mit bestimmten Configuration Items zu verknüpfen.

Das Übersichts-Diagramm 'ITIL Incident Management' (Abb. 1) illustriert die wichtigsten Informationsflüsse und Schnittstellen des Prozesses.

In ITIL 4 wird "Incident Management" als Service-Management-Praktik aufgeführt (s. o.). Die Service-Desk-Aktivitäten werden in der ITIL4-Praktik "Service Desk" beschrieben.

Teil-Prozesse

ITIL Incident Management umfasst die folgenden Teil-Prozesse:

Incident Management Support

  • Prozessziel: Bereitstellen und Pflegen der Werkzeuge, Prozesse, Qualifikationen und Regeln für eine effektive und effiziente Bearbeitung von Incidents.

Incident-Erfassung und -Kategorisierung

  • Prozessziel: Aufzeichnen und Priorisieren der Incidents mit angemessener Sorgfalt, um eine rasche und effektive Fehlerlösung zu ermöglichen.

Unmittelbare Incident-Behebung durch den 1st Level Support

  • Prozessziel: Ein Incident soll innerhalb der vereinbarten Lösungszeit gelöst werden. Ziel ist die schnelle Wiederherstellung des IT-Service ggf. mit Hilfe eines Workarounds. Sobald es klar wird, dass der 1st Level Support den Incident nicht selbst lösen kann oder wenn die festgelegte Zeit für eine Lösung durch den 1st Level überschritten wird, wird der Incident an eine geeignete Gruppe innerhalb des 2nd Level Supports übergeben.

Incident-Behebung durch den 2nd Level Support

  • Prozessziel: Ein Incident soll innerhalb der vereinbarten Lösungszeit gelöst werden. Ziel ist die schnelle Wiederherstellung des Service ggf. mit Hilfe eines Workarounds. Falls erforderlich, werden spezialisierte Support-Gruppen oder die Supplier (3rd Level Support) mit einbezogen. Sofern die Behebung der Grundursache nicht möglich ist, wird ein Problem Record erzeugt und die Fehlerbeseitigung an das Problem Management übergeben.

Behebung von Major Incidents

  • Prozessziel: Lösung eines Major Incidents (schwerwiegenden Incidents). Major Incidents verursachen gravierende Unterbrechungen der Geschäftstätigkeiten und müssen mit höherer Dringlichkeit gelöst werden. Das Ziel besteht in der schnellen Wiederherstellung des Service, ggf. mit Hilfe eines Workarounds. Falls erforderlich, werden spezialisierte Support-Gruppen oder die Supplier (3rd Level Support) mit einbezogen. Sofern die Behebung der Grundursache nicht möglich ist, wird ein Problem Record erzeugt und die Fehlerbeseitigung an das Problem Management übergeben.

Incident-Überwachung und -Eskalation

  • Prozessziel: Der Bearbeitungsstand offener Incidents soll laufend verfolgt werden, so dass bei zu langen Lösungszeiten rechtzeitig Gegenmaßnahmen eingeleitet werden können.

Incident-Abschluss und -Auswertung

  • Prozessziel: Vor dem Schließen eines Incidents soll der angewendete Lösungsweg einer Qualitätskontrolle unterzogen werden. Das Ziel besteht darin, sicherzustellen, dass der Incident tatsächlich gelöst worden ist und dass alle Informationen zur Beschreibung des Lösungswegs in ausreichendem Detail dokumentiert sind. Zusätzlich sollen eventuelle Erkenntnisse aus der Lösung des Incidents für die Lösung künftiger Incidents nutzbar gemacht werden.

Proaktive Anwender-Information

  • Prozessziel: Anwender über Service-Ausfälle informieren, sobald diese dem Service Desk bekannt geworden sind, so dass die Anwender in die Lage versetzt werden, sich auf Service-Unterbrechungen einzustellen. Die proaktive Information der Anwender zielt ebenso darauf ab, die Anzahl der Anfragen durch Anwender zu reduzieren. Dieser Prozess ist auch für die Verteilung von sonstigen Informationen an die Anwender zuständig, z.B. Sicherheitswarnungen.

Incident Management Reporting

  • Prozessziel: Incident-bezogene Informationen für die anderen Service-Management-Prozesse bereitstellen und Sicherstellen, dass aus aufgetretenen Incidents Verbesserungspotentiale abgeleitet werden.

Definitionen

Die folgenden ITIL-Begriffe und Acronyme (Informations-Objekte) werden in Incident Management zur Darstellung der Prozess-Outputs und -Inputs verwendet:

Anwender-Eskalation

  • Eine Eskalation bezüglich der Bearbeitung eines Incidents oder Service Requests, angestoßen von Anwendern, deren Incidents bzw. Aufträge nur mit Verzögerung oder gar nicht bearbeitet werden.

Anwender-FAQs

  • Informationen für Anwender zur Selbsthilfe. Diese werden z.B. auf den Support-Seiten des Service-Desks im Intranet zur Verfügung gestellt.

Incident

  • Eine ungeplante Unterbrechung oder Qualitätsminderung eines IT-Services bzw. ein Ereignis, das in der Zukunft einen IT-Service beeinträchtigen könnte. Vgl. Incident Record.

Incident-Eskalationsregeln

  • Die Regeln für die Incident-Eskalation legen die Hierarchie fest, nach der Incidents eskaliert werden, sowie die Auslöser, die zu Eskalationen führen. Die Auslöser orientieren sich in der Regel am Schweregrad des Incidents und an der voraussichtlichen Lösungsdauer. Siehe auch: Checkliste Incident-Priorität

Incident-Management-Bericht

  • Ein Bericht des Incident Managers, der andere Service-Management-Prozesse über aufgetretene Incidents und deren Beseitigung informiert.

Incident-Modell

  • Ein Incident-Modell enthält die vordefinierten Maßnahmen zum Umgang mit einem bestimmten Incident-Typ. Auf diese Weise kann gewährleistet werden, dass häufig wiederkehrende Incidents effektiv und effizient bearbeitet werden.

Incident Record

  • Ein Datensatz mit allen Angaben zu einem Incident, in dem der Lebenszyklus des Incidents von der Ersterfassung bis zur Schließung dokumentiert ist. Ein Incident ist definiert als ungeplante Unterbrechung oder Qualitätsminderung eines IT-Services. Auch ein Ereignis, das in der Zukunft einen IT-Service beeinträchtigen könnte, ist ein Incident (z.B. der Ausfall einer Festplatte in einem RAID-Verbund). Siehe auch: ITIL-Checkliste Incident Record

Incident-Status-Information

  • Eine Nachricht mit Informationen zum aktuellen Stand einer Incident-Bearbeitung an einen Anwender, der zuvor einen Incident gemeldet hat. Statusinformationen werden Anwendern typischerweise an verschiedenen Punkten im Lebenszyklus eines Incidents gesendet.

Major Incident

  • Schwerwiegende Incidents, die gravierende Unterbrechungen der Geschäftstätigkeiten verursachen und mit höherer Dringlichkeit gelöst werden müssen. Siehe auch: Checkliste Incident Priorisierung - Major Incidents

Major Incident Review

  • Ein Major Incident Review erfolgt, nachdem ein Major Incident aufgetreten ist. Das Review dokumentiert die dem Incident zugrundeliegenden Ursachen (soweit bekannt) und die vollständige Lösungshistorie, sowie Verbesserungsmöglichkeiten bei der Behandlung künftiger Major Incidents.

Meldung einer Service-Unterbrechung

  • Die Meldung einer Service-Unterbrechung an das Service-Desk, z.B. von einem Anwender per Telefon oder E-Mail, oder von einem System-Monitoring-Tool.

Priorisierungs-Richtlinie für Incidents

  • Die Priorisierungs-Richtlinie für Incidents beschreibt die Regeln für die Zuordnung von Prioritäten zu Incidents und definiert, welche Incidents als Major Incidents zu behandeln sind. Da die Eskalationsregeln für Incidents in der Regel auf Prioritäten basieren, ist die Zuordnung der richtigen Priorität maßgeblich für die angemessene Eskalation von Incidents. Siehe auch: Checkliste Richtlinie Incident-Priorisierung

Proaktive Anwender-Information

  • Eine Meldung über bestehende oder unmittelbar bevorstehende Service-Unterbrechungen an die Anwender, damit sich die Anwender auf die Nicht-Verfügbarkeit eines Service einstellen können.

Status-Anfrage

  • Eine Anfrage bezüglich des aktuellen Bearbeitungsstands eines Incidents oder Serviceauftrags, typischerweise von einem Anwender gestellt, der zuvor einen Incident oder Service Request gemeldet hat.

Support-Anfrage

  • Eine Anforderung zur Unterstützung bei der Behebung eines Incidents oder Problems. Eine solche Anforderung wird üblicherweise vom Incident Management oder Problem Management gestellt, wenn weitere technische Expertise für die Behebung von Incidents oder Problems erforderlich ist.

KPIs | Checklisten

  • Kennzahlen (KPIs) zum Incident Management
  • Checklisten Incident Management:
    • Checkliste Incident Record
    • Checkliste Incident-Priorisierung, sowie
    • Checkliste Erstanalyse eines Incidents
    • Checkliste Incident-Eskalation
    • Checkliste Schließen eines Incidents
    • Checkliste Incident Report

Rollen | Verantwortlichkeiten

Incident Manager - Prozess-Verantwortlicher

  • Der Incident Manager ist verantwortlich für die effektive Durchführung des Prozesses "Incident Management" und führt das entsprechende Berichtswesen durch. Er ist die erste Eskalationsstufe für Incidents, falls diese nicht innerhalb der vereinbarten Service Levels gelöst werden können.

1st Level Support

  • Der Bearbeiter im 1st Level Support sorgt bei eingehenden Störungsmeldungen für die Registrierung und Einordnung und unternimmt einen unmittelbaren Lösungsversuch zur schnellstmöglichen Wiederherstellung des definierten Betriebszustands eines Service. Ist dies nicht möglich, leitet er die Störung an spezielle Bearbeitergruppen im 2nd Level Support weiter.

2nd Level Support

  • Der Bearbeiter im 2nd Level Support übernimmt Störungsmeldungen vom 1st Level Support, die dieser nicht selbständig lösen kann. Bei Bedarf wird er Unterstützung von Herstellern (3rd Level Support) anfordern. Ziel ist die schnellstmögliche Wiederherstellung des definierten Betriebszustands eines Service. Ist keine ursächliche Störungsbeseitigung möglich, übergibt er die Störung zur weiteren Bearbeitung an das Problem Management.

3rd Level Support

  • Der Bearbeiter im 3rd Level Support ist typischerweise bei einem Hersteller von Hardware- oder Softwareprodukten ("Supplier") angesiedelt; er wird vom 2nd Level Support mit einbezogen, wenn dies zur Beseitigung von Störungen erforderlich ist. Ziel ist die schnellstmögliche Wiederherstellung des definierten Betriebszustands eines Service.

Major Incident Team

  • Das Major Incident Team ist ein dynamisch gegründetes Team von IT-Managern und technischen Experten, normaler Weise unter der Führung des Incident Managers. Es wird einberufen, um gemeinsam die Lösung für einen Major Incident (schwerwiegenden Incident) zu erarbeiten.
Verantwortlichkeits-Matrix: ITIL Incident Management
ITIL-Rolle / Teil-ProzessIncident Manager1st Level Support2nd Level SupportMajor Incident TeamAnwend.-
system-Analytiker[3]
Technischer Analytiker[3]IT-Operator[3]
Incident Management SupportA[1]R[2]------
Incident-Erfassung und -KategorisierungAR-----
Unmittelbare Incident-Behebung durch den 1st Level SupportAR-----
Incident-Behebung durch den 2nd Level SupportA-R-R[4]R[4]R[4]
Behebung von Major IncidentsARR-R--R
Incident-Überwachung und -EskalationARR-----
Incident-Abschluss und -AuswertungAR-----
Proaktive Anwender-InformationAR-----
Incident Management ReportingAR------

Erläuterungen

[1] A: Accountable i.S.d. RACI-Modells: Verantwortlich dafür, dass Incident Management als Gesamt-Prozess korrekt und vollständig ausgeführt wird.

[2] R: Responsible i.S.d. RACI-Modells: Verantwortlich für die Ausführung bestimmter Aufgaben in Incident Management.

[3] Zu den Rollen-Beschreibungen...

[4] In Kooperation, je nach Erfordernis: 2nd Level Support-Gruppen sind oft mit Anwendungs- bzw. Technischen Analytikern besetzt

Demo zum Incident Management

DiekurzeDemo zur ITIL-Prozesslandkarte zeigt Inhalte des ITIL-Referenzprozessmodells von IT Process Maps; das Video enthält Informationen zu den Prozessen Service Operation und ITIL Incident Management, wie z.B.

  • ITIL-Service-Lifecycle (Detailebene 0)
  • Übersicht über ITIL Service Operation (Detailebene 1)
  • Übersicht über den Prozess Incident Management (Detailebene 2)
  • Detaillierte Aktivitäten im Teil-Prozess "Incident-Behebung durch den 1st Level Support" (Detailebene 3)

Video ansehen: "Die ITIL-Prozesslandkarte - Einführung" (10:58 Min.)

Anmerkungen

Von:Stefan KempterIncident Management | IT Process Wiki (4), IT Process Maps.

ITIL 4 Incident ManagementProzess-BeschreibungTeil-ProzesseDefinitionen

Incident Management | IT Process Wiki (2024)

FAQs

What are the 5 stages of the incident management process? ›

What are the five steps of an incident response plan?
  • Incident identification.
  • Incident categorization.
  • Incident prioritization.
  • Incident response.
  • Incident closure.
Feb 16, 2024

What is incident management in IT industry? ›

Incident management is a process used by IT operations and DevOps teams to respond to and address unplanned events that can affect service quality or service operations. Incident management aims to identify and correct problems while maintaining normal service and minimizing impact to the business.

What is the IT incident management lifecycle? ›

The initial step for any incident management lifecycle is identification. This starts with an end user, IT specialist, or automated monitoring system reporting an interruption. The alert can come via in-person notification, automated system notice, email, SMS, or phone call.

What is the incident management process as per ITIL v4? ›

ITIL incident management is the process of restoring normal service operation as quickly as possible after an IT service disruption, in order to minimise the impact on the organisation. It involves identifying, logging, categorising, prioritising, investigating, diagnosing, and resolving incidents.

What are the 5 C's of incident management? ›

There is a simple method or approach to problem-solving and incident analysis that applies whether the problem is big or small. This approach is called the 5Cs. The 5Cs are Conditions, Correlations, Contributions, Causes, and Corrections. Listed below is the detail and order in which they should be considered.

What is KPI in incident management? ›

KPIs (Key Performance Indicators) are metrics that help businesses determine whether they're meeting specific goals. For incident management, these metrics could be number of incidents, average time to resolve, or average time between incidents.

What are the four R's of incident management? ›

Repair, Resolution, Recovery and Restoration are the 4 R's mostly used during the Incident Management process. While ITIL is very particular about the terms and terminology, there seems to be enough confusion while discussing these four terms.

What is an example of an IT incident? ›

Hardware incidents typically include downed or limited resources, network issues or other system outages. Security incidents encompass attempted and active threats intended to compromise or breach data. Unauthorized access to personally identifiable information and records is a security issue, for example.

What is incident management workflow? ›

Incident Management enables you to categorize and track various types of incidents (such as service unavailability or performance issues and hardware or software failures), and ensures that incidents are resolved within agreed-on service level targets.

What are the 4 stages of major incident management? ›

Most major incidents can be considered to have four stages: • the initial response; the consolidation phase; • the recovery phase; and • the restoration of normality.

What is the incident management process plan? ›

Sometimes called an incident management plan or emergency management plan, an incident response plan provides clear guidelines for responding to several potential scenarios, including data breaches, DoS or DDoS attacks, firewall breaches, malware outbreaks, insider threats, data loss and other security breaches.

What is incident management in one word? ›

Incident management is the process used by development and IT Operations teams to respond to an unplanned event or service interruption and restore the service to its operational state.

What is the main objective of incident management? ›

The purpose of the Incident Management process is to restore normal service operation as quickly as possible and minimize the adverse impact on business operations, ensuring that agreed levels of service quality are maintained.

What is a major incident in IT? ›

A major incident is an emergency-level outage or loss of service. The definition of emergency-level varies across organizations.

What are the 5 phases in the incident response process? ›

5 steps to building an effective incident response plan. There are several resources that can help you develop your incident response plan. In addition to NIST, there is SANS Incident Management, which emphasizes preparation, identification, containment, eradication, recovery, and lessons learned.

What are the 5 major components of an incident management system? ›

NIMS Components
  • Preparedness. ...
  • Communications and Information Management. ...
  • Resource Management. ...
  • Command and Management. ...
  • Ongoing Management and Maintenance.

What are the 5 management areas of the core incident command structure? ›

ICS establishes five functional areas for management of major incidents: command, operations, planning, logistics, and finance/administration. Span-of-control recommendations are followed closely, so the organizational structure is never larger than required.

Top Articles
Latest Posts
Article information

Author: Mrs. Angelic Larkin

Last Updated:

Views: 6555

Rating: 4.7 / 5 (47 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Mrs. Angelic Larkin

Birthday: 1992-06-28

Address: Apt. 413 8275 Mueller Overpass, South Magnolia, IA 99527-6023

Phone: +6824704719725

Job: District Real-Estate Facilitator

Hobby: Letterboxing, Vacation, Poi, Homebrewing, Mountain biking, Slacklining, Cabaret

Introduction: My name is Mrs. Angelic Larkin, I am a cute, charming, funny, determined, inexpensive, joyous, cheerful person who loves writing and wants to share my knowledge and understanding with you.