Emergency Recovery Plan

Im März hat ein Brand im Rechenzentrum der französischen Cloud-Infrastrukturfirma OVH die Dienste vieler Unternehmen gestört, teils sogar zerstört. Einige Kunden haben Daten verloren. Um Kundendaten zu schützen und eine Hochverfügbarkeit unseres Dienstes sicherzustellen, gibt es bei Teamwire für solche Szenarien Emergency Recovery Pläne.

Teamwire, Jul. 21 2021

Was tun, wenn eine Katastrophe wie ein Brand in einem Server-Rechenzentrum passiert? Sich als Unternehmen machtlos dem Schicksal aussetzen? Heutzutage muss man auf kritische Ereignisse und Eskalationen vorbereitet sein, wie nun auch in dem Fall des Brands der OVH Rechenzentren.

 

Viele Websites, Softwareanbieter, Internetfirmen, Bankdienste, Behördenportale, E-Commerce-Shops und andere Anbieter, die über dieses Rechenzentrum betrieben wurden, waren aufgrund des Schadens stunden- oder sogar tagelang offline. Schlimmer noch: In einigen Fällen kam es zu großen Datenverlusten. Und offenbar hatten einige Rechenzentrums-Kunden offenbar Daten verloren, weil sie keine Backups eingerichtet hatten. Aufgrund fehlender Emergency-Recovery-Pläne seitens der Kunden waren einige Dienste auch Wochen nach dem Vorfall noch nicht wieder vollständig online.

 

Was genau ist ein Emergency Recovery Plan?

 

Das Ziel eines Notfallwiederherstellungsplans – Emergency Recovery Plan – ist es, sicherzustellen, dass auf eine Katastrophe oder einen anderen Notfall, der Informationssysteme betrifft, schnell reagiert und die Auswirkungen auf den Geschäftsbetrieb minimiert werden können.

 

Der Teamwire Emergency Recovery Plan

 

Im Folgenden wollen wir einen Überblick geben, wie wir die Kundendaten von unserem Business Messenger Teamwire schützen und die Verfügbarkeit unserer Cloud-Dienste im Falle einer solchen Eskalationsstufe sicherstellen:

 

Premium-Rechenzentrum

 

  • Die Server für unsere Cloud stehen bei einem Premium-Rechenzentrumsanbieter in Deutschland. Das Rechenzentrum ist nach ISO27001 zertifiziert und als ausfallsichere Rechenzentrumsinfrastruktur mit unabhängigen Zonen aufgebaut.
  • Im Rechenzentrum finden sowohl interne als auch externe Sicherheitsaudits statt, um mögliche Schwachstellen zu identifizieren und das System kontinuierlich zu verbessern.
  • Alle Mitarbeiter des Rechenzentrums werden regelmäßig geschult und es gibt Aktionspläne für Notfallsituationen.
  • Das Rechenzentrum führt interne Backups der Server in einer anderen Zone und in einem anderen Rechenzentrum an einem anderen Standort durch. Darüber hinaus verfügt das Rechenzentrum über ein Recovery-Konzept, um eine schnelle Wiederherstellung der Server zu gewährleisten.
  • Es sind Notstromversorgungen vorhanden, um den kontinuierlichen Betrieb der Server im Störungsfall zu gewährleisten.
  • Das Rechenzentrum verfügt über verschiedene Brandabschnitte, die baulich voneinander getrennt sind. Jede Zone verfügt über eine eigene Feuerlöschanlage zur sofortigen Brandbekämpfung.
  • Die Gefährdung des Rechenzentrums durch Erdbeben und Überschwemmungen ist nach DIN-Normen bewertet worden.
  • Natürlich gibt es noch viele weitere Maßnahmen, um IT-Sicherheit, Datenschutz und DSGVO zu gewährleisten.

 

Regelmäßige Backups in verschiedenen Rechenzentren

 

  • Unser Rechenzentrum tut viel, um Daten zu schützen und die Verfügbarkeit unserer Cloud zu gewährleisten. Wir wollen aber nicht von einem Rechenzentrum abhängig sein und im schlimmsten Fall eigene Backups haben. Deshalb machen wir als Teamwire zusätzlich zum Rechenzentrum eigene Backups.
  • Zunächst einmal basiert unsere deutsche Cloud auf einem Cluster-Setup von Servern, die ständig synchronisiert werden. Das bedeutet, dass im Falle des Ausfalls einer Maschine sofort eine andere Maschine einspringt. Mit dem Clusterserver können wir eine hohe Verfügbarkeit unserer deutschen Cloud sicherstellen.
  • Zusätzlich machen wir stündliche Backups aller Serverdatenbanken der deutschen Cloud in einer separaten Zone des Rechenzentrums.
  • Außerdem machen wir tägliche Backups aller Serverdatenbanken der deutschen Cloud in einem anderen deutschen Rechenzentrum in einer anderen Region.

 

     Notfall-Wiederherstellungsprotokoll

 

  • Alle oben genannten Maßnahmen schützen die Daten und gewährleisten die volle Verfügbarkeit bei Zwischenfällen wie Maschinenausfällen, Netzwerkproblemen oder kleineren Bränden.
  • Für den schlimmsten Fall eines kompletten Rechenzentrumsausfalls (z.B. Zerstörung der Anlage wie im Fall OVH) haben wir ein Notfallwiederherstellungsprotokoll eingerichtet, um unsere deutsche Cloud innerhalb von 2 Stunden in einem alternativen Rechenzentrum einzurichten.
  • Das Notfall-Wiederherstellungsprotokoll regelt alle erforderlichen Schritte, um die Dienste neu zu installieren, Datenbanken und Assets wiederherzustellen und die alternative Cloud-Umgebung schnell zu starten. Es beschreibt klare Anweisungen und alle Aufgaben (inkl. Commands) von Devops und Support.
  • Das Notfallwiederherstellungsprotokoll kümmert sich auch um die gesamte interne Kommunikation, um die organisatorische Abstimmung und maximale Geschwindigkeit zu gewährleisten. Auch die externe Information an Kunden und Partner wird beschrieben, um Business Continuity und Transparenz zu gewährleisten.

 

Wechsel zu einem alternativen Rechenzentrum

 

Mit diesen Sicherheitsmaßnahmen und unserem Notfallwiederherstellungsprotokoll könnten wir sehr schnell auf ein alternatives Rechenzentrum in Deutschland für unsere Cloud umschalten. Das bedeutet, dass unsere Kunden in einem solchen Worst-Case-Szenario nur eine minimale Ausfallzeit erleben würden.

 

Die Sicherheit als größten Faktor mit einbeziehen

 

So machtlos man als Kunde bei einem Rechenzentrum in solch einem Moment sein kann, um so wichtiger ist es für uns die bestmögliche Absicherung für unseren eigenen Kundenstamm zu bieten     . Wir können keine 100-prozentige Garantie geben, dass solch ein Szenario nie stattfinden wird. Die Wahrscheinlichkeit ist sehr gering, aber nicht unmöglich. Und genau aus diesem Grund haben wir für unsere Kunden den Teamwire Emergency Recovery Plan entwickelt.

 

Wir sind für Sie da!

 

Sie möchten mehr über das Thema Sicherheit bei und den Emergency Recovery Plan von Teamwire erfahren? Dann kontaktieren Sie unser Sales-Team. Unsere Sales-Kollegen können Ihnen sowohl als Bestandskunde und (potentiellen) Neukunde die genauen Sicherheitsvorkehrungen schildern.