Die Klassifizierung von Rechenzentren umfasst vier Stufen, die jeweils spezifische Geschäftsfunktionen repräsentieren und Kriterien für Wartung, Stromversorgung, Kühlung und mögliche Störungen festlegen. Diese Stufen bauen progressiv aufeinander auf, wobei jede Stufe die Anforderungen der vorherigen berücksichtigt. Ein Tier-IV-Rechenzentrum gilt nicht automatisch als "besser" als ein Tier-II-Zentrum; vielmehr sind diese Stufen auf verschiedene Geschäftsabläufe zugeschnitten. Die Definitionen und Vorteile dieser Stufen sind im Topologie-Standard des Institutes festgelegt und konzentrieren sich auf die Infrastruktur.
Die betriebliche Nachhaltigkeit stellt eine weitere wesentliche Komponente der Daten-Tier-Klassifizierung dar. Sie befasst sich mit Verhaltensweisen und Risiken, die neben dem Design der Infrastruktur die Fähigkeit eines Rechenzentrums beeinflussen, langfristige Geschäftsziele zu erreichen. Rechenzentrumsbetreiber können ihr Managementverhalten anpassen, um diese Ziele zu erreichen, da dies für die betriebliche Nachhaltigkeit entscheidend ist.
Topologie und betriebliche Nachhaltigkeit bilden gemeinsam die Leistungskriterien für Rechenzentren. Betreiber sollten zusätzlich andere Aspekte wie Bauvorschriften, lokale Wetterbedingungen, Sicherheit und Immobiliennutzung berücksichtigen, die durch die Standards nicht abgedeckt werden. Es liegt letztendlich in der Verantwortung des Eigentümers, die passende Tier-Stufe für die eigenen Geschäftsanforderungen auszuwählen.
Die Tier-Definitionen legen zwar Kriterien fest, schreiben aber keine spezifischen Technologien oder Designentscheidungen vor, um eine bestimmte Klassifizierung zu erreichen. Die Flexibilität der Stufen erlaubt verschiedene Lösungsansätze, die den Leistungszielen und Vorschriften gerecht werden, was technische Innovation und Einzigartigkeit in Rechenzentren fördert. Jedes Zentrum hat die Freiheit, individuell zu entscheiden, wie es die Tier-Kriterien und Geschäftsziele am besten erfüllt.
Rechenzentrumsbetreiber, die eine bestimmte Stufe anstreben, um ihre geschäftlichen Anforderungen zu erfüllen, können ihr Design und ihre Einrichtungen vom Uptime Institute bewerten und zertifizieren lassen. Diese Zertifizierung bezeugt die Zuverlässigkeit der Infrastruktur und steht weltweit für ausgezeichnete Leistung. Der Zertifizierungsprozess bietet eine unvoreingenommene Bewertung, die sicherstellt, dass alle Anforderungen und Erwartungen erfüllt werden, wobei die individuellen Bedürfnisse des Rechenzentrums berücksichtigt werden.
Das KAMP-Rechenzentrum ist an den Tier 3 Standard angelehnt, verfügt aber über keineoffizielleTier 3 Standard-Verifizierung.
Tier I
Ein Tier-I-Rechenzentrum ist die grundlegende Kapazitätsstufe mit einer Infrastruktur zur Unterstützung der Informationstechnologie für eine Büroumgebung und darüber hinaus. Zu den Anforderungen an eine Tier-I-Einrichtung gehören:
- Eine unterbrechungsfreie Stromversorgung (USV) für Stromausfälle und -spitzen
- Ein Bereich für IT-Systeme
- Eine spezielle Kühlanlage, die außerhalb der Bürozeiten läuft
- Ein Motorgenerator für Stromausfälle
Stufe I schützt vor Unterbrechungen durch menschliches Versagen, nicht aber vor unerwarteten Ausfällen oder Störungen. Zu den redundanten Geräten gehören Kühlanlagen, Pumpen, USV-Module und Motorgeneratoren. Die Anlage muss für vorbeugende Wartungsarbeiten und Reparaturen vollständig abgeschaltet werden, und wenn dies nicht geschieht, erhöht sich das Risiko ungeplanter Unterbrechungen und schwerwiegender Folgen eines Systemausfalls.
Stufe II
Tier-II-Einrichtungen umfassen redundante Kapazitätskomponenten für Strom und Kühlung, die bessere Wartungsmöglichkeiten und Sicherheit vor Störungen bieten. Zu diesen Komponenten gehören:
- Motor-Generatoren
- Energiespeicher
- Kältemaschinen
- Kühleinheiten
- USV-Module
- Pumpen
- Geräte zur Wärmeabfuhr
- Kraftstofftanks
- Brennstoffzellen
Der Verteilungspfad von Tier II dient einer kritischen Umgebung, und die Komponenten können entfernt werden, ohne dass es zu einer Abschaltung kommt. Wie bei einer Tier-I-Einrichtung wirkt sich auch bei einem Tier-II-Rechenzentrum eine unerwartete Abschaltung auf das System aus.
Stufe III
Ein Tier-III-Rechenzentrum ist gleichzeitig wartungsfähig und verfügt über redundante Komponenten als Hauptunterscheidungsmerkmal sowie über redundante Verteilungswege für die kritische Umgebung. Im Gegensatz zu Tier I und Tier II müssen diese Einrichtungen nicht abgeschaltet werden, wenn Geräte gewartet oder ausgetauscht werden müssen. Die Komponenten von Tier III werden zu den Komponenten von Tier II hinzugefügt, so dass jeder Teil abgeschaltet werden kann, ohne den IT-Betrieb zu beeinträchtigen.
Stufe IV
Ein Tier IV-Rechenzentrum verfügt über mehrere unabhängige und physisch isolierte Systeme, die als redundante Kapazitätskomponenten und Verteilungswege fungieren. Die Trennung ist notwendig, um zu verhindern, dass ein Ereignis beide Systeme beeinträchtigt. Die Umgebung wird durch eine Unterbrechung aufgrund geplanter oder ungeplanter Ereignisse nicht beeinträchtigt. Wenn jedoch die redundanten Komponenten oder Verteilungspfade zu Wartungszwecken abgeschaltet werden, besteht für die Umgebung bei einem Ausfall ein höheres Risiko einer Unterbrechung.
Tier-IV-Einrichtungen ergänzen die Tier-III-Topologie um Fehlertoleranz. Fällt ein Gerät aus oder kommt es zu einer Unterbrechung im Verteilungspfad, wird der IT-Betrieb nicht beeinträchtigt. Die gesamte IT-Ausrüstung muss über ein fehlertolerantes Stromversorgungskonzept verfügen, um kompatibel zu sein. Tier-IV-Rechenzentren erfordern auch eine kontinuierliche Kühlung, um die Umgebung stabil zu halten.
Was sind "fehlertolerante Systeme"?
Fehlertolerante Systeme verwenden fortschrittliche Softwarelösungen, um auf eine Vielzahl potenzieller Fehlerquellen angemessen reagieren zu können. Ein wesentlicher Vorteil fehlertoleranter Systeme ist ihre Fähigkeit, Single Points of Failure (SPOF) zu eliminieren. Ein SPOF ist eine einzelne Komponente, deren Ausfall das gesamte System zum Stillstand bringen kann; es kann sich dabei sogar um einen Netzwerk-Switch handeln, dessen Ausfall den Dienst des gesamten Netzwerks beeinträchtigt.
Um das Risiko von SPOFs zu minimieren, setzen fehlertolerante Systeme auf Redundanz und automatisches Failover. Dies bedeutet, dass kritische Hardware- und Netzwerkkomponenten einschließlich Router und Switches, mehrfach vorhanden sind, um im Fehlerfall nahtlos die Funktion der ausgefallenen Komponente zu übernehmen. Für Umgebungen mit extrem hohen Verfügbarkeitsanforderungen ist es sogar möglich, die gesamte Computerhardware in einem Standby-System zu duplizieren.
Neben der technischen Infrastruktur sind jedoch auch die organisatorischen Rahmenbedingungen entscheidend für die Aufrechterhaltung einer hohen Verfügbarkeit. Zu den notwendigen organisatorischen Maßnahmen zählen:
- Die Bereitstellung von geschultem Wartungspersonal
- Die Bevorratung von Ersatzteilen
- Abschluss von Wartungsverträgen
- Klare Anweisungen für das Vorgehen im Störfall
- Effektive Kommunikationswege
- Lückenlose Protokollierung von Ereignissen
Zur Unterstützung dieser organisatorischen Anforderungen sind bestimmte Normen und Leitfäden von Bedeutung, insbesondere die ISO/IEC 27001, die ein Rahmenwerk für Informationssicherheits-Managementsysteme (ISMS) bietet und die ISO/IEC 20000 für IT-Service-Management (ITSM). Ergänzt werden diese durch die ISO/IEC 27002 für Best Practices im Bereich ISMS und die IT Infrastructure Library (ITIL) für ITSM. Diese Standards und Richtlinien bieten umfassende Anleitungen und Best Practices, um die organisatorische und technische Basis für hochverfügbare Systeme in einer Colocation-Umgebung zu schaffen.