- Technischer Leiter
- Author
Wenn Unternehmen eine fehlertolerante Serverinfrastruktur aufbauen möchten, kommen sie ohne RAID-Arrays nicht aus. Die Verwendung einer einzigen Festplatte als Speichergerät ist nicht sicher, da jede andere Maschine mitten in der Arbeit und zum ungünstigsten Zeitpunkt ausfallen kann. Was sollten Unternehmen tun, wenn sie alle Daten verlieren? „Backup“, werden Sie vielleicht sagen, und Sie haben Recht, doch das Wiederherstellen verlorener Daten aus dem Backup ist ein langwieriger Prozess. Deshalb wurden RAID-Arrays entwickelt, damit die Daten jederzeit verfügbar bleiben.
Zunächst müssen wir definieren, was ein RAID ist. Kurz gesagt ist RAID ein „Redundant Array of Independent Disks“, also ein Array aus einzelnen Festplatten, die so angeordnet sind, dass durch das Verschachteln und Speichern von Daten redundante Daten auf einer physisch anderen Festplatte entstehen.
Im Falle eines physischen Festplattenausfalls sind die Daten bei einem ordnungsgemäß konfigurierten Array sicher. RAID kann Sie nicht vor Virenangriffen schützen, es sorgt lediglich dafür, dass Ihre Speicherhardware und die darauf befindlichen Daten länger erhalten bleiben. Es schützt die Daten vor mechanischen Schäden, während eine Datensicherung Ihre Daten auf programmierbare Weise sichern kann. Es ist immer besser, von Anfang an in mehr Festplatten zu investieren, als ein einziges Speicherarray zu nutzen, bei dem im Falle eines Ausfalls ein hohes Risiko besteht, dass alle Daten unwiederbringlich verloren gehen
In den 30 Jahren seit der Einführung von RAID haben Unternehmen Ingenieure damit beauftragt, bestimmte Arten der Fehlertoleranz zu entwickeln, was zu verschiedenen RAID-Typen führte, die für bestimmte Aufgaben ausgelegt sind.
Ein RAID-0-Array ist eigentlich kein echtes RAID, da es keine redundanten Informationen enthält und daher keinen Schutz für die gespeicherten Daten bietet (ein Ausfall eines Mitglieds bedeutet Datenverlust). Die einzelnen Geräte werden lediglich zu einem logischen Ganzen zusammengefasst, wodurch eine Kapazität in Höhe der Summe aller Mitglieder entsteht. Die Verbindung kann auf zwei Arten realisiert werden: als Verkettung (d. h. linear) und durch Striping:
Bei der Verkettung werden Daten sequenziell auf mehreren Festplatten gespeichert. Wenn die erste voll ist, werden die Daten auf der zweiten gespeichert, dann auf der dritten und so weiter. Der Vorteil besteht darin, dass die Kapazität durch Hinzufügen eines weiteren Mitglieds leicht erhöht werden kann und dass einige Dateien von einem Ausfall eines Mitglieds unberührt bleiben können.
Beim Interleaving werden die Daten zyklisch auf den Festplatten gespeichert (abwechselnd, siehe Abbildung rechts). Der Speicherplatz wird in Blöcke fester Größe unterteilt, sodass das Schreiben oder Lesen eines längeren Datenabschnitts von mehreren Festplatten erfolgt. Im Falle eines Festplattenausfalls ist es unwahrscheinlich, dass eine Datei unbeschädigt bleibt. Interleaving kann das Lesen und Schreiben größerer Datenblöcke beschleunigen, da es möglich ist, gleichzeitig einen Block von einer Festplatte und den nächsten Block von einer anderen Festplatte zu lesen (bzw. zu schreiben). Theoretisch sollte die Lesegeschwindigkeit geringer sein als bei RAID 1, doch in der Praxis sind Lese- und Schreibvorgänge bei RAID 0 deutlich schneller als bei RAID 1. Die Leistungssteigerung bei sequenziellen Lesevorgängen liegt in einer Heimanwendung in der Regel bei etwa 50 % (d. h. bei Verwendung von zwei Festplatten mit 100 MB/s sequenzieller Lesegeschwindigkeit erreicht das Festplattenarray (typischerweise) eine Lesegeschwindigkeit von etwa 150 MB/s). Natürlich bedeutet eine Steigerung um 50 % nicht die Hälfte der Leistung, da RAID 0 die Zugriffszeiten nicht verlängert.
Grundsätzlich gilt: 1 TB + 1 TB = 2 TB plus verbesserte Lese-/Schreibgeschwindigkeit. Fällt eine Festplatte aus, fällt alles aus.
Die einfachste, aber durchaus effektive Datensicherung. Es wird eine Spiegelung durchgeführt. Der Inhalt wird gleichzeitig auf zwei Festplatten gespeichert. Bei Ausfall einer Festplatte steht sofort eine Kopie zur Verfügung. Eine ähnliche Technik lässt sich eine Ebene höher anwenden, wobei zwei separate Controller zum Einsatz kommen. Diese Technik wird als Duplexing bezeichnet und ist zudem robust gegenüber Controller-Ausfällen. Theoretisch kann sie die Lesegeschwindigkeit deutlich erhöhen und die Reaktionszeit leicht verkürzen, dies hängt jedoch vom jeweiligen Controller ab (Software-Controller nutzen die Möglichkeit, von beiden Festplatten zu lesen, in der Regel gar nicht). Das Schreiben kann langsamer sein, da dieselben Daten auf zwei Festplatten gespeichert werden. Die Technik verbessert die Datensicherheit gegen Verluste aufgrund von Hardwareausfällen erheblich. Der Nachteil ist der doppelte Platzbedarf auf den Festplatten.
Ist eine Kombination aus RAID 0 und RAID 1. Wir speichern Daten verschachtelt (Striping) auf zwei Festplatten (A, B) und verfahren dann ebenso mit den anderen beiden Festplatten (C, D). Dadurch erhalten wir zwei logische Festplatten AB und CD, die redundante Inhalte aufweisen. (Wenn wir eine Datei haben, die beim Striping in zwei Hälften geteilt wird, befindet sich der erste Teil der Datei auf den Festplatten A und C, der zweite auf den Festplatten B und D.) Der Vorteil dieser Methode besteht darin, dass wir nicht nur die Lese- und Schreiblast auf mehrere Festplatten verteilen, sondern die Daten auch redundant speichern, sodass sie nach einem Fehler leicht wiederhergestellt werden können. Zu den Nachteilen gehört, dass nur 50 % der gesamten Festplattenkapazität genutzt werden und die Datenredundanz verloren geht, wenn eine der vier Festplatten ausfällt.
ist wiederum eine Kombination aus RAID 0 und RAID 1, jedoch in umgekehrter Reihenfolge. Zunächst speichern wir dieselben Daten auf den Festplatten A und B, dann auf den Festplatten C und D. So erhalten wir zwei logische Festplatten AB und CD, auf denen die Daten gestreift gespeichert sind. (Wenn wir eine Datei haben, die beim Striping in zwei Hälften geteilt wird, befindet sich der erste Teil der Datei auf den Festplatten A und B, der zweite Teil auf den Festplatten C und D, im Gegensatz zu RAID 0+1.) Die Vorteile ähneln denen von RAID 0+1, zudem ist RAID 1+0 widerstandsfähiger gegenüber dem Ausfall mehrerer Festplatten und die Datenwiederherstellung nach einem Ausfall erfolgt wesentlich schneller. Der Nachteil besteht wiederum darin, dass nur 50 % der Kapazität genutzt werden.
RAID 5 erfordert mindestens 3 Festplatten, wobei die Kapazität einer Festplatte von selbstkorrigierenden Codes belegt wird, die abwechselnd auf den Festplatten gespeichert werden. Der Vorteil besteht darin, dass paralleler Datenzugriff genutzt werden kann, da ein längerer Datenabschnitt über mehrere Festplatten verteilt ist, wodurch die Lesegeschwindigkeit deutlich höher ist. Der Nachteil ist eine langsamere Schreibgeschwindigkeit (da die Berechnung des selbstkorrigierenden Codes erforderlich ist). Es ist widerstandsfähig gegen den Ausfall einer einzelnen Festplatte.
Es unterscheidet sich von RAID 0+1 dadurch, dass die Daten zunächst in den Festplatten-Arrays gespiegelt werden, bevor sie in ein weiteres RAID 0-Festplatten-Array eingefügt werden, um schnellere Übertragungsraten zu erzielen. Die maximale Anzahl an Festplatten, die ohne Folgen ausfallen können, beträgt eine pro Array. Dieser Typ wird häufig für stark ausgelastete Datenbankanwendungen verwendet. Dies liegt daran, dass keine Paritätsdaten berechnet werden müssen, was den gesamten Vorgang beschleunigt (oder kostengünstiger macht).
Es handelt sich um ein RAID, das das Betriebssystem selbst erstellt, einbindet und das gesamte RAID auf einer Reihe physischer Festplatten verwaltet. Das Betriebssystem selbst markiert die im RAID zu verwendenden Partitionen, erstellt dann das virtuelle Gerät und ermöglicht die Arbeit mit diesem Speicherplatz.
Der Nachteil dieses Systems ist die Bindung von Serverressourcen für alle Aufgaben im Zusammenhang mit dem RAID, andererseits hat es den Vorteil, ein zuverlässiges System zu sein, fast so zuverlässig wie ein Hardware-RAID. Was das vorliegende Thema betrifft, so arbeiten die allermeisten Hersteller wie Synology, QNAP, Thecus usw. in der Regel mit dieser Art von System für den SOHO- und SMB-Bereich (insbesondere unter Linux); wenn Ihr NAS also beispielsweise wichtige Dateiübertragungen durchführt, verlangsamen sich die anderen Prozesse, da die CPU-Auslastung erheblich zunimmt.
Dies ist das RAID, das in Hochleistungsservern zu finden ist. Es handelt sich um Systeme, die mithilfe von Controllern oder Karten aufgebaut sind, die speziell für die eigenständige Verwaltung des RAIDs ausgelegt sind und über eigene Prozessoren und Speicher verfügen, wodurch die CPU des Systems, das als Datenserver fungiert, entlastet wird. Ein Hardware-RAID ist für SATA-, SAS- oder SCSI-Festplatten erhältlich, wobei letztere immer seltener zum Einsatz kommen.
Logischerweise ist diese Implementierung die zuverlässigste, schnellste und daher deutlich teurere Variante, sodass Sie mit ziemlicher Sicherheit davon ausgehen können, dass das RAID, das Sie auf Ihrem Computer oder NAS eingerichtet haben, nicht mit diesem System arbeitet, da hier Kosten in Höhe von mehreren tausend Euro anfallen.
In den Betriebsmodi RAID 0, 1 und 10 bietet diese Art von RAID keine großen Vorteile gegenüber anderen Systemen, da die Karten keine wesentlichen Entlastungsaufgaben für das System übernehmen.
Start for free and unlock high-performance infrastructure with instant setup.
Your opinion helps us build a better service.