Hotspare versus Coldspare: Tipps für den RAID-Alltag - Starline Computer: Storage und Server Lösungen von erfahrenen Experten

Tipps für den RAID-Alltag

Hotspare versus Coldspare: So sparen Sie Zeit und Nerven

Vor- und Nachteile einer „heißen“ Ersatz-Festplatte im RAID

Warum wollen auf Sicherheit bedachte Administratoren keine Hotspare Platte im RAID, sondern doch lieber eine Platte als Coldspare sicher im Schrank verstaut wissen?

Was ist überhaupt Hotspare?

Als Hotspare (englisch für „heißes Ersatzteil“) nennen Experten eine integrierte Festplatte in einem RAID-System, die nicht Teil eines RAID-Sets beziehungsweise -Verbundes ist. Das Präfix „Hot“ steht jedoch davor, weil auch diese Festplatte – genauso wie die aktiven Platten – nach dem Einschalten des RAID-Systems mit Strom versorgt werden und deshalb auch dessen Spindelmotoren mitlaufen.  

Der Vorteil: Die Ersatzplatte kann bei einem Ausfall einer produktiven HDD augenblicklich einspringen und sofort mit dem Rebuild beginnen. Nicht wenige Admins lehnen dieses komfortable Feature allerdings ab. Wie kann das sein?

 

Ein Fallbeispiel aus der Praxis: Hotspare versus Coldspare

Angenommen wir haben ein RAID-System mit 16 Platten. 15 Platten davon hat der Administrator zu einem RAID 5 angelegt und die 16. Platte als Hotspare eingerichtet. Wenn jetzt ein Datenträger im RAID-Set ausfällt, springt erwartungsgemäß die Hotspare Platte unmittelbar ein und der Rebuild beginnt. 

Der Pferdefuß: Um einen Block auf der Spare-Platte wiederherstellen zu können, müssen alle entsprechenden Blöcke auf den verbliebenen 14 Platten des RAID-Sets gelesen werden, damit der RAID-Controller daraus wieder den Inhalt des defekten Laufwerks – also die Summe der wiederherzustellenden Blöcke – rekonstruieren kann. Das System muss also auch alle Blöcke auf den anderen Platten lesen.

Und hier liegt der Hase im Pfeffer: Im Normalbetrieb gibt es immer Bereiche auf Datenträgern, die schon lange nicht mehr gelesen wurden wie etwa abgespeicherte Rechnungen der vergangenen Jahre. Wenn sich aber genau in diesen Bereichen bereits nicht lesbare Blöcke eingeschlichen haben, sind Timeouts und mitunter auch weitere Laufwerksausfälle die Folge. 

Ein im Normalbetrieb unauffälliges System könnte also im Rebuild endgültig die Segel streichen. Das wiederum wäre der Supergau, da in einem RAID 5 kein zweites Laufwerk ausfallen darf – ansonsten droht Datenverlust.

 

Und wie machen es die sicherheitsbewussten Administratoren?

Sie legen sich eine Reserveplatte als Coldspare in den Schrank, um sie bei einem Plattenausfall sofort griffbereit zu haben. Bevor sie allerdings die ausgefallene HDD durch die Reserveplatte ersetzen, prüfen sie, ob von sämtlichen Daten auf dem RAID-Set ein Backup existiert. Falls nicht, sichern sie umgehend die fehlenden Daten. Da es sich in der Regel lediglich um die aktuellen Bestände handelt, bleibt die Wahrscheinlichkeit eines weiteren Plattenausfalls während des Backups unverändert. 


Erst nach dem Backup setzt der Admin die Reserveplatte ein, um den Rebuild zu starten. Sollte jetzt dasselbe Szenario eintreten wie beschrieben, gehen immerhin keine Daten verloren, da sie aus dem vorherigen Backup wiederhergestellt werden können.

Profi-Tipp

Aktiveren Sie – wenn verfügbar – bei RAID-Systemen grundsätzlich ein regelmäßiges Prüflesen. Der Controller checkt dann – beispielsweise in zweiwöchigen Abstand – sämtliche Blöcke auf allen Laufwerken im RAID-Set und verifiziert gleichzeitig deren Paritäts-Informationen. So erkennen Sie fehlerhafte Blöcke frühzeitig und können entsprechende Platten geplant austauschen. 

Dieses Prüflesen beziehungsweise Parity Check oder Scrubbing bieten folgende Produkte aus unserem Sortiment: RAID-Controller von Areca, ATTO und Broadcom/LSI, RAIDdeluxe-Systeme und Infortrend-Storages.

Fazit: Hotspare versus Coldspare

Den Hotspare-Komfort – also den automatisch gestarteten Rebuild bei Abwesenheit – erkauft sich der Admin mit einem höheren Risiko eines kompletten Datenverlustes. Die Wahrscheinlichkeit für einen Plattenausfall ist schließlich in Stresssituationen wie dem Rebuild deutlich größer als im Normalbetrieb. 

Diesen Umstand sollten Sie auch im alltäglichen Workflow berücksichtigen. Wir empfehlen daher grundsätzlich RAID 6 beziehungsweise RAID Z2 für einen stabil arbeitenden Laufwerksverbund.

KB
Konrad Beyer
Technik

Unser Technikchef verfügt über ein umfassendes Wissen in allen Storage- und Server-Themen.