Es wird geschätzt, dass über 90 % aller neuen Informationen, die weltweit produziert werden, auf magnetischen Medien gespeichert werden, die meisten davon auf Festplattenlaufwerken. Trotz ihrer Bedeutung gibt es relativ wenige veröffentlichte Arbeiten zu den Ausfallmustern von Festplattenlaufwerken und den Schlüsselfaktoren, die ihre Lebensdauer beeinflussen. Die meisten verfügbaren Daten basieren entweder auf der Extrapolation aus beschleunigten Alterungsexperimenten oder aus relativ bescheidenen Feldstudien.
Darüber hinaus verfügen größere Bevölkerungsstudien selten über die Infrastruktur, um Gesundheitssignale von in Betrieb befindlichen Komponenten zu sammeln, was entscheidende Informationen für eine detaillierte Fehleranalyse sind.
Laut einer von der Carnegie Mellon University durchgeführten Studie mit etwa 100.000 Laufwerken ersetzen Kunden Festplattenlaufwerke zu Raten, die weit höher sind als die von Laufwerksherstellern bereitgestellte MTBF (Mean Time Between Failure).
Festplattenausfall
Eine Carnegie-Mellon-Studie untersuchte große Produktionssysteme, darunter Hochleistungsrechnerstandorte und Internetdienststandorte mit SCSI-, FC- und SATA-Laufwerken. Die Datenblätter für diese Laufwerke listeten MTBF zwischen 1 Million und 1,5 Millionen Stunden auf, was laut Studie jährliche Ausfallraten „von höchstens 0,88 %“ bedeuten sollte. Die Studie zeigte jedoch typische jährliche Austauschraten zwischen 2 % und 4 %, „und bis zu 13 %, die bei einigen Systemen beobachtet wurden“.
Was bedeutet das also für Sie, den Verbraucher, der Festplatten und Computer mit Festplatten kauft?
Ich habe über 25 Jahre Erfahrung in den Bereichen Technik, Fertigung und Softwareentwicklung, also lassen Sie uns zunächst einen wichtigen Aspekt typischer Herstellungsprozesse von Autos und Flugzeugen bis hin zu Festplatten und Smartphones untersuchen. Der typische Hersteller eines Endprodukts produziert tatsächlich einige der Komponenten, aus denen das Endprodukt besteht. Tatsächlich lagern sie die Herstellung und oft auch das Design fast aller Unterkomponenten aus und geben dem Lieferanten eine Aufsicht, die von gar keinen bis hin zu umfangreichen Spezifikationen, Tests und Aufsicht reicht. Der für die Lieferung der Komponente ausgewählte Lieferant ist oft der günstigste Anbieter, während einige Hersteller den besten Lieferanten auf der Grundlage des Wertes wählen, der eine Kombination aus Preis, Qualität und Zuverlässigkeit ist.
Dieses System des Outsourcings wird oft als abgestufte Lieferantenbasis bezeichnet. Ein Tier-1-Lieferant liefert direkt an den Hersteller des Endprodukts. Die Lieferanten des Tier-1-Lieferanten sind Tier-2-Lieferanten, und so geht es in der Lebensmittelkette weiter. Technisch gesehen handelt es sich bei einem Festplattenhersteller tatsächlich um einen Tier-One-Lieferanten für den Computerhersteller. Dieses System erklärt, warum, als die Regierung der Vereinigten Staaten darüber rang, ob sie die US-Automobilhersteller retten sollten, Leute mit den Worten zitiert wurden, wenn ihnen erlaubt würde, unterzugehen, würden Hunderttausende von Menschen ihre Jobs verlieren. Sie bezog sich auf die Mitarbeiter aller Tier-Lieferanten.
In einem solchen System ist die Qualität des Endprodukts nur so gut wie das schwächste Glied in der Lieferkette. Die meisten Lieferanten verwenden sehr komplexe und strenge Qualitätskontroll- und Designmethoden, um die Qualität ihrer Produkte sicherzustellen, aber am Ende läuft es immer noch auf die Möglichkeit menschlicher Fehler hinaus. Selbst die ausgeklügeltste, rund um die Uhr computergesteuerte und robotisierte Produktionsanlage der Welt ist menschlichen Fehlern ausgesetzt. Die Person, die den Roboter programmiert, konzentriert sich möglicherweise nicht auf die Aufgabe, die dazu führt, dass der Roboter bei jeder 100. Operation einen Mikrochip einen Bruchteil eines Mikrometers vom Ziel entfernt platziert, was dazu führt, dass Ihre Festplatte Probleme hat, wenn der identische Computer Ihres Kollegen einwandfrei funktioniert.
Solche Frühausfälle sind keine Seltenheit. Es ist das, was alle Garantien als „Herstellungsfehler“ bezeichnen. Der brancheninterne Begriff lautet Infant Mortality Failure (IMF). Garantien sind zeitlich begrenzt, da sie Sie vor IMFs schützen sollen. Tatsächlich gibt es verschiedene Ebenen von IWFs. Die meisten elektronischen Geräte durchlaufen eine Art Test, der oft als Burn-In bezeichnet wird. Dies testet auf einen sofortigen Ausfall oder einen Ausfall in den ersten paar Minuten. Diese werden durch grobe Herstellungsfehler verursacht, die fast sofort zu einem katastrophalen Ausfall führen.
Die lästigeren IMFs sind diejenigen, die es bis zu Ihnen, dem Verbraucher, schaffen, für eine kurze Zeit fehlerfrei funktionieren und dann bam, es ist tot. Die Hersteller hassen diese Fehler, weil jetzt Ihre Meinung über den Hersteller getrübt ist. Sie haben nie von den Fehlern während des Burn-Ins gewusst und waren froh, nichts davon zu wissen, aber als Ihre Festplatte in der Nacht vor einer kritischen Frist den Geist aufgibt, geraten Sie in Panik und fordern von der Welt eine Entschädigung. Die Kosten dieses Ausfalls sind langfristig und höher als die Kosten für eine neue Festplatte. Es kann zu einem verlorenen Kunden für immer führen. Aus diesem Grund werde ich nie wieder einen HP-Computer besitzen, auch wenn es großartige Computer sind. Ich habe einen schlechten bekommen und es hat mich für immer gegen HP getrübt.
Verwandt: Festplatte hat sich selbst gelöscht! Was kann ich tun?
Was können Sie also tun, um sich zu schützen?
Ich persönlich recherchiere immer viel, bevor ich eine neue Elektronik kaufe. IMF kann ein anhaltendes Problem bei einem Hersteller oder Modell sein, bis die Grundursache des Problems gefunden und behoben ist. Es könnte sogar ein Konstruktionsfehler und kein Herstellungsproblem sein. Ich habe kürzlich einen neuen Großbild-HD-Fernseher gekauft und dachte, ich wollte den Panasonic 3D-Plasma der Spitzenklasse, bis ich durch das Lesen von Bewertungen aus mehreren Quellen erfuhr, dass die 2010er-Modelle einen frühen (innerhalb von 3 Monaten) Verlust der Schwarzwerte erfahren und nicht genug Es waren Informationen verfügbar, um festzustellen, ob es in den Modellen von 2011 behoben wurde. Also kaufte ich meine zweite Wahl.
Die andere offensichtlichere Sache, die Sie speziell mit einer Computerfestplatte tun können, ist, Ihre Daten zu sichern oder Ihr gesamtes System abzubilden. Ich persönlich verwende ein Produkt namens Acronis True Image. Ich erstelle ein Backup-Image meines gesamten Systems und erstelle dann jede Nacht inkrementelle Backups. Ich habe es so eingestellt, dass es 10 vergangene Inkremente beibehält, damit ich immer auf eine frühere aktuelle Version zurücksetzen kann. Ich sichere dies auf einer dedizierten externen 1-TB-Festplatte. Was ist, wenn diese Festplatte ausfällt, sagen Sie? Nun, die Wahrscheinlichkeit, dass Ihre Computerfestplatte und Ihre externe Festplatte gleichzeitig ausfallen, ist gering, aber ich besitze mein eigenes Unternehmen, also habe ich eine redundante externe Festplatte, auf der ich redundante Backups mache, nur um sicher zu gehen.
Ich würde Ihnen auch empfehlen, einen hochwertigen Überspannungsschutz zu kaufen, nicht die Art, die Sie bei Walmart neben den Verlängerungskabeln bekommen, sondern ein hochwertiges Gerät von einem Einzelhändler wie Best Buy oder einem anderen Computerzubehörhändler. ICH VERWENDE ein Belkin-Gerät, das etwa 40 USD kostet.
Aktivieren Sie dies, wenn Sie Freeware benötigen, um die Festplatte auf potenzielle Fehler zu überwachen.
Der Autor dieses Gastbeitrags, Randy L. Miller, ist CEO von Alagad Incorporated.