Tragic hetzner fault drives to data lose
Μία λάθος αλλαγή δίσκου από τους τεχνικούς της hetzner οδήγησε σε απώλεια δεδομένων στο διακομιστή hades.
Ο διακομιστής Hades φιλοξενείται στο data center της hetzner στη Γερμανία και έχει 2 δίσκους σε RAID1. Ένας από τους δύο δίσκους (ο δεύτερος) χάλασε και έγινε αναγκαστική αντικατάστασή του. Δυστυχώς όμως οι τεχνικοί της hetzner έκαναν το λάθος να αλλάξουν την σειρά των δίσκων βάζοντας τον καλό δίσκο (α) στην θέση του χαλασμένου (β) και τον καινούργιο στη θέση του παλιού καλού (α) αντί να τον βάλουν δεύτερο (κούμπωσαν ανάποδα τα φυσάκια). Έτσι όταν έγινε αντιγραφή των partition από τον πρώτο δίσκο στον δεύτερο αντιγράφηκε το τίποτα στον καλό δίσκο με αποτέλεσμα να καταστραφεί το partition table του καλού δίσκου.
Αυτό το τραγικό λάθος της hetzner είναι μη-αναστρέψιμο και δυστυχώς τα δεδομένα που υπήρχαν στον διακομιστή δεν μπορεί να προσπελαστούν. Η hetzner είναι υπόλογη για αυτό. Κάνουμε κάποιες τελευταίες απέλπιδες προσπάθειες μήπως μπορέσουμε να ανακτήσουμε το partition table από τον κατεστραμένο δεύτερο δίσκο. Νεότερα αργότερα.
Η απόδειξη του λάθους της hetzner
Πριν την αλλαγή του δίσκου από τους τεχνικούς της hetzner o δίσκος με σειριακό αριθμό S13UJ1NQ800756 ήταν πρώτος (sda).
hades:/ # hdparm -i /dev/sda
/dev/sda:
Model=SAMSUNG HD753LJ, FwRev=1AA01113, SerialNo=S13UJ1NQ800756
Μετά την αλλαγή ο πρώτος δίσκος κουμπώθηκε λανθασμένα στην δεύτερη θέση και αντιγράφηκε το partition του καινούργιο δίσκου (το τίποτα δηλαδή) στον καλό δίσκο με αποτέλεσμα να καταστραφεί.
root@rescue ~ # hdparm -i /dev/sda
/dev/sda:
Model=SAMSUNG HD753LJ, FwRev=1AA01113, SerialNo=S13UJ1CQB02960
root@rescue ~ # hdparm -i /dev/sdb
/dev/sdb:
Model=SAMSUNG HD753LJ, FwRev=1AA01113, SerialNo=S13UJ1NQ800756