Beim Löschen einiger Dateien ist es passiert: “rm: Cannot delete file foo. File system is read-only.” Warum ist mein Root-Filesystem plötzlich read-only? Das kann nur einen Grund haben: Es gibt Probleme damit und bevor diese zu wirklich großen Problemen werden, wird das Filesystem halt read-only remountet. Man kann dann in aller Ruhe mal fsck laufen lassen, die Fehler beheben, das Filesystem wieder read-write mounten und alles ist wieder gut. Soweit die Theorie.
Die Praxis sieht anders aus. fsck spuckt einige tausend Fehler aus, wirft einem diverse “SEVERE DATA LOSS POSSIBLE” und anderes Zeug an den Kopf, was nicht grade vertrauenserweckend klingt. Anschließend soll man das System dann mal rebooten. Gesagt, getan. Das System bootet zwar noch, bleibt aber irgendwo im Bootprozess stehen, weil das Root-Filesystem immer noch (schon wieder?) read-only ist und manche Init-Scripte darüber stolpern. Warum? Es scheint keine /etc/fstab zu geben. Also gut, ab in den Single User Mode. “Give Root Password for maintenance” *tippsel* “Access denied” – Also scheint doch noch ein wenig mehr kaputt zu sein… sehr schön.
Nach einigem Suchen finde ich dann auch die (leider nicht ganz aktuelle) Knoppix-CD und starte davon. Leider erkennt die kein Software-RAID (tun aktuelle Knoppixe das?), aber zumindest lesend kann ich auf die Platten zugreifen. Ein Blick darauf zeigt dann das volle Ausmaß des Grauens: /lost+found ist ca. 620 KiB groß, enthält aber weder die fehlende /etc/fstab, noch die fehlende /etc/modules, noch einige andere Dateien, die ich vermisse. Dafür sind aber diverse Dateien aus /etc/logrotate.d, meine /etc/ssh/sshd_config, diverse Timezone-Definitionen und einige ELF-Binaries drin. Das Ausmaß des Schadens scheint also immens zu sein – Dateien quer durchs System sind betroffen.
Immerhin hat Knoppix viel Kram an Bord, den man im alltäglichen Leben braucht und ich habe es erstmal dazu gebracht, ein wenig zu routen, damit mich mein Nachbar nachher nicht erschlägt, weil sein Netz nicht mehr geht (er teilt sich einen DSL-Anschluss mit mir und mein Rechner ist nunmal das Gateway…). Irgendwann im Laufe des Tages muss ich dann meinen WRT54G klarmachen und erstmal übergangsweise ans Netz klemmen.
Und dann mal sehen, ob das System noch zu retten ist, oder ob ich es am besten gleich komplett platt machen und neu aufsetzen soll. Nein, ein Backup habe ich selbstverständlich nicht…
also aus solchen gründen habe ich fast immer eine grml (http://grml.org/) bei mir liegen, die macht lvm2, software-raid und lauter ähnliches gedöns mit. und sie startet standardmäßig ein screen :D
nur mit der zsh konnte ich mich bis jetzt noch nicht anfreunden…
Solche Probleme vermeide ich recht zuverlaessig ueber ein RootFS das im normalen Betrieb RO ist und nur zur Softwareinstallation kurz RW remountet wird…