Server: Filer M Giga 2011
Problem: Server läuft einige Stunden, wird aktiv genutzt (rsync von mehreren 100GB auf den Server, Download des Geocities-Torrents (650GB), teilweise konstant >20MB/s Traffic), friert dann vollständig ein (kein Netzwerk und keine ping-Replies mehr, keine neuen Einträge in den Logs) und muss über das Kundencenter resettet werden (Softreset).
Reproduzierbar: Durch intensive Nutzung, Laden größerer Datenmengen in den Cache. Passiert unabhängig davon, welche Partition gerade stark belastet wird, ebenfalls unabhängig davon, ob rtorrent läuft.
Setup: Relativ frisch installiertes Debian Squeeze, Upgrade von der Lenny-Standardinstallation. Die Rootpartition nimmt ~70GB auf sda1 ein, auf /dev/sd{a,b,c,d} befindet sich ein RAID5 (xfs, 5.3T).
Die Logs deuten darauf hin, dass die Abstürze mit Arbeitsspeichermangel beim Caching zusammenhängen, ob eine swap-Partition gemountet ist oder nicht, spielt aber keine Rolle. Anbei kern.log eines Durchlaufs, messages und syslog zeigen großteils das Gleiche. Überhitzung ist wahrscheinlich nicht das Problem (mit sensors(1) gemessen).