CRC Fehler - Proxmox- oder Hardware-Defekt?

Bitte loggen sie sich ein oder registrieren sie sich.

Einloggen mit Benutzername, Passwort und Sitzungslänge
Erweiterte Suche  

Autor Thema: CRC Fehler - Proxmox- oder Hardware-Defekt?  (Gelesen 2661 mal)

0 Mitglieder und 1 Gast betrachten dieses Thema.

Hadraniel

  • Grünschnabel
  • *
  • Offline Offline
  • Geschlecht: Männlich
  • Beiträge: 8
CRC Fehler - Proxmox- oder Hardware-Defekt?
« am: 09.Mai 2012, 12:33:19 »

Hallo,

ich nutze seit einem halben Jahr einen Rootserver Misurfi XLD AMD 2012 v5.1.
Dieser schmiert mir alle 2-8 Wochen ohne erkennbaren Grund ab, soll heissen, er ist plötzlich nicht mehr erreichbar und per soft(!)reset wieder zum Leben zu erwecken. Das alleine hat mich bisher von der vollständigen Migration von einem >4J alten, rock-solid Server bei der Konkurrenz abhalten lassen.

Nun stelle ich fest, daß ich bei einem recht einfachen unrar-test auf 8GB Daten á 200MB Chunks nicht reproduzierbare Fehler erhalte. Je nach Durchlauf sind alle Dateien ok, mal aber eine oder auch mehrere Archive defekt. Das gleiche Verhalten ist mit md5/shasum auf viele große Dateien festzustellen: ab und zu ist eine Datei defekt, im nächsten Durchlauf dann wieder ok. Das gleiche mit rsync lokal oder auch remote ...

kurzum: bitfehler bei der I/O? Das erweckt jetzt natürlich nicht gerade Vertrauen.


Ich nutze auf dem Misurfi erstmals Proxmox, genauer das aktuelle proxmox 2, pve-kernel-2.6.32-11-pve
Zitat
andy@proxmox:~$ uname -a
Linux proxmox 2.6.32-11-pve #1 SMP Wed Apr 11 07:17:05 CEST 2012 x86_64 GNU/Linux
auf einem stinknormalen Debian 6 minimal.

Die OpenVZ-Hosts, wo ich die Fehler reproduzieren kann, laufen von ext3 auf luks-crypt auf LVM2 auf RAID1.

Das sind jetzt natürlich viele mögliche Fehlerquellen, wobei ich davon ausgehen würde, daß bei einem debian stable so Sachen wie ext3, LUKS, LVM und mdraid auch wirklich stabil sind. Am ehesten habe ich daher jetzt defekte Hardware oder aber Allergien zwischen dem proxmox-Kernel und der Mifi-Hardware in Verdacht.

Gibt es hier zufällig jemanden, der ein vergleichbares Setup auf einem Misurfi XLD AMD 2012 v5.1 fährt?
Vielleicht Erfahrungen oder eine Aussage vom Support dazu?

Grüße aus Bonn,
Andy
Gespeichert


timo

  • Gast
Re: CRC Fehler - Proxmox- oder Hardware-Defekt?
« Antwort #1 am: 09.Mai 2012, 13:41:27 »

Hallo,

nein, laut einer kurzen Recherche ist dies noch nicht bei dieser Hardware so vorgekommen.

Bitte direkt an den Support wenden, damit die Kollegen vor Ort dies genauer prüfen können.
Vorzugsweise eine entsprechende Ausfallzeit mit einplanen für die Prüfungen.

Gruß Timo,
Gespeichert

Hadraniel

  • Grünschnabel
  • *
  • Offline Offline
  • Geschlecht: Männlich
  • Beiträge: 8
Re: CRC Fehler - Proxmox- oder Hardware-Defekt?
« Antwort #2 am: 09.Mai 2012, 17:36:37 »

Vielen Dank, Mail an den Support ist raus.


Zwischenzeitlich sind ein paar der Dateien auch kaputt - die Kopien von eben diesen Dateien, auf meinen anderen Servern, sind hingegen intakt.
Das Problem tritt nur bei einem winzigen Bruchteil der Daten auf, aber es ist reproduzierbar. So etwas kenne ich nur von RAM-Fehlern (konnte ich seinerzeit mit memtest86 identifizieren) und - lang lang ists her - vom CMD640 IDE Chipsatz zu 486er-Zeiten .. der hat auch ab und zu mal bits gekippt.

Naja, schaunmermal...
Gespeichert
 

Seite erstellt in 0.1 Sekunden mit 18 Abfragen.