Proxmox läuft über längere Zeit stabil, bei höheren Netzwerk-Lasten ist die VM plötzlich nicht mehr erreichbar. Im Logging (dmesg-Ausgabe) wird sporadisch die Fehlermeldung “Detected Hardware Unit Hang” ausgegeben.
Nach einem Neustart des Hardware-Servers funktioniert erstmal wieder alles.
Lösung
Es handelt sich um ein spezifisches Problem mit den Intel e1000-Netzwerkkarten. Betroffen ist hier die Offloading-Funktionen der Netzwerkkarte. Diese muss deaktiviert werden.
Dazu müssen einige Parameter in der Netzwerkkarte gesetzt werden. Das erledigt man direkt aus der Kommandozeile mit ethtool. ethtool wird in Proxmox nicht standardmäßig installiert, muss also per apt vorher installiert werden.
apt update ; apt install ethtool
Dannach können die Parameter mit ethtool gesetzt werden. Im Beispiel für das Interface eno1:
ethtool -K eno1 gso off gro off tso off tx off rx off rxvlan off txvlan off sg off
Um das ganze beim Start automatisch auszuführen, entweder in einer Bash-Datei oder gleich in einem Service.
[Service]
Type=oneshot
# Ofloading-Funktion deaktivieren
ExecStart=/sbin/ethtool -K Kartenname gso off gro off tso off tx off rx off rxvlan off txvlan off sg off
RemainAfterExit=true
(nicht vergessen, Kartenname durch die tatsächliche Bezeichnung zu ersetzen.)