Nur AOS - Was tun, wenn eine Home-Partition oder ein Home-Nutanix-Verzeichnis auf einer Controller-VM (CVM) voll ist?
Nur AOS - Was tun, wenn eine Home-Partition oder ein Home-Nutanix-Verzeichnis auf einer Controller-VM (CVM) voll ist?
Nur AOS - Was tun, wenn eine Home-Partition oder ein Home-Nutanix-Verzeichnis auf einer Controller-VM (CVM) voll ist?
Beschreibung
Wichtige Hinweise:
- Verwenden Sie dieses KB oder das Bereinigungsskript nicht, wenn die /home-Partition das Limit auf einer Prism Central VM (PCVM) überschreitet. Informationen zum PCVM-Problem finden Sie in KB 5228 .
- Melden Sie sich als Nutanix -Benutzer bei den CVMs an.
- Behandeln Sie die Nutanix CVM (Controller VM) nicht wie eine normale Linux-Maschine.
- Verwenden Sie rm -rf unter keinen Umständen, sofern nicht anders angegeben. Dies kann zu Datenverlust führen.
- Wenn Sie LCM-2.6 oder LCM-2.6.0.1 ausführen, füllt die LCM-Protokollsammlung das /home-Verzeichnis. Informationen zur Problemumgehung finden Sie in KB 14671 .
- Wenn Sie auf einem Cluster mit NCC 4.0.0 eine Warnmeldung bezüglich der hohen /home-Partitionsauslastung erhalten, prüfen Sie auch KB 10530 .
- Sie können die spezifischen Cluster, die von dieser Warnung betroffen sind, über die Entdeckungen im Support-Portal von Nutanix Insights hier überprüfen.
- Wenden Sie sich bei Zweifeln an den Nutanix-Support .
Eine volle CVM-Partition /home oder das Verzeichnis /home/nutanix kann in zwei Szenarien gemeldet werden:
- Der NCC-Integritätscheck „disk_usage_check“ meldet, dass die Nutzung der /home-Partition über dem Schwellenwert liegt (standardmäßig 75 %).
- Die Vorabprüfung test_nutanix_partition_space prüft, ob alle Knoten über mindestens 5,6 GB Speicherplatz im Verzeichnis /home/nutanix verfügen.
Die folgenden Fehlermeldungen werden in Prism durch die Prüfung test_nutanix_partition_space vor dem Upgrade generiert:
Nutanix reserviert auf der SSD-Ebene jedes CVM Speicherplatz für seine Dateien und Verzeichnisse. Diese Dateien und Verzeichnisse befinden sich im Ordner /home, den Sie sehen, wenn Sie sich bei einem CVM anmelden. Die Größe des Ordners /home ist auf 40 GB begrenzt, sodass der Großteil des Speicherplatzes auf der SSD für Benutzerdaten verfügbar ist.
Aufgrund der begrenzten Größe der /home -Partition kann es passieren, dass der freie Speicherplatz knapp wird und Prism-Warnungen, NCC Health Check-Fehler oder -Warnungen oder Pre-Upgrade Check-Fehler ausgelöst werden. Diese Schutzmaßnahmen verhindern, dass /home vollständig voll wird, da dies dazu führt, dass Datenverarbeitungsdienste wie Stargate nicht mehr reagieren. Cluster, in denen die /home -Partitionen mehrerer CVMs zu 100 % voll sind, führen häufig zu Ausfallzeiten der Benutzer-VMs.
Beim Bereinigen nicht verwendeter Binärdateien und alter Protokolle auf einem CVM ist zu beachten, dass alle Benutzerdatenpartitionen auf jedem Laufwerk, das einem bestimmten Knoten zugeordnet ist, auch in /home gemountet sind. Aus diesem Grund raten wir dringend davon ab, nicht dokumentierte Befehle wie rm -rf /home zu verwenden, da dadurch auch die in diesem Pfad gemounteten Benutzerdatenverzeichnisse gelöscht werden. Der Zweck dieses Artikels besteht darin, Sie durch die Identifizierung der Dateien zu führen, die dazu führen, dass der CVM nur wenig freien Speicherplatz hat, und nur diejenigen zu entfernen, die sicher gelöscht werden können.
Lösung
Hinweis: Die neuesten Versionen von AOS enthalten Verbesserungen und Fehlerbehebungen zur Optimierung der /home-Speicherplatznutzung. Um mögliche Probleme in der Zukunft zu vermeiden, ist es wichtig, dass Sie Ihr AOS regelmäßig aktualisieren.
Allgemeine Hinweise
- Überprüfen der Speicherplatznutzung in /home . Um ein mögliches AOS-Upgrade zu ermöglichen, sollte die Nutzung unter 70 % liegen. Verwenden Sie den Befehl df -h, um die Menge des freien Speicherplatzes in /home zu überprüfen. Im folgenden Beispiel beträgt die Nutzung von CVM xxx12 /home 81 %.
================== xxx11 =================
/dev/md2 40 G 22 G 18 G 55 % /home
=================== xxx12 =================
/dev/md2 40 G 32 G 7,4 G 81 % /home
================== xxx13 =================
/dev/md2 40 G 24 G 16 G 61 % /home
Um eine weitere Aufschlüsselung der Nutzung in absteigender Reihenfolge zu erhalten, verwenden Sie den Befehl du -h mit dem Flag -d, um die gewünschte Verzeichnisebene zu erhalten. Beispielsweise bedeutet -d 2 unten, dass in zwei Verzeichnisebenen von /home/nutanix/data gesucht wird. Wenn Sie zusätzlich head -n 15 hinzufügen, werden die 15 wichtigsten Verzeichnisse angezeigt, die dann mit anderen CVMs verglichen werden können, um zu sehen, woher die hohe Nutzung kommt:
================== xx.xx.xx.11 =================
17G /home/Nutanix/Daten
9,4 G /home/Nutanix/Daten/Protokolle
4.6G /home/nutanix/data/installer/el7.*
4,6 G /home/Nutanix/Data/Installer
2,5 G /home/Nutanix/Daten/Logs/Sysstats
512M /home/Nutanix/Data/NCC/Installer
================== xx.xx.xx.12 =================
18G /home/Nutanix/Daten
9,5 G /home/Nutanix/Daten/Protokolle
4.6G /home/nutanix/data/installer/el7.*
4,6 G /home/Nutanix/Data/Installer
3,0 G /home/Nutanix/Daten/Logs/Sysstats
610M /home/Nutanix/Daten/Logbay/Taskdata
.
.
- Informationen zur CVM-/Home-Partition können mit dem Befehl „logbay“ gesammelt werden (NCC 4.0.0 und höher, Nutanix KB 6691 ).
- Bereinigen unnötiger Dateien im /home -Verzeichnis.
Wenn Sie offene Fälle mit ausstehender Ursachenanalyse haben, klären Sie mit dem Fallbesitzer, ob diese Protokolldateien noch benötigt werden oder verworfen werden können.
Warnungen: Stellen Sie sicher, dass Sie die wichtigen Hinweise oben im Knowledge Base-Artikel (KB) zur Hand haben, bevor Sie Workarounds anwenden.
Methode 1: Genehmigtes Skript verwenden
Laden Sie KB-1540_clean_v12.sh herunter und führen Sie es aus, um Dateien aus genehmigten Verzeichnissen zu bereinigen.
Hinweis: Dieses Skript ist NICHT für die Verwendung auf Prism Central VM geeignet.
- Führen Sie von einem beliebigen CVM die folgenden Befehle aus, um KB-1540_clean_v12.sh herunterzuladen:
(MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ md5sum KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
- Stellen Sie das Skript auf einem lokalen CVM oder allen CVMs des Clusters bereit:
Wählen Sie das bereitzustellende Paket aus
1: Stellen Sie das Tool nur auf dem lokalen CVM bereit.
2: Stellen Sie das Tool auf allen CVMs im Cluster bereit
Auswahl (Abbrechen="c"): <==== 1 oder 2
- Führen Sie das Skript aus, um Dateien aus genehmigten Verzeichnissen zu löschen.
- Helfen
- Interaktiver Modus
- Nicht-interaktiver Modus
Hinweis: Wenn die Ausgabe des Skripts oder seine Farbgebung falsch erscheint, versuchen Sie, die Umgebungsvariable vor dem Ausführen des Skripts festzulegen, oder verwenden Sie die Option „--no_color“:
Interaktiver Modus
Hauptmenü
|
Menü „Planelement“
|
Nicht-interaktiver Modus
Befehle
|
Wenn ein Element in der Spalte „Vorgang“ als „Anweisung“ aufgeführt ist, können Sie die Anweisungen anzeigen, indem Sie das Element ausführen.
Zum Beispiel:
┌─────────────────────────────────────── ──────────────────┬───────────┬──────── ┐ │ Reinigungspläne: Betroffene Artikel │ Bedienung │ Nutzung │ ├─────────────────────────────────────── ──────────────────┼───────────┼──────── ┤ │ 5: Protokollbündel (Logbay) │entfernen │ 2,25 G│ │10: Heruntergeladenes Installationsprogramm │Anleitung│ 824.00M│ │59: Mögliche manuell erstellte Dateien │Anleitung│ 3.69G│ ├─────────────────────────────────────── ──────────────────┴───────────┼──────── ┤ │ Gesamt │ 6,74 G │ ╞═══════════════════════════════════════ ══════════════════════════════╧════════ ╡ │CVM xxxx │ │ /home-Nutzung = 30,99 G (80 %) >> Reinigung wird empfohlen │ └─────────────────────────────────────── ─────────────────────────────────────── ┘
Die Punkte 10 und 59 sind als „Anweisungen“ aufgeführt. Um die Anweisungen für Punkt 10 anzuzeigen, führen Sie ihn aus, indem Sie im Hauptmenü „10“ und auf dem nächsten Bildschirm „R“ eingeben. Beispielausgabe unten:
┌───────────────────────────────────────────────┬───────────┐ │ Reinigung Plan 10 │ Betrieb │ Nutzung │ ├─────────────────────────────────────── ──────────────────┼───────────┼──────── ┤ │10: Heruntergeladenes Installationsprogramm │Anleitung│ 824.00M│ └──────────────────────────────────────────────┴───────────┘ Plan 10-Menü (Beenden, Zurück, Hilfe, Neu scannen, Vorgang, Liste, Probelauf, Ausführen, Exportieren): R Vorgang für Plan 10 ausführen: „Anweisung“ Für Plan 10 ist ein manueller Vorgang erforderlich – Anweisung – Diese heruntergeladenen Installationsprogramme können aus „Software aktualisieren“ auf Prism gelöscht werden. In KB-1540 (http://portal.nutanix.com/kb/1540) finden Sie einen Abschnitt mit „/home/nutanix/software_downloads/“. Ältere Installationsdateien konnten weder auf Prism noch von ncli aufgelistet werden. Wenden Sie sich an den Nutanix-Support, wenn Sie Hilfe benötigen. ┌───────────────────────────────────────────────┬───────────┐ │ Reinigung Plan 10 │ Betrieb │ Nutzung │ ├─────────────────────────────────────── ──────────────────┼───────────┼──────── ┤ │10: Heruntergeladenes Installationsprogramm │Anleitung│ 824.00M│ └─────────────────────────────────────── ──────────────────┴───────────┴──────── ┘
Wiederholen Sie die obigen Schritte für Punkt 59, um die Anweisungen für Punkt 59 anzuzeigen.
- Aufräumen nach der Fehlerbehebung
Die heruntergeladenen Skriptdateien, Protokolle und exportierten Dateien sollten nach jeder Fehlerbehebung manuell entfernt werden. Die Gesamtgröße dieser Dateien sollte klein sein und das Dateisystem von CVM nicht beeinträchtigen. Sie können die folgenden Dateien entfernen, sobald das Skript nicht mehr benötigt wird.
<jjmmtt-hhmmss> ist das Erstellungsdatum und die Erstellungszeit.- Im CVM, in dem das KB-Skript bereitgestellt wird ( /home/nutanix/tmp/ ):
KB-1540_clean.sh – heruntergeladene Datei aus der KB
deploytool_yyyymmdd-hhmmss.log – Protokoll des Bereitstellungsskripts (nach der Bereitstellung nicht mehr erforderlich)
nutanix_home_clean.py – Haupt-KB-Skript
nutanix_home_clean_config.py – Konfigurationsdatei für das Hauptskript - In den restlichen CVMs im Cluster – falls in Schritt 2 auf allen CVMs bereitgestellt:
nutanix_home_clean.py – Haupt-KB-Skript
nutanix_home_clean_config.py – Konfigurationsdatei für das Hauptskript - Jedes CVM, auf dem nutanix_home_clean.py ausgeführt wird:
KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log – KB-Skriptprotokoll
KB-1540_v12_yyyymmdd_hhmmss_export_*.csv – exportierte Dateien (falls exportiert)
Mit dem folgenden Befehl können Sie alle oben genannten Elemente entfernen:
nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540* deploytool_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
- Im CVM, in dem das KB-Skript bereitgestellt wird ( /home/nutanix/tmp/ ):
Methode 2: Manuelle Methode
BITTE LESEN : Nur die Dateien in den unten angegebenen Verzeichnissen können sicher gelöscht werden. Beachten Sie die spezifischen Anweisungen zum Entfernen von Dateien aus den einzelnen Verzeichnissen. Verwenden Sie keine anderen Befehle oder Skripte zum Entfernen von Dateien. Verwenden Sie unter keinen Umständen rm -rf .
- Entfernen alter Protokolle und Kerndateien. Löschen Sie nur die Dateien in den folgenden Verzeichnissen und nicht die Verzeichnisse selbst .
- /home/Nutanix/Daten/Kerne/
- /home/Nutanix/Daten/Binärprotokolle/
- /home/nutanix/data/ncc/installer/
- /home/nutanix/daten/log_collector/
- /home/nutanix/prism/webapps/console/downloads/NCC-logs-*
Verwenden Sie die folgende Syntax zum Löschen von Dateien in jedem dieser Verzeichnisse:
- Entfernen alter ISOs und Software-Binärdateien. Löschen Sie nur die Dateien in den folgenden Verzeichnissen und nicht die Verzeichnisse selbst .
Überprüfen Sie die aktuell ausgeführte AOS-Version unter „Cluster-Version“:
Clustername: Axxxxa
Cluster-Version: 5.10.2
- /home/nutanix/software_uncompressed/ – Der Ordner „software_uncompressed“ wird nur verwendet, wenn das Pre-Upgrade ausgeführt wird, und sollte nach einem erfolgreichen Upgrade entfernt werden. Wenn Sie einen laufenden Cluster sehen, der derzeit nicht aktualisiert wird, können Sie bedenkenlos alles im Verzeichnis „software_uncompressed“ entfernen. Löschen Sie alle alten Versionen außer der Version, auf die Sie aktualisieren.
- /home/nutanix/foundation/isos/ – Alte ISOs von Hypervisoren oder Phoenix.
- /home/nutanix/foundation/tmp/ – Temporäre Dateien, die gelöscht werden können.
Verwenden Sie die folgende Syntax zum Löschen von Dateien in jedem dieser Verzeichnisse:nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/* nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
- /home/nutanix/software_downloads/
Wenn die Dateien im Verzeichnis software_downloads für geplante Upgrades nicht erforderlich sind, entfernen Sie sie aus der Prism-Webkonsole > Einstellungen > Software-Upgrade . Überprüfen Sie auch die Registerkarten Dateiserver , Hypervisor , NCC und Foundation , um die Downloads zu finden, die Sie möglicherweise nicht benötigen. Das folgende Beispiel zeigt zwei Versionen von AOS, die für ein Upgrade verfügbar sind. Jede davon verbraucht etwa 5 GB. Klicken Sie auf das „X“, um die Dateien zu löschen.
Wenn die Option „Automatischen Download aktivieren“ aktiviert ist, deaktivieren Sie sie. Ohne Überwachung lädt der Cluster mehrere Versionen herunter und verbraucht unnötig Speicherplatz im Home-Verzeichnis.
- Überprüfen Sie die Speicherplatznutzung in /home erneut mit df -h (siehe Allgemeine Hinweise in diesem Artikel), um sicherzustellen, dass sie jetzt unter 70 % liegt.
Hinweis: Wenn Sie die Dateien mit dem folgenden Fehler und nicht beanspruchtem Speicherplatz nicht löschen können, wenden Sie sich für Unterstützung an den Nutanix-Support .
==> Erkannte Systemdateien:
/home/nutanix/data/software_uncompressed/xxx
Vorgang nicht zulässig. Das Löschen von Systemdateien führt zu Clusterinstabilität und potenziellem Datenverlust.
Wichtige Hinweise für NC2-Cluster:
In einigen Instanzen von NC2-Clustern wurde beobachtet, dass /tmp fast voll ist. Sie können die folgenden Schritte ausführen, um das Verzeichnis ~/tmp zu bereinigen.
- Stellen Sie per SSH eine Verbindung zum betroffenen CVM her und überprüfen Sie die Festplattennutzung, indem Sie den Befehl „df -h“ ausführen:
nutanix@CVM:~$ df -h /tmp Verwendete Dateisystemgröße Verfügbare Nutzung% Eingebunden auf /dev/loop0 240M 236M 0 100 % /tmp
- In der obigen Ausgabe sehen wir, dass /tmp 100 % anzeigt. Ändern Sie das Verzeichnis in ~/tmp und sortieren Sie die Liste mit sudo du -aSxh /tmp/* | sort -h .
4,0 KB /tmp/hsperfdata_nutanix 12 KB /tmp/lost+found 23 KB /tmp/rc_nutanix_start.1731.log 39 KB /tmp/rc_nutanix_start.1734.log 78 MB /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 MB /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 MB /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
- Löschen Sie aus der oben erhaltenen Ausgabe manuell Dateien, die größer als 12 KB sind. Unten sehen Sie beispielsweise die aus der obigen Ausgabe gelöschten Dateien.
nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
- Nach dem Löschen können Sie den verfügbaren freien Speicherplatz mit df -h überprüfen:
nutanix@CVM:~/tmp$ df -h /tmp Verwendete Dateisystemgröße Verfügbare Nutzung% Eingebunden auf /dev/loop0 240 M 14 M 210 M 6 % /tmp
- Wie Sie sehen, beträgt der verfügbare freie Speicherplatz jetzt 6 %. Sie können dies mit folgendem Befehl noch einmal überprüfen:
nutanix@CVM:~$ ncc Integritätsprüfungen Hardwareprüfungen Festplattenprüfungen Festplattennutzungsprüfung --cvm_list=
odernutanix@CVM:~$ ncc health_checks run_all
Wenden Sie sich an den Nutanix-Support , wenn die /home -Nutzung nach dem Bereinigen der Dateien aus den genehmigten Verzeichnissen immer noch über dem Schwellenwert liegt. Entfernen Sie unter keinen Umständen Dateien aus anderen Verzeichnissen als den in diesem Artikel empfohlenen, da diese für die CVM-Leistung kritisch sein oder Benutzerdaten enthalten können.