AOS uniquement - Que faire lorsqu'une partition personnelle ou un répertoire personnel Nutanix sur une machine virtuelle de contrôleur (CVM) est plein
AOS uniquement - Que faire lorsqu'une partition personnelle ou un répertoire personnel Nutanix sur une machine virtuelle de contrôleur (CVM) est plein
AOS uniquement - Que faire lorsqu'une partition personnelle ou un répertoire personnel Nutanix sur une machine virtuelle de contrôleur (CVM) est plein
Description
Remarques importantes :
- N'utilisez pas cet article de base de connaissances ni le script de nettoyage si la partition /home dépasse la limite sur une machine virtuelle Prism Central (PCVM) . Pour le problème PCVM, reportez-vous à l'article de base de connaissances 5228 .
- Connectez-vous aux CVM en tant qu'utilisateur Nutanix
- Ne traitez pas le Nutanix CVM (Controller VM) comme une machine Linux normale.
- N'utilisez en aucun cas rm -rf , sauf indication contraire. Cela entraînerait des pertes de données.
- Si vous exécutez LCM-2.6 ou LCM-2.6.0.1, la collecte des journaux LCM remplit le répertoire /home, veuillez vous référer à l'article 14671 de la base de connaissances pour une solution de contournement.
- Si vous recevez une alerte d'utilisation élevée de la partition /home sur un cluster exécutant NCC 4.0.0, vérifiez également KB 10530 .
- Vous pouvez consulter les clusters spécifiques affectés par cette alerte via les découvertes sur le portail d'assistance optimisé par Nutanix Insights ici
- Contactez le support Nutanix si vous avez des doutes.
La partition CVM /home ou le répertoire /home/nutanix saturé peut être signalé dans deux scénarios :
- Le contrôle de santé NCC disk_usage_check signale que l'utilisation de la partition /home est supérieure au seuil (par défaut, 75 %).
- Le test de vérification préalable à la mise à niveau test_nutanix_partition_space vérifie si tous les nœuds disposent d'un minimum de 5,6 Go d'espace dans le répertoire /home/nutanix.
Les messages d'erreur suivants sont générés dans Prism par la vérification préalable à la mise à niveau de test_nutanix_partition_space :
Nutanix réserve de l'espace sur le niveau SSD de chaque CVM pour ses fichiers et répertoires. Ces fichiers et répertoires se trouvent dans le dossier /home que vous voyez lorsque vous vous connectez à un CVM. La taille du dossier /home est limitée à 40 Go afin que la majorité de l'espace sur le SSD soit disponible pour les données utilisateur.
En raison de la taille limitée de la partition /home , il est possible que l'espace libre soit insuffisant et que des alertes Prism, des échecs ou des avertissements de vérification de l'état du NCC ou des échecs de vérification avant mise à niveau soient déclenchés. Ces garde-fous existent pour empêcher que /home ne soit complètement plein, car cela empêche les services de traitement de données comme Stargate de répondre. Les clusters où les partitions /home de plusieurs CVM sont pleines à 100 % entraînent souvent des temps d'arrêt des machines virtuelles des utilisateurs.
Lors du nettoyage des binaires inutilisés et des anciens journaux sur un CVM, il est important de noter que toutes les partitions de données utilisateur sur chaque lecteur associé à un nœud donné sont également montées dans /home. C'est pourquoi nous déconseillons fortement d'utiliser des commandes non documentées telles que rm -rf /home, car cela effacera également les répertoires de données utilisateur montés dans ce chemin. Le but de cet article est de vous guider dans l'identification des fichiers qui entraînent un manque d'espace libre dans le CVM et de supprimer uniquement ceux qui peuvent être supprimés en toute sécurité.
Solution
Remarque : les dernières versions d'AOS incluent des améliorations et des correctifs de bogues conçus pour optimiser l'utilisation de l'espace /home. Pour éviter d'éventuels problèmes à l'avenir, il est essentiel de veiller à ce que votre AOS soit régulièrement mis à jour.
Orientation générale
- Vérification de l'utilisation de l'espace dans /home . Pour permettre une éventuelle mise à niveau d'AOS, l'utilisation doit être inférieure à 70 %. Utilisez la commande df -h pour vérifier la quantité d'espace libre dans /home . Dans l'exemple ci-dessous, l'utilisation de CVM xxx12 /home est de 81 %.
================ xxx11 =================
/dev/md2 40 Go 22 Go 18 Go 55 % /home
================ xxx12 =================
/dev/md2 40 Go 32 Go 7,4 Go 81 % /home
================ xxx13 =================
/dev/md2 40 Go 24 Go 16 Go 61 % /home
Pour obtenir une répartition plus détaillée de l'utilisation par ordre décroissant, utilisez la commande du -h avec l'indicateur -d pour obtenir le nombre de niveaux de répertoires dont vous avez besoin. Par exemple, ci-dessous -d 2 implique de rechercher deux niveaux de répertoires à partir de /home/nutanix/data , en plus, l'ajout de head -n 15 affichera les 15 premiers répertoires qui peuvent ensuite être comparés à d'autres CVM pour voir d'où vient l'utilisation élevée :
================ xx.xx.xx.11 =================
17G /accueil/nutanix/données
9.4G /home/nutanix/data/journaux
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
2,5 G /home/nutanix/data/logs/sysstats
512M /home/nutanix/data/ncc/installer
================ xx.xx.xx.12 =================
18G /accueil/nutanix/données
9,5 G /accueil/nutanix/données/journaux
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
3.0G /home/nutanix/data/logs/sysstats
610M /home/nutanix/data/logbay/données de tâches
.
.
- Les informations sur la partition CVM /home peuvent être collectées à l'aide de la commande logbay (NCC 4.0.0 et supérieur, Nutanix KB 6691 ).
- Nettoyage des fichiers inutiles sous le répertoire /home .
Si vous avez des dossiers ouverts avec une analyse des causes profondes en attente, vérifiez auprès du propriétaire du dossier si ces fichiers journaux sont toujours nécessaires ou peuvent être supprimés.
Avertissements : assurez-vous de conserver à portée de main les notes importantes mentionnées en haut de l'article de la base de connaissances (KB) avant d'appliquer des solutions de contournement.
Méthode 1 : Utilisation d'un script approuvé
Téléchargez et exécutez KB-1540_clean_v12.sh pour nettoyer les fichiers des répertoires approuvés.
Remarque : ce script n'est PAS qualifié pour être utilisé sur la machine virtuelle Prism Central.
- Depuis n'importe quel CVM, exécutez les commandes suivantes pour télécharger KB-1540_clean_v12.sh :
(MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ md5sum KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
- Déployez le script sur un CVM local ou sur tous les CVM du cluster :
Sélectionnez le package à déployer
1 : Déployer l’outil uniquement sur le CVM local
2 : Déployer l’outil sur tous les CVM du cluster
Sélection (Annuler="c") : <==== 1 ou 2
- Exécutez le script pour effacer les fichiers des répertoires approuvés.
- Aide
- Mode interactif
- Mode non interactif
Remarque : si la sortie du script ou sa coloration semble incorrecte, essayez de définir la variable d'environnement avant d'exécuter le script ou utilisez l'option « --no_color » :
Mode interactif
Menu principal
|
Menu des éléments du plan
|
Mode non interactif
Commandes
|
Si un élément est répertorié comme « instruction » dans la colonne Opération, vous pouvez afficher les instructions en exécutant cet élément.
Par exemple:
┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plans de nettoyage : Éléments concernés │ Fonctionnement │ Utilisation │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │ 5 : Paquet de journaux (logbay) │supprimer │ 2,25 G│ │10 : Installateur téléchargé │instruction│ 824,00 M│ │59 : Fichiers éventuellement créés manuellement │instruction│ 3,69G│ ├─────────────────────────────────────── ──────────────────┴───────────┼────────┤ │ Total │ 6,74 G│ ╞═══════════════════════════════════════ ══════════════════════════════╧════════╡ │CVM xxxx │ │ /utilisation domestique = 30,99 G (80 %) >> un nettoyage est recommandé │ └─────────────────────────────────────── ───────────────────────────────────────┘
Les éléments 10 et 59 sont répertoriés comme « instructions ». Pour voir les instructions de l'élément 10, exécutez-le en saisissant « 10 » dans le menu principal et en saisissant « R » sur l'écran suivant. Exemple de sortie ci-dessous :
┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plan de nettoyage 10 │ Fonctionnement │ Utilisation │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10 : Installateur téléchargé │instruction│ 824,00 M│ └──────────────────────────────────────────────────────────────┴─ ...� Menu Plan 10 ( Quitter, Retour, Aide, Rescanner, Opération, Liste, Exécution à sec, Exécuter, Exporter) : R Opération d'exécution pour le plan 10 : « instruction » Une opération manuelle est requise pour le plan 10 -- Instruction -- Ces programmes d'installation téléchargés peuvent être supprimés de « Mettre à niveau le logiciel » sur Prism. Veuillez trouver une section avec « /home/nutanix/software_downloads/ » sur KB-1540 (http://portal.nutanix.com/kb/1540) Les anciens fichiers d'installation n'ont pas pu être répertoriés sur Prism ou par ncli. Veuillez contacter le support Nutanix chaque fois que vous avez besoin d'aide. ┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plan de nettoyage 10 │ Fonctionnement │ Utilisation │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10 : Installateur téléchargé │instruction│ 824,00 M│ └─────────────────────────────────────── ──────────────────┴───────────┴────────┘
Répétez l’opération ci-dessus pour l’élément 59 pour voir les instructions pour l’élément 59.
- Nettoyage après le dépannage
Les fichiers de script téléchargés, les journaux et les fichiers exportés doivent être supprimés manuellement après chaque dépannage. La taille totale de ces fichiers doit être petite et n'affectera pas le système de fichiers de CVM. Vous pouvez supprimer les fichiers suivants une fois que le script devient inutile.
<aammjj-hhmmss> est la date et l'heure de création.- Dans le CVM où le script KB est déployé ( /home/nutanix/tmp/ ) :
KB-1540_clean.sh - fichier téléchargé depuis la base de connaissances
deploytool_yyyymmdd-hhmmss.log - journal du script de déploiement (inutile après le déploiement)
nutanix_home_clean.py - script principal de la base de connaissances
nutanix_home_clean_config.py - fichier de configuration pour le script principal - Dans le reste des CVM du cluster, s'ils sont déployés sur tous les CVM à l'étape 2 :
nutanix_home_clean.py - script principal de la base de connaissances
nutanix_home_clean_config.py - fichier de configuration pour le script principal - Chaque CVM où nutanix_home_clean.py est exécuté :
KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log - Journal du script KB
KB-1540_v12_yyyymmdd_hhmmss_export_*.csv - fichiers exportés (si exportés)
La commande suivante peut supprimer tout ce qui précède :
nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540*deploytool_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
- Dans le CVM où le script KB est déployé ( /home/nutanix/tmp/ ) :
Méthode 2 : Méthode manuelle
VEUILLEZ LIRE : Seuls les fichiers des répertoires indiqués ci-dessous peuvent être supprimés en toute sécurité. Prenez note des instructions spécifiques pour supprimer les fichiers de chaque répertoire. N'utilisez aucune autre commande ou script pour supprimer des fichiers. N'utilisez en aucun cas rm -rf .
- Suppression des anciens fichiers journaux et de base. Supprimez uniquement les fichiers contenus dans les répertoires suivants et non les répertoires eux-mêmes .
- /home/nutanix/data/cores/
- /home/nutanix/data/journaux_binaires/
- /home/nutanix/data/ncc/installer/
- /home/nutanix/data/collecteur_de_journaux/
- /home/nutanix/prism/webapps/console/téléchargements/NCC-journaux-*
Utilisez la syntaxe suivante pour supprimer des fichiers dans chacun de ces répertoires :
- Suppression des anciens fichiers ISO et binaires logiciels. Supprimez uniquement les fichiers contenus dans les répertoires suivants et non les répertoires eux-mêmes .
Vérifiez la version AOS en cours d'exécution sous « Version du cluster » :
Nom du cluster : Axxxxa
Version du cluster : 5.10.2
- /home/nutanix/software_uncompressed/ - Le dossier software_uncompressed n'est utilisé que lorsque la pré-mise à niveau est en cours d'exécution et doit être supprimé après une mise à niveau réussie. Si vous voyez un cluster en cours d'exécution qui n'est actuellement pas en cours de mise à niveau, vous pouvez supprimer en toute sécurité tout ce qui se trouve dans le répertoire software_uncompressed. Supprimez toutes les anciennes versions autres que la version vers laquelle vous effectuez la mise à niveau.
- /home/nutanix/foundation/isos/ - Anciens ISO d'hyperviseurs ou de Phoenix.
- /home/nutanix/foundation/tmp/ - Fichiers temporaires qui peuvent être supprimés.
Utilisez la syntaxe suivante pour supprimer des fichiers dans chacun de ces répertoires :nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/* nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
- /home/nutanix/téléchargements_de_logiciels/
Si les fichiers sous le répertoire software_downloads ne sont pas nécessaires pour les mises à niveau planifiées, supprimez-les de Prism Web Console > Paramètres > Mettre à niveau le logiciel . Vérifiez également les onglets Serveur de fichiers , Hyperviseur , NCC et Fondation pour localiser les téléchargements dont vous n'avez peut-être pas besoin. L'exemple ci-dessous illustre deux versions d'AOS disponibles pour la mise à niveau, chacune consommant environ 5 Go. Cliquez sur le « X » pour supprimer les fichiers.
Si cette option est cochée, décochez-la. Si elle n'est pas surveillée, le cluster téléchargera plusieurs versions, consommant ainsi inutilement de l'espace dans le répertoire personnel.
- Revérifiez l'utilisation de l'espace dans /home à l'aide de df -h (voir les instructions générales de cet article) pour confirmer qu'elle est désormais inférieure à 70 %.
Remarque : si vous ne parvenez pas à supprimer les fichiers avec l’erreur suivante et que l’espace n’est pas réclamé, contactez le support Nutanix pour obtenir de l’aide.
==> Fichiers système détectés :
/home/nutanix/data/logiciel_non_compressé/xxx
Opération non autorisée. La suppression des fichiers système entraînera une instabilité du cluster et une perte potentielle de données.
Remarques importantes pour les clusters NC2 :
Il a été observé dans certains cas de clusters NC2 que /tmp est presque plein. Vous pouvez suivre les étapes ci-dessous pour nettoyer le répertoire ~/tmp.
- Connectez-vous en SSH au CVM concerné et vérifiez l'utilisation du disque en exécutant la commande « df -h » :
nutanix@CVM:~$ df -h /tmp Taille du système de fichiers utilisée Utilisation disponible% Monté sur /dev/loop0 240M 236M 0 100% /tmp
- Dans la sortie ci-dessus, nous pouvons voir que /tmp affiche 100 %. Modifiez le répertoire vers ~/tmp et triez la liste à l'aide de sudo du -aSxh /tmp/* | sort -h .
4,0 Ko /tmp/hsperfdata_nutanix 12 Ko /tmp/lost+found 23 Ko /tmp/rc_nutanix_start.1731.log 39 Ko /tmp/rc_nutanix_start.1734.log 78 Mo /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 Mo /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 Mo /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
- À partir du résultat obtenu ci-dessus, supprimez manuellement les fichiers de plus de 12 Ko. Par exemple, voir ci-dessous les fichiers supprimés à partir du résultat ci-dessus.
nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.AVERTISSEMENT.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
- Après la suppression, vous pouvez vérifier l'espace libre disponible en utilisant df -h :
nutanix@CVM:~/tmp$ df -h /tmp Taille du système de fichiers utilisée Utilisation disponible% Monté sur /dev/loop0 240 Mo 14 Mo 210 Mo 6 % /tmp
- Comme vous pouvez le constater, l'espace libre disponible affiche désormais 6 %. Vous pouvez revérifier avec :
nutanix@CVM:~$ ncc health_checks hardware_checks disk_checks disk_usage_check --cvm_list=
ounutanix@CVM:~$ ncc health_checks run_all
Contactez le support Nutanix pour obtenir de l'aide si l'utilisation de /home est toujours supérieure au seuil après avoir nettoyé les fichiers des répertoires approuvés. Vous ne devez en aucun cas supprimer des fichiers d'autres répertoires que ceux recommandés par cet article, car ils peuvent être essentiels aux performances de CVM ou contenir des données utilisateur.