Solo AOS: qué hacer cuando una partición de inicio o un directorio Nutanix de inicio en una máquina virtual controladora (CVM) está lleno
Solo AOS: qué hacer cuando una partición de inicio o un directorio Nutanix de inicio en una máquina virtual controladora (CVM) está lleno
Solo AOS: qué hacer cuando una partición de inicio o un directorio Nutanix de inicio en una máquina virtual controladora (CVM) está lleno
Descripción
Notas importantes:
- No utilice este artículo de la base de conocimientos ni el script de limpieza si la partición /home excede el límite en una máquina virtual Prism Central (PCVM) . Para el problema de PCVM, consulte el artículo de la base de conocimientos 5228 .
- Inicie sesión en los CVM como usuario nutanix
- No trate el Nutanix CVM (Controller VM) como una máquina Linux normal.
- No utilice rm -rf bajo ninguna circunstancia a menos que se indique lo contrario. Esto provocará pérdida de datos.
- Si está ejecutando LCM-2.6 o LCM-2.6.0.1, la recopilación de registros de LCM llena el directorio /home; consulte KB 14671 para obtener una solución alternativa.
- Si recibe una alerta de uso alto de la partición /home en un clúster que ejecuta NCC 4.0.0, consulte también KB 10530 .
- Puede revisar los clústeres específicos afectados por esta alerta a través de los descubrimientos en el Portal de soporte impulsado por Nutanix Insights aquí
- Comuníquese con el soporte de Nutanix si tiene alguna duda.
La partición /home de CVM o el directorio /home/nutanix que está lleno se pueden informar en dos escenarios:
- La comprobación de estado de NCC disk_usage_check informa que el uso de la partición /home está por encima del umbral (por defecto, 75%).
- La comprobación previa a la actualización test_nutanix_partition_space comprueba si todos los nodos tienen un mínimo de 5,6 GB de espacio en el directorio /home/nutanix.
Los siguientes mensajes de error se generan en Prism mediante la comprobación previa a la actualización test_nutanix_partition_space :
Nutanix reserva espacio en el nivel SSD de cada CVM para sus archivos y directorios. Estos archivos y directorios se encuentran en la carpeta /home que se ve cuando se inicia sesión en un CVM. El tamaño de la carpeta /home está limitado a 40 GB para que la mayor parte del espacio en SSD esté disponible para los datos del usuario.
Debido al tamaño limitado de la partición /home , es posible que se quede sin espacio libre y se activen alertas de Prism, errores o advertencias de verificación de estado de NCC o errores de verificación previa a la actualización. Estas barreras existen para evitar que /home se llene por completo, ya que esto hace que los servicios de procesamiento de datos como Stargate dejen de responder. Los clústeres en los que las particiones /home de varios CVM están llenas al 100 % suelen provocar tiempos de inactividad en las máquinas virtuales de los usuarios.
Al limpiar archivos binarios no utilizados y registros antiguos en un CVM, es importante tener en cuenta que todas las particiones de datos de usuario en cada unidad asociada con un nodo determinado también están montadas dentro de /home. Es por eso que recomendamos encarecidamente no utilizar comandos no documentados como rm -rf /home, ya que esto también borrará los directorios de datos de usuario montados dentro de esta ruta. El propósito de este artículo es guiarlo para identificar los archivos que están causando que el CVM tenga poco espacio libre y eliminar solo aquellos que se puedan eliminar de manera segura.
Solución
Nota: Las últimas versiones de AOS incluyen mejoras y correcciones de errores diseñadas para optimizar el uso del espacio de la casa. Para evitar posibles problemas en el futuro, es fundamental asegurarse de que su AOS se actualice periódicamente.
Orientación general
- Comprobación del uso del espacio en /home . Para permitir una posible actualización de AOS, el uso debe ser inferior al 70 %. Utilice el comando df -h para verificar la cantidad de espacio libre en /home . En el siguiente ejemplo, el uso de CVM xxx12 /home es del 81 %.
================== xxx11 =================
/dev/md2 40G 22G 18G 55% /inicio
================== xxx12 =================
/dev/md2 40G 32G 7,4G 81% /inicio
================== xxx13 =================
/dev/md2 40G 24G 16G 61% /inicio
Para obtener un desglose más detallado del uso en orden descendente, utilice el comando du -h con el indicador -d para obtener el número de nivel de directorio que necesita. Por ejemplo, a continuación -d 2 implica buscar en dos niveles de directorio desde /home/nutanix/data , además, agregar head -n 15 mostrará los 15 directorios principales que luego se pueden comparar con otros CVM para ver de dónde proviene el alto uso:
================== xx.xx.xx.11 =================
17G /inicio/nutanix/datos
9.4G /inicio/nutanix/datos/registros
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
2.5G /inicio/nutanix/datos/registros/estadísticas del sistema
512M /inicio/nutanix/datos/ncc/instalador
================== xx.xx.xx.12 =================
18G /inicio/nutanix/datos
9.5G /inicio/nutanix/datos/registros
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
3.0G /inicio/nutanix/datos/registros/sysstats
610M /inicio/nutanix/datos/logbay/taskdata
.
.
- La información de la partición CVM/home se puede recopilar utilizando el comando logbay (NCC 4.0.0 y superior, Nutanix KB 6691 ).
- Limpieza de archivos innecesarios en el directorio /home .
Si tiene casos abiertos con análisis de causa raíz pendiente, consulte con el propietario del caso si estos archivos de registro aún son necesarios o pueden descartarse.
Advertencias: asegúrese de tener a mano las notas importantes mencionadas en la parte superior del artículo de la Base de conocimientos (KB) antes de aplicar cualquier solución alternativa.
Método 1: Utilizar un guión aprobado
Descargue y ejecute KB-1540_clean_v12.sh para limpiar archivos de directorios aprobados.
Nota: este script NO está calificado para usarse en la máquina virtual Prism Central.
- Desde cualquier CVM, ejecute los siguientes comandos para descargar KB-1540_clean_v12.sh :
(MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ suma md5 KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
- Implemente el script en un CVM local o en todos los CVM del clúster:
Seleccionar el paquete a implementar
1: Implementar la herramienta solo en el CVM local
2: Implementar la herramienta en todos los CVM del clúster
Selección (Cancelar="c"): <==== 1 o 2
- Ejecute el script para borrar archivos de los directorios aprobados.
- Ayuda
- Modo interactivo
- Modo no interactivo
Nota: Si la salida del script o su color no son correctos, intente configurar la variable de entorno antes de ejecutar el script o use la opción "--no_color":
Modo interactivo
Menú principal
|
Menú de elementos del plan
|
Modo no interactivo
Comandos
|
Si un elemento aparece como "instrucción" en la columna Operación, puede ver las instrucciones ejecutando ese elemento.
Por ejemplo:
┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Planes de limpieza: Elementos involucrados │ Operación │ Uso │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │ 5: Paquete de registro (logbay) │eliminar │ 2,25 G│ │10: Instalador descargado │instrucciones│ 824.00M│ │59: Posibles archivos creados manualmente │instrucción│ 3.69G│ ├─────────────────────────────────────── ──────────────────┴───────────┼────────┤ │Total │6,74G│ ╞═══════════════════════════════════════ ══════════════════════════════╧════════╡ │CVM xxxx │ │ /uso doméstico = 30,99 G (80%) >> se recomienda limpieza │ └─────────────────────────────────────── ───────────────────────────────────────┘
Los elementos 10 y 59 se enumeran como "instrucción". Para ver las instrucciones del elemento 10, ejecútelo ingresando "10" en el menú principal e ingresando "R" en la siguiente pantalla. A continuación, se muestra un ejemplo de salida:
┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plan de limpieza 10 │ Operación │ Uso │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10: Instalador descargado │instrucciones│ 824.00M│ └────────────────────────────────────────────────────────────────┴──────────┴──────────┘ Menú del Plan 10 (Salir, Atrás, Ayuda, Volver a escanear, Operación, Lista, Ejecutar en seco, Ejecutar, Exportar): R Ejecutar operación para el plan 10: "instrucción" Se requiere una operación manual para el plan 10 -- Instrucción -- Estos instaladores descargados se pueden eliminar desde "Actualizar software" en Prism. Busque una sección con "/home/nutanix/software_downloads/" en KB-1540 (http://portal.nutanix.com/kb/1540) Los archivos de instalación más antiguos no se pudieron incluir en Prism ni mediante ncli. Comuníquese con el soporte técnico de Nutanix siempre que necesite ayuda. ┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plan de limpieza 10 │ Operación │ Uso │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10: Instalador descargado │instrucciones│ 824.00M│ └─────────────────────────────────────── ──────────────────┴───────────┴────────┘
Repita lo anterior para el artículo 59 para ver las instrucciones del artículo 59.
- Limpieza después de la resolución de problemas
Se espera que los archivos de script, los registros y los archivos exportados descargados se eliminen manualmente después de cada solución de problemas. El tamaño total de estos archivos debe ser pequeño y no afectará el sistema de archivos de CVM. Puede eliminar los siguientes archivos una vez que el script ya no sea necesario.
<aammdd-hhmmss> es la fecha y hora de creación.- En el CVM donde se implementa el script de KB ( /home/nutanix/tmp/ ):
KB-1540_clean.sh : archivo descargado de la base de conocimientos
deploymenttool_yyyymmdd-hhmmss.log : registro del script de implementación (innecesario después de la implementación)
nutanix_home_clean.py - script de la base de conocimientos principal
nutanix_home_clean_config.py : archivo de configuración para el script principal - En el resto de los CVM del clúster, si se implementa en todos los CVM en el paso 2:
nutanix_home_clean.py - script de la base de conocimientos principal
nutanix_home_clean_config.py : archivo de configuración para el script principal - Cada CVM donde se ejecuta nutanix_home_clean.py:
KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log : registro del script de KB
KB-1540_v12_yyyymmdd_hhmmss_export_*.csv - archivos exportados (si se exportaron)
El siguiente comando puede eliminar todo lo anterior:
nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540* herramienta de implementación_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
- En el CVM donde se implementa el script de KB ( /home/nutanix/tmp/ ):
Método 2: Método manual
LEA : Solo los archivos que se encuentran en los directorios que se indican a continuación se pueden eliminar de forma segura. Tome nota de las instrucciones específicas para eliminar archivos de cada directorio. No utilice ningún otro comando o script para eliminar archivos. No utilice rm -rf bajo ninguna circunstancia.
- Eliminar registros antiguos y archivos principales. Eliminar únicamente los archivos dentro de los siguientes directorios y no los directorios en sí .
- /inicio/nutanix/datos/núcleos/
- /inicio/nutanix/datos/registros_binarios/
- /inicio/nutanix/datos/ncc/instalador/
- /inicio/nutanix/datos/recopilador_de_registros/
- /inicio/nutanix/prism/webapps/consola/descargas/registros-NCC-*
Utilice la siguiente sintaxis para eliminar archivos dentro de cada uno de estos directorios:
- Eliminación de ISOs y binarios de software antiguos. Borre únicamente los archivos que se encuentran dentro de los siguientes directorios y no los directorios en sí .
Compruebe la versión actual de AOS en ejecución en "Versión del clúster":
Nombre del clúster: Axxxxa
Versión del clúster: 5.10.2
- /home/nutanix/software_uncompressed/ - La carpeta software_uncompressed solo se utiliza cuando se ejecuta la actualización previa y se debe eliminar después de una actualización exitosa. Si ve un clúster en ejecución que actualmente no se está actualizando, es seguro eliminar todo lo que se encuentre dentro del directorio software_uncompressed. Elimine todas las versiones anteriores que no sean la versión a la que está actualizando.
- /home/nutanix/foundation/isos/ - ISOs antiguas de hipervisores o Phoenix.
- /home/nutanix/foundation/tmp/ - Archivos temporales que se pueden eliminar.
Utilice la siguiente sintaxis para eliminar archivos dentro de cada uno de estos directorios:nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/* nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
- /inicio/nutanix/descargas_de_software/
Si los archivos del directorio software_downloads no son necesarios para ninguna actualización planificada, elimínelos desde Prism Web Console > Settings > Upgrade Software . También verifique las pestañas File Server , Hypervisor , NCC y Foundation para localizar las descargas que quizás no necesite. El siguiente ejemplo ilustra dos versiones de AOS disponibles para actualización, cada una consume alrededor de 5 GB. Haga clic en la "X" para eliminar los archivos.
Si está marcada, desmarque la opción “Habilitar descarga automática”. Si no se supervisa, el clúster descargará varias versiones, lo que consumirá espacio en el directorio de inicio de manera innecesaria.
- Vuelva a verificar el uso de espacio en /home usando df -h (consulte la Guía general de este artículo) para confirmar que ahora esté por debajo del 70%.
Nota: Si no puede eliminar los archivos con el siguiente error y espacio no reclamado, comuníquese con el soporte técnico de Nutanix para obtener ayuda.
==> Archivos del sistema detectados:
/inicio/nutanix/datos/software_sin_comprimir/xxx
Operación no permitida. La eliminación de archivos del sistema provocará inestabilidad en el clúster y posible pérdida de datos.
Notas importantes para los clústeres NC2:
Se ha observado que en algunos casos de clústeres NC2 /tmp se llena casi por completo. Puede seguir los pasos a continuación para limpiar el directorio ~/tmp.
- Inicie sesión por SSH en el CVM afectado y verifique el uso del disco ejecutando el comando "df -h":
nutanix@CVM:~$ df -h /tmp Tamaño del sistema de archivos utilizado Disponibilidad Uso % Montado en /dev/loop0 240M 236M 0 100% /tmp
- En el resultado anterior, podemos ver que /tmp se muestra al 100%. Cambie el directorio a ~/tmp y ordene la lista usando sudo du -aSxh /tmp/* | sort -h .
4,0 K /tmp/hsperfdata_nutanix 12 K /tmp/lost+found 23 K /tmp/rc_nutanix_start.1731.log 39 K /tmp/rc_nutanix_start.1734.log 78 Mb /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 Mb /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 Mb /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
- A partir del resultado que recibes arriba, elimina manualmente los archivos de más de 12 K. Por ejemplo, consulta a continuación los archivos eliminados del resultado anterior.
nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ADVERTENCIA.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
- Después de eliminar, puedes verificar el espacio libre disponible usando df -h :
nutanix@CVM:~/tmp$ df -h /tmp Tamaño del sistema de archivos utilizado Disponibilidad Uso % Montado en /dev/loop0 240M 14M 210M 6% /tiempo
- Como puede ver, el espacio libre disponible ahora muestra un 6 %. Puede volver a comprobarlo con:
nutanix@CVM:~$ ncc comprobaciones de estado comprobaciones de hardware comprobaciones de disco comprobación de uso de disco --cvm_list=
onutanix@CVM:~$ ncc health_checks ejecutar_todo
Comuníquese con el soporte técnico de Nutanix para obtener ayuda si el uso de /home sigue siendo superior al umbral después de limpiar los archivos de los directorios aprobados. Bajo ninguna circunstancia debe eliminar archivos de otros directorios que no sean los recomendados en este artículo, ya que pueden ser críticos para el rendimiento de CVM o pueden contener datos de usuario.