Somente AOS - O que fazer quando uma partição Home ou diretório Home Nutanix em uma VM do controlador (CVM) está cheio

Somente AOS - O que fazer quando uma partição Home ou diretório Home Nutanix em uma VM do controlador (CVM) está cheio

Somente AOS - O que fazer quando uma partição Home ou diretório Home Nutanix em uma VM do controlador (CVM) está cheio

Este é um artigo traduzido automaticamente, por favor clique aqui para ver a versão original em inglês.

Descrição

Notas importantes:

  • Não use este KB ou o script de limpeza se a partição /home estiver excedendo o limite em uma Prism Central VM (PCVM) . Para o problema do PCVM, consulte KB 5228 .
  • Faça login no CVMs como usuário nutanix
  • Não trate o Nutanix CVM (Controller VM) como uma máquina Linux normal.
  • Não use rm -rf em nenhuma circunstância, a menos que seja indicado. Isso levará a cenários de perda de dados.
  • Se você estiver executando o LCM-2.6 ou LCM-2.6.0.1, a coleta de logs do LCM preenche o diretório /home. Consulte o KB 14671 para obter uma solução alternativa.
  • Se você receber um alerta de alto uso da partição /home em um cluster executando o NCC 4.0.0, verifique também o KB 10530 .
  • Você pode revisar os clusters específicos afetados por este alerta por meio das descobertas no Portal de Suporte fornecido pelo Nutanix Insights aqui
  • Entre em contato com o Suporte Nutanix se tiver alguma dúvida.

A partição CVM /home ou o diretório /home/nutanix cheio pode ser relatado em dois cenários:

  • A verificação de integridade do NCC disk_usage_check relata que o uso da partição /home está acima do limite (por padrão, 75%).
  • O teste de verificação de pré-atualização test_nutanix_partition_space verifica se todos os nós têm no mínimo 5,6 GB de espaço no diretório /home/nutanix.

As seguintes mensagens de erro são geradas no Prism pela verificação de pré-atualização test_nutanix_partition_space :

Não há espaço suficiente no diretório /home/nutanix na VM do controlador [ip]. Disponível = x GB: Esperado = x GB

Falha ao calcular o espaço mínimo necessário

Falha ao obter o uso do disco para cvm [ip], provavelmente devido à falha de ssh no cvm

Saída inesperada de df no Controller VM [ip]. Consulte preupgrade.out para obter mais informações

A Nutanix reserva espaço na camada SSD de cada CVM para seus arquivos e diretórios. Esses arquivos e diretórios estão localizados na pasta /home que você vê quando faz login em um CVM. O tamanho da pasta /home é limitado a 40 GB para que a maioria do espaço no SSD esteja disponível para dados do usuário.

Devido ao tamanho limitado da partição /home , é possível ficar com pouco espaço livre e disparar alertas Prism, falhas ou avisos de verificação de integridade do NCC ou falhas de verificação de pré-atualização. Essas proteções existem para evitar que /home fique completamente cheio, pois isso faz com que serviços de processamento de dados como o Stargate fiquem sem resposta. Clusters onde várias partições /home de CVMs estão 100% cheias geralmente resultam em tempo de inatividade de VMs de usuários.

Ao limpar binários não utilizados e logs antigos em um CVM, é importante observar que todas as partições de dados do usuário em cada unidade associada a um determinado nó também são montadas em /home. É por isso que desaconselhamos fortemente o uso de comandos não documentados como rm -rf /home, pois isso também limpará os diretórios de dados do usuário montados neste caminho. O objetivo deste artigo é orientá-lo na identificação dos arquivos que estão fazendo com que o CVM tenha pouco espaço livre e remover apenas aqueles que podem ser excluídos com segurança.

Solução

Observação: as versões mais recentes do AOS incluem melhorias e correções de bugs projetadas para otimizar a utilização do espaço /home. Para evitar problemas potenciais no futuro, é crucial garantir que seu AOS seja atualizado regularmente.

Orientação Geral

  • Verificando o uso de espaço em /home . Para acomodar uma potencial atualização do AOS, o uso deve ser abaixo de 70%. Use o comando df -h para verificar a quantidade de espaço livre em /home . No exemplo abaixo, o uso de CVM xxx12 /home é 81%.
nutanix@cvm$ allssh "df -h /home"
==================== xxx11 =================
/dev/md2 40G 22G 18G 55% /início
==================== xxx12 =================
/dev/md2 40G 32G 7,4G 81% /início
=================== xxx13 =================
/dev/md2 40G 24G 16G 61% /início

Para obter uma análise mais aprofundada do uso em ordem decrescente, use o comando du -h com o sinalizador -d para obter o número do nível de diretório necessário. Por exemplo, abaixo de -d 2 implica em procurar em dois níveis de diretório de /home/nutanix/data , além disso, adicionar head -n 15 exibirá os 15 principais diretórios que podem ser comparados com outros CVMs para ver de onde vem o alto uso:

nutanix@CVM:~$ allssh "du -h -d 2 -x /home/nutanix/data |classificar -h -r |cabeçalho -n 15"
=================== xx.xx.xx.11 =================
17G /home/nutanix/dados
9.4G /home/nutanix/dados/logs
4,6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/instalador
2.5G /home/nutanix/dados/logs/sysstats
512M /home/nutanix/data/ncc/installer
=================== xx.xx.xx.12 =================
18G /home/nutanix/dados
9.5G /home/nutanix/dados/logs
4,6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/instalador
3.0G /home/nutanix/dados/logs/sysstats
610M /home/nutanix/dados/logbay/dadosdatarefa
.
.
  • As informações da partição CVM /home podem ser coletadas usando o comando logbay (NCC 4.0.0 e superior, Nutanix KB 6691 ).
nutanix@cvm$ logbay coletar -t disk_usage_info
  • Limpando arquivos desnecessários no diretório /home .

    Se você tiver algum caso aberto com Análise de Causa Raiz pendente, verifique com o proprietário do caso se esses arquivos de log ainda são necessários ou podem ser descartados.

    Avisos: certifique-se de manter as notas importantes mencionadas no início do artigo da Base de Conhecimento (KB) à mão antes de aplicar qualquer solução alternativa

Método 1: Usando script aprovado

Baixe e execute KB-1540_clean_v12.sh para limpar arquivos de diretórios aprovados.

Observação: este script NÃO é qualificado para ser usado na VM do Prism Central.

  1. De qualquer CVM, execute os seguintes comandos para baixar KB-1540_clean_v12.sh :
    (MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~$ cd ~/tmp
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ md5sum KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
  1. Implante o script em uma CVM local ou em todas as CVMs do cluster:
nutanix@cvm:~/tmp$ sh KB-1540_clean_v12.sh

Selecione o pacote para implantar
1: Implante a ferramenta apenas no CVM local
2: Implante a ferramenta em todos os CVMs no cluster
Seleção (Cancelar="c"): <==== 1 ou 2
  1. Execute o script para limpar arquivos de diretórios aprovados.
  • Ajuda
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py --help [--no_color]
  • Modo interativo
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py [--no_color]
  • Modo não interativo
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py <comando> <opção> [--no_color]

Nota: Se a saída do script ou sua coloração parecerem incorretas, tente definir a variável de ambiente antes de executar o script ou use a opção "--no_color":

nutanix@cvm:~/tmp$ TERMO=xterm


Modo interativo

Imagem adicionada pelo usuário

Menu principal
Todos os Planos Alternar planos de exibição (todos / interessados)
Re s pode Reexaminar usos e atualizar tabela
Listar tudo Listar todos os arquivos/diretórios alvos
Executar tudo Executar ou testar todos os planos
E xportar tudo Exportar todos os arquivos/diretórios de destino para CSV
##: Plano # Vá para o menu de itens do plano
Menu de itens do plano
Re s pode Redigitalize e atualize a tabela
Operação Alterar operação (remover/abrigar/etc.)
Lista Listar arquivos/diretórios alvos
Secar Teste este plano
Correr Execute este plano
E xport Exportar arquivos/diretórios direcionados para CSV

Modo não interativo

Imagem adicionada pelo usuário

Comandos
$ ./nutanix_home_clean.py --scan Digitalize e mostre os usos.
$ ./nutanix_home_clean.py --lista
$ ./nutanix_home_clean.py --list=<##>
Liste os arquivos de destino para todos os planos ou planos específicos-##.
$ ./nutanix_home_clean.py --dryrun
$ ./nutanix_home_clean.py --dryrun=<##>
Execute todos os planos ou um plano específico-##.
$ ./nutanix_home_clean.py --executar
$ ./nutanix_home_clean.py --run=<##>
Execute todos os planos ou um plano específico-##.
Opções adicionais
--operação=<op> Escolha a operação (remover, abrigar)
--sheletedir=<caminho> Defina o local de abrigo.
--sim Para pular o aviso de isenção de responsabilidade e confirmação.

Se um item estiver listado como "instrução" na coluna Operação, você poderá visualizar as instruções executando esse item.

Por exemplo:

 ┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐
│ Planos de limpeza: Itens em questão │ Operação │ Uso │
├─────────────────────────────────────── ──────────────────┼───────────┼────────┤
│ 5: Pacote de log (logbay) │remover │ 2,25G│
│10: Instalador baixado │instruções│ 824.00M│
│59: Possíveis arquivos criados manualmente │instrução│ 3.69G│
├─────────────────────────────────────── ──────────────────┴───────────┼────────┤
│ Total │ 6,74G│
╞═══════════════════════════════════════ ══════════════════════════════╧════════╡
│CVM xxxx │
│ /uso doméstico = 30,99G (80%) >> limpeza recomendada │
└─────────────────────────────────────── ───────────────────────────────────────┘

Os itens 10 e 59 são listados como "instrução". Para ver as instruções do item 10, execute-o inserindo "10" no menu principal e inserindo "R" na próxima tela. Exemplo de saída abaixo:

 ┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plano de limpeza 10 │ Operação │ Uso │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10: Instalador baixado │instruções│ 824.00M│ └─────────────────────────────────────────────────────────────────────────────────┴─────────────┴─────────┘ Menu do Plano 10 ( Sair, Voltar, Ajuda, Redigitalizar, Operação, Listar, Dryrun, Executar, Exportar): Operação R Run para o plano 10: "instrução" A operação manual é necessária para o plano 10 -- Instrução -- Esses instaladores baixados podem ser excluídos de "Atualizar software" no Prism. Encontre uma seção com "/home/nutanix/software_downloads/" no KB-1540 (http://portal.nutanix.com/kb/1540) Arquivos de instaladores mais antigos não puderam ser listados no Prism ou pelo ncli. Entre em contato com o Suporte Nutanix sempre que precisar de assistência. ┌─────────────────────────────────────── ──────────────────┬───────────┬────────┐ │ Plano de limpeza 10 │ Operação │ Uso │ ├─────────────────────────────────────── ──────────────────┼───────────┼────────┤ │10: Instalador baixado │instruções│ 824.00M│ └─────────────────────────────────────── ──────────────────┴───────────┴────────┘

Repita o procedimento acima para o item 59 para ver as instruções do item 59.

  1. Limpeza após a solução de problemas
    Espera-se que os arquivos de script baixados, logs e arquivos exportados sejam removidos manualmente após cada solução de problemas. O tamanho total desses arquivos deve ser pequeno e não afetará o sistema de arquivos do CVM. Você pode remover os seguintes arquivos quando o script se tornar desnecessário.
    <yymmdd-hhmmss> é a data e hora de criação.
    • No CVM onde o script KB é implantado ( /home/nutanix/tmp/ ):
      KB-1540_clean.sh - arquivo baixado do KB
      deploytool_yyyymmdd-hhmmss.log - log do script de implantação (desnecessário após a implantação)
      nutanix_home_clean.py - script principal da KB
      nutanix_home_clean_config.py - arquivo de configuração para o script principal
    • No restante das CVMs no cluster - se implantadas em todas as CVMs na etapa 2:
      nutanix_home_clean.py - script principal da KB
      nutanix_home_clean_config.py - arquivo de configuração para o script principal
    • Cada CVM onde nutanix_home_clean.py é executado:
      KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log - Log do script KB
      KB-1540_v12_yyyymmdd_hhmmss_export_*.csv - arquivos exportados (se exportados)

    O comando a seguir pode remover todos os itens acima:

     nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540* deploytool_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
    

Método 2: Método manual

LEIA POR FAVOR : Somente os arquivos sob os diretórios indicados abaixo são seguros para exclusão. Observe as orientações específicas para remover arquivos de cada diretório. Não use nenhum outro comando ou script para remover arquivos. Não use rm -rf sob nenhuma circunstância.

  1. Removendo logs antigos e arquivos core. Exclua apenas os arquivos dentro dos seguintes diretórios e não os diretórios em si .
  • /home/nutanix/dados/núcleos/
  • /home/nutanix/dados/binários_logs/
  • /home/nutanix/data/ncc/instalador/
  • /home/nutanix/dados/coletor_de_log/
  • /home/nutanix/prism/webapps/console/downloads/NCC-logs-*

Use a seguinte sintaxe para excluir arquivos dentro de cada um desses diretórios:

nutanix@cvm:~$ rm /home/nutanix/data/cores/*


  1. Removendo ISOs e binários de software antigos. Exclua apenas os arquivos dentro dos seguintes diretórios e não os diretórios em si .

Verifique a versão atual do AOS em execução em "Versão do Cluster":

nutanix@cvm:~$ ncli cluster info | egrep 'Cluster [Nome|Versão]'
Nome do cluster: Axxxxa
Versão do cluster: 5.10.2
  • /home/nutanix/software_uncompressed/ - A pasta software_uncompressed só é usada quando a pré-atualização está em execução e deve ser removida após uma atualização bem-sucedida. Se você vir um cluster em execução que não está sendo atualizado no momento, é seguro remover tudo dentro do diretório software_uncompressed. Exclua todas as versões antigas que não sejam a versão para a qual você está atualizando.
  • /home/nutanix/foundation/isos/ - ISOs antigas de hipervisores ou Phoenix.
  • /home/nutanix/foundation/tmp/ - Arquivos temporários que podem ser excluídos.
    Use a seguinte sintaxe para excluir arquivos dentro de cada um desses diretórios:
     nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/*
    nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
    
  • /home/nutanix/software_downloads/

    Se os arquivos no diretório software_downloads não forem necessários para nenhuma atualização planejada, remova-os do Prism Web Console > Configurações > Atualizar software . Verifique também as guias File Server , Hypervisor , NCC e Foundation para localizar os downloads que você pode não precisar. O exemplo abaixo ilustra duas versões do AOS disponíveis para atualização, cada uma consome cerca de 5 GB. Clique no 'X' para excluir os arquivos.

    download_de_software

    Se estiver marcada, desmarque a opção “Enable Automatic Download”. Se não for monitorado, o cluster baixará várias versões, consumindo espaço no diretório home desnecessariamente.

  1. Verifique novamente o uso do espaço em /home usando df -h (consulte a Orientação Geral deste artigo) para confirmar se agora está abaixo de 70%.

Observação: se você não conseguir excluir os arquivos com o seguinte erro e espaço não reivindicado, entre em contato com o Suporte Nutanix para obter assistência.

nutanix@CVM:~$ sudo rm -f /home/nutanix/data/software_uncompressed/xxx
==> Arquivos de sistema detectados:
/home/nutanix/dados/software_descompactado/xxx
Operação não permitida. A exclusão de arquivos do sistema causará instabilidade do cluster e potencial perda de dados.


Notas importantes para clusters NC2:
Foi observado em algumas instâncias de clusters NC2 que /tmp fica quase cheio. Você pode seguir os passos abaixo para limpar o diretório ~/tmp.

  1. SSH para o CVM afetado e verifique o uso do disco executando o comando "df -h":
     nutanix@CVM:~$ df -h /tmp
    Tamanho do sistema de arquivos usado Disponível Use% Montado em
    /dev/loop0 240M 236M 0 100% /tmp
    
  2. Na saída acima, podemos ver que /tmp está mostrando 100%. Altere o diretório para ~/tmp e classifique a lista usando sudo du -aSxh /tmp/* | sort -h .
     4,0 K /tmp/hsperfdata_nutanix 12 K /tmp/lost+found 23 K /tmp/rc_nutanix_start.1731.log 39 K /tmp/rc_nutanix_start.1734.log 78 M /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 M /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 M /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
  3. Da saída que você receber acima, exclua manualmente os arquivos maiores que 12K. Por exemplo, veja abaixo os arquivos excluídos da saída acima.
     nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
  4. Após a exclusão, você pode verificar o espaço livre disponível usando df -h :
     nutanix@CVM:~/tmp$ df -h /tmp
    Tamanho do sistema de arquivos usado Disponível Use% Montado em
    /dev/loop0 240M 14M 210M 6% /tmp
    
  5. Como você pode ver, o espaço livre disponível agora mostra 6%. Você pode verificar novamente com:
     nutanix@CVM:~$ ncc verificações_de_saúde verificações_de_hardware verificações_de_disco verificação_de_uso_de_disco --cvm_list= 
       
       
    ou
     nutanix@CVM:~$ ncc health_checks executar_tudo
    

Entre em contato com o Suporte Nutanix para obter assistência se o uso de /home ainda estiver acima do limite após a limpeza de arquivos dos diretórios aprovados. Em nenhuma circunstância você deve remover arquivos de quaisquer outros diretórios além dos recomendados por este artigo, pois eles podem ser críticos para o desempenho do CVM ou podem conter dados do usuário.

ID do documento:HT514182
Data de publicação original:09/09/2022
Data da última modificação:10/28/2024