Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены

Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены

Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены

Эта статья переведена автоматически. Щелкните здесь, чтобы просмотреть исходную версию на английском языке.

Описание

Важные примечания:

  • Не используйте эту статью KB или сценарий очистки, если раздел /home превышает лимит на виртуальной машине Prism Central (PCVM) . По вопросу PCVM см. статью KB 5228 .
  • Войдите в CVM как пользователь nutanix .
  • Не относитесь к Nutanix CVM (Controller VM) как к обычной машине Linux.
  • Не используйте rm -rf ни при каких обстоятельствах, если не указано иное. Это приведет к сценариям потери данных.
  • Если вы используете LCM-2.6 или LCM-2.6.0.1, сбор журналов LCM заполняет каталог /home, обратитесь к статье базы знаний 14671 для решения этой проблемы.
  • Если вы получили предупреждение о высоком уровне использования раздела /home в кластере под управлением NCC 4.0.0, проверьте также KB 10530 .
  • Вы можете просмотреть конкретные кластеры, затронутые этим оповещением, с помощью обнаружений на Портале поддержки, работающем на базе Nutanix Insights, здесь.
  • Если у вас возникли какие-либо сомнения, обратитесь в службу поддержки Nutanix .

О переполнении раздела CVM /home или каталога /home/nutanix может сообщаться в двух случаях:

  • Проверка работоспособности NCC disk_usage_check сообщает, что использование раздела /home превышает пороговое значение (по умолчанию 75%).
  • Проверка перед обновлением test_nutanix_partition_space проверяет, имеют ли все узлы не менее 5,6 ГБ места в каталоге /home/nutanix.

В Prism при проверке test_nutanix_partition_space перед обновлением выдаются следующие сообщения об ошибках:

Недостаточно места в каталоге /home/nutanix на контроллере VM [ip]. Доступно = x ГБ: Ожидается = x ГБ

Не удалось рассчитать минимально необходимое пространство

Не удалось получить данные об использовании диска для cvm [ip], скорее всего, из-за сбоя подключения по ssh к cvm

Неожиданный вывод от df на контроллере VM [ip]. Пожалуйста, обратитесь к preupgrade.out для получения дополнительной информации

Nutanix резервирует место на SSD-уровне каждой CVM для своих файлов и каталогов. Эти файлы и каталоги находятся в папке /home, которую вы видите при входе в CVM. Размер папки /home ограничен 40 ГБ, так что большая часть пространства на SSD доступна для пользовательских данных.

Из-за ограниченного размера раздела /home может иссякнуть свободное место и сработать оповещения Prism, сбои или предупреждения проверки работоспособности NCC или сбои проверки перед обновлением. Эти защитные барьеры существуют для предотвращения полного заполнения /home , поскольку это приводит к тому, что службы обработки данных, такие как Stargate, перестают отвечать. Кластеры, в которых разделы /home нескольких CVM заполнены на 100%, часто приводят к простою пользовательских виртуальных машин.

При очистке неиспользуемых двоичных файлов и старых журналов на CVM важно отметить, что все разделы пользовательских данных на каждом диске, связанном с данным узлом, также монтируются в /home. Вот почему мы настоятельно не рекомендуем использовать недокументированные команды, такие как rm -rf /home , так как это также сотрет каталоги пользовательских данных, смонтированные в этом пути. Цель этой статьи — помочь вам определить файлы, из-за которых на CVM мало свободного места, и удалить только те, которые можно удалить безопасно.

Решение

Примечание: Последние версии AOS включают улучшения и исправления ошибок, разработанные для оптимизации использования пространства /home. Чтобы избежать потенциальных проблем в будущем, крайне важно регулярно обновлять AOS.

Общее руководство

  • Проверка использования пространства в /home . Для размещения потенциального обновления AOS использование должно быть ниже 70%. Используйте команду df -h для проверки объема свободного пространства в /home . В примере ниже использование CVM xxx12 /home составляет 81%.
nutanix@cvm$ allssh "df -h /home"
================== xxx11 =================
/dev/md2 40G 22G 18G 55% /home
================== xxx12 =================
/dev/md2 40G 32G 7.4G 81% /home
================== xxx13 =================
/dev/md2 40G 24G 16G 61% /home

Чтобы получить дальнейшую разбивку использования в порядке убывания, используйте команду du -h с флагом -d, чтобы получить номер нужного вам уровня каталога. Например, ниже -d 2 подразумевает просмотр двух уровней каталогов из /home/nutanix/data , кроме того, добавление head -n 15 отобразит 15 верхних каталогов, которые затем можно будет сравнить с другими CVM, чтобы увидеть, откуда исходит высокое использование:

nutanix@CVM:~$ allssh "du -h -d 2 -x /home/nutanix/data |sort -h -r |head -n 15"
=================== xx.xx.xx.11 ==================
17G /home/nutanix/data
9.4G /home/nutanix/data/logs
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
2.5G /home/nutanix/data/logs/sysstats
512M /home/nutanix/data/ncc/installer
=================== xx.xx.xx.12 ==================
18G /home/nutanix/data
9.5G /home/nutanix/data/logs
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
3.0G /home/nutanix/data/logs/sysstats
610M /home/nutanix/data/logbay/taskdata
.
.
  • Информацию о разделе CVM /home можно собрать с помощью команды logbay (NCC 4.0.0 и выше, Nutanix KB 6691 ).
nutanix@cvm$ logbay собирать -t disk_usage_info
  • Очистка ненужных файлов в каталоге /home .

    Если у вас есть открытые дела с ожидающим анализа первопричины, уточните у владельца дела, требуются ли еще эти файлы журналов или их можно удалить.

    Предупреждения: прежде чем применять какие-либо обходные пути, обязательно сохраните важные примечания, упомянутые в начале статьи Базы знаний (KB).

Метод 1: Использование утвержденного сценария

Загрузите и запустите KB-1540_clean_v12.sh для очистки файлов из одобренных каталогов.

Примечание: этот скрипт НЕ предназначен для использования на виртуальной машине Prism Central.

  1. Из любого CVM выполните следующие команды для загрузки KB-1540_clean_v12.sh :
    (MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~$ cd ~/tmp
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ md5sum KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
  1. Разверните скрипт на локальной CVM или на всех CVM кластера:
nutanix@cvm:~/tmp$ sh KB-1540_clean_v12.sh

Выберите пакет для развертывания
1: Развернуть инструмент только на локальном CVM
2: Разверните инструмент на всех CVM в кластере
Выбор (Отмена="c"): <==== 1 или 2
  1. Выполните скрипт для очистки файлов из одобренных каталогов.
  • Помощь
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py --help [--no_color]
  • Интерактивный режим
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py [--no_color]
  • Неинтерактивный режим
nutanix@cvm:~/tmp$ ./nutanix_home_clean.py <команда> <опция> [--no_color]

Примечание: Если вывод скрипта или его раскраска выглядят некорректно, попробуйте задать переменную окружения перед запуском скрипта или используйте опцию «--no_color»:

nutanix@cvm:~/tmp$ TERM=xterm


Интерактивный режим

Изображение, добавленное пользователем

Главное меню
Все планы Переключить отображение планов (все / заинтересованные)
Re s может Повторное сканирование использований и обновление таблицы
Список всех Список всех целевых файлов/каталогов
Запустить все Запустить или прогнать все планы
Экспортировать все Экспорт всех целевых файлов/каталогов в CSV
##: План # Перейти в меню пунктов плана
Меню пункта плана
Re s может Повторное сканирование и обновление таблицы
Операции Изменить операцию (удалить/укрыть/и т.д.)
Список Список целевых файлов/каталогов
D ryrun Проведите пробный прогон этого плана
Бегать Запустите этот план
Экспорт Экспорт целевых файлов/каталогов в CSV

Неинтерактивный режим

Изображение, добавленное пользователем

Команды
$ ./nutanix_home_clean.py --scan Сканируйте и показывайте случаи использования.
$ ./nutanix_home_clean.py --list
$ ./nutanix_home_clean.py --list=<##>
Перечислите целевые файлы для всех планов или конкретного плана-##.
$ ./nutanix_home_clean.py --dryrun
$ ./nutanix_home_clean.py --dryrun=<##>
Пробный прогон всех планов или конкретного плана-##.
$ ./nutanix_home_clean.py --run
$ ./nutanix_home_clean.py --run=<##>
Запустить все планы или определенный план-##.
Дополнительные возможности
--operation=<оп> Выберите операцию (удаление, укрытие)
--sheletedir=<путь> Установите место укрытия.
--да Для пропуска отказа от ответственности и подтверждения.

Если элемент указан как «инструкция» в столбце «Операция», вы можете просмотреть инструкции, запустив этот элемент.

Например:

 ┌â€────────────────────────────────────────────────────┬───────────┬────────┐
│ Планы уборки: Затронутые пункты │ Эксплуатация │ Использование │
├─────────────────────────────────────────────────────┼──────────┼────────┤
│ 5: Пакет журналов (logbay) │удалить │ 2.25G│
│10: Загруженный установщик │инструкция│ 824.00M│
│59: Возможные файлы, созданные вручную │инструкция│ 3.69G│
├─────────────────────────────────────────────────────┴──────────┼────────┤
│ Всего │ 6.74G│
╞═══════════════════════════════════════ ══════════════════════════════╧════════╡
│CVM хххх │
│ /домашнее использование = 30,99 г (80%) >> рекомендуется очистка │
└─────────────────────────────────────────────────────────────────────────┘

Элементы 10 и 59 указаны как "instruction". Чтобы увидеть инструкции для элемента 10, запустите его, введя "10" в главном меню и введя "R" на следующем экране. Пример вывода ниже:

 ┌â€────────────────────────────────────────────────────┬───────────┬────────┐ │ План уборки 10 │ Эксплуатация │ Использование │ ├──────────────────────────────────────────────────────┼──────────┼───────┤ │10: Загруженный установщик │инструкция│ 824.00M│ └──────────────────────────────────────────────────────────────────────────────────────────────────────┴─────────┘ Меню План 10 (Выход, Назад, Справка, Повторное сканирование, Операция, Список, Сухой запуск, Запуск, Экспорт): R Запустить операцию для плана 10: "instruction" Для плана 10 требуется ручная операция -- Инструкция -- Эти загруженные установщики можно удалить из "Обновления программного обеспечения" на Prism. Найдите раздел с "/home/nutanix/software_downloads/" на KB-1540 (http://portal.nutanix.com/kb/1540) Старые файлы установщика не удалось найти в списке Prism или ncli. Пожалуйста, свяжитесь со службой поддержки Nutanix, когда вам понадобится помощь. ┌â€────────────────────────────────────────────────────┬───────────┬────────┐ │ План уборки 10 │ Эксплуатация │ Использование │ ├─────────────────────────────────────────────────────┼──────────┼────────┤ │10: Загруженный установщик │инструкция│ 824.00M│ └─────────────────────────────────────────────────────┴──────────┴────────┘

Повторите вышеизложенное для пункта 59, чтобы увидеть инструкции для пункта 59.

  1. Уборка после устранения неполадок
    Загруженные файлы скриптов, журналы и экспортированные файлы должны удаляться вручную после каждого устранения неполадок. Общий размер этих файлов должен быть небольшим и не повлияет на файловую систему CVM. Вы можете удалить следующие файлы, как только скрипт станет ненужным.
    <yymmdd-hhmmss> — дата и время создания.
    • В CVM, где развернут скрипт KB ( /home/nutanix/tmp/ ):
      KB-1540_clean.sh - скачанный файл из KB
      deploytool_yyyymmdd-hhmmss.log - журнал скрипта развертывания (не нужен после развертывания)
      nutanix_home_clean.py - основной скрипт KB
      nutanix_home_clean_config.py - файл конфигурации для основного скрипта
    • В остальных CVM в кластере — если развернуто на всех CVM на шаге 2:
      nutanix_home_clean.py - основной скрипт KB
      nutanix_home_clean_config.py - файл конфигурации для основного скрипта
    • Каждая CVM, где запущен nutanix_home_clean.py:
      KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log - Журнал скрипта KB
      KB-1540_v12_yyyymmdd_hhmmss_export_*.csv - экспортированные файлы (если экспортировались)

    Следующая команда может удалить все вышеперечисленное:

     nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540* deploytool_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
    

Метод 2: Ручной метод

ПОЖАЛУЙСТА, ПРОЧИТАЙТЕ : Только файлы в указанных ниже каталогах можно безопасно удалить. Обратите внимание на конкретные указания по удалению файлов из каждого каталога. Не используйте никакие другие команды или скрипты для удаления файлов. Ни при каких обстоятельствах не используйте rm -rf .

  1. Удаление старых журналов и основных файлов. Удаляйте только файлы внутри следующих каталогов, а не сами каталоги .
  • /home/nutanix/data/cores/
  • /home/nutanix/data/binary_logs/
  • /home/nutanix/data/ncc/installer/
  • /home/nutanix/data/log_collector/
  • /home/nutanix/prism/webapps/console/downloads/NCC-logs-*

Для удаления файлов в каждом из этих каталогов используйте следующий синтаксис:

nutanix@cvm:~$ rm /home/nutanix/data/cores/*


  1. Удаление старых ISO и двоичных файлов программного обеспечения. Удаляйте только файлы внутри следующих каталогов, а не сами каталоги .

Проверьте текущую версию AOS в разделе «Версия кластера»:

nutanix@cvm:~$ ncli информация о кластере | egrep 'Кластер [Имя|Версия]'
Имя кластера: Axxxxa
Версия кластера: 5.10.2
  • /home/nutanix/software_uncompressed/ - папка software_uncompressed используется только при запуске предварительного обновления и должна быть удалена после успешного обновления. Если вы видите работающий кластер, который в данный момент не обновляется, можно безопасно удалить все в каталоге software_uncompressed. Удалите все старые версии, кроме той, до которой вы обновляетесь.
  • /home/nutanix/foundation/isos/ - Старые ISO-образы гипервизоров или Phoenix.
  • /home/nutanix/foundation/tmp/ — Временные файлы, которые можно удалить.
    Для удаления файлов в каждом из этих каталогов используйте следующий синтаксис:
     nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/*
    nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
    
  • /home/nutanix/загрузки_программного_обеспечения/

    Если файлы в каталоге software_downloads не требуются для запланированных обновлений, удалите их из Prism Web Console > Settings> Upgrade Software . Также проверьте вкладки File Server , Hypervisor , NCC и Foundation , чтобы найти загрузки, которые вам могут не понадобиться. В примере ниже показаны две версии AOS, доступные для обновления, каждая из которых занимает около 5 ГБ. Нажмите «X», чтобы удалить файлы.

    загрузка_программного_обеспечения

    Если он отмечен, снимите флажок «Включить автоматическую загрузку». Если его не контролировать, кластер будет загружать несколько версий, потребляя место в домашнем каталоге без необходимости.

  1. Повторно проверьте использование места в /home с помощью df -h (см. Общие указания в этой статье), чтобы убедиться, что оно теперь ниже 70%.

Примечание: Если вам не удается удалить файлы из-за следующей ошибки и невостребованного пространства, обратитесь за помощью в службу поддержки Nutanix .

nutanix@CVM:~$ sudo rm -f /home/nutanix/data/software_uncompressed/xxx
==> Обнаружены системные файлы:
/home/nutanix/data/software_uncompressed/xxx
Операция не разрешена. Удаление системных файлов приведет к нестабильности кластера и потенциальной потере данных.


Важные примечания для кластеров NC2:
В некоторых случаях кластеров NC2 наблюдалось, что /tmp почти заполняется. Вы можете выполнить следующие шаги, чтобы очистить каталог ~/tmp.

  1. Подключитесь по SSH к затронутой CVM и проверьте использование диска, выполнив команду «df -h»:
     nutanix@CVM:~$ df -h /tmp
    Файловая система Размер Использовано Доступно Использовано% Смонтировано на
    /dev/loop0 240M 236M 0 100% /tmp
    
  2. В приведенном выше выводе мы видим, что /tmp показывает 100%. Измените каталог на ~/tmp и отсортируйте список с помощью sudo du -aSxh /tmp/* | sort -h .
     4,0 тыс. /tmp/hsperfdata_nutanix 12 тыс. /tmp/lost+found 23 тыс. /tmp/rc_nutanix_start.1731.log 39 тыс. /tmp/rc_nutanix_start.1734.log 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
  3. Из полученного выше вывода вручную удалите файлы размером более 12K. Например, см. ниже файлы, удаленные из вышеприведенного вывода.
     nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
  4. После удаления вы можете проверить доступное свободное место с помощью df -h :
     nutanix@CVM:~/tmp$ df -h /tmp
    Файловая система Размер Использовано Доступно Использовано% Смонтировано на
    /dev/loop0 240M 14M 210M 6% /tmp
    
  5. Как вы видите, доступное свободное место теперь показывает 6%. Вы можете дополнительно перепроверить с помощью:
     nutanix@CVM:~$ ncc проверки_здоровья проверки_оборудования проверки_дисков проверка_использования_диска --cvm_list= 
       
       
    или
     nutanix@CVM:~$ ncc health_checks run_all
    

Обратитесь в службу поддержки Nutanix за помощью, если использование /home все еще превышает пороговое значение после очистки файлов из одобренных каталогов. Ни при каких обстоятельствах не удаляйте файлы из других каталогов, кроме рекомендованных в этой статье, поскольку они могут иметь решающее значение для производительности CVM или содержать пользовательские данные.

ID документа:HT514182
Дата публикации оригинала:09/09/2022
Дата последнего изменения:10/28/2024