Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены
Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены
Только AOS — что делать, если домашний раздел или домашний каталог Nutanix на контроллере виртуальной машины (CVM) заполнены
Описание
Важные примечания:
- Не используйте эту статью KB или сценарий очистки, если раздел /home превышает лимит на виртуальной машине Prism Central (PCVM) . По вопросу PCVM см. статью KB 5228 .
- Войдите в CVM как пользователь nutanix .
- Не относитесь к Nutanix CVM (Controller VM) как к обычной машине Linux.
- Не используйте rm -rf ни при каких обстоятельствах, если не указано иное. Это приведет к сценариям потери данных.
- Если вы используете LCM-2.6 или LCM-2.6.0.1, сбор журналов LCM заполняет каталог /home, обратитесь к статье базы знаний 14671 для решения этой проблемы.
- Если вы получили предупреждение о высоком уровне использования раздела /home в кластере под управлением NCC 4.0.0, проверьте также KB 10530 .
- Вы можете просмотреть конкретные кластеры, затронутые этим оповещением, с помощью обнаружений на Портале поддержки, работающем на базе Nutanix Insights, здесь.
- Если у вас возникли какие-либо сомнения, обратитесь в службу поддержки Nutanix .
О переполнении раздела CVM /home или каталога /home/nutanix может сообщаться в двух случаях:
- Проверка работоспособности NCC disk_usage_check сообщает, что использование раздела /home превышает пороговое значение (по умолчанию 75%).
- Проверка перед обновлением test_nutanix_partition_space проверяет, имеют ли все узлы не менее 5,6 ГБ места в каталоге /home/nutanix.
В Prism при проверке test_nutanix_partition_space перед обновлением выдаются следующие сообщения об ошибках:
Nutanix резервирует место на SSD-уровне каждой CVM для своих файлов и каталогов. Эти файлы и каталоги находятся в папке /home, которую вы видите при входе в CVM. Размер папки /home ограничен 40 ГБ, так что большая часть пространства на SSD доступна для пользовательских данных.
Из-за ограниченного размера раздела /home может иссякнуть свободное место и сработать оповещения Prism, сбои или предупреждения проверки работоспособности NCC или сбои проверки перед обновлением. Эти защитные барьеры существуют для предотвращения полного заполнения /home , поскольку это приводит к тому, что службы обработки данных, такие как Stargate, перестают отвечать. Кластеры, в которых разделы /home нескольких CVM заполнены на 100%, часто приводят к простою пользовательских виртуальных машин.
При очистке неиспользуемых двоичных файлов и старых журналов на CVM важно отметить, что все разделы пользовательских данных на каждом диске, связанном с данным узлом, также монтируются в /home. Вот почему мы настоятельно не рекомендуем использовать недокументированные команды, такие как rm -rf /home , так как это также сотрет каталоги пользовательских данных, смонтированные в этом пути. Цель этой статьи — помочь вам определить файлы, из-за которых на CVM мало свободного места, и удалить только те, которые можно удалить безопасно.
Решение
Примечание: Последние версии AOS включают улучшения и исправления ошибок, разработанные для оптимизации использования пространства /home. Чтобы избежать потенциальных проблем в будущем, крайне важно регулярно обновлять AOS.
Общее руководство
- Проверка использования пространства в /home . Для размещения потенциального обновления AOS использование должно быть ниже 70%. Используйте команду df -h для проверки объема свободного пространства в /home . В примере ниже использование CVM xxx12 /home составляет 81%.
================== xxx11 =================
/dev/md2 40G 22G 18G 55% /home
================== xxx12 =================
/dev/md2 40G 32G 7.4G 81% /home
================== xxx13 =================
/dev/md2 40G 24G 16G 61% /home
Чтобы получить дальнейшую разбивку использования в порядке убывания, используйте команду du -h с флагом -d, чтобы получить номер нужного вам уровня каталога. Например, ниже -d 2 подразумевает просмотр двух уровней каталогов из /home/nutanix/data , кроме того, добавление head -n 15 отобразит 15 верхних каталогов, которые затем можно будет сравнить с другими CVM, чтобы увидеть, откуда исходит высокое использование:
=================== xx.xx.xx.11 ==================
17G /home/nutanix/data
9.4G /home/nutanix/data/logs
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
2.5G /home/nutanix/data/logs/sysstats
512M /home/nutanix/data/ncc/installer
=================== xx.xx.xx.12 ==================
18G /home/nutanix/data
9.5G /home/nutanix/data/logs
4.6G /home/nutanix/data/installer/el7.*
4.6G /home/nutanix/data/installer
3.0G /home/nutanix/data/logs/sysstats
610M /home/nutanix/data/logbay/taskdata
.
.
- Информацию о разделе CVM /home можно собрать с помощью команды logbay (NCC 4.0.0 и выше, Nutanix KB 6691 ).
- Очистка ненужных файлов в каталоге /home .
Если у вас есть открытые дела с ожидающим анализа первопричины, уточните у владельца дела, требуются ли еще эти файлы журналов или их можно удалить.
Предупреждения: прежде чем применять какие-либо обходные пути, обязательно сохраните важные примечания, упомянутые в начале статьи Базы знаний (KB).
Метод 1: Использование утвержденного сценария
Загрузите и запустите KB-1540_clean_v12.sh для очистки файлов из одобренных каталогов.
Примечание: этот скрипт НЕ предназначен для использования на виртуальной машине Prism Central.
- Из любого CVM выполните следующие команды для загрузки KB-1540_clean_v12.sh :
(MD5:967eb7f5de91bb684f730eb4bb45a16d)
nutanix@cvm:~/tmp$ wget -O KB-1540_clean_v12.sh http://download.nutanix.com/kbattachments/1540/KB-1540_clean_v12.sh
nutanix@cvm:~/tmp$ md5sum KB-1540_clean_v12.sh
967eb7f5de91bb684f730eb4bb45a16d KB-1540_clean_v12.s
- Разверните скрипт на локальной CVM или на всех CVM кластера:
Выберите пакет для развертывания
1: Развернуть инструмент только на локальном CVM
2: Разверните инструмент на всех CVM в кластере
Выбор (Отмена="c"): <==== 1 или 2
- Выполните скрипт для очистки файлов из одобренных каталогов.
- Помощь
- Интерактивный режим
- Неинтерактивный режим
Примечание: Если вывод скрипта или его раскраска выглядят некорректно, попробуйте задать переменную окружения перед запуском скрипта или используйте опцию «--no_color»:
Интерактивный режим
Главное меню
|
Меню пункта плана
|
Неинтерактивный режим
Команды
|
Если элемент указан как «инструкция» в столбце «Операция», вы можете просмотреть инструкции, запустив этот элемент.
Например:
┌â€────────────────────────────────────────────────────┬───────────┬────────┐ │ Планы уборки: Затронутые пункты │ Эксплуатация │ Использование │ ├─────────────────────────────────────────────────────┼──────────┼────────┤ │ 5: Пакет журналов (logbay) │удалить │ 2.25G│ │10: Загруженный установщик │инструкция│ 824.00M│ │59: Возможные файлы, созданные вручную │инструкция│ 3.69G│ ├─────────────────────────────────────────────────────┴──────────┼────────┤ │ Всего │ 6.74G│ ╞═══════════════════════════════════════ ══════════════════════════════╧════════╡ │CVM хххх │ │ /домашнее использование = 30,99 г (80%) >> рекомендуется очистка │ └─────────────────────────────────────────────────────────────────────────┘
Элементы 10 и 59 указаны как "instruction". Чтобы увидеть инструкции для элемента 10, запустите его, введя "10" в главном меню и введя "R" на следующем экране. Пример вывода ниже:
┌â€────────────────────────────────────────────────────┬───────────┬────────┐ │ План уборки 10 │ Эксплуатация │ Использование │ ├──────────────────────────────────────────────────────┼──────────┼───────┤ │10: Загруженный установщик │инструкция│ 824.00M│ └──────────────────────────────────────────────────────────────────────────────────────────────────────┴─────────┘ Меню План 10 (Выход, Назад, Справка, Повторное сканирование, Операция, Список, Сухой запуск, Запуск, Экспорт): R Запустить операцию для плана 10: "instruction" Для плана 10 требуется ручная операция -- Инструкция -- Эти загруженные установщики можно удалить из "Обновления программного обеспечения" на Prism. Найдите раздел с "/home/nutanix/software_downloads/" на KB-1540 (http://portal.nutanix.com/kb/1540) Старые файлы установщика не удалось найти в списке Prism или ncli. Пожалуйста, свяжитесь со службой поддержки Nutanix, когда вам понадобится помощь. ┌â€────────────────────────────────────────────────────┬───────────┬────────┐ │ План уборки 10 │ Эксплуатация │ Использование │ ├─────────────────────────────────────────────────────┼──────────┼────────┤ │10: Загруженный установщик │инструкция│ 824.00M│ └─────────────────────────────────────────────────────┴──────────┴────────┘
Повторите вышеизложенное для пункта 59, чтобы увидеть инструкции для пункта 59.
- Уборка после устранения неполадок
Загруженные файлы скриптов, журналы и экспортированные файлы должны удаляться вручную после каждого устранения неполадок. Общий размер этих файлов должен быть небольшим и не повлияет на файловую систему CVM. Вы можете удалить следующие файлы, как только скрипт станет ненужным.
<yymmdd-hhmmss> — дата и время создания.- В CVM, где развернут скрипт KB ( /home/nutanix/tmp/ ):
KB-1540_clean.sh - скачанный файл из KB
deploytool_yyyymmdd-hhmmss.log - журнал скрипта развертывания (не нужен после развертывания)
nutanix_home_clean.py - основной скрипт KB
nutanix_home_clean_config.py - файл конфигурации для основного скрипта - В остальных CVM в кластере — если развернуто на всех CVM на шаге 2:
nutanix_home_clean.py - основной скрипт KB
nutanix_home_clean_config.py - файл конфигурации для основного скрипта - Каждая CVM, где запущен nutanix_home_clean.py:
KB-1540_v12_yyyymmdd_hhmmss_nutanix_home_clean.log - Журнал скрипта KB
KB-1540_v12_yyyymmdd_hhmmss_export_*.csv - экспортированные файлы (если экспортировались)
Следующая команда может удалить все вышеперечисленное:
nutanix@cvm:~/tmp$ allssh 'cd ~/tmp/; /usr/bin/rm KB-1540* deploytool_*.log nutanix_home_clean.py nutanix_home_clean_config.py'
- В CVM, где развернут скрипт KB ( /home/nutanix/tmp/ ):
Метод 2: Ручной метод
ПОЖАЛУЙСТА, ПРОЧИТАЙТЕ : Только файлы в указанных ниже каталогах можно безопасно удалить. Обратите внимание на конкретные указания по удалению файлов из каждого каталога. Не используйте никакие другие команды или скрипты для удаления файлов. Ни при каких обстоятельствах не используйте rm -rf .
- Удаление старых журналов и основных файлов. Удаляйте только файлы внутри следующих каталогов, а не сами каталоги .
- /home/nutanix/data/cores/
- /home/nutanix/data/binary_logs/
- /home/nutanix/data/ncc/installer/
- /home/nutanix/data/log_collector/
- /home/nutanix/prism/webapps/console/downloads/NCC-logs-*
Для удаления файлов в каждом из этих каталогов используйте следующий синтаксис:
- Удаление старых ISO и двоичных файлов программного обеспечения. Удаляйте только файлы внутри следующих каталогов, а не сами каталоги .
Проверьте текущую версию AOS в разделе «Версия кластера»:
Имя кластера: Axxxxa
Версия кластера: 5.10.2
- /home/nutanix/software_uncompressed/ - папка software_uncompressed используется только при запуске предварительного обновления и должна быть удалена после успешного обновления. Если вы видите работающий кластер, который в данный момент не обновляется, можно безопасно удалить все в каталоге software_uncompressed. Удалите все старые версии, кроме той, до которой вы обновляетесь.
- /home/nutanix/foundation/isos/ - Старые ISO-образы гипервизоров или Phoenix.
- /home/nutanix/foundation/tmp/ — Временные файлы, которые можно удалить.
Для удаления файлов в каждом из этих каталогов используйте следующий синтаксис:nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/isos/* nutanix@cvm:~$ /usr/bin/rm /home/nutanix/foundation/tmp/*
- /home/nutanix/загрузки_программного_обеспечения/
Если файлы в каталоге software_downloads не требуются для запланированных обновлений, удалите их из Prism Web Console > Settings> Upgrade Software . Также проверьте вкладки File Server , Hypervisor , NCC и Foundation , чтобы найти загрузки, которые вам могут не понадобиться. В примере ниже показаны две версии AOS, доступные для обновления, каждая из которых занимает около 5 ГБ. Нажмите «X», чтобы удалить файлы.
Если он отмечен, снимите флажок «Включить автоматическую загрузку». Если его не контролировать, кластер будет загружать несколько версий, потребляя место в домашнем каталоге без необходимости.
- Повторно проверьте использование места в /home с помощью df -h (см. Общие указания в этой статье), чтобы убедиться, что оно теперь ниже 70%.
Примечание: Если вам не удается удалить файлы из-за следующей ошибки и невостребованного пространства, обратитесь за помощью в службу поддержки Nutanix .
==> Обнаружены системные файлы:
/home/nutanix/data/software_uncompressed/xxx
Операция не разрешена. Удаление системных файлов приведет к нестабильности кластера и потенциальной потере данных.
Важные примечания для кластеров NC2:
В некоторых случаях кластеров NC2 наблюдалось, что /tmp почти заполняется. Вы можете выполнить следующие шаги, чтобы очистить каталог ~/tmp.
- Подключитесь по SSH к затронутой CVM и проверьте использование диска, выполнив команду «df -h»:
nutanix@CVM:~$ df -h /tmp Файловая система Размер Использовано Доступно Использовано% Смонтировано на /dev/loop0 240M 236M 0 100% /tmp
- В приведенном выше выводе мы видим, что /tmp показывает 100%. Измените каталог на ~/tmp и отсортируйте список с помощью sudo du -aSxh /tmp/* | sort -h .
4,0 тыс. /tmp/hsperfdata_nutanix 12 тыс. /tmp/lost+found 23 тыс. /tmp/rc_nutanix_start.1731.log 39 тыс. /tmp/rc_nutanix_start.1734.log 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 78 МБ /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575
- Из полученного выше вывода вручную удалите файлы размером более 12K. Например, см. ниже файлы, удаленные из вышеприведенного вывода.
nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.WARNING.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/infra-gateway.ntnx-i-02a754840c30b5e66-a-cvm.root.log.INFO.20230123-200932.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/.ntnx-i-02a754840c30b5e66-a-cvm.root.log.ERROR.20230123-201357.3575 nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1734.log nutanix@CVM:~/tmp$ sudo /usr/bin/rm /tmp/rc_nutanix_start.1731.log
- После удаления вы можете проверить доступное свободное место с помощью df -h :
nutanix@CVM:~/tmp$ df -h /tmp Файловая система Размер Использовано Доступно Использовано% Смонтировано на /dev/loop0 240M 14M 210M 6% /tmp
- Как вы видите, доступное свободное место теперь показывает 6%. Вы можете дополнительно перепроверить с помощью:
nutanix@CVM:~$ ncc проверки_здоровья проверки_оборудования проверки_дисков проверка_использования_диска --cvm_list=
илиnutanix@CVM:~$ ncc health_checks run_all
Обратитесь в службу поддержки Nutanix за помощью, если использование /home все еще превышает пороговое значение после очистки файлов из одобренных каталогов. Ни при каких обстоятельствах не удаляйте файлы из других каталогов, кроме рекомендованных в этой статье, поскольку они могут иметь решающее значение для производительности CVM или содержать пользовательские данные.