NCC 健康检查:pcvm_disk_usage_check

NCC 健康检查:pcvm_disk_usage_check

NCC 健康检查:pcvm_disk_usage_check

这是机器翻译的文章,请单击此处查看原始英文版本。

描述

NCC 健康检查pcvm_disk_usage_check验证 Prism Central (PC) VM 中的磁盘或系统分区使用量是否在限制范围内。

此项检查包含以下部分:

  1. 检查单个数据磁盘使用情况(NCC 3.5.1 中添加):
    • 如果使用率持续数小时超过 75%,则会返回警告以识别磁盘。
    • 如果使用率持续数小时超过 90%,则会返回 FAIL 来识别磁盘。
  2. 检查整体数据磁盘使用情况(NCC 3.10.1 中添加):
    • 如果几个小时内总体使用率超过 90%,则会返回警告。
  3. 检查 Prism Central VM 系统根分区使用情况(在 NCC 3.9.4 中添加)。如果分区使用率超过 95%,则仅返回 FAIL 消息。
  4. 检查 Prism Central VM 主分区使用情况(在 NCC 3.9.4 中添加):
    • 如果使用率超过 75%,则会返回警告。
    • 如果使用率超过 90%,则返回 FAIL。
  5. 检查 Prism Central VM CMSP 分区使用情况(在 NCC 3.10.1 中添加):
    • 如果使用率超过 75%,则会返回警告。
    • 如果使用率超过 90%,则返回 FAIL。
  6. 检查 Prism Central VM 升级磁盘分区使用情况(在 NCC 4.6.0 中添加):
    • 如果使用率超过 70%,则返回 FAIL。
    • 此检查每 5 分钟运行一次。
    • 如果故障超过 5 次(30 分钟),则会发出严重警报。

注意:如果您正在运行 LCM-2.6 或 LCM-2.6.0.1,LCM 日志收集将填满 /home 目录,请参阅KB-14671寻求解决方法。

运行 NCC 检查
将 NCC 检查作为完整 NCC 健康检查的一部分运行。

点击这里 显示以下详细信息:

检查 PC VM 中的磁盘使用情况
以下是如何检查 PC VM 上的磁盘使用情况的示例。

点击这里 显示以下示例:

触发 pcvm_disk_usage 检查 /home 分区上的警告/失败的场景

点击这里 显示此步骤的详细信息:

解决方案

如果检查报告 WARN 或 FAIL 状态,则表示磁盘使用率高于阈值,需要调查。通常,可以使用df -h查询空间利用率。以下输出显示了以下挂载点:

  • /dev/sdb1 是根分区
  • /dev/sdb3 是主分区
  • /dev/sdc1是数据盘分区
nutanix@pcvm$ df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 7.9G 0 7.9G 0% /dev tmpfs 7.9G 44K 7.9G 1% /dev/shm tmpfs 7.9G 6.1M 7.9G 1% /run tmpfs 7.9G 0 7.9G 0% /sys/fs/cgroup /dev/sdb1 9.8G 7.4G 2.3G 77% / /dev/sdb3 50G 8.5G 41G 18% /home /dev/sdc1 492G 150M 486G 1% /home/nutanix/data/stargate-storage/disks/NFS_2_0_267_5a298323_3c9f_4a6f_a265_10c4c1e6593e tmpfs 1.6G 0 1.6G 0% /run/user/1000 /dev/sde 98G 401M 93G 1% /home/nutanix/data/sys-storage/NFS_1_0_264_1f5cda9a_2b3f_4f49_b348_baeb0ae338b8 tmpfs 1.6G 0 1.6G 0% /run/user/0

数据磁盘使用情况/dev/sdXX或整体多磁盘使用情况

验证特定 Prism Central 大小支持的虚拟机数量是否在限制范围内(请从支持门户查阅适用于您版本的 Prism Central 指南以了解限制)。联系Nutanix 支持。打开支持案例时,将以下命令的输出附加到案例中。

 nutanix@pcvm$ allssh df -h nutanix@pcvm$ ncc health_checks system_checks pcvm_disk_usage_check

Prism Central VM 主分区/home ):

检查 NCC 输出以确定哪个 Prism Central VM 使用率较高,然后执行以下操作:

  1. 登录到 Prism Central VM。
  2. 使用cd命令将位置更改为 /home 分区。
  3. 使用以下命令按大小列出目录的内容:
     nutanix@pcvm$ ls -al | sort -k5,5nr

    检查输出中是否存在可以删除的大型未使用文件。

  4. 运行下面的du命令来列出每个文件和子目录的使用情况:
     nutanix@pcvm$ sudo du -skxh * | sort -h

    检查大型子目录的输出。您可以对每个有问题的子目录运行du命令,以进一步识别可以删除的大型未使用文件。

  5. 以下是/home下的一些常见子目录,其中可能存在大量未使用的文件:
    • /home/nutanix/software_downloads/ - 删除除您当前正在升级的版本之外的任何旧版本。
    • /home/nutanix/software_uncompressed/ - 删除除您当前正在升级的版本之外的任何旧版本。
    • /home/nutanix/data/cores - 删除不再需要的旧堆栈跟踪。
    • /home/nutanix/data/log_collector/ - 删除 NCC-logs-2018-07-20-111111111111111-1032057545.tar 格式的旧 NCC 日志。
    • /home/nutanix/foundation/isos/ ——旧 ISO。
    • /home/nutanix/foundation/tmp/ -可以删除的临时文件。

如果上述步骤不能解决问题,或者问题与本文前面介绍的情形之一相符,请按照下面概述的解决方案步骤进行操作。

Prism Central VM 根系统分区( / ) 或CMSP 分区( /dev/sdXX ):
考虑联系Nutanix 支持。收集以下命令的输出并将其附加到支持案例中:

 nutanix@pcvm$ allssh df -h nutanix@pcvm$ sudo du -h --max-depth=1 / 2>/dev/null nutanix@pcvm$ ncc health_checks system_checks pcvm_disk_usage_check

场景 1

点击这里 显示此场景的详细信息:

场景 2
如果您的 Prism Central 实例与此场景相符,请参阅KB-12707场景 #2并向Nutanix 支持部门提交案例,以获得有关从问题中恢复的帮助。

场景 3

点击这里 显示此场景的详细信息:

场景 4
Nutanix 已意识到此问题。此问题的修复将在未来的 PC 版本中提供。如需解决方法,请联系Nutanix 支持

场景 5
如果您发现 catalina.out 日志文件占用了大量空间,请使用以下命令重新启动 PCVM 上的 prism 服务。

点击这里 显示此场景的详细信息:

场景 6

按照KB-6082清除 inode 使用情况。

相关文章

文件ID:HT516503
初始发布日期:05/16/2024
最近修改日期:05/30/2024