NCC 健康检查:cvm_memory_usage_check

NCC 健康检查:cvm_memory_usage_check

NCC 健康检查:cvm_memory_usage_check

这是机器翻译的文章,请单击此处查看原始英文版本。

描述

NCC 健康检查cvm_memory_usage_check验证每个控制器虚拟机 (CVM) 在每个节点上是否有足够的可用内存。

检查使用每个 CVM 上/proc/meminfo中报告的MemAvailable指标。默认情况下,如果任何 CVM 上的MemAvailable小于以下值,则检查失败:

  • 768000 KB (750 MB),带有
  • 589824 KB (576 MB),NCC 3.10 及更高版本

注意:如果任何 CVM 上的MemAvailable值持续 20 分钟低于配置的阈值,则会触发“CVM 或 PC VM RAM 使用率高”的严重警报,ID 为 A1056。

如果收到以下警告且可用内存大小大于 750 MB,请升级到最新版本的 NCC。

控制器虚拟机或 Prism Central 虚拟机 {ip_address} 中的主内存使用率很高。{available_memory_kb} KB 的内存可用

运行 NCC 检查

将 NCC 检查作为完整 NCC 健康检查的一部分运行。

nutanix@cvm$ ncc health_checks run_all

或者您可以单独运行此检查。

nutanix@cvm$ ncc 健康检查系统检查 cvm_memory_usage_check

您还可以从 Prism Web 控制台健康页面运行检查:选择操作>运行检查。选择所有检查并单击运行

  • 此检查在控制器虚拟机和 Prism Central 虚拟机上运行。
  • 默认情况下,此检查每 5 分钟运行一次。
  • 此检查将在预定时间间隔内连续 5 次失败后生成警报。

注意:我们可以在 /proc/meminfo 中看到与 MemAvailable 类似的 MemFree 类别。但是,MemFree 不包含可回收的缓冲区和缓存内存区域。因此,我们不应该检查 MemFree 的值以获取可用内存。

示例输出

状态:警告

正在运行 /health_checks/system_checks/cvm_memory_usage_check [警告]
------------------------------------------------------------------------------------+
cvm_memory_usage_check 的详细信息:
节点xxxx:
警告:无法解析来自 xxxx 的响应:
有关 cvm_memory_usage_check 的详细信息,请参阅 KB 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新检查:ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxx


状态:失败(NCC 3.10 及更高版本为 589824 KB,NCC <3.10 版本为 758000 KB

cvm_memory_usage_check 的详细信息:
节点xxxx:
控制器 VM 10.xxx 中的主内存使用率很高。有 758000 KB 的内存可用。
有关 cvm_memory_usage_check 的详细信息,请参阅 KB 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新检查:ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxx


输出消息

检查身份证 3023
描述 检查 CVM 或 Prism Central VM 内存使用率是否过高。
失败的原因 控制器 VM 或 Prism Central VM 上的 RAM 使用率很高。
决议 检查 Prism Central VM 或 Controller VM 的内存利用率。如果发现异常行为,请收集日志并联系 Nutanix 支持。
影响 集群性能可能会显著下降。
警报编号 A1056
警报标题 CVM 或 Prism Central VM RAM 使用率高
警报智能标题 vm_type上的 RAM 使用率过高: ip_address
警报消息 vm_type ip_address中的主内存使用率较高, available_memory_kb KB 是空闲的。

注意:要检查此警报是在 CVM 还是 PCVM(Prism Central VM)上生成的,请选择警报并检查 UI 上提到的源实体。它将打印生成警报的虚拟机的名称。

解决方案

如果检查报告警告,或触发“CVM 或 PC VM RAM 使用率高”警报,请确保根据集群上使用的功能,在阈值内存量内配置 CVM。有关更多信息,请参阅控制器 VM 内存配置(适用于 CVM)和Prism Central 实例配置(适用于 Prism Central VM)

如果检查在 PC VM 上报告警告,请执行以下操作:

  1. 确保根据 PC 集群上使用的功能,在阈值内存量范围内配置 PC VM。

Prism Central <5.17.1. 对于每个 Prism Central VM

电脑尺寸 虚拟 CPU 内存 [GB] 支持的虚拟机(跨所有集群)
小的 4 16 GB 2500(横向扩展:5000)
大的 8 32 GB 12500(横向扩展:25000)

Prism Central 5.17.1 或更高版本。适用于每个 Prism Central VM。

电脑尺寸 虚拟 CPU 内存 [GB] 支持的虚拟机(跨所有集群)
小的 6 26 GB 2500(横向扩展:5000)
大的 10 44 GB 12500(横向扩展:25000)

如果启用以下服务则需要额外的内存:

电脑尺寸 平静/飞跃或同时启用,GB 微分段,GB
小的 4 1
大的 8 1

  1. 在 Prism Central 环境中将 NCC 升级到最新版本。请参阅在 Prism Central 上升级 NCC
  2. 将 Prism Central 升级到 5.17.1 或更高版本。请参阅Prism Central 升级和安装
  3. Prism Central VM 应仅根据 Prism Central 处理的 VM 配置标准资源大小,我们不建议添加任何自定义资源。 如果 PC VM 的配置在内存阈值范围内,但检查仍报告失败,请联系Lenovo Premier 支持(如果您有服务)或Nutanix 支持,以验证 PC VM 服务是否按预期运行。
  4. 使用行为学习工具从 Prism Central 仪表板检查是否有任何虚拟机过度配置了更多的内存资源。


在向Lenovo Premier Support (如果您有保障)或Nutanix 支持记录此问题的支持案例时,请将以下命令的输出包含在案例中:

  • 收集当前内存使用情况信息(CVM 或 PCVM):
    nutanix@cvm$ allssh “cat /proc/meminfo | grep Mem”
  • 使用Logbay收集日志包,然后直接通过 FTP/SFTP 将其上传到案例,或手动通过支持门户上传。有关如何使用 Logbay 的更多信息,请参阅Nutanix KB 6691。要使用 Logbay 自动上传日志包,请使用--dst (FTP/SFTP 目标)和-c (支持案例编号)选项。

附加信息

文件ID:HT514184
初始发布日期:09/09/2022
最近修改日期:09/11/2024