NCC 健康检查:cvm_memory_usage_check
NCC 健康检查:cvm_memory_usage_check
NCC 健康检查:cvm_memory_usage_check
描述
NCC 健康检查cvm_memory_usage_check验证每个控制器虚拟机 (CVM) 在每个节点上是否有足够的可用内存。
检查使用每个 CVM 上/proc/meminfo中报告的MemAvailable指标。默认情况下,如果任何 CVM 上的MemAvailable小于以下值,则检查失败:
- 768000 KB (750 MB),带有
- 589824 KB (576 MB),NCC 3.10 及更高版本
注意:如果任何 CVM 上的MemAvailable值持续 20 分钟低于配置的阈值,则会触发“CVM 或 PC VM RAM 使用率高”的严重警报,ID 为 A1056。
如果收到以下警告且可用内存大小大于 750 MB,请升级到最新版本的 NCC。
控制器虚拟机或 Prism Central 虚拟机 {ip_address} 中的主内存使用率很高。{available_memory_kb} KB 的内存可用
运行 NCC 检查
将 NCC 检查作为完整 NCC 健康检查的一部分运行。
或者您可以单独运行此检查。
您还可以从 Prism Web 控制台健康页面运行检查:选择操作>运行检查。选择所有检查并单击运行。
- 此检查在控制器虚拟机和 Prism Central 虚拟机上运行。
- 默认情况下,此检查每 5 分钟运行一次。
- 此检查将在预定时间间隔内连续 5 次失败后生成警报。
注意:我们可以在 /proc/meminfo 中看到与 MemAvailable 类似的 MemFree 类别。但是,MemFree 不包含可回收的缓冲区和缓存内存区域。因此,我们不应该检查 MemFree 的值以获取可用内存。
示例输出
状态:警告
------------------------------------------------------------------------------------+
cvm_memory_usage_check 的详细信息:
节点xxxx:
警告:无法解析来自 xxxx 的响应:
有关 cvm_memory_usage_check 的详细信息,请参阅 KB 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新检查:ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxx
状态:失败(NCC 3.10 及更高版本为 589824 KB,NCC <3.10 版本为 758000 KB )
节点xxxx:
控制器 VM 10.xxx 中的主内存使用率很高。有 758000 KB 的内存可用。
有关 cvm_memory_usage_check 的详细信息,请参阅 KB 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新检查:ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxx
输出消息
检查身份证 | 3023 |
---|---|
描述 | 检查 CVM 或 Prism Central VM 内存使用率是否过高。 |
失败的原因 | 控制器 VM 或 Prism Central VM 上的 RAM 使用率很高。 |
决议 | 检查 Prism Central VM 或 Controller VM 的内存利用率。如果发现异常行为,请收集日志并联系 Nutanix 支持。 |
影响 | 集群性能可能会显著下降。 |
警报编号 | A1056 |
警报标题 | CVM 或 Prism Central VM RAM 使用率高 |
警报智能标题 | vm_type上的 RAM 使用率过高: ip_address |
警报消息 | vm_type ip_address中的主内存使用率较高, available_memory_kb KB 是空闲的。 |
注意:要检查此警报是在 CVM 还是 PCVM(Prism Central VM)上生成的,请选择警报并检查 UI 上提到的源实体。它将打印生成警报的虚拟机的名称。
解决方案
如果检查报告警告,或触发“CVM 或 PC VM RAM 使用率高”警报,请确保根据集群上使用的功能,在阈值内存量内配置 CVM。有关更多信息,请参阅控制器 VM 内存配置(适用于 CVM)和Prism Central 实例配置(适用于 Prism Central VM) 。
如果检查在 PC VM 上报告警告,请执行以下操作:
- 确保根据 PC 集群上使用的功能,在阈值内存量范围内配置 PC VM。
Prism Central <5.17.1. 对于每个 Prism Central VM
电脑尺寸 | 虚拟 CPU | 内存 [GB] | 支持的虚拟机(跨所有集群) |
小的 | 4 | 16 GB | 2500(横向扩展:5000) |
大的 | 8 | 32 GB | 12500(横向扩展:25000) |
Prism Central 5.17.1 或更高版本。适用于每个 Prism Central VM。
电脑尺寸 | 虚拟 CPU | 内存 [GB] | 支持的虚拟机(跨所有集群) |
小的 | 6 | 26 GB | 2500(横向扩展:5000) |
大的 | 10 | 44 GB | 12500(横向扩展:25000) |
如果启用以下服务则需要额外的内存:
电脑尺寸 | 平静/飞跃或同时启用,GB | 微分段,GB |
小的 | 4 | 1 |
大的 | 8 | 1 |
- 在 Prism Central 环境中将 NCC 升级到最新版本。请参阅在 Prism Central 上升级 NCC 。
- 将 Prism Central 升级到 5.17.1 或更高版本。请参阅Prism Central 升级和安装。
- Prism Central VM 应仅根据 Prism Central 处理的 VM 配置标准资源大小,我们不建议添加任何自定义资源。 如果 PC VM 的配置在内存阈值范围内,但检查仍报告失败,请联系Lenovo Premier 支持(如果您有服务)或Nutanix 支持,以验证 PC VM 服务是否按预期运行。
- 使用行为学习工具从 Prism Central 仪表板检查是否有任何虚拟机过度配置了更多的内存资源。
在向Lenovo Premier Support (如果您有保障)或Nutanix 支持记录此问题的支持案例时,请将以下命令的输出包含在案例中:
- 收集当前内存使用情况信息(CVM 或 PCVM):
nutanix@cvm$ allssh “cat /proc/meminfo | grep Mem”
- 使用Logbay收集日志包,然后直接通过 FTP/SFTP 将其上传到案例,或手动通过支持门户上传。有关如何使用 Logbay 的更多信息,请参阅Nutanix KB 6691。要使用 Logbay 自动上传日志包,请使用--dst (FTP/SFTP 目标)和-c (支持案例编号)选项。
附加信息
- Nutanix KB 2473 - Nutanix 门户中的原始文档
- Lenovo ThinkAgile HX 系列知识库文章登陆页面