NCC 運作狀況檢查:cvm_memory_usage_check
NCC 運作狀況檢查:cvm_memory_usage_check
NCC 運作狀況檢查:cvm_memory_usage_check
描述
NCC 運作狀況檢查cvm_memory_usage_check驗證每個控制器虛擬機器 (CVM) 在每個節點上是否有足夠的可用記憶體。
檢查使用每個 CVM 上/proc/meminfo中報告的MemAvailable指標。預設情況下,如果任何 CVM 上的MemAvailable小於:
- 768000 KB (750 MB),其中
- NCC 3.10 及更高版本為 589824 KB (576 MB)
注意:如果任何 CVM 上的MemAvailable值小於配置的閾值達 20 分鐘,則會觸發「CVM 或 PC VM RAM 使用率高」嚴重警報,ID 為 A1056。
如果您收到以下警報且可用記憶體大小大於 750 MB,請升級至最新版本的 NCC。
控制器 VM 或 Prism Central VM {ip_address} 中的主記憶體使用率較高。 {available_memory_kb} KB 記憶體可用
運行 NCC 檢查
執行 NCC 檢查作為完整 NCC 運行狀況檢查的一部分。
或者您可以單獨執行此檢查。
您也可以從 Prism Web 控制台執行狀況頁面執行檢查:選擇操作>執行檢查。選擇所有檢查並點擊運行。
- 此檢查在控制器 VM 和 Prism Central VM 上執行。
- 預設情況下,此檢查計劃每 5 分鐘運行一次。
- 此檢查將在預定時間間隔內連續 5 次失敗後產生警報。
注意:我們可以在 /proc/meminfo 中看到類似 MemAvailable 的 MemFree 類別。但是,MemFree 不包含可以回收的緩衝區和快取記憶體區域。因此,我們不應該檢查可用記憶體的 MemFree 值。
樣本輸出
對於狀態:警告
-------------------------------------------------- ----------------------+
cvm_memory_usage_check的詳細資料:
節點xxx:
警告:無法解析來自 xxxx 的回應:
有關 cvm_memory_usage_check 的詳細信息,請參閱知識庫文章 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新檢查: ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxxvm
對於狀態: FAIL (NCC 3.10 及更高版本為 589824 KB,NCC <3.10 為 758000 KB )
節點xxx:
控制器 VM 10.xxx 中的主記憶體使用率很高。 758000 KB 記憶體可用。
有關 cvm_memory_usage_check 的詳細信息,請參閱知識庫文章 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新檢查: ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxxvm
輸出訊息
檢查身份證件 | 3023 |
---|---|
描述 | 檢查 CVM 或 Prism Central VM 記憶體使用率是否較高。 |
失敗原因 | 控制器 VM 或 Prism Central VM 上的 RAM 使用率很高。 |
決議 | 檢查 Prism Central VM 或控制器 VM 的記憶體使用率。如果發現異常行為,請收集日誌並聯絡 Nutanix 支援。 |
影響 | 集群性能可能會顯著下降。 |
警報ID | A1056 |
警報標題 | CVM 或 Prism Central VM RAM 使用率高 |
警報智慧標題 | vm_type上的 RAM 使用率較高: ip_address |
警報訊息 | vm_type ip_address中的主記憶體使用率較高, available_memory_kb KB 空閒。 |
注意:要檢查此警報是否在 CVM 或 PCVM(Prism Central VM)上生成,請選擇該警報並檢查 UI 上提到的來源實體。它將列印產生警報的虛擬機器的名稱。
解決方案
如果檢查報告警告,或觸發「CVM 或 PC VM RAM 使用率過高」警報,請確保根據叢集上使用的功能在閾值記憶體量內配置 CVM。有關更多信息,請參閱控制器 VM 內存配置(適用於 CVM)和Prism Central 實例配置(適用於 Prism Central VM) 。
如果檢查報告 PC VM 上的警告,請執行下列操作:
- 確保根據 PC 叢集上使用的功能,將 PC VM 配置在記憶體閾值範圍內。
棱鏡中心 <5.17.1。對於每個 Prism Central VM
電腦尺寸 | 虛擬CPU | 記憶體 [GB] | 支援的虛擬機器(跨所有集群) |
小的 | 4 | 16 GB | 2500(橫向擴展:5000) |
大的 | 8 | 32GB | 12500(橫向擴展:25000) |
Prism Central 5.17.1 或更高版本。對於每個 Prism Central VM。
電腦尺寸 | 虛擬CPU | 記憶體 [GB] | 支援的虛擬機器(跨所有集群) |
小的 | 6 | 26GB | 2500(橫向擴展:5000) |
大的 | 10 | 44GB | 12500(橫向擴展:25000) |
如果啟用以下服務,則需要額外的記憶體:
電腦尺寸 | 平靜/跳躍或兩者均啟用,GB | 微分段,GB |
小的 | 4 | 1 |
大的 | 8 | 1 |
- 在 Prism Central 環境中將 NCC 升級到最新版本。請參閱在 Prism Central 上升級 NCC 。
- 將 Prism Central 升級至 5.17.1 或更高版本。請參閱Prism Central 升級和安裝。
- Prism Central VM 應僅根據 Prism Central 處理的 VM 配置標準資源大小,我們不建議新增任何自訂資源。 如果 PC VM 配置在閾值記憶體量內,但檢查仍然報告失敗,請聯絡Lenovo Premier 支援(如果您有覆蓋範圍)或Nutanix 支援以驗證 PC VM 服務是否按預期運行。
- 使用行為學習工具從 Prism Central Dashboard 檢查是否有任何虛擬機器過度配置了更多記憶體資源。
當向Lenovo Premier Support (如果您有覆蓋範圍)或Nutanix Support記錄此問題的支援案例時,請將以下命令的輸出包含到案例中:
- 收集目前記憶體使用資訊(CVM 或 PCVM):
nutanix@cvm$ allssh "cat /proc/meminfo | grep Mem"
- 使用Logbay收集日誌包並直接透過 FTP/SFTP 或透過支援入口網站手動上傳到案例。有關如何使用 Logbay 的更多信息,請參閱Nutanix KB 6691 。若要使用 Logbay 自動上傳日誌包,請使用--dst (FTP/SFTP 目標)和-c (支援案例編號)選項。
附加資訊
- Nutanix KB 2473 - Nutanix 入口網站中的原始文檔
- Lenovo ThinkAgile HX 系列知識庫文章登陸頁面