NCC 運作狀況檢查:cvm_memory_usage_check

NCC 運作狀況檢查:cvm_memory_usage_check

NCC 運作狀況檢查:cvm_memory_usage_check

這份文件為翻譯程式自動翻譯結果,請點選以下連結流灠英文版文件內容。

描述

NCC 運作狀況檢查cvm_memory_usage_check驗證每個控制器虛擬機器 (CVM) 在每個節點上是否有足夠的可用記憶體。

檢查使用每個 CVM 上/proc/meminfo中報告的MemAvailable指標。預設情況下,如果任何 CVM 上的MemAvailable小於:

  • 768000 KB (750 MB),其中
  • NCC 3.10 及更高版本為 589824 KB (576 MB)

注意:如果任何 CVM 上的MemAvailable值小於配置的閾值達 20 分鐘,則會觸發「CVM 或 PC VM RAM 使用率高」嚴重警報,ID 為 A1056。

如果您收到以下警報且可用記憶體大小大於 750 MB,請升級至最新版本的 NCC。

控制器 VM 或 Prism Central VM {ip_address} 中的主記憶體使用率較高。 {available_memory_kb} KB 記憶體可用

運行 NCC 檢查

執行 NCC 檢查作為完整 NCC 運行狀況檢查的一部分。

nutanix@cvm$ ncc health_checks run_all

或者您可以單獨執行此檢查。

nutanix@cvm$ ncc health_checks system_checks cvm_memory_usage_check

您也可以從 Prism Web 控制台執行狀況頁面執行檢查:選擇操作>執行檢查。選擇所有檢查並點擊運行

  • 此檢查在控制器 VM 和 Prism Central VM 上執行。
  • 預設情況下,此檢查計劃每 5 分鐘運行一次。
  • 此檢查將在預定時間間隔內連續 5 次失敗後產生警報。

注意:我們可以在 /proc/meminfo 中看到類似 MemAvailable 的 MemFree 類別。但是,MemFree 不包含可以回收的緩衝區和快取記憶體區域。因此,我們不應該檢查可用記憶體的 MemFree 值。

樣本輸出

對於狀態:警告

運行 /health_checks/system_checks/cvm_memory_usage_check [ 警告 ]
-------------------------------------------------- ----------------------+
cvm_memory_usage_check的詳細資料:
節點xxx:
警告:無法解析來自 xxxx 的回應:
有關 cvm_memory_usage_check 的詳細信息,請參閱知識庫文章 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新檢查: ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxxvm


對於狀態: FAIL (NCC 3.10 及更高版本為 589824 KB,NCC <3.10 為 758000 KB

cvm_memory_usage_check的詳細資料:
節點xxx:
控制器 VM 10.xxx 中的主記憶體使用率很高。 758000 KB 記憶體可用。
有關 cvm_memory_usage_check 的詳細信息,請參閱知識庫文章 2473 (http://portal.nutanix.com/kb/2473) 或使用以下命令重新檢查: ncc health_checks system_checks cvm_memory_usage_check --cvm_list=xxxxvm


輸出訊息

檢查身份證件 3023
描述 檢查 CVM 或 Prism Central VM 記憶體使用率是否較高。
失敗原因 控制器 VM 或 Prism Central VM 上的 RAM 使用率很高。
決議 檢查 Prism Central VM 或控制器 VM 的記憶體使用率。如果發現異常行為,請收集日誌並聯絡 Nutanix 支援。
影響 集群性能可能會顯著下降。
警報ID A1056
警報標題 CVM 或 Prism Central VM RAM 使用率高
警報智慧標題 vm_type上的 RAM 使用率較高: ip_address
警報訊息 vm_type ip_address中的主記憶體使用率較高, available_memory_kb KB 空閒。

注意:要檢查此警報是否在 CVM 或 PCVM(Prism Central VM)上生成,請選擇該警報並檢查 UI 上提到的來源實體。它將列印產生警報的虛擬機器的名稱。

解決方案

如果檢查報告警告,或觸發「CVM 或 PC VM RAM 使用率過高」警報,請確保根據叢集上使用的功能在閾值記憶體量內配置 CVM。有關更多信息,請參閱控制器 VM 內存配置(適用於 CVM)和Prism Central 實例配置(適用於 Prism Central VM)

如果檢查報告 PC VM 上的警告,請執行下列操作:

  1. 確保根據 PC 叢集上使用的功能,將 PC VM 配置在記憶體閾值範圍內。

棱鏡中心 <5.17.1。對於每個 Prism Central VM

電腦尺寸 虛擬CPU 記憶體 [GB] 支援的虛擬機器(跨所有集群)
小的 4 16 GB 2500(橫向擴展:5000)
大的 8 32GB 12500(橫向擴展:25000)

Prism Central 5.17.1 或更高版本。對於每個 Prism Central VM。

電腦尺寸 虛擬CPU 記憶體 [GB] 支援的虛擬機器(跨所有集群)
小的 6 26GB 2500(橫向擴展:5000)
大的 10 44GB 12500(橫向擴展:25000)

如果啟用以下服務,則需要額外的記憶體:

電腦尺寸 平靜/跳躍或兩者均啟用,GB 微分段,GB
小的 4 1
大的 8 1

  1. 在 Prism Central 環境中將 NCC 升級到最新版本。請參閱在 Prism Central 上升級 NCC
  2. 將 Prism Central 升級至 5.17.1 或更高版本。請參閱Prism Central 升級和安裝
  3. Prism Central VM 應僅根據 Prism Central 處理的 VM 配置標準資源大小,我們不建議新增任何自訂資源。 如果 PC VM 配置在閾值記憶體量內,但檢查仍然報告失敗,請聯絡Lenovo Premier 支援(如果您有覆蓋範圍)或Nutanix 支援以驗證 PC VM 服務是否按預期運行。
  4. 使用行為學習工具從 Prism Central Dashboard 檢查是否有任何虛擬機器過度配置了更多記憶體資源。


當向Lenovo Premier Support (如果您有覆蓋範圍)或Nutanix Support記錄此問題的支援案例時,請將以下命令的輸出包含到案例中:

  • 收集目前記憶體使用資訊(CVM 或 PCVM):
    nutanix@cvm$ allssh "cat /proc/meminfo | grep Mem"
  • 使用Logbay收集日誌包並直接透過 FTP/SFTP 或透過支援入口網站手動上傳到案例。有關如何使用 Logbay 的更多信息,請參閱Nutanix KB 6691 。若要使用 Logbay 自動上傳日誌包,請使用--dst (FTP/SFTP 目標)和-c (支援案例編號)選項。

附加資訊

文件ID:HT514184
原始發布日期:09/09/2022
Last Modified Date:09/11/2024