Potencjalny brak dostępu do danych po wielokrotnych awariach dysków w rozproszonych macierzach RAID
Potencjalny brak dostępu do danych po wielokrotnych awariach dysków w rozproszonych macierzach RAID
Potencjalny brak dostępu do danych po wielokrotnych awariach dysków w rozproszonych macierzach RAID
Abstrakcyjny
Jeśli wiele dysków w macierzy rozproszonych macierzy RAID przestanie działać jednocześnie, a co najmniej jeden z tych napędów zostanie wymieniony, może pojawić się wiele rozgrzanych punktów węzłowych ze względu na APAR HU01792.
Ten problem występuje tylko w systemach z oprogramowaniem 7.8.1.5, 8.1.1.1 lub 8.1.2.0.
Zawartość
Odzyskiwanie z uszkodzonego dysku w macierzy rozproszonych RAID składa się z dwóch faz: przebudowy (gdzie dane są automatycznie przepisywane w celu przebudowania obszarów na innych dyskach w macierzy) i kopiowania (gdzie dane są kopiowane na nowy dysk, po awarii dysku jest fizycznie zastąpiony).
Jeśli więcej dysków zakończyło się niepowodzeniem, niż w obszarze tablicy znajdują się obszary odbudowy, to funkcja kopiowania działa w trybie awaryjnym. W przypadku wadliwych wersji oprogramowania ten zdegradowany copyback zakończy się niepowodzeniem, prowadząc do powstania gorących początków wielu węzłów i tymczasowej utraty dostępu do danych.
Naprawić
Systemy, w których występują dotknięte usterki wersje oprogramowania i korzystanie z usługi Distributed RAID, należy zaktualizować do wersji 7.8.1.6, 8.1.1.2 lub 8.1.2.1, aby temu zapobiec.
Obejście
Dopóki system nie zostanie zaktualizowany, należy zachować ostrożność podczas wymiany uszkodzonych dysków w macierzy rozproszonych RAID.
GUI pokazuje & część; Rebuild Areas total" wartość dla każdej tablicy.
- Jeśli liczba uszkodzonych dysków w tablicy jest mniejsza niż Całkowicie odbuduj obszary , napęd można wymienić na normalny.
- Jeśli liczba uszkodzonych dysków w macierzy jest równa lub większa niż przebudowuje obszary tota l , należy pilnie zaktualizować oprogramowanie do wersji stałej przed wymianą dysku. Po zakończeniu aktualizacji dysk można wymienić bez ryzyka wywołania tego problemu.