RAID

Autor: Leandro Alegsa

23-11-2020 12:38

Spis treści

· 1 Wprowadzenie

o 1.1 Różnica między dyskami fizycznymi a logicznymi

o 1.2 Odczytywanie i zapisywanie danych

o 1.3 Co to jest RAID?

o 1.4 Dlaczego używać macierzy RAID?

o 1.5 Historia

· 2 Podstawowe pojęcia stosowane w systemach RAID

o 2.1 Buforowanie

o 2.2 Odwzorowanie: Więcej niż jedna kopia danych

o 2.3 Striping: Część danych znajduje się na innym dysku

o 2.4 Korekta błędów i usterek

o 2.5 Gorące części zamienne: stosowanie większej liczby dysków niż jest to konieczne

o 2.6 Rozmiar pasków i wielkość fragmentów: rozkładanie danych na kilku dyskach

o 2.7 Łączenie dysków: JBOD, konkatenacja lub rozpiętość

o 2.8 Drive Clone

o 2.9 Różne konfiguracje

· 3 Podstawy: proste poziomy RAID

o 3.1 Powszechnie stosowane poziomy RAID

§ 3.1.1 RAID 0 "striping"

§ 3.1.2 RAID 1 "zwierciadło"

§ 3.1.3 RAID 5 "striping z parytetem rozłożonym"

§ 3.1.4 Zdjęcia

o 3.2 Poziomy RAID stosowane w mniejszym stopniu

§ 3.2.1 RAID 2

§ 3.2.2 RAID 3 "striping z dedykowanym parytetem"

§ 3.2.3 RAID 4 "striping z dedykowanym parytetem".

§ 3.2.4 RAID 6

§ 3.2.5 Zdjęcia

o 3.3 Niestandardowe poziomy RAID

§ 3.3.1 Parytet podwójny / Parytet przekątny

§ 3.3.2 RAID-DP

§ 3.3.3 RAID 1.5

§ 3.3.4 RAID 5E, RAID 5EE i RAID 6E

§ 3.3.5 RAID 7

§ 3.3.6 Macierze RAID Intel Matrix

§ 3.3.7 Sterownik MD RAID dla systemu Linux

§ 3.3.8 RAID Z

§ 3.3.9 Zdjęcia

· 4 Łączenie poziomów RAID

· 5 Tworzenie macierzy RAID

o 5.1 Oprogramowanie RAID

o 5.2 Sprzętowa macierz RAID

o 5.3 Sprzętowo wspomagana macierz RAID

· 6 Różne terminy związane z awariami sprzętu

o 6.1 Wskaźnik awaryjności

o 6.2 Średni czas do utraty danych

o 6.3 Średni czas do powrotu do zdrowia

o 6.4 Nieodzyskiwalna bitowa stopa błędów

· 7 Problemy z RAID

o 7.1 Dodawanie dysków w późniejszym czasie

o 7.2 Powiązane awarie

o 7.3 Atomowość

o 7.4 Dane nieodzyskiwalne

o 7.5 Niezawodność zapisu w pamięci podręcznej

o 7.6 Kompatybilność urządzeń

· 8 Co RAID może, a czego nie może zrobić

o 8.1 Co RAID może zrobić

o 8.2 Czego RAID nie może zrobić

· 9 Przykład

· 10 Referencje

· 11 Inne strony internetowe

RAID jest akronimem, który oznacza Redundant Array of Inexpensive Disks lub Redundant Array of Independent Disks. RAID jest terminem używanym w informatyce. Dzięki macierzy RAID kilka dysków twardych jest tworzonych w jednym dysku logicznym. Istnieją różne sposoby, aby to zrobić. Każda z metod łączenia dysków twardych ma pewne zalety i wady w porównaniu z wykorzystaniem dysków jako pojedynczych, niezależnych od siebie dysków. Głównymi powodami stosowania macierzy RAID są:

Aby utrata danych odbywała się rzadziej. Odbywa się to poprzez posiadanie kilku kopii danych.
Aby uzyskać więcej miejsca do przechowywania dzięki wielu mniejszym dyskom.
Aby uzyskać większą elastyczność (dyski mogą być zmieniane lub dodawane podczas pracy systemu)
Aby szybciej uzyskać dane.

Nie jest możliwe osiągnięcie wszystkich tych celów w tym samym czasie, dlatego należy dokonać wyboru.

Są też pewne złe rzeczy:

Niektóre wybory mogą chronić przed utratą danych z powodu awarii jednego (lub kilku) dysków. Nie chronią one jednak przed usunięciem lub nadpisaniem danych.
W niektórych konfiguracjach, RAID może tolerować, że jeden lub kilka dysków zawiedzie. Po wymianie uszkodzonych dysków, dane muszą zostać zrekonstruowane. W zależności od konfiguracji i rozmiaru dysków rekonstrukcja ta może trwać długo.
Pewne rodzaje błędów uniemożliwiają odczytanie danych

Większość prac nad macierzą RAID opiera się na dokumencie napisanym w 1988 roku.

Firmy używają systemów RAID do przechowywania swoich danych od momentu powstania technologii. Istnieją różne sposoby, w których systemy RAID mogą być wykonane. Od czasu jej odkrycia, koszt budowy systemu RAID znacznie spadł. Z tego powodu, nawet niektóre komputery i urządzenia, które są używane w domu mają pewne funkcje RAID. Takie systemy mogą być wykorzystywane do przechowywania muzyki lub filmów, na przykład.

Wprowadzenie

Różnica między dyskami fizycznymi a logicznymi

Dysk twardy jest częścią komputera. Normalne dyski twarde wykorzystują magnetyzm do przechowywania informacji. Gdy używane są dyski twarde, są one dostępne dla systemu operacyjnego. W systemie Microsoft Windows, każdy dysk twardy otrzymuje literę dysku (zaczynając od C:, A: lub B: są zarezerwowane dla dyskietek). Systemy operacyjne Unix i podobne do Linuksa mają jedno zakorzenione drzewo katalogów. Oznacza to, że osoby korzystające z komputerów czasami nie wiedzą, gdzie przechowywane są informacje (mówiąc szczerze, wielu użytkowników systemów Windows nie wie również, gdzie przechowywane są ich dane).

W obliczeniach dyski twarde (które są sprzętowe i mogą być dotykane) są czasami nazywane dyskami fizycznymi lub fizycznymi. To, co system operacyjny pokazuje użytkownikowi, jest czasami nazywane dyskami logicznymi. Dysk fizyczny może być podzielony na różne sekcje, zwane partycjami dyskowymi. Zazwyczaj, każda partycja dyskowa zawiera jeden system plików. System operacyjny pokazuje każdą partycję jak dysk logiczny.

Dlatego dla użytkownika zarówno konfiguracja z wieloma dyskami fizycznymi, jak i konfiguracja z wieloma dyskami logicznymi będzie wyglądać tak samo. Użytkownik nie może zdecydować, czy "dysk logiczny" jest taki sam jak dysk fizyczny, czy też po prostu jest częścią dysku. Sieci pamięci masowych (SAN) całkowicie zmieniają ten widok. Wszystko, co jest widoczne w sieci SAN, to kilka dysków logicznych.

Odczytywanie i zapisywanie danych

W komputerze dane są zorganizowane w postaci bitów i bajtów. W większości systemów 8 bitów składa się na jeden bajt. Pamięć komputerowa wykorzystuje energię elektryczną do przechowywania danych, dyski twarde wykorzystują magnetyzm. Dlatego, gdy dane są zapisywane na dysku, sygnał elektryczny jest zamieniany na magnetyczny. Kiedy dane są odczytywane z dysku, konwersja odbywa się w drugą stronę: Sygnał elektryczny jest wytwarzany na podstawie polaryzacji pola magnetycznego.

Co to jest RAID?

Macierz RAID łączy dwa lub więcej dysków twardych, dzięki czemu tworzą one dysk logiczny. Istnieją różne powody, dla których jest to robione. Najczęstsze z nich to:

Zatrzymanie utraty danych, gdy zawiedzie jeden lub więcej dysków macierzy.
Uzyskanie szybszego transferu danych.
Uzyskanie możliwości zmiany dysków podczas pracy systemu.
Łączenie kilku dysków w celu uzyskania większej pojemności magazynowej; czasami używa się wielu tanich dysków, a nie droższych.

RAID odbywa się za pomocą specjalnego sprzętu lub oprogramowania na komputerze. Połączone dyski twarde będą wtedy wyglądały dla użytkownika jak jeden dysk twardy. Większość poziomów macierzy RAID zwiększa nadmiarowość. Oznacza to, że przechowują one dane częściej, lub przechowują informacje o tym, jak je zrekonstruować. Pozwala to na awarię wielu dysków bez utraty danych. W przypadku wymiany uszkodzonego dysku, dane, które powinien on zawierać, zostaną skopiowane lub odtworzone z innych dysków systemu. Może to zająć dużo czasu. Czas ten zależy od różnych czynników, takich jak rozmiar macierzy.

Dlaczego używać macierzy RAID?

Jednym z powodów, dla których wiele firm używa macierzy RAID jest to, że dane w macierzy mogą być po prostu używane. Osoby korzystające z danych nie muszą być świadome, że w ogóle korzystają z macierzy RAID. Gdy wystąpi awaria i macierz jest odzyskiwana, dostęp do danych będzie wolniejszy. Dostęp do danych w tym czasie również spowolni proces odzyskiwania danych, ale i tak jest to znacznie szybsze niż brak możliwości pracy z danymi w ogóle. W zależności od poziomu macierzy RAID, dyski nie mogą jednak zawieść podczas przygotowywania nowego dysku do użytku. Awaria dysku w tym czasie spowoduje utratę wszystkich danych w macierzy.

Różne sposoby łączenia dysków są nazywane poziomami RAID. Większy numer dla danego poziomu nie musi być lepszy. Różne poziomy macierzy RAID mają różne cele. Niektóre poziomy macierzy RAID wymagają specjalnych dysków i specjalnych kontrolerów.

Historia

W 1978 roku, człowiek o nazwisku Norman Ken Ouchi, który pracował w IBM, przedstawił sugestię opisującą plany tego, co później stanie się RAID 5. Plany te opisywały również coś podobnego do RAID 1, jak również ochronę części RAID 4.

Pracownicy Uniwersytetu w Berkeley pomogli w zaplanowaniu badań w 1987 roku. Starali się, aby technologia RAID umożliwiała rozpoznanie dwóch dysków twardych zamiast jednego. Stwierdzili, że gdy technologia RAID posiadała dwa dyski twarde, miała znacznie lepszą pamięć masową niż w przypadku jednego dysku twardego. Jednak znacznie częściej dochodziło do awarii.

W 1988 roku, różne rodzaje RAID (od 1 do 5), zostały napisane przez Davida Pattersona, Gartha Gibsona i Randy'ego Katza w ich artykule, zatytułowanym "A Case for Redundant Arrays of Inexpensive Disks (RAID)". Ten artykuł był pierwszym, który nazwał nową technologię RAID i nazwa ta stała się oficjalna.

Blisko 4 dyski, które tworzą macierz RAID, wbudowaną w system komputerowy. Niebieskie zatrzaski pozwalają na wymianę dysków podczas pracy systemu.

Dysk twardy został usunięty z macierzy.

Podstawowe pojęcia stosowane w systemach RAID

RAID wykorzystuje kilka podstawowych idei, które zostały opisane w artykule "RAID: High-Performance, Reliable Secondary Storage" autorstwa Petera Chena i innych, opublikowanym w 1994 roku.

Caching

Caching jest technologią, która ma swoje zastosowanie również w systemach RAID. Istnieją różne rodzaje buforów, które są wykorzystywane w systemach RAID:

System operacyjny
Kontroler RAID
Macierze dyskowe klasy korporacyjnej

W nowoczesnych systemach, żądanie zapisu jest pokazywane tak, jak to się dzieje, gdy dane zostały zapisane w pamięci podręcznej. Nie oznacza to, że dane zostały zapisane na dysku. Żądania z pamięci podręcznej niekoniecznie są obsługiwane w tej samej kolejności, w jakiej zostały zapisane do pamięci podręcznej. To umożliwia, że w przypadku awarii systemu, czasami niektóre dane nie zostały zapisane na dysk, którego to dotyczy. Z tego powodu, wiele systemów posiada pamięć podręczną, która jest podtrzymywana przez baterię.

Zwierciadło: Więcej niż jedna kopia danych

Kiedy mówimy o lustrze, to jest to bardzo prosty pomysł. Zamiast danych znajdujących się tylko w jednym miejscu, istnieje kilka ich kopii. Kopie te zazwyczaj znajdują się na różnych dyskach twardych (lub partycjach dyskowych). Jeśli istnieją dwie kopie, jedna z nich może zawieść bez wpływu na dane (tak jak to jest w przypadku drugiej). Odtwarzanie kopii lustrzanych może również dać impuls podczas odczytu danych. Będzie ona zawsze pobierana z najszybszego dysku, który zareaguje. Zapisywanie danych jest jednak wolniejsze, ponieważ wszystkie dyski wymagają aktualizacji.

Striptizowanie: Część danych znajduje się na innym dysku

Dzięki pasowaniu dane są dzielone na różne części. Te części trafiają następnie na różne dyski (lub partycje dyskowe). To oznacza, że zapis danych jest szybszy, ponieważ można go wykonywać równolegle. Nie oznacza to, że nie dojdzie do błędów, ponieważ każdy blok danych znajduje się tylko na jednym dysku.

Korekta błędów i usterek

Możliwe jest obliczanie różnych rodzajów sum kontrolnych. Niektóre metody obliczania sum kontrolnych pozwalają na znalezienie błędu. Większość poziomów macierzy RAID, które wykorzystują redundancję, może to zrobić. Niektóre metody są trudniejsze do wykonania, ale pozwalają nie tylko wykryć błąd, ale i go naprawić.

Gorące części zamienne: użycie większej liczby dysków niż potrzeba

Wiele sposobów, aby mieć RAID obsługiwać coś jest nazywany hot spare. Gorący dysk zapasowy to pusty dysk, który nie jest używany podczas normalnej pracy. W przypadku awarii dysku, dane można skopiować bezpośrednio na gorący dysk zapasowy. W ten sposób uszkodzony dysk musi zostać wymieniony na nowy, pusty, aby stał się gorącym dyskiem zapasowym (hot spare).

Wielkość paska i wielkość kawałka: rozłożenie danych na kilku dyskach

RAID pracuje poprzez rozłożenie danych na kilku dyskach. Dwa z często używanych w tym kontekście terminów to wielkość paska i wielkość kawałków.

Rozmiar fragmentu jest najmniejszym blokiem danych, który jest zapisywany na pojedynczym dysku macierzy. Rozmiar paska to rozmiar bloku danych, który zostanie rozłożony na wszystkich dyskach. W ten sposób, z czterema dyskami i paskiem o rozmiarze 64 kilobajtów (kB), na każdym dysku zostanie zapisane 16 kB. Rozmiar fragmentu w tym przykładzie wynosi zatem 16 kB. Zwiększenie rozmiaru paska będzie oznaczać szybszy transfer danych, ale również większe maksymalne opóźnienie. W tym przypadku jest to czas potrzebny do uzyskania bloku danych.

Złożenie dysku: JBOD, konkatenacja lub rozpiętość

Wiele sterowników (a także oprogramowanie) może łączyć dyski w następujący sposób: Bierzemy pierwszy dysk, aż do końca, potem drugi, i tak dalej. W ten sposób, kilka mniejszych dysków wygląda jak większy. To nie jest tak naprawdę RAID, ponieważ nie ma nadmiarowości. Ponadto, spanning może łączyć dyski, gdzie RAID 0 nie może nic zrobić. Ogólnie rzecz biorąc, nazywa się to tylko kiść dysków (JBOD).

To jest jak daleki krewny macierzy RAID, ponieważ dysk logiczny jest wykonany z różnych dysków fizycznych. Konkatenacja jest czasami stosowana w celu przekształcenia kilku małych dysków w jeden większy dysk użyteczny. Nie można tego zrobić za pomocą macierzy RAID 0. Na przykład JBOD może łączyć dyski 3 GB, 15 GB, 5,5 GB i 12 GB w jeden dysk logiczny o pojemności 35,5 GB, co często jest bardziej przydatne niż same dyski.

Na wykresie po prawej stronie dane są zbierane od końca dysku 0 (blok A63) do początku dysku 1 (blok A64); koniec dysku 1 (blok A91) do początku dysku 2 (blok A92). Gdyby użyto macierzy RAID 0, wówczas dysk 0 i dysk 2 zostałyby obcięte do 28 bloków, czyli do wielkości najmniejszego dysku w macierzy (dysk 1) o łącznej wielkości 84 bloków.

Niektóre kontrolery RAID wykorzystują JBOD do rozmów o pracy na dyskach bez funkcji RAID. Każdy dysk pojawia się oddzielnie w systemie operacyjnym. Ten JBOD nie jest tym samym, co konkatenacja.

Wiele systemów Linux używa terminów "tryb liniowy" lub "tryb dodawania". Implementacja systemu Mac OS X 10.4 - zwana "Concatenated Disk Set" - nie pozostawia użytkownikowi żadnych użytecznych danych na pozostałych dyskach, jeśli jeden z dysków ulegnie awarii w zestawie połączonych dysków, mimo że dyski te działają w inny sposób, jak opisano powyżej.

Konkatenacja jest jednym z zastosowań Logicznego Menedżera Woluminów w Linuksie. Może być używany do tworzenia dysków wirtualnych.

Drive Clone

Większość nowoczesnych dysków twardych posiada standard o nazwie Self-Monitoring, Analysis and Reporting Technology (S.M.A.R.T.). SMART pozwala na monitorowanie pewnych rzeczy na dysku twardym. Niektóre kontrolery pozwalają na wymianę pojedynczego dysku twardego jeszcze przed jego awarią, na przykład dlatego, że S.M.A.R.T lub inny test dysku zgłasza zbyt wiele możliwych do skorygowania błędów. W tym celu sterownik kopiuje wszystkie dane na gorący dysk zapasowy. Następnie dysk może zostać wymieniony na inny (który po prostu stanie się nowym dyskiem hot spare).

Różne konfiguracje

Konfiguracja dysków i sposób korzystania z powyższych technik wpływa na wydajność i niezawodność systemu. W przypadku użycia większej liczby dysków, jeden z nich jest bardziej podatny na awarię. Z tego powodu, aby móc znaleźć i naprawić błędy, należy zbudować mechanizmy. Sprawia to, że cały system jest bardziej niezawodny, ponieważ jest w stanie przetrwać i naprawić awarię.

JBOD z 3 dyskami o różnych rozmiarach

Podstawy: proste poziomy RAID

Poziomy RAID w powszechnym użyciu

RAID 0 "striping"

RAID 0 nie jest tak naprawdę RAID, ponieważ nie jest zbędny. Dzięki macierzy RAID 0, dyski są po prostu łączone, aby stworzyć duży dysk. Nazywa się to "stripingiem". Kiedy jeden dysk ulegnie awarii, cała macierz ulega awarii. Dlatego też, macierz RAID 0 rzadko jest używana dla ważnych danych, ale odczyt i zapis danych z dysku może być szybszy przy stripingu, ponieważ każdy dysk odczytuje część pliku w tym samym czasie.

W macierzy RAID 0 bloki dyskowe, które przychodzą po sobie, są zazwyczaj umieszczane na różnych dyskach. Z tego powodu wszystkie dyski używane w macierzy RAID 0 powinny być tej samej wielkości.

RAID 0 jest często używana do Swapspace w systemach operacyjnych Linux lub Uniksopodobnych.

RAID 1 "mirroring"

W macierzy RAID 1, dwa dyski są połączone razem. Oba przechowują te same dane, jeden "lustrzany" jest drugi. Jest to łatwa i szybka konfiguracja, niezależnie od tego, czy jest realizowana za pomocą kontrolera sprzętowego czy oprogramowania.

RAID 5 "striping z rozproszonym parytetem"

Poziom 5 macierzy RAID jest tym, co jest prawdopodobnie używane przez większość czasu. Do zbudowania macierzy pamięci masowej RAID 5 potrzebne są co najmniej trzy dyski twarde. Każdy blok danych będzie przechowywany w trzech różnych miejscach. W dwóch z tych miejsc blok będzie przechowywany w takim stanie, w trzecim będzie przechowywana suma kontrolna. Suma kontrolna jest specjalnym przypadkiem kodu Reed-Solomona, w którym zastosowano tylko dodatek bitowy. Zazwyczaj jest ona obliczana przy użyciu metody XOR. Ponieważ metoda ta jest symetryczna, jeden utracony blok danych może zostać odbudowany z drugiego bloku danych i sumy kontrolnej. Dla każdego bloku, inny dysk będzie posiadał blok parzystości, na którym znajduje się suma kontrolna. Jest to robione w celu zwiększenia redundancji. Każdy dysk może zawieść. Ogólnie rzecz biorąc, jeden dysk będzie posiadał sumę kontrolną, więc całkowita użyteczna pojemność będzie taka sama jak wszystkich dysków z wyjątkiem jednego. Rozmiar wynikowego dysku logicznego będzie równy rozmiarowi wszystkich dysków razem, z wyjątkiem jednego, który przechowuje informacje o parzystości.

Oczywiście jest to wolniejsze niż poziom 1 macierzy RAID, ponieważ na każdym zapisie, wszystkie dyski muszą być odczytywane w celu obliczenia i aktualizacji informacji o parytecie. Wydajność odczytu z macierzy RAID 5 jest prawie tak dobra jak z macierzy RAID 0 dla tej samej liczby dysków. Z wyjątkiem bloków parzystości, rozkład danych na dyskach odbywa się według tego samego schematu, co w przypadku macierzy RAID 0. Powodem, dla którego macierz RAID 5 jest nieco wolniejsza, jest fakt, że dyski muszą przeskakiwać nad blokami parzystości.

RAID 5 z uszkodzonym dyskiem będzie nadal działać. Jest ona w trybie awaryjnym. Zdegradowana macierz RAID 5 może pracować bardzo wolno. Z tego powodu często dodawany jest dodatkowy dysk. Jest to tzw. gorący dysk zapasowy. Jeśli dysk ulegnie awarii, dane mogą być bezpośrednio odbudowane na dodatkowy dysk. Macierze RAID 5 można również dość łatwo wykonać w oprogramowaniu.

Głównie z powodu problemów z wydajnością nieudanych macierzy RAID 5, niektórzy eksperci bazy danych utworzyli grupę o nazwie BAARF - Battle Against Any Raid Five.

Jeśli system zawiedzie podczas aktywnego zapisu, parytet paska może stać się niespójny z danymi. Jeśli nie zostanie to naprawione przed awarią dysku lub bloku, może dojść do utraty danych. Do zrekonstruowania brakującego bloku w tym pasku zostanie użyty nieprawidłowy parytet. Ten problem jest czasami nazywany "dziurą w zapisie". Bateryjne pamięci podręczne i podobne techniki są powszechnie stosowane w celu zmniejszenia prawdopodobieństwa wystąpienia tego problemu.

Zdjęcia

RAID 0 po prostu stawia różne bloki na różnych dyskach. Nie ma żadnej nadmiarowości.

Z Raidem 1 każdy blok jest na obu dyskach

RAID 5 oblicza specjalne sumy kontrolne dla tych danych. Zarówno bloki z sumą kontrolną, jak i bloki z danymi są rozmieszczone na wszystkich dyskach.

Poziomy RAID wykorzystywane mniej

RAID 2

Używano tego z bardzo dużymi komputerami. Do korzystania z macierzy RAID poziomu 2 potrzebne są specjalne drogie dyski i specjalny kontroler. Dane są dystrybuowane na poziomie bitowym (wszystkie inne poziomy wykorzystują akcje na poziomie bajtowym). Wykonywane są specjalne obliczenia. Dane są dzielone na statyczne sekwencje bitów. Łączy się 8 bitów danych i 2 bity parzystości. Następnie obliczany jest kod Hamminga. Fragmenty kodu Hamming'a są następnie rozdzielane na różne dyski.

RAID 2 jest jedynym poziomem RAID, który może naprawić błędy, pozostałe poziomy RAID mogą je tylko wykryć. Kiedy stwierdzą, że potrzebne informacje nie mają sensu, po prostu go odbudować. Dokonuje się tego za pomocą obliczeń, wykorzystując informacje na innych dyskach. Jeśli tych informacji brakuje lub są one błędne, nie mogą zrobić wiele. Ponieważ używa kodów Hamming, RAID 2 może dowiedzieć się, który kawałek informacji jest źle, i poprawić tylko ten kawałek.

RAID 2 potrzebuje co najmniej 10 dysków do pracy. Ze względu na swoją złożoność i zapotrzebowanie na bardzo drogi i specjalny sprzęt, macierz RAID 2 nie jest już używana bardzo często.

RAID 3 "striping z dedykowanym parytetem"

Raid Level 3 jest podobny do RAID Level 0. Dodatkowy dysk jest dodawany w celu przechowywania informacji o parzystości. Odbywa się to poprzez bitowe dodawanie wartości bloku na pozostałych dyskach. Informacja o parzystości jest zapisywana na oddzielnym (dedykowanym) dysku. Nie jest to dobre, ponieważ w przypadku awarii dysku z parytetem, informacje o parytecie są tracone.

Poziom 3 macierzy RAID jest zazwyczaj wykonywany na co najmniej 3 dyskach. Konfiguracja dwóch dysków jest identyczna jak w przypadku macierzy RAID Level 0.

RAID 4 "striping z dedykowanym parytetem"

Jest to bardzo podobne do macierzy RAID 3, z tą różnicą, że informacja o parytecie jest obliczana na większych blokach, a nie na pojedynczych bajtach. To jest jak RAID 5. Do macierzy RAID 4 potrzebne są co najmniej trzy dyski.

RAID 6

Poziom RAID 6 nie był oryginalnym poziomem RAID. Dodaje on dodatkowy blok parzystości do macierzy RAID 5. Potrzebuje ona co najmniej czterech dysków (dwa dyski na pojemność, dwa dyski na nadmiarowość). RAID 5 może być traktowana jako specjalny przypadek kodu Reed-Solomon. RAID 5 jest specjalnym przypadkiem, jednak wymaga jedynie uzupełnienia w polu Galois GF(2). Jest to łatwe do zrobienia z XOR-ami. RAID 6 rozszerza te obliczenia. Nie jest to już specjalny przypadek, a wszystkie obliczenia muszą być wykonane. W macierzy RAID 6 używana jest dodatkowa suma kontrolna (zwana wielomianem), zwykle GF(²⁸). Dzięki takiemu podejściu możliwe jest zabezpieczenie przed dowolną liczbą uszkodzonych dysków. W macierzy RAID 6 stosuje się dwie sumy kontrolne w celu zabezpieczenia przed utratą dwóch dysków.

Podobnie jak w przypadku macierzy RAID 5, parytet i dane znajdują się na różnych dyskach dla każdego bloku. Dwa bloki parzystości znajdują się również na różnych dyskach.

Istnieją różne sposoby wykonania macierzy RAID 6. Różnią się one wydajnością zapisu, a także tym, jak bardzo potrzebne są obliczenia. Zdolność do szybszego zapisu oznacza zazwyczaj konieczność wykonania większej liczby obliczeń.

RAID 6 jest wolniejszy niż RAID 5, ale pozwala na kontynuowanie pracy z dwoma dowolnymi dyskami, które zawiodły. RAID 6 staje się popularna, ponieważ pozwala na odbudowę macierzy po awarii jednego dysku, nawet jeśli jeden z pozostałych dysków ma jeden lub więcej złych sektorów.

Zdjęcia

RAID 3 jest bardzo podobny do poziomu RAID 0. Dodany jest dodatkowy dysk, który będzie zawierał sumę kontrolną dla każdego bloku danych.

RAID 4 jest podobny do poziomu RAID 3, ale oblicza parytet na większych blokach danych

RAID 6 jest podobny do RAID 5, ale oblicza dwie różne sumy kontrolne. Pozwala to na awarię dwóch dysków, bez utraty danych.

Niestandardowe poziomy RAID

Podwójny parytet / Parytet przekątny

RAID 6 wykorzystuje dwa bloki parzystości. Są one obliczane w specjalny sposób nad wielomianem. Podwójny parytet RAID (nazywany również przekątnym parytetem RAID) używa innego wielomianu dla każdego z tych bloków parytetu. Ostatnio, stowarzyszenie branżowe, które zdefiniowało RAID powiedział, że podwójny parytet RAID jest inną formą RAID 6.

RAID-DP

RAID-DP to kolejny sposób na posiadanie podwójnego parytetu.

RAID 1.5

RAID 1.5 (nie należy mylić z RAID 15, który jest inny) jest zastrzeżoną implementacją RAID. Podobnie jak RAID 1, używa tylko dwóch dysków, ale robi zarówno striping, jak i mirroring (podobny do RAID 10). Większość rzeczy robi się w sprzęcie.

RAID 5E, RAID 5EE i RAID 6E

Macierze RAID 5E, RAID 5EE i RAID 6E (z dodatkiem E dla Enhanced) zasadniczo odnoszą się do różnych typów macierzy RAID 5 lub RAID 6 z gorącym zapasem. W przypadku tych urządzeń dysk zapasowy podczas pracy nie jest dyskiem fizycznym. Istnieje on raczej w postaci wolnego miejsca na dyskach. Zwiększa to wydajność, ale oznacza, że dysk typu "hot spare" nie może być dzielony między różne macierze. Program został wprowadzony przez IBM ServeRAID około roku 2001.

RAID 7

To jest zastrzeżona implementacja. Dodaje ona cachowanie do macierzy RAID 3 lub RAID 4.

Intel Matrix RAID

Niektóre płyty główne Intela posiadają układ RAID, który posiada tę funkcję. Wykorzystuje on dwa lub trzy dyski, a następnie dzieli je równomiernie na partycje, tworząc kombinację poziomów RAID 0, RAID 1, RAID 5 lub RAID 1+0.

Linux MD Sterownik RAID

Jest to nazwa sterownika, który pozwala na wykonywanie oprogramowania RAID z systemem Linux. Oprócz normalnych poziomów RAID 0-6, posiada on również implementację RAID 10. Od wersji Kernel 2.6.9, RAID 10 jest pojedynczym poziomem. Implementacja posiada pewne niestandardowe funkcje.

RAID Z

Sun wdrożył system plików o nazwie ZFS. Ten system plików jest zoptymalizowany do obsługi dużych ilości danych. Zawiera on Logiczny Menedżer Woluminów. Zawiera on również funkcję o nazwie RAID-Z. Pozwala to na uniknięcie problemu zwanego dziurą w zapisie w macierzy RAID 5, ponieważ posiada politykę kopiowania i zapisywania danych: Nie nadpisuje danych bezpośrednio, ale zapisuje nowe dane w nowej lokalizacji na dysku. Gdy zapis przebiegł pomyślnie, stare dane są usuwane. Unika się konieczności operacji read-modify-write dla małych zapisów, ponieważ zapisuje tylko pełne paski. Małe bloki są odbijane na lustrze, a nie chronione parytetem, co jest możliwe, ponieważ system plików zna sposób organizacji zapisu. Ono móc więc dodatkowy przestrzeń jeśli konieczny. Istnieje również macierz RAID-Z2, która wykorzystuje dwie formy parzystości, aby osiągnąć wyniki podobne do macierzy RAID 6: możliwość przetrwania do dwóch awarii dysków bez utraty danych.

Zdjęcia

Schemat konfiguracji macierzy RAID DP (Double Parity).

Konfiguracja macierzy RAID.

Łączenie poziomów RAID

W macierzy RAID można łączyć różne dyski, aby uzyskać dysk logiczny. Użytkownik będzie widział tylko dysk logiczny. Każdy z wyżej wymienionych poziomów macierzy RAID ma dobre i złe strony. Ale RAID może również pracować z dyskami logicznymi. W ten sposób jeden z wyżej wymienionych poziomów RAID może być używany z zestawem dysków logicznych. Wiele osób zwraca na to uwagę, zapisując numery razem. Czasami piszą '+' lub '&' w międzyczasie. Wspólne kombinacje (przy użyciu dwóch poziomów) są następujące:

RAID 0+1: Dwie lub więcej macierzy RAID 0 są połączone w macierz RAID 1; Nazywa się to zwierciadłem pasków
RAID 1+0: Tak samo jak RAID 0+1, ale poziomy RAID odwrócone; Pasek luster. Dzięki temu awaria dysku jest rzadsza niż w przypadku macierzy RAID 0+1 powyżej.
RAID 5+0: Stripe kilka RAID 5's z RAID 0. Jeden dysk każdej macierzy RAID 5 może upaść, ale sprawia, że RAID 5 jest pojedynczym punktem awarii; jeżeli inny dysk z tej macierzy ulegnie awarii, wszystkie dane z macierzy zostaną utracone.
RAID 5+1: Zwierciadło zestawu macierzy RAID 5: W sytuacji, gdy macierz RAID składa się z sześciu dysków, dowolne trzy mogą zawieść (bez utraty danych).
RAID 6+0: Rozmieszczenie kilku macierzy RAID 6 na jednej macierzy RAID 0; dwa dyski każdej macierzy RAID 6 mogą ulec awarii bez utraty danych.

Dzięki sześciu dyskom o pojemności 300 GB każdy, o łącznej pojemności 1,8 TB, możliwe jest stworzenie macierzy RAID 5, o pojemności użytkowej 1,5 TB. W tej macierzy jeden dysk może upaść bez utraty danych. W macierzy RAID 50 przestrzeń użytkowa jest zredukowana do 1,2 TB, ale jeden dysk z każdej macierzy RAID 5 może upaść, a ponadto występuje zauważalny wzrost wydajności. Macierz RAID 51 zmniejsza rozmiar użytkowy do 900 GB, ale umożliwia awarię trzech dowolnych dysków.

RAID 0+1: Kilka macierzy RAID 0 jest połączonych z RAID 1.

Macierze RAID 1+0: bardziej wytrzymała niż macierz RAID 0+1; obsługuje wiele awarii dysków, o ile nie występują dwa dyski, które powodują awarię serwera lustrzanego.

RAID 5+1: Dowolne trzy dyski z tej macierzy mogą ulec awarii, bez utraty danych.

Tworzenie macierzy RAID

Istnieją różne sposoby na wykonanie macierzy RAID. Można to zrobić za pomocą oprogramowania lub sprzętu.

Oprogramowanie RAID

RAID może być wykonany z oprogramowaniem na dwa różne sposoby. W przypadku macierzy programowej RAID dyski podłączane są jak zwykłe dyski twarde. To komputer jest tym, który sprawia, że RAID działa. Oznacza to, że dla każdego dostępu CPU musi również wykonać obliczenia dla macierzy RAID. Obliczenia dla macierzy RAID 0 lub RAID 1 są proste. Jednak obliczenia dla macierzy RAID 5, RAID 6, lub jednego z połączonych poziomów RAID mogą być bardzo trudne. W programowej macierzy RAID automatyczne uruchamianie z macierzy, która zawiodła, może być trudne do wykonania. Wreszcie, sposób, w jaki macierz RAID jest wykonywana w oprogramowaniu zależy od używanego systemu operacyjnego; na ogół nie jest możliwe ponowne zbudowanie macierzy programowej RAID z innym systemem operacyjnym. Systemy operacyjne zazwyczaj używają partycji dysku twardego zamiast całych dysków twardych do tworzenia macierzy RAID.

Sprzętowa macierz RAID

Macierze RAID może być również wykonane z wykorzystaniem sprzętu. W tym przypadku stosowany jest specjalny kontroler dysków, który ukrywa przed systemem operacyjnym i użytkownikiem fakt wykonywania macierzy RAID. Obliczenia informacji o sumie kontrolnej oraz inne obliczenia związane z macierzą RAID wykonywane są na specjalnym mikroczipie w tym kontrolerze. Dzięki temu macierz RAID jest niezależna od systemu operacyjnego. System operacyjny nie będzie widział macierzy RAID, lecz pojedynczy dysk. Różni producenci wykonują macierz RAID na różne sposoby. Oznacza to, że macierz RAID zbudowana z jednego sprzętowego kontrolera RAID nie może być przebudowana przez inny kontroler RAID innego producenta. Sprzętowe kontrolery RAID są często drogie w zakupie.

Sprzętowo wspomagana macierz RAID

Jest to połączenie sprzętowej i programowej macierzy RAID. Sprzętowa macierz RAID wykorzystuje specjalny układ kontrolera (jak sprzętowa macierz RAID), ale układ ten nie może wykonywać wielu operacji. Jest on aktywny tylko wtedy, gdy system jest uruchomiony; gdy tylko system operacyjny jest w pełni załadowany, ta konfiguracja jest jak programowa RAID. Niektóre płyty główne posiadają funkcje RAID dla podłączonych dysków; najczęściej te funkcje RAID wykonywane są jako sprzętowa macierz RAID. Oznacza to, że potrzebne jest specjalne oprogramowanie, aby móc korzystać z tych funkcji macierzy RAID i móc odzyskać dane z uszkodzonego dysku.

Różne terminy związane z awariami sprzętu

Istnieją różne terminy, które są używane w odniesieniu do awarii sprzętu:

Wskaźnik awaryjności

Wskaźnik awaryjności to częstotliwość awarii systemu. Średni czas do awarii (MTTF) lub średni czas między awariami (MTBF) systemu RAID jest taki sam, jak czas jego komponentów. System RAID nie może przecież chronić przed awariami poszczególnych dysków twardych. Bardziej skomplikowane typy macierzy RAID (cokolwiek poza "pasowaniem" lub "łączeniem") mogą jednak pomóc w utrzymaniu danych w stanie nienaruszonym nawet w przypadku awarii pojedynczego dysku twardego.

Średni czas do utraty danych

Średni czas do utraty danych (MTTDL) daje średni czas, zanim nastąpi utrata danych w danej tablicy. Średni czas utraty danych danej macierzy RAID może być wyższy lub niższy od czasu utraty danych na jej dyskach twardych. Zależy to od typu stosowanej macierzy RAID.

Średni czas do powrotu do zdrowia

Macierze, które mają nadmiarowość, mogą być odzyskane po niektórych awariach. Średni czas odzyskiwania pokazuje, jak długo trwa powrót uszkodzonej macierzy do normalnego stanu. Dodaje to zarówno czas na wymianę uszkodzonego mechanizmu dyskowego, jak i czas na ponowne zbudowanie macierzy (tj. na replikację danych do redundancji).

Nieodzyskiwalna bitowa stopa błędów

Bitowa stopa błędów nieodzyskiwalnych (UBE) określa, jak długo dysk twardy nie będzie w stanie odzyskać danych po zastosowaniu cyklicznej kontroli nadmiarowości (CRC) i wielokrotnych próbach.

Problemy z macierzą RAID

Istnieją również pewne problemy z pomysłami lub technologią wykorzystywaną w macierzy RAID:

Dodawanie dysków w późniejszym czasie

Niektóre poziomy macierzy RAID pozwalają na rozszerzenie macierzy po prostu dodając dyski twarde, w późniejszym czasie. Informacje takie jak bloki parzystości są często rozproszone na kilku dyskach. Dodanie dysku do macierzy oznacza, że konieczna jest reorganizacja. Taka reorganizacja jest jak ponowna rozbudowa macierzy, może zająć dużo czasu. Kiedy to zostanie zrobione, dodatkowe miejsce może nie być jeszcze dostępne, ponieważ zarówno system plików na macierzy, jak i system operacyjny muszą być o tym poinformowane. Niektóre systemy plików nie mogą być rozwijane po ich utworzeniu. W takim przypadku wszystkie dane muszą być zarchiwizowane, tablica musi być odtworzona z nowym układem, a dane muszą być na niej przywrócone.

Inną możliwością dodania pamięci masowej jest utworzenie nowej macierzy i umożliwienie logicznego zarządzania woluminami. Pozwala to na rozbudowę prawie każdego systemu RAID, nawet RAID1 (który sam w sobie jest ograniczony do dwóch dysków).

Powiązane awarie

Mechanizm korekcji błędów w macierzy RAID zakłada, że awarie dysków są niezależne. Możliwe jest obliczenie, jak często może dojść do awarii urządzenia i ułożenie macierzy w taki sposób, aby utrata danych była bardzo mało prawdopodobna.

W praktyce jednak dyski były często kupowane razem. Mają one mniej więcej ten sam wiek i były używane w podobny sposób (tzw. zużycie). Wiele napędów ulega awarii z powodu problemów mechanicznych. Im starszy jest napęd, tym bardziej zużywają się jego części mechaniczne. Części mechaniczne, które są stare, są bardziej narażone na awarie niż te, które są młodsze. Oznacza to, że awarie napędów nie są już statystycznie niezależne. W praktyce istnieje prawdopodobieństwo, że drugi dysk również ulegnie awarii, zanim pierwszy zostanie odzyskany. W praktyce oznacza to, że utrata danych może nastąpić w znacznym stopniu.

Atomowość

Innym problemem, który występuje również w systemach RAID jest to, że aplikacje oczekują tego, co nazywa się Atomicity: Albo wszystkie dane są zapisywane, albo żadne nie są. Zapisanie danych jest znane jako transakcja.

W macierzach RAID nowe dane są zazwyczaj zapisywane w miejscu, w którym znajdowały się stare dane. Stało się to znane jako update in-place. Jim Gray, badacz bazy danych, napisał w 1981 roku artykuł, w którym opisał ten problem.

Bardzo niewiele systemów przechowywania pozwala na atomową semantykę zapisu. Gdy obiekt jest zapisywany na dysku, urządzenie pamięci masowej RAID zazwyczaj zapisuje równolegle wszystkie jego kopie. Bardzo często za zapis danych odpowiedzialny jest tylko jeden procesor. W takim przypadku zapisy danych na różnych dyskach będą się na siebie nakładały. Jest to tzw. zapis nakładający się na siebie lub rozłożony w czasie. Błąd, który pojawia się podczas procesu zapisu, może więc pozostawić nadmiarowe kopie w różnych stanach. Co gorsza, może to spowodować, że kopie nie pozostaną ani w starym, ani w nowym stanie. Logowanie polega jednak na tym, że oryginalne dane znajdują się albo w starym, albo w nowym stanie. Pozwala to na wycofanie zmiany logicznej, ale niewiele systemów pamięci masowej zapewnia atomowy zapis semantyczny na dysku RAID.

Użycie pamięci podręcznej z podtrzymaniem bateryjnym może rozwiązać ten problem, ale tylko w przypadku awarii zasilania.

Obsługa transakcji nie jest dostępna we wszystkich sprzętowych kontrolerach RAID. Dlatego wiele systemów operacyjnych zawiera ją w celu zabezpieczenia przed utratą danych podczas przerwania zapisu. Novell Netware, począwszy od wersji 3.x, posiada system śledzenia transakcji. Microsoft wprowadził śledzenie transakcji za pomocą funkcji rejestrowania transakcji w systemie NTFS. System plików NetApp WAFL rozwiązuje ten problem, nigdy nie aktualizując istniejących danych, podobnie jak ZFS.

Dane nieodzyskiwalne

Niektóre sektory na dysku twardym mogły stać się nieczytelne z powodu błędu. Niektóre implementacje macierzy RAID mogą poradzić sobie z tą sytuacją, przenosząc dane w inne miejsce i oznaczając sektor na dysku jako zły. Dzieje się tak w przypadku około 1 bitu w ^{1015 w dyskach} klasy korporacyjnej i 1 bit w ¹⁰¹⁴ w zwykłych dyskach. Pojemność dysku stale rośnie. Może to oznaczać, że czasami nie można odbudować macierzy RAID, ponieważ taki błąd występuje, gdy macierz jest odbudowywana po awarii dysku. Niektóre technologie, takie jak macierz RAID 6, starają się rozwiązać ten problem, ale cierpią na bardzo wysokie kary za zapis, innymi słowy zapis danych staje się bardzo powolny.

Niezawodność pisania w pamięci podręcznej

System dyskowy może potwierdzić operację zapisu, gdy tylko dane znajdą się w pamięci podręcznej. Nie musi czekać, aż dane zostaną fizycznie zapisane. Jednak każda przerwa w dostawie prądu może wtedy oznaczać znaczną utratę danych, które znajdują się w kolejce do takiego bufora.

Dzięki sprzętowej macierzy RAID, bateria może być używana do ochrony tej pamięci podręcznej. To często rozwiązuje problem. W przypadku awarii zasilania kontroler może zakończyć zapisywanie w pamięci podręcznej, gdy zasilanie zostanie przywrócone. Jednak to rozwiązanie może się nie udać: bateria mogła być zużyta, zasilanie mogło być wyłączone zbyt długo, dyski mogły zostać przeniesione do innego kontrolera, sam kontroler mógł się nie udać. Niektóre systemy mogą przeprowadzać okresowe kontrole baterii, ale wykorzystują one samą baterię i pozostawiają ją w stanie, w którym nie jest w pełni naładowana.

Zgodność sprzętu

Formaty dysków na różnych kontrolerach RAID nie muszą być kompatybilne. W związku z tym odczytywanie macierzy RAID na różnych urządzeniach może nie być możliwe. W związku z tym, w przypadku awarii sprzętu innego niż dysk, do odzyskania danych może być konieczne użycie identycznego sprzętu lub wykonanie kopii zapasowej.

Co RAID może, a czego nie może zrobić

Przewodnik ten został zaczerpnięty z wątku na forum związanym z RAID-em. Zrobiono to, aby pomóc zwrócić uwagę na zalety i wady wyboru RAID. Jest on skierowany do osób, które chcą wybrać RAID dla zwiększenia wydajności lub redundancji. Zawiera on linki do innych wątków na swoim forum zawierających wygenerowane przez użytkownika anegdotyczne opinie na temat ich doświadczeń z RAID.

Co RAID może zrobić

RAID może chronić czas pracy. Poziomy macierzy RAID 1, 0+1/10, 5 i 6 (oraz ich warianty, takie jak 50 i 51) kompensują awarię mechanicznego dysku twardego. Nawet po awarii dysku twardego, dane w macierzy mogą być nadal używane. Zamiast czasochłonnego przywracania danych z taśm, płyt DVD lub innych powolnych nośników kopii zapasowych, macierz RAID pozwala na przywrócenie danych z innych elementów macierzy na dysk zastępczy. Podczas tego procesu przywracania dane są dostępne dla użytkowników w stanie awaryjnym. Jest to bardzo ważne dla przedsiębiorstw, ponieważ czas przestoju szybko prowadzi do utraty zysków. W przypadku użytkowników domowych może on chronić czas pracy dużych macierzy pamięci masowej, który wymagałby czasochłonnego przywracania z kilkudziesięciu płyt DVD lub kilku taśm w przypadku awarii dysku, który nie jest chroniony przez nadmiarowość.
RAID może zwiększyć wydajność w niektórych aplikacjach. Poziomy macierzy RAID 0, 5 i 6 wykorzystują paskowanie. Pozwala to na zwiększenie szybkości transferu dla transferów liniowych za pomocą wielu wrzecion. Aplikacje typu stacja robocza często pracują z dużymi plikami. Dużą zaletą jest możliwość stripingu dysków. Przykładami takich zastosowań są te, w których wykorzystywane są pliki wideo lub audio. Ta przepustowość jest również przydatna przy tworzeniu kopii zapasowych z dysku na dysk. Poziomy RAID 1, jak również inne poziomy RAID oparte na zasadzie stripingu mogą poprawić wydajność dla schematów dostępu z wieloma równoczesnymi dostępami losowymi, jak te używane przez bazę danych wielu użytkowników.

Czego RAID nie może zrobić

RAID nie może chronić danych w macierzy. Macierz RAID ma jeden system plików. Tworzy to pojedynczy punkt awarii. Jest wiele rzeczy, które mogą się zdarzyć w tym systemie plików, innych niż uszkodzenie dysku fizycznego. Macierz RAID nie może się bronić przed tymi źródłami utraty danych. RAID nie powstrzyma wirusa przed zniszczeniem danych. RAID nie uchroni przed uszkodzeniem. RAID nie zapisze danych, gdy użytkownik zmodyfikuje je lub usunie przez przypadek. RAID nie chroni danych przed awarią sprzętową jakiegokolwiek elementu poza dyskami fizycznymi. RAID nie chroni danych przed klęskami żywiołowymi lub katastrofami spowodowanymi przez człowieka, takimi jak pożary i powodzie. Aby chronić dane, należy wykonać kopię zapasową na nośnikach wymiennych, takich jak DVD, taśma lub zewnętrzny dysk twardy. Kopia zapasowa musi być przechowywana w innym miejscu. Sama macierz RAID nie zapobiegnie przekształceniu się katastrofy w utratę danych w przypadku jej wystąpienia (nie w przypadku jej wystąpienia). Nie można zapobiec katastrofie, ale tworzenie kopii zapasowych pozwala zapobiec utracie danych.
RAID nie może uprościć odzyskiwania danych w przypadku awarii. Podczas uruchamiania pojedynczego dysku, dysk może być używany przez większość systemów operacyjnych, ponieważ są one wyposażone w zwykły sterownik urządzenia. Jednak większość kontrolerów macierzy RAID potrzebuje specjalnych sterowników. Narzędzia do odzyskiwania danych, które pracują z pojedynczymi dyskami na typowych kontrolerach, będą wymagały specjalnych sterowników, aby uzyskać dostęp do danych z macierzy RAID. Jeśli te narzędzia do odzyskiwania danych są słabo zakodowane i nie pozwalają na dostarczenie dodatkowych sterowników, wówczas macierz RAID będzie prawdopodobnie niedostępna dla tego narzędzia do odzyskiwania danych.
RAID nie może zapewnić zwiększenia wydajności we wszystkich aplikacjach. Stwierdzenie to jest szczególnie prawdziwe w przypadku typowych użytkowników aplikacji desktopowych i graczy. Dla większości aplikacji stacjonarnych i gier strategia buforowa i wydajność dysków są ważniejsze niż ich surowa przepustowość. Wzrost nieprzetworzonego, trwałego transferu pokazuje niewielkie korzyści dla takich użytkowników, ponieważ większość plików, do których uzyskują oni dostęp, jest zazwyczaj bardzo mała. Stripowanie dysku przy użyciu macierzy RAID 0 zwiększa wydajność transferu liniowego, a nie buforowania i wyszukiwania. W związku z tym, w większości aplikacji desktopowych i gier, chociaż istnieją wyjątki, striping dysków przy użyciu macierzy RAID 0 wykazuje niewielki lub żaden wzrost wydajności. Dla użytkowników komputerów stacjonarnych i graczy z wysoką wydajnością jako cel, lepiej jest kupić szybszy, większy i droższy pojedynczy dysk, niż uruchomić dwa wolniejsze/mniejsze dyski w macierzy RAID 0. Nawet uruchomienie najnowszych, największych i największych dysków w macierzy RAID-0 prawdopodobnie nie zwiększy wydajności o więcej niż 10%, a wydajność może spaść w niektórych wzorcach dostępu, zwłaszcza w grach.
Trudno jest przenieść RAID do nowego systemu. W przypadku pojedynczego dysku, stosunkowo łatwo jest przenieść dysk do nowego systemu. Można go po prostu podłączyć do nowego systemu, jeśli posiada on ten sam interfejs. Jednak w przypadku macierzy RAID nie jest to takie proste. Istnieje pewien rodzaj metadanych, które mówią o tym, jak ustawiona jest macierz RAID. BIOS RAID musi być w stanie odczytać te metadane, aby móc z powodzeniem zbudować tablicę i udostępnić ją dla systemu operacyjnego. Ponieważ producenci kontrolerów RAID używają różnych formatów dla swoich metadanych (nawet kontrolery z różnych rodzin z tego samego producenta mogą używać niekompatybilnych formatów metadanych), przeniesienie macierzy RAID do innego kontrolera jest prawie niemożliwe. Przy przenoszeniu macierzy RAID do nowego systemu należy zaplanować również przeniesienie kontrolera. Ze względu na popularność zintegrowanych macierzy RAID na płytach głównych, jest to niezwykle trudne. Generalnie, możliwe jest wspólne przenoszenie członków macierzy RAID i kontrolerów. Oprogramowanie macierzy RAID w Linuksie i produktach serwerowych Windows również może działać wokół tego ograniczenia, ale oprogramowanie macierzy RAID ma inne (głównie związane z wydajnością).

Przykład

Najczęściej stosowane poziomy RAID to RAID 0, RAID 1 i RAID 5. Załóżmy, że mamy do czynienia z 3 identycznymi dyskami o pojemności 1 TB każdy, a prawdopodobieństwo awarii dysku dla danego okresu czasu wynosi 1%.

Poziom RAID	Pojemność użytkowa	Prawdopodobieństwo niepowodzenia podany w procentach	Prawdopodobieństwo niepowodzenia 1 w ... przypadkach niepowodzenia
0	3 TB	2,9701%	34
1	1 TB	0,0001%	1 milion
5	2 TB	0,0298%	3356

Przeszukaj encyklopedię

RAID

Spis treści

Wprowadzenie

Różnica między dyskami fizycznymi a logicznymi

Odczytywanie i zapisywanie danych

Co to jest RAID?

Dlaczego używać macierzy RAID?

Historia

Podstawowe pojęcia stosowane w systemach RAID

Caching

Zwierciadło: Więcej niż jedna kopia danych

Striptizowanie: Część danych znajduje się na innym dysku

Korekta błędów i usterek

Gorące części zamienne: użycie większej liczby dysków niż potrzeba

Wielkość paska i wielkość kawałka: rozłożenie danych na kilku dyskach

Złożenie dysku: JBOD, konkatenacja lub rozpiętość

Drive Clone

Różne konfiguracje

Podstawy: proste poziomy RAID

Poziomy RAID w powszechnym użyciu

RAID 0 "striping"

RAID 1 "mirroring"

RAID 5 "striping z rozproszonym parytetem"

Zdjęcia

Poziomy RAID wykorzystywane mniej

RAID 2

RAID 3 "striping z dedykowanym parytetem"

RAID 4 "striping z dedykowanym parytetem"

RAID 6

Zdjęcia

Niestandardowe poziomy RAID

Podwójny parytet / Parytet przekątny

RAID-DP

RAID 1.5

RAID 5E, RAID 5EE i RAID 6E

RAID 7

Intel Matrix RAID

Linux MD Sterownik RAID

RAID Z

Zdjęcia

Łączenie poziomów RAID

Tworzenie macierzy RAID

Oprogramowanie RAID

Sprzętowa macierz RAID

Sprzętowo wspomagana macierz RAID

Różne terminy związane z awariami sprzętu

Wskaźnik awaryjności

Średni czas do utraty danych

Średni czas do powrotu do zdrowia

Nieodzyskiwalna bitowa stopa błędów

Problemy z macierzą RAID

Dodawanie dysków w późniejszym czasie

Powiązane awarie

Atomowość

Dane nieodzyskiwalne

Niezawodność pisania w pamięci podręcznej

Zgodność sprzętu

Co RAID może, a czego nie może zrobić

Co RAID może zrobić

Czego RAID nie może zrobić

Przykład

Szukaj według litery