Skip to main content
Loading...
Szukaj
Logowanie
Dane logowania.
Nie masz konta? Załóż je tutaj.
Zarejestruj się
Zarejestruj się
Masz konto? Zaloguj się tutaj.

Zapis przeplotowy (IMR). Przyszłość dysków twardych czy technologiczna pułapka?

Zapis przeplotowy (IMR). Przyszłość dysków twardych czy technologiczna pułapka?

Czy nowa metoda organizacji danych to przełom, który zrewolucjonizuje przechowywanie informacji, czy tylko kolejna technologia z ukrytymi wyzwaniami? Sprawdź, jakie korzyści i trudności niesie za sobą to rozwiązanie. 

Zapis przeplotowy w dyskach twardych

Historia dysków twardych liczy sobie niemal 70 lat. W tym czasie wielokrotnie wieszczono koniec tego typu nośników danych i odsyłano je na emeryturę. Miały zostać wyparte przez inne technologie i faktycznie w wielu zastosowaniach ustąpiły SSDkom, ale pomimo wszystko wciąż się rozwijają. Najnowszym rozwiązaniem pozwalającym na zwiększenie gęstości zapisu w dyskach twardych jest zapis wspomagany energetycznie.

Energetyczne wspomaganie zapisu pozwala zastąpić wykorzystywane od lat stopy kobaltowe twardszymi magnetycznie stopami żelazowo-platynowymi. Wyższa koercja stopu wykorzystywanego do przechowywania danych pozwala na uzyskanie mniejszych stabilnych domen, a tym samym wyższej gęstości zapisu. Wspomaganie zapisu może być realizowane za pomocą lasera (Heat-Assisted Magnetic Recording — HAMR) lub promieniowania mikrofalowego (Microwave Assisted Magnetic Recording – MAMR).

Pierwsze dyski HAMR trafiły na rynek w ubiegłym roku. Są jeszcze mało popularne, więc trudno przewidywać, jak się będą zachowywały w eksploatacji i jaka będzie ich awaryjność. Jeśli wierzyć producentowi, przynajmniej na razie te dyski nie wykorzystują technologii SMR (zob. Security Magazine 6(15)/2023). I może faktycznie SMR nigdy nie trafi do tych dysków, bo producent przygotowuje ciekawszą metodę zwiększenia gęstości zapisu.

Idea zapisu przeplotowego

Przeplotowy zapis magnetyczny (IMR — Interlaced Magnetic Recording), to sposób organizacji danych możliwy do zastosowania na dyskach wykorzystujących technologię energetycznie wspomaganego zapisu HAMR, jakie po wprowadzeniu tego typu zapisu mają dostać oznaczenie HIMR, ale też może w przyszłości trafić do dysków typu MAMR. Polega on na wykorzystaniu dwóch rodzajów ścieżek: dolnych i górnych. Tzw. górne ścieżki są węższe od dolnych i zapisywane są z wykorzystaniem mniejszej energii częściowo nadpisując dwie sąsiednie ścieżki dolne. Tym samym każda dolna ścieżka jest zwężana przez dwie ścieżki górne nadpisujące jej krawędzie i w konsekwencji efektywna szerokość ścieżki dolnej staje się mniejsza od górnej. Ten sposób zapisu pozwala spodziewać się gęstości zapisu powyżej miliona ścieżek na powierzchni dysku 2,5”, co oznacza ok. pięciokrotne zwiększenie gęstości zapisu w stosunku do wartości typowo uzyskiwanych obecnie.

Określenia ścieżek jako górnych i dolnych ma charakter wyłącznie konwencjonalny. Obie kategorie tych ścieżek fizycznie znajdują się na tym samym poziomie warstwy magnetycznej. Rozróżnienie polega na tym, że w przypadku ścieżki górnej dostarczana porcja dodatkowej energii cieplnej jest zbyt mała, by umożliwić wpływ pola magnetycznego indukowanego przez głowicę zapisującą na sąsiednie ścieżki dolne, natomiast zapis ścieżki dolnej wiąże się z takim podgrzaniem powierzchni talerza, że pole magnetyczne indukowane przez głowicę podczas zapisu przemagnesowuje także obszary sąsiednich ścieżek górnych.

Większa energia używana do zapisu dolnych ścieżek pozwala na uzyskanie w nich liniowej gęstości zapisu wyższej o ponad 25 % w porównaniu do ścieżek górnych, jednak nie ma pewności, czy tę możliwość uda się wykorzystać w produkcji dysków, jakie faktycznie trafią do klientów. Na przeszkodzie wykorzystaniu sąsiadujących ścieżek o różnej liniowej gęstości zapisu mogą stanąć takie czynniki, jak konieczność umieszczania na dysku danych niezbędnych dla zapewnienia poprawnego adresowania (nagłówki sektorów, sektory serwo), organizacja stref o stałej liczbie sektorów na ścieżkę i związanej z tym częstotliwości zapisywanego i odczytywanego sygnału oraz występujące na powierzchni defekty.

Zapis przeplotowy, a zapis dachówkowy.

Przeplotowy sposób zwiększania gęstości zapisu jest w swej idei podobny do zapisu dachówkowego (SMR), jednak rozwiązanie przeplotowe pozwala w istotny sposób ograniczyć uciążliwości związane z koniecznością przepisywania dużej porcji danych w przypadku konieczności zmiany zawartości pojedynczego sektora w strefie SMR. Przewaga zapisu IMR polega na tym, że jeśli dane zapisywane są w ścieżce górnej, mogą być one zapisane bezpośrednio do właściwego sektora, podobnie jak w zapisie konwencjonalnym. Dopiero zapis ścieżki dolnej powoduje uszkodzenie zapisu sąsiednich ścieżek górnych, co skutkuje koniecznością odczytania ich zawartości do bufora i ponownego ich zapisania po zapisaniu ścieżki dolnej.

Ten sposób zapisu, jakkolwiek bardziej złożony od zapisu konwencjonalnego, jest znacznie bardziej efektywny od zapisu SMR, gdyż zmiana zawartości sektora wymaga przepisania sąsiednich sektorów na maksymalnie trzech ścieżkach, podczas gdy w przypadku zapisu SMR konieczne jest przepisywanie całych stref o objętościach liczonych w dziesiątkach MB. Ponadto w przypadku zapisu IMR możliwe jest, podobnie, jak i w przypadku SMR wykorzystanie funkcji TRIM służącej do informowania przez system operacyjny podsystemu translacji o tym, które obszary adresacji LBA są zaalokowane na poziomie systemu plików jako zajęte, a które są wolne. W przypadku, gdy ścieżki górne sąsiadujące z zapisywaną ścieżką dolną nie zawierają danych zaalokowanych w strukturach logicznych systemu plików, możliwe jest podniesienie wydajności zapisu poprzez ignorowanie uszkodzeń zawartości ścieżek górnych wskutek ich nadpisania zmianą zawartości ścieżki dolnej.

Translacja adresacji logicznej na fizyczną w zapisie przeplotowym.

W celu optymalizacji wydajności dysku z zapisem IMR podsystem translacji może w pierwszej kolejności przypisywać adresy LBA ścieżkom dolnym, a dopiero w dalszej – ścieżkom górnym. Podobnie, jak i w zapisie konwencjonalnym pierwsze adresy LBA będą nadawane począwszy od zewnętrznej krawędzi talerza, gdzie ścieżka jest najdłuższa, a więc przy stałej prędkości obrotowej, prędkość liniowa jest największa. W przypadku ścieżek górnych testowane są dwa rozwiązania. Jedno z nich polega na numerowaniu sektorów na ścieżkach górnych począwszy od zewnętrznej krawędzi, a drugie na nadawaniu im numerów od środka, to jest od ostatniej ścieżki dolnej. Drugie z tych rozwiązań pozwala uniknąć konieczności przemieszczenia głowicy od środka talerza do zewnętrznej krawędzi w przypadku przejścia adresacji LBA ze ścieżek dolnych na górne.

Ze względu na to, że w przypadku większości systemów plików dane w pierwszej kolejności są alokowane w sektorach LBA o niższych numerach, takie rozwiązanie pozwala przez dłuższy czas nie przejmować się zawartością górnych ścieżek i poprzestać na zapisywaniu wyłącznie dolnych. Rozwiązanie to jest znacznie prostsze i wydajniejsze przy zapisie od wymagającej użycia bardziej skomplikowanego wariantu dwupoziomowego podsystemu translacji w technologii SMR. Pozwala także żywić nadzieję, że w praktyce okaże się ono nie tylko szybsze, ale też i mniej awaryjne.

Kolejnym rozwiązaniem możliwym do zastosowania przy technologii IMR jest użycie części górnych ścieżek jako bufora (Top Buffer) analogicznego do bufora Media Cache w przypadku dysków SMR. Do tego bufora może być zapisywana zawartość, jaka docelowo powinna się znaleźć w ścieżkach dolnych, do których zostanie ostatecznie przeniesiona po zakończeniu transferu danych. Zastosowanie takiego bufora pozwala uniknąć utraty wydajności spowodowanej koniecznością odświeżania zawartości ścieżek górnych przy zapisie ścieżek dolnych.

W połączeniu z wykorzystaniem funkcji TRIM, oprogramowanie układowe może wykorzystywać jako bufor te ścieżki górne, których zawartość jest wolnym miejscem z punktu widzenia struktur logicznych. Oczywiście ścieżki górne używane jako bufor muszą być odświeżane w przypadku zapisów w sąsiadujących z nimi ścieżkami dolnymi. Wiąże się to z koniecznością utworzenia na potrzeby oprogramowania układowego modułu pozwalającego na zarządzanie buforem oraz jego sukcesywne oczyszczanie.

Innym rozwiązaniem umożliwiającym optymalizację wydajności dysków wykorzystujących zapis przeplotowy jest umieszczanie danych statycznych, rzadko ulegających zmianom w sektorach znajdujących się w ścieżkach dolnych przy jednoczesnym przenoszeniu zawartości często ulegającej zmianom do sektorów w ścieżkach górnych (Block Swap). Takie rozwiązanie sprawia, że zapisywane dane częściej będą umieszczane w ścieżkach górnych. Zastosowanie takiej technologii wymaga monitorowania liczby zapisów do poszczególnych sektorów, a także komplikuje proces translacji adresacji logicznej na fizyczną.

Jakich problemów możemy się spodziewać w zapisie przeplotowym?

Utrzymywanie odpowiednio dużych tablic (dla dysku o pojemności 20 TB byłoby to ok. 1,2 GB przy używanym przez standard ATA adresowaniu 48-bitowym lub ok. 1,6 GB przy wykorzystywanym przez standard SCSI adresowaniu 64-bitowym) oraz skomplikowanego podsystemu translacji może być trudne i obarczone zbyt dużym ryzykiem awarii, by Block Swap został ostatecznie zaimplementowany w masowej produkcji dysków IMR, ale trwają prace w kierunku opracowania prostszych algorytmów decyzyjnych pozwalających na wykorzystanie tego sposobu optymalizacji zapisów.

W przypadku ścieżek dolnych można względnie prosto identyfikować często zmieniające się sektory i aktualizować stosowny licznik przy każdym zapisie. W przypadku osiągnięcia określonego progu wartości sektor może zostać przeniesiony do ścieżki górnej. O wiele większym wyzwaniem jest monitorowanie ścieżek górnych w celu wychwytywania sektorów, jakie zmieniają się najrzadziej i mogłyby być przeniesione do ścieżek dolnych. Aby nie zbierać dużej ilości danych dla każdego sektora z osobna, ścieżki górne można łączyć w grupy i obserwować częstotliwość zmian dla całej grupy.

Proces zamiany często zmieniających zawartość sektorów ze ścieżek dolnych z rzadko aktualizowanymi sektorami ze ścieżek górnych z łatwością może doprowadzić do chaotycznego przypisywania adresów logicznych do sektorów fizycznych. W praktyce mogłoby to doprowadzić do obniżenia wydajności dysku w związku z koniecznością częstego przemieszczania bloku głowic magnetycznych w poszukiwaniu umieszczonych fizycznie na odległych ścieżkach sektorów ułożonych liniowo w adresacji logicznej. Sytuacja ta wymusza konieczność opracowania algorytmu decyzyjnego optymalizującego procedurę przemieszczania adresów LBA pomiędzy ścieżkami górnymi, a dolnymi.

Wysoka gęstość zapisu przy częściowym nadpisywaniu dolnych ścieżek górnymi wiąże się z silnymi interferencjami międzyścieżkowymi znacznie pogarszającymi stosunek sygnału do szumu. Odfiltrowanie zakłóceń przy tak dużej gęstości zapisu wymaga wykorzystania technologii zapisu dwuwymiarowego TDMR. Dwuwymiarowy zapis wykorzystujący macierz głowic obsługujących kilka sąsiednich ścieżek naraz może być wykorzystany nie tylko do skuteczniejszego odfiltrowywania wpływu namagnesowania na sąsiednich ścieżek na odczytywany sygnał, ale też do zwiększenia wydajności dysków z przeplotowym zapisem poprzez równoczesny zapis sąsiednich ścieżek. Także efekty skosu przy tak wąskich ścieżkach wymuszają zastosowanie wielostopniowych pozycjonerów bloków magnetycznych głowic, co podnosi ich wrażliwość na usterki.

Oceń artykuł

Sprawdź się!

Powiązane materiały

Zapisz się do newslettera

Bądź na bieżąco z najnowszymi informacjami na temat
cyberbezpieczeństwa