Od wielu lat jednym z podstawowych celów producentów dysków twardych jest zwiększenie gęstości zapisu na powierzchni magnetycznej. Wyższa gęstość zapisu pozwala nie tylko na produkcję pomniejszych nośników, ale też korzystnie wpływa na wydajność dysku (pozwala przy jednym obrocie talerza odczytać lub zapisać większą porcję danych, niż w dysku o tej samej prędkości obrotowej, ale niższej gęstości zapisu) i umożliwia utrzymywanie niskich cen urządzeń.
Jednym ze sposobów zwiększania gęstości zapisu jest tzw. zapis dachówkowy (lub gontowy – Shingled Magnetic Recor-ding) wprowadzony na rynek w 2013 r. Obecnie zdecydowana większość dostępnych na rynku dysków wykorzystuje tę tech-nologię, jednak często użytkownicy nawet nie zdają sobie z te-go sprawy. Nie bez powodu – istnieją przyczyny, dla których producenci nie śpieszą się, by chwalić się rozwiązaniami wykorzystywanymi w ich produktach.
Postępy w zwiększaniu gęstości zapisu w dyskach twardych
Z biegiem lat producenci wprowadzili wiele innowacji pozwalających na zwiększenie gęstości zapisu. Do najważniejszych z nich należy zastąpienie odpowiedzialnych za pozycjonowanie głowic silników krokowych silnikami liniowymi umożliwiającymi bezstopniową regulację położenia głowic. Dzięki temu udało się setki razy zwiększyć liczbę ścieżek na powierzchni talerza. Ewoluowały też stopy używane, jako warstwa magnetyczna przechowująca dane. Poprawa struktury krystalicznej warstwy magnetycznej oraz użycie stopów o wyższej koercji umożliwiło stopniowe zmniejszanie domen magnetycznych. Istotnym prze-łomem było zastąpienie zapisu równoległego bardziej odpornym na efekt superparamagnetyzmu zapisem prostopadłym. Nie bez znaczenia była także ewolucja systemów kodowania danych pozwalających na zwiększenie gęstości upakowania strumienia danych w domenach magnetycznych.
Zastąpienie systemów kodowania FM/MFM samo-taktującym kodowaniem RLL wyeliminowało konieczność uwzględniania w sygnale składowej zegarowej. Pozwoliło także upakować w domenach więcej bitów danych. Rosnąca gęstość zapisu wpłynęła także na optymalizację innych aspektów funkcjonowania dysków. Mniejsze odstępy pomiędzy impulsami sygnału i niższe ich amplitudy wymusiły zastąpienie detekcji szczytów metodą detekcji PRML (Partial Response – Maximum Likelihood częściowa odpowiedź – maksymalne prawdopodobieństwo). Wprowadza się także bardziej zaawansowane metody detekcji i korekcji błędów bitowych. Powierzchnię talerzy dla lepszego wykorzystania podzielono na strefy o różnej liczbie sektorów na ścieżkę.
Podstawy koncepcji technologii SMR
Nazwa zapisu dachówkowego pochodzi od sposobu wyznaczania ścieżek tak, aby kolejna ścieżka częściowo nadpisywała poprzednią. Już dawno zauważono, że głowice zapisujące indukują pole magnetyczne znacznie szerzej, niż jest to niezbędne dla odczytu przez głowicę odczytującą. Jednak zwężanie ścieżek tradycyjnymi metodami ma swoje granice. Jednak zwężanie ścieżek tradycyjnymi metodami ma swoje granice.
Żeby skutecznie namagnesować powierzchnię podczas zapisu, musimy operować dostatecznie silnym polem magnetycznym, które maleje proporcjonalnie do kwadratu odległości i rozchodzi się na szerokość po obu stronach ścieżek. Ścieżki można zwężać obniżając wysokość lotu głowicy nad powierzchnią talerza, co daje możliwość precyzyjnej magnesować pożądane obszary oraz indukować dostatecznie silne pole przez coraz mniejsze głowice.
Aby możliwe było zastosowanie technologii zapisu dachówkowego, konieczna była zmiana sposobu konstrukcji głowic zapisujących. Pola indukowane w zapisie dachówkowym nie mogą się rozchodzić równomiernie, gdyż zapis kolejnej ścieżki uszkadzałby poprzednią. Dla-tego głowice zapisujące konstruuje się, jakby były „połówką” tradycyjnych głowic z wstawionym ekranem, do którego zamykają się linie pola, chroniąc przed przemagnesowaniem tę część poprzedniej ścieżki, która powinna pozostać nienaruszona.
Dzięki temu namagnesowanie kolejnej ścieżki jest asymetryczne względem jej środka i obszar dający największą odpowiedź sygnału może się znaleźć znacznie bliżej sąsiedniej ścieżki (tego, co z niej zostanie po częściowym nadpisaniu), jednocześnie pozostawiając następnej ścieżce obszar, który może być przemagnesowany bez utraty danych. Równocześnie ekranowanie pozwala operować silniejszym polem bez ryzyka uszkodzenia sąsiednich ścieżek. Rozwiązanie to umożliwia zmniejszenie szerokość ścieżki z kilkudziesięciu do ok. 10 nm, co odpowiada szerokości wystarczającej dla odczytu przez głowicę odczytującą.
Najważniejsze problemy związane z zapisem dachówkowym
Jednym z problemów związanych z rosnącą gęstością zapisu są efekty skosu związane z przemieszczaniem głowic po łuku względem powierzchni talerza w poszukiwaniu właściwych ścieżek. W pewnym momencie odchylenia położenia głowic od równoległego względem ścieżek nie można było już ignorować. Stąd konieczna była modyfikacja konstrukcji aktuatorów i wyposażenie ich w elementy piezoelektryczne ustawiające ślizgacze równolegle do przebiegu ścieżki w dowolnym miejscu talerza. Wprawdzie takie dwustopniowe aktuatory nie są ściśle związane z zapisem dachówkowym, jednak przy tej gęstości zapisu są obowiązkowe.
Inna kategoria problemów dotyczy zakłóceń odczytywanego sygnału. Ze względu na znaczne zmniejszenie odstępu pomiędzy ścieżkami rośnie wpływ interferencji między ścieżkowych, co utrudnia odfiltrowanie sygnału od szumu. Rośnie też znaczenie fluktuacji wysokości lotu głowic nad powierzchnią talerza, co wymusza stosowanie rozwiązań pozwalających na obserwowanie oraz stabilizację wysokości ich lotu.
Jednak najważniejszą przyczyną problemów związanych z zapisem dachówkowym jest utrata swobodnego dostępu do sektora podczas zapisu. O ile możemy swobodnie odczytywać dowolne sektory, to przy zapisie różnica szerokości ścieżek odczytywane i zapisywane powoduje, że nie możemy zapisać wybranego sektora bez zmiany namagnesowania sąsiedniej ścieżki. W praktyce oznacza to konieczność przepisywania wielu ścieżek nawet wtedy, gdy potrzebujemy zmienić za-wartość pojedynczego sektora. Oczywiście bardzo negatywnie odbija się to na wydajności dysku podczas zapisu.
Sposoby rozwiązywania problemów i optymalizacji pracy dysków SMR
Gdyby zapisać całą powierzchnię talerza, wykorzystując technologię SMR, jakakolwiek zmiana któregokolwiek sektora wymagałaby przepisania wszystkich ścieżek począwszy od tej, na której ten sektor się znajduje aż do końca powierzchni talerza. W praktyce taka sytuacja jest niedopuszczalna, dlatego ścieżki dzieli się na grupy (strefy) oddzielone niewielkimi odstępami (ostatnia ścieżka strefy nie jest częściowo nadpisywana przez kolejną). Pozwala to na ograniczenie liczby zapisów, jednak i tak zmiana zawartości sektora leżącego w takiej strefie wymaga przepisania całej strefy.
Przepisywanie całych stref za każdym razem przy zmianie zawartości pojedynczych sektorów byłoby bardzo uciążliwe dla użytkowników, natomiast wykorzystanie ulotnego buforowania DRAM do przechowywania większych ilości danych obciążone jest ryzykiem ich utraty w przypadku zaniku zasilania. Dlatego opracowano szereg rozwiązań pozwalających na względnie normalne korzystanie z dysków SMR.
Rozwiązania te sprowadzają się do różnych zabiegów pozwalających na umieszczanie logicznych sektorów w różnych fizycznych miejscach dysku, co skutkuje zerwaniem tradycyjnego dla wcześniejszych generacji dysków twardych względnie trwałego przywiązania adresów logicznych do adresów fizycznych. Metody zarządzania adresacją danych można podzielić na trzy zasadnicze kategorie:
Host Managed (HM-SMR) – zarządzane przez komputer, w którym dysk się znajduje,
Disk Managed (DM-SMR) – gdzie ciężar zarządzania adresacją danych w całości spoczywa na oprogramowaniu układowym dysku i odbywa się w sposób niezauważalny dla użytkownika,
Host Awared (HA-SMR) – łączący powyższe podejścia, w których za część informacji o adresowaniu danych odpowiada oprogramowanie układowe dysku, a część jest przechowywana przez komputer zarządzający w tzw. buforze H.
Rozwiązania DM-SMR z racji obciążenia zarządzaniem adresacją oprogramowania układowego dysku są najłatwiejsze w implementacji. Nie wymagają obsługi dodatkowych funkcji od BIOS-u oraz systemu operacyjnego komputera. Poza tym pozwalają one na podłączanie dysku do różnych komputerów nie powodując ryzyka utraty danych, gdyż wszystkie niezbędne dla ich adresowania informacje są zapisane w strefie serwisowej dysku.
Nie dziwi więc, że w praktyce to z nimi najczęściej będziemy się spotykać i to właśnie na nich skupimy się w dalszej części artykułu. Rozwiązania HM-SMR i HA-SMR można spotkać jedynie w dużych centrach danych. Rozwiązania DM-SMR opierają się na dwustopniowej translacji adresów logicznych na fizyczne. Pierwszy stopień, podobnie, jak i w przypadku dysków z zapisem konwencjonalnym (bez SMR), odpowiada za omijanie defektów i relokację uszkodzonych sektorów. Drugi pozwala na ustalanie, w której fizycznej lokalizacji znajduje się aktualna wersja danej jednostki LBA.
Jest to związane z faktem buforowania danych napływających do dysku w strefie zapisu konwencjonalnego, co jest rejestrowane w odpowiednich tablicach oprogramowania układowego dysku. Dane te są przenoszone do właściwych stref zapisu SMR, gdy dysk nie jest obciążony innymi operacjami. Ale dopóki sektor nie trafi w swoje docelowe miejsce, podsystem translacji musi wiedzieć, gdzie go szukać na wypadek, gdyby użytkownik chciał go odszukać. Większość dysków SMR wspiera także obsługę funkcji TRIM, która pozwala zwracać wartości 0x00 w odpowiedzi na żądanie odczytania sektorów niezaalokowanych w strukturach logicznych systemu plików (wolne miejsce partycji – zob. „Rola metadanych w przechowywaniu plików”, Security Magazine 5(14) 2023 bez konieczności ich fizycznego odnajdywania i odczytywania.
Tym niemniej tak skomplikowany podsystem translacji adresów logicznych na fizyczne istotnie wpływa na awaryjność dysków SMR. Jest to dodatkowa rzecz, która może się zepsuć, a z racji dużej liczby zapisów w odpowiednich tablicach oprogramowania układowego, ryzyko wystąpienia w nich błędów jest całkiem spore. Jeśli diagnostyka dysku (zob. „Podstawy diagnostyki dysków twardych”) wskazuje na uszkodzenie oprogramowania układowego, w przypadku dysków SMR z bardzo dużym prawdopodobieństwem ucierpiała translacja adresów logicznych na fizyczne.
Z uwagi na fakt, że podsystem translacji nie tylko jest bardzo złożoną częścią oprogramowania układowego, ale też jest unikalny dla każdego egzemplarza dysku, trzeba zachować dużą ostrożność przy próbach jego naprawy. Bezwzględnie należy zabezpieczyć stan wyjściowy zgrywając zawartość strefy serwisowej dysku. Większość modeli wymaga przy tym dodatkowych, specyficznych dla producenta i rodziny modeli, ingerencji w oprogramowanie układowe.
Trzeba też zwracać uwagę na to, że wiele opisywanych w różnych źródłach sposobów naprawy dysku jest destrukcyjnych dla zawartości i może utrudnić lub wręcz w praktyce uniemożliwić jej odzyskanie.