Czy warto rozmawiać ze sztuczną inteligencją o odzyskiwaniu danych?
Jedni przyjęli modele językowe z ogromnym entuzjazmem, upatrując w nich pożyteczne narzędzie pozwalające wyręczyć człowieka w wielu zadaniach od tworzenia różnego rodzaju tekstów, publikacji i opracowań po udzielanie odpowiedzi na trudne pytania i wsparcie w rozwiązywaniu złożonych problemów. Inni zwracają uwagę na liczne błędy i konfabulacje w udzielanych przez modele językowe odpowiedziach. Na ile sztucznej inteligencji można zaufać?
Mi utkwiła w pamięci jedna z odpowiedzi udzielonych na Elektrodzie. Po zwróceniu sztucznej inteligencji uwagi, że pisze bzdury odpowiedziała „nie jestem inżynierem, ale jestem tu, żeby Ci pomóc”.
Temat wykorzystania modeli językowych wynikł przy okazji tworzonego przez Artura Markiewicza poradnika „Metody tworzenia firmy odpornej na cyberprzestępcę”. Poradnik ten jest adresowany przede wszystkim do nietechnicznych menedżerów i ma im ułatwić zrozumienie zagrożeń związanych z cyberprzestępczością. Z kolei Artur Maciąg zaproponował wykorzystanie dla poszerzenia wiedzy menedżerów sztucznej inteligencji i zaproponował do wykorzystania szereg promptów.
Nie mogłem w tej sytuacji nie zwrócić uwagi na ryzyko związane z udzieleniem przez sztuczną inteligencję głupich odpowiedzi i szkodliwych porad, stąd przeprowadziliśmy eksperyment. Wrzuciłem zaproponowane przez Artura Maciąga prompty dotyczące odzyskiwania danych w ChatGPT 4.0 i odniosłem się do jego odpowiedzi. Poniżej znajdziesz prompty, odpowiedzi sztucznej inteligencji oraz ich ocenę z moim uzasadnieniem.
Najlepsze praktyki odzyskiwania danych po awarii:
Prompt:
Jakie są najnowsze, sprawdzone metody odzyskiwania danych z oryginalnych nośników po awarii? Proszę o informacje oraz źródła, które potwierdzają skuteczność tych metod.
Odpowiedź:
Odzyskiwanie danych z oryginalnych nośników po awarii jest zaawansowanym procesem, który może różnić się w zależności od rodzaju awarii i typu nośnika. Oto niektóre z najnowszych i sprawdzonych metod odzyskiwania danych:
1. Analiza i naprawa uszkodzonych sektorów
W przypadku uszkodzeń fizycznych nośników, takich jak dyski twarde, technicy często korzystają z zaawansowanych narzędzi do naprawy uszkodzonych sektorów. Technologie takie jak HDD Regenerator czy SpinRite mogą pomóc w analizie i naprawie uszkodzonych obszarów na dysku.
Źródła:
SpinRite: SpinRite Official Website
HDD Regenerator: HDD Regenerator Official Website
2. Odzyskiwanie danych z uszkodzonych systemów plików
W przypadku problemów z systemami plików (np. NTFS, FAT32), narzędzia takie jak Recuva, TestDisk, czy PhotoRec mogą być używane do analizy i odzyskiwania danych.
Źródła:
Recuva: Recuva Official Website
TestDisk/PhotoRec: TestDisk Official Website
3. Odzyskiwanie danych z uszkodzonych pamięci flash
Dla nośników typu SSD czy karty pamięci, techniki odzyskiwania mogą obejmować bezpośredni odczyt pamięci przy użyciu specjalistycznego sprzętu i oprogramowania, jak np. DriveSavers czy Ontrack EasyRecovery.
Źródła:
DriveSavers: DriveSavers Official Website
Ontrack EasyRecovery: Ontrack EasyRecovery Official Website
4. Inżynieria odwrotna i odbudowa danych
W bardziej skomplikowanych przypadkach, takich jak uszkodzenia kontrolera dysku czy uszkodzenia mechaniczne, stosuje się inżynierię odwrotną. Technicy często wymieniają uszkodzone elementy w specjalistycznych laboratoriach, co może obejmować wymianę elektroniki dysku twardego lub naprawę w trybie czysto laboratoryjnym.
Źródła:
Kroll Ontrack: Kroll Ontrack Official Website
Data Rescue: Data Rescue Official Website
5. Użycie sprzętu do odzyskiwania danych
Nowoczesne laboratoria odzyskiwania danych używają sprzętu takich jak data recovery workstations i readers do bezpośredniego odczytu pamięci w uszkodzonych nośnikach. Przykłady to narzędzia takie jak PC-3000 czy DeepSpar Disk Imager.
Źródła:
PC-3000: PC-3000 Official Website
DeepSpar Disk Imager: DeepSpar Official Website
Uwagi:
Profesjonalne Laboratoria: W wielu przypadkach odzyskiwanie danych wymaga pracy w profesjonalnym laboratorium, gdzie technicy mają dostęp do zaawansowanych narzędzi i technologii.
Koszty: Proces odzyskiwania danych, zwłaszcza w przypadku poważnych uszkodzeń, może być kosztowny. Warto ocenić, czy dane są na tyle cenne, aby inwestować w profesjonalne usługi.
Najnowsze metody i technologie są regularnie aktualizowane, więc dobrze jest śledzić branżowe wiadomości i rozwój oprogramowania, aby być na bieżąco z najlepszymi praktykami odzyskiwania danych.
Komentarz:
Samo zapytanie jest postawione w wątpliwy sposób. Dobór metody powinien być adekwatny do usterki stwierdzonej w toku diagnostyki. W większości przypadków mamy do czynienia z metodami starymi, aczkolwiek wciąż rozwijanymi. Naprawdę nowe metody pojawiają się jedynie w przypadku, kiedy w konstrukcji nośników danych pojawiają się przełomowe technologie skutkujące pojawieniem się nowej kategorii problemów.
1/ — SzI poleca dwa programy, jakich zasada działania wiąże się z ryzykiem pogorszenia stanu nośnika i jego zawartości. W przypadku wystąpienia uszkodzonych sektorów nie należy ich naprawiać, ale zabezpieczyć zawartość nośnika kopiując ją na inny dysk. HDD Regenerator jest szeroko krytykowany także za skłonność do zawieszania i związane z tym ryzyko nadpisania dużych obszarów danych. Z kolei Spinrite (swoją drogą program z lat '80, a więc śmiało można go zaliczyć do najstarszych narzędzi do odzyskiwania danych) zapisuje odzyskiwane dane na tym samym dysku, co należy do najbardziej podstawowych błędów odzyskiwania danych (zob. Security Magazine 1(10)/2023). Ze względu na wskazane wyżej ryzyko, żaden z tych programów nie jest i nie powinien być wykorzystywany w odzyskiwaniu danych.
2/ — Recuva faktycznie jest szeroko polecana i wykorzystywana w amatorskim obiegu, jednak jej jedyną, a przy tym wątpliwą (zob. Security Magazine 4(25)/2024) zaletą jest prostota obsługi i pełny automatyzm wykonywanych procedur. Z tego względu program cieszy się dużym zainteresowaniem osób niemających pojęcia o odzyskiwaniu danych. Program nie obsługuje żadnych funkcji wykorzystywanych w odzyskiwaniu danych, prócz skanowania nośnika. Nie pozwala na wykonywanie kopii posektorowych. Nie ma też wbudowanego edytora szesnastkowego.
Podobnych programów są tysiące, jednak Recuva jest polecana częściej, niż inne programy. Prawdopodobnie dlatego, że we właściwym momencie przekroczyła krytyczną masę poleceń i jest często wybierana, a następnie polecana dalej przez osoby, jakim w jakiś sposób pomogła. Jeśli dowolny prymitywny program nie potrafi sam znaleźć utraconych danych, prawdopodobieństwo, że inny prymitywny program to zrobi, jest znikome, stąd największe szanse na polecenie ma program wybrany, jako pierwszy. Poważną wadą prymitywnych programów do odzyskiwania danych (w tym Recuvy) jest to, że słabo sobie radzą z pracą z uszkodzonymi strukturami logicznymi i potrafią skłonić użytkownika do sformatowania dysku, co jest poważnym błędem, jaki może doprowadzić do katastrofalnych konsekwencji (zob. Security Magazine 5(14)/2023).
Z kolei zestaw Testdisk + Photorec jest lepszy nie tylko ze względu na lepszą skuteczność wyszukiwania plików, ale też dlatego, że umożliwia wstawienie odnalezionych partycji. Czasem pozwala to szybko przywrócić dostęp do danych bez konieczności skanowania całego dysku i wykopiowywania plików, jednak jest obarczone ryzykiem uszkodzenia lub utraty danych, jeśli zostanie wstawiona niewłaściwa partycja. Zwłaszcza na nośnikach obsługujących funkcję TRIM.
3/ — Ten punkt odpowiedzi jest nie na temat. Drive Savers, to nie metoda, czy narzędzie do odzyskiwania danych, ale firma oferująca usługi odzyskiwania danych. Z kolei Ontrack Easy Recovery, to kolejny z tysięcy prymitywnych programów, jakie mogą być amatorsko użyte do odzyskiwania danych w przypadku uszkodzeń logicznych, ale polecanie go w przypadku jakichkolwiek uszkodzonych nośników jest grubym nieporozumieniem.
4/ — Nazywanie manualnej wymiany uszkodzonych podzespołów inżynierią odwrotną jest mocno na wyrost. Tak, w przypadku uszkodzeń elektronicznych lub mechanicznych często uszkodzone elementy są wymieniane (te metody są stosowane od początku istnienia odzyskiwania danych jako osobnej specjalizacji IT), jednak niewiele mają wspólnego z inżynierią odwrotną (wsteczną) wykorzystywaną dla lepszego zrozumienia działania nośników danych i występujących w nich usterek, co z kolei pozwala opracowywać nowe i udoskonalać istniejące metody odzyskiwania danych podnosząc skuteczność procesu. Współcześnie inżynieria wsteczna nośników danych dotyczy przede wszystkim zagadnień związanych z oprogramowaniem układowym i jego usterkami (zob. Security Magazine 6(15)/2023, 9(18)/2023 i 11(20)/2023).
5/ — Data recovery workstations i readers, to prawdopodobnie jedynie puste pojęcia, jakie SzI znalazła na anglojęzycznych stronach, a jakich ani nie rozumie, ani nie potrafi przetłumaczyć po polsku. PC-3000, to faktycznie grupa zaawansowanych narzędzi pozwalających na pracę z uszkodzonymi nośnikami danych, rozwiązywanie problemów oprogramowania układowego, czy wykonywanie kopii posektorowych uszkodzonych i niestabilnie pracujących dysków. Natomiast Deepspar Disk Imager, to duplikator – narzędzie o funkcjonalności ograniczonej do klonowania dysków sprawnych lub uszkodzonych jedynie w niewielkim stopniu. W odzyskiwaniu danych czasami wykorzystuje się ten i podobne duplikatory, jednak są to narzędzia o co najwyżej pomocniczym znaczeniu.
Ogólna ocena udzielonej odpowiedzi – niedostateczna.
Uzasadnienie: SzI popełniła kilka błędów, jakie mogą przynieść krytyczne dla danych i nieodwracalne konsekwencje. W szczególności takie konsekwencje może przynieść użycie HDD Regeneratora oraz próby odzyskiwania danych na ten sam dysk przez Spinrite. Ryzykowne może być także użycie Testdisku przez osoby nierozumiejące podstaw funkcjonowania struktur logicznych. Używanie prymitywnych programów do automatycznego skanowania nośników w przypadku fizycznych uszkodzeń, o ile uruchomienie skanu w ogóle będzie możliwe, jest zbędnym obciążeniem, jakie może doprowadzić do dalszej degradacji nośnika przy niewielkim prawdopodobieństwie uzyskania pozytywnych rezultatów.
Pozostałe błędy, jak np. wskazanie nazwy firmy odzyskującej dane jako przykładu specjalistycznego sprzętu lub oprogramowania, czy nazywanie relatywnie prostych czynności manualnych inżynierią odwrotną nie mają krytycznego znaczenia, jednak jasno pokazują nieadekwatność udzielonej odpowiedzi do postawionego pytania, a także to, że SzI wiele brakuje do elementarnego zrozumienia, na czym odzyskiwanie danych w istocie polega.
Zabrakło także choćby podstawowych informacji o tym, że jakiekolwiek działania powinny być poprzedzone adekwatną diagnostyką i powinny prowadzić do możliwie najmniej inwazyjnego zabezpieczenia zawartości nośnika na innym dysku. Dlatego dialog na ten temat ze SzI jest w lepszym wariancie stratą czasu, w gorszym – zastosowanie się do jej porad może być szkodliwe.
Ciąg dalszy w kolejnych wydaniach "Security Magazine".