Model językowy — warunki powstania
Model językowy, mimo ogromnej popularności, jest jednak modelem tzw. blackbox („czarna skrzynka"), botem typu „pytanie — odpowiedź”. Oznacza to, że jest w stanie wygenerować ładnie zbudowane odpowiedzi, ale zupełnie nie rozumie, o co został zapytany — nie orientuje się w rzeczywistości, nie osadza informacji w kontekście. Łączą się z nim też inne kontrowersje, np. tania siła robocza z Afryki wykorzystywana do manualnego sprawdzania modeli.
Magazyn Time raportował, że Open AI, firma, która stworzyła ChatGPT, outsource’owała manualne a-notowanie tekstów i nadawanie im tagów do firmy z Kenii i płaciła pracownikom mniej niż 2 dolary za godzinę. Pracownicy ci narażeni byli narażeni na kontakt z drastycznymi treściami.
"Wydaje się, że większość tego tekstu została wyciągnięta z najciemniejszych zakamarków internetu. Niektóre z nich szczegółowo opisywały sytuacje, takie jak wykorzystywanie seksualne dzieci, bestialstwo, morderstwo, samobójstwo, tortury, samo-okaleczenie i kazirodztwo" — podał Time.
- ChatGPT robi wrażenie, jednak przez to, jak został zbudowany, może wprowadzać w błąd lub szerzyć dezinformację, co jest nieakceptowalne, szczególnie w zastosowaniu biznesowym — mówił Bartosz Baziński, COO i współzałożyciel SentiOne, dodając: — Technologia musi służyć ludziom, a nie działać przeciwko nim. Algorytmy sztucznej inteligencji powinny być pomocne, nie mogą szerzyć dezinformacji, wprowadzać błąd, przeklinać lub szerzyć obraźliwych opinii — ksenofobicznych, rasistowskich itp., co już się zdarzało. Po co nam technologia, która wprowadza w błąd lub nas obraża? To bez sensu.
Aby stworzyć model językowy jak ChatGPT, należy spełnić kilka warunków, w tym:
dostępność dużej ilości danych treningowych: modele językowe opierają się na uczeniu maszynowym, co wymaga dużej ilości danych tekstowych do nauki,
zasoby obliczeniowe: modele językowe są bardzo złożone i wymagają dużych zasobów obliczeniowych, takich jak procesory graficzne (GPU) lub chmury obliczeniowe, aby móc efektywnie trenować modele,
zespół ekspertów: stworzenie modelu językowego wymaga zespołu ekspertów w dziedzinach takich jak uczenie maszynowe, językoznawstwo czy informatyka,
czas i budżet: trenowanie modelu językowego jest czasochłonne i kosztowne, dlatego ważne jest, aby mieć odpowiednie zasoby, aby móc to zrobić skutecznie,
otwarte źródła i biblioteki: dostępność otwartych źródeł i bibliotek umożliwiających budowanie i trenowanie modeli językowych, takich jak TensorFlow lub PyTorch, jest kluczowa dla sukcesu projektu,
wiedza i doświadczenie w projektowaniu modeli językowych: Projektowanie i trenowanie wymaga wiedzy i doświadczenia w zakresie architektur sieci neuronowych, hiperparametrów oraz metod uczenia,
dostęp do różnorodnych źródeł danych: modele językowe uczą się od danych, dlatego ważne jest, aby mieć dostęp do różnorodnych i reprezentatywnych źródeł danych, takich jak teksty, dialogi czy artykuły,
ocena i testowanie modelu: po stworzeniu modelu językowego ważne jest, aby przeprowadzić szereg testów i ocen, aby upewnić się, że jest on wystarczająco dobry i gotowy do użycia,
częste aktualizacje i ulepszenia: modele językowe muszą być regularnie aktualizowane i ulepszane, aby umożliwić im uczenie się i dostosowywanie do zmieniających się potrzeb i wymagań rynku,
integracja z innymi systemami i narzędziami: modele językowe muszą być zintegrowane z innymi systemami i narzędziami, takimi jak CRM, e-commerce i systemy baz danych, aby były jak najbardziej efektywne i użyteczne.
Model językowy może zostać stworzony przez wiele różnych firm i organizacji, w tym:
Duże korporacje technologiczne, jak Google, Amazon, Microsoft czy Apple, które mają wiedzę, zasoby i doświadczenie w dziedzinie uczenia maszynowego i technologii językowej.
Start-upy specjalizujące się w uczeniu maszynowym i sztucznej inteligencji, które inwestują w rozwój modeli językowych.
Instytuty naukowe i akademickie, które mają programy badawcze i duże zasoby obliczeniowe, a także specjalistów z dziedziny uczenia maszynowego i językoznawstwa.
Firmy z branży IT i oprogramowania, które chcą wykorzystać modele językowe w swoich produktach i usługach.
Agencje rządowe i organizacje non-profit, które szukają nowych rozwiązań do zastosowań w sektorze publicznym lub dla dobra społeczeństwa.
Polska firma zbuduje model językowy dla biznesu
Rozpoczęły się prace nad stworzeniem europejskiej odpowiedzi na ChatGPT, a jej twórcą będzie polski SentiOne.
- Nasze modele sztucznej inteligencji są na bieżąco douczane na specjalnie przygotowanych tekstach i wiedzy dziedzinowej, testowane m.in. na zapisach rzeczywistych rozmów klientów z call center. Patrząc na nasze zasoby – zbiory danych i zespół – jestem przekonany, że nikt nie zbuduje lepszego modelu dla języka polskiego, a następnie dla innych języków europejskich, niż my. Chcemy stać się liderem w dostarczaniu technologii AI dla biznesu, a konkretnie dla branż: finansowej, ubezpieczeniowej, medycznej, telekomunikacyjnej. Od początku powstania SentiOne zainwestowaliśmy w rozwój technologii oraz modeli sztucznej inteligencji ponad 42 mln złotych i cały czas ją rozwijamy. Ze względu na duże zainteresowanie zarówno naszymi modelami, jak i ChatGPT, rozważamy, czy udostępnić próbki naszego modelu do testów dla szerszego grona odbiorców — damy znać — zaznaczył Bartosz Baziński.
- SentiOne spełnia warunki, pozwalające zbudować takie narzędzie. Dzięki 11 latom monitorowania Internetu ma dostęp do nieprzebranej ilości danych publicznych, tekstów oraz wypowiedzi. Ma również doświadczenie w budowaniu skutecznego, autorskiego modelu AI opartego o sieci neuronowe, który rozumie ludzkie intencje na poziomie 96 procentach. Dzięki licznym skutecznym wdrożeniom chatbotów i voicebotów u klientów biznesowych eksperci z SentiOne dysponują również dużym know-how oraz mają dostęp do danych dziedzinowych. Narzędzie SentiOne będzie równie łatwe do obsługi, jak ChatGPT, bo jest tworzone w systemie low-code / no-code, który nie wymaga od użytkowników umiejętności kodowania — dowiedzieliśmy się od firmy, która od 11 lat wspiera marki w zakresie automatyzacji obsługi klienta z wykorzystaniem technologii AI.
Warto też wiedzieć, że w 2021 roku firma otrzymała od Narodowego Centrum Badań i Rozwoju grant wysokości niemal 19 mln zł na rozwój konwersacyjnej sztucznej inteligencji, a w 2020 roku zdobyła tytuł finalisty EIT Digital Challenge i znalazła się wśród 20 najlepszych spółek technologicznych w Europie.
Życie z technologią
- Wobec ChatGPT pojawiają się również zarzuty związane z tym, że jest wykorzystywany do zadań, które powinny być wykonywane samodzielnie, np. pisania wypracowań i prac zaliczeniowych przez uczniów i studentów. Jednak to nie zawsze jest złe rozwiązanie. Przykładowo, nauczyciel może zlecić technologii, by wymyśliła i napisała test na temat wojen z zakonem krzyżackim z 10 propozycjami pytań wielokrotnego wyboru. Czy to oznacza, że sztuczna inteligencja zastąpi nauczyciela? Nie, bo test będzie wymagał weryfikacji, a do wykorzysta-nia będzie się nadawało zapewne 50-70 procent zaproponowanych pytań. Czy to przyspieszy pracę nauczyciela? Tak, o te 50-70 procent — przekonywał SentiOne.
- Do tego, że modele AI zachęcają do pracy niesamodzielnej, podszedłbym od drugiej strony — zachęcam, by wszyscy wspierali swoją pracę AI — mówił Bartosz Baziński, dodając: — Nie obronimy się przed technologią, więc radzę, by nauczyć się z nią żyć i z niej korzystać, a nie dać się jej wykorzystać. Technologia AI może znacząco przyspieszyć pracę wielu, wielu osób. I w mojej opinii sztuczna inteligencja nie zastąpi ludzi, ale zastąpi tych, którzy jej nie używają.