menu
tygodnik internetowy
ISSN 2544-5839
zamknij
Pracuj w mediach. Zobacz, kto rekrutuje w branży dziennikarskiej, reklamowej i kreatywnej

20.03.2023 Rynek medialny

ChatGPT nie zna się na żartach

Ludwika Tomala

Naukowcy z Politechniki Wrocławskiej sprawdzili czy ChatGPT rozumie żarty, wychwytuje błędy językowe, sarkazm i agresję, rozpoznaje spam. Poprosili program o wykonanie ponad 38 tysięcy zadań. Na razie wypada on gorzej niż nowoczesne wyspecjalizowane w tym programy, nie mówiąc już o ludziach.
ChatGPT nie zna się na żartachfot. Airam Dato-on/CC0/Pexels

- Jak na program, który nie był trenowany specyficznie w tym zakresie, ChatGPT i tak wypadł całkiem nieźle - komentuje jeden z autorów badania dr Jan Kocoń.

Język naturalny w komunikacji człowiek-komputer


- Ludzie przyzwyczaili się już, że w komunikacji z komputerem używają formularzy, komend czy słów kluczowych zamiast języka naturalnego. A głównym celem opracowania ChatGPT miało być wykonanie kroku w stronę naturalnej interakcji człowiek-komputer w formie konwersacji. Według nas ChatGPT jest w tym zakresie czymś rewolucyjnym - wyjaśnia dr Jan Kocoń z Politechniki Wrocławskiej. - ChatGPT szybko zaczął być jednak stosowany do celów, o których nie śniło się jego twórcom: rozwiązywania bardzo różnych problemów, które często wymagają świetnego rozumienia języka i znajomości kontekstów towarzyszących używaniu języka. Pytanie więc, jak dobrze ChatGPT orientuje się w tych obszarach.

Jak zadać 38 ty sięcy pytań


Naukowcy z zespołu CLARIN-PL - zajmujący się badaniami nad sztuczną inteligencją i przetwarzaniem języka naturalnego - postanowili to systematycznie sprawdzić. Poddali nowy chatbot restrykcyjnym testom. Zadali sztucznej inteligencji ponad 38 tysięcy zapytań.


- To było bardzo pracochłonne, bo nie było wtedy jeszcze do tego żadnej API (interfejsu) do zadawania takiej liczby pytań. Dostępna była również jedynie bezpłatna wersja z limitem około 50 pytań na godzinę dla jednego użytkownika. 20 osób z zespołu użyczało swoich kont w serwisie ChatGPT, dzięki czemu możliwe było automatyczne zadawanie ok. 2 tys. pytań dziennie - opowiada dr Kocoń.

To jedne z największych dotąd badań dotyczących Chatu GPT. Na razie badania te nie były jeszcze zrecenzowane, badacze udostępnili preprint.

ChatGPT a konkurencja


Naukowcy chcieli porównać, jak ChatGPT prezentuje się na tle najlepszych dostępnych na rynku modeli do automatycznej analizy języka. Chodzi choćby o systemy do analizy tzw. sentymentu. To programy, które np. firmom marketingowym pozwalają analizować, jakie emocje wywołuje w sieci dana informacja, usługa czy marka.
- Dostawaliśmy bowiem zapytania od firm, czy opłaca się zrezygnować z tych wyspecjalizowanych programów i zdać się jedynie na ChatGPT - opowiada dr Kocoń.

Wniosek? Na razie ChatGPT wypada gorzej niż te programy. Im gorzej radziły sobie z jakimś zadaniem inne modele, tym słabiej na ich tle wypadł ChatGPT. Popełniał błędy, które wychwyciłaby większość ludzi. Specjalista do wszystkich tematów nie okazał się więc być mistrzem w żadnym z nich - oceniają w swojej publikacji naukowcy.

Bazy ludzkich ocen


Badacze wzięli na warsztat 25 obszarów tematycznych powiązanych z wielkimi bazami różnych tekstów, w których każdy tekst oceniony był już ręcznie przez ludzi. I tak np. korzystano z bazy prawie 40 tysięcy tweetów z Twittera, gdzie każdy oceniony był już wcześniej przez ileś osób jako sarkastyczny lub nie. Zrobiono też użytek z bazy projektu Wikipedia Detox, gdzie wikipedyści głosowali nad tym, czy dany komentarz jest agresywny czy nie. Użyto też bazy kilkudziesięciu tysięcy wpisów z portalu Reddit otagowanych przez ekspertów jako zawierających jakieś konkretne emocje.

Badacze zadawali Chatowi GPT te same pytania, na które wcześniej odpowiedzieli już ludzie. Np. pytali, czy zacytowany przez nich tekst jest spamem albo czy zawiera sarkazm, jest humorystyczny, agresywny albo czy jest poprawny gramatycznie. Były też prośby o rozpoznanie w tekście emocji, o wnioskowanie na podstawie informacji zaszytych w tekście czy o rozwiązanie prostych matematycznych zadań "z treścią".

- We wszystkich z 25 badanych obszarów chatbot od OpenAI znacznie ustępował swojej konkurencji. Aktualnie najlepsze modele przetwarzania języka naturalnego SOTA (state-of-the-art) znacznie lepiej wychwytywały poprawność gramatyczną, emocje użytkowników, znaczenia słów, trafniej odpowiadały na pytania i rozwiązywały zadania matematyczne. Mimo to, wyniki osiągane przez ChatGPT są imponujące, biorąc pod uwagę fakt, że dla większości testowanych zadań model nie był wcześniej trenowany bezpośrednio do ich rozwiązywania - komentują naukowcy w przesłanym PAP komunikacie o badaniach.

AUTOPROMOCJA. Zajrzyj na nasz Youtube. Poznaj #59sec REPORT
Zaskoczenie: Wideo już NIE RZĄDZI [NAPISY] 👇

A dr Kocoń dodaje, że strata ChatGPT wobec innych modeli wynosiła średnio 25 punktów procentowych. Najgorzej ChatGPT radził sobie z oceną emocji i zadaniami pragmatycznymi, wymagającymi wiedzy o świecie. Lepiej - z zadaniami semantycznymi, gdzie odpowiedź na pytanie można było wyciągnąć z analizowanego tekstu.

Naukowcy zwracają uwagę, że wyspecjalizowane modele do przetwarzania języka naturalnego, które już są na rynku, są zaprojektowane do jednego celu, np. do automatycznego wychwytywania agresywnych komentarzy. Są mniejsze i szybsze, i wytrenowane na konkretnych zbiorach danych odpowiadających na potrzeby użytkowników.

ChatGPT, mimo że jego odpowiedzi były poprawne rzadziej niż innych modeli, miał też jednak inne silne strony, w których pokonywał konkurencję. Jego zaletą było choćby to, że był w stanie wyjaśnić, dlaczego udzielił takiej, a nie innej odpowiedzi. I był kreatywny w odpowiedziach - gdy zadawano mu kilka razy to samo pytanie - odpowiedzi różniły się między sobą (co niestety znaczy również, że czasem bot odpowiadał prawidłowo, a czasem - nie).

AUTOPROMOCJA. Zajrzyj na nasz Youtube. Poznaj #59sec REPORT
Jak obrazy hakują twój mózg? [NAPISY] 👇

- Na razie więc ChatGPT nie zastąpi tych wyspecjalizowanych modeli, ale otwiera przed nami nowe możliwości, pokazuje, jak rozwijać się będzie świat - podsumowuje dr Kocoń. - Jest sporo zawodów, które ChatGPT może wyprzeć. Możliwości, jakie daje bot zmniejszą prawdopodobnie popyt na pracowników call-center. Pojawią się jednak inne zawody, których dotąd nie było - to choćby prompt-engineer - osoba specjalizująca się w układaniu dobrych poleceń dla chatbota. Ddla innych zawodów chatbot może być sporym wsparciem - przyda się np. w programowaniu, edukacji, korekcie czy tłumaczeniu tekstów.

Projekt CLARIN-PL jest największym projektem rozwoju sztucznej inteligencji finansowanym ze środków publicznych w Polsce. W jego realizację zaangażowanych jest 6 instytutów i ponad 20 firm. Większość zespołu pracuje na Politechnice Wrocławskiej. Głównym celem projektu jest opracowanie narzędzi do automatycznego przetwarzania ogromnych danych tekstowych głównie w języku polskim (ang. natural language processing - NLP).

***
artykuł pochodzi z portalu Naukawpolsce.pl
Udostępniany jest na wolnej licencji.

Udostępnij znajomym:

dodaj na Facebook prześlij przez Messenger dodaj na Twitter dodaj na LinkedIn

PRZERWA NA REKLAMĘ
Czytaj prasę w PDF

Najnowsze w dziale Rynek medialny:

Żółta Plakietka. Dokument Jana Bluza o więźniach politycznych na Białorusi

BARD
Wyobraź sobie, że piszesz trzy posty na portalu społecznościowym. Za kilka kliknięć w klawiaturę dostajesz trzy lata kolonii karnej. Brzmi jak ponury żart? Dla więźniów politycznych na Białorusi to codzienność, którą Jan Bluz pokazuje w dokumencie "Żółta Plakietka", zrealizowanym przy wsparciu Centrum Pulitzera.

Rynek reklamy 2025. Polska na tle Europy i świata

Marcin Grządka
Globalny rynek reklamowy rośnie w 2025 roku w tempie 8,8% i osiągnie wartość 1.14 biliona dolarów. Wynik branży w Europie notuje nieco niższą dynamikę, na poziomie 5,8%. W tym zestawieniu Polska wypada wyraźnie powyżej średniej. Zanotujemy w tym roku wzrost o 8,9% i wartość 18,56 mld zł - szacuje WPP Media w dorocznym raporcie "This Year Next Year".

Rynek prasy drukowanej 2025. Trzy globalne trendy

Krzysztof Fiedorek
Wartość rynku to 359,53 miliarda dolarów, jednak erozję widać gołym okiem. Spadek dla gazet wyniesie -2,3 procent. Mimo to, druk zachowuje siłę: generuje 76 procent przychodów z subskrypcji i cieszy się 82-procentowym zaufaniem konsumentów. Przyszłość branży definiują hybrydowe strategie i niszowa specjalizacja.

Podobne artykuły:

E-Booki o mediach i dla dziennikarzy w sklepie Reporterzy.info [LINK]

AUTOPROMOCJA Reporterzy.info
Dzięki współpracy z księgarnią Nexto i Tradedoubler Polska w sklepie reportera mamy dla Was nową ofertę tematycznych e-booków. Opracowania na temat historii i rynku mediów, wywiady, reportaże i poradniki fotograficzne. Zamówienie i dostawa książki zajmuje teraz tylko kilka chwil. Zapraszamy! [autopromocja]

Zero-click search 2025. Jeszcze większy koniec klikania w wyszukiwarkach

Bartłomiej Dwornik
Google rezygnuje z pozycji internetowego drogowskazu. Coraz bardziej chce być celem całej podróży. Depczące po piętach ChatGPT i Perplexity zmieniają zasady gry w wyszukiwanie. AI Overviews to karta z tej samej talii. Tylko twórcy treści są w tym wyścigu na coraz słabszej pozycji.

Polacy czytają coraz mniej? Niekoniecznie!

Bartłomiej Dwornik
W wojnie o czytelnika prasa wydaje się być już zdaniem wielu medioznawców na pozycji straconej, choć oczywiście nie zniknie całkowicie. Jej głównym rywalem jest internet.

Kim są użytkownicy ChatGPT? Analiza PSMM, Gemius i PBI

PSMM
Blisko 100 tysięcy publikacji na temat ChatGPT pojawiło się w polskojęzycznych mediach zaledwie kilka miesięcy po premierze rozwiązania na rynku. Najwięcej czasu na stronie firmy spędzają młode kobiety, a liczba polskich użytkowników ChatGPT w kwietniu 2023 osiągnęła prawie 3 miliony.

więcej w dziale: Rynek medialny

praca w mediach

Wydawca, redaktor
praca stacjonarna i online Dziennikarz, reporter
oferty mediów lokalnych, regionalnych i ogólnopolskich Grafik, Social Media, SEO, reklama
Warszawa • Białystok • Bydgoszcz • Gdańsk • Katowice • Kielce • Kraków • Lublin • Łódź • Olsztyn • Opole • Poznań • Rzeszów • Szczecin • Toruń • Wrocław • Zielona Góra • Praca zdalna Więcej

reklama

webePartnres

dołącz do nas

Facebook LinkedIn X Twitter TikTok Instagram Threads Youtube Google News Blue Sky Social RSS

Reporterzy.info - internetowy magazyn medioznawczy. Świat komunikacji od kuchni. Media, dziennikarstwo, PR i marketing. Dane, raporty, analizy, porady. Historia i rynek, prawo, fotografia, oferty pracy.




Sklep reportera

Sklep reportera

Niedrogie laptopy, notebooki i netbooki
Niedrogie laptopy, notebooki i netbooki
do pisania
Cyfrowe lustrzanki i aparaty kompaktowe
Cyfrowe lustrzanki i aparaty kompaktowe
dla fotoreportera
Książki i e-booki o mediach
Książki i e-booki o mediach
do czytania
Drony wideo i latające kamery
Drony wideo i latające kamery
dla pilota
Gimbale do stabilizacji wideo
Gimbale do stabilizacji wideo
dla operatora
Oprogramowanie i aplikacje
Oprogramowanie i aplikacje
dla twórców
więcej produktów


zajrzyj na nasz 👉 Youtube

Zobacz więcej 👇
#59sec REPORT SHORTS
gazety w PDF i epub

Czytaj gazety w PDF i EPUB

Okładka Egzorcysta - Pismo Ludzi Wolnych
Egzorcysta - Pismo Ludzi Wolnych
Okładka Historia Bez Cenzury
Historia Bez Cenzury
Okładka Lotnictwo
Lotnictwo
Okładka Świat Nauki
Świat Nauki
Okładka Tygodnik Solidarność
Tygodnik Solidarność
Okładka Wprost
Wprost
więcej e-gazet

Reporterzy.info

Dla głodnych wiedzy

Nasze serwisy

Współpraca


© Dwornik.pl Bartłomiej Dwornik 2oo1-2o26