ChatGPT-4 przewyższa ludzi w testach świadomego myślenia
Najnowsze badania wykazały, że modele AI opracowane przez OpenAI, w tym ChatGPT-4, przewyższają ludzi w testach świadomego myślenia. W badaniu opublikowanym w „Nature Computational Science” stwierdzono, że wcześniejsze wersje tych modeli, takie jak GPT-1 i GPT-2, często popełniały błędy podobne do tych, które popełniają ludzie, bo opierają się na intuicji. Jednak nowsze wersje, 3.5 i 4, wykazują znacznie większą dokładność w rozwiązywaniu zadań wymagających refleksji i analizy.
Badanie przeprowadzone przez zespół naukowców z różnych dziedzin miało na celu sprawdzenie, czy modele AI mogą naśladować procesy poznawcze ludzi, szczególnie decyzje intuicyjne oraz bardziej przemyślane i analityczne. W eksperymentach wzięło udział 500 osób oraz różne wersje modeli GPT. Wyniki pokazały, że ChatGPT-4, dzięki zaawansowanej zdolności do „analitycznego myślenia”, przewyższa ludzkie wyniki w testach świadomego myślenia.
ChatGPT-4 radzi sobie lepiej od ludzi w zadaniach wymagających głębokiej refleksji i analizy
Jednym z kluczowych odkryć badaczy było to, że wcześniejsze modele AI, takie jak GPT-1 i GPT-2, często wykazywały błędy typowe dla ludzkiej intuicji, co wskazuje na ich zdolność do naśladowania ludzkich procesów myślowych. Natomiast najnowsza wersja nie tylko unika tych błędów, ale również przewyższa ludzi w zadaniach wymagających głębokiej refleksji i analizy.
Badacze podkreślają, że postępy w dużych modelach językowych, takich jak ChatGPT, nie tylko zwiększają ich możliwości, ale także utrudniają przewidywanie ich zachowań. Zamiast badać te modele przez pryzmat architektury i parametrów, naukowcy proponują stosowanie metod psychologicznych do analizy procesów decyzyjnych AI. To podejście może pomóc w lepszym zrozumieniu, jak modele AI podejmują decyzje i jakie mogą być ich ograniczenia.
Pełne wyniki badań można znaleźć w artykule „Human-like intuitive behavior and reasoning biases emerged in large language models but disappeared in ChatGPT” autorstwa Thilo Hagendorffa, Sarah Fabi i Michała Kosińskiego.
Więcej informacji dostępnych jest na stronie PsyPost.
Miłośnik nowoczesnych technologii, głównie nowych rozwiązań IT. Redaktor w czasopismach Gambler, Enter, PC Kurier, Telecom Forum, Secret Service, Click!, Komputer Świat Gry, Play, GameRanking. Wiele lat spędził w branży tłumaczeniowej – głównie gier i programów użytkowych. W wolnych chwilach lata szybowcem, jeździ na rowerze i pochłania duże ilości książek.