Google przyznaje, że film demonstrujący możliwości AI Gemini został zainscenizowany
Wideo Hands-on with Gemini: Interacting with multimodal AI od Google było imponującą prezentacją nowego dużego modelu językowego AI (LLM) firmy. Jednak według rzecznika Google, z którym rozmawiał Bloomberg, film był inscenizowany, a interakcja ze sztuczną inteligencją nie do końca wygląda tak, jak to pokazano. W rzeczywistości komendy głosowe nie były używane podczas filmowania, a dialogi dodano później.
Sundar Pichai, dyrektor generalny Google, który udostępnił wideo w czwartek, podkreślał, że najlepszym sposobem na zrozumienie niesamowitych możliwości Gemini jest zobaczenie ich w akcji. Subtelna wskazówka, że nie wszystko jest takie, jak widzimy na ekranie, pochodzi z opisu filmu na YouTube. Wspomniano w nim: Na potrzeby tego demo opóźnienie zostało zmniejszone, a odpowiedzi Gemini zostały skrócone w celu zachowania zwięzłości.
Okazuje się jednak, że wyjaśnienie w przypisie nie było do końca dokładne. Wideo nie zostało jedynie skrócone, a podczas procesu nagrywania nie było interakcji na żywo. Rzecznik Google ujawnił Bloombergowi, że film został zmontowany przy użyciu pojedynczych klatek z materiału wideo i podpowiedzi tekstowych. W ten sposób Gemini reagowała tylko na wpisywane monity i przesyłane obrazy. Pozorna konwersacja z człowiekiem mówiącym, rysującym, pokazującym obiekty i wchodzącym w interakcje z AI, została najwyraźniej zainscenizowana wyłącznie na potrzeby filmu demonstracyjnego.
Hands-on with Gemini to inspiracja dla programistów
Dodatkowych wyjaśnień dotyczących Hands-on with Gemini udzielił Oriol Vinyals, wiceprezes ds. badań i Deep Learning Lead w Google DeepMind, który stwierdził:
Film pokazuje, jak mogą wyglądać multimodalne doświadczenia użytkownika budowane przez Gemini. Stworzyliśmy go, aby zainspirować programistów.
Jednak oświadczenie Vinyalsa spotkało się z krytyką za powtórzenie twierdzenia, że wideo było prawdziwe, skrócone dla zwięzłości.
Wielu komentujących nie kryje rozczarowania i krytykuje amerykańskiego giganta za wprowadzenie w błąd. Pozostaje mieć nadzieję, że materiał rzeczywiście zainspiruje programistów i będziemy mogli wejść w interakcję z Gemini dokładnie tak, jak przedstawiono to na filmie.
Wraz z materiałem wideo firma Google opublikowała post na blogu wyjaśniający, po części, w jaki sposób powstał film. Dopiero zapoznanie się z nim może dać nam wskazówki, że rzeczywistość różni się znacznie od reklamy.
Źródło: Tom’s Hardware, Bloomberg
Miłośnik nowoczesnych technologii, głównie nowych rozwiązań IT. Redaktor w czasopismach Gambler, Enter, PC Kurier, Telecom Forum, Secret Service, Click!, Komputer Świat Gry, Play, GameRanking. Wiele lat spędził w branży tłumaczeniowej – głównie gier i programów użytkowych. W wolnych chwilach lata szybowcem, jeździ na rowerze i pochłania duże ilości książek.