Kiedy wydawało się, że tryb głosowy ChatGPT Advanced Voice Mode jest już niemal doskonały i naprawdę potrafi oszukać nas, że rozmawiamy z człowiekiem, a nie sztuczną inteligencją, pojawił się ON – Sesame. Twórcy narzędzia sami mówią o nim – „przekraczanie granic doliny niesamowitości głosu” (Crossing the Uncanny Valley of Voice). Sztuczna inteligencja po raz kolejny sprawiła, że zbieramy szczęki z podłogi.
Tryb rozmów głosowych w ChatGPT dostępny jest także w Polsce, ale możemy korzystać tylko z podstawowej wersji konwersacji. Brzmią dość mało realistycznie, ale ułatwiają komunikację z chatbotem na smartfonie – zamiast wpisywać prompty na małej i niewygodnej klawiaturze ekranowej, możemy je podyktować, a aplikacja oprócz tego, że wyświetli odpowiedź na ekranie, to jeszcze ją przeczyta. Odpowiedzi brzmią jednak niewiele lepiej niż te z Alexy czy Asystenta Google.
Dużo większe wrażenie robi tryb ChatGPT Advanced Voice Mode, niestety niedostępny jeszcze w Europie. Nie tylko bardzo realistycznie odpowiada na pytania, ale dodatkowo potrafi naśladować dowolny akcent (możemy go poprosić, by mówił np. po angielsku z hinduskim akcentem).
Sesame sprawia, że ChatGPT Advanced Voice Mode wygląda jak technologia z przeszłości
To, co pokazuje Sesame, to kolejny poziom. Asystent przy odpowiadaniu na pytania dostosowuje tempo i dynamikę rozmowy, potrafi się zawahać, zamyślić, a w jego głosie autentycznie słychać… emocje. Czegoś takiego jeszcze nie słyszeliśmy podczas rozmowy głosowej z AI. Obejrzyjcie poniższe wideo.
Poniżej nasza rozmowa z asystentem, ale na YouTube i TikToku zaczynają się właśnie pojawiać filmy innych twórców internetowych, którzy pokazują możliwości Sesame.
Sesame jest dostępny dla każdego i każdy za darmo może porozmawiać z tym robotem. Nie trzeba instalować żadnych aplikacji – Sesame działa w przeglądarce internetowej (trzeba jedynie zezwolić na dostęp do mikrofonu). Wystarczy wejść na tę stronę, wybrać, czy chcemy rozmawiać z Mayą czy Milesem i rozpocząć konwersację. Jeśli oglądaliście film „Her” z 2013 roku, to właśnie osiągnęliśmy poziom głosu filmowego robota – Samanthy, tyle że nazywa się Maya…
Dziennikarz komputerowy od 1994 roku. Właściciel i redaktor naczelny portalu ITbiznes; prowadzący magazyn ITbiznes na antenie kanału telewizyjnego Biznes24; gospodarz programu poradnikowego „Cyfrowy Niezbędnik” na antenie kanału telewizyjnego Antena HD; gospodarz podcastów Elektrycznie Tematyczni o samochodach elektrycznych oraz Zrozumieć AI o sztucznej inteligencji. Współprowadzący podcast ITbiznes o technologiach w biznesie. Twórca bloga o pasjach Fabryka Pasji. Założyciel, redaktor naczelny i były właściciel portalu PCLab.pl. Założyciel i były redaktor naczelny serwisów AGDLab.pl, Softonet.pl. Były redaktor naczelny serwisów PC.com.pl i Technowinki.onet.pl.