nowe technologie w biznesie

ITbiznes

Chcesz skontaktować się z naszą redakcją? Pisz na adres: redakcja@itbiznes.pl lub zadzwoń: 511 144 444

Eleven v3 (alpha) – generator głosu tak ekspresyjny, jak nigdy dotąd

Założona przez dwóch Polaków spółka ElevenLabs wciąż udowadnia, że jeśli chodzi o generowanie ludzkiego głosu, wciąż jest w stanie osiągać spektakularne efekty. ElevenLabs zaprezentowała właśnie nowy model Eleven v3 (alpha), który wzbogacono o możliwość symulowania emocji, śmiechu, umiejętność mówienia z różnymi akcentami, szeptania, krzyczenia, a także rozmów kilku osób (tryb dialogowy).

ElevenLabs jest dziś jednym z najczęściej wykorzystywanych rozwiązań typu TTS (text-to-speech, zamiana tekstu na mowę). Generator wykorzystywany jest przez twórców wideo do uzupełnienia filmów o realistycznie brzmiącego lektora; studia produkujące gry używają ElevenLabs do podkładania głosów. Rozwiązanie służy też do tworzenia podcastów czy audiobooków.

Choć możliwości ElevenLabs były bardzo duże, to konkurencja nie spała. Rozwiązania takie jak MiniMax Audio czy Speechelo podgryzają pozycję ElevenLabs, więc firma postanowiła zrobić skok do przodu i pokazać konkurencji, gdzie raki zimują. Tym skokiem jest najnowszy model Eleven v3 (alpha).

Generator zyskał zupełnie nowe możliwości. Po pierwsze, może udawać emocje: ekscytację, gniew, smutek czy rozczarowanie. Głos potrafi też śpiewać, szeptać czy krzyczeć. Możliwe jest też wybieranie akcentu, tak by generowany głos mówił po angielsku, ale z charakterystycznym, brytyjskim, hinduskim albo francuskim akcentem (przykładowo).

Emocjami steruje się przez dodanie „tagów audio” w odpowiednich miejscach tekstu, takich jak [chuckles], [giggles], [impressed] czy [amused].

elevenlabs audio tags

Nowością w Eleven v3 jest też funkcja jednoczesnego generowanie kilku mówców, co pozwala na tworzenie dialogów. We wcześniejszej wersji Eleven v2 mogliśmy wybrać tylko jeden głos. Teraz możemy tworzyć na przykład podcasty, w których rozmawiają ze sobą dwie osoby.

Eleven v3 powiększył także bazę obsługiwanych języków, z 29 do ponad 70. Język polski, naturalnie, jest w ElevenLabs dostępny już od samego początku.

elevenlabs v3 enable

Z Eleven v3 można skorzystać już teraz, a do końca czerwca ElevenLabs oferuje dostęp do usługi z 80-procentową zniżką – na zachętę.

Udostępnij artykuł
Link do udostępniania
Poprzedni artykuł

Perplexity Pro za darmo (zamiast 1000 zł!) od T-Mobile – promocja przedłużona do końca czerwca

Następny artykuł

Darmowy certyfikat SSL krok po kroku

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Przeczytaj także