Microsoft Teams wykorzystuje sztuczną inteligencję do poprawy akustyki

Firma Microsoft spędziła ostatnie dwa lata na dodawaniu do Teams nowych, atrakcyjnych funkcji zwiększających produktywność, a teraz, dzięki sztucznej inteligencji, zmienia sposób działania podstawowych funkcji.

Wszyscy uczestniczyliśmy w rozmowach, w których ktoś miał słabą akustykę pomieszczenia, przez co trudno było go usłyszeć, lub słyszeliśmy, jak dwie osoby próbują rozmawiać w tym samym czasie, co prowadzi do niezręcznych sytuacji. Nowe ulepszenia jakości głosu oparte na sztucznej inteligencji powinny poprawić lub nawet wyeliminować te codzienne irytujące sytuacje.

pko-bank-polski-microsoft-teams-wdrozenie-przewaga

Microsoft wykorzystuje teraz modele uczenia maszynowego do poprawy akustyki pomieszczenia, dzięki czemu nie będziesz już brzmieć jak z jaskini.

Chociaż staraliśmy się jak najlepiej wykorzystać cyfrowe przetwarzanie sygnału, aby wykonać naprawdę dobrą robotę w Teams, teraz po raz pierwszy zaczęliśmy wykorzystywać uczenie maszynowe do stworzenia systemu eliminacji echa, w którym można naprawdę zredukować echo pochodzące ze wszystkich różnych urządzeń – wyjaśnia Robert Aichner, główny menedżer programu inteligentnych rozmów i chmury w firmie Microsoft, w rozmowie z serwisem The Verge.

Microsoft testował to rozwiązanie od miesięcy, sprawdzając modele w rzeczywistym świecie, aby upewnić się, że użytkownicy zauważą redukcję echa i poprawę jakości rozmów. Producent oprogramowania wykorzystał 30 000 godzin wypowiedzi, aby pomóc w trenowaniu modeli, a także pozyskał tysiące urządzeń w ramach crowdfundingu, w którym użytkownicy Teams otrzymują wynagrodzenie za nagrywanie swojego głosu i odtwarzanie dźwięku z urządzenia.

Eliminacja echa w Teams

Symulujemy także około 100 000 różnych pomieszczeń… akustyka pomieszczeń odgrywa dużą rolę w eliminacji echa – mówi Aichner.

W rezultacie uzyskano znaczną poprawę jakości dźwięku rozmów oraz eliminację echa, co pozwala na jednoczesne prowadzenie rozmów przez kilka osób. Wszystkie te udoskonalenia można zobaczyć w akcji na powyższym filmie.

end-to-end-szyfrowanie-microsoft-teams-polaczenia-indywidualne

Jeśli Teams wykryje, że dźwięk odbija się lub powoduje pogłos w pomieszczeniu, model przekształci i przetworzy go tak, aby brzmiał jakby uczestnicy rozmowy w mówili do mikrofonu znajdującego się w bezpośredniej bliskości, eliminując echo.

Największe wrażenie robi możliwość przerywania sobie nawzajem rozmów w ramach Teams, bez kłopotliwego nakładania się wypowiedzi. Do tego, całe przetwarzanie odbywa się lokalnie na urządzeniach klienckich, a nie w chmurze.

Wszystkie te nowe ulepszenia Microsoft Teams są już dostępne, wraz z optymalizacjami wyświetlania w czasie rzeczywistym dla tekstu w filmach oraz opartymi na sztucznej inteligencji ulepszeniami ograniczeń przepustowości podczas rozmów wideo lub dzielenia się ekranem.

Źródło: The Verge

0 0 votes
Article Rating
Powiadomienia
Powiadom o
0 komentarzy
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x