Microsoft Teams wykorzystuje sztuczną inteligencję do poprawy akustyki
Firma Microsoft spędziła ostatnie dwa lata na dodawaniu do Teams nowych, atrakcyjnych funkcji zwiększających produktywność, a teraz, dzięki sztucznej inteligencji, zmienia sposób działania podstawowych funkcji.
Wszyscy uczestniczyliśmy w rozmowach, w których ktoś miał słabą akustykę pomieszczenia, przez co trudno było go usłyszeć, lub słyszeliśmy, jak dwie osoby próbują rozmawiać w tym samym czasie, co prowadzi do niezręcznych sytuacji. Nowe ulepszenia jakości głosu oparte na sztucznej inteligencji powinny poprawić lub nawet wyeliminować te codzienne irytujące sytuacje.
Microsoft wykorzystuje teraz modele uczenia maszynowego do poprawy akustyki pomieszczenia, dzięki czemu nie będziesz już brzmieć jak z jaskini.
Chociaż staraliśmy się jak najlepiej wykorzystać cyfrowe przetwarzanie sygnału, aby wykonać naprawdę dobrą robotę w Teams, teraz po raz pierwszy zaczęliśmy wykorzystywać uczenie maszynowe do stworzenia systemu eliminacji echa, w którym można naprawdę zredukować echo pochodzące ze wszystkich różnych urządzeń – wyjaśnia Robert Aichner, główny menedżer programu inteligentnych rozmów i chmury w firmie Microsoft, w rozmowie z serwisem The Verge.
Microsoft testował to rozwiązanie od miesięcy, sprawdzając modele w rzeczywistym świecie, aby upewnić się, że użytkownicy zauważą redukcję echa i poprawę jakości rozmów. Producent oprogramowania wykorzystał 30 000 godzin wypowiedzi, aby pomóc w trenowaniu modeli, a także pozyskał tysiące urządzeń w ramach crowdfundingu, w którym użytkownicy Teams otrzymują wynagrodzenie za nagrywanie swojego głosu i odtwarzanie dźwięku z urządzenia.
Eliminacja echa w Teams
Symulujemy także około 100 000 różnych pomieszczeń… akustyka pomieszczeń odgrywa dużą rolę w eliminacji echa – mówi Aichner.
W rezultacie uzyskano znaczną poprawę jakości dźwięku rozmów oraz eliminację echa, co pozwala na jednoczesne prowadzenie rozmów przez kilka osób. Wszystkie te udoskonalenia można zobaczyć w akcji na powyższym filmie.
Jeśli Teams wykryje, że dźwięk odbija się lub powoduje pogłos w pomieszczeniu, model przekształci i przetworzy go tak, aby brzmiał jakby uczestnicy rozmowy w mówili do mikrofonu znajdującego się w bezpośredniej bliskości, eliminując echo.
Największe wrażenie robi możliwość przerywania sobie nawzajem rozmów w ramach Teams, bez kłopotliwego nakładania się wypowiedzi. Do tego, całe przetwarzanie odbywa się lokalnie na urządzeniach klienckich, a nie w chmurze.
Wszystkie te nowe ulepszenia Microsoft Teams są już dostępne, wraz z optymalizacjami wyświetlania w czasie rzeczywistym dla tekstu w filmach oraz opartymi na sztucznej inteligencji ulepszeniami ograniczeń przepustowości podczas rozmów wideo lub dzielenia się ekranem.
Źródło: The Verge
Miłośnik nowoczesnych technologii, głównie nowych rozwiązań IT. Redaktor w czasopismach Gambler, Enter, PC Kurier, Telecom Forum, Secret Service, Click!, Komputer Świat Gry, Play, GameRanking. Wiele lat spędził w branży tłumaczeniowej – głównie gier i programów użytkowych. W wolnych chwilach lata szybowcem, jeździ na rowerze i pochłania duże ilości książek.