Polska IVONA najlepsza na świecie

26 września 2006 0 przez Michał Tomaszkiewicz

Opracowany przez IVO Software syntezator mowy ludzkiej IVONA został wybrany najlepszym podczas odbywającego się w Stanach międzynarodowego konkursu Blizzard Challenge.
W konkursie brało udział 14 grup badawczych z całego świata: 7 ośrodków naukowych i 7 ośrodków badawczo-rozwojowych najlepszych firm zajmujących się syntezą mowy między innymi: ATR, Japonia; Carnegie Mellon University, USA; CSTR, University of Edinburgh, Wielka Brytania; DFKI, Saarbrücken, Niemcy; IBM, Yorktown Heights, USA; IBM, Haifa, Izrael; Kyoto University, Japonia; Microsoft Research Asia, Chiny; Nagoya Institute of Technology, Japonia; University of Science and Technology of China, Chiny.


Uczestnicy konkursu otrzymali nagrania głosu lektora, który posłużył do stworzenia jego sztucznego odpowiednika. Na stworzenie syntetycznego odpowiednika otrzymanego wzoru głosu partycypanci otrzymali sześć tygodni. Następnie uczestnicy otrzymali kilkaset zdań, które musieli odczytać z pomocą sztucznie wytworzeonego głosu. Przetworzony i odczytany przez sztuczny głos tekst, został odesłany do organizatorów konkuru w celu dokonania oceny. Z próbkami oryginalnymi i zsyntezowanymi można zapoznać się odwiedzając ten adres.

Według światowej rangi ekspertów najlepszą technologią generowania mowy ludzkiej (syntezy mowy) dysponuje firma IVO Software i stworzony przez dział badawczo rozwojowy firmy syntezator mowy IVONA. Według ocen „jakość oraz naturalność głosu syntezatora IVONA jest zdecydowanie najlepsza i pozostawia osiagnięcia pozostałych uczestników konkursu daleko w tyle”.




Prace nad IVONĄ trwają już trzy lata. IVO Software zostało założone przez Łukasza Osowskiego i Michała Kaszczuka, absolwentów Politechniki Gdańskiej. Do tej pory technologia IVONY dostosowana była do potrzeb rynku polskiego, na potrzeby konkursu informatycy opracowali angielską wersję programu.

IVONA zdążyła zdobyć w Polsce dużą popularność. Program, przeznaczony początkowo do pomocy osobom niewidomym i niedowidzącym, znalazł zastosowanie także w wojsku i przedsiębiorstwach telekomunikacyjnych. Wśród Internautów popularna jest edycja Expressivo, pozwalająca na odsłuchiwanie wiadomości e-mail, artykułów, a także na oglądanie filmu z lektorem.