Автоматичний майже синхронний голосовий переклад з однієї мови на іншу став реальністю.
Як пише "Компьюлента", Microsoft Research продемонструвала переклад з англійської на путунхуа (мова поширена у деяких регіонах Китаю) із затримкою у кілька секунд, в якому сам варіант на путунхуа звучав у вокальній манері оригіналу.
Стверджується, що це результат нововведень на всіх стадіях процесу. ПЗ на зразок Dragon Naturally Speaking компанії Nuance вже здійснило тиху революцію в області розпізнавання мови. І тепер продукти, засновані на цій технології, доступні широкій публіці у вигляді додатку Siri для iPhone або голосового інтерфейса ігрового контроллера Kinect.
Microsoft застосувала нову систему машинного навчання на основі штучних нейронних мереж, яка скорочує нерозуміння до кожного сьомого/восьмого слова. А це означає, що програма-перекладач Bing Translate видасть генератору мови більш точний текст.
Але найбільше досягнення – це, звичайно, генерація мови із збереженням модуляцій голосу того, хто говорить. Співрозмовникам буде легше одне одного зрозуміти, і тим самим спілкування стане ефективнішим.
"Ще кілька років, – сказав директор Microsoft з розробок Рік Рашидд, – і ми зламаємо мовні бар'єри між народами".
02:35 17.11.2012