Впечатляваща технология от Microsoft за превод на глас в реално време

Впечатляваща технология от Microsoft за превод на глас в реално време
Екип от Microsoft Research и представители на университета в Торонто е готов с технология за превод на глас, която отново представя превода като глас с тембъра на превеждания. Всичко това става в реално време с минимално забавяне. Универсалният преводач е бил демонстриран наскоро в Китай, а както можете да се убедите сами чрез прикаченото видео, работи повече от добре.

В основата на разработката е система, наречена Deep Neural Networks, която имитира поведението на човешкия мозък и която е била използвана за осъществяването на по-точно гласово разпознаване от досегашните методи. Като цяло проектът има нужда от известен брой гласови записи от съответния език, въз основа на които изгражда свой речник. В момента се справя с превода на испански, италиански и мандарин.

Основното в технологията е високата точност, която са успели да постигнат от Microsoft - според Рашид грешното разпознаване на думи е намалено с около 30%, което означава, че на 7-8 думи една е грешна. Всичко това е част от работата на Microsoft в посока на естествения потребителски интерфейс, а както посочва Рик Рашид от Microsoft Research, какъв по-естествен интерфейс от човешкия глас.

http://blogs.technet.com/b/next/archive/2012/11/08/microsoft-research-shows-a-promising-new-breakthrough-in-speech-translation-technology.aspx