Пусть синтез речи уже давно перестал быть новинкой, представители китайской компании Baidu утверждают, что их детище Deep Voice оставило всех своих конкурентов по этой части далеко позади. Программа имитирует различные голоса со многими (если не всеми) эмоциональными нюансами.
Чтобы добиться этого эффекта, сотрудники Baidu долго и упорно обучали нейросеть. Аудиоматериала, на котором она училась, хватило на 800 часов записи, но и результат себя оправдал.
Хотя разработчики нахваливают возможности Deep Voice, в частности, советуя его тем, кто потерял способность к членораздельной речи, скептики уже задали вопрос: а что, если программу будут использовать мошенники, чтобы обманывать людей и программы распознавания голоса?