Американские и китайские разработчики представили новую технологию, которая позволяет искусственному интеллекту «читать» по губам. При этом обучение данному навыку проходит с использованием видеороликов.
Существующие сегодня нейросети неспособны эффективно справляться с задачей распознавания речи по губам. Долгое время ученые работали над созданием программы, которая все же смогла бы это сделать. Не так давно специалисты из США и Китая все же смогли добиться определенных успехов и представили программу, использующую технологию работы распознавателей звуковых фраз. Отмечается, что она поглощает необходимые аудиоданные из видеозаписи, ориентируясь при этом на контекст и движения речевого аппарата спикера.
Первые эксперименты на проверку нового навыка нейросетей показали, что они справляются с задачей на 7,66% лучше, чем ранее созданные программы.