ИИ обучили игре в прятки

Сотрудники OpenAI заявили, что им удалось обучить нейросетевых агентов игре в прятки. Основным моментам агенты научились самостоятельно.

Обычно при обучении нейросетевых алгоритмов используют метод обучения с учителем. Например, чтобы научиться распознавать котов на снимках, им предоставляют огромное количество таких снимков с котами и другими животными и объектами. Таким образом, алгоритм сразу обучается на практике. Рядом с этим методом также существует другой, подразумевающий лишь наличие абстрактной награды или штрафа от среды обучения. Разработчики из OpenAI использовали именно этот метод для обучения нейросетевых агентов сложному обучению.

В ходе обучения агенты играли в прятки. Эксперты протестировали три вида подвижных блоков: кубы, лестницы и длинные подвижные стены. Спустя огромное количество раундов, нейросетевые агенты самостоятельно обучились обходить преграды и изощренно прятаться.

загрузка...

Коротко

Показать все новости