Международная группа ученых создала алгоритм глубокого обучения под названием LucaProt, который позволяет вычислять неизвестные последовательности и идентифицировать на их основе РНК-вирусы. Этот искусственный интеллект проанализировал вирусные геномы длиной до 47 250 нуклеотидов и открыл 161 979 новых вирусов, среди которых имеются организмы, обитающие не только в организме человека, но и в атмосфере и горячих источниках.
Исследователи утверждают, что новый метод поиска потенциально опасных микроорганизмов также будет полезен для выявления неизвестных ранее бактерий и паразитов. Эти результаты были опубликованы в журнале Cell.
Хотя наука идентифицировала 6 тысяч вирусов, эксперты полагают, что общее число может достигать миллионов. В настоящее время в открытых базах данных имеется более 80 тысяч вирусов, но их последовательности столь разнообразны, что идентификация затруднена. Современные биоинформационные технологии медленно расшифровывают вирусы, что задерживает поиск новых видов.