Анна
Таранина
02.12.2024

В России разработали первую в мире открытую виртуальную среду, которая позволяет значительно ускорить контекстное обучение искусственного интеллекта (ИИ) с подкреплением. Она способна выполнять миллиарды операций в секунду и опережает современный уровень развития ИИ. Решение опубликовано в открытом доступе для разработчиков технологий в области ИИ по всему миру.

С помощью виртуальной среды XLand-MiniGrid можно обучать искусственный интеллект самостоятельно принимать решения и выполнять новые действия. Новация стала результатом совместной работы лаборатории исследований искусственного интеллекта T-Bank AI Research и института AIRI при участии студентов МФТИ, Сколтеха и Университета Иннополис.

Как отмечают разработчики, новая среда уже получила признание международного исследовательского сообщества. Так, эксперименты в ней уже провели разработчики из Google DeepMind, Калифорнийского университета в Беркли и Оксфордского университета. А научная статья, описывающая создание среды, будет представлена на крупнейшей международной конференции в области искусственного интеллекта NeurIPS 2024, которая состоится с 10 по 15 декабря в канадском Ванкувере.

Среда XLand-MiniGrid - оригинальное решение в области контекстного обучения с подкреплением. Так называется направление в сфере ИИ-технологий, где нейросетевые модели быстро адаптируются к новым задачам, используя подсказки и контекст, а не требуют длительного обучения с нуля. В результате ИИ "схватывает на лету" данные из окружающей среды. На практике это применяется в таких областях как персонализированные рекомендации, управление роботами и автономными транспортными средствами, где требуется мгновенная адаптация нейросети к новым условиям.

- Мы пришли в область контекстного обучения с подкреплением, когда она еще зарождалась, и поэтому не нашли ни одного подходящего инструмента для оценки новых идей, - сообщил сотрудник лаборатории исследований искусственного интеллекта T-Bank AI Research Вячеслав Синий. - Стало понятно, что это проблема для многих специалистов, и ее надо решить одной из первых. Поэтому появился XLand-MiniGrid. Наша работа сразу привлекла внимание других исследователей в этой области, и уже сейчас появляются научные статьи, где авторы используют среду для проверки своих методов.

Ранее подобные среды для обучения ИИ разрабатывались крупными компаниями для своих нужд и были закрыты для широкого круга исследователей. А публично доступные инструменты, как правило, предлагали однотипные и легкие задачи, которые не подходили для разработки и тестирования сложных алгоритмов.

В отличие от них, XLand-MiniGrid находится в открытом доступе и позволяет менять условия обучения прямо в процессе работы. Разработчики могут создавать множество вариантов задач разного уровня сложности, что в результате помогает создавать более надежные модели искусственного интеллекта, способные самостоятельно адаптироваться и подстраиваться к новым условиям.

Среда создана на базе JAX - технологии для разработки высокопроизводительных программ. XLand-MiniGrid, в отличие от более медленных аналогов, способна выполнять миллиарды операций в секунду. В ней собрано 100 миллиардов примеров действий искусственного интеллекта в 30 тысячах задач. Это позволяет использовать готовые датасеты (базы данных) для обучения, а не проводить его каждый раз с нуля, что снижает затраты и экономит ресурсы на проведение исследований.

Авторы исследования доказали, что XLand-MiniGrid позволяет моделям искусственного интеллекта совершать до триллиона взаимодействий со средой за три дня. Это значительно ускоряет эксперименты и проверку гипотез. Также в процессе тестирования выяснилось, что среда имеет высокую сложность для текущего уровня технологий, а значит, сможет стимулировать их улучшение.

Новости из связанных рубрик