Google Brain Team опубликовала исходный код фреймворка Dopamine, позволяющего реализовать обучение с подкреплением для нейронных сетей. На репозитории GitHub размещены 15 файлов на языке Python с документацией. Инструмент построен на базе TensorFlow, библиотеке для машинного обучения.

Dopamine обучает с помощью игр
Фреймворк основан на платформе Arcade Learning Environment, оценивающей производительность ИИ с помощью видеоигр. Разработчики также получили доступ к наборам исходных данных для обучения и тестам по 60 играм, поддерживаемым платформой. Такой подход даёт возможность стандартизировать процесс работы с нейросетями и получать воспроизводимые результаты.

Dopamine поддерживает 4 модели обучения: deep Q-learning, C51, Implicit Quantile Network и упрощённый вариант Rainbow.

Одновременно с размещением исходного кода, Google запустила работу веб-сайта с инструментами, позволяющими визуализировать процесс взаимодействия с ИИ через Dopamine. Сайт поддерживает работу с несколькими агентами одновременно, предоставляет доступ к статистике, моделям обучения и планированию посредством TensorBoard.

Пабло Самуэль Кастро (Pablo Samuel Castro) и Марк Беллмер (Marc G. Bellemare), исследователи Google Brain Team выразили надежду, что гибкость и простота использования разработанного их группой инструмента вдохновит разработчиков опробовать новые идеи.

Это не первый шаг Google к повышению доступности инструментов для нейронных сетей. В 2017 году компания объявила о начале работы проекта Google.ai, проекта по демократизации достижений в области машинного обучения.