MARL_MSA предлагает новый способ интеграции мультиагентного обучения в миксросервисную систему. Проект представляет собой сервис выбора дорожного маршрута, который предлагает пользователю оптимальное туристическое направление на основе текущих погодных условий, а также загруженности траффика. Сервис использует подключенную глубокую нейронную сеть IQN, которая независимо обучает агентов управлять ресурсами внутри системы и выбирать наилучший маршрут с учетом динамически изменяющихся условий.
- numpy, torch: создание нейронной сети
- Flask: основной фреймворк для создания UI
- PostgreSQL: создание и управление БД каждого отдельного микросервиса
- html, SSE (Server-Sent Events): настройка UI и автоматических обновлений браузера
git clone https://github.com/egormorgunov/smart_city_road.git
cd smart_city_road
pip install -e .
Проект включает в себя два типа сервисов:
- Одноагентный сервис, в котором агент обучается с помощью алгоритма глубокого Q-обучения (см. Одноагентная среда)
- Мультиагентный сервис, в котором агенты обучаются с помощью алгоритма независимого Q-обучения (см. Мультиагентная среда)