Байесовские нейронные сети в мультиагентных средах

Авторы: Подмарёв М.С.
Опубликовано в выпуске: #3(92)/2024
DOI:
Раздел: Информатика, вычислительная техника и управление \| Рубрика: Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
Ключевые слова: мультиагентная среда, машинное обучение, мультиагентное обучение с подкреплением, нейронные сети, байесовские нейронные сети, байесовский алгоритм Actor-Critic
Опубликовано: 25.07.2024

Рассмотрены особенности поведения байесовских нейронных сетей в мультиагентных средах. Представлены обучение с подкреплением, мультиагентное обучение с подкреплением и поведение байесовского Actor-Critic в мультиагентных средах. Рассмотрено обучение с помощью байесовских нейронных сетей. Показаны архитектура и иерархия байесовской нейронной сети. Описаны компоненты агента, его взаимодействие со средой тестирования. Для проведения тестирования выбрана среда Mujoco. Выделены особенности и аспекты среды. Проведены тесты для проверки поведения агентов под управлением байесовской нейронной сети с использованием алгоритма Actor-Critic. Продемонстрированы результаты тестирования, по итогам которых определены успешность работы алгоритма, достижение успехов в обучении и взаимодействия агентов со средой. Проделанная работа является доказательством того, что байесовские нейронные сети и байесовский алгоритм Actor-Critic способны обучаться и достигать поставленных результатов мультиагентных средах.

Литература

[1] Лапань М. Глубокое обучение с подкреплением. AlphaGo и другие технологии. Санкт-Петербург, Питер, 2020, 496 с.

[2] Саттон Р.С., Барто Э.Дж. Обучение с подкреплением. Москва, ДМК Пресс, 2020, 552 с.

[3] Алфимцев А.Н. Мультиагентное обучение с подкреплением. Москва, МГТУ им. Н.Э. Баумана, 2021, 222 с.

[4] Konda V. Actor-Critic Algorithms. Available at: https://dspace.mit.edu/bitstream/handle/1721.1/8120/51552606-MIT.pdf?sequence=2 (accessed April 15, 2024).

[5] Дауни А.Б. Байесовские модели. Москва, ДМК Пресс, 2019, 184 c.

[6] Qin Yang, Ramviyas Parasuramana. A Strategy-Oriented Bayesian Soft Actor-Critic Model. The 14th International Conference on Ambient Systems, Networks and Technologies (ANT), 2023, Leuven, Belgium. Available at: https://arxiv.org/pdf/2303.04193.pdf (accessed March 7, 2023).