HMAS é uma estrutura de código aberto em Python que permite o desenvolvimento de sistemas multiagente hierárquicos. Oferece abstrações para definir hierarquias de agentes, protocolos de comunicação entre agentes, integração de ambientes e loops de treinamento integrados. Pesquisadores e desenvolvedores podem usar HMAS para prototipar interações complexas de vários agentes, treinar políticas coordenadas e avaliar o desempenho em ambientes simulados. Seu design modular torna fácil estender e personalizar agentes, ambientes e estratégias de treinamento.
Uma implementação baseada em Keras do Multi-Agent Deep Deterministic Policy Gradient para aprendizado por reforço multiagente cooperativo e competitivo.
MADDPG-Keras oferece uma estrutura completa para pesquisa em aprendizado por reforço multiagente ao implementar o algoritmo MADDPG em Keras. Suporta espaços de ação contínuos, múltiplos agentes e ambientes padrão do OpenAI Gym. Pesquisadores e desenvolvedores podem configurar arquiteturas de redes neurais, hiperparâmetros de treinamento e funções de recompensa, iniciando experimentos com registros integrados e checkpointing de modelos para acelerar o aprendizado de políticas multiagente e benchmarking.