分享好友 最新动态首页 最新动态分类 切换频道
【MARL】多智能强化学习测试环境:SMAC、MPE、PettingZoo等
2024-12-26 08:39

        本篇文章是博主强化学习RL领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在强化学习专栏

       【强化学习】(12)---《多智能强化学习测试环境:SMAC、MPE、PettingZoo等》

一、常用的多智能强化学习测试环境

1. SMAC(StarCraft Multi-Agent Challenge

2. MPE(Multi-Agent Particle Environment

3. PettingZoo

4. MATLAB MARL Toolbox

5. OpenAI Gym + Gym-Multi-Agent

6. DeepMind Lab2D

7. Hanabi Learning Environment

8. MADRL (Multi-Agent Deep Reinforcement Learning)

9. Roboschool 和 PyBullet

 二、获取测试环境的方式

1. 通过 GitHub 搜索相关环境仓库

2. 通过 Google Scholar 或 arXiv 查找相关文献

3. 通过 Python 包管理工具安装

4. 代理或镜像服务

三、总结


        在多智能体强化学习(Multi-Agent Reinforcement Learning, MARL的研究和应用中,构建合适的环境来测试和评估算法是非常重要的。以下是一些常用的多智能体强化学习环境,它们涵盖了多种任务类型,如协作、对抗、竞争,帮助研究者验证算法的效果。

1. SMAC(StarCraft Multi-Agent Challenge

  • 简介:SMAC 是基于实时战略游戏 《星际争霸II》 的一个多智能体强化学习平台。它提供了丰富的微观战斗场景,允许多个智能体在局部观测的条件下进行协作或对抗。
  • 特点
    • 高度复杂的策略空间,智能体需要在合作中战胜对手。
    • 集中训练和分散执行的框架非常适合多智能体强化学习算法的测试。
    • 支持如 VDN、QMIX、MADDPG 等常见 MARL 算法。
  • 适用任务:协作、对抗。
  • 链接:SMAC 环境

2. MPE(Multi-Agent Particle Environment

  • 简介:MPE 是一个轻量级的多智能体粒子环境,智能体是无形的粒子,可以在二维平面中移动执行任务。该环境中,智能体需要完成协作或竞争任务。
  • 特点
    • 提供多个经典的多智能体场景,包括协作和竞争。
    • 易于设置,适合快速实验和算法验证。
  • 适用任务:协作、竞争、对抗。
  • 链接:MPE 环境

3. PettingZoo

  • 简介:PettingZoo 是一个多智能体强化学习框架,类似于 OpenAI Gym,但它专门为多智能体任务设计。它提供了丰富的多智能体环境,如合作博弈、竞技游戏和对抗场景等。
  • 特点
    • 支持多种不同类型的任务:协作、竞争、对抗等。
    • 易于集成现有的多智能体强化学习算法。
    • 提供了适合不同任务类型的 benchmark 环境。
  • 适用任务:协作、对抗、策略博弈。
  • 链接:PettingZoo 环境

4. MATLAB MARL Toolbox

  • 简介:MATLAB 提供了一个用于多智能体强化学习的工具箱。用户可以快速构建和测试多智能体系统的合作和竞争任务。适合复杂系统的建模和实验。
  • 特点
    • 便于使用 MATLAB 仿真工具进行复杂任务的设计。
    • 集成强化学习算法,支持模型的快速迭代开发。
  • 适用任务:复杂的工程应用、系统控制。
  • 链接:MATLAB MARL Toolbox

5. OpenAI Gym + Gym-Multi-Agent

  • 简介:OpenAI Gym 是单智能体强化学习的标准环境库,通过扩展 Gym-Multi-Agent,可以使其支持多智能体场景。该库能够快速集成多智能体问题,支持多种任务类型。
  • 特点
    • 任务类型广泛,支持自定义多智能体环境。
    • 轻量、易用,适合初学者和快速开发者。
  • 适用任务:自定义的协作、对抗场景。
  • 链接:Gym-Multi-Agent

6. DeepMind Lab2D

  • 简介:DeepMind Lab2D 是一个灵活的二维模拟环境,适合多智能体场景。用户可以在二维平面上构建自定义的场景,智能体可以在该环境中进行交互。
  • 特点
    • 灵活的任务设计,可用于构建从简单到复杂的多智能体场景。
    • 支持与深度学习框架的无缝集成。
  • 适用任务:协作、对抗、博弈。
  • 链接:Lab2D

7. Hanabi Learning Environment

  • 简介:Hanabi 是一个多智能体的协作游戏环境,基于牌类游戏 Hanabi。该环境特别适合测试智能体之间的沟通和协作能力。
  • 特点
    • 测试智能体的协作和沟通策略。
    • 支持有限的信息共享,适合复杂的决策场景。
  • 适用任务:协作、信息共享。
  • 链接:Hanabi 环境

8. MADRL (Multi-Agent Deep Reinforcement Learning)

  • 简介:MADRL 是多智能体深度强化学习的经典环境集合,支持如捕食者-猎物等常见的多智能体任务。
  • 特点
    • 提供标准的多智能体环境。
    • 环境设置简洁、易用,适合验证多智能体算法。
  • 适用任务:协作、对抗。
  • 链接:MADRL 环境

9. Roboschool 和 PyBullet

  • 简介:Roboschool 和 PyBullet 是机器人模拟环境,适合多智能体机器人控制和协作任务。通过这些环境可以模拟多机器人任务,如机器人足球等。
  • 特点
    • 高度仿真现实物理,适合多智能体机器人协作或对抗任务。
    • 支持复杂的物理交互和控制任务。
  • 适用任务:机器人控制、协作。
  • 链接:PyBullet 环境

        上文给出的链接都是官方仓库或文档的参考路径,但这些链接可能会因为网络、地域或其它因素而无法打开。为了解决这个问题,可以尝试通过以下几种方式获取相关资源

1. 通过 GitHub 搜索相关环境仓库

        大部分多智能体强化学习环境的代码都托管在 GitHub 上,可以直接在 GitHub 上搜索相关项目。以下是一些关键搜索词

  • SMAC
  • Multi-Agent Particle Environment (MPE)
  • PettingZoo
  • Hanabi Learning Environment
  • PyBullet

2. 通过 Google Scholar 或 arXiv 查找相关文献

        如果你想查找这些环境的研究论文,可以通过 Google Scholar 或 arXiv 来搜索关键字,如 "StarCraft Multi-Agent Challenge" 或 "PettingZoo MARL environment"。

3. 通过 Python 包管理工具安装

很多环境可以通过 直接安装

 

4. 代理或镜像服务

        如果遇到链接打不开的问题,可能与网络访问限制相关。你可以尝试使用代理或镜像网站访问 GitHub、arXiv 等资源。


        这些多智能体强化学习环境涵盖了从简易的粒子世界到复杂的物理仿真和对抗游戏,研究者可以根据任务的复杂性和需求选择合适的环境。这些环境不仅为 MARL 算法提供了标准测试平台,也为算法改进和实际应用提供了宝贵的实验基础。


最新文章
阿里地区经济呈回升向好平稳恢复态势
今年以来,阿里地区落实“12114”工作思路和“三园一绿一清一沙”产业布局,统筹推进稳预期、稳增长、稳就业工作,地区经济呈现回升向好、平稳恢复态势。阿里地区认真落实国家、自治区制定的系列促进消费政策,出台促进消费10条措施,安排
招商银行信用卡逾期还完后怎么办理恢复正常
在快节奏的现代生活中信用卡已成为许多人不可或缺的支付工具。由于各种起因人们有时会面临信用卡逾期的情况。对招商银行的持卡人对于一旦发现自身的信用卡出现逾期及时还清欠款是首要任务。但是还清欠款后怎样恢复信用卡的正常利用状态避免
【轻评论】尚未开始便已结束的故事,评《埃罗芒阿老师》
《黄漫》在刚刚出版时,被视为业界题材的希望之花,以及伏见司优秀代表作《俺妹》的精神续作。然而,从现下的情况来看,《黄漫》的表现并不尽如人意。我对《黄漫》的态度,也随着作品的进程而经历了从粉到路再到黑的转变。以下,本文就来解
推荐 一个新产品上市需要考虑什么,如何做好宣传推广
一个新产品想要在竞争激烈的市场上立足并分得一杯羹,除了优秀可靠的品质,新产品或者新的企业问世,其中包括一个必不可少的重要环节,就是如何进行宣传推广。市场化是所有产品的终极目标,而市场推广最大化就是最高目标。一个产品面对市场
金媒婚恋交友v10.4独立开源版+原生小程序前端+搭建环境教程
一.介绍 金媒10.4交友婚恋系统旗舰版小程序发布,全新ui全新后台,全新功能!门店分站切换,CRM细节重构了 小程序支持门店切换 ,从10.1-10.4版本的更新了! 含PC+H5+小程序全端可用二.搭建环
美团抖音推广软件叫什么-美团推广可靠吗
在当今数字化营销的时代,美团和抖音作为两大巨头,各自拥有庞大的用户群体和强大的影响力,为了更好地推广业务、提升品牌知名度,许多商家都在寻找有效的推广软件,美团抖音推广软件叫什么呢?美团,作为本地生活服务的替换词平台,其推广
用户体验至上:最受欢迎的五款优化大师
下面给大家推荐几款好用的免费的优化大师软件,有需要的小伙伴们来了解一下。Win7优化大师是一款功能强大的系统优化软件,支持64位和32位Windows 7操作系统。它提供了数百项实用功能,包括加速系统启动、软件执行速度等。该软件具有超快、
漫蛙2 官网下载免费版
漫蛙2官网下载免费版软件拥有海量的漫画作品。满足不同用户们的不同需求,用户们可以根据自己的喜好设置阅读模式,同时,平台还支持离线阅读,让用户在没有网络的情况下也能随时随地享受漫画的乐趣。软件还会根据用户的阅读历史和喜好,为
新澳精准正版资料免费|广泛的解释落实方法分析
  摘要:在这篇深入的文章中,我们探讨了如何有效地获取和利用新澳精准正版资料。我们提供了一些免费资源的获取途径,其中包括图书馆、在线数据库和机构出版物等。文章详细讨论了正版资料的重要性以及保护版权的必要性。我们进一步分析了
百度刷机纯净版 v3.1.11
百度刷机是一款非常实用的刷机软件,这款软件能够支持市面上大部分的手机系统,让用户可以利用这款软件实现无线刷机体验,并且使用过程也没有任何的门槛.非常的方便,致力为用户体验一键刷机的快感,操作非常的快捷而方便,满足不同用户的需求,感
相关文章
推荐文章
发表评论
0评