最擅长玩《毁灭战士》的AI开源了 | 来自CMU的论文&代码

原创 2017年12月26日 00:00:00
李林 发自 凹非寺
量子位 出品 | 公众号 QbitAI

640?wx_fmt=png&wxfrom=5&wx_lazy=1

最擅长玩《毁灭战士(DOOM)》的那个AI,最近开源了。

它叫Arnold,来自卡耐基梅隆大学“终结者队(Terminator)”,在2017年的VizDoom竞赛中以275杀220死0自杀的成绩,拿下了未知地图完整版死斗比赛的冠军。

在比赛中,Arnold能够只根据游戏的画面来判断局势,在一个陌生的3D环境中探索地图、选择武器、击杀敌人。

VizDoom,是基于第一人称射击游戏《毁灭战士》游戏的AI研究平台,主要用在视觉机器学习和深度强化学习的研究上。Viz代表Visual,也就是说,平台上的Agent主要依靠视觉输入来玩游戏。

Arnold参加的VizDoom 2017竞赛,就是在这个平台上举办的。

竞赛以Agent在10场多人死斗中击杀敌人的数量-自杀数来定胜负,分为两个“赛道”:Track 1是已知地图上的限制版死斗,玩家可用的武器只有火箭炮;Track 2是未知地图上的完整版死斗,玩家可以使用各种武器,训练Agent时有5张地图可选,不过在最终比赛时会遇到一张陌生的测试地图。

比赛场面非常血腥热烈,是这样的(视频有点长……):


 Track 2完整视频,时长100分钟

这两个赛道,Arnold都参加了,它在限制版死斗获得了第二名,在完整版死斗中拿下了冠军。

最近开源的,就是Arnold的PyTorch实现。发布在GitHub上的代码包括训练《毁灭战士》Agent所需要的源代码、17张可以用于训练或测试的地图、5个可以可视化出来玩的预训练模型,包括今年夺冠的那个。

Arnold有两位作者:Devendra Singh Chaplot和Guillaume Lample。Chaplot是CMU机器学习系的博士生,师从Ruslan Salakhutdinov,研究深度强化学习及其在机器人和NLP中的应用。Lample 2016年获得了CMU硕士学位,现在是Facebook AI Research的博士生。

0?wx_fmt=png

0?wx_fmt=png

在VizDoom 2017中和他们竞争的高手们,也不乏大机构背后支持。比如Track 1的第三名Axon,来自腾讯互娱(IEG)的NEXT研发中心;Track 2第二名TSAIL队,来自清华大学,他们给自己的Agent起了个古代人偶工匠的名字:偃师;Track 2第三名则是英特尔是IntelAct。另外,参赛的还有Facebook田渊栋和吴育昕组成的F1队、王乃岩、Siyi Li组成的AlphaDoom队等等。

这些队伍中有不少在2016年就参加过这个竞赛,比如F1,就是VizDoom 2016限制版死斗的冠军,IntelAct是完整版死斗的冠军。CMU终结者队的Arnold,在VizDoom 2016两个赛道上都是第二名。

2016年的竞赛结束后,F1队和终结者队都发表了相关论文,解读自己在比赛中所用的技术,而终结者队最近开源的Arnold代码,与去年的论文仍是一脉相承。

最后,本文相关的代码和论文都在这里啦:

Arnold开源代码:
https://github.com/glample/Arnold

Arnold论文:
https://arxiv.org/abs/1609.05521

田渊栋、吴育昕的论文Training Agent for First-Person Shooter Game with Actor-Critic Curriculum Learning:
https://openreview.net/pdf?id=Hk3mPK5gg

今年还有一支队伍DoomNet也开源了代码:
https://github.com/akolishchak/doom-net-pytorch

VizDoom官网:
http://vizdoom.cs.put.edu.pl/

作者系网易新闻·网易号“各有态度”签约作者

活动报名

0?wx_fmt=jpeg

加入社群

量子位AI社群12群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进群请加小助手微信号qbitbot4,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

0?wx_fmt=jpeg

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


版权声明:本文为博主原创文章,未经博主允许不得转载。

代码之美——Doom3源代码赏析

背景介绍: Doom3是id Software于2004年开发的第一人称射击游戏,目前以GPL v3协议开源。其采用游戏引擎的是id Tech 4,由id Software创始人、首席程序员John...
  • wishfly
  • wishfly
  • 2013年01月19日 10:09
  • 4271

德州扑克AI简介——2015华为软件精英赛小结

经历一个月的奋斗,前天终于提交代码!持续了一个月的赛事终于暂时性的落下帷幕。回想起来,这个也算是一个不错的经历,也有必要写一段文章纪念一下。本篇文章将分为如下四个部分:德州扑克AI简介、德州扑克出牌策...
  • shiyuan0
  • shiyuan0
  • 2015年06月05日 11:28
  • 4144

关于CMUSphinx的一些整理

过去挺久了,这里记录的代码还是比较原始的阶段,等以后整理好后补上更完整的应用代码。...
  • tzdwsy
  • tzdwsy
  • 2015年08月09日 13:43
  • 1552

【AI最新论文精选文章讲解+文章、代码下载链接】包括词向量、强化学习、自回归生成模型, 可视化神经等等干货文章

  • 2018年01月14日 21:59
  • 772KB
  • 下载

NIPS2017大统计:谷歌、CMU、杜克大学Lawrence Carin分列总数、第一作者、团队论文数榜首

原文来源:Unsupervised Method 作者:Robbie Allen 「雷克世界」编译:嗯~阿童木呀 众所周知,第三十一届神经信息处理系统年会(NIPS)本周...
  • Ksf3kg7dU95rn0XL
  • Ksf3kg7dU95rn0XL
  • 2017年12月06日 00:00
  • 52

CMU论文—Hadoop’s Adolescence(0-3页)

Hadoop的转变时代:三种科研级别集群工作负载比较分析     Kai Ren1 , YongChul Kwon2 , MagdalenaBalazinska2 , Bill Howe2      ...
  • zengjun713
  • zengjun713
  • 2013年10月06日 22:07
  • 598

苹果AI人才报告:斯坦福、伯克利、CMU、MIT被挖空

自2014年以来,苹果致力于人工智能和相关领域的员工人数翻了一番,而科技巨头们也在大幅招募博士、研究员,打造下一代更智能的产品。为了解苹果公司招募AI人才的方式,Fast Company通过公开的Li...
  • gh13uy2ql0N5
  • gh13uy2ql0N5
  • 2017年10月26日 00:00
  • 100

「毁灭战士3」源码就是“保持简洁”的证明

假如你在网上搜最好的C++源代码。「毁灭战士3 | Doom 3」的源代码肯定会被提到好多次,这篇就来证明此事。 我花了一些时间通读了 DOOM3 的源代码。这可能是我见过的最干净最漂亮的代码了...
  • flyingleo1981
  • flyingleo1981
  • 2015年05月04日 19:52
  • 580

rete算法原文和CMU的一个论文

  • 2009年07月10日 22:27
  • 863KB
  • 下载

Doom3 源代码 毁灭战士

  • 2012年02月28日 15:39
  • 7.49MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:最擅长玩《毁灭战士》的AI开源了 | 来自CMU的论文&代码
举报原因:
原因补充:

(最多只允许输入30个字)