MAX+

来源自MAX+

09月11日 11:37

作者:PunkZhang

OpenAI团队负责人:DOTA2更有挑战性

导语

          今日,我有幸采访到了OpenAI DOTA2团队的分布式系统负责人Szymon Sidor,听他来聊聊当时选择该项目的初衷,以及OpenAI机器人未来与社区之间的交互可能。

  去年TI7,OpenAI在影魔Solo表演赛中战胜了顶级玩家Dendi,名声大震;TI8前夕,五个OpenAI电脑人组成的队伍击败了由Merlini等组成的人类半职业队伍;TI8表演赛上,OpenAI战队挑战了人类职业战队,但未能成功。今日,我有幸采访到了OpenAI DOTA2团队的分布式系统负责人Szymon Sidor,听他来聊聊当时选择该项目的初衷,以及OpenAI机器人未来与社区之间的交互可能。

  Q:你好,Szymon!感谢抽时间接受采访。请问您在OpenAI中的职务是?

  A:我是DOTA2团队的分布式系统负责人。

  Q:有趣。咱们从头说吧,你们开发出OpenAI单个英雄和战队是如何缘起的?去年的影魔Solo赛上你们击败了一众职业选手,今年你们又携一支OpenAI战队来到TI。你们为什么想做这件事?

  A:大量的不同原因积累所致吧。起初我们只是想试着专注于任意一款流行网游,于是通过Twitch查看了所有正在直播的火爆项目,当时我觉得LOL最火,DOTA2其次。不过DOTA2更容易集成,也更易发挥软件功用。所以我们决定,就DOTA2了!决定之后,我们也找到了更多理由去支撑它。Valve是一个很好的合作伙伴,人们说进军DOTA2较之LOL更具有战略意义。

  Q:Valve便于合作,这是不是你们进入DOTA2的主要原因?

  A:是的。我相信假如选择LOL的话,Riot肯定也会对我们的工作有所帮助,但我们没有考虑过他们。

  Q:说到战略意义,与LOL合作难道不是更容易些吗?还是说OpenAI DOTA2团队想挑战自己?

  A:可能会更容易吧。不过我们确实也更有野心,也想让任务更具有挑战性。我们选择DOTA2,是因为没有显而易见的方法去实现它的人工智能。所以在项目伊始,我们也不知道如何解决这一问题。

  Q:这个OpenAI团队中,有没有谁是项目开始前就在打DOTA2的,有没有人是在项目确定后开始玩的?

  A:跟我一起参加了TI8项目的Jakub是一个DOTA2/LOL双修玩家。公司其他一些人也都有数千小时的游戏时长。我本人是项目开始后进来玩的,玩了大约一千小时了。我极不擅长!不过我觉得,仅仅通过观看机器人游戏就能学到很多东西。

  Q:我记得OpenAI团队说过,机器人从他们之前的经历中吸取教训,然后变得更好。刚开始时,你需要先教他们点儿什么吗?

  A:吸取教训,谈不上吧。我们用的技术是强化学习。它是建立在“观察,行动和奖励”机制上的。机器人必须先看到一些东西,然后有选择地行动,然后因行为良好而受到奖励。游戏开始时,他们会在基地周围随机走动。然后,他们可能会去走到线上开始补兵,因为它们可以得到金钱奖励。这样他们就会高兴,并且再次重复。但是,当一个机器人走得太远而被敌方防御塔击杀时,它就能学会保持一定距离,这样机器人就慢慢进化了。不过,一开始完全是随机的,没有任何形式的引导。

  Q:那你们也得告诉机器人最终目标吧?比如Solo时,目标是推掉塔;5V5时,目标是推掉遗迹……

  A:肯定的。这是奖励。我们会告诉机器人,赢得比赛是件好事。我们也会给它们一些其他指示,比如补兵是件好事。不过我们不会告诉它们如何补兵。那是它们自己必须解决的问题。如果他们可以做到,那是好事啊!

  Q:真的好有趣。我想象不出它所做的努力以及思考过程。短短一年,OpenAI团队从Solo做到能与职业战队五五对抗,这个过程有多难?

  A:极难。它需要太多开天辟地式的创新。有一长串的东西需要去融合。拿TI8表演赛上我们设置的团队精神参数来说吧。一开始我们教机器人自私,就像典型的路人局那样。然后,我们让他们跟队友越来越像,到了最后他们完全无私了。

  Q:是得有一些过程。现在的OpenAI程序可以掌握多少英雄了?英雄的装备选择是预设的吗?

  A:现在可以在18个英雄中选择了。装备选择是预设的,不过我们正在致力于让机器人根据敌人和战况做出装备选择。

  Q:你说该项目的目的为研究。那OpenAI的研究由谁资助?

  A:我们有许多的捐助人与投资人。初始投资人之一是埃隆·马斯克(特斯拉汽车CEO,译者注)。

  Q:我想知道,你们在DOTA2项目中得到的学问,在其他领域能否实现?

  A:可以的。我们在不同的地方已经开始使用这种技术了。其中有一项称之为“自动化操作”,它就发现于DOTA2项目,并且使用了同样的代码。

  Q:从社区角度来看,OpenAI软件是否会与普通玩家见面?

  A:我们正在考虑OpenAI与DOTA2客户端的结合。不过有个艰巨的问题,它需要不断维护。我们不确定是否会获得资源,所以我们无法做出任何承诺。继续进行下去的话,好处是我们可以拥有不同水平的OpenAI,这些机器人匹配起来跟真人一样。那样一来,即使是两三千分的玩家,也可以享受和机器人对战的乐趣了。

  Q:有个问题我问了许多人,但我感觉你可能是回答的最佳人选。你觉得人工智能有没有可能发展成为《黑客帝国》中那样?好比是让一种意识自我发展,然后几年后接管全人类……

  A:人工智能有很多危险场景。您所描述的应该是最有可能发生的。我们同样也要担心恶意使用者。所以正如你所说,有些东西需要戒备,不过并没有直接危险。假如发生在OpenAI身上,我们会有专门的安全团队去考虑这些问题。