风力驱动的智慧革命马斯克OpenAI版阿尔法狗碾压人类顶尖选手
8 月 11 日,人工智能再次震撼人类,伊隆·马斯克(Elon Musk)旗下的 OpenAI 研究机构宣布,他们创造的人工智能机器人在 Dota 2 电子竞技游戏中以令人瞩目的速度击败了著名的职业选手 Dendi。这个对决采用了直接的 1v1 形式,其中 AI 在不到十分钟内就轻松赢得了第一场比赛;第二场同样是 AI 的胜利,这使得 Dendi 放弃了进行第三轮比赛。
这款完全自我训练的 AI 仅花费两周时间,就能够战胜包括世界排名第一选手在内的顶尖对手。OpenAI 的 CTO 格雷格·布罗克曼(Greg Brockman)表示,这种训练方式针对性地增强了 AI 对于优势和劣势的理解。此外,接下来 OpenAI 计划让这款 AI 模拟五名玩家,以形成一个完整的团队,并计划将其开放给所有人,让他们有机会与人工智能进行对战。
此举并不孤立,因为其他研究机构,如 DeepMind 和 Facebook 也已探索过利用数据来训练深度学习算法,使之能够在即时战略游戏“星际争霸2”中与人类玩家抗衡。在八月十日,DeepMind 与暴雪公司合作推出了一个名为 SC2LE(星际2学习环境)的工具包,该工具旨在加速开发高水平星际争霸2的人工智能速度。
SC2LE 包括了一系列组件:暴雪提供的一个机器学习API,以及 DeepMind 开源版 PySC2 工具集,使研究人员可以轻松使用暴雪特征层API。此外,还有一些小型测试用例以及一大批匿名游戏数据集供研究者使用。这份包含6,500局匿名游戏回放的大型数据集预计将扩展到50,000局以上,并伴随一篇介绍环境并提供基线成绩论文发布。
尽管如此,对于长期而言,“战略”的难题仍然是一个挑战。为了学会“战略”,AI 需要有“计划”和“记忆”的能力,而这些都需要存储解决。而由于星际争霸II 长时间内产生效果的问题,加强学习并不适合当前技术水平,因此 DeepMind 希望降低开发门槛,为解决这一难题寻求新的技术突破点。
值得注意的是,在围棋领域,AlphaGo 已经成功击败包括柯洁等世界顶级棋手,在当时引发了一场关于"AI威胁"论述热潮。不过,不管怎样,看起来 OpenAI 现有的实验已经为我们揭示出一个前所未有的未来,即不远处,我们可能会见证更高水平的人类VS机器智慧竞技。但对于Dota 2 这个比象棋和围棋更加复杂、多变的地图来说,其挑战性也许才刚刚开始。