浙江工商大学AI奇迹马斯克OpenAI新星完胜顶尖人类选手
8 月 11 日,人工智能再次震惊世界,伊隆·马斯克(Elon Musk)旗下的 OpenAI 宣布他们开发的人工智能系统在电子竞技游戏 Dota 2 中战胜了著名的职业选手 Dendi。比赛采用的是极具挑战性的1v1对决模式,在短短不到十分钟的时间内,人工智能就以压倒性的优势击败了对手。在第二轮比赛中,人工智能再次展示了其卓越的能力,最终导致Dendi选择放弃第三轮比赛。
这款 AI 是完全通过自我学习和训练完成的,其研究人员从零开始,从大量历史比赛视频中提取数据进行训练。只用两周时间,这款 AI 就能够击败包括世界排名第一选手在内的一系列顶尖选手。OpenAI 的 CTO 格雷格·布罗克曼(Greg Brockman)表示,他们专门针对 AI 的优势和劣势进行了一系列精细化训练。此外,他们还计划将这个系统进一步发展,让它能够模拟一个完整五人团队,即使是在没有人类玩家参与的情况下。
此前,我们已经见证过其他公司如 DeepMind 和 Facebook 在星际争霸2领域取得显著成果。DeepMind 联合暴雪推出了 SC2LE 工具包,它包括一套机器学习 API、PySC2 开源版本、一系列小游戏以及一个包含超过6.5万局匿名游戏回放数据集的大型数据库。这一切都为研究人员提供了构建高效 AI 战略和策略的工具,而不仅仅是简单复制人类行为。
尽管如此,对于“战略”这一复杂问题目前仍未找到解决之道,因为它涉及到长期规划与记忆管理的问题。而由于星际争霸2 长时间战斗模式,加强学习并不是最有效的手段,因此技术界正在寻找新的方法来克服这一难题,以便更接近实现真正意义上的终极星际争霸 II 人工智能。
AlphaGo 团队曾经在围棋领域取得了令人瞩目的成绩,将包括柯洁等顶尖棋手悉数击败,但现在看来,这只是冰山一角。在 Dota 2 这样更加复杂且多变的环境中,不同的人工智能系统展现出了不同的潜力,而 OpenAI 的这次成功无疑开启了新篇章,为未来的人机对抗揭示出更多可能性。不过,就像 Dendi 所说,这种感觉既熟悉又陌生,是一种我们人类无法理解或匹敌的情感体验。