在RTS游戏中,计算机AI=人工智能?
对于大多数游戏玩家来说,游戏中内置的电脑AI似乎是一个笑话,应该被称为“人工智障”。
能够与玩家竞争的计算机人工智能通常会被分配超过玩家的资源。 例如,在《红色警戒》中,他们与十个残酷的敌人作战,或者在《魔兽争霸》中,他们与疯狂的电脑作战。 电脑AI的优势仅仅来自于远超玩家的资源、部队创建速度等各种作弊,或者通过取消AI上的战争迷雾。
这时,人类玩家获胜的常见方式就是要么依靠自己精心磨练的游戏技巧,要么利用计算机套路的缺陷“走后门”。 无论如何,这表明人工智能的预编程策略不足以应对灵活狡猾的人类玩家。
比如这张图中,计算机终于学会了人类隐藏基地的基本操作,玩家开心地笑了。
最初的计算机AI策略的主要问题在于,在不作弊的情况下(没有避开战争迷雾),它可以从心理上猜测玩家的单位在哪里,猜测玩家遵循什么流程,并有针对性地做出反应。 攻击能够有效响应,这是很难提前编程的。
无论是游戏AI的无脑缺陷,还是人类玩家的窃笑,当深度学习(DL)引入训练时,这一切都戛然而止。
为什么专注于征服星际争霸2?因为它极其复杂且高度真实
星际争霸是暴雪公司出品的经典即时战略(RTS)游戏。 它以超考验策略思维、精致的种族平衡性和极强的可玩性而闻名。 玩家还必须掌握经济的宏观管理和微观管理。 在个人控制之间保持谨慎的平衡。
从星际争霸1到星际争霸2,这款RTS大作一直被列为世界电子竞技的核心项目之一。
2014,一场拥挤的星际争霸 2 比赛
在人工智能已经掌握了国际象棋、围棋和危险边缘之后,星际争霸2将是人工智能的下一步。 人们一致认为存在重大挑战。 AI巨头们摩拳擦掌,渴望攻击科普鲁星区的虫海、坦克群和高级圣堂武士。
他们对《星际争霸》感兴趣,因为它足够复杂,可以模拟现实生活。
使用人工智能玩星际争霸的杰出人物、纽芬兰纪念大学计算机科学教授戴维曾表示,“星际争霸太复杂了。能够应用于星际争霸的机器人还可以解决现实生活中的其他问题。”
星际争霸中不存在最优策略,AI需要不断探索、拓展和更新自己的策略知识。
操作空间巨大,需要同时操作数百个不同的单元,因此可能的组合非常多。
游戏过程非常漫长星际争霸2好玩吗,需要长期规划。 与许多现实世界的问题一样,因果关系不是瞬时的。 游戏早期采取的行动可能不会在很长一段时间内得到回报,因此它锻炼了AI的长期思考能力。
“星际争霸是人类最难玩的游戏,就像同时下棋和踢足球一样,需要高度的专注力、超人的手指和手臂,以及超乎常人的战略思维。”
与人类玩家Mana战斗
此外,与国际象棋游戏不同,《星际争霸》中大量的“棋子”对AI提出了巨大的挑战。
围棋共有 10 的 170 次方可能走法,这比整个宇宙的原子数 10 的 80 次方还要多。 这对星际争霸来说简直就是儿戏。
《星际争霸》每时每刻都有 10 的 10 次方可能的行动——几乎无法计算。 尽管如此,人工智能仍仅限于以人类速度运行,迫使它制定战略以取胜,而不是用一系列超人无敌的动作轰炸人类对手。
平均APM只有277,而职业选手可以达到559。
该团队在《星际争霸》杂志上发表的一篇论文称,由于其“固有的复杂性和多智能体挑战,使其能够在最困难的职业中表现出色”,《星际争霸》“已经成为人工智能研究的一个重要挑战”。 在电子竞技领域具有持久的地位,并且具有很强的现实意义”。
那么为什么人工智能会玩星际争霸2这样的复杂游戏呢? 因为复杂的游戏是对现实的完美模拟。
如果人工智能能够在如此复杂的环境中像人类一样学会感知、分析、理解、推理、决策和实时行动,那么人工智能可能会在变化和复杂的现实环境中发挥更大的作用。
他残酷地折磨着人类,并达到了宗师巅峰。
来自战队的团队训练出了最强的星际争霸AI,在战网星际争霸2的一系列盲赛中击败了弱小的人类(即人类傻瓜不知道自己在和AI对战) 。
它在排位赛中达到了宗师级别,并且在欧洲服务器上超越了 99.8% 的人类。
来看看团队对于新宗师的诞生是怎么说的:
为什么团队选择专注于电脑游戏? 这也许并不奇怪,因为其首席执行官是 Demis。
CEO
一些年长的游戏玩家可能知道他参与过的游戏:在为 2004 年制作的一款即时战略游戏提供一些关卡设计后,当时 17 岁的他成为 1994 年主题公园的联合创始人。 这款游戏的设计师和首席程序员后来卖出了 1000 万份。
硬件基础:10亿次浮点运算的液冷TPU
在专有的张量处理单元 (TPU) 上运行,这些单元是专门为神经网络机器学习开发的专用集成电路 (ASIC)。
该芯片构成了许多服务的后端,例如, 中的一个芯片每天可以处理超过 1 亿张照片,而在 View 中,它可以在不到五天内提取数据库中的所有文本。
说到“张量”这个词,人们自然会想到与 RTX GPU 中支持 DLSS 的 Core 进行比较。 与 GPU 相比,TPU 的精度较低,并且缺乏用于纹理化和光栅化的硬件,但在用于大量计算时,它们的速度却令人难以置信。
在存储单元中部署第三代 TPU,每个存储单元最多包含 1,024 个芯片。
母公司首席执行官在加利福尼亚州山景城举行的公司年度 I/O 大会上表示:“现在每个 Pod 的运算能力超过 10 。”
“这使我们能够开发更好、更大、更准确的机器学习模型,并帮助我们解决更大的问题。这些芯片非常强大,以至于我们不得不首次在数据中引入液体冷却中心。”
44天相当于玩200年,拓展新玩法边界
通过观看暴雪发布的匿名人类游戏开始训练。 它开始模仿这些策略,很快就能够在 95% 的比赛中击败游戏内置计算机的精英水平。
在游戏中的三个种族中,神族受到青睐,尽管研究人员相信虫族和人族最终会并驾齐驱。
然后采用“Alpha”循环竞争方法,首先比较在人类数据上训练的神经网络,然后逐步迭代,不同的AI实例开始相互对抗,成功实例的分支被采用并重新引入为新实例,使它们能够继续发展。 生长。
最后,选择Alpha中最不可能被利用的代理,将其称为“The nash of”,并挑战人类。
顶级职业选手的血战
训练只花了 44 天,估计相当于每个 AI 智能体玩《星际争霸 2》200 年。 然后它打败了99.8%的人类。
2018年12月10日,以5:0的战绩击败Team职业星际争霸2选手TLO。 经过更多训练,他于12月19日再次以5:0战胜职业选手MaNa。 随后他们在一场表演赛中输给了 MaNa。
VS 玛娜,血战
VS,当时星际2中最强的“高手”。 虽然输掉了这场比赛,但后来他以3:1击败了他。
TLO 在他的博客中回忆道:“我对 AI 的强大程度感到惊讶。”
他还表示,“AI还展示了我以前从未想到过的策略,这意味着可能还有我们尚未充分探索的新玩法。” 这听起来就像阿尔法零,这位孤独的围棋高手,对围棋有着同样的理解。 它已经超越了人类。
下一次拿起星际2全球冠军奖杯的人真的可能不是人类玩家,而是人类玩家。
参考链接:
AI 研究人员如何应对《星际争霸 2》中的所有新手
1:10! 《星际争霸2》陨落,人类被AI血洗
更多AI玩星际2硬核技术介绍请前往:
新智慧:星际最强AI再现——
新智慧:称霸星际2! 人工智能的史诗般的胜利再次碾压人类
超人类水平! 多图详解星际2 AI
阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭[多图],阴阳师4月22日更新的内容有哪些?版本更新
2024-02-07四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址[多图],2021四川电视台经济频
2024-02-07湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口[多图],湖北电视台生活频道
2024-02-07