8090要玩网 手游攻略 新游动态 新一代AI何以登顶星际争霸2战网天梯宗师?

新一代AI何以登顶星际争霸2战网天梯宗师?

时间:2024-02-07 04:01:58 来源:网络整理 浏览:0

在RTS游戏中,计算机AI=人工智能?

对于大多数游戏玩家来说,游戏中内置的电脑AI似乎是一个笑话,应该被称为“人工智障”。

能够与玩家竞争的计算机人工智能通常会被分配超过玩家的资源。 例如,在《红色警戒》中,他们与十个残酷的敌人作战,或者在《魔兽争霸》中,他们与疯狂的电脑作战。 电脑AI的优势仅仅来自于远超玩家的资源、部队创建速度等各种作弊,或者通过取消AI上的战争迷雾。

这时,人类玩家获胜的常见方式就是要么依靠自己精心磨练的游戏技巧,要么利用计算机套路的缺陷“走后门”。 无论如何,这表明人工智能的预编程策略不足以应对灵活狡猾的人类玩家。

比如这张图中,计算机终于学会了人类隐藏基地的基本操作,玩家开心地笑了。

最初的计算机AI策略的主要问题在于,在不作弊的情况下(没有避开战争迷雾),它可以从心理上猜测玩家的单位在哪里,猜测玩家遵循什么流程,并有针对性地做出反应。 攻击能够有效响应,这是很难提前编程的。

无论是游戏AI的无脑缺陷,还是人类玩家的窃笑,当深度学习(DL)引入训练时,这一切都戛然而止。

为什么专注于征服星际争霸2?因为它极其复杂且高度真实

星际争霸是暴雪公司出品的经典即时战略(RTS)游戏。 它以超考验策略思维、精致的种族平衡性和极强的可玩性而闻名。 玩家还必须掌握经济的宏观管理和微观管理。 在个人控制之间保持谨慎的平衡。

从星际争霸1到星际争霸2,这款RTS大作一直被列为世界电子竞技的核心项目之一。

2014,一场拥挤的星际争霸 2 比赛

在人工智能已经掌握了国际象棋、围棋和危险边缘之后,星际争霸2将是人工智能的下一步。 人们一致认为存在重大挑战。 AI巨头们摩拳擦掌,渴望攻击科普鲁星区的虫海、坦克群和高级圣堂武士。

他们对《星际争霸》感兴趣,因为它足够复杂,可以模拟现实生活。

使用人工智能玩星际争霸的杰出人物、纽芬兰纪念大学计算机科学教授戴维曾表示,“星际争霸太复杂了。能够应用于星际争霸的机器人还可以解决现实生活中的其他问题。”

星际争霸中不存在最优策略,AI需要不断探索、拓展和更新自己的策略知识。

操作空间巨大,需要同时操作数百个不同的单元,因此可能的组合非常多。

游戏过程非常漫长星际争霸2好玩吗,需要长期规划。 与许多现实世界的问题一样,因果关系不是瞬时的。 游戏早期采取的行动可能不会在很长一段时间内得到回报,因此它锻炼了AI的长期思考能力。

“星际争霸是人类最难玩的游戏,就像同时下棋和踢足球一样,需要高度的专注力、超人的手指和手臂,以及超乎常人的战略思维。”

与人类玩家Mana战斗

此外,与国际象棋游戏不同,《星际争霸》中大量的“棋子”对AI提出了巨大的挑战。

围棋共有 10 的 170 次方可能走法,这比整个宇宙的原子数 10 的 80 次方还要多。 这对星际争霸来说简直就是儿戏。

《星际争霸》每时每刻都有 10 的 10 次方可能的行动——几乎无法计算。 尽管如此,人工智能仍仅限于以人类速度运行,迫使它制定战略以取胜,而不是用一系列超人无敌的动作轰炸人类对手。

平均APM只有277,而职业选手可以达到559。

该团队在《星际争霸》杂志上发表的一篇论文称,由于其“固有的复杂性和多智能体挑战,使其能够在最困难的职业中表现出色”,《星际争霸》“已经成为人工智能研究的一个重要挑战”。 在电子竞技领域具有持久的地位,并且具有很强的现实意义”。

那么为什么人工智能会玩星际争霸2这样的复杂游戏呢? 因为复杂的游戏是对现实的完美模拟。

如果人工智能能够在如此复杂的环境中像人类一样学会感知、分析、理解、推理、决策和实时行动,那么人工智能可能会在变化和复杂的现实环境中发挥更大的作用。

他残酷地折磨着人类,并达到了宗师巅峰。

来自战队的团队训练出了最强的星际争霸AI,在战网星际争霸2的一系列盲赛中击败了弱小的人类(即人类傻瓜不知道自己在和AI对战) 。

它在排位赛中达到了宗师级别,并且在欧洲服务器上超越了 99.8% 的人类。

来看看团队对于新宗师的诞生是怎么说的:

为什么团队选择专注于电脑游戏? 这也许并不奇怪,因为其首席执行官是 Demis。

CEO

一些年长的游戏玩家可能知道他参与过的游戏:在为 2004 年制作的一款即时战略游戏提供一些关卡设计后,当时 17 岁的他成为 1994 年主题公园的联合创始人。 这款游戏的设计师和首席程序员后来卖出了 1000 万份。

硬件基础:10亿次浮点运算的液冷TPU

在专有的张量处理单元 (TPU) 上运行,这些单元是专门为神经网络机器学习开发的专用集成电路 (ASIC)。

该芯片构成了许多服务的后端,例如, 中的一个芯片每天可以处理超过 1 亿张照片,而在 View 中,它可以在不到五天内提取数据库中的所有文本。

说到“张量”这个词,人们自然会想到与 RTX GPU 中支持 DLSS 的 Core 进行比较。 与 GPU 相比,TPU 的精度较低,并且缺乏用于纹理化和光栅化的硬件,但在用于大量计算时,它们的速度却令人难以置信。

在存储单元中部署第三代 TPU,每个存储单元最多包含 1,024 个芯片。

母公司首席执行官在加利福尼亚州山景城举行的公司年度 I/O 大会上表示:“现在每个 Pod 的运算能力超过 10 。”

“这使我们能够开发更好、更大、更准确的机器学习模型,并帮助我们解决更大的问题。这些芯片非常强大,以至于我们不得不首次在数据中引入液体冷却中心。”

44天相当于玩200年,拓展新玩法边界

通过观看暴雪发布的匿名人类游戏开始训练。 它开始模仿这些策略,很快就能够在 95% 的比赛中击败游戏内置计算机的精英水平。

在游戏中的三个种族中,神族受到青睐,尽管研究人员相信虫族和人族最终会并驾齐驱。

然后采用“Alpha”循环竞争方法,首先比较在人类数据上训练的神经网络,然后逐步迭代,不同的AI实例开始相互对抗,成功实例的分支被采用并重新引入为新实例,使它们能够继续发展。 生长。

最后,选择Alpha中最不可能被利用的代理,将其称为“The nash of”,并挑战人类。

顶级职业选手的血战

训练只花了 44 天,估计相当于每个 AI 智能体玩《星际争霸 2》200 年。 然后它打败了99.8%的人类。

2018年12月10日,以5:0的战绩击败Team职业星际争霸2选手TLO。 经过更多训练,他于12月19日再次以5:0战胜职业选手MaNa。 随后他们在一场表演赛中输给了 MaNa。

VS 玛娜,血战

VS,当时星际2中最强的“高手”。 虽然输掉了这场比赛,但后来他以3:1击败了他。

TLO 在他的博客中回忆道:“我对 AI 的强大程度感到惊讶。”

他还表示,“AI还展示了我以前从未想到过的策略,这意味着可能还有我们尚未充分探索的新玩法。” 这听起来就像阿尔法零,这位孤独的围棋高手,对围棋有着同样的理解。 它已经超越了人类。

下一次拿起星际2全球冠军奖杯的人真的可能不是人类玩家,而是人类玩家。

参考链接:

AI 研究人员如何应对《星际争霸 2》中的所有新手

1:10! 《星际争霸2》陨落,人类被AI血洗

更多AI玩星际2硬核技术介绍请前往:

新智慧:星际最强AI再现——

新智慧:称霸星际2! 人工智能的史诗般的胜利再次碾压人类

超人类水平! 多图详解星际2 AI

标题:新一代AI何以登顶星际争霸2战网天梯宗师?
链接:https://www.yaowan8090.com/news/xydt/3204.html
版权:文章转载自网络,如有侵权,请联系删除!
资讯推荐
更多
阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭

阴阳师4月22日更新内容:帝释天上线技能调整,红莲华冕活动来袭[多图],阴阳师4月22日更新的内容有哪些?版本更新

2024-02-07
四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址

四川电视台经济频道如何培养孩子的学习习惯与方法直播在哪看?直播视频回放地址[多图],2021四川电视台经济频

2024-02-07
湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口

湖北电视台生活频道如何培养孩子的学习兴趣直播回放在哪看?直播视频回放地址入口[多图],湖北电视台生活频道

2024-02-07
小森生活金币不够用怎么办?金币没了不够用解决方法

小森生活金币不够用怎么办?金币没了不够用解决方法[多图],小森生活金币突然就不够用的情况很多人都有,金币没

2024-02-07