索尼搞了个大新闻!AI打败人类三冠王 登上Nature封面

今天,索尼真的在背后捅了任天堂一刀。

上午,任天堂在面对面的会议上宣布了许多游戏杰作:不同等级的剑锋3,无与伦比的火焰使者,马里奥前锋,可以说是在聚光灯下。

然而,出乎意料的是,索尼的3A游戏杰作带来了更大的新闻,出现在《自然》杂志的封面上。

我相信这个游戏已经被宣传并发布到顶级学术期刊的封面上。

然而,这篇文章并不是为了增加广告费,而是一篇真正的技术论文--

来自索尼的AI,名叫GTSophie

让我们看看AI赛车手的赛车照片。首先,巧妙的换道绕过对手的牌位:

然后,当弯道被卡住时,大秀操纵并以190公里/小时的速度超过了对手。

不要认为AI在比赛中战胜人类没什么特别的。你知道,这样的比赛是在GT赛车中进行的--

这是一款非常逼真的赛车游戏,玩家几乎都在开车。

△右边是Takuma和GT世界冠军Miyazono

GTSophie也是世界上第一个在这种需要持续判断和高速反应的比赛中击败人类冠军的AI。

斯坦福汽车研究中心联合主任克里斯·格德斯教授说:

"GTSophie在比赛中超越人类车手,这是人工智能的一个里程碑。”

值得一提的是,最新一代GT系列游戏GranTurismo7将于3月4日正式登陆PS4/ps5平台。

虽然玩家不太可能第一次与GTSophie较量,但索尼表示,他们正试图将这款强大的AI整合到GT汽车中。

不是一辆简单的赛车,马华腾

AI对人类的胜利对许多人来说还不够新鲜。

然而,与曾经在国际象棋、围棋和其他棋类游戏中打斗,或在星际争霸和DOTA等动作游戏中打斗的AI相比,看似“先赢后赢”的简单比赛目标实际上要复杂得多:

例如,刹车是一场“物理战”,不断探索汽车轮胎和道路之间的摩擦。

如果转弯时刹车太早,你可能无法顺利过弯并失去速度;

刹车太晚,很难保持理想的路线轨迹,甚至导致车身旋转。

在整个比赛过程中,驾驶员必须始终判断周围环境,并根据路况及时做出反应。

同时,驾驶技术、不同对手的战术策略,甚至遵守规则的比赛精神和礼仪,都是AI比赛必备的素质。

为了实现这些目标,索尼在自己的GT赛车系列游戏中设置了AI的训练场。

这是PS平台上的独家游戏。它的全名是GranTurismo。这是汽车行业的一个真正的术语,意思是“能行驶很长距离的高性能汽车”。

这个游戏关注真实的驾驶感觉。通过一套带力反馈的方向盘外围设备,您甚至可以体验各种精致的路感反馈,如横向g值、前轮打滑率、车辆重量、车辆调节特性等。

在GT游戏中,研究通常使用10到20PS游戏控制台的GPU、相同数量的计算示例和异步更新神经网络,并从头开始训练名为GTSophie的AI。

培训主要针对持续价值观的两个方面:转向和速度。

与此同时,为了让GTSophie和人类走到同一条起跑线上,研究人员还放慢了它的运行速度:

游戏的交互频率为10Hz(人类标准为60Hz),反应时间分别为100ms、200ms和250ms。

在完整的地图中,研究人员在6秒内将代理运行的轨迹量化为“静态地图段”,并将每条轨迹的左右边缘和中心线编码为60个等距三维点:

训练场已经准备好了。现在是时候让GTSophie真正成为一名能够转身思考的汽车司机了。

参与者评估机制

索尼使用了一种新的深度学习算法,也被称为定量回归参与者评估器(qrsac)方法。

AI的智慧经验被抛到一个没有指示的环境中,根据评价者的评价(即价值函数)选择行动,并根据实现目标的结果获得奖惩。

例如,聪明的经验会因保持高速运动而得到奖励,也会因出界、撞墙或失去牵引力而受到惩罚。

这种奖惩机制使代理人能够快速获得积极反馈,并逐渐熟悉轨道上的行为。

事实上,GTSophie在短短几个小时内就学会了在赛道上驾驶,很快就超过了Maggiore赛道上的17700名球员:

然而,这种简单的速度,或者说对赛道完成进度的奖励,不足以激励经纪人赢得比赛。

因为如果对手足够快,代理可以通过跟踪和学习对手的“懒惰”来积累大量奖励,最终实现目标。

结果,研究人员增加了“超车奖励”,与对手的距离变化与奖励点数成正比。

同时,对赛车碰撞也有奖惩机制。研究人员设定了一个更保守的奖励:

在确保智能的身体能力能够赢得足够强大的驾驶风格,它不会粗暴地驾驶其他汽车出公路,并受到真正的比赛规则的惩罚。

最终,GTSophie在GT比赛中击败了许多世界顶级赛车手,如2021年TGRGT杯冠军、2020年国家杯世界冠军、2021年亚军和2018年国家杯亚洲/大洋洲冠军。

在比赛中,GTSophie赢得了三条赛道的第一名。

在比赛中,它可以执行多种类型的转弯、有效利用漂移、干扰后面的车辆、拦截对手和执行其他紧急机动。

然而,研究人员还提到,GTSophie的战略决策仍有一些改进空间:有时同一跑道上会留下足够的空间,让对手可以利用它。

索尼想用它来开发自动驾驶仪

你觉得苏菲的能力怎么样?

不管怎样,有几位世界级的球员被说服了。

宫园拓真(Takuma、Miyazono)在世界级GT赛事中获得三次冠军,他说:

"索菲的速度非常快,圈速超过了最佳车手之前的预期。”

--在其中一场比赛中,GTSophieRouge以5.8秒的优势击败第二名山中志明(2021年TGRGT杯冠军)。最快圈速为1:54.373,比山中快2秒多。

GTSophie的能力显然不仅可以杀死比赛中的四方。

斯坦福德汽车研究中心联合主任克里斯·格德斯指出,GTSophy背后的AI技术可以帮助开发自动驾驶汽车:

在未来的某一天,GTSophy在赛道上的成功表明,神经网络可能在自动驾驶软件中发挥更大的作用。

目前,在自动驾驶车辆软件中,神经网络算法主要负责跟踪道路标线和感知障碍物,而控制软件仍然依赖于人工规则。

丰田研究院高级经理Avinash和Balachandran也表示,“将机器学习和自动控制应用到赛车中令人兴奋。”。

很多网友认为,AI可能与索尼新成立的电动汽车公司有关。也许几年后,这款AI将出现在自动驾驶技术中。

当然,对于索尼的玩家来说,最令人期待的事情是:下个月推出的gt7能否加入这个实力最强的AI?

好消息是,gt7仍将登录上一代游戏机PS4,不购买ps5的玩家可以品尝它。

© 本文系原创,著作权归:芦虎导航官网。如需转载,请署名并注明出处:https://www.luhu.co/article/000000000014531.shtml