手机号
验证码

正在加载验证码......

请先拖动验证码到相应位置

密码
确认密码
已有账号, 立即

已发送密码重置邮件到您的注册邮箱,请立即点击密码重置链接修改密码!

验证邮件24小时内有效,请尽快登录您的邮箱点击验证链接完成验证。若未收到邮件请先确认是否在垃圾邮件中。

查看邮箱

找回密码

手机号
验证码
新密码
确认新密码
没有账号? 立即 注册
Follow us on
@EVOLIFE 公众账号
On Wechat
@爱活新鲜播
On Weibo
@EVOLIFE.CN
On Instagram
Nina@evolife.cn
Mail us
@RSS
Follow our feed
下完围棋打星际 为什么DeepMind的AI机器人那么爱玩?

继今年3月,谷歌DeepMind推出的围棋人工智能机器人AlphaGo,打败职业棋手李世石,震惊世界后,DeepMind又在近日宣布,将与暴雪公司合作,用和人类玩家相同的视角和权限,共同开发《星际争霸2》的AI机器人。也许我们就会在暴雪嘉年华上,看到机器人拿走总冠军的一天。

在AI正式进入职业比赛之前,暴雪和DeepMind将在明年的第一季度发布一个仅供AI开发者们测试的《星际争霸2》的游戏环境,一个界面与普通游戏相同,但更简单、更适合机器学习系统。同时,API会允许AI读取真实的游戏数据,来训练自己,或者用游戏的编辑软件,完成开发者制定的任务。

bmCTcwO

AI会在游戏初期选择三个独立比赛区中的一个,学习选择采集矿石的时间和地点,学习建地施工的世纪和场所,最重要的,是培养离开所处的视觉范围,对不可见的领域进行探索、绘图和记忆的能力。AI的记忆力、测绘、建立长期目标计划、收集信息等能,都将在一个游戏中得到自我锻炼和提高,最终,将开发出和人类处在同一视角和思维模式的AI机器人玩家。

《星际争霸》复杂的策略

暴雪将使用《星际争霸2》作为AI研究的环境,进行测试、训练,让机器人能够在暴雪的游戏世界中的“真实”世界成长。游戏的环境,有着自己的世界观和构架,也有着自己的隐形条款和视角,能够训练处更加有自由度和智能的机器人。同时,在拥有职业选手的竞技比赛和规则下,AI也能获得即时反馈。

RTS即时战略游戏在暴雪的发展下,不仅吸引了大众玩家,还几乎是建立了电子竞技的概念,20年间,产生了大批以此为生的职业玩家。《星际争霸》对技巧、操控、决策、反映都有着很高的要求,在职业竞技中,《星际争霸》也是最具挑战性的RTS游戏。作为一个复杂的策略游戏,玩家需要同时对资源进行管理、侦查环境以及展开战争。单就是《星际争霸》的画面、速度,就远超过了此前训练的Atari 2600游戏平台,对AI的视觉(像素输入)观察要求更高。Labyrinth%20Medley_sm.width-1500

对于暴雪公司和玩家来说,星际AI机器人的引入和培养,可能会给游戏本身带来巨大影响。如果DeepMind的AI被培养成为新一代的顶级选手,那么它的发展速度、游戏方法和思维都可能提高整个职业玩家现有的水平。

对强化学习的挑战

DeepMind所训练的强化学习,就是让机器人能够像人类一样,在没有手动建模和域启发的情况下,通过不断地试错、进行自我奖励或惩罚,从视觉等直接原始输入资料中进行知识的学习和系统的搭建。

2014年,DeepMind推出了成功的深度增强学习算法,让Deep Q-network(DeepMind训练的深度神经网络)通过Atari游戏的训练,在没有经验知识的前提之下进行训练。并且从2D的视觉逐渐突破到3D视觉,训练AI的适应能力、和计划概念等抽象的、高层次的能力。

A26U3069.width-1500

AlphaGo与李世石的棋局

在这些封闭的游戏环境中,围棋是最困难的,也是DeepMind非常大的突破。AlphaGo在3月击败李世石,将深度增强学习推到了一个新的高度,让AI不再是一个单纯的计算,而是向人类一样拥有“直觉”。此外,DeepMind还利用德州扑克进行训练,由于德州扑克的牌面信息并不完整,玩家需要猜测对方手中的牌,AI在自我的训练、纠错中,也逐渐掌握了德州扑克的技巧。

但是在《星际争霸》的环境中,从玩家不能够察觉的角度,游戏的后台同时也在进行操作,而这些操作都是不可预见的,也就是说,AI和人类一样,将无法获得所有的信息。因此,AI所获得的直接、原始的信息,其实是不足以让它生成出正确的行动的。AI必须在派遣部队,去视线之外的对方阵营进行侦查,以获得完整的信息,并且将这些信息储存在记忆当中。

starcraft2screenshot_3

游戏的分层结构和“隐藏”的信息,就与围棋对环境的全知视角产生了强烈的反差。因为双方阵营都在即时发生着变化,所以每一个决策和动作,必须即时且快速。

1
文章来自:爱活网
了解更多

发表评论

全部评论 1条
  1. 匿名:

    it is a excellent weblog and that i like it very much!

评论
从现在知道的信息来看,应该还是ARM架构,除了ARM也没什么适合移动端的新架构。
还是arm架构吗,听说弄了新架构
EVO_1438 2023/05/25
能把我拍的好看点吗
EVO_1438 2023/05/25
今年realme的声音小了很多啊
EVO_1438 2023/05/25
版权 © 2017 爱活网 Evolife.cn 科技进化生活 [沪ICP备2021031998号]
版权 © 2017 爱活网 Evolife.cn 科技进化生活
[沪ICP备2021031998号]