当前位置: 首页 > 编程日记 > 正文

2:0!谷歌 AI “AlphaStar“ 虐杀职业星际玩家

640?wx_fmt=png


作者 | 若名

出品 | AI科技大本营(ID:rgznai100)


刚刚,在更复杂的《星际争霸 II》游戏中,DeepMind AI 以总比分 2:0 分别战胜两位职业人类选手。这或许是自 2017 年 AlphaGo 在围棋上战胜人类后,再次让人类刷新 AI 认知的人机大战。


此次与人类对战的 AI 是 AlphaGo 兄弟:AlphaStar。开赛前几个小时,DeepMind CEO 在 Twitter 上公布了这一名字。而在开赛前一天,DeepMind 宣布 AI 将与人类在《星际争霸 II》中公开对战的消息,并表示在《星际争霸 II》游戏的疯狂难度模式下,其 AI 的胜率为 50%。


需要说明的是,正如之前打 Dota 的 OpenAI 受到的降低反应速度一样,DeepMind 此次将 AlphaStar 的反应速度“限制”到 APM 280,大致相当于星际中等职业玩家的水平。就 AlphaStar 的表现来看,虽然最终在现场 PK 时输了最后一局比赛,但整体上还是完虐人类。


比赛开始,与 AlphaStar 对战的第一个职业选手是 TLO,其世界排名为第 68 位。此次人机大战是五局三胜制,TLO 虽然不是顶级星际选手,但让人足够惊叹的是,AlphaStar 最终在约五十分钟内结束战斗,以 3:0 的成绩获胜,人类职业选手似乎毫无还手之力。


640?wx_fmt=png


先来简单回顾下人机大战第一场:AlphaStar 第一局一开始就表现的很有全局观,在 PvP 两矿打一矿的情况下,TLO 很快被击败;第二局一度打得很焦灼,但 AlphaStar 依然以 2:0 再赢一局;十分钟后,TLO 溃败给 AlphaStar,有网友说选手太初级,批评 TLO 作为职业选手在瞎打,没有尊重熬夜看人机大赛的观众。不过,也有人说 AI 很可怕。


640?wx_fmt=png


如果说第一回合 AlphaStar 战胜的是“初级”选手,那随后与其对战的职业选手是世界排名第 19 位的 MaNa ,其职业水平至少是中上游。


640?wx_fmt=png


上图显示的是 AlphaStar 的决策过程,具体比赛过程就不说了,结果是 MaNa 在大约 45 分钟内连输五局被 AlphaStar 斩落马下。


640?wx_fmt=png


前一个职业选手 TLO 在 MaNa 输掉比赛后称,“相信我, 和一个像 AlphaStar 这样的对手比赛是非常困难的, 它的打法和人类完全不同,是你以前从未有过的经验。 AlphaStar 给人留下了极深的印象, 这在游戏 AI 中也是前所未有的。"


AlphaStar 遇神杀神,干脆利落。这次应该没人责怪 MaNa 打得不好,他显然拼尽了全力,而网友发出的慨叹是希望终结者不会来那么快。


640?wx_fmt=png


但最后一局让网友们为人类命运紧张的情绪稍稍放松,与 MaNa 现场对战的 AlphaStar 一着不慎,让 MaNa 扳回一局,但最终以 1:5 输掉比赛。


AlphaStar 的来历


早在 2016 年,谷歌 DeepMind 的 AI 研究人员已经开始关注暴雪娱乐的《星际争霸 II》。通过游戏来确定 AI 是否可以胜过人类相对简单的复杂任务是 DeepMind 的研究人员长期以来都在尝试的项目。同年 11 月,DeepMind 曾在暴雪嘉年华上宣布与暴雪达成合作协议,将在《星际争霸》系列游戏中进行合作,将在游戏平台中引入机器学习方法,进行人工智能研究。


2017 年 8 月,Deepmind 与暴雪共同发布了合作计划的首个成果:基于《星际争霸 II》的人工智能研究环境 SC2LE,它允许研究者在 Linux 系统中接入游戏 API,开放了 65000 场比赛的数据缓存用于训练 AI,并将添加 50 万场游戏数据到缓存中。


640?wx_fmt=png

     

2018 年,同样在暴雪嘉年华上,他们分享了人工智能模型在《星际争霸》游戏中的突破。人工智能模型能执行基本的宏观战略,还能防御像 Tower Rush 这样的激进战术。而刚刚结束的“星际争霸”赛则是是一项“重大挑战”,因为这要求 AI 智能体“实现和平衡一些子目标”,以便最终击败人类选手。


例如,虽然游戏的目标是击败对手,但玩家还必须考虑平衡多个子目标,比如收集资源(水晶和气矿)或建筑。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的行动会在很长时间不见成效。最后,由于玩家智能看到部分地图,这意味着智能体必须结合记忆与规划才能成功。


AlphaStar 背后的 AI 技术


在围棋任务中,对手间可以看到整个棋盘,但《星际争霸 II》与此不同,我们通常无法看到整个地图,需要派小兵出去侦查。而且游戏是不间断进行的,整个游戏甚至会有超过 5000 步的操作。


640?wx_fmt=png


DeepMind 科学家 Oriol Vinyals 曾在去年的一场以《AI 对战星际争霸胜算几何?》的演讲中提到,这个游戏基本上就是建造一些建筑物以及单位,在同一个地图里与不同的组织相互竞争。在这个游戏中,哪怕只是建造建筑物,也需要做出许多决策。除此之外,他们还要不断收集和利用资源、建造不同的建筑物、不断扩张,因此整个游戏非常具有挑战性。


他们在这个游戏中使用的方法依旧是强化学习。他们要让 AI 模仿人类玩这个游戏的方式,但即使是模仿人类点击鼠标和敲击键盘的行为也非常困难,需要收集整个《星际争霸》玩家的行为进行分析。为此还引入了一个游戏引擎。


DeepMind 还为游戏过程设计了不同的指令和模式,这使得整个玩《星际争霸》的过程变得独一无二。如今,我们看到的 AlphaStar 正是上述想法的结晶。


现在的 AlphaStar 还是刚出生的婴幼儿,不过以其极快的进化速度,你也能想到日后的进化版会是多么无可匹敌。到现在,或许还有很多人期待 2 月 15 日 AlphaStar 与世界排名第一的 Serral 进行终极对决,但最终的结果可想而知。正如柯洁输给 AlphaGo 时面临的绝望一样,人类可能不愿意面对这样的现实:在更多复杂的场景中,人类可能正以难以想象的速度输给 AI。


(本文为 AI科技大本营原创文章,转载请微信联系 1092722531。

征稿

640?wx_fmt=png


推荐阅读

  • PDF翻译神器,再也不担心读不懂英文Paper了

  • Facebook增强版LASER开源:零样本迁移学习,支持93种语言

  • 啥是佩奇排名算法

  • 网络爬虫的法律边界

  • Caicloud 开源 Nirvana:让 API 从对框架的依赖中涅槃重生

  • 程序员有话说 | 那个拒绝加班的程序员后来怎么样了

  • 告别摩拜

  • 6大改进:盘点以太坊的2018冒险之旅

  • 不难!月薪 50K大牛,悉心整理程序员必备技能!


640?wx_fmt=png

相关文章:

插件化知识梳理(7) 类的动态加载入门

一、前言 在 插件化知识梳理(6) - Small 源码分析之 Hook 原理 这一章的学习完成之后,下一步我们将进入插件化加载的精髓,动态加载类的学习,在此之前,我们需要先准备一些关于类加载的知识。 Android当中,支持动态加载的…

redhat中使用securecrt 中文乱码解决办法

具体解决方法是: 1,修改远程linux机器的配置 vim /etc/sysconfig/i18n 把LANG改成支持UTF-8的字符集 如:LANG”zh_CN.UTF-8″ 或者是 LANG”en_US.UTF-8″ 2,然后再改Secure CRT的设置,选项->会话选项->外观->字符编码-&…

知否?知否?一文看懂深度文本分类之DPCNN原理与代码

【导读】ACL2017年中,腾讯AI-lab提出了Deep Pyramid Convolutional Neural Networks for Text Categorization(DPCNN)。论文中提出了一种基于word-level级别的网络-DPCNN,由于上一篇文章介绍的TextCNN 不能通过卷积获得文本的长距离依赖关系,…

linux驱动:设备-总线-驱动(以TI+DM8127中GPIO为例)

一:说明:这次学习设备-总线-驱动是以TIDM8127的GPIO为例 1、GPIO资源注册到omap_hwmod链表中 2、初始化GPIO 3、将GPIO注册到plarform层 4、将GPIO注册到device层 二、流程图 1、GPIO资源注册到omap_hwmod链表中 2、初始化GPIO 3、将GPIO注册到pla…

生活总是在推着你一步一步往前走

上早班的时候,无意间看到了关于高考这个字眼。对于我的高考已经过去五年了,但回想起来记忆依旧是那么深刻。记得五年前的那个日子,阳光明媚,空气中到处都是一股夏天的气息,我妈和我哥早早的从家里搭车到县城&#xff0…

急!!!求从字符串中提取形如: div([MC0010000000006],此若干个字符或数字,0) 的正则表达式...

如题, 形如: div([MC0010000000006],此处有若干个字符或数字, 此处只有一个字符) 静坐等待.

C# 如何创建Excel多级分组

在Excel中如果能够将具有多级明细的数据进行分组显示,可以清晰地展示数据表格的整体结构,使整个文档具有一定层次感。根据需要设置显示或者隐藏分类数据下的详细信息,在便于数据查看、管理的同时也使文档更具美观性。那么,在C#中如…

苹果裁员逾200人,拿无人驾驶“开刀”

整理 | 琥珀出品 | AI科技大本营1 月 14日,据美国媒体 CNBC 援引知情人士消息报道称,本周,苹果泰坦项目(Project Titan)的 200 多名员工遭到解雇。据悉,泰坦项目是苹果未公开的自动驾驶汽车项目。一名苹果发…

linux驱动:i2c驱动(一)

I2C系统框架:I2C核心层、I2C总线驱动、I2C设备驱动 -------------------------------------------------------------------------------- 【I2C核心层】 代码在driver/i2c/i2c-core.c中 【I2C总线驱动】也叫I2C适配器驱动 1、每个适配器视为一个字符设备文件 …

关于SQLServer2005的学习笔记——XML的处理

在 SQLServer2005 中对 XML 的处理功能显然增强了很多,提供了 query(),value(),exist(),modify(),nodes() 等函数。关于 xml ,难以理解的不是 SQLServer 提供的函数,而是对 xml 本身的理解,看似很简单的文件格式,处理起…

2019最新实战!给程序员的7节深度学习必修课,最好还会Python!

整理 | 琥珀出品 | AI科技大本营从 2017 年开始,fast.ai 创始人、数据科学家 Jeremy Howard 以每年一迭代的方式更新“针对编程者的深度学习课程”(Practical Deep Learning For Coders)。这场免费的课程可以教大家如何搭建最前沿的模型、了解…

linux驱动:i2c驱动(二)

3、驱动源码分析 IPNC_RDK_V3.8.0.1/Source/ti_tools/ipnc_psp_arago/kernel/sound/soc/codecs/tlv320aic3x.c 3.1 注册模块 module_init(aic3x_modinit); 3.2 在初始化函数中添加i2c驱动 static int __init aic3x_modinit(void) { intret 0; #if defined(CONFIG_I2C) ||…

01 使用AFN3 0上传图片时间慢的问题

##iOS中修改图片的大小:修改分辨率和裁剪 ###第一步:裁剪图片 // 裁剪// 要裁剪的图片区域,按照原图的像素大小来,超过原图大小的边自动适配CGSize size CGSizeMake(1000, 1000);UIImage *img [self imageWithImageSimple:image scaledToS…

配置telnet

配置telnet<?xml:namespace prefix o ns "urn:schemas-microsoft-com:office:office" />允许root账号能够登录telnet&#xff0c;但是拒绝某一台主机登录且只允许在9&#xff1a;00-14&#xff1a;00 14&#xff1a;00-18&#xff1a;00能够访问&#xff0…

04 pod setup 慢的问题

解决方式一: 可以直接从别人的电脑中拷贝解决方式二转载于:https://juejin.im/post/5a3c5a985188257d391d3a39

linux驱动:i2c驱动(三)流程图之注册设备

一、设备注册过程 1、将i2c设备信息保存到i2c_board_info结构体中&#xff1b; 2、在注册i2c_board_info时&#xff08;i2c_register_board_info&#xff09;将它加入一个全局列表__i2c_board_list中&#xff0c; 3、在注册I2c adapter适配器驱动后&#xff0c;再从全局列表…

AI找Bug,一键快速预测

作者 | Jane出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;在程序开发中&#xff0c;程序员每天都要和 Bug 打交道&#xff0c;对新手程序员而言&#xff0c;debug 是一件非常让人头疼的事情。好不容易写完一段代码&#xff0c;一运行&#xff0c;全是红色&#xff…

专业研究HP procurve网络、阿姆瑞特和系统集成的论坛

一个专业研究HP procurve网络、阿姆瑞特防火墙和系统集成的论坛http://www.vlan2.com确实不错。转载于:https://blog.51cto.com/showrouter/284235

到底是什么特征影响着CNN的性能?

作者 | 刘畅 编辑 | Jane出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;开门见山。最近阅读了一篇论文&#xff0c;加上看了一些之前的工作。记录一下&#xff0c;CNN 到底学到了什么东西&#xff0c;或者换句话讲。到底是什么样的特征在影响着CNN 的性能&#xff1…

Java数据结构与算法(八)-二叉树

一、为什么要使用树 有序数组插入、删除数据慢。链表查找数据慢树可以解决这两个问题二、相关术语 树的结点&#xff1a;包含一个数据元素及若干指向子树的分支&#xff1b;孩子结点&#xff1a;结点的子树的根称为该结点的孩子&#xff1b;双亲结点&#xff1a;B 结点是A 结点…

linux驱动:i2c驱动(四)流程图之注册驱动

二、i2c设备的驱动部分 1、i2c驱动i2c_driver 2、通过i2c_add_driver注册 2、注册过程中 比较i2c_device_id数组中各成员的id与i2c_client中的名字&#xff0c;找到设备 3、执行i2c_driver驱动中的probe

Expression Blend实例中文教程(2) - 界面快速入门

上一篇主要介绍Expression系列产品&#xff0c;另外概述了Blend的强大功能&#xff0c;本篇将用Blend 3创建一个新Silverlight项目&#xff0c;通过创建的过程&#xff0c;对Blend进行快速入门学习。 在开始使用Blend前&#xff0c;首先需要进行Silverlight的开发环境搭建&…

Lua基本语法-书写规范以及自带常用函数

Lua基本语法-书写规范和常用函数本文提供全流程&#xff0c;中文翻译。Chinar坚持将简单的生活方式&#xff0c;带给世人&#xff01;&#xff08;拥有更好的阅读体验 —— 高分辨率用户请根据需求调整网页缩放比例&#xff09; 1String Operation —— 字符串操作2Table ——…

linux驱动:音频驱动(一)ALSA

一、【基础知识】 1、J2 《--HPR_OUTHPL_OUT 《-- U13&#xff08;TLV320AIC3104IRHBR&#xff09;的HPROUTHPLOUT 2、驱动源码 IPNC_RDK_V3.8.0.1/Source/ti_tools/ipnc_psp_arago/kernel/sound/soc/codecs/tlv320aic3x.c 3、依赖于I2C驱动 4、声卡驱动框架&#xff1a;…

秘籍 | 机器学习数据集网址大全

作者 | Will Badr译者 | Linstancy整理 | Jane出品 | AI科技大本营&#xff08;ID:rgznai100&#xff09;要找到一定特定的数据集可以解决各种机器学习问题&#xff0c;是一件很难的事情。越来越多企业或研究机构将自己的数据集公开&#xff0c;已经成为全球的趋势&#xff0c;…

为asa防火墙配置ssh登陆

由于最近事情超多&#xff0c;单位下发某些令人恶心的制度&#xff0c;今天突然说北京分公司和总公司之间要做***的连接&#xff0c;虽然俺是个CCNP&#xff0c;但是对于***来说接触的少之又少&#xff0c;并且工作繁忙&#xff0c;每天头大&#xff0c;北京分公司的安全ie同事…

70.nodejs操作mongodb

转自&#xff1a;https://www.cnblogs.com/whoamme/p/3467374.html 首先安装nodejs mongodb npm install mongodb var mongodb require(mongodb); var server new mongodb.Server(localhost, 27017, {auto_reconnect:true}); var db new mongodb.Db(mydb, server, {saf…

明晚8点公开课 | 用AI给旧时光上色!详解GAN在黑白照片上色中的应用

在改革开放40周年之际&#xff0c;百度联合新华社推出了一个刷屏级的H5应用——用AI技术为黑白老照片上色&#xff0c;浓浓的怀旧风勾起了心底快被遗忘的时光。想了解如何给老照片上色&#xff1f;本次公开课中&#xff0c;我们邀请到了百度高级研发工程师李超&#xff0c;他的…

linux驱动:音频驱动(二)ASoc

五、【ASoC声卡驱动框架】 1、ASoC将嵌入式设备的音频系统从软件层面划分为3个组件 1.1 codec驱动&#xff1a;音频编解码器驱动&#xff0c;与平台无关&#xff0c;实现音频控制项添加、音频接口实现、DAPM&#xff08;动态音频电源管理&#xff09;、音频编解码器的IO功能 …

把32位的SharePoint服务器场迁移到64位, 应该怎么做?

总体步骤如下: 1. 迁移已经存在了的数据库服务器到新的数据库服务器. 先迁移这一层的目的是避免可能发生的一些由64位系统对32位系统执行查询或写入操作所引起的性能问题. 2. 迁移WFE服务器到64位环境下. 准备工作: 1. 重新编译已经存在的32位的应用程序和自定义的程序集(web p…