首页 > 娱乐前沿 > 科技
OpenAI举办机器学习擂台,让开发者在SEGA音速小子上决胜负
小柯 2018-04-10 16:30:53

OpenAI举办人工智能转移学习(Transfer△Learning)比赛,采用整合了30款SEGA△Mega△Drive经典游戏的Gym△Retro平台,参赛者将需要面对前所未见的关卡,以评估其强化学习演算法(Reinforcement△Learning△Algorithm)举一反三的能力。hBL我酷网

OpenAI表示,在典型的增强学习研究中,演算法经常一再的于相同环境中测试,而这样不只让演算法容易以记忆的方式取胜,开发者也可以调整出最适合的超级参数组。这次的经典游戏大赛反其道而行,OpenAI会以音速小子系列游戏的自订义关卡,来测试参赛者的演算法。hBL我酷网

OpenAI释出了经典基准(Retro-baselines),向参赛者展示增强学习演算法在游戏关卡中的应用。而经典基准显示,即使使用了转移学习,增强学习演算法的学习能力还是远低于人类,人类只玩1个小时的游戏,其得分非常于演算法学习玩18个小时。hBL我酷网

参赛者可以使用各种环境以及参数训练演算法,但是实际比赛时,只能在官方准备好的全新关卡上游玩18小时,约执行100万步。OpenAI表示,18个小时看起来是一段很长的时间,但事实上得到的结果仍然差强人意。hBL我酷网

(如下图)这个经典基准测试中,提供了一些实验结果给参赛者参考,内含Rainbow△DQN、PPO以及简单随机猜测JERK等演算法的执行结果。他们发现,使用转移学习的PPO演算法,可以大幅提升学习效能,甚至是其他演算法的两倍。hBL我酷网

hBL我酷网

而随着比赛消息的释出,他们也对外公布Gym△Retro测试版,这是将经典游戏包装成增强学习环境的系统,其中包含来自SEGA△Mega△Drive的30款经典游戏以及62款Atari△2600的游戏。hBL我酷网

在过去5年,Arcade一直是增强学习的主要测试环境,目的在于让机器学习挑战人类玩家的运动技能以及解决问题的能力。OpenAI表示,Gym△Retro提供更为现代地控制台介面,SEGA△Mega△Drive的游戏也比Atari拥有更多层次,包括更多维度与玩法,借此不只能扩大增强学习研究可用的游戏数量,同时也能增加测试复杂性。在Gym△Retro中,玩家可以直接通过JSON文件来控制关卡组成。hBL我酷网

比赛将于4月5日至6月5日举行,为期两个月,而官方表示,获奖者会得到非常酷的奖杯,期望开发者踊跃挑战。hBL我酷网

上一篇  下一篇

I 相关 / Other

机器人是Twitter上的最佳公关!研究:66%的连结推文来自机器人

示意图,与新闻事件无关。 Pew△Research△Center本周公布一研究报告,指出机器人帐号在Twitter上扮演重要的角色,该组织在去年夏天调查了2,315个网站与120万则张贴相关连结的英文推文,发现有66%的连结出自机器人

超级机器人大战X哪个机师最好用 [游戏攻略]

超级机器人大战X哪些机师好用?优先培养好有发展的机师能让我们在后期战斗也变得轻松。下面给大家带来超级机器人大战X机师推荐,一起来看看吧。机师推荐1、UC众:这次5大NT集齐了,虽然说V也有西布克,但毕竟不是F91。

超级机器人大战X隐藏关卡在哪怎么进 [游戏攻略]

《超级机器人大战X》隐藏关怎么解锁?下面给大家带来超级机器人大战X隐藏关解锁方法,不知道的可以了解一下。甲儿和铁也的合计击落数80能进,或是前置条件不达成的情况下,在28话里将魔神zero的血量消减至30000以下,

长白山神庙遗址角逐全国十大考古新发现擂台 推荐

本报讯(记者韩金祥)2017年度全国考古界的终评会将于2018年4月8日至10日在北京召开,届时,26个终评入围项目将会进行擂台角逐,全国十大考古新发现也将同时亮相。2017年度全国十大考古新发现初评结果于2月26日揭晓。

促进机器学习模型再利用,Google释出模组打包函式库TensorFlow Hub

为促进机器学习TensorFlow生态系的发展,让开发者的努力可互相交流与再次使用。Google发表TensorFlow△Hub,提供机器学习模组打包函式库,帮开发者把TensorFlow的训练模型发布成模组,方便再次使用或是与社交共享成果

I 热点 / Hot