OpenAI举办机器学习擂台，让开发者在SEGA音速小子上决胜负

小柯 2018-04-10 16:30:53

OpenAI举办人工智能转移学习（Transfer△Learning）比赛，采用整合了30款SEGA△Mega△Drive经典游戏的Gym△Retro平台，参赛者将需要面对前所未见的关卡，以评估其强化学习演算法（Reinforcement△Learning△Algorithm）举一反三的能力。hBL我酷网

OpenAI表示，在典型的增强学习研究中，演算法经常一再的于相同环境中测试，而这样不只让演算法容易以记忆的方式取胜，开发者也可以调整出最适合的超级参数组。这次的经典游戏大赛反其道而行，OpenAI会以音速小子系列游戏的自订义关卡，来测试参赛者的演算法。hBL我酷网

OpenAI释出了经典基准（Retro-baselines），向参赛者展示增强学习演算法在游戏关卡中的应用。而经典基准显示，即使使用了转移学习，增强学习演算法的学习能力还是远低于人类，人类只玩1个小时的游戏，其得分非常于演算法学习玩18个小时。hBL我酷网

参赛者可以使用各种环境以及参数训练演算法，但是实际比赛时，只能在官方准备好的全新关卡上游玩18小时，约执行100万步。OpenAI表示，18个小时看起来是一段很长的时间，但事实上得到的结果仍然差强人意。hBL我酷网

（如下图）这个经典基准测试中，提供了一些实验结果给参赛者参考，内含Rainbow△DQN、PPO以及简单随机猜测JERK等演算法的执行结果。他们发现，使用转移学习的PPO演算法，可以大幅提升学习效能，甚至是其他演算法的两倍。hBL我酷网

hBL我酷网

而随着比赛消息的释出，他们也对外公布Gym△Retro测试版，这是将经典游戏包装成增强学习环境的系统，其中包含来自SEGA△Mega△Drive的30款经典游戏以及62款Atari△2600的游戏。hBL我酷网

在过去5年，Arcade一直是增强学习的主要测试环境，目的在于让机器学习挑战人类玩家的运动技能以及解决问题的能力。OpenAI表示，Gym△Retro提供更为现代地控制台介面，SEGA△Mega△Drive的游戏也比Atari拥有更多层次，包括更多维度与玩法，借此不只能扩大增强学习研究可用的游戏数量，同时也能增加测试复杂性。在Gym△Retro中，玩家可以直接通过JSON文件来控制关卡组成。hBL我酷网

比赛将于4月5日至6月5日举行，为期两个月，而官方表示，获奖者会得到非常酷的奖杯，期望开发者踊跃挑战。hBL我酷网

I 相关 / Other

机器人是Twitter上的最佳公关！研究：66%的连结推文来自机器人

示意图，与新闻事件无关。 Pew△Research△Center本周公布一研究报告，指出机器人帐号在Twitter上扮演重要的角色，该组织在去年夏天调查了2,315个网站与120万则张贴相关连结的英文推文，发现有66%的连结出自机器人

超级机器人大战X哪个机师最好用 [游戏攻略]

超级机器人大战X哪些机师好用?优先培养好有发展的机师能让我们在后期战斗也变得轻松。下面给大家带来超级机器人大战X机师推荐，一起来看看吧。机师推荐1、UC众：这次5大NT集齐了，虽然说V也有西布克，但毕竟不是F91。

超级机器人大战X隐藏关卡在哪怎么进 [游戏攻略]

《超级机器人大战X》隐藏关怎么解锁?下面给大家带来超级机器人大战X隐藏关解锁方法，不知道的可以了解一下。甲儿和铁也的合计击落数80能进，或是前置条件不达成的情况下，在28话里将魔神zero的血量消减至30000以下，

长白山神庙遗址角逐全国十大考古新发现擂台推荐

本报讯（记者韩金祥）2017年度全国考古界的终评会将于2018年4月8日至10日在北京召开，届时，26个终评入围项目将会进行擂台角逐，全国十大考古新发现也将同时亮相。2017年度全国十大考古新发现初评结果于2月26日揭晓。

促进机器学习模型再利用，Google释出模组打包函式库TensorFlow Hub

为促进机器学习TensorFlow生态系的发展，让开发者的努力可互相交流与再次使用。Google发表TensorFlow△Hub，提供机器学习模组打包函式库，帮开发者把TensorFlow的训练模型发布成模组，方便再次使用或是与社交共享成果

I 相关 / Other

I 热点 / Hot