人工智能迈向真实"智能学习体

2021-02-25 17:30   来源: 互联网    阅读次数:3175

据英国"自然"杂志24日报道,美国团队报告了一种可以追溯到过去并解决了复杂任务的增强学习,并确实改善了探索复杂环境的方式,并有望用于机器人、语言理解和药物设计。这种被统称为"去探索"的算法在经典游戏的算法挑战中超越了人类玩家和先进的人工智能系统。这一成就被认为是朝着实现真正的"智能学习体"迈出的重要一步。


强化学习可以让人工智能系统通过探索和理解复杂环境做出决定,并学会如何以最好的方式获得奖励。奖励可以包括到达特定位置或在电脑游戏中达到一定水平的机器人。然而,当面对一个反馈很少的复杂环境时,现有的增强学习算法很容易碰壁,这让人工智能专家非常不安。


OpenAI是一个非营利性人工智能组织,由许多硅谷巨头共同创建,其中包括美国企业孵化器YCombinator的总裁萨姆·阿尔特曼(Sam Altman)和美国太空技术探索公司(SpaceX)的创始人埃隆·马斯克(Elon Musk)。其目标是防止人工智能的灾难性影响,并推动人工智能发挥积极作用。这次,OpenAI的科学家Edland Ekfield、Juster Huizinga和团队提出了两个主要障碍,并设计了一系列解决这些障碍的算法。


image.png


研究人员说,去探索可以对环境进行全面的观察,并建立一个档案来记住它所处的位置,并确保它不会忘记通往充满希望的临时或最终胜利的道路(奖励)。"研究人员说,它可以全面地探索环境,同时建立档案以记住它在哪里,并确保它不会忘记通往充满希望的临时或最终胜利的道路。它在雅达利经典游戏中的得分超过了人类玩家和先进的人工智能系统。研究人员使用这样的算法来解决2600个以前未被解决的亚达利游戏,并验证了这些算法的潜力。"去探索"在算法挑战中的得分是"蒙特祖马的复仇"的四倍,比另一项算法挑战"玛雅冒险"中的人类玩家平均得分还要高。"相反,以前的算法没有得到一分钱。


去探索"算法还可以完成一个模拟机器人任务,它必须用一个机械手捡起东西,并把它们放在四个架子中的一个,其中两个是关在两扇门后面的。


研究人员指出,记住并返回有望成功的探索领域的简单原理是一种强大而普遍的探索方式。他们相信,最新的算法有望应用于机器人、语言理解和药物设计。

责任编辑:无量渡口
分享到:
0
【慎重声明】凡本站未注明来源为"深圳导报"的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。如因作品内容、版权和其他问题需要同本网联系的,请在30日内进行!
关于我们 投诉建议 免责声明 网站地图 sitemap

未经许可任何人不得复制和镜像,如有发现追究法律责任 粤ICP备2020138440号