网站便捷导航 - 百度XML地图 - RSS 订阅 - 设为首页 - 加入收藏
您的当前位置:主页 > 健身用品 > 舞蹈 > 了解为了解:为了将好奇心强硬地引入机器人而开发的算法

了解为了解:为了将好奇心强硬地引入机器人而开发的算法

来源:欣欣旅游网 编辑:孤城竹叶青 时间:2019-09-02 点击:6664
ShareTweet

为了更好地充实人工智能(AI),计算机科学家已经将一种算法放在一起,使机器只是为了学习而好奇地探索和学习。从长远来看,这些项目甚至可以从工厂中取出机器人,并将它们与研究人员并排放置。

Sage的建议。图像归功于Gerd Altmann。

概念对于我们来说,智慧和好奇心是如此深深地缠绕在一起,几乎无法想象一个人在没有另一个人的情况下走得很远。然而,即使是迄今为止我们建立的最强大的机器大脑也必须在没有任何好奇心计算的情况下完成,并在指示时返回答案,在没有输入的情况下返回屏幕保护程序。

不喜欢现在才搞清楚这一点。一段时间以来,科学家们一直致力于各种方式让我们的硅胶朋友充满好奇心,但他们的努力总是远远低于我们与生俱来的好奇心所设定的基准。例如,一个重要的限制是,大多数好奇心算法无法确定某些事物是否有趣,因为与我们不同,它们无法评估机器存储的数据总和,以查看潜在的知识差距。相比之下,你可以非常自信地判断一本书是否有趣而不先阅读它。

通过封面评判书籍

但Todd Hester,一位目前在伦敦与Google DeepMind合作的计算机科学家,认为机器人实际上应该能够反对这种民间智慧。为此,他与德克萨斯大学奥斯汀分校的计算机科学家Peter Stone合作,创建了具有方差 - 新颖 - 内在 - 奖励/ TEXPLORE-VENIR算法的目标探索。

I他说,正在寻找方法让计算机更智能地学习,并以人类的方式进行探索。不要探索一切,不要随意探索,而是尝试做一些更聪明的事情。

他们这样做的方式是将TEXPLORE-VENIR建立在一种称为强化学习的技术上。它也是人类学习的主要方式之一,并且通过小幅增加来实现最终目标。基本上,有问题的机器或人类会尝试某些东西,如果结果更接近某个目标(例如清除扫雷中的所有电路板),它会收到奖励(对我们来说是多巴胺)以促进该行为或行为。未来。

强化学习对于我们来说,通过制作像吃的东西感觉良好,所以我们不会忘记吃东西,它适用于机器,也是强化学习,让DeepMind掌握ATARI游戏和Go,例如。但这是通过随机实验实现的,而且,该程序被指示学习游戏。另一方面,TEXPLORE-VENIR与我们大脑中的奖励回路类似,通过给予程序内部奖励来理解新事物,即使知识不能更接近最终目标。

图片来自Troy Straszheim /维基媒体。

当机器了解周围的世界时,TEXPLORE-VENIR会奖励它,以发现与探索新的森林斑块或寻找新的森林之前所看到的不同的新信息。执行某项任务的方法。但它也奖励机器减少不确定性,即更深入地了解它已经知道的事情。因此总的来说,该算法比以前的程序更接近于我们所理解的好奇心。

文章链接地址:http://www.dunc2403.com/jianshenyongpin/wudao/201909/1475.html

上一篇:联合国特使
下一篇:没有了

相关文章:

精心推荐

Copyright © 2019 六e彩票计划 Inc.

Top