-
优步研究实验室负责人开发新的人工智能算法
- 时间:2024-03-02 来源:ku游官网 人气:
本文摘要:一种新型的机器学习算法刚掌控了一些已被证明是人工智能的困惑的重返视频游戏。接下来的人将不会告诉人工智能算法在古老,高雅的策略游戏Go中打败了世界顶级人类玩家,这是最难以想象的游戏之一。但是,来自8位电脑游戏时代的两个像素化经典作品-蒙特祖玛的报仇和陷阱早已妨碍了AI研究人员。 这种看起来对立的原因是有道理的。蒙特苏马的报仇和陷阱虽然看起来非常简单,但看起来非常简单!通过增强自学早已不不受掌控,这种技术本来擅长于自学吞并视频游戏。
一种新型的机器学习算法刚掌控了一些已被证明是人工智能的困惑的重返视频游戏。接下来的人将不会告诉人工智能算法在古老,高雅的策略游戏Go中打败了世界顶级人类玩家,这是最难以想象的游戏之一。但是,来自8位电脑游戏时代的两个像素化经典作品-蒙特祖玛的报仇和陷阱早已妨碍了AI研究人员。
这种看起来对立的原因是有道理的。蒙特苏马的报仇和陷阱虽然看起来非常简单,但看起来非常简单!通过增强自学早已不不受掌控,这种技术本来擅长于自学吞并视频游戏。DeepMind是Alphabet的子公司,专心于人工智能,值得一提的是地用它来研发需要自学如何在专家级别上玩游戏几个经典视频游戏的算法。增强自学算法与大多数游戏很好地融合,因为他们根据大力的对系统调整他们的不道德-分数下降。
该方法的顺利使人们产生了期望,AI算法可以教会自己做到各种简单的东西,这些东西目前对机器来说是不有可能的。蒙特祖玛的报仇和陷阱的问题!是没可信的奖励信号。
两个标题都牵涉到典型场景:主角探寻充满著可怕生物和陷阱的块状世界。但是在每种情况下,许多在游戏中行进所必须的不道德都急于提升分数,直到很幸以后。
普通的增强自学算法一般来说无法挣脱蒙特祖玛的报仇和陷阱中的第一个房间!他们分数正好为零。这些新的算法来自优步在旧金山的人工智能研究团队,由JeffClune领导,他也是怀俄明大学的副教授。
该团队在一个环境中展出了一种显然有所不同的机器学习方法,该环境完全没获取表明算法的线索。这种方法引向了一些有意思的实际应用于,Clune和他的团队在今天公布的博客文章中写到-例如,在机器人自学中。这是因为未来的机器人必须弄清楚在简单的环境中应当做到些什么并且只获取一些稠密的奖励。
本文关键词:ku游官网,优步,研究,实验室,负责人,开发,新的,一种
本文来源:ku游官网-www.tjysygb.com
相关文章
-
美国宇航局火星探测器找到火星表面不存在数十个通向表面下方的洞口,火星勘测轨道探测器0.5米级照相机的图像表明,它们有可能包含了一个极大的地下...2024-03-01 12.03.01
-
据日媒报导,日本横跨党派议员联盟大家一起祭拜靖国神社国会议员不会20日上午集体祭拜了正在举办秋季例会大祭的靖国神社(东京都九段北)。日本议员集...2024-03-01 12.03.01
-
11月28日电 据外媒报导,在美国密苏里州陪审团要求不控告射杀黑人青年的白人警员之后,美国各地的大规模示威活动持续了两天。当地时间27日,弗格森镇...2024-02-29 12.02.01
-
人民网11月11日讯 据美国《侨报》援引《华尔街日报》报导,美国国会于是以打算通过法律,容许联邦政府注销相当严重欠税的公民的护照。根据国会参、...2024-02-29 12.02.01
-
伊拉克政府军与极端的组织“伊拉克和黎凡特伊斯兰国”(全称“伊黎”)18日之后在多地进行争夺战。伊仅次于炼油厂18日清晨遭到“伊黎”武装人员围困,...2024-02-28 12.02.02