谷歌人工智能研究部门 DeepMind 推出了一种新的自我改进人工智能模型 RoboCat。RoboCat 是一个大型模型,可以学习使用大量真实的机械臂来完成各种任务。它还可以自行生成新的训练数据以改进其技术。这使得 Deepmind 的模型在机器人领域向前迈出了重要一步,因为它有潜力被用来构建更多功能和适应性更强的机器人。
什么是机器猫?
在机器人技术的一项令人兴奋的发展中,研究人员创造了RoboCat,一种可以自我改进的人工智能代理。与只能执行特定任务的传统机器人不同,它可以使用不同的机械臂学习并执行许多不同的任务。RoboCat 的特别之处在于它可以制作自己的训练数据,这有助于它快速变得更好,而不需要人类来教它。这是创造可以做多种事情并轻松融入我们日常生活的机器人的重要一步。
快速学习
RoboCat 非常擅长学习,并且改变了我们对机器人的看法。它只需观看 100 个示例即可学习一项新任务。它可以在真实和假装的情况下通过使用文字、图像和动作来理解并做不同的事情。
它使用一种名为Gato的特殊模型来学习和执行许多不同的任务。它可以通过观看大量不同的示例来学习,这有助于研究人员更快地在机器人技术方面取得进展。这意味着机器人未来可以做更多令人兴奋的事情。
自我完善的过程
这个模型通过巧妙的自我完善过程不断变得越来越好。它首先从一个大数据集中学习,其中包括来自不同机器人手臂的图片和动作。
然后,它会承担以前从未见过的新任务,并通过五个重要步骤来变得更好:
- 观看示威活动
- 自我调整
- 创建更多训练数据
- 使用新的和自行生成的数据
- 训练一个新的和改进的版本
这个循环不断重复,每一次,RoboCat 都会变得更加熟练。
庞大且多样化的训练数据集
RoboCat能够做出令人难以置信的事情,因为它从大量的训练数据中学习。这些数据包括来自真实和模拟机器人手臂的数百万条不同路径和运动,甚至包括该模型自身生成的数据。
为了收集所有这些信息,研究人员使用了四种不同类型的机器人和许多机械臂。多样化的训练数据集使模型具有如此强的适应性和多功能性。它可以很好地处理不同的机械臂并解决非常困难的任务。
掌握新武器和复杂任务
RoboCat 可以做一些非常神奇的事情——它可以快速学习和使用不同类型的机械臂。即使手臂更复杂,比如具有三个手指和更多控件的手臂,它也可以在短短几个小时内弄清楚它们。通过仅观看 1000 次人类演示,该模型就变得非常擅长控制新手臂。
例如,它可以在 86% 的时间内成功换挡,这确实令人印象深刻!它也非常适合需要精确度和理解力的任务,例如从碗中选择正确的水果或解决形状匹配难题。
这表明 Deepmind 的模型可以应对需要大量控制的更艰巨的挑战。
自我完善的通才
RoboCat 总是变得越来越好,因为它可以自我学习。每次它学习一项新任务,它在未来的学习就会变得更好。当 RoboCat 第一次启动时,在观看了每项任务 500 次演示后,它只能在大约 36% 的时间内正确完成任务。
但现在,通过对不同任务进行更多训练,最新的 RoboCat 可以完成相同任务两倍以上!这表明机器猫可以快速学习和适应新的和不熟悉的情况。
结论
总之,RoboCat 的自我改进人工智能代理代表了通用机器人探索中的重大飞跃。通过结合不同的训练数据、从最小的演示中快速学习以及对不同机械臂的适应性,RoboCat 为机器人能够无缝融入我们生活的各个方面铺平了道路。凭借其良性学习循环,RoboCat 体现了人工智能和机器人技术的潜力,有望在未来让机器人成为我们日常工作中不可或缺的盟友。
原创文章,作者:网贝WebBay,如若转载,请注明出处:https://www.webbay.cn/meet-robocat-new-self-improving-ai-model-from-deepmind