当前位置:首页 > ng28南宫娱乐官网正版
人形机器人的世界如此热闹,端到端自主执行任务的人形机器人和其它人形机器人开始分道扬镳,在国内中科院自动化所研发的人形机器人大工厂已经诞生了Q家族人形机器人,分别适应和用于不相同的领域。而现在这个人形机器人18年磨一剑,也终于诞生了。
浙江人形机器人创新中心,这支在人形机器人领域积累了18年的团队,发布了他们的最新作品——通用人形机器人领航者1号,它能适应多种地形步行和避障,而且无需过于依赖大模型,就能端到端伺服控制,适应本地化的应用。
据了解,浙江大学是该团队的核心成员的母校。他们曾在2006年研制出小型人形足球机器人,实现了多机协作踢足球,连续十多年获得全国冠军,甚至四次获得RoboCup机器人世界杯仿人组亚军。
期间,他们也在2008-2011年间研发出自动打乒乓球的仿人机器人,实现了145个回合的人机对打。团队甚至开始深入研究新一代室内外快速鲁棒行走机器人,使其能适应多种地形、推力扰动、动态避障等。在2023年10月的北京测试中,他们成了唯一一个能够在室外不断通过多种地形并跨越障碍的团队。
领航者1号在浙江大学人形机器人悟空 4.0的基础上,团队进行了全新迭代,研制出了第一款商业化产品。他的创新性在于将机理控制、模拟学习和强化学习融为一体。
据了解领航者1号身高150cm,体重50kg的领航者1号拥有39个自由度,单臂最大负载达到4kg。他搭载了4个彩色相机、2个RGBD相机和2个IMU,边缘算力高达275 TOPs。
领航者1号的机器人整机系统是完全自主研发。在硬件方面,团队自主研发了新型行星减速器、轻型化仿人机械臂和多自由度的灵巧手,其中的灵巧手有15个手指关节与6个主动自由度,单手重量只有600g,关节速度能达到150度/秒。
在算法方面,领航者1号做了多方面的技术突破。他采用了模拟学习与非线性运动控制融合的方式,能快速地学习人的动作,并可泛化,赋予了机器人类似人类的学习动作能力。
与Figure 01、Sara 、Apollo等接入大模型的人形机器人不同,
什么无模型的端到端的伺服控制?无模型的端到端伺服控制方式通常涉及到强化学习(Reinforcement Learning,简称RL)技术。强化学习的目标是让系统(例如机器人或其他自动化系统)通过个人的实验来学习最优的行为策略,而不依赖于基于规则的控制方法。
在传统的伺服控制管理系统中,经常需要对系统来进行精确的建模,然后根据模型设计控制器。然而,在无模型的端到端伺服控制中,通常不通过先验建立系统模型。取而代之的是,系统直接利用传感器数据作为输入,而执行的动作或控制信号作为输出,利用试错的方式来寻找策略,以此来实现目标。这种办法能够适用于机器人臂的控制、无人机的飞行控制等多种场景。
具体来说,这种方法利用端到端的学习框架:系统从原始的传感器数据(例如摄像头图像、位置传感器数据等)直接产生控制输出。利用深度学习和其他机器学习算法,系统通过与环境的交互来学习控制策略,而无需对系统的动态行为有深入的了解。
例如,一个无模型的端到端的伺服控制管理系统可能会通过观察机器人臂的移动和相应的结果来学习怎么样精确地抓取和搬运对象。通过这一种方式,系统可以自主地适应复杂的、未知的或者变化的环境,而不需要开发者提供详细的指令或编程。完整的学习过程完全依赖于收集到的数据和系统对这一些数据的反馈。
值得注意的是,这种方法的一个关键优势是其通用性和适应性。它不局限于特定的控制任务,且能够更好地处理实际环境中的不确定性和变化。然而,它在大多数情况下要大量的数据和计算资源来训练有效的控制策略。此外,安全性和鲁棒性也是在实际部署过程中一定要考虑的因素。
因而,可以动态适应环境操作,摆脱对云端算力的依赖,使算法的本地部署更方便快捷。团队的部分算法已在一些头部工业公司中得到应用,与创新中心与中国电子科技集团有限公司、中控技术股份有限公司等9家单位共同签署了战略合作框架协议。
在全身运动控制上,领航者1号也有所尝试,他采用了机理建模与强化学习相结合的方式,以保证对不同环境的适应和操作的可靠性,已经初步实现了全身运动控制。
国内外人形机器人进入迸发阶段,从概念到发布和应用的时间正在缩短,在国内“闷声落地”,诞生了像 领航者1号、Q族、WalkerS等人形机器人,未来我们可能要习惯每个月或者更短的时间里诞生一批人形机器人。