特斯拉擎天柱机器人视频爆了端到端AI大
2025/6/6 来源:不详北京白癜风医院网站 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/编辑:桃子好困特斯拉人形机器人「擎天柱」最新视频公开,在端到端神经网络加持下,能够精准分类物体、找准身体平衡感,让众多网友惊呼将改变人类。
周末,特斯拉人形机器人「擎天柱」一波更新,引众多网友围观。
官方发布的一个视频中,「擎天柱」现在可以自主对对象进行排序。
这全凭背后的神经网络完成了端到端的训练,即「视频输入,控制输出」。
它现在能够自我精确操控手部,以及腿部的动作,更高效学习各种任务。
甚至,只利用视觉和关节位置编码器,就能够在空间中精确定位手的位置。
另外,它的神经网络完全在车载设备上运行,而且仅使用视觉能力。
在强大技术加持背后,使得「擎天柱」能够自动分类不同颜色的积木块。
即便是有人干扰,「擎天柱」也不畏惧,还在认真工作。它还有自主纠正的能力,积木倒了,拿起来再摆正。
不仅能分类积木,还能执行与之相反的动作,把积木再拿出来。
干了一天的活,再做个舒展运动。此时,「擎天柱」单腿直立,双臂伸展,有模有样。
最后双手合十「Namaste」。
看过视频的网友惊叹道,不到2年前,「擎天柱」还需要被推上舞台,而现在却能如此快速地完成表演!而且,这不是事先编好的戏法!它使用的是AGI,太神奇了!
还有网友调侃道,看看「擎天柱」那平衡感......已经在瑜伽上打败我了。
这是年10月,在AIDAY上,「擎天柱」原型被三个壮汉,抬上来和大家打招呼。
马斯克曾介绍,「擎天柱」与特斯拉FSD(全自动驾驶)构建的强大视觉系统能够共通,两者的底层模块已经打通。
在他看来,特斯拉一直以来都是一家AI公司,而不仅仅是汽车公司。
「很快,我们将会看到『擎天柱』的数量,将远远超过特斯拉汽车。」
如何实现?
在今年特斯拉的股东大会上,放出了5个「擎天柱」同时向前行进的视频。
相较于与去年首次亮相的「擎天柱」,已经完成了非常大的迭代升级。
再到这次,通过视觉,精细控制手部动作,更是加满了buff。
英伟达高级科学家JimFan对擎天柱进行了「逆向工程」,对其技术堆栈可能实现的方式进行了分析。
值得一提的是,JimFan的深度分析,甚至吸引到了马斯克的回关!1.模仿学习
几乎可以肯定,Optimus流畅的手部动作,是基于对人类操作员的模仿学习(行为克隆)而训练出来的。
相比之下,如果采用在模拟中进行强化学习的方法,则会造成抖动的动作和不自然的手部姿势。
具体来说,有至少4种方法,可以用于收集人类的示范:
(1)定制远程操作系统:这是特斯拉团队最有可能采用的手段。
开源实例:ALOHA是斯坦福、UC伯克利和Meta开发的一种低成本的双机械臂和远程操作系统。它能实现非常精确、灵巧的动作,例如将AAA电池装入遥控器或操作隐形眼镜。
ALOHA项目