特斯拉擎天柱机器人视频爆了端到端AI大

2025/6/6 来源：不详

北京白癜风医院网站 https://wapjbk.39.net/yiyuanzaixian/bjzkbdfyy/
编辑：桃子好困特斯拉人形机器人「擎天柱」最新视频公开，在端到端神经网络加持下，能够精准分类物体、找准身体平衡感，让众多网友惊呼将改变人类。

周末，特斯拉人形机器人「擎天柱」一波更新，引众多网友围观。

官方发布的一个视频中，「擎天柱」现在可以自主对对象进行排序。

这全凭背后的神经网络完成了端到端的训练，即「视频输入，控制输出」。

它现在能够自我精确操控手部，以及腿部的动作，更高效学习各种任务。

甚至，只利用视觉和关节位置编码器，就能够在空间中精确定位手的位置。

另外，它的神经网络完全在车载设备上运行，而且仅使用视觉能力。

在强大技术加持背后，使得「擎天柱」能够自动分类不同颜色的积木块。

即便是有人干扰，「擎天柱」也不畏惧，还在认真工作。它还有自主纠正的能力，积木倒了，拿起来再摆正。

不仅能分类积木，还能执行与之相反的动作，把积木再拿出来。

干了一天的活，再做个舒展运动。此时，「擎天柱」单腿直立，双臂伸展，有模有样。

最后双手合十「Namaste」。

看过视频的网友惊叹道，不到2年前，「擎天柱」还需要被推上舞台，而现在却能如此快速地完成表演！而且，这不是事先编好的戏法！它使用的是AGI，太神奇了！

还有网友调侃道，看看「擎天柱」那平衡感......已经在瑜伽上打败我了。

这是年10月，在AIDAY上，「擎天柱」原型被三个壮汉，抬上来和大家打招呼。

马斯克曾介绍，「擎天柱」与特斯拉FSD（全自动驾驶）构建的强大视觉系统能够共通，两者的底层模块已经打通。

在他看来，特斯拉一直以来都是一家AI公司，而不仅仅是汽车公司。

「很快，我们将会看到『擎天柱』的数量，将远远超过特斯拉汽车。」

如何实现？

在今年特斯拉的股东大会上，放出了5个「擎天柱」同时向前行进的视频。

相较于与去年首次亮相的「擎天柱」，已经完成了非常大的迭代升级。

再到这次，通过视觉，精细控制手部动作，更是加满了buff。

英伟达高级科学家JimFan对擎天柱进行了「逆向工程」，对其技术堆栈可能实现的方式进行了分析。

值得一提的是，JimFan的深度分析，甚至吸引到了马斯克的回关！

1.模仿学习

几乎可以肯定，Optimus流畅的手部动作，是基于对人类操作员的模仿学习（行为克隆）而训练出来的。

相比之下，如果采用在模拟中进行强化学习的方法，则会造成抖动的动作和不自然的手部姿势。

具体来说，有至少4种方法，可以用于收集人类的示范：

（1）定制远程操作系统：这是特斯拉团队最有可能采用的手段。

开源实例：ALOHA是斯坦福、UC伯克利和Meta开发的一种低成本的双机械臂和远程操作系统。它能实现非常精确、灵巧的动作，例如将AAA电池装入遥控器或操作隐形眼镜。

ALOHA项目