bg
  • 新智元
  • 2022年10月01日01时

    马斯克带「擎天柱」机器人亮相!不到2万美金,比特斯拉还便宜



    新智元报道

    编辑:编辑部
    【新智元导读】特斯拉AI日,马斯克自豪地推出「擎天柱2.0」。会比心的机器人,你见过没?

    特斯拉人形机器人终于来了!

    刚刚,第二届特斯拉AI日在加州正式开启。

    看完整场发布会的小编表示,这场发布会的确非常「硬核」。

    马斯克上台还没说几句话,直接把「擎天柱」请了出来。

    现场,观众一阵欢呼。

    还没有备好外壳的「擎天柱」一出场先是活动双手,然后缓缓移步到舞台中央。

    要知道,这可是它首次实现了独立行走。

    随后,「擎天柱」举起一只手臂,朝台下的观众打招呼。

    还举起双手开启了自嗨模式。

    马斯克称,「擎天柱」产量预计可以达到数百万台,要比汽车便宜得多,不到2万美金(142320元)即可拥有。

    马斯克现场为擎天柱站台

    但这都不重要,除了炫技,「擎天柱」长相暂时让大众失望了。

    擎天柱首亮相,只要不到2万美金


    还记得去年,马斯克首次亮相的Tesla Bot是这样子的。

    现场,研究人员称,初次亮相的只是一款概念机,到今年AI日已经实现了第二次迭代,实物图也与概念图进一步贴近。

    并且,现场三个壮汉还将最接近生产的「擎天柱」搬了出来。

    不得不说马院士的团队还是很拼的,马院士也特别向手下的工程团队表示了感谢。

    这个机器人能干点啥?不仅可以浇花、搬运生产线上的零配件

    还随便能帮你拿个快递。

    接下来就进入正题环节了,「擎天柱」能够完成这一系列动作背后都有哪些技术加持?

    经过两次大版本改进,现在的人形擎天柱已经可以说是名副其实了,身高173,净重73公斤,与一个成年男子相仿。

    功耗控制方面,静坐状态100W,快速行进状态为500W。全身自由度高达200以上,光是手部自由度就高达27。

    最新一代机器人(图示)身体整体构造中,橙色是执行器/执行单元,蓝色是电驱动系统/计算单元,配备2.3kWh电池组,搭载28个结构执行器,以及自由度高达11的手。

    机器人大脑运行在特斯拉SoC上,带有WiFi通信、音频、安全保护功能。

    据介绍,擎天柱架构基础便是应用了大量特斯拉汽车的工程思想和开发逻辑。

    比如,根据汽车撞击试验,模拟机器人的摔倒场景,以保护「大脑」中央计算平台。说不定以后也会有机器人的碰撞试验了...

    另外,通过对特斯拉汽车和机器人的动力系统对比,机器人会显得更加的复杂。

    从下面的红色组件的密度上就能看出,机器人的动力系统能够实现比特斯拉自动驾驶车更丰富的功能。

    而在执行器单元的设计方面,特斯拉团队也想出了6种独特的结构设计方案,应对不同的载荷需求,同时尽可能实现轻量化。

    在执行器的具体配置上,针对不同载荷和运动精细程度的要求,采用了不同的内部结构和轴承装备方案。

    比如左侧的交叉滚子轴承,右侧的四点接触轴承和球轴承等。

    刚刚提到,特斯拉机器人一共有28个关节,每一个关节里面都有多套执行器,这些执行器都会在后台去分析它的执行效率,减少无效的工作。

    更重要的是,这些执行器可以在高压的情况下实现线性拉伸,比如都能提起一架近半吨的钢琴。

    既然是「类人机器人」,如何让机器人的动作更像人类?答案是重建「关节」。

    特斯拉的人形机器人的执行器,是从人体骨骼的运动轨迹上得到的灵感,以实现自由行走、蹲下、拿东西等涉及多个自由度的高难度动作。

    可以看到,在各个方向上,特斯拉的人形机器人是可以自由活动的。

    再来看特斯拉机器人之手,要知道,这也是本次AI日「比心」的预告之手。

    它拥有6个执行器,11个自由度,支持自适应抓取,可抓起20磅重量,特别适用于精密小零件的抓取。

    在软硬件配置上,特斯拉汽车和机器人采用了同款视觉感知。Tesla Bot 的导航系统就是一个很有意思的3D路径导航。

    开发人员强调,特斯拉机器人的AI技术跟FSD是同源的!

    也就是说它会自己识别环境,自己找到需要的东西,并自己做要做的事。

    特斯拉机器人还支持室内路径规划,不仅会走路,还会像人一样走路,还能通过视觉识别判断物体。

    而讲到机器人走路,特斯拉工程师还特意带我们回顾了一下擎天柱走路的「进化史」。

    从今年4月迈出第一步,到7月解锁Pelvis,到8月手臂实现摆动,再到今天,终于实现了脚趾离地的行走。

    这几个月的飞速进步,背后凝聚的技术内核可不像走路看上去那么简单。

    它涉及到物理自我感知、高能效步法训练、平衡、协调动作等多个阶段的设计。

    为此,特斯拉设计规划了「运动方案」系统,由实际期望的运动路径出发,经由运动规划器(Locomotion Planner)生成参照投影,生成机器人的步伐运动方案。

    在参考投影的指引下,机器人按照运动规划器的步伐方案行进。

    运动模拟图就像下面这样,如果真实世界中也能走的这么稳就好了。

    实际上,在真实世界中,环境复杂、背景丰富,远不可能像理论模拟的理想环境这么简单。

    一个不留神就是双脚离地,分分钟失稳摔个「狗啃泥」。

    对于机器人如何搬东西这一过程,研究人员称,先让人示范这一动作,并进行动捕后,让机器人在孪生世界中去训练。

    到这里擎天柱的主场基本结束了。

    特斯拉研究人员称,未来几个月,我们努力让机器人变得更加灵活,实现更好的平衡控制,以及导航,希望让擎天柱进一步扩展,来帮助我们处理更多事情。

    虽是难看了点,但确实,开启了一个时代。

    FSD全自动驾驶:16万人用了都说好

    Tesla FSD Beta现在拥有160,000名客户,而在2021年只有2000名客户。
    特斯拉预计将在AI Day之后发布v.10.69.2.3,不过没有公布确切的日期。
    在过去一年里,特斯拉的自动驾驶团队训练了75,000多个模型,相当于每8分钟就训练一个模型。
    而在这7万多个模型中,团队一共工程化了281个模型!

    总体规划

    面对现实中复杂的路况,特斯拉需要每50毫秒就做出一个决策。
    为此团队开发了一个「交互式搜索」框架,来进行最优化选择。
    如此一来,每个动作的用时可以从传统方法的125毫秒被降至差不多100微秒。

    占道避让识别

    为了给汽车周围的三维世界建模,特斯拉团队建立了这个网络是特斯拉团队的解决方案,它目前没有显示在我们面向客户的可视化中,我们在这里看到的是我们内部的dab工具输出的道路网络。
    FSD可以实时计算行车路线两侧环境和潜在碰撞目标,对于危险目标自动成像,10毫秒内完成计算。
    使用体积渲染技术,进行3D深度重建模。深度计算模型采用大型自动标注数据集进行训练。

    摄像头和目标识别

    摄像头成像是自动驾驶技术的重要技术基础,即使是有了激光雷达,摄像头在自动驾驶中仍是不可替代的。
    特斯拉FSD寻路神经网络的可视化部分,使用主摄像头、左摄像头和后摄像头的三组信号作为输入,经过Transformer等神经网络处理,与地图信息一起作为寻路导航信号的输出,再经过语言模块的解码转换,实现自动选择行车路线。
    根据向量空间的编码,可以产生不同的「行车线路语言」,指导车辆行驶。
    比如遇见闯红灯的车辆怎么办,前方遇见路障怎么办。
    车内FSD网络参数数量约为10亿,组成一个15w层以上的神经网络,连接数量更是高达37.5w以上。

    自动标注

    之前,特斯拉的自动驾驶团队依靠人工数据注释来识别和描述特斯拉汽车上的摄像头和传感器所拍摄的短视频片段中的物体。
    这些标记的片段用于训练特斯拉的神经网络,并改进驾驶辅助系统,使特斯拉汽车能够在驾驶者的监督下绕行,自动避开障碍。
    现在,特斯拉已经开发出了自动标注技术,每天可以搞定50万个片段。
    虽然可能还需要人类来最后敲定,但至少不用从0开始了。
    解决自动3D标注大体上分为三步。
    第一步:高精度的路径投影。标记出地图上的点、线、面。
    第二步则是根据前期的投射标记,进行多路线的模型重建。
    之后是最后一步,对这些新的路线进行自动标注。
    基于此,特斯拉可以改善不同环境情况下的决策,如夜晚、雾和雨。

    现实模拟

    现在,有超过100万辆装有摄像头的车辆在路上行驶,并有一个建立在虚幻引擎中的模拟器,用来改进自动驾驶。
    至少从放出的效果来看,真实感拉满!
    Dojo超算:每秒千万亿次,2023到来
    特斯拉与 Dojo 的目标是建立一个单一的加速器。
    实现其目标的一个关键步骤是它的训练图块,它在 2021 年 AI 日期间推出。
    特斯拉一直试图弄清楚如何使其 Dojo 设计具有可扩展性,并在此过程中遇到了挑战。
    Dojo的出现主要目的之一便是,比市售云计算能力更强大。它的设计之初就考虑了硬件层面要为深度神经网络训练作考虑。
    Dojo超算结构关键组件,首先就包括「D1芯片」,提供AI算力362TFLOPs。
    接口处理器提供内存宽带和通讯接口,PCIE板卡形式。单片可提供800GB/S的带宽,用于训练。单片32GB DRAM、900TB/s高速通讯协议。
    通过6颗D1芯片组合,再加20个接口处理器,组成一个托盘,再由多个托盘组成一个机柜Dojo Cabinet。
    最终将发展成为一个完整的Dojo集群或 「ExaPod」。
    Dojo ExaPod,包含1.3TB的高速SRAM和13TB的高带宽DRAM,将打破计算量的ExaFlop障碍。
    每个Dojo ExaPod集成了120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到 1.1 EFLOP*(每秒千万亿次浮点运算)。
    另外,特斯拉还首次展示了DOJO超级计算机。
    在特斯拉自研芯片的加持下,只需四个Dojo机柜就能取代由4000个GPU组成的72个GPU机架。
    简单来说就是,Dojo把以前需要数月的工作,减少到了一周。
    此外,Dojo的整体集成度比英伟达A100主机也要高很多,一个「Dojo 砖」可以顶多个主机,但成本却比一个还低。
    到时,性能最高将是A100的4.4倍。
    特斯拉在介绍Dojo的时候还放了一个小彩蛋:训练Stable Diffusion生成了几张「火星上的Cybertruck」。
    最后,特斯拉计划在2023年之前建造它的第一个Exapod(1/7),预计将可以极大地提高自动标注的产量 。
    系统构建成功后,Dojo超级计算机预计将成为世界上最强大的超级计算机之一。
    不知到时候,全球超算排名中,Dojo能排到第几?
    参考资料:
    https://www.youtube.com/watch?v=ODSJsviD_SU