特斯拉和他的Dojo超算、Tesla Bot
比既定时间延迟半小时以上开始,已经是特斯拉开发布会的“传统”了。那么,随性如特斯拉,其AI技术进展“靠谱”吗?
在特斯拉AI Day上,特斯拉CEO Elon Musk、AI部门总监Andrej Karpath等均现身会场,在发布自研AI训练芯片D1、AI超级计算机Dojo ExaPod之外,也把纯视觉感知实现自动驾驶这件事讲清楚了。发布会结束前马斯克还放出了一个彩蛋,特斯拉不仅造车,还要造“机器人”,该产品最快明年就会推出。
自研芯片D1,组成最强算力计算机Dojo
在AI Day上,最重磅的莫过于特斯拉发布了训练自动驾驶的超级计算机Dojo。
特斯拉Dojo项目负责人Ganesh Venkataramanan介绍说,几年前,马斯克说:要有一个超快的计算机来训练Autopilot在内的整个自动驾驶系统。于是,Dojo诞生了。
据悉,Dojo 是一种通过网络结构连接的分布式计算架构。它具有大型计算平面、极高带宽和低延迟的特点,并可通过一个新编译器来减少局部通信和全局通信,可扩展性极强。实际上,在CVPR 2021现场,特斯拉就已经剧透过Dojo的相关性能。当时采用英伟达的A100 GPU,总算力达1.8EFLOPS,读写速度高达1.6TBps,一度被认为创造了新超算纪录。而现在,Dojo更进一步,启用了自研的AI训练芯片D1。
文章插图
D1芯片,图片来源:特斯拉
据介绍,D1芯片采用分布式结构和7nm工艺,单片FP32达到22.6 TOPs算力,BF16算力362 TOPs。它可实现50万个训练节点无缝连接,变成超大规模计算阵列。之前预热海报上的“神秘物种”,就是集合了25个D1芯片的训练模块。该模块算力达 9 PFLOPS(9千万亿次),接口带宽每秒36TB。
而得益于训练模块的独立运行能力和无限链接能力,由其组成的Dojo超级计算机的性能拓展在理论上无上限。此次特斯拉就带来了集成了120个训练模块、3000颗D1芯片、超过100万个训练节点、BF16/CFP8算力高达1.1EFLOPS的机柜模型ExaPOD。其每单位能耗下的性能比当今最强超算高1.3倍,但碳排放仅为1/5。Ganesh指出,这是全球最快的AI训练计算机。
文章插图
机柜模型ExaPOD,图片来源:特斯拉
【 特斯拉和他的Dojo超算、Tesla Bot】事实上,AutoPilot、FSD,特斯拉的其他AI训练任务,都能在Dojo里更高效练就。另外,特斯拉官方还继续剧透:这不是终点,下一代Dojo还会有10倍性能的提升!
完善神经网络架构,为纯视觉方案而生
有了Dojo强大的算力支持,就势必能推动自动驾驶的发展吗?不!自动驾驶是个系统工程。
此前Autopilot功能下特斯拉时有事故发生,一度使特斯拉深陷安全信任危机。特斯拉AI技术主管Andrej Karpathy也在现场承认,过去的FSD并不完善。其车身搭载的8个摄像头虽然能够检测到目标,但也存在着多摄像头物体难以拼接、空间数据输出质量不高等问题。为此,特斯拉开发了“矢量空间”技术,重新设计了多任务学习HydraNets神经网络架构。
文章插图
4D空间和时间标签的“路网”,图片来源:特斯拉
据了解,此次特斯拉在相机校准、缓存、队列和优化等环节都做了最大程度的简化,兼具非凸优化算法、高维度两大优势,可同时处理目标检测、交通标志识别、车道预测等任务,还可实现了驶过程中车道线实时建模能力,形成4D空间和时间标签的“路网”。Karpathy表示,这些策略能够使得汽车摆脱对高精地图的依赖性,也将最终帮助特斯拉建立纯视觉模型。
而在感知端收集到海量、精准的数据后,人工标注显然难以应对,所以只有自动化标注,才能形成数据闭环。特斯拉目前已组建了上千人的数据标注团队,在人工标注和更高效率自动标注的配合下,可实现所有摄像头多帧画面的标注。同时,特斯拉还开发了“仿真场景技术”,以提供不同环境以及其他参数(障碍物、碰撞、舒适度等),提升训练效率。
- 荣耀|今年过节不乱跑,荣耀智慧屏1499起,和年夜饭一样真香
- 普莉希拉|祖籍徐州的普莉希拉,嫁全球第5富豪扎克伯格,坐拥6530亿被说丑
- 分成|YY直播:2021年公会和主播分成超50亿
- CPU|E5系列处理器——工作室和生产力专业处理器,小白请勿购买
- 一嗨租车|倪光南最辉煌的时光是不是和柳传志的那段“蜜月期”?
- Linux|电脑城卖的CPU是intel而不是AMD,和实体店不喜欢卖小米手机是一个道理
- 文和友|泡泡玛特与飞书达成合作 新消费代表企业加速迁移飞书
- 芯片|据称索尼和台积电计划在日本投资70亿美元建芯片工厂
- |电脑界有两种说法“高U低显”和“低U高显”,你们觉得哪个合理?
- 体验首款Linux消费级平板,原来芯片和系统全是国产