您当前的位置:首页 > 生活百科 > 汽车

大模型上车,特斯拉带了个好头吗?

时间:2023-10-11 11:56:47  来源:界面新闻  作者:
1989年,卡内基梅隆大学接到了美国军方的一个研究课题,内容是当时看起来不可思议的自动驾驶。

为此,研究人员给一辆翻新的军用急救车,装上了一个看起来像探照灯的硕大摄像头,还配备了一台冰箱大小的处理器和一部5000W的发电机。

尽管设备简陋、数据粗糙,比如据媒体报道当时车顶的摄像头只能输入30×32像素网格,但借助开创性的神经网络,这辆名为ALVINN的自动驾驶汽车最高速度能达到88km/h。

ALVINN被誉为自动驾驶领域一个里程碑项目。其最深刻的影响,正是用神经网络替代人工代码,成为后来自动驾驶技术发展的一座灯塔。

此后数十年,自动驾驶技术沿着ALVINN的方向飞速发展,直到ChatGPT问世,大模型走上舞台,成为改变自动驾驶最大的一个变量。

在车端,大模型已经作用于自动驾驶的感知和预测环节,正在向决策层渗透;在云端,大模型为L3及以上自动驾驶落地铺平了道路;甚至,大模型还将加速城市NOA落地。

而全球的下游企业中,特斯拉毫无疑问是跑在最前面的少数。

今年8月特斯拉端到端AI自动驾驶系统FSD Beta V12版本的公开亮相,据称可以完全依靠车载摄像头和神经网络,识别道路和交通情况并做出相应的决策。

这种端到端模型的感知决策一体化,让自动驾驶直接从一端输入图像数据,一端输出操作控制,更接近人类的真实驾驶。

但车企们努力接近端到端模型时才发现,想要超越必须先跟随。

让大模型上车,特斯拉绝对是最激进的一个。

早在2015年,特斯拉就开始布局自动驾驶软硬件自研,2016-2019年陆续实现了算法和芯片自研。随后在2020年,特斯拉自动驾驶又迎来大规模升级:

不仅用FSD Beta替换了Mobileye的Autopilot 3.0,还将算法由原来的2D+CNN升级为BEV+Transform。

Transformer就是GPT中的T,是一种深度学习神经网络,优势是可实现全局理解的特征提取,增强模型稳定性和泛化能力。

BEV全称是Bird’s Eye View(鸟瞰视角),是一种将三维环境信息投影到二维平面的方法,以俯视视角展示环境当中的物体和地形。

与传统小模型相比,BEV+Transformer对智能驾驶的感知和泛化能力进行了提升,有助于缓解智能驾驶的长尾问题:

1)感知能力:BEV统一视角,将激光雷达、雷达和相机等多模态数据融合至同一平面上,可以提供全局视角并消除数据之间的遮挡和重叠问题,提高物体检测和跟踪的精度 ;

2)泛化能力:Transformer模型通过自注意力机制,可实现全局理解的特征提取,有利于寻找事物本身的内在关系,使智能驾驶学会总结归纳而不是机械式学习。

2022年特斯拉又在算法中引入时序网络,并将BEV升级为占用网络(Occupanc.NETwork),有效解决了从三维到二维过程中的信息损失问题。

从感知算法的推进来看,行业总体2022年及之前的的商业化应用主要为2D+CNN算法。随着ChatGPT等AI大模型的兴起,算法已经升级至BEV+Transformer。

时间上特斯拉有领先优势(2020年),国内小鹏、华为、理想等均是今年才切换至BEV+Transformer。

但不论是特斯拉还是国内主机厂,BEV+Transformer都仍只应用于感知端。

虽然学术界以最终规划为目标,提出感知决策一体化的智能驾驶通用大模型UniAD+全栈Transformer模型,不过受限于算法复杂性+大算力要求,目标落地尚无准确时间表。

2016年,因辅助驾驶致死事故和Mobileye分道扬镳的特斯拉,找到英伟达定制了算力为24TOPS的计算平台 Drive PX2,由此开启了车企疯狂追求算力的神奇序幕。

继Drive PX2之后,英伟达在6年时间内发布了三代智能驾驶芯片,从Xavier、Orin再到Thor,算力从30TOPS一跃升到2000TOPS,足足增长了83倍,比摩尔定律还要快。

上游如此“丧心病狂”的堆算力,归根结底还是因为下游有人买单。

一方面,随着智能汽车上的传感器规格和数量提升,带来数据层面的暴涨。

以特斯拉Model Y(配置|询价)和小鹏 G6(配置|询价) Max为例,后者因配置了更多传感器,所需算力达到了前者的3.5倍。

当一辆自动驾驶车辆每天可以产生数TB,甚至数十TB数据,数据处理能力即为自动驾驶技术验证的关键点之一。

另一方面,“大模型化”也让智能驾驶算法的芯片算力愈发吃紧。

上汽人工智能实验室曾测试,实现L2级自动驾驶只需10Tops以下的算力,即便是实现L4级自动驾驶也只需100Tops左右的算力。而下游企业暴涨的算力需求,实际也另有原因。

一个是云端算力。

自动驾驶系统前期和后期开发依赖大量环境数据输入,对算法进行训练与验证,同时仿真测试中场景搭建与渲染也需要高算力支持。

而且特斯拉引领的神经网络Transformer又是一个资源消耗大户,毫末智行数据显示,Transformer在训练端所需算力是CNN的100倍。

如此一来,下游企业想要获得算力要么自建智算中心(特斯拉),要么与云服务商合作,最不济的全部外采,包括算法、计算资源、应用服务等。

国内主流主机厂/自动驾驶厂商的智算中心虽然都已上线,但因自建成本较高,国内主流自动驾驶厂商大多采取合作模式/采购模式,比如吉利星睿、小鹏扶摇都是阿里云,毫末和理想则是火山引擎。但从长期成本优势来看,仍具备较高的自建倾向。

还有一个则是NOA。

现实中主机厂具备城市NOA高阶智能驾驶功能的车型,算力大多在200-500TOPS左右。

但NOA从高速道路向城市道路拓展(高速道路-城市快速路-城市主干道-城市次干道-城市支路)的过程中,人流越密集(每天仅25%的人出行途径高速,而城市道路则是100%)的道路环境复杂度更高,物体识别、感知融合和系统决策的算力需求就越高。

沐曦首席产品官孙国梁就指出,在车端部署大模型并能实现既定任务,算力至少要达到300~500TOPS。模型优化或可降低算力要求,但考虑到未来场景复杂度和数据量增加,以及视觉感知占比增加(相对基于规则),车端算力或将翻倍达800TOPS以上。

光大证券有一个判断,认为L2/L2+级向L3级高阶智能驾驶迈进的三大要素重要性排序分别是数据>算法>硬件,而后阶段向更高阶智能驾驶迈进的排序或为硬件>=算法>数据。

理论依据在于,实现L3级智能驾驶的关键在于全面感知,主要依赖海量+长尾场景数据驱动算法升级优化;其中,无图场景覆盖还需低线城市数据(vs。当前车载算力已基本满足L3-L4级需求)。

而当前阶段,海量+长尾场景数据的获取就要依靠车载传感器(摄像头)的大幅升级。

根据Yole报告,自动驾驶L1-L3所需的摄像头数量翻倍增长,比如L1-L2级仅需前后两颗摄像头,到L3就要20颗。

而实际上,主机厂为后续OTA升级预留冗余,单车摄像头配置远超本级所需的摄像头数量,如特斯拉Model 3(配置|询价)搭载9颗,蔚来、小鹏、理想车型达到10-13颗。

此外,因大模型对感知数据的精细化要求,高分辨率图像数据可以作为深度学习模型中更新和优化其架构的参数的数据源,尤其是前视摄像头,需要解决的场景最多,目标识别任务最复杂,比如远距离小目标识别、近距离目标切入识别。

为了对更远距离的目标进行识别和监测,车载摄像头就要向800万像素或更高升级。典型如百度Apollo,就已联合索尼、联创与黑芝麻智能,全球首创了超1500万高像素车载摄像头模组。

而在提高感知能力这件事上,还有两个所有车企都想绕开的坎,高精地图和激光雷达。

高精度地图作为先验信息,可以给自动驾驶提供大量的安全冗余,在数据和算法尚未成熟之前,主机厂依赖程度较高。而脱图的原因也比较好理解:

1)高精地图存在更新周期长、成本高、图商资格收紧等弊端,限制了高阶自动驾驶大规模商业化的可能性。

2)构建数据闭环,形成对算法模型的迭代升级反哺车端。

至于如何脱图,特斯拉的办法是引入车道线网络及新的数据标注方法,国内自动驾驶头部公司则采取车端实时建图方案,通过安装在车辆上的相机等传感器来构建车辆行驶过程中周围的环境地图。

目前小鹏、华为等头部主机厂发布无高精地图的高阶智能驾驶方案,并定下量产时间表,华为、毫末、元戎启行等自动驾驶公司也加入其中,自动驾驶算法“重感知,轻地图”趋势明确。

激光雷达则是因为成本问题。

激光雷达在距离和空间信息方面具有精度优势,搭载激光雷达的多传感器融合感知方案可通过互补达到全环境感知能力,为高级别自动驾驶提供安全冗余。

但激光雷达也的确是成本大户,早些年除了特斯拉,几乎所有成熟的无人驾驶技术方案都采用了64位激光雷达,它的成本约人民币70万元,一个小雷达抵得上一辆车甚至几辆车。

特斯拉利用占用网络来实现类似激光雷达的感知效果,国内主机厂由于机器视觉算法的缺失,预计仍将激光雷达作为重要的补充传感器,由此可减少在视觉领域所需积累的数据量。

另外4D成像毫米波雷达或将完全替代3D毫米波雷达,有望对低线激光雷达形成替代。

与激光雷达相比,4D成像毫米波雷达部分指标近似达到16线激光雷达性能,但成本仅为激光雷达十分之一。

特斯拉基于全新的自动驾驶硬件HW4.0,首次在S/X的车型上搭载了4D毫米波雷达。除特斯拉外,价格在40万元以下的理想车型和价格在70万以上的宝马车型、以及通用收购的Cruise自动驾驶服务车均于近两年完成了4D毫米波雷达布局。同时大陆、采埃孚等汽车Tier-1巨头基本完成对该领域的布局。

8月,马斯克亲自上线开启了一场FSD Beta V12的试驾直播,45分钟内FSD Beta V12系统在行驶全程进展非常顺利,能够轻松绕过障碍物,识别道路各种标志。

马斯克激动地表示:

V12系统从头到尾都是通过AI实现。我们没有编程,没有程序员写一行代码来识别道路、行人等,全部交给了神经网络。

而这一切是建立在巨量的‘视频数据’和1万个H100之上。

遗憾的是,这两个战略性资源都不是国内主机厂能够轻易追赶上的。

参考资料

[1] 你知道么,自动驾驶竟然已存在27年?佚名

[2] 智能驾驶芯片算力越大就越好吗,远川汽车评论

[3] 大模型应用下自动驾驶赛道将有哪些变化?天风证券

[4] AI大模型应用于汽车智能驾驶梳理:吐故纳新,如日方升,光大证券

[5] ALVINN探秘:一辆来自1989年的自动驾驶汽车,雷锋网

[6] 爆火的ChatGPT,能让自动驾驶更快实现吗?钛媒体

[7] 马斯克直播试驾特斯拉FSD V12!端到端AI自动驾驶,1万块H100训练,新智元



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(18)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
AI大模型之争远未落幕
吕归亚自2022年年底OpenAI发布聊天机器人ChatGPT3.0后,各大科技公司纷纷跟进推出各自的产品。经历了一年多高速推进且“万众瞩目”的发展后, ChatGPT依旧是行业内的标杆级存在...【详细内容】
2024-03-20  Search: 大模型  点击:(19)  评论:(0)  加入收藏
▌简易百科推荐
小米SU7被大卸八块,雷军回应了
4月8日晚国内有一场汽车发布会,然后出现了令人不可思议的一幕。他们把小米SU7当为标杆进行对比,但却把小米SU7的参数给标错了。随后小米官方连发三条信息进行强硬回应,最后的结...【详细内容】
2024-04-09  锋向科技    Tags:小米SU7   点击:(1)  评论:(0)  加入收藏
0首付、0利息!多家车企跟进“车贷新政”,但背后还有“隐性”要求
“您是全款购车,还是贷款购车。”4月7日,《每日经济新闻》记者进入北京某吉利银河4S店后被销售人员如此询问。“如果您选择贷款购车,现在很划算,可以有多种分期方案可选。比如,至...【详细内容】
2024-04-09    每日经济新闻  Tags:车贷   点击:(2)  评论:(0)  加入收藏
真正0首付、0利息来了!“车贷新政”后,多家车企放大招,甚至出现高达3万元金融贴息
每经记者:段思瑶 每经编辑:王月龙,裴健如“您是全款购车,还是贷款购车。”4月7日,《每日经济新闻》记者进入北京某吉利银河4S店后被销售人员如此询问。“如果您选择贷款购车,现在...【详细内容】
2024-04-09    每日经济新闻  Tags:车贷   点击:(1)  评论:(0)  加入收藏
聚焦AI自动驾驶 热闹背后的三个灵魂拷问
2024年,如果还有人没听说过人工智能,那恐怕就不是一句OUT能够形容的了。Artificial Intelligence简称AI,已经是老少皆知、无远弗届的存在。从美国瑰丽七股(Magnificent Seven)、...【详细内容】
2024-04-09    车质网  Tags:AI自动驾驶   点击:(3)  评论:(0)  加入收藏
二手车电池,被“黑市”疯抢
新能源汽车“价格战”再次升级,二手车市场却被打了个措手不及。春节刚过,比亚迪打响了新车价格战第一枪,旗下两款混插车型上市,最低售价跳水至7.98万元。4月1日,问界新M7入门型车...【详细内容】
2024-04-07    中国新闻周刊  Tags:电池   点击:(3)  评论:(0)  加入收藏
保费和50万元油车接近?小米汽车再回应
小米汽车热度不减!小米汽车发布小米SU7答网友问(第九集),就保险费用和50多万元油车接近等问题,作出回应。小米SU7命名有什么来由吗?SU,是Speed Ultra的缩写。高性能是小米的基...【详细内容】
2024-04-07    新黄河  Tags:小米汽车   点击:(5)  评论:(0)  加入收藏
理想汽车上线“潮汐 App”:车内提供小憩模式、冥想模式
IT之家 4 月 6 日消息,理想汽车日前宣布,潮汐 App 现已上线理想 MEGA、理想 L 系列车型,号称为车主打造“专属休憩空间”。IT之家附官方介绍:小憩模式:潮汐独特的小憩助手,专为车...【详细内容】
2024-04-07    IT之家  Tags:潮汐 App   点击:(3)  评论:(0)  加入收藏
特斯拉又涨价了,跟不跟?
喜欢反复降价、涨价,反复试探用户底线的特斯拉,刚刚又有新动作。4月1日,特斯拉Model Y全系涨价5000元, 现款车型售价区间变更为26.39万元-36.89万元。调整价格本是汽车市场常见...【详细内容】
2024-04-03  My车轱辘    Tags:特斯拉   点击:(5)  评论:(0)  加入收藏
雷军:小米SU7大定超10万单,锁单超4万!中国必将诞生像特斯拉一样伟大的公司
快科技4月3日消息,今天,小米汽车正式开始交付,这也标志着雷军三年前的承诺变为现实。首批车主将在今天(4月3日)接收他们的小米SU7,成为这款车的首批车主。根据官方消息,5000辆小米S...【详细内容】
2024-04-03    快科技  Tags:小米SU7   点击:(5)  评论:(0)  加入收藏
小米SU7开启全国首批交付,雷军亲手向首批车主交车
4月3日,在北京亦庄小米汽车工厂举行的小米SU7首批交付仪式上,小米集团创始人雷军亲自迎接了每一位新车车主,并为他们开关车门。雷军在微博上分享了这一刻的喜悦:“三年前的豪言...【详细内容】
2024-04-03  互联网的一些事    Tags:SU7   点击:(5)  评论:(0)  加入收藏
站内最新
站内热门
站内头条