
7月22日,馬斯克在推特上宣布,x.AI由10萬張H100組成AI訓(xùn)練集群上線,這是全世界目前最強的AI訓(xùn)練集群。
光是這10萬張卡本身,就需要40億美元的資本投入,再加上驚人的電耗、散熱管理以及卡間通信的成本。
到2024年,AI公司進(jìn)入第一梯隊的門票可能進(jìn)一步提升到10萬張卡這個量級。
AI公司的突圍成本,正變得越發(fā)巨高無比。
在智能駕駛領(lǐng)域,特斯拉的純視覺智駕獨樹一幟,國內(nèi)也只有極越等少數(shù)汽車品牌能夠跟進(jìn),超高的算力、數(shù)據(jù)、算法門檻決定了純視覺只能是「少數(shù)玩家的游戲」。
激光雷達(dá)的核心原理是運用回波時間測量法,繪制出周邊物體的點云,激光點云包含的信息精度高,但信息的維度有限。
純視覺則類似于人眼,其獲取的信息十分豐富,并且車端的成本更低。但采用純攝像頭作為數(shù)據(jù)輸入,距離識別,尤其是縱向距離的精度提高非常困難。同時,攝像頭的輸入也容易受到光照等環(huán)境影響,在逆光、大雪遮擋的情況下會造成辨識困難。
就連特斯拉的前AI高級總監(jiān)Andrej Karpathy早些時候也在演講時表示:「純視覺能夠精準(zhǔn)感知深度、速度、加速度信息,實現(xiàn)純視覺是一件困難的事情,需要大量的數(shù)據(jù)?!?/p>
好在,隨著AI技術(shù)的發(fā)展,基于人工智能框架和大模型,純視覺方法對三維環(huán)境的識別能力已有大幅提升。
不過,相應(yīng)的代價,是這套流程需要強大的算力。
前文提到,建立一個10萬卡的AI訓(xùn)練集群,光買下這10萬卡的集群,就需要40億美元的投入。
而從能耗角度,10萬張H100的功耗是150MW(兆瓦)。作為對比,目前最大的國家超級計算機El Capitan只需要30MW的功率。
更何況,這些AI集群之間通過光通信連接,距離越遠(yuǎn),光通信的成本也越高。
這也是為什么,特斯拉不僅部署了超級算力中心,還于去年正式投產(chǎn)了特斯拉的Dojo,后者是特斯拉自研的超級計算機。
據(jù)公開數(shù)據(jù),特斯拉每個Dojo都集成了120個訓(xùn)練模塊,內(nèi)置3000個D1芯片,擁有超過100萬個訓(xùn)練節(jié)點,算力達(dá)到1.1EFLOP(每秒千萬億次浮點運算)。

特斯拉基于自研芯片的算力集群,一個ExaPod 1.1 EFLOPS
此外,特斯拉預(yù)計,2024年10月特斯拉的算力總規(guī)模將達(dá)到100 Exa Flops ,相當(dāng)于30萬塊英偉達(dá)A100顯卡的算力總和。
今年3月,特斯拉推出FSD V12更新,整個系統(tǒng)中端到端的算法幾乎全部采用神經(jīng)網(wǎng)絡(luò)構(gòu)建,靈活度非常高、應(yīng)變能力強,并能以高度擬人化的狀態(tài)駕駛。
但光有算力就夠了嗎?顯然不是。純視覺技術(shù)路線的主要「成本」,除了算力之外,還包括算法和數(shù)據(jù)。
視覺算法需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練。算力可以砸錢堆砌,但算法和數(shù)據(jù),卻很難坐等「拿來主義」。因此,純視覺方案,對于追趕者具有極高的門檻。
而在國內(nèi)造車新勢力中,背靠百度的能力,由集度主導(dǎo)智能化研發(fā)的極越01在純視覺智能駕駛的路線中走在市場前列。
在談到為什么要押注純視覺方案時,集度(極越)汽車CEO夏一平曾表示:因為這是最為類似人類駕駛的方案,人眼看到的圖像和視頻包含了大量的場景信息,機器也可以從圖像中獲得最為豐富的信息,通過這些信息,機器只要能夠識別圖像中的相關(guān)語義,就可以做出準(zhǔn)確的判斷,并且覆蓋范圍更廣。
而更深層次的原因,其實也包括純視覺方案相對激光雷達(dá)方案對硬件要求低,對AI能力要求高,因此,只要AI算法一直升級,它的智駕能力就能一直升級,智駕系統(tǒng)就能越來越像人類老司機,能自主理性決策,更人性化,所以它的上限更高。
這也是為什么夏一平會喊出「五年內(nèi)不過時」的內(nèi)在邏輯。
「這樣的技術(shù)路線選擇,其實是為了將來能夠讓智駕能夠更加快速普及,做的一個非常大的決定。」
極越其采用的純視覺方案,以自動駕駛視覺大模型VTA(Vision Takes All)為底座,大幅升級包括動靜態(tài)檢測、時序跟蹤、實時建圖、場景理解等能力。

硬件上,由集度主導(dǎo)智能化研發(fā)的極越01全系則配置了大算力智駕芯片,搭載2顆OrinX,除此之外,還有百度為其智駕訓(xùn)練提供的2.2 EFlops的云端算力。事實上,基于百度Apollo純視覺高階智駕能力和安全體系賦能,極越完成了OCC占用網(wǎng)絡(luò)升級。

去年10月,極越在國內(nèi)第一個用了BEV+Transformer的純視覺方案,而后在今年1月又是國內(nèi)第一個應(yīng)用了OCC占用網(wǎng)絡(luò)技術(shù),形成了“BEV+OCC+Transformer”純視覺方案的“完全體”。
其中,OCC占用網(wǎng)絡(luò)這個技術(shù)的原理是感知攝像頭將周邊環(huán)境的物體3D化,將物體識別為網(wǎng)絡(luò)中的一個個“體素”,感知系統(tǒng)只要對網(wǎng)絡(luò)體素是否被占用進(jìn)行識別,這樣就能對3D物理空間的可通行區(qū)域進(jìn)行高保真度還原。
依托這套比激光雷達(dá)點云分辨率更高的三維結(jié)構(gòu)信息,OCC占用網(wǎng)絡(luò)還能減少漏檢、誤檢并彌補視覺所不具備的空間高度信息,突破能力上限和提升安全保障的同時,完全替代了激光雷達(dá),大幅提升了泛化能力。
由此,在搭載了OCC占用網(wǎng)絡(luò)技術(shù)后,極越能夠?qū)崿F(xiàn)障礙物精細(xì)刻畫,3D精度可以做到厘米級,輕松比肩激光雷達(dá)精度。
過去一段時間,坊間習(xí)慣性將純視覺路線視為車企的降本之舉。誠然,對比激光雷達(dá)的硬件成本,純視覺方案的確要「 省錢」不少,但其實,藏在純視覺方案背后的軟件成本,卻要大幅高于激光雷達(dá)方案。
對車企而言,只要愿意掏錢,激光雷達(dá)方案可以輕松上車。但純視覺方案卻不行。
而極越的優(yōu)勢,來自于百度的技術(shù)賦能。在純視覺智能駕駛相關(guān)的技術(shù)指標(biāo)上,百度在算力、算法、數(shù)據(jù)這三個關(guān)鍵領(lǐng)域都有著深厚積累。
首先是算力,百度已為智能駕駛在建立了超過2.2 EFLOPS高算力訓(xùn)練集群。
其次是算法,百度Apollo擁有10多年的L4級自動駕駛技術(shù)研發(fā)積累。
而國內(nèi)其他車企的應(yīng)用方案目前都是L2級,雖然都在發(fā)力L3級乃至更高級別的自動駕駛的研發(fā)工作,但相比已搭建起L4級別自動駕駛大模型、并成熟落地應(yīng)用的百度而言,技術(shù)差距是顯而易見的。
最后是數(shù)據(jù)方面,百度Apollo的自動駕駛里程已經(jīng)超過1億公里,未發(fā)生過重大傷亡事故,這些都是高質(zhì)量的L4級別自動駕駛數(shù)據(jù)積累。同時,通過蘿卜快跑、極越汽車等品牌,百度還在持續(xù)迭代數(shù)據(jù)規(guī)模。
目前,百度不僅擁有海量L4級別高質(zhì)量實際行駛數(shù)據(jù),還形成數(shù)據(jù)資產(chǎn)管理、自動化數(shù)據(jù)產(chǎn)線等一系列的體系化能力。目前國內(nèi)其他車企也還做不到這樣的數(shù)據(jù)能力。
而這些百度所獨有的技術(shù)優(yōu)勢,無疑將毫無保留地在極越品牌身上得到體現(xiàn)。
作為全球領(lǐng)先的AI大模型公司,也是自動駕駛技術(shù)領(lǐng)軍企業(yè),百度擁有10余年L4級自動駕駛技術(shù)研發(fā)和創(chuàng)新應(yīng)用經(jīng)驗。同時,百度Apollo已形成海量的數(shù)據(jù)資產(chǎn)管理,建立了百億參數(shù)的視覺大模型、高標(biāo)準(zhǔn)的自動化標(biāo)注產(chǎn)線、超過2.2 EFLOPS高算力訓(xùn)練集群,為AI算法升級提供持續(xù)動力,同時賦能極越和蘿卜快跑的智駕能力高速迭代。
正是在百度智駕能力的加持下,極越汽車的智駕表現(xiàn)才站在了第一梯隊,比肩特斯拉,成為中國純視覺智駕方案的領(lǐng)跑者。
值得一提的是,國內(nèi)不少車企都從今年開始跟進(jìn)布局純視覺智駕的路線,包括小鵬汽車今年的新車,以及蔚來子品牌樂道在內(nèi)。
隨著極越以及特斯拉這兩家領(lǐng)航者的持續(xù)推動,未來不排除越來越多的車企會加碼純視覺的陣營
來源:第一電動網(wǎng)
作者:HiEV
本文地址:http://www.idc61.net/kol/239554
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。