關(guān)注并標(biāo)星電動(dòng)星球News
每天打卡閱讀
更深刻理解汽車產(chǎn)業(yè)變革
————————
出品:電動(dòng)星球 News
作者:毓肥
9 月 28 日,毫末智行舉辦了第三期品牌開放日。
和前兩次相比,這次品牌開放日的毫末智行,「亮劍」的氣氛明顯更濃。簡(jiǎn)單點(diǎn)說,就是干貨更多、數(shù)據(jù)更多、需要多想一會(huì)兒的技術(shù)思考更多了。
而另一個(gè)事實(shí),是雖然毫末的品牌日已經(jīng)舉辦到了第三期,但卻是以每季度一次的高頻率呈現(xiàn)。即使是技術(shù)立身的自動(dòng)駕駛公司,如此高密度宣發(fā),也是對(duì)技術(shù)積累的考驗(yàn)。

毫末智行 CEO 顧維灝在發(fā)布會(huì)上,將他們的智能駕駛哲學(xué),凝練為「數(shù)據(jù)處理慢功夫」,一個(gè)很容易讓友商放松警惕的概念——因?yàn)椤嘎?,聽上去與智能駕駛的滾滾洪流,似乎并不對(duì)稱。
但實(shí)際上,毫末智行昨天在開放日呈現(xiàn)的信息,或者表態(tài),不像字面意義上的「慢」,甚至更像「快」。
比如國內(nèi)首發(fā)高通 8540+9000 的智能駕駛方案——單芯片360T四芯片 1440TOPS 的高算力;
再比如引入 Swin-Transformer 模型,相比常規(guī)方式最多提高80%深度學(xué)習(xí)速度;
還比如使用無監(jiān)督聚類,自動(dòng)化挖掘每天數(shù)千萬幀數(shù)據(jù)的價(jià)值、開發(fā)自動(dòng)轉(zhuǎn)化工具提高仿真測(cè)試速度,從每天仿真 30 個(gè)場(chǎng)景提升到 14400 個(gè),等等。

無人駕駛進(jìn)入深水區(qū),需要解決的核心問題有兩個(gè):如何提高數(shù)據(jù)利用率?如何降低數(shù)據(jù)利用成本?
至于如何解決這些問題,毫末智行用品牌開放日給出了自己的答案。干貨很多,術(shù)語很多,下面馬上開始。
前言:車企孵化的自動(dòng)駕駛技術(shù)公司?
成立于 2019 年的毫末智行,前身是長(zhǎng)城汽車智能駕駛前瞻部,由長(zhǎng)城汽車孵化而出,成為獨(dú)立的自動(dòng)駕駛?cè)斯ぶ悄芗夹g(shù)公司。
也就是說,長(zhǎng)城汽車既是毫末智行的大股東,也是毫末智行的大客戶。
這樣的路線,類似福特之于 Argo UI,通用之于 Cruise。也就是成熟車企獨(dú)立孵化的自動(dòng)駕駛技術(shù)公司。
這種模式的特點(diǎn),是技術(shù)公司不僅保留了輕裝上陣的獨(dú)立性,距離量產(chǎn)車場(chǎng)景也還比純粹的技術(shù)公司更近。
截止到技術(shù)日,毫末智行小魔盒累積的路測(cè)數(shù)據(jù)已經(jīng)達(dá)到了 100 萬公里,輔助駕駛打開率為 30%,未來三年的目標(biāo)則是登上 100 萬輛長(zhǎng)城乘用車。

另外,張凱表示到 2025 年,長(zhǎng)城汽車旗下所有新車型都會(huì)搭載 L2 技術(shù),75% 車型搭載 L2+ 技術(shù),其中 40% 車型搭載 L3 及以上技術(shù)。

這次技術(shù)日雖然有很多術(shù)語和干貨,但毫末智行希望傳遞的核心信息,其實(shí)就是這兩個(gè) 100 萬,以及「2025 小目標(biāo)」背后的意義:量產(chǎn)智能駕駛會(huì)遇到什么挑戰(zhàn)?如何克服這些挑戰(zhàn),讓更多汽車實(shí)現(xiàn)智能駕駛?
一、怎么把每一公里數(shù)據(jù)利用到極致?
100 萬公里路測(cè)數(shù)據(jù),是智能駕駛征程中的一個(gè)節(jié)點(diǎn)。

在毫末智行 CEO 顧維灝的演講中,百萬級(jí)的數(shù)據(jù)積累在他看來,更像是一塊敲門磚。「我們發(fā)現(xiàn)了大量的,量產(chǎn)前想不到的情況。發(fā)現(xiàn)現(xiàn)實(shí)世界遠(yuǎn)遠(yuǎn)比我們想的復(fù)雜。」

他用「浩如煙?!箒硇稳莠F(xiàn)實(shí)世界對(duì)智能駕駛的考驗(yàn)。
事實(shí)上,這樣的考驗(yàn)并不來源于「里程」,而是來自每一幀視頻畫面。
擁有自主思考能力的人類司機(jī),經(jīng)過教育和實(shí)踐之后,可以識(shí)別、分析并適應(yīng)道路狀況。比如你知道路邊停著的共享單車不會(huì)自動(dòng)沖出路面,也知道對(duì)向車道來車突然撞過來的幾率很小。

但對(duì)于人工智能來說,光是讓它「認(rèn)清」這個(gè)世界,就已經(jīng)難倒了無數(shù)工程師。
毫末智行將這種困難,總結(jié)為「如何找到對(duì)當(dāng)前能力最有價(jià)值的數(shù)據(jù)」。顧維灝則用了一個(gè)詞語:「診斷」。

這是毫末智行尋找有價(jià)值場(chǎng)景的具體方法,看懂這張圖的門檻不低。
簡(jiǎn)單總結(jié)一下,就是毫末用了兩套模型——云端的 fundamental model 全任務(wù)感知模型+車端的 domain model 部分感知模型,用類似于「找茬兒」的方式,實(shí)現(xiàn)了更高比例的自主診斷。
是的,找茬兒,找車端感知過程中的茬兒。
比如這張 PPT,很生動(dòng)地展示了車端感知的三個(gè)常見「漏檢」:道路遠(yuǎn)處已經(jīng)變得很小的前車、被障礙物擋住的前車,以及只有部分被攝像頭拍到的側(cè)前車。

對(duì)于人類司機(jī)相當(dāng)于 5.76 億像素的視覺和極其精妙的大腦而言,這三個(gè)「漏洞」除非危險(xiǎn)駕駛,否則基本不會(huì)出現(xiàn)。但對(duì)于人工智能,想要認(rèn)清這樣的 Corner cases,就必須依賴訓(xùn)練。
而如果同樣的數(shù)據(jù)量,能夠找到更多 Corner cases,那就是「尋找有價(jià)值場(chǎng)景」的效率更高。
這也是顧維灝提出「數(shù)據(jù)處理的慢功夫」背后的邏輯:慢,指的是深度挖掘同一組數(shù)據(jù)的利用率;慢的目的,則是為了少出錯(cuò)。
二、自動(dòng)化+Transformer,數(shù)據(jù)效率方法論
但顧維灝提出的「慢功夫」,也為毫末智行帶來了新的挑戰(zhàn):數(shù)據(jù)量。
在自動(dòng)駕駛業(yè)內(nèi),路測(cè)里程數(shù)是一個(gè)相對(duì)通俗易懂的維度。但如果要準(zhǔn)確描述深度學(xué)習(xí)的負(fù)擔(dān),用「幀」是更對(duì)工程師口味的。
毫末智行的工程師告訴我們,目前他們的路測(cè)車,每天可以產(chǎn)生數(shù)千萬幀的視頻數(shù)據(jù)。
隨著 100 萬長(zhǎng)城乘用車裝配智能駕駛「小目標(biāo)」的臨近,這樣的數(shù)據(jù)量只會(huì)繼續(xù)幾何級(jí)增長(zhǎng)——更何況,毫末智行才剛提出了不斷挖掘場(chǎng)景的「慢功夫」。
那么,毫末智行會(huì)如何進(jìn)入數(shù)據(jù)爆炸的智能駕駛時(shí)代?顧維灝給出的答案是「快」,或者說,「提高訓(xùn)練數(shù)據(jù)的效率」。
1.提高效率,首先要提高深度學(xué)習(xí)訓(xùn)練速度。

Swin-Transformer,這是 PPT 上面非常重要的一張。
Swin Transformer是一種新型深度學(xué)習(xí)視覺模型,由微軟首先提出,屬于 Transformer 模型的一類——Transformer 和 CNN(卷積神經(jīng)網(wǎng)絡(luò)),屬于目前比較主流的深度學(xué)習(xí)模型。
更具體的原理分析,本文就不展開了。簡(jiǎn)單總結(jié)一下 Swin-Transformer 的優(yōu)點(diǎn),就是相比起 CNN,它對(duì)數(shù)據(jù)量大的模型更友好,效率更高。
毫末智行表示,如果使用標(biāo)準(zhǔn)的數(shù)據(jù)并行訓(xùn)練,同樣是 100 萬幀的視頻數(shù)據(jù),4 臺(tái)各配置 4 張英偉達(dá) V100 深度學(xué)習(xí)卡的服務(wù)器,需要 64.3 小時(shí)。
但 100 萬幀數(shù)據(jù)根本不算多——上文剛說了,現(xiàn)階段毫末智行每天的數(shù)據(jù)量就達(dá)到了數(shù)千萬幀,使用原始方法訓(xùn)練速度明顯不夠快。

顧維灝表示他們使用了數(shù)據(jù)和模型同時(shí)并行的混合方案,比如把模型、不同層的網(wǎng)絡(luò)數(shù)據(jù)橫向和縱向各自拆分,動(dòng)態(tài)分配到計(jì)算卡顯存里面。

結(jié)果如這個(gè)表格所示,優(yōu)化后的迭代速度(橙色),可以提高50%-80%。
2.提高效率,還需要降低人力參與度。
毫末智行每天產(chǎn)生的數(shù)千萬幀視頻數(shù)據(jù),根據(jù)我們了解到的消息,如果光靠人力「看」,速度只有每個(gè)人每天 1000 幀,效率極低。
所以除了必要的人工標(biāo)注之外,毫末智行一直希望提高數(shù)據(jù)處理的自動(dòng)化程度。

總結(jié)下來,毫末智行的自動(dòng)處理,主要有「無監(jiān)督聚類」、「CSS 自動(dòng)轉(zhuǎn)換+云端仿真」兩個(gè)主要特點(diǎn)。

上面提到過,毫末智行使用了雙模型對(duì)比的方式尋找錯(cuò)漏。而無監(jiān)督聚類的作用,則是自動(dòng)找到更多工程師想要的場(chǎng)景。

舉個(gè)例子,比如工程師需要「被樹木擋住的車」,首先需要進(jìn)行一次表征學(xué)習(xí),把圖片變成特殊的矩陣,基于這個(gè)特殊矩陣做自動(dòng)化積累——最后所有「被樹木擋住的車」相關(guān)圖片都會(huì)自動(dòng)分類。
毫末智行方面表示,無監(jiān)督聚類過程不需要人工打標(biāo)簽,這個(gè)過程極大提高了數(shù)據(jù)利用的速度。
CSS 自動(dòng)轉(zhuǎn)換+云端仿真,則是毫末智行在傳統(tǒng)方式基礎(chǔ)上,加快驗(yàn)證速度的工具。

顧維灝表示,常規(guī)方法一套流程走下來,每個(gè)人每天只能驗(yàn)證30個(gè)場(chǎng)景,「而且人工設(shè)置的也很隨意,經(jīng)常會(huì)設(shè)置很多無效的場(chǎng)景,浪費(fèi)時(shí)間?!?/span>

使用云端并行和自動(dòng)轉(zhuǎn)換工具之后,他表示目前每天可以自動(dòng)生成一萬多個(gè)仿真測(cè)試用例,PPT 上的數(shù)據(jù)則是 14400 個(gè)/天。
二、毫末智行+高通,最高 1440TOPS 算力?
自動(dòng)駕駛深水區(qū),一定是數(shù)據(jù)量和計(jì)算能力互相超越的「軍備競(jìng)賽」。
數(shù)據(jù)量不僅來源于量產(chǎn)車數(shù)量,還來源于精度不斷提高的感知硬件。

從明年開始,200 萬像素,甚至 800 萬像素就將成為智能汽車的標(biāo)配。和如今主流的 100/130 萬像素相比,對(duì)芯片的要求上了好幾層樓——這也為「算力競(jìng)賽」推波助瀾。
那么毫末智行,會(huì)為長(zhǎng)城汽車提供怎樣的算力?
2020 年 12 月 30 日,長(zhǎng)城汽車與高通技術(shù)公司宣布雙方在自動(dòng)駕駛領(lǐng)域達(dá)成合作。長(zhǎng)城汽車將是國內(nèi)首批采用高通 Snapdragon Ride 平臺(tái)的整車廠商。

也是在毫末智行的技術(shù)開放日上,我們第一次得知了高通智能駕駛芯片的代號(hào)——8540+9000。
其中 8540 是類 CPU+GPU 的 SOC 芯片,9000 則是專業(yè)負(fù)責(zé)深度學(xué)習(xí)的異構(gòu)芯片,它們都將基于車規(guī)級(jí) 5 納米工藝打造,單片 8540+9000 的功耗大概是 75W。

在 5 納米工藝高通芯片加持下,毫末智行帶來了新的「小魔盒 3.0」平臺(tái),單板可以達(dá)到 360TOPS 的算力,并支持升級(jí)到 1440TOPS,也就是 4 板聯(lián)合的算力。

顧維灝則表示,75W 的 8540+9000 每秒可以計(jì)算 2 萬幀數(shù)據(jù)。
目前,高通驍龍 Ride 平臺(tái)已經(jīng)在毫末智行上車測(cè)試。發(fā)布會(huì)上分享的數(shù)據(jù),則是該平臺(tái)已經(jīng)幫助毫末智行的算法擴(kuò)展了從感知到認(rèn)知的各項(xiàng)任務(wù),號(hào)稱「端到端延遲低于30毫秒」。
最后:「又干又硬」,智能駕駛的必修課
前兩天,毫末智行公布了他們的高速公路領(lǐng)航輔助功能 NOH(Navigation on HIpilot)。到了品牌開放日上,官方表示目前已經(jīng)適配 31 萬公里的高速公路和城市快速路。

進(jìn)入 2021 之后,毫末智行在加速。這是長(zhǎng)城汽車進(jìn)入智能駕駛時(shí)代的主客觀要求,但加速的前提,是技術(shù)夠硬、夠干。
這是作為一家自動(dòng)駕駛公司必須做到的,也是毫末智行一直希望證明的。
NOH 高速領(lǐng)航輔助、新的深度學(xué)習(xí)模型、高自動(dòng)化數(shù)據(jù)處理,這些是發(fā)布會(huì)打在 PPT 上的成果。
此外,毫末智行的人員規(guī)模,還是另一個(gè)低調(diào)的發(fā)力點(diǎn)——毫末智行團(tuán)隊(duì)目前超過 500 人,預(yù)計(jì)在今年底超過 700 人,明年達(dá)到 1000 人,其中碩博比為 50%。

除了名詞、術(shù)語、數(shù)據(jù),成為國內(nèi)首批跟高通合作并量產(chǎn)智能駕駛平臺(tái)的自動(dòng)駕駛公司,還能看出毫末智行希望成為頭部玩家,也就是他們的「野心」。
顧維灝在開放日開場(chǎng)的時(shí)候這樣說:「誰能用最低的成本,得到最多的數(shù)據(jù),用最快的速度進(jìn)行產(chǎn)品迭代,誰就將獲得未來競(jìng)爭(zhēng)的勝利。」

從發(fā)布會(huì)上看,毫末智行在往這樣的方向走,至于能不能贏,那就要看 2022 年落地的表現(xiàn)如何了。
(完)
來源:第一電動(dòng)網(wǎng)
作者:電動(dòng)星球News蟹老板
本文地址:http://www.idc61.net/kol/157625
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。