成年人国产黄色免费播放器|91AV另类电影在线免费观看|一区二区AV啊好爽|国产Av网站美女主福利|ay在线中文字幕无码|日韩AV毛片电影|欧美国产人人视频在线观看|久久人妻色欲岛国第一网站|一级黄色片一级黄色片|免费五级黄高潮片下载

  1. 首頁
  2. 大牛說
  3. 智能駕駛如何擁抱大模型?

智能駕駛如何擁抱大模型?

幾個月的時間,以ChatGPT為代表的大模型飛速躥紅,狂飆迭代,大有席卷各行各業(yè)之勢。當這股熱風吹進智能駕駛領域,帶來了一些恐慌,也帶來了新的方向。

一個是在云上滿足泛化性多任務的語言類模型,一個是在公共交通環(huán)境下運行的智能駕駛系統(tǒng),在智己汽車智駕中心軟件高級經(jīng)理殷瑋看來,二者是通往AGI(Artificial General Intelligence通用人工智能)雛形的兩條不同路徑,ChatGPT從“云”出發(fā)走向“可信任”,智能駕駛從“端”出發(fā)走向“泛用”。

在通向AGI的路上,它們會有哪些交集?大模型對于智能駕駛的發(fā)展有什么指導意義?未來智能駕駛又會朝著什么方向演進?

在2023中國(亦莊)智能網(wǎng)聯(lián)汽車科技周暨第十屆國際智能網(wǎng)聯(lián)汽車技術年會(CICV2023)上,殷瑋分享了他的思考。

以下根據(jù)殷瑋演講速記整理,略有刪減:

1、大模型和智能駕駛在何處交集?

圖片

智己汽車智駕中心軟件高級經(jīng)理殷瑋

1)感知融合預測

ChatGPT和智能駕駛都屬于系統(tǒng)范疇,而任何系統(tǒng)的研究,討論的就是兩個問題:一個是泛用性(指一個模型經(jīng)過訓練后,應用到新數(shù)據(jù)并做出準確預測,實現(xiàn)廣泛場景覆蓋的能力),一個是可靠性。通過泛用性來維持自己的不確定性,通過可靠性來維持確定性。

目前,智駕領域從原來只有圖像感知使用模型、其它則使用規(guī)則算法的方式,到現(xiàn)在除了規(guī)控以外,感知融合預測已經(jīng)可以全模型化。

研究車端大模型對于整個軟件泛化性的控制,對corner case的處理有非常積極的意義,也是發(fā)展趨勢。

2)數(shù)據(jù)引擎

數(shù)據(jù)閉環(huán)是ChatGPT和智能駕駛都必不可少的。不過,過去談數(shù)據(jù)閉環(huán),模型的變更還很多,但最近討論的重點變成了看怎么用模型去得到結果,再用結果得到模型,循環(huán)套娃。

其實ChatGPT也類似,從1.0到4.0,整個數(shù)據(jù)結構就像腦子里的神經(jīng)元,基本結構沒發(fā)生多大變化,只是每次教育改革訓練我們腦子的學習資料變化很大,讓腦子變得很快。

3)Transformer

Transformer即為GPT的T,在智能駕駛領域里也被廣泛提及。它是一種利用注意力機制來提高模型訓練速度的深度學習模型,由編碼和解碼兩部分組成。

智能駕駛系統(tǒng)和大模型在沒有商量的情況下,高度一致地選擇了Transformer,看似巧合,背后卻有一定客觀規(guī)律存在。Transformer對于時空邏輯帶有一些因果推理過程,至少當前情況下正在統(tǒng)一化整個智能系統(tǒng)研發(fā)的策略。

智能駕駛系統(tǒng)現(xiàn)在處于一種大編碼器的研發(fā)策略,對于解碼器的使用還是在研狀態(tài),但是大模型已經(jīng)進入到了解碼器階段,這對于智能駕駛往后做Transformer開發(fā)是有借鑒意義的。

4)多模態(tài)

現(xiàn)在,語言類、文字類的大模型火出圈,圖片類、視頻類、語音類開始流行起來,還沒有出圈的模態(tài)就是行為類的大模型,跟機器人的結合。一旦大模型走到行為這一步,就開始跟智能駕駛進入統(tǒng)一的討論范疇了。

但是智能駕駛系統(tǒng)的發(fā)展會有點區(qū)別,現(xiàn)在更多討論的是相機、激光雷達等感知的BEV模型,也討論地圖預測過程中,怎么用模型來進行原來高精度地圖做的一些拓撲映射,這些對于智能駕駛的規(guī)劃決策都是輸入。在這個維度上,語言模型的突破,對于智能駕駛系統(tǒng)規(guī)劃接下來的發(fā)展,有很強的借鑒意義。

5)平權

這個詞最近智能駕駛和大模型都在提,但是兩者平權邏輯不太一樣。

智能駕駛談平權,大部分都跟降本有關,要保證高迭代情況下還要降本,整個集中化架構要怎么做,還有軟件邊際成本的降低。在適配新車型、新算法、新業(yè)務狀態(tài)的時候,要保證軟件的變更最低,模型化對于這件事情確實有極大貢獻。

當然它也會帶來新的問題,如果模型輸入源發(fā)生變化,可能帶來成本的極大增加。

但從大模型領域出發(fā),平權更多談論的是所有權問題,這么恐怖的生產(chǎn)力掌握在誰手上的問題。

2、在確定性和不確定性之間反復橫跳

要研究大模型和智能駕駛的工作流狀態(tài),就要理解它們在處理泛化性和可靠性時,都經(jīng)歷了怎樣的過程。

ChatGPT的業(yè)務天生就是自解釋的,面向多任務場景,高容錯。它的整個訓練過程,從最開始對數(shù)量要求最大的無監(jiān)督學習,到結構化的微調、有監(jiān)督學習過程,再到強化學習,訓練完產(chǎn)生的結果到這個階段其實已經(jīng)可以用了。

但是要能真正用于工作流的話,還是要到達提示詞工程(用AI聽得懂的提示語言,幫助AI高效理解需求,實現(xiàn)功能)這個級別才能發(fā)揮生產(chǎn)力價值。

ChatGPT整個發(fā)展過程是從泛化性、高容錯,轉化到一些看上去很像智能汽車的價值觀,如控制時延、少算力,增強交互的真實性、可控性。屬于更強調不確定性的范式,要求從這個過程中得到一些答案和新的思考,人只是給到一個指引,但是不會去強行控制它的結果。

但縱觀整個智能汽車的發(fā)展階段,以及后面想做的事情,其實是跟ChatGPT是反過來的。

在智能汽車上,一開始無論系統(tǒng)多小,它其實已經(jīng)是一個在公共交通環(huán)境下運行的機器人了,關系到生命安全,因此一定要強調安全性和可靠性。智能駕駛系統(tǒng)屬于更強調確定性的范式,一個模型要先到達一個安全系數(shù),再進行控制。

兩種方法之間差異非常大,習慣了確定性做法或習慣了規(guī)則的人,和習慣了不確定性做法的人,他們之間可能完全無法相互理解。但智能駕駛系統(tǒng)的實現(xiàn)過程,就是在確定性和不確定性之間反復橫跳的過程。

圖片

確定性的工作流,它在產(chǎn)品里最大的作用是確保短期的產(chǎn)品質量,為量產(chǎn)兜底,同時,也為不確定性的工作流提供了“差異識別”的能力。有一個確定性的方法或者安全系統(tǒng),控制邊界,給深度學習一點空間,這是量產(chǎn)比較好操作的方案。

不確定性的工作流,對產(chǎn)品的長期迭代有很深的影響,能幫助確定性工作流提升效率,緩解壓力。

這種在確定性和不確定性之間的反復橫跳是一種螺旋式上升,兩者的變化會帶來對智能駕駛系統(tǒng)認知維度的躍遷。

3、未來跳向何方?

ChatGPT在用戶中有很高的付費意愿,產(chǎn)品迭代也很快,而智能駕駛商業(yè)化落地相比之下就慢多了,也導致很多資本從智能駕駛涌入ChatGPT。

兩者在發(fā)展軌跡上注定是不同的,雖然都要走向廣泛信任的終點,但以ChatGPT為代表的AIGC經(jīng)歷的是從廣泛到廣泛信任,智能駕駛經(jīng)歷的則是從信任到廣泛信任。

圖片

雖然AIGC在這段時間的爆發(fā)異常迅猛,從語言,到多模態(tài),到專業(yè)領域的定制化,到很多工具的調用,再到最后機器人的介入,速度會非常快,但AIGC的發(fā)展速度也不會一直這么快,總有慢下來的一天。

它會在什么時候慢下來?會在面臨一些跟智能駕駛同樣問題的時候慢下來。當進入到一些高敏感領域決策的問題,比如在一些機器人進入到公共安全領域時,它肯定會慢下來。

ChatGPT和智能駕駛之間,可能會經(jīng)歷三個階段。

第一個階段是恐慌,就是現(xiàn)在的感覺。

第二個階段,LLM(大語言模型)類業(yè)務會開始指導智能駕駛的工程師實踐,現(xiàn)在智能駕駛很多工作流也是朝這個方向去做,從萬物感知,到預測、規(guī)劃,到自解釋的過程。

越往后會發(fā)現(xiàn)ChatGPT和智能駕駛在做的研究越像,很多時候會成為一些共性的問題。雖然現(xiàn)在的差距從工程上來說還比較大,兩者聯(lián)系并沒有那么密切,但是未來這種趨勢會變得越來越明顯。最后,肯定會朝著AGI共同目標驅同演進。

來源:第一電動網(wǎng)

作者:智車星球

本文地址:http://www.idc61.net/kol/204052

返回第一電動網(wǎng)首頁 >

收藏
21
  • 分享到:
發(fā)表評論
新聞推薦
大牛作者

智車星球

服務智能汽車創(chuàng)業(yè)者,提供媒體報道、品牌公關、會議活動、投融資對接等其他定制服務。

  • 178
    文章
  • 8011
    獲贊
閱讀更多文章
第一電動網(wǎng)官方微信

反饋和建議 在線回復

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
-->