經(jīng)濟(jì)觀察網(wǎng) 周信/文 2024年被廣泛認(rèn)為是人工智能的元年,人工智能的研究與應(yīng)用如雨后春筍般涌現(xiàn)。得益于此,2024年汽車智能化飛速發(fā)展,不管是智能座艙還是智能駕駛,都有了質(zhì)變性的提升。
AI大模型的應(yīng)用,促使汽車智能座艙的聽、說(shuō)、人機(jī)交互、車手互聯(lián)、個(gè)性化體驗(yàn)實(shí)現(xiàn)了全面升級(jí),汽車座艙能夠更流暢、更智能地理解用戶,并提供定制化的服務(wù)和體驗(yàn)。
而“端到端”技術(shù)的應(yīng)用,則讓高等級(jí)智能輔助駕駛從高速NOA向城市NOA快速突進(jìn),此前眾多車企規(guī)劃的逐步“開城”計(jì)劃也迅速轉(zhuǎn)向“全國(guó)開城”,城市NOA的技術(shù)的迭代速度越來(lái)越快,智駕技術(shù)也越來(lái)越像“老司機(jī)”。
在AI加持下,新一輪智能化革命蓄勢(shì)待發(fā)。AI Agent即將上車,最終將實(shí)現(xiàn)人“人”交互。在端到端技術(shù)尚未完全被消化之際,業(yè)內(nèi)又掀起“一段式端到端”自動(dòng)駕駛技術(shù)競(jìng)賽,各家企業(yè)都希望在智駕技術(shù)方面實(shí)現(xiàn)跨越性的領(lǐng)先。
但與此同時(shí),智能化的發(fā)展深度依賴數(shù)據(jù)、算法、算力?!暗搅巳斯ぶ悄軙r(shí)代,汽車行業(yè)最缺的是智算的基礎(chǔ)設(shè)施,這也將會(huì)成為智能網(wǎng)聯(lián)汽車加速發(fā)展的主要矛盾?!敝袊?guó)電動(dòng)汽車百人會(huì)副理事長(zhǎng)兼秘書長(zhǎng)張永偉表示。
AI大模型讓智能座艙更類人
隨著智能化技術(shù)的日新月異,車企比拼智駕、智艙技術(shù)上車的節(jié)奏令人眼花繚亂,也讓很多人享受到了智能化進(jìn)步帶來(lái)的更好體驗(yàn)。
2019至2022年,預(yù)訓(xùn)練模型(Pre-trained Model)井噴式出現(xiàn);2023年,首個(gè)真正意義上的大語(yǔ)言模型(Large Language Model)ChatGPT落地,谷歌、亞馬遜、百度、阿里、騰訊等科技巨頭先后加入。
根據(jù)網(wǎng)信辦發(fā)布的數(shù)據(jù)統(tǒng)計(jì),目前已有超過(guò)283個(gè)大模型通過(guò)備案。大模型與其他模型最大的區(qū)別在于“涌現(xiàn)”能力,有了類人的“思維方式”。在預(yù)訓(xùn)練階段,隨著模型規(guī)模的擴(kuò)大和參數(shù)量的提升,在超過(guò)某一閾值后,模型準(zhǔn)確度就會(huì)大幅提升。
去年12月,理想汽車開始批量推送OTA5.0,認(rèn)知大模型Mind GPT首次上車,賦能理想汽車智能助手“理想同學(xué)”擁有類似于 ChatGPT、Midjourney 等生成式 AI 的能力,拉開了智能座艙的AI競(jìng)爭(zhēng)序幕。
在智能座艙領(lǐng)域,現(xiàn)階段AI大模型主要應(yīng)用于車載語(yǔ)音助手,通過(guò)深化語(yǔ)義理解和優(yōu)化語(yǔ)料生成,AI大模型能夠精準(zhǔn)捕捉用戶的意圖與需求,提供自然、擬人、流暢且邏輯清晰的回答與建議。
今年4月,蔚來(lái)汽車自研的AI大模型NOMI GPT上線,實(shí)現(xiàn)了視覺(圖像)、聽覺(聲音)、觸覺(車身傳感器信息)等維度的感知能力,具備包括語(yǔ)音、視覺和文本等多種形式的交互能力。
AI大模型還具備強(qiáng)大的短期記憶及長(zhǎng)期記憶,長(zhǎng)期記憶存儲(chǔ)和回憶過(guò)去的數(shù)據(jù)和經(jīng)驗(yàn),短期記憶幫助快速響應(yīng)和即時(shí)處理信息。基于此,座艙能夠主動(dòng)為用戶提供音樂、新聞、導(dǎo)航等信息,自動(dòng)調(diào)整座椅位置、后視鏡角度、氛圍燈顏色、空調(diào)溫度等。
目前,AI在智能座艙上的應(yīng)用更多是通過(guò)語(yǔ)音識(shí)別、圖像識(shí)別等提升感知模塊的準(zhǔn)確度。而隨著多模態(tài)及大模型技術(shù)的發(fā)展,基于語(yǔ)音、手勢(shì)控制和視覺多模態(tài)能夠讓智能座艙更加準(zhǔn)確地識(shí)別用戶需求和意圖。
在AI智能體的作用下,智能座艙能提升復(fù)雜問題的快速拆解、推理、決策、并分發(fā)執(zhí)行的技術(shù)能力,切實(shí)解決用戶困難,滿足或預(yù)測(cè)用戶需求,實(shí)現(xiàn)類人的執(zhí)行能力,進(jìn)行主動(dòng)交互,提供個(gè)性化服務(wù)。
同時(shí),智能座艙也將真正向改變場(chǎng)景體驗(yàn)轉(zhuǎn)變,打破“車”“家”“手機(jī)”的功能和習(xí)慣壁壘,在高頻率使用能工上深挖功能與場(chǎng)景結(jié)合,在低頻使用的功能方面則進(jìn)一步提升已用、實(shí)用性,讓汽車真正成為用戶第三智能空間。
“端到端“助推高階智駕快速普及
除了智能座艙,智能駕駛輔助技術(shù)在今年也實(shí)現(xiàn)了革命性的進(jìn)步。今年3月,特斯拉推出采用“端到端”自動(dòng)駕駛解決方案的V12版本FSD(全稱Full-Self Driving,完全自動(dòng)駕駛)能夠高度模擬人類駕駛行為,實(shí)現(xiàn)感知決策一體化,引起了全球汽車產(chǎn)業(yè)的震動(dòng)。
所謂“端到端自動(dòng)駕駛”,一般指控制系統(tǒng)讀取原始傳感器的數(shù)據(jù)后,僅通過(guò)神經(jīng)網(wǎng)絡(luò)直接計(jì)算出控制指令,其中不包含任何人為設(shè)計(jì)的規(guī)則模塊。
在特斯拉推出“端到端”后,國(guó)內(nèi)的造車新勢(shì)力企業(yè)也開始上馬“端到端”智駕技術(shù)。小鵬汽車在“520AI DAY”發(fā)布會(huì)上宣布,小鵬國(guó)內(nèi)首個(gè)“端到端”大模型量產(chǎn)上車。7月,理想汽車發(fā)布了基于“端到端”模型、VLM 視覺語(yǔ)言模型和世界模型的全新自動(dòng)駕駛技術(shù)架構(gòu)。
在特斯拉布局“端到端”技術(shù)的時(shí)候,國(guó)內(nèi)智駕公司如Momenta、元戎啟行等也于2023年做出了相關(guān)布局。商湯絕影、百度Apollo、輕舟智航等供應(yīng)商,也公布了各自在“端到端”領(lǐng)域的計(jì)劃和落地進(jìn)展。
傳統(tǒng)自主車企依托智駕供應(yīng)商的技術(shù),也快速實(shí)現(xiàn)了“端到端”的上車。8月,采用元戎啟行“端到端”智駕方案的魏牌全新藍(lán)山,成為中大型新能源SUV市場(chǎng)的爆款車型。采用Momenta“端到端”高階智駕方案的廣汽埃安第二代AION V霸王龍、埃安RT都取得了不錯(cuò)的市場(chǎng)反響。
與“端到端”技術(shù)一起發(fā)展的還有去激光雷達(dá)的純視覺技術(shù)路線。小鵬汽車發(fā)布了AI鷹眼視覺方案,華為帶來(lái)了ADS SE(乾崑智駕的基礎(chǔ)版)、卓馭(原大疆車載)帶來(lái)了成行平臺(tái)。智駕供應(yīng)商如鑒智機(jī)器人、商湯絕影、文遠(yuǎn)知行等也都發(fā)布了純視覺智駕方案。
“純視覺+端到端,讓高階智駕技術(shù)快速迭代、快速普及。地平線方面向經(jīng)濟(jì)觀察網(wǎng)表示,截至2024年10月,中國(guó)自主品牌高階智駕滲透率達(dá)到了11.7%,2024年推出的NEV新車種,L2+及以上級(jí)別智能駕駛功能的搭載率超過(guò)50%。
在“端到端“技術(shù)正火熱,眾多車企甚至還沒上馬端到端技術(shù)之際,“一段式端到端”又成為眾多自動(dòng)駕駛公司和車企的布局重點(diǎn)。
相比“兩段式端到端”方案將信息經(jīng)過(guò)感知模型過(guò)濾后再到規(guī)控模型的兩個(gè)信息處理環(huán)節(jié),“一段式端到端”將智駕的感知、預(yù)測(cè)決策、規(guī)劃多個(gè)模塊合為一體,直接從傳感器輸入外部環(huán)境信息,并輸出車輛的行駛軌跡,只有一個(gè)信息處理環(huán)節(jié)。
今年4月的北京車展上,商湯絕影發(fā)布了其“一段式端到端“自動(dòng)駕駛技術(shù)DriveAGI;?9月底,Momenta也發(fā)布了首個(gè)量產(chǎn)“一段式端到端”智駕大模型。小米、華為等眾多企業(yè)也開始布局“一段式端到端“。
辰韜資本聯(lián)合多家單位在8月發(fā)布的2024年度《端到端自動(dòng)駕駛行業(yè)研究報(bào)告》認(rèn)為,“一段式端到端”系統(tǒng)中性預(yù)期落地時(shí)間會(huì)晚于模塊化端到端1~2年時(shí)間,從2026年至2027年開始上車量產(chǎn)。
在AI大模型推高智能座艙和智駕競(jìng)爭(zhēng)天花板的同時(shí),AI算力也在急劇消耗。人工智能三要素是數(shù)據(jù)、算法、算力,整個(gè)產(chǎn)業(yè)鏈?zhǔn)堑谷墙Y(jié)構(gòu),越往算力方向發(fā)展,能提供高算力的廠家越少。
根據(jù)中國(guó)電動(dòng)汽車百人會(huì)的數(shù)據(jù),“端到端”智能駕駛領(lǐng)域的起步算力為1 EFLOPS,而座艙大模型的基礎(chǔ)模型算力需求大于10EFLOPS,垂域模型算力需求為數(shù)百到數(shù)千PFLOPS?。
理想狀態(tài)下,一家車企在“端到端”大模型上消耗的算力就高達(dá)100 EFLOPS。但數(shù)據(jù)顯示,國(guó)內(nèi)車企現(xiàn)有的算力都在10 EFLOPS以下,中國(guó)移動(dòng)、中國(guó)電信、中國(guó)聯(lián)通三大運(yùn)營(yíng)商的規(guī)劃算力合計(jì)才53 EFLOPS。
如何追求端云一體化,更好地執(zhí)行更高的算力,降低主機(jī)廠單車成本,同時(shí)優(yōu)化云端算力成本,是當(dāng)前行業(yè)面臨的主要挑戰(zhàn)。