理想汽車是國(guó)內(nèi)最成功、最早實(shí)現(xiàn)盈利的造車新勢(shì)力,2025年以來(lái)銷量依舊保持快速增長(zhǎng)。不過(guò)理想汽車的成功,主要來(lái)自于增程式電動(dòng)系統(tǒng)的成功運(yùn)用、精準(zhǔn)的高端定位、寬敞的內(nèi)部空間等方面,智能化方面表現(xiàn)出來(lái)的領(lǐng)先優(yōu)勢(shì)并不多。
現(xiàn)在,理想汽車準(zhǔn)備補(bǔ)上這個(gè)短板。近日理想汽車提交了一枚名為“理想VLA”的商標(biāo)申請(qǐng),揭示了理想的一個(gè)大動(dòng)作。業(yè)內(nèi)人士認(rèn)為,這是理想汽車正在豪賭下一代的智能駕駛的第一步。那么,理想VLA到底是什么呢?
理想VLA到底是什么?
按照理想汽車的說(shuō)法,理想VLA的目標(biāo)是在今年下半年突破VLA智駕大模型的落地難關(guān)。值得一提的是,目前智駕領(lǐng)域的主流模式是端到端,而且只在部分高端車型上才能實(shí)現(xiàn),并沒(méi)有真正普及。那么,理想的理想VLA模型,是要另起爐灶嗎?
實(shí)際上,VLA這個(gè)詞在智能化應(yīng)用領(lǐng)域并不陌生,它的三個(gè)字母分別對(duì)應(yīng)視覺(jué)-語(yǔ)言-動(dòng)作。而在決定研發(fā)VLA模型之前,理想汽車已經(jīng)在2024年10月底推送了端到端+VLM大模型,不過(guò)在理想汽車看來(lái),這套大模型仍然不足以稱為完美。
目前流行的端到端大模型,實(shí)際上是人工智能的一種最新應(yīng)用。常規(guī)的智駕系統(tǒng),一般是由工程師先寫(xiě)好規(guī)則,然后將感知到的實(shí)際路況與這些規(guī)則進(jìn)行匹配;而端到端智駕則是用人工智能模型來(lái)取代感知、規(guī)劃、控制三個(gè)模塊,讓智駕系統(tǒng)對(duì)于車輛的操作更接近人的水準(zhǔn)。
但端到端模型目前仍然無(wú)法完全理解一些極端路況,在這種情況下,部分廠商便希望通過(guò)打“補(bǔ)丁”的方式來(lái)完善自身的端到端模型。而理想汽車的VLM模型就是這樣一個(gè)“強(qiáng)勁的“補(bǔ)丁”,其自身是一個(gè)多模態(tài)的視覺(jué)語(yǔ)言模型,對(duì)圖像和場(chǎng)景的理解能力更強(qiáng),從而能夠提升智駕的精準(zhǔn)度。
可以這么說(shuō),VLM模型針對(duì)的就是少量端到端智駕無(wú)法理解的復(fù)雜場(chǎng)景。
但這樣一來(lái),端到端智駕與VLM就又成了兩個(gè)獨(dú)立的模型,這勢(shì)必會(huì)影響整個(gè)智駕系統(tǒng)的性能。
除此之外,多一個(gè)模型就會(huì)多占用一部分芯片,這在算力緊張的情況下并不是一個(gè)好的選擇。而理想的VLA模型,就是希望將端到端、VLM兩個(gè)模型合二為一。
根據(jù)目前已經(jīng)公布的信息,理想VLA智駕在復(fù)雜路口的決策準(zhǔn)確率已經(jīng)達(dá)到了98.7%,在行業(yè)內(nèi)具有明顯的領(lǐng)先優(yōu)勢(shì)。
在部分機(jī)構(gòu)做的200類罕見(jiàn)物體的抓取測(cè)試中,理想VLA的準(zhǔn)備率也接近90%,同樣在行業(yè)內(nèi)遙遙領(lǐng)先。
除了理想 還有誰(shuí)在做?
理想積極研發(fā)的VLA模型,屬于比端到端更前沿的技術(shù),但中國(guó)新能源汽車市場(chǎng)的技術(shù)競(jìng)爭(zhēng)非常激烈,VLA模型雖然上處于前期的起步階段,但已經(jīng)有不少?gòu)S商在做了。
比較典型的就是吉利汽車,2025年3月初,吉利汽車對(duì)旗下的智駕方案進(jìn)行整合,發(fā)布了統(tǒng)一的千里浩瀚智駕系統(tǒng),這套智駕系統(tǒng)從低端到高端分為五個(gè)版本,其中高階智駕方案就準(zhǔn)備落地VLA模型。
同時(shí),獨(dú)立的智能駕駛解決方案供應(yīng)商元戎啟行,也計(jì)劃在今年推出VLA智駕方案,這個(gè)全新領(lǐng)域的競(jìng)爭(zhēng)正在逐步加碼。
此外,華為、小鵬等品牌推動(dòng)的端到端智駕也在快速普及,整個(gè)智駕領(lǐng)域的競(jìng)爭(zhēng)越來(lái)越激烈,這會(huì)給理想汽車帶來(lái)不小的壓力。
理想VLA將會(huì)面臨哪些挑戰(zhàn)?
從理論上來(lái)說(shuō),理想VLA的技術(shù)前景還是比較誘人的,因此被部分業(yè)內(nèi)人士稱為最終版的智駕解決方案。但需要注意的是,理論是一回事兒,能否商業(yè)化又是另外一回事兒。理想VLA模型在推進(jìn)過(guò)程中,會(huì)遇到各種各樣的問(wèn)題。
首先,理想VLA模型是準(zhǔn)備將端到端和VLM兩個(gè)模型的數(shù)據(jù)進(jìn)行深度交融,這對(duì)理想開(kāi)發(fā)團(tuán)隊(duì)的技術(shù)水平提出了極高的要求,同時(shí)也意味著更高的研發(fā)成本,而且短期內(nèi)不太可能有什么收益。
其次,理想VLA模型是一種比端到端更復(fù)雜的智駕模型,這也意味著它需要更強(qiáng)的算力去支撐其運(yùn)行,目前主流高端新能源汽車搭載兩顆英偉達(dá)智駕芯片,算力達(dá)到508TOPS,就已經(jīng)是很不錯(cuò)的了,而從理論上來(lái)講,VLA模型可能需要1000TOPS的算力,這在現(xiàn)有條件上很難實(shí)現(xiàn)。
除此之外,這樣的大模型也意味著它對(duì)高端芯片的需求更大,而芯片則是目前國(guó)內(nèi)新能源汽車行業(yè)僅剩的幾個(gè)容易被斷供、卡脖子的領(lǐng)域。短期來(lái)看,國(guó)產(chǎn)廠商對(duì)英偉達(dá)等國(guó)外芯片廠商的依賴難以擺脫,這樣的因素,也會(huì)帶來(lái)技術(shù)上的風(fēng)險(xiǎn),尤其是在商業(yè)化落地環(huán)節(jié)。
從總體上看,理想VLA路線的確提供了一種不錯(cuò)的技術(shù)路線,并且已經(jīng)得到了吉利、長(zhǎng)城等廠商的認(rèn)可。但從客觀角度來(lái)說(shuō),在端到端智駕尚未普及的情況下,VLA模型更像是一種前瞻性研究,距離落地還有比較遠(yuǎn)的距離。但無(wú)論怎么樣,這樣的技術(shù)嘗試,對(duì)行業(yè)和消費(fèi)者來(lái)說(shuō)都是一件好事兒。