欧美国产亚洲日韩在线三区,日韩无码一区中文

如何訓(xùn)練并評(píng)價(jià)VLM/VLA模型，13大開(kāi)源數(shù)據(jù)集一覽

典型VLM包含四個(gè)組件：視覺(jué)編碼器vision encoder、駕駛視覺(jué)適配器driving adapter、文本編碼器text encoder和大型語(yǔ)言模型（LLM），VLA與VLM相比則多了一個(gè)軌跡規(guī)劃器，一般是基于擴(kuò)散模式。有時(shí)adapter也稱(chēng)為Input Projector：將不同模態(tài)的輸入數(shù)據(jù)映射到共享的語(yǔ)義空間。無(wú)論是VLM還是VLA，LLM都是核心。

佐思產(chǎn)研

360

06/23 17:38

VLA 視覺(jué)語(yǔ)言模型VLM

如何訓(xùn)練并評(píng)價(jià)VLM/VLA模型，13大開(kāi)源數(shù)據(jù)集一覽

自動(dòng)駕駛中常提的VLA是個(gè)啥？

隨著自動(dòng)駕駛技術(shù)落地，很多新技術(shù)或在其他領(lǐng)域被使用的技術(shù)也在自動(dòng)駕駛行業(yè)中得到了實(shí)踐，VLA就是其中一項(xiàng)，尤其是隨著端到端大模型的提出，VLA在自動(dòng)駕駛中的使用更加普遍。那VLA到底是個(gè)啥？它對(duì)于自動(dòng)駕駛行業(yè)來(lái)說(shuō)有何作用？

智駕最前沿

311

06/18 12:47

自動(dòng)駕駛 VLA

一文看懂視覺(jué)語(yǔ)言動(dòng)作模型（VLA）及其應(yīng)用

VLA 應(yīng)該是自動(dòng)駕駛以及機(jī)器人產(chǎn)業(yè)前沿最熱的 AI人工智能詞語(yǔ)。我們之前文章《2025年，自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》也分享和預(yù)言過(guò)它是自動(dòng)駕駛大模型2.0。

Vehicle

1674

06/12 16:51

自動(dòng)駕駛 VLA

一文看懂視覺(jué)語(yǔ)言動(dòng)作模型（VLA）及其應(yīng)用

解讀理想VLA司機(jī)大模型：你不用付費(fèi)的專(zhuān)屬“代駕”

在2025理想AI Talk第二季活動(dòng)上，理想汽車(chē)董事長(zhǎng)兼CEO李想聚焦理想汽車(chē)最新推出的VLA司機(jī)大模型，不僅展示了“司機(jī)Agent”，更通過(guò)他本人對(duì)AI與人性的深度思考，勾勒出了智能汽車(chē)發(fā)展的新范式——AI不應(yīng)該是簡(jiǎn)單地將"汽車(chē)智能化"，而是真正實(shí)現(xiàn)"人工智能的汽車(chē)化"。

硅星人

867

05/12 10:55

智能汽車(chē) 理想汽車(chē)

解讀理想VLA司機(jī)大模型：你不用付費(fèi)的專(zhuān)屬“代駕”

理想汽車(chē)VLA的三個(gè)為什么？

理想成功，全靠油箱 - 這是理想汽車(chē)當(dāng)前最想證明給大家-“這是錯(cuò)誤的”。不得不說(shuō)，理想非常精準(zhǔn)的抓住汽車(chē)電氣化轉(zhuǎn)型時(shí)候的一個(gè)機(jī)會(huì)，找到技術(shù)跨越鴻溝的梯子 - 可油可電而且技術(shù)實(shí)現(xiàn)相對(duì)簡(jiǎn)單的增程式，發(fā)電機(jī)發(fā)電給電池充電，汽車(chē)其他所有結(jié)構(gòu)都類(lèi)似于純電汽車(chē)結(jié)構(gòu)。

Vehicle

894

05/12 10:30

理想汽車(chē) VLA

理想智駕的VLA模型及其結(jié)構(gòu)

我們之前文章《2025年，自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》分享過(guò)VLA，現(xiàn)在，不少公司已經(jīng)宣稱(chēng)會(huì)在2025年下半年都會(huì)推出此類(lèi)模型結(jié)構(gòu)。所以，本文將通過(guò)理想相關(guān)信息來(lái)拆解分享理想智駕VLA算法。理想VLA模型架構(gòu)的四大核心模塊：

Vehicle

1410

04/25 14:33

自動(dòng)駕駛 VLA

特斯拉全局端到端走不通，理想與地平線(xiàn)VLA加入diffusion policy再進(jìn)化

【觀點(diǎn)：全局端到端除了太消耗運(yùn)算和存儲(chǔ)資源外，還很難添加輔助模塊，如應(yīng)對(duì)交通規(guī)則的地圖模塊，特斯拉就是因此幾乎完全無(wú)法適應(yīng)中國(guó)的交通規(guī)則。模塊化端到端將是主流，至少在違反交通規(guī)則處罰力度和廣度都很強(qiáng)的中國(guó)如此，某種意義上講還是快慢雙系統(tǒng)，快系統(tǒng)是diffusion planner或policy，慢系統(tǒng)是LLM或VLM?！?/div>

佐思產(chǎn)研

896

04/09 09:00

特斯拉理想汽車(chē)

特斯拉全局端到端走不通，理想與地平線(xiàn)VLA加入diffusion policy再進(jìn)化

VLA，是不是自動(dòng)駕駛的下一站？

中國(guó)農(nóng)歷新年結(jié)束沒(méi)多久，馬斯克就給中國(guó)的特斯拉車(chē)主送上一份大禮——2月26日，在毫無(wú)征兆的情況下特斯拉向中國(guó)區(qū)購(gòu)買(mǎi)了FSD的HW4.0車(chē)主開(kāi)啟了功能推送。此前一度傳言FSD因?yàn)閿?shù)據(jù)問(wèn)題入華時(shí)間將推遲，而且這次推送的是和美國(guó)相同的V13版本，對(duì)于它在中國(guó)的表現(xiàn)大家非常好奇，隨后各大媒體和大V都對(duì)FSD進(jìn)行了詳細(xì)的測(cè)試。

HiEV大蒜粒車(chē)研所

2449

03/27 13:30

自動(dòng)駕駛端到端

智駕平權(quán)“最大公約數(shù)”地平線(xiàn)：2024年?duì)I收23.84億元?jiǎng)?chuàng)新高，同比大增53.6%

地平線(xiàn)機(jī)器人-W（09660.HK，以下簡(jiǎn)稱(chēng)“地平線(xiàn)”）發(fā)布2024年業(yè)績(jī)公告。截至2024年12月31日止，地平線(xiàn)全年?duì)I收23.84億元，同比增長(zhǎng)53.6%；毛利潤(rùn)18.41億元，同比增長(zhǎng)68.3%；現(xiàn)金及現(xiàn)金等價(jià)物儲(chǔ)備同比增加，流動(dòng)性維持充足。公司營(yíng)收與毛利潤(rùn)表現(xiàn)亮眼，增長(zhǎng)勢(shì)頭強(qiáng)勁。量產(chǎn)規(guī)模加速擴(kuò)大，穩(wěn)居智駕市場(chǎng)領(lǐng)導(dǎo)地位地平線(xiàn)成立于2015年，是市場(chǎng)領(lǐng)先的乘用車(chē)高級(jí)輔助駕駛（ADAS）和高

與非網(wǎng)編輯

756

03/24 08:34

智能駕駛地平線(xiàn)

智駕平權(quán)“最大公約數(shù)”地平線(xiàn)：2024年?duì)I收23.84億元?jiǎng)?chuàng)新高，同比大增53.6%

Figure AI發(fā)布VLA模型Helix，人形機(jī)器人商業(yè)化元年正在來(lái)臨

北美時(shí)間2月20日，人形機(jī)器人公司Figure AI發(fā)布新型通用人形機(jī)器人VLA模型Helix。本次Figure發(fā)布的視頻當(dāng)中能看到，有兩臺(tái)搭載了Helix模型的Figure機(jī)器人共同協(xié)作，完成了拾取任意物品并分類(lèi)的任務(wù)操作。VLA模型是指視覺(jué)(Vision)-語(yǔ)言(Language)-動(dòng)作(Action)模型，機(jī)器人可以將感知、語(yǔ)言等多模態(tài)的信息和學(xué)習(xí)到的控制能力結(jié)合，從而輸出執(zhí)行命令的動(dòng)作。

TrendForce集邦咨詢(xún)

2374

02/21 14:19

人形機(jī)器人 VLA

Figure AI發(fā)布VLA模型Helix，人形機(jī)器人商業(yè)化元年正在來(lái)臨

地平線(xiàn)SuperDrive首發(fā)三大黑科技，決勝智能化競(jìng)爭(zhēng)下半場(chǎng)

“Beyond the Horizon 地平線(xiàn)智駕科技暢想日”在上海舉辦，回顧地平線(xiàn)以軟硬結(jié)合技術(shù)實(shí)力取得的量產(chǎn)創(chuàng)新成果，展望2025高階智駕爆發(fā)之年。同時(shí)，“SuperDrive智駕百人團(tuán)體驗(yàn)活動(dòng)”在上海靜安區(qū)繁華路段開(kāi)展，首發(fā)三大智駕黑科技，打造擬人高效、“10分上手”的智駕體驗(yàn)新標(biāo)桿。決勝智駕競(jìng)爭(zhēng)賽點(diǎn)，以實(shí)力“向上捅破天” 在暢想日上，地平線(xiàn)創(chuàng)始人兼CEO余凱博士帶來(lái)了一場(chǎng)風(fēng)趣而深刻的“智

與非網(wǎng)編輯

1299

01/14 07:22

地平線(xiàn) NOA

地平線(xiàn)SuperDrive首發(fā)三大黑科技，決勝智能化競(jìng)爭(zhēng)下半場(chǎng)

開(kāi)炒VLA，“端到端”過(guò)氣了？

端到端2.0時(shí)代，會(huì)“嗖”地一下來(lái)了？2024年，智駕領(lǐng)域最熱的詞，就是“端到端”。甚至，到了不聊端到端都沒(méi)法出門(mén)的程度。不過(guò)，在這個(gè)光速迭代的智能電動(dòng)化時(shí)代，“端到端”會(huì)被迭代替掉，也是可想而知的。于是，VLM、VLA、世界模型……概念涌現(xiàn)，被譽(yù)為“端到端2.0”的VLA（Vision-Language-Action Model，視覺(jué)-語(yǔ)言-動(dòng)作模型）閃亮登場(chǎng)。

汽車(chē)公社

2244

2024/12/27

智能駕駛端到端

2025年，自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型2.0 - VLA

太卷了，智能駕駛在國(guó)內(nèi)的落地發(fā)展太迅速了，從體驗(yàn)功能端，大家開(kāi)城大戰(zhàn)打完了之后就進(jìn)入點(diǎn)到點(diǎn)的落地戰(zhàn)，點(diǎn)到點(diǎn)弄完了之后肯定Robotaxi大戰(zhàn)；而在硬核的軟件技術(shù)端，端到端大模型戰(zhàn)在華為這個(gè)月宣布急攻端到端大模型的信息下，已經(jīng)算是進(jìn)入焦灼狀態(tài)。

Vehicle

5276

2024/12/24

自動(dòng)駕駛大模型

2025年，自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型2.0 - VLA