VLA

加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機(jī)器人或者汽車(chē)運(yùn)動(dòng)軌跡數(shù)據(jù),進(jìn)一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機(jī)器人或者汽車(chē)控制的文本編碼動(dòng)作。

VLA,vision language action。VLA模型是在 VLM 基礎(chǔ)上利用機(jī)器人或者汽車(chē)運(yùn)動(dòng)軌跡數(shù)據(jù),進(jìn)一步訓(xùn)練現(xiàn)有的 VLM,以輸出可用于機(jī)器人或者汽車(chē)控制的文本編碼動(dòng)作。收起

查看更多
  • 解讀理想VLA司機(jī)大模型:你不用付費(fèi)的專(zhuān)屬“代駕”
    在2025理想AI Talk第二季活動(dòng)上,理想汽車(chē)董事長(zhǎng)兼CEO李想聚焦理想汽車(chē)最新推出的VLA司機(jī)大模型,不僅展示了“司機(jī)Agent”,更通過(guò)他本人對(duì)AI與人性的深度思考,勾勒出了智能汽車(chē)發(fā)展的新范式——AI不應(yīng)該是簡(jiǎn)單地將"汽車(chē)智能化",而是真正實(shí)現(xiàn)"人工智能的汽車(chē)化"。
    解讀理想VLA司機(jī)大模型:你不用付費(fèi)的專(zhuān)屬“代駕”
  • 理想汽車(chē)VLA的三個(gè)為什么?
    理想成功,全靠油箱 - 這是理想汽車(chē)當(dāng)前最想證明給大家-“這是錯(cuò)誤的”。不得不說(shuō),理想非常精準(zhǔn)的抓住汽車(chē)電氣化轉(zhuǎn)型時(shí)候的一個(gè)機(jī)會(huì),找到技術(shù)跨越鴻溝的梯子 - 可油可電而且技術(shù)實(shí)現(xiàn)相對(duì)簡(jiǎn)單的增程式,發(fā)電機(jī)發(fā)電給電池充電,汽車(chē)其他所有結(jié)構(gòu)都類(lèi)似于純電汽車(chē)結(jié)構(gòu)。
    理想汽車(chē)VLA的三個(gè)為什么?
  • 理想智駕的VLA模型及其結(jié)構(gòu)
    我們之前文章《2025年,自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型 2.0 - VLA (Vision Language Action)》分享過(guò)VLA,現(xiàn)在,不少公司已經(jīng)宣稱(chēng)會(huì)在2025年下半年都會(huì)推出此類(lèi)模型結(jié)構(gòu)。所以,本文將通過(guò)理想相關(guān)信息來(lái)拆解分享理想智駕VLA算法。理想VLA模型架構(gòu)的四大核心模塊:
    理想智駕的VLA模型及其結(jié)構(gòu)
  • 特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進(jìn)化
    【觀點(diǎn):全局端到端除了太消耗運(yùn)算和存儲(chǔ)資源外,還很難添加輔助模塊,如應(yīng)對(duì)交通規(guī)則的地圖模塊,特斯拉就是因此幾乎完全無(wú)法適應(yīng)中國(guó)的交通規(guī)則。模塊化端到端將是主流,至少在違反交通規(guī)則處罰力度和廣度都很強(qiáng)的中國(guó)如此,某種意義上講還是快慢雙系統(tǒng),快系統(tǒng)是diffusion planner或policy,慢系統(tǒng)是LLM或VLM?!?/div>
    特斯拉全局端到端走不通,理想與地平線VLA加入diffusion policy再進(jìn)化
  • VLA,是不是自動(dòng)駕駛的下一站?
    中國(guó)農(nóng)歷新年結(jié)束沒(méi)多久,馬斯克就給中國(guó)的特斯拉車(chē)主送上一份大禮——2月26日,在毫無(wú)征兆的情況下特斯拉向中國(guó)區(qū)購(gòu)買(mǎi)了FSD的HW4.0車(chē)主開(kāi)啟了功能推送。此前一度傳言FSD因?yàn)閿?shù)據(jù)問(wèn)題入華時(shí)間將推遲,而且這次推送的是和美國(guó)相同的V13版本,對(duì)于它在中國(guó)的表現(xiàn)大家非常好奇,隨后各大媒體和大V都對(duì)FSD進(jìn)行了詳細(xì)的測(cè)試。
    VLA,是不是自動(dòng)駕駛的下一站?
  • 智駕平權(quán)“最大公約數(shù)”地平線:2024年?duì)I收23.84億元?jiǎng)?chuàng)新高,同比大增53.6%
    地平線機(jī)器人-W(09660.HK,以下簡(jiǎn)稱(chēng)“地平線”)發(fā)布2024年業(yè)績(jī)公告。截至2024年12月31日止,地平線全年?duì)I收23.84億元,同比增長(zhǎng)53.6%;毛利潤(rùn)18.41億元,同比增長(zhǎng)68.3%;現(xiàn)金及現(xiàn)金等價(jià)物儲(chǔ)備同比增加,流動(dòng)性維持充足。公司營(yíng)收與毛利潤(rùn)表現(xiàn)亮眼,增長(zhǎng)勢(shì)頭強(qiáng)勁。 量產(chǎn)規(guī)模加速擴(kuò)大,穩(wěn)居智駕市場(chǎng)領(lǐng)導(dǎo)地位 地平線成立于2015年,是市場(chǎng)領(lǐng)先的乘用車(chē)高級(jí)輔助駕駛(ADAS)和高
    智駕平權(quán)“最大公約數(shù)”地平線:2024年?duì)I收23.84億元?jiǎng)?chuàng)新高,同比大增53.6%
  • Figure AI發(fā)布VLA模型Helix,人形機(jī)器人商業(yè)化元年正在來(lái)臨
    北美時(shí)間2月20日,人形機(jī)器人公司Figure AI發(fā)布新型通用人形機(jī)器人VLA模型Helix。本次Figure發(fā)布的視頻當(dāng)中能看到,有兩臺(tái)搭載了Helix模型的Figure機(jī)器人共同協(xié)作,完成了拾取任意物品并分類(lèi)的任務(wù)操作。VLA模型是指視覺(jué)(Vision)-語(yǔ)言(Language)-動(dòng)作(Action)模型,機(jī)器人可以將感知、語(yǔ)言等多模態(tài)的信息和學(xué)習(xí)到的控制能力結(jié)合,從而輸出執(zhí)行命令的動(dòng)作。
    Figure AI發(fā)布VLA模型Helix,人形機(jī)器人商業(yè)化元年正在來(lái)臨
  • 地平線SuperDrive首發(fā)三大黑科技,決勝智能化競(jìng)爭(zhēng)下半場(chǎng)
    “Beyond the Horizon 地平線智駕科技暢想日”在上海舉辦,回顧地平線以軟硬結(jié)合技術(shù)實(shí)力取得的量產(chǎn)創(chuàng)新成果,展望2025高階智駕爆發(fā)之年。同時(shí),“SuperDrive智駕百人團(tuán)體驗(yàn)活動(dòng)”在上海靜安區(qū)繁華路段開(kāi)展,首發(fā)三大智駕黑科技,打造擬人高效、“10分上手”的智駕體驗(yàn)新標(biāo)桿。 決勝智駕競(jìng)爭(zhēng)賽點(diǎn),以實(shí)力“向上捅破天” 在暢想日上,地平線創(chuàng)始人兼CEO余凱博士帶來(lái)了一場(chǎng)風(fēng)趣而深刻的“智
    地平線SuperDrive首發(fā)三大黑科技,決勝智能化競(jìng)爭(zhēng)下半場(chǎng)
  • 開(kāi)炒VLA,“端到端”過(guò)氣了?
    端到端2.0時(shí)代,會(huì)“嗖”地一下來(lái)了?2024年,智駕領(lǐng)域最熱的詞,就是“端到端”。甚至,到了不聊端到端都沒(méi)法出門(mén)的程度。不過(guò),在這個(gè)光速迭代的智能電動(dòng)化時(shí)代,“端到端”會(huì)被迭代替掉,也是可想而知的。于是,VLM、VLA、世界模型……概念涌現(xiàn),被譽(yù)為“端到端2.0”的VLA(Vision-Language-Action Model,視覺(jué)-語(yǔ)言-動(dòng)作模型)閃亮登場(chǎng)。
    開(kāi)炒VLA,“端到端”過(guò)氣了?
  • 2025年,自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型2.0 - VLA
    太卷了,智能駕駛在國(guó)內(nèi)的落地發(fā)展太迅速了,從體驗(yàn)功能端,大家開(kāi)城大戰(zhàn)打完了之后就進(jìn)入點(diǎn)到點(diǎn)的落地戰(zhàn),點(diǎn)到點(diǎn)弄完了之后肯定Robotaxi大戰(zhàn);而在硬核的軟件技術(shù)端,端到端大模型戰(zhàn)在華為這個(gè)月宣布急攻端到端大模型的信息下,已經(jīng)算是進(jìn)入焦灼狀態(tài)。
    2025年,自動(dòng)駕駛即將開(kāi)“卷”的端到端大模型2.0 - VLA

正在努力加載...