北美時間2月20日,人形機器人公司Figure AI發(fā)布新型通用人形機器人VLA模型Helix。本次Figure發(fā)布的視頻當(dāng)中能看到,有兩臺搭載了Helix模型的Figure機器人共同協(xié)作,完成了拾取任意物品并分類的任務(wù)操作。VLA模型是指視覺(Vision)-語言(Language)-動作(Action)模型,機器人可以將感知、語言等多模態(tài)的信息和學(xué)習(xí)到的控制能力結(jié)合,從而輸出執(zhí)行命令的動作。
2022年Google首發(fā)了人形機器人模型RT-1,并在2023年年底更新到了RT-2。Google RT-1是對視覺和語言進行訓(xùn)練和反饋,而RT-2則升級成了端到端VLA模型。TrendForce集邦咨詢指出,由于端到端大模型需要大量長任務(wù)數(shù)據(jù),搜集數(shù)據(jù)和訓(xùn)練數(shù)據(jù)的時間較長,當(dāng)下大多數(shù)人形機器人公司采用的是分層端到端大模型,通過決策大模型(即多模態(tài)或者大語言模型)和操作控制大模型相互配合。
相比于多模態(tài)大模型,端到端的VLA模型更貼近于人類感知-決策-執(zhí)行的模式,更加適用于具身智能系統(tǒng),F(xiàn)igure發(fā)布VLA模型Helix無疑讓行業(yè)在端到端大模型的技術(shù)革新上更進一步。Figure官方表示數(shù)據(jù)搜集只用了約500小時,并且Helix是首個能夠完全在嵌入式低功耗 GPU 上運行的 VLA 模型。鑒于當(dāng)下僅有少量Figure機器人在寶馬車廠試點工作,未進入到批量生產(chǎn)的規(guī)模,真實工作的場景類別和數(shù)據(jù)量的多樣性及規(guī)模較??;Helix是否如官方宣傳版本的高效低能耗,還需要隨著Figure在2025Q2開始批量生產(chǎn)之后再次接受市場檢驗。
除了人形機器人軟件端的技術(shù)更新之外,日前馬斯克在特斯拉2024Q4財報電話會上再次提起Optimus的量產(chǎn)計劃,預(yù)計2025年首條產(chǎn)線的量產(chǎn)能力將是1000臺/月,之后將升級為10000臺/月。預(yù)計2026H1發(fā)布新一代量產(chǎn)版本,2026H2將開始對外出售。TrendForce集邦咨詢指出,這一舉措標(biāo)志特斯拉正在加速推進人形機器人Optimus的量產(chǎn)計劃;同時本月Figure AI和Open AI的終止合作以及Apple公開表示開啟智能機器人項目,都證明頭部科技公司對智能機器人的關(guān)注度和投入力度在持續(xù)攀升。根據(jù)TrendForce集邦咨詢測算,特斯拉人形機器人供應(yīng)鏈公司將會在2025Q1-Q2開始逐漸送樣并確定Tier1的主要公司,預(yù)計2025年將是人形機器人初步商業(yè)化的重要元年。
關(guān)注我們
全球高科技產(chǎn)業(yè)研究機構(gòu)
TrendForce集邦咨詢是一家橫跨存儲、集成電路與半導(dǎo)體、晶圓代工、光電顯示、LED、新能源、智能終端、5G與通訊網(wǎng)絡(luò)、汽車電子和人工智能等領(lǐng)域的全球高科技產(chǎn)業(yè)研究機構(gòu)。公司在行業(yè)研究、政府產(chǎn)業(yè)發(fā)展規(guī)劃、項目評估與可行性分析、企業(yè)咨詢與戰(zhàn)略規(guī)劃、品牌營銷等方面積累了多年的豐富經(jīng)驗,是政企客戶在高科技領(lǐng)域進行產(chǎn)業(yè)分析、規(guī)劃評估、顧問咨詢、品牌宣傳的優(yōu)質(zhì)合作伙伴。