作者 |??ZeR0,編輯?|??漠影
放棄訓(xùn)練,專注推理。
芯東西5月9日報道,據(jù)EETimes報道,美國AI芯片獨角獸SambaNova Systems近期宣布將裁員77人,約占其500名員工的15%。此次裁員正值該公司偏離最初目標(biāo),放棄做AI訓(xùn)練,轉(zhuǎn)向完全專注于AI推理。
SambaNova成立于2017年,總部位于美國加州,曾希望為訓(xùn)練和推理打造基于統(tǒng)一架構(gòu)的AI芯片,2023年發(fā)布了一款專為大語言模型微調(diào)和推理設(shè)計的芯片。其上一輪融資是2021年的D輪融資,使其融資總額超過11億美元(約合人民幣80億元),估值超過50億美元(約合人民幣362億元)。SambaNova發(fā)言人稱,該公司做出了一些調(diào)整,以適應(yīng)當(dāng)前的市場狀況以及從模型訓(xùn)練到微調(diào)和推理的轉(zhuǎn)變。
SambaNova已迅速轉(zhuǎn)向?qū)W⒂谔峁┰苾?yōu)先解決方案,幫助企業(yè)和開發(fā)者大規(guī)模部署開源模型。在AI訓(xùn)練市場,英偉達(dá)的統(tǒng)治地位難以撼動。相對而言,在AI推理市場收獲客戶可能性更大。隨著大模型服務(wù)日益普及,模型推理亟需更高性價比的算力基礎(chǔ)設(shè)施,這使得數(shù)據(jù)中心AI推理芯片市場規(guī)模被空前看好。數(shù)據(jù)中心領(lǐng)域的AI芯片和硬件創(chuàng)企已轉(zhuǎn)向通過云端提供對開源大語言模型的API訪問。SambaNova的目標(biāo)客戶群是企業(yè)市場,他們正嘗試通過云服務(wù)部署基于大語言模型的應(yīng)用程序來進(jìn)入推理領(lǐng)域,去年9月首次推出SambaNova Cloud。該公司的軟件棧SambaNova Studio面向企業(yè)AI,并隨SambaNova機架式硬件一起提供,用于本地集群和云端。
近幾個月來,AI芯片獨角獸SambaNova、Cerebras、Groq,通過自有硬件提供大語言模型token服務(wù)。這三家公司最初都專注于為其他云服務(wù)提供商和本地AI計算銷售硬件系統(tǒng),其中SambaNova和Cerebras仍在銷售硬件系統(tǒng)。SambaNova平臺搭載其第四代處理器SN40L。SN40L采用數(shù)據(jù)流架構(gòu)和三層內(nèi)存架構(gòu),提高了AI推理效率。通過整合超大內(nèi)存,單個SambaNova系統(tǒng)即可容納數(shù)TB的模型。
根據(jù)獨立AI基準(zhǔn)測試公司Artificial Analysis的測試結(jié)果,SambaNova在DeepSeek R1 671B上平均每秒每位用戶可交付250個token,而使用GPU的提供商平均每秒每位用戶僅交付19個token,這意味著SambaNova的推理性能平均比GPU驅(qū)動的系統(tǒng)快10倍以上。盡管多家AI芯片創(chuàng)企曾披露“超越英偉達(dá)”的雄心,并試圖通過提供更具競爭力的價格來打動客戶,但芯片市場競爭非常殘酷,英偉達(dá)的生態(tài)影響力難以撼動,其他在AI芯片市場上有所作為的供應(yīng)商也以芯片大廠居多。精簡團(tuán)隊、聚焦主線,是近期多家芯片企業(yè)為改善業(yè)績、增強競爭力的主要手段。隨著企業(yè)適應(yīng)不斷變化的行業(yè)競爭和經(jīng)濟(jì)狀況,2025年科技行業(yè)的裁員名單預(yù)計會變得更長。
來源:SambaNova,EETimes