隨著智能算力需求的倍增,到2024年,千卡算力集群已成為國內大模型訓練的必備場景。壁仞科技,作為國內少數擁有原創(chuàng)訓推一體架構的高端算力芯片廠商之一,與在AI算力市場具有重要影響力的無問芯穹在千卡訓練集群、大模型推理服務等領域開展了深度的研發(fā)合作。
近日,經壁仞科技與無問芯穹聯合研發(fā)攻關,成功將壁仞科技的千卡規(guī)模訓練集群在無問芯穹Infini-AI異構云平臺上進行納管和調度,已實現并完整驗證了彈性容錯、異常節(jié)點探測、檢查點保存與加載、斷點續(xù)訓四大功能。
與此同時,基于壁仞科技BIRENSUPA??軟件工具鏈和無問芯穹大模型訓練引擎,雙方通過并行策略層和計算加速層優(yōu)化,持續(xù)深挖壁仞大算力優(yōu)勢,在壁仞科技GPU上實現了LLM模型訓練性能提升近1倍。
在大模型推理服務方面,壁仞科技最新發(fā)布的高性能、低功耗壁礪110E推理卡在同機架高度下,AI算力密度最高可達到市場主流云端PCIE8卡服務器方案的1.3倍以上。此外,能耗節(jié)省達70%,顯著降低整體系統(tǒng)的總擁有成本。
當前,壁礪110E推理卡已在無問芯穹Infini-AI異構云平臺的GenStudio大模型服務平臺中上線,可廣泛應用于大模型多模態(tài)生成、圖像及語音識別、自然語言處理、搜索與推薦等人工智能推理應用場景,支持大規(guī)模分布式推理。在基于壁礪110E的多級推理平臺上,結合無問芯穹GenStudio精選模型開放API,已經形成文生圖/圖生圖的秒級出圖、多模態(tài)大型語言模型(LLM)圖文交互和圖像理解、移動端聊天應用等多個大模型推理應用場景的商業(yè)級用戶業(yè)務支撐能力。
壁礪110E GPGPU卡
目前,壁仞科技的“壁礪106系列”和“壁礪110系列”GPU產品已完成與無問芯穹Infini-AI異構云平臺的全面接入。這些產品支持中間層、大模型算法庫、工具庫和應用層的分級部署、管理、加速等平臺能力,以及各項優(yōu)化策略。未來,雙方將繼續(xù)攜手,在大規(guī)模自主可控智能算力集群優(yōu)化與運營等方面深化合作,進一步提升面向商業(yè)化算力客戶場景的聯合服務水平。
壁仞科技作為國內領先的GPU芯片廠商,秉承“擔當、卓越、協(xié)作、創(chuàng)新、務實、共贏”的價值觀,不斷提升技術競爭力,并與合作伙伴攜手,從實際用戶需求出發(fā),致力于打造性能卓越且具有高性價比的國產AI訓練集群方案。