• 正文
    • 那么,什么是 NVLink?
    • NVLink 的歷史
    • “樂高式”計算鏈路
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

什么是 NVLink?

2023/04/19
2093
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

NVLink 是加速系統(tǒng)中 GPU 和 CPU 處理器的高速互連技術,推動數(shù)據(jù)和計算加速得出可執(zhí)行結果。

加速計算是一項曾經(jīng)只有政府研究實驗室中才有的高性能計算能力。如今,它已成為主流技術。

銀行、汽車制造商、工廠、醫(yī)院、零售商等機構需要處理和理解的數(shù)據(jù)日益增加,他們現(xiàn)在正在采用 AI 超級計算機來處理這些堆積如山的數(shù)據(jù)。

這些強大、高效的系統(tǒng)如同一條條“超級計算高速公路”。它們在多條并行路徑上同時傳輸數(shù)據(jù)和計算,可以瞬間得出可執(zhí)行結果。

GPU 和 CPU 處理器是“公路”沿途的資源,而快速互連通道是通往它們的“匝道”。NVLink 是加速計算互連通道的黃金標準。

那么,什么是 NVLink?

NVLink 是 GPU 和 CPU 之間的高速連接通道。它由一個強大的軟件協(xié)議組成,通常通過印在計算機板上的多對導線實現(xiàn),可以讓處理器以閃電般的速度收發(fā)共享內(nèi)存池中的數(shù)據(jù)。

如今,第四代 NVLink 連接主機和加速處理器的速度高達每秒 900GB/s。

這是傳統(tǒng) x86 服務器的互連通道——PCIe 5.0 帶寬的 7 倍多。由于每傳輸 1 字節(jié)數(shù)據(jù)僅消耗 1.3 皮焦,因此 NVLink 的能效是 PCIe 5.0 的 5 倍。

NVLink 的歷史

NVLink 最初作為 NVIDIA P100 GPU 的互連通道推出,之后便與每一代新的 NVIDIA GPU 架構同步發(fā)展。

2018 年,NVLink 首次亮相便被用于連接兩臺超級計算機——Summit 和 Sierra 的 GPU 和 CPU,成為了高性能計算領域的焦點。

這兩套安裝在美國橡樹嶺國家實驗室和美國勞倫斯利弗莫爾國家實驗室的系統(tǒng)正在推動藥物研發(fā)、自然災害預測等科學領域的發(fā)展。

帶寬翻倍,繼續(xù)發(fā)展

2020 年,第三代 NVLink 將每個 GPU 的最大帶寬翻倍提高至 600GB/s,每個 NVIDIA A100 Tensor Core GPU 中都有十幾條互連通道。

A100 為全球各地企業(yè)數(shù)據(jù)中心云計算服務和 HPC 實驗室的 AI 超級計算機提供動力。

如今,一個 NVIDIA H100 Tensor Core GPU 中包含 18 條第四代 NVLink 互連通道。這項技術已承擔了一項新的戰(zhàn)略任務——幫助打造全球領先的 CPU 和加速器。

芯片到芯片互聯(lián)

NVIDIA NVLink-C2C 是一種板級互連技術,它能夠在單個封裝中將兩個處理器連接成一塊超級芯片。比如它通過連接兩塊 CPU 芯片,使 NVIDIA Grace CPU 超級芯片具有 144 個 Arm Neoverse V2 核心,為云、企業(yè)和 HPC 用戶帶來了高能效性能。

NVIDIA NVLink-C2C 還將 Grace CPU 和 Hopper GPU 連接成 Grace Hopper 超級芯片,將用于處理最棘手的 HPC 和 AI 工作的加速計算能力集合到一塊芯片中。

計劃在瑞士國家計算中心投入使用的 AI 超級計算機 Alps 將是首批使用 Grace Hopper 的計算機之一。這套高性能系統(tǒng)將在今年晚些時候上線,用于處理從天體物理學到量子化學等領域的大型科學問題。

Grace CPU 包含 144 個 Arm Neoverse V2 核心,通過 NVLink-C2C 互連。

Grace 和 Grace Hopper 還非常適合用于提升高要求云計算工作負載的能效。

例如 Grace Hopper 是最適合用于推薦系統(tǒng)的處理器。這些互聯(lián)網(wǎng)的經(jīng)濟引擎需要快速、高效地訪問大量數(shù)據(jù),才能每天向數(shù)十億用戶提供數(shù)萬億條結果。

與使用傳統(tǒng) CPU 的 Hopper 相比,采用 Grace Hopper 的推薦系統(tǒng)的性能提高了 4 倍,并且效率更高。

另外,NVLink 還被用于為汽車制造商提供的強大系統(tǒng)級芯片,包括 NVIDIA Hopper、Grace 和 Ada Lovelace 處理器等。車載計算平臺 NVIDIA DRIVE Thor 將數(shù)字儀表板、車載信息娛樂、自動駕駛、泊車等諸多智能功能統(tǒng)一整合到單個架構中。

“樂高式”計算鏈路

NVLink 的作用就像是樂高積木的凸粒和凹槽。它是構建超級系統(tǒng)以處理超大型 HPC 和 AI 工作的基礎。

例如,NVIDIA DGX 系統(tǒng)中的八個 GPU 上的 NVLink 通過 NVSwitch 芯片共享快速、直接的連接。它們共同組成了一個 NVLink 網(wǎng)絡,使服務器中的每一個 GPU 都是一套系統(tǒng)的一部分。

為了獲得更強大的性能,DGX 系統(tǒng)本身可以堆疊成由 32 臺服務器組成的模塊化單元,形成一個強大、高效的計算集群。

NVLink 是一項關鍵的技術,它可以讓用戶輕松地將模塊化的 NVIDIA DGX 系統(tǒng)擴展成為一個 AI 性能高達 1 EXAFLOP 的 SuperPOD。

用戶可以利用 DGX 內(nèi)部的 NVLink 網(wǎng)絡與兩者之間的 NVIDIA Quantum-2 InfiniBand 交換以太網(wǎng),將 32 個 DGX 系統(tǒng)模塊連接成一臺 AI 超級計算機。例如,一臺 NVIDIA DGX H100 SuperPOD 包含 256 個 H100 GPU,可提供最高 1 EXAFLOP 的峰值 AI 性能。

如要進一步提高性能,用戶還可以使用云中的 AI 超級計算機,例如微軟Azure使用數(shù)萬個 A100 和 H100 GPU 打造的超級計算機。OpenAI 等團隊正在使用這項服務訓練一些全球最大的生成式 AI 模型。

這再次印證了加速計算的力量。

 

英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

自1993年成立以來,NVIDIA一直在視覺計算的藝術與科學發(fā)展中勇當先鋒. NVIDIA公司的諸多技術正在徹底改變顯示世界的面貌,在高級渲染、高性能計算,乃至遠端云服務,你都將看到NVIDIA的身影.