人工智能的概念誕生于1956年的Dartmouth學會,麥卡錫在此次會議上正式提出人工智能的概念。人工智能經(jīng)過半個多世紀的發(fā)展,目前已經(jīng)應用在機器人,語音識別,圖像識別,自然語言處理,專家系統(tǒng)等領域。當然還有近幾年超火的芯片設計領域,國內(nèi)AI芯片公司也如雨后春筍般涌現(xiàn)。地平線,燧原,天數(shù)智芯,寒武紀,比特大陸.....每家也都推出了自己的芯片產(chǎn)品。
目前市場上的對于AI芯片并無明確統(tǒng)一的定義,廣義上所有面向人工智能(Artificial Intelligence,AI),包括Training(訓練)和Inference(推理)應用的芯片都可以被稱為AI芯片。[1]
目前市面上的AI芯片種類太多了,各種PU(process unit)層出不窮,從最常見的CPU,GPU,到現(xiàn)在的BPU,DPU,VPU,NPU等等(當然有一些PU在嚴格意義上來講,并不算AI芯片),感覺在命名上,26個英文字母已經(jīng)快不夠了,今天就梳理一下常見的各種PU,看看他們都是如何在各自的領域發(fā)揮作用的。
APU(Accelerated Processing Units)
中文名字叫加速處理器,是AMD在2011年推出的融聚未來理念產(chǎn)品。它第一次將處理器和獨顯核心做在一個晶片上,協(xié)同計算、彼此加速,使得任務可以靈活地在CPU和GPU間分配,提高效率。
就在6.1號,蘇媽現(xiàn)身主題為“AMD Accelerating – The High-Performance Computing Ecosystem.”的發(fā)布會,發(fā)布了兩款APU,分別是R7-5700G和R5-5600,將于8月5號開售。
當然,APU也可以指Audio Processing Unit,專門用于處理聲音數(shù)據(jù)的單元。
BPU(Brain Processing Unit)
BPU是自動駕駛芯片及解決方案公司研發(fā)的一款AI芯片?;趧?chuàng)新的人工智能專用計算架構 BPU,地平線已成功流片量產(chǎn)了中國首款邊緣人工智能芯片——專注于智能駕駛的征程(Journey) 1 和專注于 AIoT 的旭日(Sunrise) 1 ;2019 年,地平線又推出了中國首款車規(guī)級 AI 芯片征程 2 和新一代AIoT智能應用加速引擎旭日 2 ;2020年,地平線進一步加速AI芯片迭代,推出新一代高效能汽車智能芯片征程 3 和全新一代 AIoT 邊緣 AI 芯片平臺旭日 3 。
近日,2021款理想ONE汽車搭載雙“征程3”芯片,地平線的AI芯片已經(jīng)受到業(yè)內(nèi)車企的廣泛認可。
CPU(central processing unit)
這個大家太熟悉了,CPU的結構主要包括運算器(ALU, Arithmetic and Logic Unit)、控制單元(CU, Control Unit)、寄存器(Register)、高速緩存器(Cache)和它們之間通訊的數(shù)據(jù)、控制及狀態(tài)的總線。
DPU(Deep-Learning Processing Unit)
DPU的概念最早由深鑒科技提出,成立于2016年,其產(chǎn)品則是基于FPGA的處理單元,擁有業(yè)界較為領先的機器學習能力,專注于神經(jīng)網(wǎng)絡剪枝、深度壓縮技術及系統(tǒng)級優(yōu)化。2018年被Xilinx收購。
DPU也指Dataflow Processing Unit 數(shù)據(jù)流處理器, Wave Computing 公司提出的AI架構;Data storage Processing Unit,深圳大普微的智能固態(tài)硬盤處理器。
EPU(Emotion Processing Unit)
EPU這個詞,我也是第一次聽。EPU是由Emoshape公司提出的。Emoshape是一家致力于提供可教導智能機器與人類互動技術的公司。EPU基于微控制器(MCU)設計,在人工智能(AI)、機器人和消費電子設備中促成近乎無限的認知過程產(chǎn)生真正情緒反應。EPU是Ekman理論的延伸,該理論利用情緒進化理論識別12種主要情緒。
EPU的部分主要功能包括:
- 具有高性能機器情緒意識
- 在智能機器中創(chuàng)造情緒狀態(tài)和合成情緒
- 讓人工智能或機器人能夠體驗64萬億種不同的情緒狀態(tài)
- 向其他人工智能技術傳送數(shù)據(jù),以獲得一系列真實的表情和互動,并且全面了解語言和評價
- 對話準確率高達98%
FPU(Floating Processing Unit)
做浮點運算的模塊
GPU(Graphics Processing Unit)
可以說這幾年GPU太火爆了!國內(nèi)很多AI芯片公司都是做GPU的。在5年以前,想在國內(nèi)公司做GPU是很難的,但現(xiàn)在則有很多初創(chuàng)公司進入GPU領域,比如天數(shù),沐曦,景嘉微等。
GPU被廣泛用于嵌入式系統(tǒng)、移動電話、個人電腦、工作站和電子游戲解決方案當中。現(xiàn)代的GPU對圖像和圖形處理是十分高效率的,這是因為GPU被設計為很高的并行架構這樣使得比通用處理器CPU在大的數(shù)據(jù)塊并行處理算法上更具有優(yōu)勢。
從硬件設計上來講,CPU 由專為順序串行處理而優(yōu)化的幾個核心組成。另一方面,GPU則由數(shù)以千計的更小、更高效的核心組成,這些核心專為同時處理多任務而設計。
串行運算示意圖
并行運算示意圖
所以,GPU在圖像處理等任務上,有極大的優(yōu)勢,結合自動駕駛等應用場景,使得GPU成為芯片行業(yè)的新寵。
HPU(Holographic Processing Unit)
全息處理器。微軟HoloLens是世界上首臺獨立的全息計算機設備,能夠提供高清晰度的全息影像,其秘密在于HoloLens搭載的Holographic Processing Unit(全息處理單元,簡稱HPU),這是一款定制芯片,可以處理和交互不同傳感器及Intel Atom的數(shù)據(jù)串流。
IPU(Intelligence Processing Unit)
英國AI芯片創(chuàng)業(yè)公司Graphcore率先提出的概念,即智能處理器。成立于2016年,總部位于英國布里斯托,Graphcore的主要業(yè)務是設計用于AI應用程序的處理器,為云服務等應用提供產(chǎn)品支持。
今年5月20號,在第五屆世界智能大會上,Graphcore的MK2 IPU正式亮相,工藝為7納米,集成了594億個晶體管,具有1472個真正獨立的處理器內(nèi)核。IPU-M2000是一款即插即用的機器智能刀片式計算單元,集成了4顆MK2 IPU,可提供1 petaFLOPS機器智能計算。
JPU
JPU目前還沒有明確的概念,有一稱說是Job Processing Unit,叫這個名字完全沒有任何特點。
KPU(Knowledge Processing Unit)
嘉楠耘智的K210就是一款基于自主研發(fā)的神經(jīng)網(wǎng)絡KPU,基于RISV-V架構,目前已經(jīng)應用在多個領域。
另外中科馭數(shù)也提出了KPU概念,其KPU是專為加速特定領域核心功能計算設計的一種協(xié)處理器架構,以功能核作為基本單元,直接對應用中的計算密集性應用進行抽象和高層綜合,實現(xiàn)以應用為中心的架構“定制”,有效解決特定領域的海量數(shù)據(jù)處理問題。
LPU
目前業(yè)內(nèi)還沒有關于LPU的定義,大家快來搶??!
MPU(Micro Processing Unit)
微處理器,與CPU概念相近,不做過多的介紹。
NPU(Neural-Network Processing Unit)
做NPU的公司不止一家,這里介紹一下平頭哥的含光NPU。2019年9月,T-Head發(fā)布了首個數(shù)據(jù)中心芯片-含光800。瀚光800是一款12nm高性能人工智能推理芯片,集成了170億個晶體管,實現(xiàn)了820 TOPS的峰值計算能力。在行業(yè)標準ResNet-50測試中,實現(xiàn)了78563 IPS的推理性能和500 IPS/W的能效率比。
OPU
OPU在業(yè)內(nèi)也沒有明確的概念,有想法的同學們早點下手。
PPU(Physics Processing Unit)
物理運算處理器。PPU是進行模擬物理計算的處理器,CPU是為了達到更快的運算速度,GPU是為了達到更好的圖像效果,那么PPU就是用于溝通虛擬電子世界和普遍存在的物理真實,使畫面更加真實,貼近現(xiàn)實。在GDC2005首次提出PPU這個概念。
QPU(Quantum Processing Unit)
量子處理器,利用量子疊加性快速遍歷問題的各種可能性并找到正確答案。QPU算力隨比特數(shù)n的增長呈冪指數(shù)2n增長。目前無論國內(nèi)還是國外在量子計算領域都處于探索階段。
RPU
Radio Processing Unit? Resistive Processing Unit? 目前來看,PRU在業(yè)內(nèi)被提及的少之又少。這兩個概念也很少聽到。
SPU
Service Processing Unit?Standard Product Unit?Streaming Processing Unit?沒有一個能打的!
TPU(Tensor Processing Unit)
張量處理器,它是谷歌在2015年6月的I/O開發(fā)者大會上推出的計算神經(jīng)網(wǎng)絡專用芯片,為優(yōu)化自身的TensorFlow機器學習框架而打造,主要用于AlphaGo系統(tǒng),以及谷歌地圖、谷歌相冊和谷歌翻譯等應用中,進行搜索、圖像、語音等模型和技術的處理。
至今,谷歌已經(jīng)發(fā)布了四代TPU。
UPU(unified processor unit)
是深圳中微電科技有限公司(ICube)提出的概念。特點是把CPU和GPU兩種異質核統(tǒng)一在一個芯核內(nèi),并采用獨有的不犧牲效率的多線程技術。
中微電不僅提供UPU IP,還提供芯片,其IC1是第一個基于UPU的移動系統(tǒng)芯片,已于去年推出工程樣片,主頻600MHz,是雙核-8線程。預計明年底推出IC2芯片,主頻1GHz,四核-16線程。
VPU(Vector Processing Unit)
一指矢量處理器,是Intel收購的Movidius公司推出的圖像處理與人工智能的專用芯片的加速計算核心。
還有Vision Processing Unit,Video Processing Unit,和GPU功能接近。
WPU
一指Wearable Processing Unit,Ineda Systems公司推出的可穿戴SoC產(chǎn)品,現(xiàn)在已經(jīng)沒有消息了。二指Web Processing Unit。
XPU
X代表未知,代表無限,任何一個尚未研發(fā)出來的處理器都可以認為是X處理器!目前的話,如果非要選一個,那么就選Xilinx-XPU吧。
YPU
這個真沒有......
ZPU(Zylin Processing Unit)
Zylin是一家挪威公司,ZPU是其推出的一款32位開源處理器。目前我們依然可以在github上看到它的開源代碼。
zylin/zpu
在人工智能,深度學習等概念全面融入芯片設計的時代,各家AI芯片公司順勢而起,各種概念也是層出不窮。而26個英文字母也面臨著即將用盡的情況。沒關系,不用慌,大不了用兩個字母嘛。在未來的AI芯片浪潮中,能有多少能真正把概念做成產(chǎn)品推廣到市場還是未知數(shù)。芯片是一個盈利周期長且投資巨大的行業(yè),潮水退去后,我們就知道到底哪些公司在裸泳。
AI芯片設計在國內(nèi)處于百花齊放的狀態(tài),相比國外,我們不算落后,這是我們希望看到的,也希望AI芯片能為我們帶來更具想象力的應用場景。
參考
^https://www.graphcore.ai/posts/machine-learning-processors-for-both-training-and-inference