POST TIME:2018-12-03 21:12
文/顏萌 李林(編譯)
量子位 出品 | 公眾號 QbitAI
所到之處,英偉達CEO黃仁勛例行強調(diào):我們是一家AI公司。
誰又能說不是?
市值兩年上漲 7 倍,芯片供不該求,屢戰(zhàn)英特爾,堅持懟谷歌,是當前AI大紅大紫中的實力玩家,也是AI大潮中最閃亮耀眼的明星縮影。
創(chuàng)立 24 年來,從游戲芯片供應(yīng)商,到AI芯片壟斷者,英偉達儼然歷史欽定。
不過,回溯英偉達的風(fēng)云際會,歷史進程縱然功不成沒,個人奮斗更是不容忽視——沒有瀕臨破產(chǎn)時的豪賭,沒有在CUDA上百億美元的押注,又怎會有如今風(fēng)光無限的英偉達和黃教主。
《紐約時報》記者Don Clark,決定揭秘英偉達“奇幻漂流”背后的關(guān)鍵時刻。
這不止是一個豪賭出奇跡的案例。
英偉達轉(zhuǎn)折點
轉(zhuǎn)折點是“CUDA”。
CUDA,英偉達的并行計算平臺和編程模型。在它出現(xiàn)之前,英偉達的主要芯片GPU只是一個負責(zé)在屏幕上繪制圖像的“圖形處理單元”。
但CUDA的出現(xiàn),讓GPU擁有解決復(fù)雜計算問題的能力,可以幫手客戶為差別的任務(wù)對處理器進行編程。
好比遠在波蘭的圖像識別公司CTA.ai,可以用它幫手篩查腸道圖像——僅需要病患咽下一個藥丸大小的傳感器,就能讓醫(yī)生檢測腸道功能紊亂的速度能夠比視頻檢查快速70%,不但檢查成本降低,并且診斷結(jié)果更精確。
對于類似的GPU應(yīng)用,CTA.ai并不孤單。
GPU也正出現(xiàn)在越來越多出現(xiàn)在新興設(shè)備上,好比無人車、機器人、自動駕駛汽車、辦事器、超級計算機和虛擬現(xiàn)實設(shè)備。
它幾乎是AI市場最為核心的需求品類,因為當前只有英偉達的GPU,才能快速處理各種復(fù)雜的人工智能任務(wù),如圖像識別、臉部識別和語音識別,甚至深度學(xué)習(xí)加速、氣候建模,石油勘探都必需標配GPU。、
實際上,這樣的應(yīng)用,遠超老黃的最初預(yù)期。
黃仁勛生于臺灣,在俄勒岡州立大學(xué)和斯坦福大學(xué)學(xué)習(xí)電子工程,后來在硅谷的芯片制造商工作。
1993 年,他和Chris Malachowsky、Curtis Priem一起創(chuàng)辦了英偉達,最初,他們給游戲PC提供視覺特效,幫它們和那些專業(yè)的電子游戲機競爭。
Malachowsky說,公司最初的產(chǎn)品并不可功,而圖形市場對手眾多。后來,英偉達重組了它的產(chǎn)品和戰(zhàn)略,逐漸與對手拉開距離,最終成就了在游戲PC中GPU加速器卡的絕對的領(lǐng)導(dǎo)地位。
GPU生成三角形以形成框架結(jié)構(gòu),模擬對象,為顯示屏上的像素賦予顏色。要做到這一點,必需并行執(zhí)行許多簡單的指令,這就是圖形芯片隨著微型處理器數(shù)量的增加,性能優(yōu)化的原因。
如何最大化利用這些微處理器的并行計算能力,始終是英偉達核心關(guān)心的問題。
也是CUDA誕生的原因。
實習(xí)生杰作
2004 年,斯坦福大學(xué)博士生Ian Buck進入英偉達實習(xí),這是CUDA研發(fā)的開端。當時,Buck參與過一項編程競賽,任務(wù)是讓能更容易地辦理GPU的眾多計算引擎。
△ Ian Buck 來源:heise.de
CUDA的核心設(shè)計理念就是計算機中的線程。與傳統(tǒng)CPU中的4、 8 和 16 個線程差別,GPU中的線程可以多達幾萬個。
Buck體現(xiàn),看起來這些線程的辦理是一件十分復(fù)雜的事情。但實際上,編程人員主要的困難在于如何發(fā)揮這些線程的優(yōu)勢,而不是辦理這些線程。早期,CUDA的性能主要依賴編程人員人工發(fā)現(xiàn)代碼中可并行計算的部分。
目前,隨著CUDA庫的發(fā)展,這方面的工作開始越來越自動化。CUDA團隊已經(jīng)開發(fā)了很多石油、天然氣和國防等相關(guān)產(chǎn)業(yè)所使用的科學(xué)計算方面的庫。最終, 2012 年發(fā)布的Titan超級計算機使用了 18688 個NVIDIA Tesla K20 GPU作為協(xié)處理器,標識表記標幟著GPGPU在高性能計算方面的成功推廣和應(yīng)用。從 2011 年開始,Top 500 的超級計算機中至少有 50 臺會使用GPU進行加速。而這些機器基本上也都出現(xiàn)在Green 500(全球節(jié)能超級計算機榜單)的列表中。
Buck曾體現(xiàn),在CUDA的應(yīng)用傍邊,最讓其影響深刻的就是,,乳腺癌檢測和診斷的系統(tǒng)。與傳統(tǒng)方法比擬,采用支持CUDA編程的Tesla GPU后,醫(yī)生能夠更早、更精確地發(fā)現(xiàn)乳腺癌。而美國國家癌癥研究所數(shù)據(jù)顯示,基于CUDA的系統(tǒng)在運行蛋白質(zhì)配體運算(用于研發(fā)治療癌癥和老年癡呆癥的新藥)時只需要本來1/ 12 的時間。
此后,CUDA開始受到越來越多的關(guān)注。