文/顏萌 李林(編譯)
量子位 出品 | 公眾號 QbitAI
所到之處,英偉達CEO黃仁勛例行強調:我們是一家AI公司。
誰又能說不是?
市值兩年上漲7倍,芯片供不應求,屢戰(zhàn)英特爾,堅持懟谷歌,是當前AI大紅大紫中的實力玩家,也是AI大潮中最閃亮耀眼的明星縮影。
創(chuàng)立24年來,從游戲芯片供應商,到AI芯片壟斷者,英偉達儼然歷史欽定。
不過,回溯英偉達的風云際會,歷史進程縱然功不可沒,個人奮斗更是不容忽視——沒有瀕臨破產時的豪賭,沒有在CUDA上百億美元的押注,又怎會有如今風光無限的英偉達和黃教主。
《紐約時報》記者Don Clark,決定揭秘英偉達“奇幻漂流”背后的關鍵時刻。
這不止是一個豪賭出奇跡的案例。
英偉達轉折點
轉折點是“CUDA”。
CUDA,英偉達的并行計算平臺和編程模型。在它出現(xiàn)之前,英偉達的主要芯片GPU只是一個負責在屏幕上繪制圖像的“圖形處理單元”。
但CUDA的出現(xiàn),讓GPU擁有解決復雜計算問題的能力,可以幫助客戶為不同的任務對處理器進行編程。
比如遠在波蘭的圖像識別公司CTA.ai,可以用它幫助篩查腸道圖像——僅需要病患咽下一個藥丸大小的傳感器,就能讓醫(yī)生檢測腸道功能紊亂的速度能夠比視頻檢查快速70%,不僅檢查成本降低,而且診斷結果更精確。
對于類似的GPU應用,CTA.ai并不孤單。
GPU也正出現(xiàn)在越來越多出現(xiàn)在新興設備上,比如無人車、機器人、自動駕駛汽車、服務器、超級計算機和虛擬現(xiàn)實設備。
它幾乎是AI市場最為核心的需求品類,因為當前只有英偉達的GPU,才能快速處理各種復雜的人工智能任務,如圖像識別、臉部識別和語音識別,甚至深度學習加速、氣候建模,石油勘探都必須標配GPU。、
實際上,這樣的應用,遠超老黃的最初預期。
黃仁勛生于臺灣,在俄勒岡州立大學和斯坦福大學學習電子工程,后來在硅谷的芯片制造商工作。
1993年,他和Chris Malachowsky、Curtis Priem一起創(chuàng)辦了英偉達,最初,他們給游戲PC提供視覺特效,幫它們和那些專業(yè)的電子游戲機競爭。
Malachowsky說,公司最初的產品并不成功,而圖形市場對手眾多。后來,英偉達重組了它的產品和戰(zhàn)略,逐漸與對手拉開距離,最終成就了在游戲PC中GPU加速器卡的絕對的領導地位。
GPU生成三角形以形成框架結構,模擬對象,為顯示屏上的像素賦予顏色。要做到這一點,必須并行執(zhí)行許多簡單的指令,這就是圖形芯片隨著微型處理器數(shù)量的增加,性能優(yōu)化的原因。
如何最大化利用這些微處理器的并行計算能力,始終是英偉達核心關心的問題。
也是CUDA誕生的原因。
實習生杰作
2004年,斯坦福大學博士生Ian Buck進入英偉達實習,這是CUDA研發(fā)的開端。當時,Buck參與過一項編程競賽,任務是讓能更容易地管理GPU的眾多計算引擎。
△ Ian Buck 來源:heise.de CUDA的核心設計理念就是計算機中的線程。與傳統(tǒng)CPU中的4、8和16個線程不同,GPU中的線程可以多達幾萬個。
Buck表示,看起來這些線程的管理是一件十分復雜的事情。但實際上,編程人員主要的困難在于如何發(fā)揮這些線程的優(yōu)勢,而不是管理這些線程。早期,CUDA的性能主要依賴編程人員人工發(fā)現(xiàn)代碼中可并行計算的部分。
目前,隨著CUDA庫的發(fā)展,這方面的工作開始越來越自動化。CUDA團隊已經開發(fā)了很多石油、天然氣和國防等相關產業(yè)所使用的科學計算方面的庫。最終,2012年發(fā)布的Titan超級計算機使用了18688個NVIDIA Tesla K20 GPU作為協(xié)處理器,標志著GPGPU在高性能計算方面的成功推廣和應用。從2011年開始,Top 500的超級計算機中至少有50臺會使用GPU進行加速。而這些機器基本上也都出現(xiàn)在Green 500(全球節(jié)能超級計算機榜單)的列表中。
Buck曾表示,在CUDA的應用當中,最讓其影響深刻的就是,乳腺癌檢測和診斷的系統(tǒng)。與傳統(tǒng)方法相比,采用支持CUDA編程的Tesla GPU后,醫(yī)生能夠更早、更精確地發(fā)現(xiàn)乳腺癌。而美國國家癌癥研究所數(shù)據(jù)顯示,基于CUDA的系統(tǒng)在運行蛋白質配體運算(用于研發(fā)治療癌癥和老年癡呆癥的新藥)時只需要原來1/12的時間。
此后,CUDA開始受到越來越多的關注。
Buck還介紹說,他之前和來自很多工業(yè)界的人士交流發(fā)現(xiàn),他們寧愿犧牲性能,也不愿接受一門新的語言。為了能夠給相關編程人員提供很好的入門體驗,從而便于CUDA的推廣,CUDA采用了已經流行的C語言作為基礎。
這樣,編程人員就不需要去學習特定的顯示芯片的指令或是特殊的結構,即可編寫GPU上運行的程序,這毫無疑問促進了CUDA在程序員之間的流行。
此外,英偉達當年做出的一個決定也極為關鍵。現(xiàn)在已是英偉達負責加速計算的副總裁lan Buck回憶說,英偉達讓自家消費級GPU和高端產品都支持CUDA。這就意味著只要研究人員、學生有筆記本電腦或者臺式機,就能在學校實驗室和宿舍里開發(fā)軟件。
英偉達還說服了許多大學開設課程,教學生用他們公司的最新編程技術。程序員們逐漸把GPU應用于氣候建模、勘探石油和天然氣等很多領域。
2012年,GPU的強大能力和深度學習一起,震驚了學術界。當時,加拿大多倫多大學的Geoffrey Hinton帶著兩個學生,用GPU訓練深度神經網(wǎng)絡拿下了ImageNet圖像識別大賽的冠軍。
Buck表示,在GPU出現(xiàn)之前,訓練這樣一個系統(tǒng)可能需要整整一個學期。而有了這項技術,研究人員現(xiàn)在可以在很短的時間內完成這一過程。
“我無法想象要是沒有GPU該怎么做!彼固垢4髮W的副教授Silvio Savarese說。
而對于GPU和英偉達來說,最好的時間已經來到。只是同樣讓人難以想象的是這場從無到有背后的押注。
百億美元押注
這絕對是一場賭上全部身家的押注。而最關鍵的拍板者是英偉達創(chuàng)始人:黃仁勛。
黃仁勛總被國內網(wǎng)友稱為“老黃”,甚至被安上了“核武狂魔、兩彈元勛”的名號,但本質上,他有著像喬教主一樣嚴苛的個性、戰(zhàn)略上的直覺。
也有人習慣把他和喬布斯相提并論,除了個性和才能之外,他們同樣喜歡穿一身深色衣服,甚至同樣為公司建了一棟引人注目的大樓。當然,改變英偉達命運的CUDA,和改變蘋果命運的iPhone,也有不少相似之處——至少它們都誕生在同一年,都堪稱孤膽押注。
當時是,老黃宣布要通過一些列軟件開發(fā)和修改工作,讓GPU勝任各種任務,不再只是負責在屏幕上繪制圖像。
但最大的問題是錢、錢、錢!他說:“成本對公司來說奇高無比!
一旦項目啟動,每年砸到CUDA上的研發(fā)成本估算就有5億美元,而當時公司全年的總收入才大約30億美元。也就是說,老黃把整個整個公司的1/6,押注在了和公司核心業(yè)務似乎沒什么關系的一個軟件平臺上。
最后來看,自CUDA推出以來,英偉達在將GPU轉化為更通用的計算工具上投入了將近100億美元。
說巧不巧,正當黃仁勛大舉押注CUDA之時,計算行業(yè)也正在發(fā)生廣泛變革,摩爾定律帶來的計算提升速度正在放緩,這也讓當初借此統(tǒng)治芯片市場的英特爾,地位發(fā)生動搖,即便諸多芯片設計公司試圖從無到有打造更專業(yè)芯片,并讓該類芯片與英特爾處理器一同運行,利用芯片電路的微型化提供更多的好處。
但又怎擋得住英偉達的勢能優(yōu)勢。在英特爾和其他芯片廠商轉型途中,英偉達不需要從頭做起,只要重新定位已有的芯片,利用在CUDA項目中開發(fā)的芯片和軟件,就能逐漸打造出一個廣受程序員和企業(yè)歡迎的技術平臺。
現(xiàn)在,這樣的平臺已然展現(xiàn)在世人面前,但不意味著戰(zhàn)場就此風平浪靜。
芯片戰(zhàn)爭還在繼續(xù)
英偉達的競爭對手們說,在AI領域,芯片制造商之間的斗爭才剛開始。
首先是英特爾,這家傳統(tǒng)芯片巨頭在這場戰(zhàn)爭中不甘落后,接連重金收購了可編程芯片制造商Altera、專注于研究深度學習和機器視覺的其他創(chuàng)業(yè)公司、還有為汽車生產駕駛輔助設備的以色列公司Mobileye。
還有Google,其中最醒目的莫過于最近則發(fā)布的第二代TPU,這是該公司內部開發(fā)的人工智能芯片,在它的助力下,谷歌在圍棋比賽中擊敗了世界冠軍柯潔。谷歌聲稱,這種芯片在某些應用程序中比GPU有更明顯的優(yōu)勢。
當然,諸如Wave Computing之類的初創(chuàng)公司也這么說。
但擊敗英偉達并不容易。
一個很重要的原因是,這家公司有來自游戲市場的,源源不斷的收入,他們能投入到芯片研發(fā)上,比大多數(shù)人工智能競爭對手都要多。
比如說前不久發(fā)布的Volta架構,就投入了30億美元研發(fā)費用,創(chuàng)下了行業(yè)記錄。
英偉達表示,目前有50多萬開發(fā)人員使用GPU。此外,這家公司還打算開源一種芯片架構,免費供其他芯片廠商用在燈泡、攝像頭等低端深度學習應用上,借此在這些自己不打算涉足的領域,擴大粉絲基礎。
老黃說,“人工智能終將影響到世界上的每一家公司,但我們不會什么都做。”
不了解黃仁勛的人以為這是謙虛,熟悉他的人就知道,這是殺伐征戰(zhàn)24年后,老黃敢賭敢贏背后的專注力。