“AI鋼鐵俠”黃仁勛 又進化了英偉達
2024年,英偉達一年一度的GTC大會已然成為AI界春晚,現(xiàn)場座無虛席,全球AI愛好者翹首以待黃仁勛的SOLO。
北京時間3月19日凌晨,GTC終于拉開大幕。英偉達創(chuàng)始人兼CEO黃仁勛一如既往一身黑色皮衣登場,率先發(fā)布了全新架構平臺Blackwell和相關的GPU新品,包括B100、B200、GB200超級芯片。
同時,英偉達還升級了自動駕駛芯片平臺Thor,使用了Blackwell架構并支持生成式AI;在大熱的機器人方面,英偉達發(fā)布人形機器人通用基礎模型Project GR00T、新型人形機器人計算機Jetson Thor,并對NVIDIA Isaac機器人平臺進行升級。
軟件層面,英偉達推出了NIM微服務、Omniverse Cloud API。不止于此,英偉達也在深入半導體產業(yè)鏈上游,臺積電和新思將在生產中使用英偉達計算光刻平臺NVIDIA cuLitho,從而加快先進半導體芯片的制造速度。從硬件到軟件,英偉達繼續(xù)全方位碾壓并與同行拉開代際差距。
Forrester副總裁兼首席分析師戴鯤向21世紀經濟報道記者表示:“英偉達的軟硬件一體化生態(tài)發(fā)展相當迅猛,同時英偉達也在繼續(xù)開放生態(tài)邊界?!?/p>
在GTC大會兩小時的演講中,黃仁勛再一次回顧了AI發(fā)展歷程和計算進化史,多年前他親手把第一臺AI超級計算機DGX交到OpenAI手中時,命運的齒輪就開始轉動。如今,在黃仁勛看來,加速計算已經來到了臨界點,通用計算后勁不足,需要新的計算方式。而生成式AI是這個時代的決定性技術,Blackwell GPU是推動這場新工業(yè)革命的引擎。
在業(yè)績拉動方面,Counterpoint Research副研究總監(jiān)Brady Wang向記者預測道,英偉達2024年數(shù)據(jù)中心收入將超過720億美元,同比增長134%。
截至3月19日,英偉達股價為885美元/股,市值約2.2萬億美元。
圖片來源:視覺中國
Blackwell架構和AI超級芯片
先看英偉達最新一代的GPU芯片架構Blackwell,這一命名致敬了數(shù)學家David Harold Blackwell。Blackwell接棒兩年前推出的Hopper架構,這兩年間,Hopper助力了英偉達業(yè)務和股價飆升。
而隨著多模態(tài)大模型的演進,英偉達認為需要更多、更大的GPU。于是在現(xiàn)場,黃仁勛從口袋中掏出了基于Blackwell架構的芯片,黃仁勛說:“Hopper很棒,但我們需要更大的GPU。”
在Blackwell架構家族中,黃仁勛著墨最多的是NVIDIA GB200 Grace Blackwell超級芯片,由兩個B200 Blackwell GPU和一個Grace CPU連接而成,比Hopper芯片更大。
其中,B200 GPU包含2080億個晶體管,可以支持高達10萬億個參數(shù)的AI模型。而B200則由兩顆B100裸片通過片間互聯(lián)技術整合而來,Blackwell整體采用臺積電4納米家族下的4NP定制工藝。
新系列的芯片預計將于今年晚些時候上市,AWS、戴爾、谷歌、Meta、微軟、OpenAI和特斯拉計劃使用Blackwell GPU。
同時,英偉達還發(fā)布了GB200 NVL72液冷機架系統(tǒng),其中包含36顆GB200 Grace Blackwell Superchips。與當前的H100 GPU相比,該系統(tǒng)的推理工作負載性能最多能提高30倍。
若從訓練性能看,在具有1750億個參數(shù)的GPT-3 LLM基準測試中,GB200的性能是H100的7倍,并且訓練速度是H100的4倍。
可以看到,新一代芯片在推理側有著突飛猛進的增長,訓練端也實現(xiàn)了翻倍。英偉達一直是訓練端的王者,但是在推理側也面臨激烈的競爭。
英偉達的另一個優(yōu)勢則在于成本和能效。黃仁勛介紹稱,使用前一代Hopper架構產品,以90天的時間訓練一個1.8萬億參數(shù)規(guī)模的大模型,需要動用8000顆GPU,并耗電15兆瓦;若使用Blackwell,則僅需要2000顆GPU,電力消耗亦降低至4兆瓦。
在AI芯片上,英偉達繼續(xù)一騎絕塵,進一步鞏固業(yè)界的主導地位。同時,英偉達的同行和客戶也在發(fā)力自研AI芯片,英特爾、AMD虎視眈眈,大客戶云廠商也在加大投入。
對于競合關系,英偉達相關負責人向21世紀經濟報道記者表示:“我們正與云廠商共同工程化,將他們的最佳技術堆棧與NVIDIA的AI技術整合在一起,提供一個為生成性AI專門構建的服務。”
自動駕駛芯片擴大朋友圈
自動駕駛一直是英偉達看重的AI方向之一。英偉達很早就推出了面向汽車智駕的AI計算平臺NVIDIA DRIVE,并已經迭代了多系列的自動駕駛芯片,包括Thor、Orin等。
其中,DRIVE Thor是英偉達專為汽車行業(yè)的生成式AI應用而打造的車載計算平臺,可提供座艙功能、高度自動化駕駛和無人駕駛功能。而英偉達的DRIVE系列芯片平臺就要做汽車的最強大腦,目前,其在車規(guī)級高算力自動駕駛芯片擁有超過80%的市場份額。
在英偉達看來,NVIDIA DRIVE Thor將改變汽車行業(yè)的格局,進入生成式AI定義駕駛體驗的時代。如今包括英偉達、英特爾在內的芯片廠商,正在爭奪生成式AI芯片的新市場。
汽車廠商也必然不會錯過新時代,比亞迪、廣汽埃安旗下昊鉑、小鵬、理想、極氪等都將在DRIVE Thor上構建下一代電動車。
除乘用車外,DRIVE Thor還將應用于卡車、自動駕駛出租車等細分領域。比如,文遠知行正在與聯(lián)想一同基于DRIVE Thor來創(chuàng)建多個商用L4級自動駕駛解決方案,該解決方案集成在聯(lián)想首款自動駕駛域控制器AD1中。
文遠知行相關負責人向21世紀經濟報道記者表示,DRIVE Thor可實現(xiàn)最高2000TOPS算力,較DRIVE Orin提升了八倍之多。并且,文遠知行預測革命性變化會出現(xiàn)在對自動駕駛模型的建模方式上。
“現(xiàn)階段的自動駕駛還是一個以理解(analysis)為主的模型,通過解析傳感器數(shù)據(jù)去理解周邊的障礙物和場景,預測它們的行為和意圖,然后規(guī)劃自車(主視角在自己車上)未來的行為軌跡。我們預測一個新的范式是通過生成式的方式去建模,目前仍屬于比較前沿的探索領域?!鄙鲜鲐撠熑苏f道。
首發(fā)人形機器人大模型
今年人形機器人成為另一個聚光燈焦點,英偉達也在加大投資和研發(fā)力度,黃仁勛認為:“機器人的ChatGPT時刻可能很快就會到來?!?/p>
在今年GTC上,英偉達也在機器人和具身智能領域放大招。英偉達發(fā)布了人形機器人通用基礎模型Project GROOT,以及基于NVIDIA Thor系統(tǒng)級芯片(SoC)的新型人形機器人計算機Jetson Thor。
大模型GR00T驅動的機器人將能夠理解自然語言,并通過觀察人類行為來模仿動作。SoC可提供每秒800萬億次8位浮點運算AI性能,以運行GR00T等多模態(tài)生成式AI模型。
在戴鯤看來,英偉達面向人形機器人推出大模型和相關Jetson Thor軟硬件技術棧,會極大加速人形機器人生態(tài)體系的技術發(fā)展與業(yè)務創(chuàng)新。
和英偉達合作的機器人公司包括1X Technologies、Agility Robotics、Apptronik、波士頓動力公司、Figure AI、傅利葉智能、Sanctuary AI、宇樹科技和小鵬鵬行等。在發(fā)布會上,這些機器人產品和黃仁勛同臺,并且還有迪士尼的orange和green登臺,和黃仁勛進行互動。
另一個值得關注的軟件新產品是NIM微服務。戴鯤向21世紀經濟報道記者分析道:“NIM是個推理平臺,融合了底層的CUDA、對自身和第三方大模型的支持、對主流推理框架和云平臺的集成,可以加速生成式人工智能模型推理全過程,對于包括內容生成、現(xiàn)代知識管理、情景式聊天機器人等各類生成式場景在內的工作負載的加速起到了關鍵作用,是NVIDIA企業(yè)級AI平臺的最后一塊拼圖。”
此外,英偉達推出了NVIDIA Omniverse Cloud API,通過接口開發(fā)者可以將Omniverse的技術直接集成到數(shù)字孿生等軟件應用程序中,英偉達正在將Omniverse引入Apple Vision Pro。
可以看到,英偉達構建起越來越強大的AI生態(tài),正在引領生成式AI的新紀元。在上一次工業(yè)革命中,電是重要能源,百年后新一輪工業(yè)革命正在進行,黃仁勛認為,現(xiàn)在我們正在利用基礎設施創(chuàng)造新型的電子(能源),現(xiàn)在的工廠是AI工廠,它們將生產具有高價值的AI產品。
在發(fā)布會上,黃仁勛還提到了英偉達的靈魂:計算機圖形學、物理學、人工智能的交集。從GB200到人形機器人的GROOT,英偉達還在不斷拓展邊界,GROOT或許隱喻著“I’m ROOT”,似乎要成為全球人工智能的根。