黃仁勛:下一個浪潮是物理人工智能
5月19日消息,英偉達CEO黃仁勛在中國臺灣出席臺北國際電腦展(COMPUTEX 2025),發(fā)表主題演講。
?
在演講中,黃仁勛首先強調(diào)了英偉達從芯片制造商向AI基礎設施領導者的轉變。他指出,AI和加速計算正在重塑計算機行業(yè),推動“第四次工業(yè)革命”,并將從云端擴展到邊緣計算,改變數(shù)據(jù)中心、機器人和自動駕駛等領域。
?
黃仁勛詳細介紹了英偉達在AI基礎設施方面的進展,包括構建數(shù)據(jù)中心、開發(fā)專用庫(如cuQuantum、cuDSS等)以加速不同領域的應用,以及推動電信業(yè)的軟件定義化。他還展示了GeForce RTX 50系列顯卡在AI驅(qū)動下的光線追蹤技術,并強調(diào)了CUDA和相關庫在加速計算中的核心地位。
?
此外,黃仁勛介紹了英偉達在AI推理和生成式AI方面的突破,包括推理型AI、物理AI和代理型AI的發(fā)展,以及如何通過Grace Blackwell系統(tǒng)實現(xiàn)高性能計算。他表示,生成式人工智能賦予了我們一次性人工智能。智能遠不止是你從大量數(shù)據(jù)中所學到的東西,代理型人工智能基本上就是理解、思考和行動,是數(shù)字形式的機器人。這些將在未來幾年變得非常重要。他還宣布了與富士康、臺積電合作建造巨型AI超級計算機的計劃,并推出NVLink Fusion技術,以支持構建半定制AI基礎設施。
?
黃仁勛還展示了多款新產(chǎn)品,包括DGX Spark和DGX工作站,這些產(chǎn)品旨在為開發(fā)者和企業(yè)提供強大的AI計算能力。他還介紹了RTX Pro企業(yè)級服務器和Omniverse平臺,強調(diào)了AI在企業(yè)IT中的應用前景,以及如何通過數(shù)字孿生技術推動工業(yè)自動化和機器人技術的發(fā)展。
?
最后,黃仁勛宣布英偉達將在臺北市北投士林區(qū)建立新的辦公園區(qū)——英偉達星系(NVIDIA Constellation),以支持公司不斷增長的業(yè)務需求,并感謝合作伙伴多年來對英偉達的支持。
?
以下是演講實錄:
?
很高興來到這里。我的父母也在觀眾席中,他們在那里。
?
英偉達在這里已經(jīng)超過30年了。這里是我們許多珍貴合作伙伴和親愛朋友的家。多年來,你們見證了英偉達的成長,也見證了我們完成了許多激動人心的成就,并一路與我合作。今天,我們將討論我們在行業(yè)中所處的位置、我們將要去的地方,并宣布一些新產(chǎn)品,令人激動和令人驚喜的產(chǎn)品,這些產(chǎn)品將為我們打開新的市場,創(chuàng)造新的市場、新的增長。我們將討論偉大的合作伙伴,以及我們將如何共同發(fā)展這個生態(tài)系統(tǒng)。
?
眾所周知,我們正處于計算機生態(tài)系統(tǒng)的中心,這是世界上最重要的行業(yè)之一。因此,當需要創(chuàng)造新的市場時,我們必須從這里開始創(chuàng)造,這是理所當然的,位于計算機生態(tài)系統(tǒng)的中心。而且我為你們準備了一些驚喜,一些你們可能猜不到的事情。
當然,我保證我會談論人工智能和機器人技術。
?
英偉達的故事是計算機產(chǎn)業(yè)的重塑。事實上,英偉達的故事也是我們公司的重塑。正如我所說,我已經(jīng)來了30年了,你們中的許多人都經(jīng)歷過我的多次主題演講,你們中的一些人,全部都經(jīng)歷過。回顧這次對話,以及我們過去30年所談論的內(nèi)容,變化是如此巨大。
?
我們最初是一家芯片公司,目標是創(chuàng)建一個全新的計算平臺。在2006年,我們推出了CUDA,它徹底改變了計算的方式。
十年后的2016年,我們意識到一種新的計算方法已經(jīng)到來。這種新的計算方法需要對技術堆棧的每一層進行徹底的改造。處理器是全新的,軟件堆棧是全新的,因此,系統(tǒng)也必然是全新的。
所以我們發(fā)明了一個新的系統(tǒng)。一個在我2006年在GTC大會上宣布它的那天,沒有人理解我在說什么,也沒有人給我下采購訂單的系統(tǒng),叫做DGX-1。
?
DGX-1,我將第一臺捐贈給了一個叫做OpenAI的非營利性公司,它開啟了人工智能革命。
幾年后,我們意識到,事實上,這種新的軟件開發(fā)方式,現(xiàn)在被稱為人工智能,與傳統(tǒng)的軟件運行方式不同。許多應用程序都在大型數(shù)據(jù)中心的少量處理器上運行,我們稱之為超大規(guī)模。這種新型應用程序需要多個處理器協(xié)同工作,為數(shù)百萬人的查詢提供服務。并且該數(shù)據(jù)中心的架構將從根本上不同。
?
我們意識到有兩種類型的網(wǎng)絡。
一條用于南北向流量,因為仍然需要控制存儲,仍然需要擁有一個控制平面,仍然需要連接到外部。但最重要的網(wǎng)絡將會是東西向流量,計算機互相通信,試圖解決一個問題。我們認識到在高性能計算的東西向流量方面,最優(yōu)秀的網(wǎng)絡公司進行大規(guī)模分布式處理。
一家對我們公司非常重要且與我們息息相關的公司,一家名為Mellanox的公司,我們在5年前,即2019年收購了他們。
我們將整個數(shù)據(jù)中心轉換成一個計算單元。之前聽我說過,現(xiàn)代計算機就是一個完整的數(shù)據(jù)中心。數(shù)據(jù)中心是一個計算單元,不再僅僅是一臺PC,不再僅僅是一臺服務器,整個數(shù)據(jù)中心都在運行一個作業(yè),而操作系統(tǒng)將會改變。
?
英偉達的數(shù)據(jù)中心發(fā)展歷程現(xiàn)在已廣為人知。在過去的三年里,已經(jīng)看到了我們正在塑造的一些理念,以及我們?nèi)绾伍_始以不同的視角看待我們的公司。
歷史上沒有任何一家公司,尤其是沒有任何一家科技公司,會一次性公布長達五年的發(fā)展路線圖。沒有人會告訴你接下來會發(fā)生什么,他們對此秘而不宣,極其保密。
然而,我們意識到英偉達不再僅僅是一家科技公司。事實上,我們是一家至關重要的基礎設施公司。如果不了解我將要做什么,又如何規(guī)劃你的基礎設施、你的場地、你的外殼、你的電力、你所有的必要融資,遍布全世界?如果不了解我將要做什么,又怎么可能做到這一切呢?
?
于是,我們相當詳細地描述了我們公司的發(fā)展藍圖,詳細到世界上每個人都可以開始建造數(shù)據(jù)中心。
我們現(xiàn)在意識到,我們是一家人工智能基礎設施公司,一家在全球都至關重要的基礎設施公司。每個地區(qū)、每個行業(yè)、每家公司都將建設這些基礎設施。
那么,這些基礎設施是什么呢?事實上,這些基礎設施與第一次工業(yè)革命非常相似。當人們意識到,通用電氣、西屋電氣、西門子公司意識到,有一種名為電的新型技術,并且需要在世界各地建設新的基礎設施。這些基礎設施成為了社會基礎設施的重要組成部分,如今,這種基礎設施被稱為電力。
?
若干年后,就在我們這一代,我們意識到出現(xiàn)了一種新型的基礎設施,而且這種新的基礎設施非常概念化,難以理解。這種基礎設施被稱為信息。這種信息基礎設施,第一次被描述時,沒有人能理解,但我們現(xiàn)在意識到它就是互聯(lián)網(wǎng),互聯(lián)網(wǎng)無處不在,并且所有事物都與它相連。
現(xiàn)在出現(xiàn)了一種新的基礎設施,這種新的基礎設施建立在前兩種基礎設施之上,而這種新的基礎設施是一種智能基礎設施。我知道現(xiàn)在,當我們說存在智能基礎設施時,這毫無意義。
我向你們保證,10年后,你們回首往事,就會意識到人工智能已經(jīng)融入到一切事物之中。事實上,我們需要人工智能無處不在。而且每個地區(qū)、每個行業(yè)、每個國家、每個公司,都需要人工智能。
?
人工智能現(xiàn)在是基礎設施的一部分。而這種基礎設施,就像互聯(lián)網(wǎng),就像電力一樣,需要工廠。這些工廠本質(zhì)上就是我們今天所建造的東西。它們不是過去的那些數(shù)據(jù)中心。一個價值 1 萬億美元的產(chǎn)業(yè),提供信息和存儲,支持我們所有的企業(yè)資源計劃(ERP)系統(tǒng)和員工。這是一個數(shù)據(jù)中心。一個過去的數(shù)據(jù)中心。從某種意義上說,這與它類似,因為它來自同一個行業(yè)。它來自我們所有人。但它將演變成完全不同的東西。完全獨立于世界的數(shù)據(jù)中心。這些人工智能數(shù)據(jù)中心,如果你愿意這么稱呼它們,實際上被不恰當?shù)孛枋隽恕K鼈儗嶋H上是人工智能工廠。
?
你向它輸入能量,它就會產(chǎn)出極具價值的東西。這些東西被稱為token。到了企業(yè)開始談論上個季度他們生產(chǎn)了多少token的地步。以及上個月他們生產(chǎn)了多少token。很快,我們將討論我們每小時生產(chǎn)多少token。正如每個工廠所做的那樣。
?
因此,世界已經(jīng)發(fā)生了根本性的變化。從我們公司成立的那天起,我就在試圖弄清楚1993年我們的機會有多大。我得出的結論是,英偉達的商機是巨大的。3億美元。我們要發(fā)財了。3億美元的芯片產(chǎn)業(yè)。
?
針對一個價值約一萬億美元的數(shù)據(jù)中心機遇。發(fā)展到如今,一個人工智能工廠,一個價值將以數(shù)萬億美元計的人工智能基礎設施產(chǎn)業(yè)。這就是我們正在從事的令人興奮的未來。
現(xiàn)在,從根本上說,我們所做的一切都建立在幾項重要的技術之上。當然,我經(jīng)常談論加速計算。我經(jīng)常談論人工智能。使英偉達真正特別的是這些能力的融合。尤其重要的是算法、庫,我們稱之為 CUDAX 庫的東西。我們一直在談論庫。事實上,我們是世界上唯一一家不停談論庫的科技公司。這背后的原因是圖書館是我們一切工作的核心。圖書館是這一切的起點。
今天我將向大家展示一些新的圖書館。但在此之前,讓我先預覽一下我今天要講的內(nèi)容。您即將看到的一切都與模擬、科學和人工智能相關。這里展示的都不是藝術。一切都是模擬。只是恰好很美。讓我們來看一下。
?
我現(xiàn)在正站在實時的計算機圖形前。這不是視頻,這是計算機圖形。它由GeForce生成。這是全新的GeForce 5060,RTX 5060。這是華碩的產(chǎn)品。我的好朋友約翰尼在前排。這是微星的產(chǎn)品。我們將這款令人難以置信的GPU縮小并放到了這里。這有道理嗎?
?
這太不可思議了,這就是微星搭載5060顯卡的新款筆記本電腦。英偉達GeForce為世界帶來了CUDA,現(xiàn)在你所看到的,是每一個像素都經(jīng)過了光線追蹤。
我們是如何做到模擬光子,并以這種分辨率提供這種幀率的?原因在于人工智能。我們只渲染十分之一的像素。所以你看到的每個像素中,只有十分之一是實際計算出來的,剩下的九個,由人工智能推測,而且效果堪稱完美,它完美地猜中了。這項技術叫做DLSS,神經(jīng)渲染。我們花費了許多年才開發(fā)出來,從我們開始研究人工智能的那一刻起,就已經(jīng)開始了,所以這已經(jīng)是一個10年的旅程。人工智能徹底革新了計算機圖形學的進步,GeForce將人工智能帶到了世界,現(xiàn)在人工智能又回來革新了GeForce,真的是非常驚人。
GeForce RTX 50系列剛剛完成了其有史以來最成功的發(fā)布,這是我們歷史上最快的發(fā)布,而且PC游戲現(xiàn)在已經(jīng)有30年歷史了,這說明了GeForce有多么令人難以置信。
?
核心在于,一切都始于CUDA。通過使CUDA盡可能地高性能、盡可能地普及,從而使安裝基礎遍布全球,應用程序就能很容易地找到CUDA GPU。安裝基礎越大,就越多的開發(fā)者希望創(chuàng)建庫。庫越多,越能完成令人驚嘆的事情,應用程序越好,用戶受益越多,他們就會購買更多的計算機。計算機越多,CUDA就越多,這種反饋路徑至關重要。
然而,加速計算并非通用計算。通用計算編寫軟件,每個人都用Python或C++編寫,然后進行編譯,通用計算的方法論始終一致:編寫應用程序,編譯應用程序,在CPU上運行它。然而,這種方法從根本上不適用于加速計算,因為如果可以這樣做,它就會被稱為CPU。如果不直接改變CPU,以便你可以編寫軟件、編譯軟件、并在CPU上運行它,那還有什么意義呢?你需要做一些不同的事情,這個事實實際上相當合理。其原因在于,如此多的人致力于通用計算,數(shù)萬億美元的創(chuàng)新投入,怎么可能僅僅因為芯片內(nèi)部的幾個小部件,計算機突然就變得快50倍、快100倍呢?這毫無道理。
因此,我們應用的邏輯是,如果你對應用程序有更深入的理解,你就可以加速它。如果你創(chuàng)建一種更適合加速、以接近光速運行99%運行時的架構,即使它只占代碼的5%,你也可以加速應用程序,這相當令人驚訝。大多數(shù)應用程序中,代碼的一小部分消耗了大部分的運行時。我們觀察到了這一點,因此我們逐個攻克不同的領域。
我剛才向你展示了計算機圖形。我們還有數(shù)值計算庫,這是數(shù)值計算庫。是最普及的數(shù)值計算庫。
Arial和Shona。Arial是世界首個用于5G和6G的GPU加速無線電信號處理方案。一旦我們將其軟件定義化,就可以在其上疊加人工智能。這樣我們就能將人工智能引入5G和6G。
Parabricks用于基因組學分析。Monai用于醫(yī)學影像。Earth 2用于天氣預測。cuQuantum用于量子經(jīng)典計算機架構和計算機系統(tǒng)。
Megatron。這一整行,這一整列包含我們所有的深度學習以及所有用于深度學習訓練和推理的必要庫。這徹底改變了計算。而這一切都始于這些庫。不僅僅是CUDA,還有CUDNN。在CUDNN之上,有Megatron。Megatron,然后是Tensor RTLM。然后最近,用于大型AI工廠的全新操作系統(tǒng),Dynamo。
CUDF用于像Spark和SQL這樣的數(shù)據(jù)幀。結構化數(shù)據(jù)也可以被加速。cuML,經(jīng)典機器學習。Warp,一個框架,一個用于描述 CUDA 內(nèi)核的 Pythonic 框架。非常成功。
cuopt,數(shù)學運算,優(yōu)化。例如旅行商問題。能夠優(yōu)化高度約束、大量變量類型的問題,例如供應鏈優(yōu)化。這是一個了不起的成功。我對 cuopt 非常興奮。
cuDSS 和?cuDSparse,用于稀疏結構模擬器。它們用于 CAE 和 CAD 流體動力學。有限元分析,對于EDA和CAE行業(yè)來說極其重要。
然后,當然還有粗culitho。它是計算光刻領域最重要的庫之一。光掩模制造很容易花費一個月的時間。而且光掩模制造過程需要極高的計算強度。現(xiàn)在有了culitho,我們可以將計算速度提高50倍、70倍。因此,這將為未來將人工智能應用于光刻技術奠定基礎,打開世界。我們在這里擁有優(yōu)秀的合作伙伴。臺積電正在廣泛使用culitho。阿斯麥、新思科技,都是與我們在culitho方面合作的卓越伙伴。
正是這些庫本身使得我們能夠在一個又一個的應用領域、科學領域和物理領域中加速應用,同時也為我們開拓了市場。我們關注特定的區(qū)域和市場,認為這些區(qū)域?qū)τ谵D型到新型計算方式而言非常重要。如果通用計算經(jīng)過這么多年已經(jīng)走到了盡頭,為什么它沒有在每一個行業(yè)都走到盡頭呢?
?
最重要的行業(yè)之一,當然是電信業(yè)。正如世界上的云數(shù)據(jù)中心現(xiàn)在已經(jīng)變成了軟件定義的一樣,電信也應該變成軟件定義的,這是理所當然的。因此,我們花了大約6年的時間來完善和優(yōu)化一個完全加速的無線接入網(wǎng)(RAN)堆棧,它能實現(xiàn)驚人的性能。對于每兆瓦的數(shù)據(jù)速率,或每瓦的數(shù)據(jù)速率,我們現(xiàn)在與最先進的專用集成電路(ASIC)處于同一水平。
一旦我們能夠做到這一點,一旦我們能夠達到那種性能和功能水平,那么之后我們就可以在上面疊加人工智能(AI)。我們在這里有很棒的合作伙伴,如軟銀、T-Mobile、印尼電信和沃達豐正在進行試驗。諾基亞、三星、京瓷正在與我們合作進行全棧開發(fā)。富士通和思科正在進行系統(tǒng)方面的合作。因此,現(xiàn)在我們有能力引入基于5G的人工智能,或者基于6G的人工智能,以及基于計算的人工智能的理念。
?
我們正在利用量子計算來實現(xiàn)這一點。量子計算仍處于含噪聲中等規(guī)模量子 (NISQ) 狀態(tài)。然而,我們已經(jīng)可以開始進行許多非常有用的應用。因此我們對此感到興奮,我們正在開發(fā)一個量子經(jīng)典,或者量子GPU計算平臺,我們稱之為CUDA-cu,并與世界各地出色的公司合作。GPU可以用于預處理和后處理、糾錯以及控制。我預測在未來,所有超級計算機都將擁有量子加速器,所有計算機都將連接cuQPU。因此,一臺超級計算機將是由cuPU、GPU和一些CPU組成的系統(tǒng)。這將是現(xiàn)代計算機的表征。因此,我們與該領域的許多優(yōu)秀公司合作。
人工智能方面,12年前,我們從感知開始,即能夠理解模式、識別語音、識別圖像的人工智能模型。那是開端。過去5年,我們一直在談論生成式人工智能,即人工智能不僅能理解,還能生成的能力。因此,它可以從文本生成文本,比如ChatGPT中一直在使用的那樣;文本到圖像,文本到視頻,視頻到文本;圖像到文本,幾乎任何事物到任何事物。這才是人工智能真正令人驚嘆之處,我們已經(jīng)發(fā)現(xiàn)了一個通用的函數(shù)逼近器,一個通用的翻譯器。它可以從任何事物翻譯到任何其他事物。
?
只要我們能簡單地對其進行標記化,表示信息的比特,那么我們就已經(jīng)達到了一個真正重要的人工智能水平。
生成式人工智能賦予了我們一次性人工智能。你給它一段文本,它就給你一段文本作為回報。那是兩年前,我們首次接觸了聊天機器人GPT。那是重大的、令人驚嘆的突破。你給它一段文本,它會回給你一段文本。它預測下一個詞,預測下一段。
然而,智能遠不止是你從大量數(shù)據(jù)中所學到的東西。智能包括推理能力,包括解決你以前從未見過的問題的能力,包括將問題逐步分解的能力,包括應用一些規(guī)則和定理來解決你從未見過的問題,包括模擬多種選擇并權衡其優(yōu)劣的能力。
你可能聽說過其中的一些技術:思維鏈,將其逐步分解;思維樹,提出大量可能的路徑。所有這些技術都在引領人工智能具備推理能力。
現(xiàn)在,令人驚奇的是,一旦你擁有推理能力,并且擁有感知能力,也就是說,比如,多模態(tài)讀取PDF,你就可以進行搜索,可以使用工具,你就擁有了自主智能。
這種自主智能所做的事情,正是我剛才描述的我們所有人都在做的事情。我們被賦予一個目標,我們將其逐步分解。我們推理要做什么,以及做這件事的最佳方式是什么。我們考慮其后果,然后開始執(zhí)行計劃。該計劃可能包括做一些研究,可能包括做一些工作,使用一些工具。它可能包括聯(lián)系另一個人工智能代理,以便與之協(xié)作。
代理型人工智能基本上就是理解、思考和行動。嗯,理解、思考和行動是機器人學的循環(huán)。代理型人工智能基本上是數(shù)字形式的機器人。這些將在未來幾年變得非常重要。我們正在看到這個領域取得巨大的進展。
?
除此之外的下一個浪潮是物理人工智能,能夠理解世界的人工智能。他們理解慣性、摩擦、因果關系等事物。例如,如果我滾動一個球,球滾到車下,根據(jù)球的速度,它可能滾到了車的另一邊,但球并沒有消失,客體永久性。你或許能夠推斷出,如果你面前有一張桌子,而你必須到另一邊去,最好的方法不是直接穿過去。最好的方法可能是繞過它或從它下面過去。能夠推理這些物理事物對于下一代人工智能至關重要。我們稱之為物理人工智能。
因此,在這個特定的例子中,你看到我們只是提示人工智能,它就生成視頻來訓練自動駕駛汽車在不同的場景中行駛。稍后我會向你展示更多相關內(nèi)容。
那是一只狗。它可以說,“給我生成一只狗”。“給我生成一只帶鳥的,帶人的”。它一開始生成了左邊的圖像。
?
在那之后的階段,我們將采用推理系統(tǒng)、生成系統(tǒng)、物理人工智能,而這種級別的能力將會進入我們稱之為機器人的物理載體中。 如果你能想象提示人工智能生成一個視頻來伸手拿起一個瓶子,當然你也可以想象告訴一個機器人伸手拿起那個瓶子。 今天的人工智能有能力做到這些事情。 這就是我們在不久的將來要實現(xiàn)的目標。
我們?yōu)閷崿F(xiàn)這一目標而構建的計算機,其屬性與之前的計算機截然不同。 名為Hopper的革命性計算機大約在3年前問世,它徹底改變了我們所認知的人工智能。 它可能成為了世界上最流行、最廣為人知的計算機。
在過去的幾年里,我們一直在研發(fā)一種新的計算機,以便我們能夠?qū)崿F(xiàn)推理時間擴展,或者說,能夠以難以置信的速度進行思考。 因為當你思考的時候,你會產(chǎn)生大量的tokens(標記),你會產(chǎn)生大量的想法,并且在你給出答案之前,在你的大腦中進行迭代。 所以,過去的一次性人工智能現(xiàn)在將變成思考型人工智能、推理型人工智能、推理時間擴展型人工智能。 而這將需要更多的計算量。
?
因此,我們創(chuàng)建了一個名為Grace Blackwell的新系統(tǒng)。Grace Blackwell具有多種功能:它具有向上擴展的能力,意味著將一臺計算機變成一臺巨型計算機;向外擴展是指將一臺計算機與多臺計算機連接起來,并讓多臺不同的計算機完成工作。 擴展很容易,向上擴展極其困難。 構建超越半導體物理極限的更大型計算機,難如登天。 而這正是格蕾絲·布萊克威爾所做的。 格蕾絲·布萊克威爾幾乎打破了一切。
在座的各位,你們中的許多人正在與我們合作構建格蕾絲·布萊克威爾系統(tǒng)。 我很高興地說,我們已經(jīng)全面投產(chǎn)。 雖然基于HGX的布萊克威爾系統(tǒng)自去年年底以來一直在全面生產(chǎn),并且自2月起已上市,但我們現(xiàn)在才剛剛將所有格蕾絲·布萊克威爾系統(tǒng)上線。 它們每天都在各地陸續(xù)上線,已經(jīng)在CoreWeave上可用好幾周了,已經(jīng)有很多云服務提供商(CSPs)在使用它。 現(xiàn)在你開始看到它從各個地方涌現(xiàn)出來,每個人都開始發(fā)推文說Grace Blackwell正在全面投產(chǎn)。
在今年第三季度,正如我承諾的,我們將像有節(jié)奏一樣,每年都提高我們平臺的性能。 今年,在第三季度,我們將升級到Grace Blackwell GB300。
GB300 將沿用相同的架構、相同的物理尺寸和相同的電氣機械結構,但內(nèi)部的芯片已經(jīng)升級,使用了一種新的 Blackwell 芯片。
?
現(xiàn)在,它的推理性能提高了 1.5 倍,HBM 內(nèi)存增加了 1.5 倍,網(wǎng)絡吞吐量提高了 2 倍,因此整體系統(tǒng)性能更高。
讓我們看看 Grace Blackwell 內(nèi)部是什么。Grace Blackwell 從計算節(jié)點開始。這是其中一個計算節(jié)點。這是上一代產(chǎn)品 B200 的樣子,這是 B300 的樣子。請注意正中間,現(xiàn)在是 100% 液冷,但除此之外,從外部來看,它是一樣的。你可以把它插入到相同的系統(tǒng)和相同的機箱中。
?
這是 Grace Blackwell GB300 系統(tǒng),它的推理性能提高了 1.5 倍。訓練性能大致相同,但推理性能提高了 1.5 倍。現(xiàn)在,這個特殊的系統(tǒng)算力達到了 40 Petaflops,大約相當于 2018 年 Sierra 超級計算機的性能。
Sierra 超級計算機擁有 18000 個 Volta 架構的 GPU。這里的這一個節(jié)點就取代了整個超級計算機。6 年內(nèi)性能提升了 4000 倍。這就是極端的摩爾定律。記住,人工智能公司 NVIDIA 已經(jīng)實現(xiàn)了大約每 10 年計算能力提升一百萬倍,而且我們?nèi)匀辉谘刂@條軌道前進。
但是實現(xiàn)這一目標的方法不僅僅是提高芯片的速度。芯片的速度和尺寸都有其極限。在 Blackwell 的案例中,甚至將兩個芯片連接在一起,使其成為可能。臺積電與我們合作,發(fā)明了一種名為COOS-L的全新COOS工藝,使我們能夠制造這些巨型芯片。
但即便如此,我們?nèi)匀幌胍冗@更大的芯片。因此,我們必須創(chuàng)造出所謂的NVLink,這是世界上最快的交換機,速率是每秒7.2太字節(jié)。9個這樣的交換機安裝到那個機架中。
?
這9個交換機通過這個奇跡般的裝置連接起來。這就是NVLink骨干網(wǎng),兩英里的電纜,5000根結構化的電纜,全部同軸,其阻抗已匹配。它將所有72個GPU連接到NVLink交換網(wǎng)絡中的其他72個GPU。NVLink骨干網(wǎng)的帶寬為每秒130兆兆字節(jié)。
簡單來說,整個互聯(lián)網(wǎng)的峰值流量為每秒900兆兆比特,除以8,它的流量超過了整個互聯(lián)網(wǎng)的流量。
一個NVLink主干網(wǎng)連接著9個NVLink交換機,這樣每個GPU都可以完全同時地與其他GPU通信。這就是GB200的奇跡。
由于SerDes的驅(qū)動距離有限制,這是SerDes所能達到的最遠距離,它從芯片到交換機,再到主干網(wǎng),到任何其他交換機,任何其他芯片,全部是電信號。因此,這個限制迫使我們將所有東西都放在一個機架中。
現(xiàn)在一個機架是120千瓦,這就是所有東西都必須進行液冷的原因。我們現(xiàn)在有能力將GPU從一個主板上分離出來,本質(zhì)上是分布在一個完整的機架上。那么整個機架就是一塊主板,這就是奇跡,完全解耦。
現(xiàn)在GPU的性能非常驚人,內(nèi)存容量非常驚人,網(wǎng)絡帶寬非常驚人,現(xiàn)在我們真的可以大規(guī)模擴展這些系統(tǒng)。一旦我們向上擴展,我們就可以將它們向外擴展到大型系統(tǒng)中。
英偉達幾乎所有產(chǎn)品都非常龐大,原因在于我們不是在構建數(shù)據(jù)中心和服務器,我們正在建造人工智能工廠。這是CoreWeave,這是Oracle Cloud。每個機架的功率密度非常高,他們必須將它們分隔得更遠,以便功率密度可以分散。但實際上,歸根結底,我們不是在建造數(shù)據(jù)中心,我們正在建造人工智能工廠。
?
這是XAI Colossus工廠,這是星門 (Stargate),4百萬平方英尺,1吉瓦。因此,請想象一下這座工廠,這座1吉瓦的工廠可能需要大約600億到800億美元的投資。在這600億到800億美元中,電子設備和計算部分,也就是這些系統(tǒng),就占了400億到500億美元。所以,這些都是巨大的工廠投資。
人們建造工廠的原因是因為你知道答案,買得越多,生產(chǎn)得越多,這就是工廠所做的事情。
這項技術非常復雜,實際上,僅僅在這里看看,你仍然無法充分領略我們的所有合作伙伴以及在座的所有公司所完成的卓越工作。所以我們?yōu)槟谱髁艘徊坑捌?/p>
?
影片文字:Blackwell 是一項工程奇跡。它始于臺積電的一塊空白硅晶圓。數(shù)百個芯片處理和紫外光刻步驟在 12 英寸晶圓上逐層構建起 2000 億個晶體管。晶圓被劃片成一個個 Blackwell 芯片,經(jīng)過測試和分類,分離出合格的芯片以繼續(xù)后續(xù)流程。
臺積電、Spill 和 Amcor 完成芯片-晶圓-基板(chip-on wafer on substrate)工藝,將 32 個 Blackwell 芯片和 128 個 HBM 堆棧連接到定制的硅中介層晶圓上。 金屬互連走線直接蝕刻到其中,將 Blackwell GPU 和 HBM 堆棧連接到每個系統(tǒng)和封裝單元中,將所有部件鎖定到位。
然后對組件進行烘烤、模塑和固化,從而制造出 Blackwell B200 超級芯片。 在 KYEC,每個 Blackwell 都在 125 攝氏度的烤箱中進行應力測試,并在其極限下運行幾個小時。
回到富士康,機器人日夜不停地工作,將 10000 多個組件拾取并放置到 Grace Blackwell PCB 上。 與此同時,其他組件正在全球各地的工廠中準備。 來自 Cooler Master、AVC、Aorus 和 Delta 的定制液體冷卻銅塊將芯片保持在最佳溫度。在另一家富士康工廠,ConnectX 7 SuperNIC 正在構建中,以實現(xiàn)橫向擴展通信,而 Bluefield 3DPU 則用于卸載和加速網(wǎng)絡、存儲和安全任務。 所有這些部件匯集在一起,被仔細地集成到GB200計算托盤中。
NVLink是英偉達發(fā)明的突破性高速互聯(lián)技術,用于連接多個GPU并擴展成一個巨大的虛擬GPU。 NVLink交換機托盤由NVLink交換機芯片構建,提供每秒14.4太字節(jié)的全互連帶寬。NVLink主干網(wǎng)絡形成一個定制的、盲插式背板,集成了5000根銅纜,可提供每秒130太字節(jié)的全互連帶寬。 這將所有72個Blackwell芯片,或144個GPU裸晶,連接成一個巨大的GPU。
來自世界各地的零部件陸續(xù)運達。 從富士康、緯創(chuàng)、廣達、戴爾、華碩、技嘉、慧與、超微和其他合作伙伴處運來,由熟練的技術人員組裝成機架規(guī)模的AI超級計算機。 總計120萬個組件,2英里的銅纜,130萬億個晶體管,重達1800公斤。從蝕刻到晶圓上的第一個晶體管到固定Blackwell機架的最后一顆螺栓,每一步都承載著合作伙伴的奉獻、精確和工藝。 Blackwell不僅僅是一個技術奇跡,更證明了科技生態(tài)系統(tǒng)的奇跡。為此共同取得的成就感到無比自豪。
?
因此,今天我們宣布,富士康、英偉達、臺積電,我們將在這里為人工智能基礎設施和人工智能生態(tài)系統(tǒng)建造第一臺巨型人工智能超級計算機。
謝謝。有誰需要一臺人工智能計算機嗎?有聽眾席上的任何人工智能研究人員嗎?每一位學生、每一位研究人員、每一位科學家、每一家初創(chuàng)公司、每一家大型成熟公司,臺積電本身已經(jīng)進行了大量的人工智能和科學研究。富士康在機器人技術方面也做了大量的工作。我知道聽眾席上還有許多其他的公司,稍后會提到,你們也在進行機器人技術研究和人工智能研究。因此,擁有世界一流的人工智能基礎設施確實非常重要。
?
所有這些都是為了我們能夠構建一個非常大的芯片。NVLink 和 Blackwell,這一代的技術,使我們能夠創(chuàng)造出這些令人難以置信的系統(tǒng)。這是來自和碩、廣達電腦、緯創(chuàng)和緯穎的系統(tǒng)。這是來自富士康、技嘉和華碩的系統(tǒng)。可以看到它的正面和背面。它的整個目標是利用這些 Blackwell 芯片,可以看到它們有多大,并將它們變成一個巨大的芯片。當然,實現(xiàn)這一目標的能力是由 NVLink 提供的。但這低估了系統(tǒng)架構的復雜性,以及將它們連接在一起的豐富的軟件生態(tài)系統(tǒng)。由 150 家公司共同構建的整個生態(tài)系統(tǒng)。這種架構以及技術、軟件和產(chǎn)業(yè)中的整個生態(tài)系統(tǒng),是三年工作的成果。這是一項大規(guī)模的工業(yè)投資。
現(xiàn)在,我們希望讓任何想構建數(shù)據(jù)中心的人都能做到。它可以是大量的英偉達GB200或300,以及英偉達的加速計算系統(tǒng)。也可以是其他公司的產(chǎn)品。
?
所以今天,我們要宣布一件非常特別的事情。我們要宣布英偉達 NVLink Fusion。NVLink Fusion 旨在讓可以構建半定制的 AI 基礎設施。不僅僅是半定制芯片,因為那已經(jīng)是過去式了。需要構建 AI 基礎設施。而且每個人的 AI 基礎設施都可能略有不同。有些人可能擁有更多的 CPU,有些人可能擁有更多的英偉達 GPU,還有些人可能擁有某種半定制的 ASIC。而那些系統(tǒng)構建起來極其困難。并且它們都缺少一個至關重要的要素。這個至關重要的要素叫做NVLink。NVLink可以擴展這些半定制系統(tǒng),并構建真正強大的計算機。所以今天,我們宣布推出NVLink Fusion。NVLink Fusion的工作方式大致如下。這是英偉達平臺。100%英偉達。
您擁有英偉達CPU、英偉達GPU、NVLink交換機,來自英偉達的網(wǎng)絡,名為Spectrum X或InfiniBand,網(wǎng)卡,網(wǎng)絡互連,交換機。整個系統(tǒng),整個基礎設施都是端到端構建的。
?
現(xiàn)在,當然,您可以隨意混合搭配。而且今天我們使您甚至可以在計算層面上進行混合搭配。這將是您使用定制專用集成電路(ASIC)所做的事情。我們有很多優(yōu)秀的合作伙伴,他們正在與我們合作,以集成您特殊的TPU或您特殊的ASIC,您特殊的加速器。
而且它不一定是轉換器加速器。它可以是您想集成到大型縱向擴展系統(tǒng)中的任何類型的加速器。我們創(chuàng)建了一個NVLink芯片模塊,它基本上是一個緊挨著您的芯片的交換機。將會有IP可用于集成到您的半定制ASIC中。
然后,一旦您完成了這些,它就可以直接安裝到計算板中,并且可以安裝到AI超級計算機的生態(tài)系統(tǒng)中。
現(xiàn)在,也許您想要的是使用您自己的CPU。您已經(jīng)構建自己的CPU一段時間了,也許您的CPU已經(jīng)建立了一個非常龐大的生態(tài)系統(tǒng),并且您希望將NVIDIA整合到您的生態(tài)系統(tǒng)中。現(xiàn)在,我們使您能夠做到這一點。您可以通過構建自定義CPU來實現(xiàn)這一點。
我們?yōu)槟峁㎞VLink芯片間接口,以便集成到您的專用集成電路(ASIC)中。我們使用NVLink芯片組進行連接,現(xiàn)在它可以連接并直接毗鄰Blackwell芯片和我們的下一代Rubin芯片。再次強調(diào),它完全適合這個生態(tài)系統(tǒng)。
這項令人難以置信的工作成果現(xiàn)在變得靈活和開放,供所有人集成。因此,您的人工智能基礎設施可以包含一些NVIDIA組件,還有很多您的自有組件,很多CPU,很多ASIC,也許還有很多NVIDIA GPU。
因此,在任何情況下,您都可以受益于使用NVLink基礎設施和NVLink生態(tài)系統(tǒng),并且它與Spectrum X完美連接。所有這些都具有工業(yè)強度,并且受益于已經(jīng)使其成為可能的龐大工業(yè)合作伙伴生態(tài)系統(tǒng)。這就是NVLink Fusion。
?
我們有一些很棒的合作伙伴,如LCHIP、Astera Labs、Marvell,以及聯(lián)發(fā)科,他們將與我們合作,與ASIC或半定制客戶、超大規(guī)模企業(yè),以及希望構建這些東西的CPU供應商合作,他們將成為他們的半定制ASIC供應商。
我們還有富士通和高通,他們正在構建帶有NVLink的CPU,以集成到我們的生態(tài)系統(tǒng)中。
Cadence和Synopsys,我們與他們合作將我們的IP轉移給他們,以便他們可以與所有人合作,并將該IP提供給所有芯片。
所以這個生態(tài)系統(tǒng)非常棒。但這恰恰突顯了NVLink Fusion生態(tài)系統(tǒng)的優(yōu)勢。一旦與他們合作,將立即融入整個更大的NVIDIA生態(tài)系統(tǒng),從而擴展到這些AI超級計算機中。
?
現(xiàn)在來談談一些新的產(chǎn)品類別。已經(jīng)展示了幾款不同的計算機。然而,為了服務于世界上的絕大多數(shù)人,仍然缺少一些計算機。所以將要談談它們。
在此之前,想通報一下,我們稱之為DGX Spark的這款新計算機已經(jīng)全面投產(chǎn)。DGX Spark即將就緒,不久即可上市,可能就在幾周內(nèi)。
我們有非常棒的合作伙伴與我們合作,如戴爾、HPI、華碩、微星、技嘉、聯(lián)想。他們是與我們合作的杰出伙伴。這就是DGX Spark。這實際上是一臺量產(chǎn)機型。這是我們的版本。然而,我們的合作伙伴正在構建許多不同的版本。
這是為原生 AI 開發(fā)者設計的。如果是一名開發(fā)者、一名學生、一名研究人員,而且不想總是打開云端,并進行準備工作,然后在完成后再進行清理,那么就會希望擁有自己的,基本上是自己的 AI 云就坐在旁邊,并且它始終開啟,始終等待著。它允許進行原型設計、早期開發(fā),這就是它令人驚嘆的地方。這就是 DGX Spark。這是一個千萬億次浮點運算和128千兆字節(jié)。
?
在2016年,當我交付DGX One時,這只是擋板,我無法抬起一整臺電腦,它重達300磅。這是DGX One,這是一個千萬億次浮點運算和128千兆字節(jié)。當然,這是128千兆字節(jié)的HBM內(nèi)存。這是128千兆字節(jié)的LPDDR5X。實際上,性能非常相似。但最重要的是,能做的工作,可以在這里做的工作與在這里能做的工作相同。這在僅僅大約10年的時間里,是一項了不起的成就。
這是DGX Spark,適合任何想要擁有自己的人工智能超級計算機的人。我會讓所有的合作伙伴自己定價,但可以肯定的是,每個人都能在圣誕節(jié)擁有一臺。
?
我還有另一臺電腦想展示。如果那還不夠,并且仍然想要擁有自己的個人電腦,這位是珍妮·保羅女士。如果那臺對你來說不夠大,這里還有一臺。這又是另一臺臺式機,將由戴爾、惠普、華碩、技嘉、微星、聯(lián)想提供。它將從Box、Lambda等卓越的工作站公司提供。這將是你自己的個人DGX超級計算機,能讓你從一個墻壁插座中獲得你能獲得的最高性能。你可以把它放在你的廚房里,但只能勉強放得下。如果把這個放在廚房里,然后有人啟動微波爐,我認為那就是極限了。
這就是極限,這就是你能從墻上插座獲得的極限。這是一個DGX工作站。它的編程模型和我展示的那些巨型系統(tǒng)的編程模型是相同的。這就是令人驚嘆的地方。單一架構,它擁有足夠的能力和性能來運行一個萬億參數(shù)的AI模型。記住,Llama是Llama 70B。一個萬億參數(shù)的模型在這臺機器上將會運行得非常出色。這就是DGX工作站。
?
這些系統(tǒng)都是AI原生的,是為新一代軟件而構建的計算機。它不必與 x86 兼容,不必運行傳統(tǒng)的 IT 軟件,不必運行虛擬機監(jiān)控程序,不必運行 Windows。這些計算機是為現(xiàn)代人工智能原生應用程序設計的。當然,這些人工智能應用程序可以是可以通過傳統(tǒng)和經(jīng)典應用程序調(diào)用的 API。但是,為了將人工智能帶入一個新世界,而這個新世界是企業(yè) IT,我們必須回到我們的根源,并且必須重新發(fā)明計算并將人工智能帶入傳統(tǒng)的企業(yè)計算中。
現(xiàn)在,我們所知的企業(yè)計算,實際上是三個層次,不僅僅是計算層,而是計算、存儲和網(wǎng)絡。始終是計算、存儲和網(wǎng)絡。正如人工智能已經(jīng)改變了一切,可以推斷,人工智能也必然改變了企業(yè)IT的計算、存儲和網(wǎng)絡。那么,這個底層必須被徹底改造,而我們正在進行改造。
?
我將展示一些新產(chǎn)品,這些產(chǎn)品將為我們開啟、解鎖企業(yè)IT。它必須與傳統(tǒng)的IT行業(yè)協(xié)同工作,并且必須增加一種新的能力。對于企業(yè)而言,這種新的能力就是代理式人工智能。
基本上就是數(shù)字營銷活動經(jīng)理、數(shù)字研究員、數(shù)字軟件工程師、數(shù)字客服、數(shù)字芯片設計師、數(shù)字供應鏈經(jīng)理,以及過去所做所有工作的數(shù)字化人工智能版本。
代理式人工智能具有推理、使用工具以及與其他人工智能協(xié)同工作的能力。在很多方面,這些都是數(shù)字勞工,是數(shù)字雇員。
世界正面臨勞動力短缺,工人短缺。預計到2030年,勞動力短缺將達到約3000萬到5000萬,這實際上限制了世界經(jīng)濟的增長能力。因此,現(xiàn)在我們有了這些可以協(xié)同工作的數(shù)字代理。英偉達(NVIDIA)現(xiàn)在有100%的軟件工程師都配備了數(shù)字代理,以便它們能夠幫助、協(xié)助開發(fā)更好的代碼,提高生產(chǎn)力。
在未來,將會看到一層代理人工智能,人工智能代理。過去我們有人力資源部管理人力勞動者,未來信息技術部門將成為數(shù)字勞動者的人力資源部。因此,必須為當今的IT產(chǎn)業(yè)、當今的IT從業(yè)者創(chuàng)造必要的工具,使他們能夠管理、改進、評估在其公司內(nèi)部工作的一整個AI代理家族。這就是我們想要構建的愿景。
但首先,我們必須重新發(fā)明計算。企業(yè)IT運行在x86架構上,運行傳統(tǒng)的軟件,例如來自VMware、IBM Red Hat或Nutanix的虛擬機管理程序。它運行著大量的經(jīng)典應用程序。我們需要擁有能夠執(zhí)行相同操作的計算機,同時還要增加一種稱為代理人工智能的新功能。
?
這是全新的 RTX Pro 企業(yè)級和 Omniverse 服務器。這臺服務器可以運行所有程序,當然,它有 x86 架構,可以運行所有經(jīng)典的虛擬機管理程序。它在這些虛擬機管理程序中運行 Kubernetes。因此,IT 部門想要管理網(wǎng)絡、集群以及編排工作負載的方式,與之前的工作方式完全相同。它甚至能夠?qū)?Citrix 和其他虛擬桌面流式傳輸?shù)?PC。今天世界上運行的任何東西都應該能在這里運行。Omniverse 在這里運行得非常完美。除此之外,這還是企業(yè)級人工智能代理的計算機。這些人工智能代理可能僅是文本形式,也可能是計算機圖形。像是小 TJ,來到你面前,像是小玩具 Jensen 來拜訪你,幫助你工作。因此,這些人工智能代理可以是文本形式,可以是圖形形式,也可以是視頻形式。
所有這些工作負載都可以在此系統(tǒng)上運行。無論何種模態(tài),我們所知的世界上每一個模型、每一個應用程序都應該運行于此,即使是 Crysis 也能在這里運行。
?
連接這8個GPU(Blackwell,新的Blackwell RTX,RTX Pro 6000s)的是這塊新的主板。這塊新的主板實際上是一個交換網(wǎng)絡。
CX8是一個新的芯片類別,首先它是一個交換機,其次它是一個網(wǎng)絡芯片,也是世界上最先進的網(wǎng)絡芯片。CX8現(xiàn)在已進入批量生產(chǎn)階段。在CX8中,可以插入GPU。CX8都在后面,PCI Express 連接在此處,CX8 在它們之間進行通信。而且網(wǎng)絡帶寬非常高,達到每秒800千兆位。這是插入到這里的收發(fā)器。因此,每個GPU都有它們自己的網(wǎng)絡接口。現(xiàn)在,所有GPU都在東西向流量上與其他所有GPU進行通信,性能驚人。
這是 RTX Pro。在人工智能工廠的世界中,思考性能的方式是吞吐量,即每秒處理的token數(shù)。你的工廠產(chǎn)出越多,你生產(chǎn)的token就越多。因此,吞吐量衡量的是每秒處理的token數(shù)。
然而,每個AI模型都不一樣,有些AI模型需要更多的推理。因此,你需要每個用戶的性能非常高,每個用戶的每秒token數(shù)必須很高。工廠要么喜歡高吞吐量,要么喜歡低延遲,但它不喜歡兩者兼得。
因此,挑戰(zhàn)在于如何創(chuàng)建一個操作系統(tǒng),使我們能夠在擁有高吞吐量的同時,擁有非常低的延遲,即交互性,每用戶每秒令牌數(shù)。
這張圖表告訴您一些關于計算機整體性能,以及工廠整體計算機性能的信息。這些不同的顏色代表了您必須配置我們所有GPU的不同方式,才能實現(xiàn)這種性能。有時您需要流水線并行,有時您需要專家并行,有時您希望進行批處理,有時您希望進行推測性解碼,有時您不希望。因此,所有這些不同類型的算法必須根據(jù)工作負載分別且不同地應用。
帕累托曲線(即外圍區(qū)域)的總體區(qū)域代表您工廠的能力。請注意,Hopper(世界上最著名的計算機,Hopper H100,HGX,225000美元的Hopper)就在那里。
您剛才看到的Blackwell企業(yè)級服務器,其性能是現(xiàn)有服務器的1.7倍。
Llama70B與DeepSeek R1相比,后者性能是前者的4倍。 這得益于DeepSeek R1的優(yōu)化,它確實是世界人工智能產(chǎn)業(yè)的一份禮物。 其中計算機科學的突破非常顯著,為美國和世界各地的研究人員開啟了大量的優(yōu)質(zhì)研究。 無論在哪里,DeepSeek R1都對人們?nèi)绾慰创斯ぶ悄堋⑼评硪约巴评硇腿斯ぶ悄墚a(chǎn)生了影響。 他們?yōu)樾袠I(yè)和世界做出了巨大貢獻。 DeepSeek R1的性能是當前最先進的H100的4倍,這使其更具現(xiàn)實意義。
?
如果您正在構建企業(yè)人工智能,我們現(xiàn)在為您提供一臺出色的服務器,一個出色的系統(tǒng)。 它是一臺可以運行任何程序的計算機,一臺具有驚人性能的計算機,無論是x86還是AI程序都能運行。 我們的RTX Pro服務器正在行業(yè)內(nèi)所有合作伙伴處批量生產(chǎn),這很可能是有史以來規(guī)模最大的上市系統(tǒng)。
計算平臺和存儲平臺是不同的。 人們查詢的是像SQL這樣的結構化數(shù)據(jù)庫,但AI想要查詢非結構化數(shù)據(jù)。 它們需要語義和意義,所以我們需要創(chuàng)建一個新型的存儲平臺,這就是英偉達AI數(shù)據(jù)平臺。
?
在最頂層,就像SQL服務器、SQL軟件以及存儲供應商提供的文件存儲軟件一樣,存在一個非常復雜的軟件層,它與存儲相關聯(lián)。 大多數(shù)存儲公司本質(zhì)上都是軟件公司,而那個軟件層極其復雜。 因此,在新型存儲系統(tǒng)之上,將是一個我們稱之為IQ的新型查詢系統(tǒng),英偉達AI IQ,或者IQ。 它是最先進的,非常出色,并且正在與存儲行業(yè)的幾乎所有人合作。
未來的存儲不再是位于一排存儲設備之上的CPU,而將會是位于存儲機架頂端的GPU。 這樣做的原因是,你需要系統(tǒng)嵌入并找到非結構化數(shù)據(jù)、原始數(shù)據(jù)中的意義。 你必須進行索引、搜索和排序。 因此,這個過程是計算密集型的。 所以未來大多數(shù)存儲服務器的前端都會有一個計算節(jié)點,即GPU計算節(jié)點。
?
這是基于我們創(chuàng)建的模型。 我接下來要展示的幾乎所有內(nèi)容都始于優(yōu)秀的AI模型。 我們創(chuàng)建AI模型,并在開源AI模型的后訓練中投入大量的精力和技術。 我們使用對您完全透明的數(shù)據(jù)對這些AI模型進行后訓練。 這些數(shù)據(jù)是安全可靠的,可以完全放心地使用和訓練,我們會將該列表提供給您查看。
它是完全透明的,我們會向您提供數(shù)據(jù)。我們對模型進行后訓練,后訓練模型性能非常出色。
它目前可供下載,是開源的推理模型。LamaNemotron推理模型是世界上最好的,它的下載量非常巨大。
我們也用一大堆其他AI模型將其包圍,以便您可以進行IQ,即檢索部分。它比市面上現(xiàn)有的快15倍,查詢結果好50%。這些模型都是可用的,都可以提供給您,IQ藍圖是開源的。
我們與存儲行業(yè)合作,將這些模型集成到他們的存儲堆棧、他們的AI平臺中。這是一個廣闊的領域,這就是它的樣子。
?
我不打算深入探討,我只是想讓大家感受一下集成到他們平臺中的人工智能模型的質(zhì)感。讓我們看看VAST都做了些什么。主動式人工智能改變了企業(yè)利用數(shù)據(jù)進行決策的方式。
僅僅三天時間,VAST就利用NVIDIA IQ藍圖及其加速人工智能數(shù)據(jù)平臺構建了一個銷售研究人工智能代理。利用Nemo Retriever,該平臺持續(xù)提取、嵌入和索引數(shù)據(jù),以實現(xiàn)快速的語義搜索。
首先,該代理起草一個概要,然后接入CRM系統(tǒng)、多模態(tài)知識庫和內(nèi)部工具。最后,它使用Lama Nemotron將該概要轉化為一個循序漸進的銷售計劃。
過去需要幾天才能完成的銷售計劃,現(xiàn)在可以通過一個人工智能提示開始,并在幾分鐘內(nèi)完成計劃。借助VAST加速的人工智能數(shù)據(jù)平臺,各組織可以為每位員工創(chuàng)建專門的代理。
這就是VAST。戴爾擁有卓越的人工智能平臺,是世界領先的存儲供應商之一。日立擁有卓越的人工智能平臺,人工智能數(shù)據(jù)平臺。IBM正在與NVIDIA Nemo合作構建人工智能數(shù)據(jù)平臺。NetApp正在構建人工智能平臺。
正如您所見,所有這些都對您開放。如果您正在構建一個具有語義查詢?nèi)斯ぶ悄芮岸说娜斯ぶ悄芷脚_,那么NVIDIA Nemo是世界上最好的。這樣,您就擁有了企業(yè)計算能力和企業(yè)存儲能力。
下一部分是一個名為AIOps的新的軟件層。正如供應鏈有他們的運營,人力資源有他們的運營一樣,未來,IT也將有AIOps。他們將管理數(shù)據(jù),微調(diào)模型,評估模型,為模型設置護欄,保障模型的安全。
我們擁有大量必要的庫和模型,可以集成到AIOps生態(tài)系統(tǒng)中。我們有優(yōu)秀的合作伙伴來幫助我們做到這一點,并將其推向市場。CrowdStrike正在與我們合作。DataIQ正在與我們合作。DataRobots正在與我們合作。
?
正如你所見,這些都是人工智能運營,為企業(yè)中的主體人工智能創(chuàng)建微調(diào)模型和部署模型。 你可以看到NVIDIA的庫和模型集成在其中。
DataRobots之后,這里是DataStacks。 這是Elastic。 據(jù)說他們被下載了4000億次。 這是Nutanix。 這是紅帽。 這是趨勢科技。?
?
這就是我們將為全球企業(yè)IT帶來為您的所有工作添加人工智能能力的方式。 您不會把企業(yè)IT組織中的所有東西都拆掉,因為公司必須運轉。 但我們可以把人工智能添加進去。 現(xiàn)在我們有了具備企業(yè)級就緒狀態(tài)的系統(tǒng),以及令人難以置信的生態(tài)系統(tǒng)合作伙伴。
杰夫·克拉克,偉大的杰夫·克拉克。 他長期以來一直是我們的合作伙伴。 還有杰夫·克拉克。 因此,我們的生態(tài)系統(tǒng)合作伙伴,戴爾和其他公司,將把這個平臺,這些平臺,帶給全球的企業(yè)IT領域。
讓我們來談談機器人。 智能體人工智能,類智能體人工智能,人工智能智能體,有很多不同的說法,智能體本質(zhì)上是數(shù)字機器人。 原因是機器人能夠感知、理解和規(guī)劃。 而這基本上就是智能體所做的事情。
但我們也希望建造實體機器人。 這些實體機器人,首先,需要具備學習成為機器人的能力。 在現(xiàn)實世界中高效地學習成為機器人的能力是不可能實現(xiàn)的。 你必須創(chuàng)建一個虛擬世界,讓機器人在其中學習如何成為一個優(yōu)秀的機器人。 那個虛擬世界必須遵守物理定律。
大多數(shù)物理引擎都無法高保真地處理剛體和柔體模擬。 因此,我們與 DeepMind、谷歌 DeepMind 和迪士尼研究院合作,共同構建了 Newton,世界上最先進的物理引擎。 它將于7月開源,它的功能令人難以置信。 它完全通過GPU加速。 它是可微的,因此你可以從經(jīng)驗中學習。 它的保真度極高,它是超實時的。
因此我們可以使用那個牛頓引擎,并且它已集成到Mujoco中。 它已集成到NVIDIA的Isaac Sim中。 所以無論你使用什么仿真環(huán)境和框架。 因此,通過它,我們可以讓這些機器人栩栩如生。
?
你能想象其中一個小家伙,或者幾個小家伙在房子里到處跑嗎? 追逐你的狗? 讓他們發(fā)瘋?
你看到了發(fā)生了什么嗎? 那不是動畫,而是一個模擬。 他在沙子和泥土中打滑。 所有這些都是模擬的。
機器人的軟件在模擬中運行,這是一種模擬而非動畫。未來,我們將采用訓練好的人工智能模型,并將其置入模擬環(huán)境中的機器人中,讓它學習如何成為一個優(yōu)秀的機器人。
?
我們正在研究多項舉措來幫助機器人產(chǎn)業(yè)。我們已經(jīng)在自主系統(tǒng)領域工作了一段時間。我們的自動駕駛汽車基本上包含三個系統(tǒng):創(chuàng)建人工智能模型的系統(tǒng)(使用GB200、GB300),訓練人工智能模型的系統(tǒng)(使用Omniverse模擬人工智能模型),以及將人工智能模型置入自動駕駛汽車中的系統(tǒng)。
今年,我們將在全球范圍內(nèi)推廣梅賽德斯所使用的端到端自動駕駛汽車技術棧。我們創(chuàng)建所有這些,并以與我們在其他任何地方工作方式完全相同的方式上市。我們創(chuàng)建整個技術棧,并將其開放。合作伙伴可以使用他們想使用的任何東西。他們可以使用我們的計算機,但不能使用我們的庫;他們可以使用我們的計算機、我們的庫以及我們的運行時環(huán)境。無論您想使用多少,都取決于您。
由于存在許多不同的工程團隊、不同的工程風格和不同的工程能力,我們希望確保以一種盡可能方便所有人都能夠集成英偉達技術的方式來提供我們的技術。如果您從我這里購買所有東西,我會很高興,但請至少從我這里購買一些東西。我們非常務實。
?
因此,我們正在機器人系統(tǒng)中做完全相同的事情,就像汽車一樣。這是我們的Isaac Groot平臺。仿真環(huán)境完全相同,都是Omniverse。訓練系統(tǒng)也是相同的。當你完成模型后,你把它放入這個Isaac Groot平臺。
Isaac Groot平臺始于一臺全新的計算機,名為Jetson Thor,它才剛剛開始投入生產(chǎn),是一個令人難以置信的處理器。這款機器人處理器可以用于自動駕駛汽車,也可以用于人或機器人系統(tǒng)。
在此之上是一個我們稱之為NVIDIA ISAAC的操作系統(tǒng),這是一個運行時環(huán)境,它進行所有的神經(jīng)網(wǎng)絡處理、傳感器處理、所有管線處理,并輸出驅(qū)動結果。在其之上,是我們與一個出色的機器人團隊創(chuàng)建的預訓練模型,他們正在對這些模型進行預訓練。創(chuàng)建這一切所需的所有工具,包括模型本身,我們都會提供。
?
今天我們宣布 Isaac Groot N1.5 現(xiàn)已開源,并向全世界開放使用。它已經(jīng)被下載了6000次,來自社區(qū)的歡迎、喜愛和贊賞令人難以置信。
以上是關于模型創(chuàng)建方面的內(nèi)容,我們公開了我們創(chuàng)建模型的方式。
機器人技術,或者說人工智能領域總體上最大的挑戰(zhàn)在于數(shù)據(jù)策略。你的數(shù)據(jù)策略必須投入大量的研究和技術。
就機器人技術而言,人類演示非常重要,就像我們向孩子們演示,或者教練向運動員演示一樣。你演示如何使用遙控操作,你向機器人示范如何執(zhí)行任務,然后機器人可以從該示范中進行泛化。因為人工智能可以泛化,并且我們擁有泛化技術,可以從該演示中泛化出其他技術。
那么,如果你想教機器人一大堆技能呢?你需要多少不同的遙控操作人員?結果表明需要很多。所以我們決定使用人工智能來放大人類示范系統(tǒng)。
因此,這本質(zhì)上是從真實到真實,并使用人工智能來幫助我們擴展、放大人類示范過程中收集的數(shù)據(jù)量,以訓練人工智能模型。
通用機器人時代已經(jīng)到來,伴隨著機電一體化、物理人工智能和嵌入式計算的突破。正當其時,因為勞動力短缺限制了全球工業(yè)增長。
機器人制造商面臨的主要挑戰(zhàn)是缺乏大規(guī)模的、真實的和合成的數(shù)據(jù)來訓練模型。人工示范不具備可擴展性,受限于一天中的小時數(shù)。
?
開發(fā)人員可以使用NVIDIA Cosmos物理人工智能世界基礎模型來放大數(shù)據(jù)。Groot Dreams是一個基于Cosmos的藍圖,用于大規(guī)模生成合成軌跡數(shù)據(jù)。
一種真實到真實的數(shù)據(jù)工作流程:首先,開發(fā)人員通過在單一環(huán)境中對單一任務進行遙操作記錄的人工示范來微調(diào)Cosmos。然后,他們用一張圖片和新的指令提示模型來生成夢想,或者說是未來的世界狀態(tài)。Cosmos是一個生成模型,因此開發(fā)者可以使用新的動作詞進行提示,而無需捕獲新的遙操作數(shù)據(jù)。
一旦生成了大量夢想,Cosmos會推理并評估每個夢想的質(zhì)量,選擇最佳的夢想用于訓練。但這些夢想仍然只是像素。機器人從行動中學習。
Groot Dreams藍圖從2D夢想視頻中生成3D動作軌跡。然后,這被用于訓練機器人模型。Groot Dreams讓機器人能夠?qū)W習各種各樣的新動作,而只需極少的人工捕獲。
因此,一小隊人類演示者現(xiàn)在可以完成成千上萬人的工作。Groot Dreams讓開發(fā)者們在解決機器人數(shù)據(jù)挑戰(zhàn)方面更進一步。
為了實現(xiàn)機器人技術,你需要人工智能。但為了教導人工智能,你需要人工智能。因此,這確實是智能體時代的偉大之處,我們需要大量的合成數(shù)據(jù)生成。機器人技術,需要大量的合成數(shù)據(jù)生成。
被稱為微調(diào)的技能學習,涉及到大量的強化學習和巨大的計算量。因此,人工智能的訓練、開發(fā)和運行都需要巨大的計算量。
正如之前提到的,世界正面臨嚴重的勞動力短缺。人形機器人如此重要的原因是,它是唯一一種幾乎可以在任何棕地環(huán)境中部署的機器人。它不必是綠地環(huán)境,它可以融入我們創(chuàng)造的世界,完成我們?yōu)樽约涸O定的任務。我們?yōu)樽约涸O計了世界,現(xiàn)在我們可以創(chuàng)造一個機器人來適應這個世界,并幫助我們。
現(xiàn)在,人形機器人最令人驚嘆之處不僅僅在于,如果它能正常運作,它將具有相當高的通用性。它很可能是唯一有可能成功的機器人。其原因在于技術需要規(guī)模效應。我們目前擁有的大多數(shù)機器人系統(tǒng)產(chǎn)量太低,這些低產(chǎn)量系統(tǒng)永遠無法達到足夠的技術規(guī)模,從而無法使飛輪運轉足夠遠、足夠快,以至于我們愿意投入足夠的技術來改進它。但人形機器人很可能成為下一個數(shù)萬億美元級的產(chǎn)業(yè),而且技術創(chuàng)新速度非常快。計算和數(shù)據(jù)中心的消耗是巨大的,但這是需要三臺計算機才能實現(xiàn)的應用之一。一臺計算機用于學習的人工智能,一臺計算機是仿真引擎,人工智能可以在虛擬環(huán)境中學習如何成為機器人,然后進行部署。一切移動的物體都將是機器人。
當我們將這些機器人放入工廠時,請記住,工廠也將是機器人化的。今天的工廠非常復雜,例如達美航空的生產(chǎn)線,他們正在為機器人化的未來做準備。它已經(jīng)是機器人和軟件定義的了,并且未來將會有機器人在其中工作。
?
為了讓我們創(chuàng)造和設計能夠像一個艦隊一樣,像一個團隊一樣運作的機器人,在一個也是機器人化的工廠中協(xié)同工作,我們必須賦予其 Omniverse(全宇宙)來學習如何協(xié)同工作。而那個數(shù)字孿生,現(xiàn)在有了一個機器人的數(shù)字孿生,擁有所有設備的數(shù)字孿生,擁有一個工廠的數(shù)字孿生。這些嵌套的數(shù)字孿生將成為 Omniverse 能夠?qū)崿F(xiàn)的一部分。這是達美航空的數(shù)字孿生,這是緯創(chuàng)資通的數(shù)字孿生。
這些都是數(shù)字孿生,都是模擬,看起來非常漂亮。圖像看起來非常漂亮,但它們都是數(shù)字孿生。這是和碩的數(shù)字孿生,這是富士康的數(shù)字孿生,這是技嘉的數(shù)字孿生,這是澳洲航空的,這是緯創(chuàng)資通的。臺積電正在為其下一個晶圓廠構建一個數(shù)字孿生。
全球正在規(guī)劃價值5萬億美元的工廠。未來三年內(nèi),將新建價值5萬億美元的工廠。
世界正在重塑,再工業(yè)化正在全球推進,新的工廠正在各地興建。這對我們來說是一個巨大的機遇,確保其建造得良好、經(jīng)濟高效且準時。
將一切都放入數(shù)字孿生體中,是邁出的絕佳第一步,并為機器人化的未來做好準備。建造這價值5萬億美元的工廠,還不包括我們正在建造的一種新型工廠。甚至我們自己的工廠,也將其放入數(shù)字孿生體中。這是英偉達人工智能工廠的數(shù)字孿生體。高雄也是一個數(shù)字孿生體。他們將高雄制造成了一個數(shù)字孿生體。目前已經(jīng)有成千上萬棟建筑,數(shù)百萬英里的道路。
臺積電、富士康、緯創(chuàng)、和碩、臺達電子、廣達、云達科技和技嘉正在 NVIDIA Omniverse 上為制造過程的每一步開發(fā)數(shù)字孿生體。臺積電與 MED-AI 從二維 CAD 生成整個晶圓廠的 3D 布局,并在 CUOP 上開發(fā)人工智能工具,可以模擬和優(yōu)化跨多個樓層的復雜管道系統(tǒng),從而節(jié)省數(shù)月時間。廣達、緯創(chuàng)和和碩計劃在實際建造之前,先以虛擬方式規(guī)劃新的設施和生產(chǎn)線,通過減少停機時間節(jié)省數(shù)百萬美元的成本。和碩模擬焊膏點膠,從而減少生產(chǎn)缺陷。廣達使用 Siemens Teamcenter X 與 Omniverse 來分析和規(guī)劃多步驟流程。富士康、緯創(chuàng)和廣達利用 Cadence Reality Digital Twin 模擬測試數(shù)據(jù)中心的電力和散熱效率。
為了開發(fā)具備人工智能的實體機器人,每家公司都將其數(shù)字孿生體用作機器人訓練場,以開發(fā)、訓練、測試和模擬機器人。無論是機械臂、自主移動機器人(AMR)、人形機器人,還是視覺人工智能代理,在執(zhí)行任務或作為多元化團隊協(xié)同工作時,均可利用數(shù)字孿生體。當通過物聯(lián)網(wǎng)(IoT)連接到物理孿生體時,每個數(shù)字孿生體都成為一個實時交互式儀表板。和碩利用 NVIDIA Metropolis 構建人工智能代理,以幫助員工學習復雜的技術。
LinkerVision 公司和高雄市利用數(shù)字孿生體來模擬不可預測情境的影響,并構建可監(jiān)控城市攝像頭流的人工智能代理,向急救人員提供即時警報。
工業(yè)人工智能時代已經(jīng)到來,由科技領軍企業(yè)率先開創(chuàng),由 Omniverse 驅(qū)動。
作為最先進產(chǎn)業(yè)的中心,人工智能和機器人技術的發(fā)源地,理應如此。這里是世界上最大的電子產(chǎn)品制造區(qū)域。
人工智能和機器人技術將變革我們所做的一切。歷史上第一次,各位所做的工作已經(jīng)徹底改變了每一個行業(yè),現(xiàn)在它將回過頭來徹底改變各位的行業(yè)。
GeForce將人工智能帶到了世界。人工智能又回來并改變了GeForce。各位將人工智能帶到了世界,人工智能現(xiàn)在會反過來改變各位所做的一切。和各位一起工作非常愉快。謝謝。
?
我有一個新產(chǎn)品要發(fā)布。我們已經(jīng)在太空船塢開發(fā)了一段時間。現(xiàn)在是我們揭曉我們有史以來建造的最大的產(chǎn)品之一的時候了。而它就停在外面等著我們。讓我們看看情況如何。英偉達星系(NVIDIA Constellation)。
正如各位所知,我們一直在發(fā)展。我們與各位的所有合作關系也一直在發(fā)展。我們這里的工程師人數(shù)一直在增長。因此,我們的發(fā)展已經(jīng)超出了目前辦公室的局限。所以我打算為他們建造一個全新的英偉達辦公室。它被稱為英偉達星系(NVIDIA Constellation)。
我們也在選擇場地。我們一直在選擇場地,各個城市的市長們都對我們非常友善。我認為我們達成了一些不錯的交易。我不太確定,但黃金地段就是黃金地段。今天我非常高興地宣布,NVIDIA Constellation 將落戶北投士林。
我們已經(jīng)就租賃權的轉讓事宜與現(xiàn)有租賃權所有者進行了談判。然而,我了解到,為了讓市長批準該租賃,他想知道臺北市民是否同意我們在這里建造一個大型、美麗的NVIDIA Constellation。各位同意嗎?他還讓各位給他回電話。所以各位確信知道他的號碼。大家都立刻給他打電話,告訴他你認為這是個很棒的主意。
這將是英偉達星空平臺。我們將要構建它。我們會盡快開始構建。我們需要辦公空間。英偉達星空平臺,北投士林。非常令人興奮。
我想感謝各位多年來的合作。我們正面臨著千載難逢的機會。擺在我們面前的機遇是前所未有的。在我們共同經(jīng)歷的這段時間里,我們第一次不僅在創(chuàng)造下一代信息技術,我們已經(jīng)這樣做了好幾次,從個人電腦到互聯(lián)網(wǎng),再到云,再到移動云。我們已經(jīng)這樣做了好幾次。
但這一次,我們不僅在創(chuàng)造下一代信息技術,事實上,我們正在創(chuàng)造一個全新的產(chǎn)業(yè)。
?
這個全新的產(chǎn)業(yè)將使我們面臨著巨大的機遇。
?
我期待與各位合作,共同構建人工智能工廠、企業(yè)智能代理、機器人。感謝各位杰出的合作伙伴,與我們共同圍繞統(tǒng)一架構構建生態(tài)系統(tǒng)。
?
因此,我想感謝各位今天的光臨。祝各位Computex2025愉快。謝謝。
?
文章標題:黃仁勛:下一個浪潮是物理人工智能
文章鏈接:https://www.huxiu.com/article/4368382.html
閱讀原文:黃仁勛:下一個浪潮是物理人工智能_虎嗅網(wǎng)