英偉達推「萬億參數」GPU,繼續加速「AGI 時代」

摘要

黃仁勛和英偉達的野心,一直是「整個地球」

「瘋球了,徹底瘋球了!」

「這是什么?泰勒·斯威夫特的演唱會嗎?」

當地時間 3 月 18 日中午,美國加州圣何塞 SAP 體育中心,超過萬人的冰球體育館內座無虛席。

這是 2024 年英偉達的 GTC 大會現場,人們等待的并不是 1 米 80 的白人女星,而是一位身穿皮衣的亞裔中年男性——英偉達創始人兼 CEO 黃仁勛。

15 個月內市值暴漲 6 倍至超過 2 萬億美元,成為繼蘋果和微軟之后的全球第三大科技公司,并且仍然看不到增長的天花板——是的,從某種意義上看,黃仁勛可能比斯威夫特更像一個「搖滾巨星」。

時隔 5 年再度回歸線下的 GTC,現場爆滿。開場,老黃打趣道:「你要意識到,這不是一場演唱會,而是一個開發者大會」。面對「粉絲」的熱情歡呼,黃仁勛也不禁用調侃作為開場白。

很難想象能有一個會議容納如此多不同行業背景的人,從氣候技術到無線電科學、從機器人到自動駕駛、從 IT 業到非 IT 業?!缸谶@個會場里的你我他,代表世界上 100 萬億美元的行業」。

而把如此多行業和英偉達締結聯系的,正是 AI。以大語言模型為核心的 AI 正在席卷幾乎所有行業,英偉達為各行各業的 AI 變革提供算力引擎。

兩萬億美元市值如何「坐實」、如何用算力繼續推送新一波的 AI 浪潮、更重要的是,英偉達如何成為「新計算時代」的王者?面對這些巨型問題,今年的這場 GTC 大會對于英偉達來說,尤其重要。

英偉達最新的 GPU 產品系列|圖片來源:Nvidia

在長達 2 小時的開場演講中,黃仁勛介紹了當下爆火的 AI 背后,英偉達準備好的新引擎:新計算架構下的硬件、軟件、服務,點燃了一個加速生成式 AI 應用的新生態:

硬件上,新 Blackwell 架構 GPU 組成的 GB200「新核彈」,將提供 4 倍于 Hopper 的訓練性能,大模型參數達到了萬億級別。

軟件層面,NIM「數字盒子」,讓企業能更簡單的在英偉達平臺上定制大模型;Omniverse 將機器人、無人駕駛和數字孿生的訓練和應用融合在一個平臺之中。

從這次發布會,你可以看到英偉達一方面通過「新 AI 核彈」穩固自己「生成 AI 算力基建」的地位;另一方面通過 NIM、Omniverse 進一步擴大產業鏈下游,力求將自己的客戶——大模型公司——逐漸管道化;同時利用 Thor+ Omniverse 成為數字孿生、無人駕駛以及機器人等新興行業最重要的基礎平臺。

在發布預測天氣的 Earth-2 模型時,黃仁勛背后出現了一張地球的衛星圖片?!杆囊靶囊恢倍际钦麄€地球,無論是物理的,還是虛擬的?!瓜矚g瞎猜的人,可能會寫下這樣的圖注。

Blackwell,專為 Transformer 而生

過去10年,隨著AI的代際發展,英偉達提供所需算力的速度也在加快。

現在,生成式 AI 時代,英偉達計算平臺進入下一個周期——Blackwell。這一新架構是繼兩年前推出的 Hopper 架構以來的全新架構。

黃仁勛在臺上介紹新架構芯片的優勢時打趣道:「這是 Blackwell(左邊),這是 Hopper(右邊),Hopper 沒關系,你的表現也很好」。|圖片來源:Nvidia

與之前的 Hopper GPU 一樣,Blackwell GPU 將作為獨立 GPU 提供,或者兩個 Blackwell GPU 可以組合并與英偉達的 Grace CPU 配對,創建一個超級芯片 GB200。

GB200 同過去架構的 AI 芯片性能對比|圖片來源:Nvidia

作為個超大規模的芯片,GB200 通過 900GB/s 超低功耗的片間互聯,將兩個 B200 GPU 與 Grace CPU 相連。

英偉達表示,該系統可以部署 27 萬億參數的模型。這甚至比最大的模型(例如 GPT-4)還要大得多,據報道 GPT-4 有 1.7 萬億個參數。

為了實現超高的 AI 性能,搭載 GB200 的系統可與英偉達 Quantum-X800 InfiniBand 和 Spectrum-X800 以太網平臺連接。這兩個平臺均可提供速度高達 800Gb/s 的高性能網絡。

黃仁勛手捧兩種 Blackwell 架構解決方案說「我得小心點,這個值多少錢,100 億美元?當然第二塊就便宜了,50 億吧?!梗鼒D片來源:Nvidia

DGX GB200 的數據性能爆表|圖片來源:Nvidia

Nvidia 還發布了 GB200 NVL72 液冷機架系統,其中包含 36 顆 GB200 Grace Blackwell Superchips。Nvidia 表示,與當前的 H100 GPU 相比,該系統的推理工作負載性能提高了 30 倍。

作為英偉達在 AI 訓練和推理方面的新的頂級領導者,Blackwell GPU 和 GB200 超級芯片也將被引入云平臺 NVIDIA DGX B200 系統中,用以模型訓練、微調和推理。所有 NVIDIA DGX 平臺均包含用于企業級開發和部署的 NVIDIA AI Enterprise 軟件。

亞馬遜,谷歌、微軟和甲骨文將通過云服務出售 GB200 的訪問權限。

定制大模型,更簡單

數據顯示,在這一波 AI 浪潮中,英偉達提供的 AI 算力可能達到了所有所需算力的 90% 甚至更高。而怎樣才能賣出更多算力?顯然是讓更多企業用上大模型。

企業想要使用大模型,通常需要進行微調和私有化部署,才能對自己的企業的業務有所助益。而在目前,通常通過部署模型的云廠商或者小的服務商完成。

此次發布會上,英偉達則推出了自己的模型定制服務,Nvidia Inference Manager,簡稱 NIM,來實現有英偉達硬件的地方,就可以進行簡單的調試使用大模型。

黃仁勛講解 NIM |圖片來源:Nvidia

NIM 被形容為一個數字盒子,在英偉達提供的網站下載即可使用。

盒子中包含幾個要件。首先是基礎大模型,有多種相關模型可供選擇,黃仁勛提到其中包括開源模型如 Llama,來自合作伙伴的模型,也包括英偉達自己創建的一些模型——例如英偉達剛剛在 GTC 公布了一個新的天氣預測模型。

按照英偉達的說法,它們都是根據英偉達硬件已經優化好的,無論你的硬件是筆記本電腦這樣只有一塊 CPU 的,還是公司級別有多個 GPU 節點的,都可以直接使用。

第二是可以幫助用戶微調大模型的工具,這包含多項微服務。

比如,英偉達 2023 年 11 月宣布的 NVIDIA NeMo Retriever 技術,就被集成在整個的微服務中,可以幫助企業啟用 RAG 功能——簡單來說就是幫助企業更好地使用自己的專有數據。

黃仁勛在演講中舉例子道:只下載了 Llama 2 模型時,他向 Llama2 提問公司獨有的編程語言方面的問題,Llama 2 無法很好地回答。而將公司的私有數據提供給大模型之后,大模型不但能回答出這個問題了,還能夠使用公司獨有的編程語言進行編程了。

學習過公司數據的大模型可以很好地幫助企業提高效率 |圖片來源:Nvidia

除了 RAG 增強,還有一系列的微服務可以幫助用戶使用大模型。包括 Lemo 檢索器,幫助信息的快速檢索,數字人的微服務,幫助用戶創建數字人等等。都包含在微服務中。

「未來我們將怎么構筑軟件?應該不是一行行地寫代碼?!裹S仁勛講到,「很有可能是一個超級 AI 將任務分解,再交給一個一個的 NIM 去做?!?/p>

這樣的 NIM,則可以被安裝在任何英偉達硬件適配的地方。比如英偉達的 DGX 系統上,任何云上、企業私有的數據中心、或者是個人的硬件上。黃仁勛直接在演講中說道:「我們是 AI 鑄造廠?!?/p>

這項微服務,現在開發者可以免費試用。而企業則需要在企業軟件訂閱中,之前有消息稱,每個 GPU 每年收取費用 4500 美元。

「現實 AI」:數字倉庫和機器人

在推進算力和算力的使用上,英偉達是認真的。英偉達在二十年前就做出了 CUDA,推崇加速計算,今日的碩果累累來自于二十年前種下的因。

黃仁勛開場時回顧二十年前,半開玩笑地講到:「當時我們已經算到了有今日?!?/p>

而黃仁勛看到的未來是什么樣的呢?

在今天的 GTC 上,我們也小小地瞥見了一下黃仁勛眼中的未來:在世界的底層,是無限擴展的、不竭的算力,在中層,是數字孿生,是 simulation,是依靠算力帶來的對物理世界的無限精準的模仿,實驗和預測,而在上層,則是一個依靠算力達到最優解的世界——在這個世界里,人與機器人共生。一切第一次發生的,都是發生過無數次的。

這其中,英偉達 2021 年開始推出的 Omniverse,就是中間層非常重要的工具。

Omniverse 是英偉達擅長的計算機圖形、人工智能、科技計算和物理模擬真正大一統的平臺,能夠對環境實現 1:1 的數字孿生。

此次發布會,結合人工智能的浪潮,Omniverse 展現了許多新的應用可能。

Omniverse 可以為現在最火的具身智能,提供一個訓練場所。英偉達表示,英偉達建立了 Isaac Lab,一款機器人學習應用程序,用于在 Omniverse Isaac 模擬器上進行訓練。通過新的計算編排服務,可以在基于物理的模擬中訓練機器人,并能零次訓練(zero-shot)遷移到實際環境。

機器人模型將使機器人能夠從少量人類演示中學習,從視頻中理解人類、在模擬中訓練模型,并最終直接部署到物理機器人上。

黃仁勛還在發布會上宣布了 Project GR00T 項目,GR00T 是一個用于人形機器人的通用基礎模型,基于 Jetson Thor(英偉達的一款GPU)來開發生產機器人。

黃仁勛與人形機器人「站在一起」,其中部分機器人來自中國公司|圖片來源:Nvidia

除此之外,英偉達還展示了一個數字倉庫的案例。

數字倉庫感知和規劃了人和機器人的路線|圖片來源:Nvidia

視頻中,展示了一個一個 10 萬平方英尺倉庫的 Omniverse 模擬環境,它整合了運行視頻、Isaac 感知器堆棧的數字工人 AMR、來自 100 個模擬天花板安裝攝像頭的整個倉庫的集中活動地圖等。

在視頻中,一個數字工人 AMR 的原定計劃的路線上,發生了一起事故,路徑受阻。英偉達 Metropolis 可以實時改變路徑規劃。通過基于生成式 AI 的 Metropolis 視覺基礎模型,操作員甚至可以使用自然語言提問發生了什么事情。

在此次 GTC 上,英偉達宣布,將創建 Omniverse Cloud 的 api,而且將非常易用,企業可以更容易地使用 Omniverse,同時其中還將有 AI 的能力。比如可以直接用自然語言場景描述,創建仿真環境的 3D 圖像。

同時,英偉達宣布與 Vision Pro 達成合作,Omniverse Cloud 將能夠向 Vision Pro 串流?!笍奶摂M車上下來,穿過車門的感覺,非常奇怪,但也非常棒?!裹S仁勛講到,「Vision Pro 將把你帶入 Omniverse Cloud,你能夠體驗到的工作流是無與倫比的?!?/p>

超過 1 萬人在現場觀看 Keynote,900 場以上的分享以及數百家展商,2024 年 GTC 被戲稱為「AI 界的伍德斯托克」——除了蘋果公司,少有公司能讓科技變成一種人人想要「沾上邊」的時尚。畢竟,在「生成式 AI」代表未來的當下,每個人都想成為那個跟上潮流的人。

英偉達無疑是那個潮流背后最大的推手之一,同時也是目前最大的受益方,它需要做的,是為所有人提供更大的夢想,和更多的算力。順便,或許,成為全球市值最高的公司,沒有之一。

 

最新文章

極客公園

用極客視角,追蹤你不可錯過的科技圈.

極客之選

新鮮、有趣的硬件產品,第一時間為你呈現。

張鵬科技商業觀察

聊科技,談商業。

国产精品揄拍一区二区,欧美aⅴ精品一区二区三区,久久九九99这里有精品10,999精品在线