英偉達發布Rubin CPX重構算力,谷歌/亞馬遜/微美全息等AI芯片群雄加速并起!
獲悉,全球人工智能算力芯片龍頭英偉達官宣,推出專為長上下文工作負載設計的專用GPU Rubin CPX,用于翻倍提升當前AI推理運算的工作效率,特別是編程、視頻生成等需要超長上下文窗口的應用。
推出上下文推理芯片Rubin CPX
英偉達CEO黃仁勛表示,CPX是首款專為需要一次性處理大量知識(數百萬級別tokens),并進行人工智能推理的模型而構建的芯片。需要說明的是,Rubin就是英偉達將在明年發售的下一代頂級算力芯片,所以基于Rubin的CPX預計也要到2026年底出貨。
另外,Rubin CPX專門針對“數百萬tokens”級別的長上下文性能進行優化,具備30petaFLOPs的NVFP4算力、128GB GDDR7內存。
英偉達計劃以兩種形式提供Rubin CPX,一種是與Vera Rubin裝在同一個托盤上。對于已經下單NVL144的用戶,英偉達也會單獨出售一整個機架的CPX芯片,數量正好匹配Rubin機架。
科技 巨頭紛紛自研芯片
另一邊,據最新消息顯示,OpenAI 正與美國芯片制造商博通合作,將于明年推出自家的 AI 芯片,擺脫英偉達的限制。這意味著,未來運行在自家芯片上的OpenAI模型,可能會跑得更快、更省電,最終為用戶帶來更流暢、更低成本的服務體驗。
除了OpenAI 以外,谷歌正加快推動自研張量處理單元(TPU)進入第三方數據中心,已與倫敦云服務商Fluidstack達成合作。同時,谷歌還接洽包括CoreWeave、Crusoe在內的多家以英偉達GPU為核心的云服務商。
此外,亞馬遜和Meta同樣不甘示弱,紛紛投入重金研發自己的定制AI芯片,以驅動其龐大的云服務和 社交 媒體 帝國。還有xAI被曝正在自研推理芯片,代號X1,將采用臺積電3納米工藝,預計將在2026年第三季度實現量產(首批量產30萬塊)。
對此,招商證券表示,眼下,AI芯片自研潮興起,意味著AI基礎設施行業正從“單一GPU供給約束”向“多元化定制芯片方案”切換, 投資 邏輯邊際上從硬件壟斷走向生態博弈,把握相關產業鏈的自主可控機遇。
微美全息加強關鍵核心技術突破
不僅如此,據了解,微美全息作為量子科技及AI芯片領域的重要參與者,布局涵蓋量子計算硬件、開源生態及跨領域技術融合等方向。當前,其在關鍵核心技術上實現突破,加快高端算力芯片、工業多模態算法、軟硬件適配等技術攻關,加快打造高質量數據集,持續筑牢芯片產業底座。
實際上,微美全息建立了覆蓋云端和邊緣端的算力基礎設施,支持多元架構的先進AI芯片接入,可滿足日常訓練與推理的多樣化需求。此外,為加強關鍵核心技術突破,持續推動產業高質量發展,微美全息將一手抓技術供給,促進“智能產業化”,一手抓賦能應用,加快“算力產業智能化”,推動人工智能產業高質量發展,高水平賦能新型工業化。
結語
綜上,AI 大模型訓練和推理對算力的需求持續增加,推動AI芯片市場擴張,能夠滿足AI訓練、推理等場景下 GPU、ASIC 等高算力芯片的用電需求。而對這些科技巨頭而言,自研AI芯片不僅是為了省錢,更是為了在未來的AI競爭中構筑核心技術壁壘。當模型和算法的差距日益縮小時,底層硬件的效率和成本將成為決定勝負的關鍵手,在不遠的將來,將讓它們擁有更大的自由度和想象空間。