騰訊云智算全新升級,相關技術能力剛獲DeepSeek公開點贊
5月21日,在騰訊云AI產業應用峰會上,騰訊云副總裁李力宣布了騰訊云智算的全新升級。新升級瞄準AI應用和模型爆發對基礎設施帶的來全新挑戰,在效能、可靠性、易用性三大方向上全面提升,將為AI大模型訓練、智能體部署等場景提供更全面的基礎設施能力支持。
李力表示,從云計算時代到AI時代,云基礎設施的技術進化始終以場景作為牽引。隨著大模型的爆發以及智能體、智駕等應用場景加速落地,騰訊云智算會以AI原生為出發點,打造安全靈活的高性能底座,與開發者和企業共同探索智能化轉型的創新路徑。
在效能維度,騰訊云智算針對數據處理效率低、資源利用率低等痛點問題,升級了多個技術能力。基于國內首個支持跨卡型GPU調度的Serverless平臺,騰訊云智算最高可支持10萬級并發數據任務處理,最高請求數能達到行業領先的百萬量級;通過騰訊云存儲數據萬象中預置的100多個數據處理任務模板,幫助企業數據打標效率提升50%。
在大模型訓練和推理場景中,騰訊云智算基于星脈自研通訊庫,雙端口網卡帶寬利用率達到峰值相比DeepEP性能可以再提升30%;同時,騰訊云智算打造了更高性價比的多機 互聯網 絡vRDMA,并將損耗比降低至不到2%,模型訓練效率接近無損擴展。
某頭部車企在智駕模型的訓練中,數據標注效率提升了50%,數據處理整體成本降低70%,訓練性能提升30%,模型迭代周期降低了40%。
在可靠性維度,針對AI基礎設施容易出現的服務不穩定、擴容速度慢、 訪問速度慢等技術難點,騰訊云智算通過自研AI服務器與智能巡檢系統,將千卡集群的日均故障率控制在0.16%以下;依托騰訊云存儲GooseFS,模型分發時間從1小時縮短到了20分鐘;同時,騰訊云全球50多個可用區,則可使AI應用服務就近接入,服務穩定性提升57%,擴容速度提升2倍。
某頭部 手機 廠商的AI助手項目應用該方案后,服務網絡丟包和抖動均下降99%,服務穩定性提升57%,同時實現200%的擴容速度提升。
在易用性維度,為加速智能體規模化落地,騰訊云智算升級了AI原生工具鏈。其中,向量數據庫全面支持向量+關鍵字混合檢索,最高支持千億級數據處理與500萬QPS高并發檢索;騰訊云智能日志服務可支持統一日志上報與可觀測大盤,支持完整鏈路追蹤與異常3分鐘定位;騰訊云智算還升級了覆蓋大模型全生命周期的安全解決方案,實現安全事件兩小時內快速響應。
某頭部房產中介平臺搜索業務,借助騰訊云向量數據庫,數據召回率增加30%,檢索時間降低50%,同時依靠日志和安全能力,異常定位效率提升30%,安全響應時間縮短90%。
目前,騰訊云智算已深度服務于智能體及AI應用、具身智能、自動駕駛、互聯網應用等多個領域。在Gartner最新發布的生成式AI基礎設施象限中,其產品性能與未來潛力均位列亞太廠商首位。
值得一提的是,騰訊云針對DeepSeek開源的DeepEP通信框架進行深度優化,使其在多種網絡環境下均實現顯著性能提升。相關技術方案也獲得了DeepSeek公開致謝,稱這是一次“huge speedup”代碼貢獻。