騰訊大模型加速迭代:混元TurboS躋身全球前八
騰訊在大模型上的技術迭代正不斷提速。
5 月 21 日,騰訊宣布,混元模型矩陣全面升級,旗艦快思考模型混元TurboS、深度思考模型混元T1雙雙迭代。基于TurboS基座,騰訊新推出視覺深度推理模型T1-Vision和端到端語音通話模型混元Voice。混元圖像2.0、混元3D v2.5及混元 游戲 視覺生成等一系列多模態模型也同步“上新”。
語言模型躋身全球前八,技術能力持續提升
在瘋狂卷技術的全球大模型角逐中,騰訊混元正小步快跑、快速迭代,技術能力持續提升。
騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生在2025騰訊云AI產業應用峰會上介紹,在全球公認的權威大語言模型評測平臺Chatbot Arena上,混元TurboS排名已攀升至全球前八,國內僅次于DeepSeek。其中,代碼、數學等理科能力,混元TurboS也進入全球前十。
年初,混元TurboS正式發布,作為業界首款大規模混合Mamba-MoE模型,其在效果與性能上已展現出顯著優勢。而這一最新突破,則得益于預訓練階段的tokens增訓,以及后訓練階段引入長短思維鏈融合技術,使得TurboS理科推理提升超10%,代碼能力提升24%,競賽數學成績大幅提升了39%。
早在去年下半年,騰訊就大力投入了深度思考模型的路線攻關。深度思考模型混元T1自年初上線元寶App后,持續快速迭代。近期,混元T1也迎來新升級,在多項核心能力上均實現了提升:其中,在競賽數學上效果提升8%;在常識問答上提升8%;在復雜任務的Agent能力提升了13%。
多模態模型快速迭代,首秀3D場景生成
基于TurboS的基座模型,混元進一步拓展了圖片和音頻的多模態理解能力。新發布的混元視覺深度推理模型T1-Vision,支持多圖輸入,具備原生長思維鏈,輕松實現“邊看圖邊思考”,整體效果相比此前級聯方案提升 5.3%,整體理解速度提升50%。
端到端語音通話模型混元Voice,實現低延遲語音通話,相比級聯方案,響應速度提升超過30%,降至1.6秒,擬人性和情緒應用能力也有明顯提升,目前已在騰訊元寶App灰度上線。實時視頻通話AI體驗,近期將推出。
今年以來,混元的迭代速度明顯加快。在多模態生成領域,混元圖像2.0率先實現“毫秒級”生圖,GenEval基準測試準確率超95%。這背后得益于超高壓縮倍率的圖像編解碼器以及全新擴散架構,模型參數量提升了一個數量級,帶來交互體驗的革新。在主觀畫面質量和美學層面的人工測評中,混元圖像2.0也被認為是“AI味”最少的模型之一。
混元3D v2.5憑借業界首創的稀疏3D原生架構,實現了可控性與超高清生成能力的代際飛躍,幾何模型精度提升10倍,紋理貼圖達4K。在端到端評測中,混元文生3D在17個生成類目中占據15個第一,圖生3D在17個類目中全部取得第一。
在游戲領域,混元推出精通游戲美術與術語的混元游戲視覺生成模型,涵蓋游戲技能特效生成、角色動態立繪、實時交互游戲世界模型、角色多視圖等五大子模型。混元游戲視覺生成平臺也正式上線,面向工業級游戲資產生成,讓游戲美術設計效率提升數十倍。
近期,混元還將推出首個大規模、可漫游3D場景生成模型,支持沉浸式交互、多樣風格場景生成及360°全景漫游體驗,助力游戲、具身智能等行業創新。
混元3D模型下載量超160萬,多尺寸模型全面開源
騰訊云副總裁、騰訊混元大模型技術負責人王迪表示,混元正加速向智能化的深度與廣度邁進,為AI普惠與產業升級提供堅實支撐。混元堅定擁抱開源,持續推進多尺寸、多場景的全系模型開源。
目前,混元已實現圖像、視頻、3D、文本等在內的全模態開源,其中,混元3D模型Hugging Face下載量超過160萬。未來,混元計劃推出多尺寸混合推理模型,從0.5B到32B的dense模型,以及激活13B的MoE模型,適配企業與端側不同需求。混元圖像、視頻、3D等多模態基礎模型及配套插件模型也將持續開源。
除模型開源外,混元面向行業推出混元訓練營,提供免費模型資源及技術支持,目前已有超過200家合作伙伴報名參與。
今年以來,騰訊在大模型領域的戰略和部署持續進化,步伐日益加快。近期,騰訊混元大模型研發體系全面重構,刷新團隊部署,加碼研發投入。伴隨投入加碼,騰訊AI戰略也正在加速落地。
目前,混元已深度融入騰訊各業務線,廣泛應用于 微信 、QQ、騰訊元寶、騰訊會議、騰訊文檔等核心產品,提升騰訊內部產品的智能化水平,并通過騰訊云向外輸出模型能力,幫助企業和開發者創新提效。