騰訊邱躍鵬:面向Agent和全球化趨勢,全面升級云基礎(chǔ)設(shè)施 | 速途網(wǎng)
速途網(wǎng)9月16日消息(報(bào)道:李楠)今日,在2025騰訊全球數(shù)字生態(tài)大會上,騰訊集團(tuán)副總裁、騰訊云總裁邱躍鵬表示,騰訊云正不斷升級云基礎(chǔ)設(shè)施,以支撐Agent規(guī)模化落地和企業(yè)全球化發(fā)展。他介紹,騰訊云已在推理加速、Agent Infra和國際化布局等方面取得突破,并將以更加開放的姿態(tài),助力企業(yè)把握時(shí)代機(jī)遇。

騰訊集團(tuán)副總裁、騰訊云總裁邱躍鵬
在推理加速方面,騰訊云深入?yún)⑴c開源貢獻(xiàn),向DeepSeek、vLLM、SGLang等社區(qū)提交了多項(xiàng)優(yōu)化技術(shù)。針對大模型推理面臨的內(nèi)存瓶頸,騰訊云自研并開源FlexKV 多級緩存技術(shù),大幅降低KVCache的占用,將首字時(shí)延降低多達(dá)70%。
邱躍鵬表示,騰訊云持續(xù)深度參與并回饋開源社區(qū),同時(shí)依托異構(gòu)計(jì)算平臺整合多種芯片資源,向外界提供高性價(jià)比的 AI 算力。目前,該平臺已全面適配主流國產(chǎn)芯片。
為了支持Agent的大規(guī)模應(yīng)用,騰訊云推出了 Agent Runtime 解決方案,通過集成執(zhí)行引擎、云沙箱和安全可觀測等五大能力,提供穩(wěn)定可靠的運(yùn)行環(huán)境。其中,云沙箱基于自研技術(shù),啟動時(shí)間只需100毫秒,支持?jǐn)?shù)十萬實(shí)例并發(fā)。
騰訊云還將Agent技術(shù)應(yīng)用于云基礎(chǔ)設(shè)施,推出的專家服務(wù)智能體 Cloud Mate,顯著提升了架構(gòu)治理和故障排查效率。在內(nèi)部實(shí)踐中,Cloud Mate實(shí)現(xiàn)風(fēng)險(xiǎn)SQL攔截率95%,排障時(shí)間從30小時(shí)縮短至最快3分鐘。
在全球市場,騰訊云持續(xù)提升自研產(chǎn)品的性能和可靠性。星星海服務(wù)器部署已超2億核,旗艦SA9在高密技術(shù)持續(xù)突破,單機(jī)核數(shù)達(dá)到768核。專有云TCE實(shí)現(xiàn)2分鐘級的RTO,近金融六級容災(zāi)標(biāo)準(zhǔn)。
騰訊云還發(fā)布全新架構(gòu)數(shù)據(jù)庫 TDSQL Boundless,兼具易用性與高并發(fā)能力,并通過 AI 優(yōu)化器在復(fù)雜查詢中將時(shí)延降低八成以上。
騰訊云基礎(chǔ)設(shè)施已覆蓋全球 55 個(gè)可用區(qū),部署 3200 多個(gè)加速節(jié)點(diǎn),為上萬款游戲提供安全防護(hù),在過去一年抵御了同比增長 183% 的 DDoS 攻擊。
此外,騰訊云還為中小企業(yè)和開發(fā)者提供了便捷的出海工具。比如,EdgeOne Pages 結(jié)合AI編程,幾分鐘就能搭建電商網(wǎng)站。低代碼直播組件也大幅縮短了開發(fā)周期。
騰訊云加快國際化布局,并計(jì)劃在日本大阪和沙特新建可用區(qū),目前全球已經(jīng)設(shè)立 9 個(gè)技術(shù)支持中心,并獲得400 多項(xiàng)專業(yè)認(rèn)證。
今年,依托適配全球技術(shù)生態(tài)的產(chǎn)品能力和本地化服務(wù),騰訊云完成印尼版“滴滴+美團(tuán)”超大規(guī)模遷移,過程中僅用 5 個(gè)月建成印尼第三可用區(qū)。
邱躍鵬最后表示,騰訊云將持續(xù)加大在技術(shù)創(chuàng)新和全球化布局上的投入,幫助中國企業(yè)穩(wěn)健出海,同時(shí)也為全球企業(yè)提供安全、可靠、智能的云服務(wù)。
以下為演講全文:
尊敬的各位領(lǐng)導(dǎo)、各位嘉賓、媒體朋友:
大家上午好!我是邱躍鵬。
大模型產(chǎn)業(yè)重心從訓(xùn)練到推理的轉(zhuǎn)變,已經(jīng)成為行業(yè)共識。從騰訊自身的實(shí)踐,我們也看到了同樣的趨勢,同時(shí)客戶對于使用大模型和建設(shè)Agent迸發(fā)出強(qiáng)烈熱情,這都帶來了推理需求的暴漲。從IDC咨詢公司的數(shù)據(jù)可以看到,Agent也將進(jìn)一步推動推理需求的爆發(fā)。這也意味著,我們的AI基礎(chǔ)設(shè)施,也要同步升級。
下面想和大家一起探討如何通過AI Infra的升級,來加速Agent的規(guī)模化落地。
從技術(shù)角度來看,開源社區(qū)與推理相關(guān)的技術(shù)范式正在快速迭代。騰訊在推理加速上一直有非常多的積累,我們積極參與到社區(qū)貢獻(xiàn)中,共建推理加速技術(shù)生態(tài)。
今年2月,DeepSeek 一口氣開源了五大代碼庫,為社區(qū)注入了前所未有的活力。其中,專注 GPU 通信的 DeepEP,與我們長期積累的 TRMT技術(shù)方向高度契合。我們在此基礎(chǔ)上優(yōu)化了 DeepEP,使其在 IB 網(wǎng)絡(luò)性能提升了 30%,在數(shù)據(jù)中心常用的 RoCE 網(wǎng)絡(luò)環(huán)境中性能更是翻倍。DeepSeek 在社區(qū)公開致謝,并用“huge speedup”形容這次貢獻(xiàn)。
第二個(gè)重點(diǎn)是 KV Cache 優(yōu)化。隨著大模型參數(shù)規(guī)模激增,推理對顯存的需求急劇上升。同時(shí),智能客服、代碼助手等場景,對上下文長度的要求不斷擴(kuò)展,導(dǎo)致推理過程中產(chǎn)生的 KV Cache 線性增長,GPU 顯存成為瓶頸。對此,我們將KV Cache逐層緩存至內(nèi)存、SSD及云端擴(kuò)展存儲,充分利用整個(gè)推理集群節(jié)點(diǎn)上的存儲資源,以及外置擴(kuò)展資源,以存換算,提高性價(jià)比和系統(tǒng)吞吐,并極大降低TTFT等延遲指標(biāo)。
為了解決分布式KV Cache和多級緩存的精細(xì)管理,并建起推理引擎到云存儲的橋梁,我們研發(fā)并正式開源了 FlexKV。在知名SSD廠商“群聯(lián)電子”的測試中,F(xiàn)lexKV 將首字時(shí)延最高降低 70%,對話時(shí)延降低57%。
推理框架優(yōu)化對于提升推理效率也非常重要。圍繞用戶體驗(yàn)、成本控制和應(yīng)用拓展,我們貢獻(xiàn)了多項(xiàng)核心技術(shù),補(bǔ)充到了不同社區(qū)框架中。
例如,我們集成了多 token 聯(lián)合預(yù)測 (MTP) 技術(shù),讓模型一次運(yùn)算生成多個(gè) token,將生成速度提升了 35%。我們還幫助社區(qū)打通了注意力數(shù)據(jù)并行 (Attention DP) 功能,將吞吐量提升了 30%。
此外,通過集成 MoE-Chunk 技術(shù),成功使推理框架能夠處理超過 256K 的超長輸入,使其在長文檔分析、復(fù)雜代碼生成等場景中也能保持高效。
這些成果背后,是騰訊軟硬件協(xié)同全棧優(yōu)化的長期戰(zhàn)略投入,騰訊始終堅(jiān)持積極參與和回饋開源社區(qū),并通過騰訊云異構(gòu)計(jì)算平臺的軟件能力,整合不同類型的芯片,對外提供高性價(jià)比的AI算力,目前我們已經(jīng)全面適配主流的國產(chǎn)芯片。
當(dāng)Agent從前沿技術(shù)走向企業(yè)生產(chǎn)環(huán)境,如何確保其在一個(gè)安全可信的環(huán)境中高效運(yùn)行成為新的挑戰(zhàn)。為此,我們推出了全新的 Agent infra 解決方案——Agent Runtime。
它集成了執(zhí)行引擎、云沙箱、上下文服務(wù)、網(wǎng)關(guān)、安全可觀測服務(wù)等多項(xiàng)產(chǎn)品和能力。可以說,Agent Runtime 為Agent提供了堅(jiān)實(shí)可靠的“手”和“腳”,以及至關(guān)重要的安全隔離云端執(zhí)行環(huán)境,真正打通了Agent從技術(shù)到應(yīng)用的最后一公里。
比如大家最關(guān)注的沙箱技術(shù)。云沙箱是 Agent Runtime 的核心組件,基于自研的Cube沙箱技術(shù),通過“運(yùn)行時(shí)快照”、“資源預(yù)創(chuàng)建池化”等多種技術(shù)手段,實(shí)現(xiàn)了 100毫秒的極速啟動,并能支持?jǐn)?shù)十萬Agent實(shí)例同時(shí)并發(fā),這意味著Agent無需等待,隨時(shí)可以投入使用,具備卓越的資源彈性和秒級調(diào)度能力。
云沙箱也支持多種靈活的接入方式,無論通過 MCP、SDK 還是 API,都能快速集成,滿足不同業(yè)務(wù)場景的需求。我們還提供了全方位的安全保障,包括嚴(yán)格的身份權(quán)限管理和數(shù)據(jù)安全防護(hù),確保每一個(gè)Agent都能在一個(gè)安全可信的環(huán)境中高效運(yùn)行。
除了面向Agent升級基礎(chǔ)設(shè)施,我們也在思考如何將Agent能力應(yīng)用在客戶的云上旅程,幫助客戶更好的用云、管云,很高興向大家介紹騰訊云的專家服務(wù)智能體——Cloud Mate。
Cloud Mate由一系列凝聚了各個(gè)云上領(lǐng)域經(jīng)驗(yàn)的子Agent構(gòu)成,它不僅僅是一項(xiàng)技術(shù),更是騰訊云海量實(shí)踐的匯總,能夠可視化治理云上架構(gòu)、前置攔截風(fēng)險(xiǎn),并大幅提升問題處理效率,改變我們管理云的方式。
在云上架構(gòu)治理方面,具備Agent能力的智能顧問就像一個(gè)全能的數(shù)字架構(gòu)師,可以無縫集成超過 90% 的騰訊云產(chǎn)品,對整個(gè)云上架構(gòu)進(jìn)行全面感知和可視化。
例如,在新游上線前必做的重保演練,它能將整個(gè)周期從原來的 1周縮短至1天,目前,騰訊云智能顧問已經(jīng)為云上客戶提供,超過100萬次的智能架構(gòu)治理服務(wù),是真正值得信賴的云上伙伴。
在風(fēng)險(xiǎn)防范場景,慢查詢或低效SQL是長期困擾開發(fā)與DBA的難題,這種業(yè)務(wù)代碼一旦上線,可能嚴(yán)重拖慢數(shù)據(jù)庫性能,甚至導(dǎo)致服務(wù)宕機(jī)。
Cloud Mate非常擅長數(shù)據(jù)庫業(yè)務(wù),能夠深入到代碼環(huán)節(jié),在開發(fā)提交代碼前,自動進(jìn)行風(fēng)險(xiǎn)檢測與攔截,從源頭保障線上數(shù)據(jù)庫的安全穩(wěn)定。從內(nèi)部實(shí)踐看,Cloud Mate對風(fēng)險(xiǎn)SQL的攔截率高達(dá)95%,累計(jì)檢測了超過770萬行代碼。
在排障方面,Cloud Mate 帶來的改變尤為顯著。當(dāng)客戶云上業(yè)務(wù)系統(tǒng)日益復(fù)雜時(shí),如何快速定位問題,是一個(gè)巨大的挑戰(zhàn)。過去,解決一個(gè)復(fù)雜問題平均需要30小時(shí)以上,并且高度依賴于個(gè)人經(jīng)驗(yàn)和手動操作。
而現(xiàn)在,通過 Cloud Mate 強(qiáng)大的自動化和并行編排能力,我們能夠?qū)⑵骄耪蠒r(shí)間,從小時(shí)級縮短至分鐘級,最快僅需3分鐘。Cloud Mate 能夠自動執(zhí)行診斷工具鏈,并行處理多個(gè)任務(wù),極大地提升了運(yùn)維效率,讓故障定位不再是難題。
除了智能化升級之外,企業(yè)全球化的趨勢也勢不可擋。
我們持續(xù)打磨產(chǎn)品性能,通過堅(jiān)實(shí)的基礎(chǔ)設(shè)施建設(shè),助力客戶在全球范圍拓展業(yè)務(wù)。
騰訊云自研的星星海服務(wù)器從SA5到SA9持續(xù)迭代,通過硬件架構(gòu)創(chuàng)新,在有限空間內(nèi),最大化提升計(jì)算密度與能效,旗艦SA9單機(jī)規(guī)格,從前一代的512核進(jìn)一步提升到768核,星星海服務(wù)器目前在全球累計(jì)部署核數(shù)超過2億,為客戶持續(xù)提供穩(wěn)定可靠的計(jì)算能力。
我們還推出了新一代架構(gòu)的TDSQL數(shù)據(jù)庫, 讓分布式數(shù)據(jù)庫像單機(jī) MySQL一樣好用,同時(shí)享受到單機(jī)數(shù)據(jù)庫的易用性,以及分布式數(shù)據(jù)庫的海量存儲與高并發(fā)能力,具備無限的TP擴(kuò)展性與輕量AP能力。 同時(shí),我們還將AI和數(shù)據(jù)庫的優(yōu)化器結(jié)合,在復(fù)雜查詢場景下,總時(shí)延能下降 80%以上。
專有云TCE在國內(nèi)政企客戶中備受好評,當(dāng)我們推向國際市場,“高可用性”也得到了國際客戶的肯定。我們持續(xù)提升TCE容災(zāi)切換的一致性、準(zhǔn)確性和實(shí)時(shí)性,目前已經(jīng)達(dá)到RTO 2分鐘級別,具備近金融6級的容災(zāi)能力。
游戲體驗(yàn)的流暢性、穩(wěn)定性和安全性,直接決定著一款產(chǎn)品能否成功走向全球。在今年Omdia的報(bào)告中,我們與AWS、Google、Microsoft等企業(yè),一同被評為全球游戲云平臺的領(lǐng)導(dǎo)者。
為了讓精品游戲都能高效進(jìn)入全球市場,我們不斷打磨基礎(chǔ)設(shè)施的健壯性。目前,我們的服務(wù)已覆蓋全球55個(gè)可用區(qū),擁有超過3200個(gè)加速節(jié)點(diǎn),確保游戲能夠以極低的延遲觸達(dá)全球玩家。我們還為全球超過1萬款游戲保駕護(hù)航,成功抵御的DDoS攻擊次數(shù)同比增長了183%,為游戲的平穩(wěn)運(yùn)營筑起了堅(jiān)實(shí)的防線。同時(shí),我們通過WeTest和ACE等一系列產(chǎn)品,為游戲開發(fā)者提供全方位的測試與安全服務(wù),幫助他們在游戲上線前,就徹底排除潛在隱患。
以韓國頭部頭部游戲集團(tuán)Com2uS為例,他們不僅是成功的游戲開發(fā)商,更打造了面向開發(fā)者的游戲后端服務(wù)平臺Hive。借助騰訊云40多款云產(chǎn)品的支撐,Hive構(gòu)建了上百個(gè)游戲開發(fā)和部署組件,并被90多家游戲公司接入使用,成功支撐了250款游戲上線,服務(wù)全球超過9億游戲玩家。今年,他們準(zhǔn)備從亞太啟航,進(jìn)一步進(jìn)軍北美市場,而騰訊云依然是他們最信賴的合作伙伴。
我們與創(chuàng)夢天地的合作也持續(xù)深化。他們的全新游戲《卡拉彼丘》在全球發(fā)行后,不到2小時(shí)就登頂Steam排行榜榜首,背后正是我們WeTest、大模型服務(wù)等能力保障的結(jié)果,大幅提升了游戲質(zhì)量優(yōu)化和多語言輿情處置的效率,讓創(chuàng)夢天地能夠更加專注于核心業(yè)務(wù),擁抱全球市場。
面向AI時(shí)代,我們持續(xù)升級產(chǎn)品,助力客戶輕松進(jìn)入低門檻的開發(fā)新時(shí)代。EdgeOne是我們面向國際市場推出的下一代安全加速產(chǎn)品,今年我們進(jìn)一步將大模型與MCP Server結(jié)合,推出了EdgeOne Pages,當(dāng)用戶使用Codebuddy、Cursor、VScode等AI編程工具時(shí),可以便捷調(diào)用EdgeOne Pages的MCP,在幾分鐘內(nèi)完成涵蓋注冊、支付、加速和安全防護(hù)的完整電商網(wǎng)頁部署。產(chǎn)品上線三個(gè)月,已助力超過10萬用戶走向全球市場,成為中小企業(yè)和獨(dú)立開發(fā)者的出海首選平臺。
如果客戶希望進(jìn)一步豐富產(chǎn)品的互動能力,我們提供低代碼、模塊化的互動直播組件,結(jié)合目前市面上主流的AI編程工具,可以將開發(fā)周期從月級壓縮至天級,同時(shí)支持千萬級規(guī)模的單房間直播。組件上線半年以來,客戶數(shù)增長超300% 。
我們致力于通過“邊加端”的AI整體方案,以極低門檻和極快速度,將創(chuàng)新想法落地為全球產(chǎn)品,釋放開發(fā)者的生產(chǎn)力。
產(chǎn)品技術(shù)的升級,也能讓騰訊云的用戶更從容應(yīng)對全球化復(fù)雜場景,尤其是瞬時(shí)流量洪峰。
過去一年,我們成功護(hù)航了多個(gè)高并發(fā)場景。例如,騰訊云平穩(wěn)支撐了國家級大型活動的直播,支撐了全球超過8000萬觀眾同時(shí)在線觀看,直播平臺全程無卡斷。我們還支持并保障了亞太地區(qū)超過一半的正版英超直播。其中的智能媒體處理技術(shù),為客戶實(shí)現(xiàn)了提質(zhì)增效,保障了音視頻全鏈路的流暢體驗(yàn)。
在安全防護(hù)方面,騰訊云的防護(hù)容量相比去年增長了70%,達(dá)到了25T,帶寬儲備增長100%,達(dá)到400T。在服務(wù)某頭部潮玩企業(yè)火爆發(fā)售的過程中,我們成功應(yīng)對了全球業(yè)務(wù)十倍級的流量突發(fā),并通過AI實(shí)時(shí)防刷引擎,將高峰時(shí)段黑產(chǎn)比例從80%大幅壓縮到0.2% 。
騰訊云在海外完善的基礎(chǔ)設(shè)施和本地化服務(wù),也在吸引越來越多的海外本地企業(yè)跨云遷移。印尼 GoTo 就是一個(gè)典型案例:
GoTo是東南亞最大的科技集團(tuán),合并了印尼兩大獨(dú)角獸企業(yè)——負(fù)責(zé)即時(shí)配送和出行服務(wù)的Gojek和電商平臺Tokopedia。騰訊云負(fù)責(zé)的Gojek業(yè)務(wù),是這場遷移中復(fù)雜度最高的部分,相當(dāng)于把印尼的“滴滴+美團(tuán)”云上搬家。
我們面對的,是一個(gè)超大體量的平臺:擁有超過1億的注冊用戶, 管理著超過10000臺云主機(jī)、730多個(gè)數(shù)據(jù)庫實(shí)例和1000多個(gè)微服務(wù)。同時(shí),其系統(tǒng)極其復(fù)雜 :四大核心業(yè)務(wù)線、九個(gè)工程子系統(tǒng),模塊間高度耦合。這無疑是一個(gè)世界級的云業(yè)務(wù)遷移挑戰(zhàn)。
面對如此復(fù)雜的項(xiàng)目,團(tuán)隊(duì)駐扎雅加達(dá)現(xiàn)場,與GoTo緊密協(xié)作:高效完成了500多項(xiàng)定制化需求交付,讓客戶50多個(gè)產(chǎn)品模塊在遷移前后的體驗(yàn)和功能無縫延續(xù)。為了確保萬無一失,進(jìn)行了5輪全鏈路演練,制定了20多項(xiàng)應(yīng)急預(yù)案。
更值得一提的是,為了滿足GoTo的高可用需求,我們僅用5個(gè)月就在印尼建成了第三個(gè)可用區(qū),為遷移提供了堅(jiān)實(shí)的本地基礎(chǔ)設(shè)施保障。
過去一年,是騰訊云在海外快速發(fā)展的一年。我們在日本大阪和沙特新建了可用區(qū),并已在全球范圍內(nèi)設(shè)立9個(gè)技術(shù)支持中心,持續(xù)為本地客戶提供卓越服務(wù)。同時(shí),我們通過了400多項(xiàng)專業(yè)認(rèn)證,為企業(yè)在安全合規(guī)的前提下穩(wěn)健前行保駕護(hù)航。
全球化市場充滿挑戰(zhàn),也蘊(yùn)藏著無限機(jī)遇。對于正在或即將出海的中國企業(yè)而言,如何穩(wěn)扎穩(wěn)打、因地制宜,抓住AI技術(shù)浪潮驅(qū)動創(chuàng)新提效,是每一步都需要認(rèn)真思考的課題。
騰訊云愿以扎實(shí)的準(zhǔn)備和開放的心態(tài),幫助全球企業(yè)用好云,陪伴中國企業(yè)走得更穩(wěn)、更遠(yuǎn)。
謝謝大家。