“人工智能+ ”,硅基流動在行動
8月26日,國務院發布了《關于深入實施“人工智能+”行動的意見》(以下簡稱《意見》),《意見》清晰具體地描述了到 2027 年、2030 年、2035 年的目標,行動是通向這些激動人心目標的關鍵路徑。在《意見》里我們看到了“加快實施重點行動”的畫面,那就是實現人工智能與 6 大重點領域的廣泛深度融合,而要在具體場景中發揮 AI 的強大應用價值,“強化基礎支撐能力”成為堅實保障。
創業 兩年的硅基流動作為 AI 基礎設施(AI Infra)平臺,深刻理解“場景應用”對“基礎設施”的牽引作用,我們通過技術創新、產品打造、生態協同等方式,在 AI Infra 領域深耕細作;我們一直抱持著明確的定位,成為 AI 能力提供商,通過算法、系統與硬件的協同創新,跨數量級降低 AI 應用的開發和使用門檻。
過去兩年,硅基流動為用戶提供服務的核心產品是大模型服務平臺,截至目前已經有 700 多萬用戶,每天消耗逾千億 Tokens。這些日益增長的數據就是最好的反饋,讓使用者實現“Token 自由”不再是一句口號。
響應國家政策號召,硅基流動在行動,繼續為開發者、企業用戶以及產業升級轉型提供一站式 AI 基礎設施服務,為 AGI 在千行百業的規?;涞爻掷m發揮價值,為加速 AGI 普惠人類做出一份自己的貢獻。
借此《意見》政策解讀學習的機會,我們也做一個小小的復盤,分享過去兩年的實踐和思考,和一直支持我們的用戶、能力供應商同行以及一直以來關注硅基流動的業界伙伴做一次交流。
模型即服務:讓 AI 能力“用得上、用得好、用得起”
? ?《意見》第十條明確提到發展“模型即服務”、“智能體即服務”,“打造人工智能應用服務鏈”。這在政策導向上給足了實踐者信心, MaaS(模型即服務)這種產品形態已經變得越來越主流了 ,硅基流動也在為這個產品形態持續實踐著。
硅基流動的 MaaS 產品邏輯很簡單。大模型這么好,那肯定要讓更多人用起來,讓更多人享受到先進的 AI 能力。但應用門檻對不同企業和個人來說肯定不一樣,這里面就有很大的服務空間。我們做什么?就是在模型和應用之間架起一座橋梁,讓用戶可以開箱即用各種大模型,三個關鍵詞: 用得上、用得好、用得起。
第一層,先讓用戶能方便部署模型,降低門檻, 模型能力用得上 。有了大模型服務平臺,用戶直接通過 API 就可以調用上百款主流模型,比如滿血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等。打個比方,這一層就是從毛坯房到拎包入住,什么GPU選型、模型下載、環境配置、調試代碼、部署上線這一系列的煩惱就都屏蔽了,沒有任何代碼基礎的用戶也可以快速上手,這就是降低門檻、推動 AI 普惠化最直接的價值。
第二層,模型用上了,還要提升效率、滿足各種場景需求, 模型能力用得好 。能用和好用從來都要跨越一個鴻溝,用模型肯定離不開場景和任務,不管是文本、圖像、音視頻,還是打造各種應用,解決真實問題、拿到真實效果才是目的。需求會隨著使用越來越多,比如模型訓練、微調,比如保證模型穩定,能做到橫向擴容、負載均衡等。模型廣場幫助用戶靈活選擇最優模型,適配多場景需求,將模型能力轉化為實際應用。
第三層,從應用驗證到規模化落地,必然要考慮 ROI 了,降低成本, 模型能力用得起 。簡單來說,和只跑幾個 Demo 對比,規?;瘧闷饋淼某杀臼侵笖导壴鲩L的,主要涉及 Token 的成本、長上下文的算力消耗等。怎么持續優化資源利用率,把成本壓下來,讓模型像水電一樣能按需使用。
這兩年的實踐就是解決以上三層問題,需要算法、芯片、工程等協同創新,做好某個單點還遠遠不夠,這是一個系統工程。技術創新方面,我們自研了推理加速引擎;算力方面,我們積極擁抱國產算力,在國產芯片適配上跑得最快、最遠;有了這些努力才讓我們打造出高性價比的大模型服務成為可能。
大模型服務平臺的每一位用戶,平臺上消耗掉的每一個 Token,都是我們收獲的正反饋。當然了,硅基流動也還在路上,我們持續驗證著各種思路,也會有更多產品持續推出。
國產芯片:從“造出來”走向“大規模商用”
《意見》第九條提到:“強化智能算力統籌”,“支持人工智能芯片攻堅創新與使能軟件生態培育”,“完善全國一體化算力網”,“推動智能算力供給普惠易用、 經濟 高效、綠色安全”。
算力在大模型時代的重要性不言而喻,我們面對的一個命題是:怎么讓國產芯片后更好用,怎么提高芯片利用率從而達到國際主流 GPU 的水準。多年來,我們嘗試了很多路徑方向,自研推理引擎并優先支持國產芯片是我們找到的答案。
今年 2 月份我們最先基于昇騰推出 DeepSeek - R1 & V3 服務。這個服務推出后,用戶體驗和性價比都達到了國際主流 GPU 水準,這給了我們非常大的信心,通過這個案例證實了 國產算力部署大模型的 商業 可行性 。今年我們還和華為聯合發表了關于新一代 AI 數據中心架構 CloudMatrix384 的論文,這項工作是用非摩爾補摩爾、用軟件補硬件的典型代表。
除了昇騰,我們也一直在適配更多國產芯片。今年7月,發布了基于沐曦曦云 C550 集群的月之暗面 Kimi-K2 服務。其他國產芯片也在支持中。通過這些工作,可以有效解決國產芯片軟件生態上不足,一步到位讓用戶很輕松地把國產芯片使用起來。
我們看見 了國產芯片從 “可用” 變為 “好用” 的變化,總結兩點:
1. 通過推理引擎技術和 MaaS 產品形態, 國產芯片能很容易地就被用戶用起來 ,用戶使用的時候也不用關心到底是什么芯片,也不用操心什么適配、優化、生態這些問題,直接無感知使用起來即可。
2 . 國產芯片做大規模推理服務有很高的性價比 。現在很多算力也建設起來了,但它還處在一個毛坯房的狀態,算力閑置率高,硅基流動通過算力整合,大幅度提升了“多元化”算力的利用率,能夠實現多元異構算力納管,滿足彈性擴縮容需求,讓用戶可以按需使用。
開源生態:信仰驅動的實踐路徑
《意見》第十一條講“促進開源生態繁榮”,我們深以為然。
從硅基流動成立開始,我們就把開源模型作為一種信仰,這是一個“因為相信,所以看見”的故事。我們信仰開源,相信開源模型能夠趕上甚至超越閉源模型,而這一切正在成真。 模型開源策略,良性競爭態勢,讓我們看到了開源模型能力追近閉源模型的趨勢。
當下中國主要的模型都開源了,同時中國的這些模型也正在走向全世界,全球范圍內領先的開源模型基本都是中國模型。這些開源模型正在促進改變發生, 中國的 AI 生態從“跟跑”向“規則定義”轉型,中國的 AI 能力也在從“跟隨”向“引領”轉變。
硅基流動基于開源模型和自研的推理能力,把開源模型變成開箱即用的服務送到用戶跟前,用戶想用什么開源模型,直接上手,完全不用考慮模型下載、部署這些事兒。我們的所有努力都是為了讓用戶能夠超順滑地使用上 AI 能力: 零門檻、高性能、低成本。
結語:跑步走進“新”時代
硅基流動成立兩年,我們在《意見》里感受到國家政策方面的指引和支持,深受鼓舞?!兑庖姟防镞€提到了“ 智能原生 ”,“大力發展智能原生技術、產品和服務體系,加快培育一批底層架構和運行邏輯基于人工智能的智能原生企業,探索 全新商業模式 ,催生 智能原生新業態。 ”這代表著一個巨大的、全新的機會,召喚著在每一次大的技術浪潮里面才能催生出來的全新的產品業態和模式。
在這個時代背景下,無論是企業還是個人,我們都有了站在同一起跑線上的“新”機會。 時不我待,激勵我們一起抓住“人工智能+”的時代機遇,即刻行動。