阿里秘密研發新模型將發布,影響力指標成最重要考核
出品|虎嗅商業消費組
作者|苗正卿
題圖|視覺中國
虎嗅獨家獲悉,阿里即將在2025年4月第二周發布新模型Qwen3,這將是阿里在2025年上半年最重要的模型產品,距離2024年9月阿里在云棲大會上發布Qwen2.5過去了大約七個月的時間。
據虎嗅獨家了解,在2024年發布Qwen2.5后,阿里云內部的基礎模型團隊已經開始推動Qwen3相關項目。但2025年初DeepSeek的火爆,改變了團隊的部分思路與重心?!?024年四季度,圈內已經意識到模型的推理能力很重要,但還不能說是最重要的方向,DeepSeek火爆后,推理能力已經成為繞不開的關鍵能力。”知情人士告訴虎嗅,DeepSeek-R1發布后,阿里云基礎模型團隊把策略中心進一步向模型的推理能力傾斜。
值得注意的是,在2024年下半年,阿里云基礎模型團隊對標的競品模型主要是OpenAI的o1,而在DeepSeek-R1發布后,DeepSeek-R1已經成為了另一個主要對標模型。
虎嗅獨家獲悉,在阿里內部,基礎模型團隊最重要的考核維度是“模型影響力”。在內部,高層希望團隊可以在業內成功塑造“最強模型”的心智。阿里集團CEO吳泳銘同時兼任阿里云CEO,據悉吳泳銘頻繁參與到基礎模型團隊的業務溝通之中,并密切留意模型團隊的各種進展。
兩個具體的維度,被視為阿里基礎模型團隊的考核點:其一是衍生模型量,其二是在開發者社區的受歡迎度。
由于阿里采取模型開源策略,基于Qwen開源模型的衍生模型總量,被視為一個關鍵指標。截至目前,這一數據已經超過10萬。而在開發者社區的歡迎度,阿里會考慮多個具體指標,比如開源模型下載量等。虎嗅獲悉,2024年Qwen系列模型在開發者社區的下載量超過了2億。
“在開發者社區之中,一個模型的影響力,主要有兩個維度:一個是下載量,一個是衍生模型數?;谙螺d的開源模型,微調而成新的衍生模型后,需要重新上傳至開發者社區。所以這兩個維度可以比較好地反映一個開源模型的人氣?!币晃恢槿耸扛嬖V虎嗅,在阿里內部針對全球開發者的模型影響力相關心智指標,從2024年開始就被高度重視,這和吳泳銘等技術出身的高管熟稔技術圈文化有關。
虎嗅另外獨家獲悉,2025年阿里模型團隊也意識到了諸如智駕、AI Agent、AI硬件等機會風口的存在。為了更好地契合這些場景,基礎模型團隊依然會采取“多尺寸”策略。2024年發布的Qwen2系列,總共發布了7種不同的模型尺寸,而即將發布的Qwen3尺寸類型可能會更多。
值得注意的是,伴隨Qwen3發布,阿里正在開啟史上最大規模的校招,而虎嗅獲悉,校招的HC之中涉及到基礎模型團隊的崗位量也達到史上最高。和以往不同的是,目前基礎模型團隊在招人過程中,更看重人才的“AI原生”,也就是說更希望引入一開始接觸的就是大語言模型的人才,而非傳統的NLP人才( 自然語言模型 )。
文章標題:阿里秘密研發新模型將發布,影響力指標成最重要考核
文章鏈接:https://www.huxiu.com/article/4187485.html
閱讀原文:阿里秘密研發新模型將發布,影響力指標成最重要考核_虎嗅網