阿里秘密研發新模型將發布，影響力指標成最重要考核

虎嗅網 ? 4月前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

出品｜虎嗅商業消費組

作者｜苗正卿

題圖｜視覺中國

虎嗅獨家獲悉，阿里即將在2025年4月第二周發布新模型Qwen3，這將是阿里在2025年上半年最重要的模型產品，距離2024年9月阿里在云棲大會上發布Qwen2.5過去了大約七個月的時間。

據虎嗅獨家了解，在2024年發布Qwen2.5后，阿里云內部的基礎模型團隊已經開始推動Qwen3相關項目。但2025年初DeepSeek的火爆，改變了團隊的部分思路與重心。“2024年四季度，圈內已經意識到模型的推理能力很重要，但還不能說是最重要的方向，DeepSeek火爆后，推理能力已經成為繞不開的關鍵能力。”知情人士告訴虎嗅，DeepSeek-R1發布后，阿里云基礎模型團隊把策略中心進一步向模型的推理能力傾斜。

值得注意的是，在2024年下半年，阿里云基礎模型團隊對標的競品模型主要是OpenAI的o1，而在DeepSeek-R1發布后，DeepSeek-R1已經成為了另一個主要對標模型。

虎嗅獨家獲悉，在阿里內部，基礎模型團隊最重要的考核維度是“模型影響力”。在內部，高層希望團隊可以在業內成功塑造“最強模型”的心智。阿里集團CEO吳泳銘同時兼任阿里云CEO，據悉吳泳銘頻繁參與到基礎模型團隊的業務溝通之中，并密切留意模型團隊的各種進展。

兩個具體的維度，被視為阿里基礎模型團隊的考核點：其一是衍生模型量，其二是在開發者社區的受歡迎度。

由于阿里采取模型開源策略，基于Qwen開源模型的衍生模型總量，被視為一個關鍵指標。截至目前，這一數據已經超過10萬。而在開發者社區的歡迎度，阿里會考慮多個具體指標，比如開源模型下載量等。虎嗅獲悉，2024年Qwen系列模型在開發者社區的下載量超過了2億。

“在開發者社區之中，一個模型的影響力，主要有兩個維度：一個是下載量，一個是衍生模型數。基于下載的開源模型，微調而成新的衍生模型后，需要重新上傳至開發者社區。所以這兩個維度可以比較好地反映一個開源模型的人氣。”一位知情人士告訴虎嗅，在阿里內部針對全球開發者的模型影響力相關心智指標，從2024年開始就被高度重視，這和吳泳銘等技術出身的高管熟稔技術圈文化有關。

虎嗅另外獨家獲悉，2025年阿里模型團隊也意識到了諸如智駕、AI Agent、AI硬件等機會風口的存在。為了更好地契合這些場景，基礎模型團隊依然會采取“多尺寸”策略。2024年發布的Qwen2系列，總共發布了7種不同的模型尺寸，而即將發布的Qwen3尺寸類型可能會更多。

值得注意的是，伴隨Qwen3發布，阿里正在開啟史上最大規模的校招，而虎嗅獲悉，校招的HC之中涉及到基礎模型團隊的崗位量也達到史上最高。和以往不同的是，目前基礎模型團隊在招人過程中，更看重人才的“AI原生”，也就是說更希望引入一開始接觸的就是大語言模型的人才，而非傳統的NLP人才（自然語言模型）。

文章標題：阿里秘密研發新模型將發布，影響力指標成最重要考核

文章鏈接：https://www.huxiu.com/article/4187485.html

閱讀原文：阿里秘密研發新模型將發布，影響力指標成最重要考核_虎嗅網

本文被轉載1次

首發媒體

| 轉發媒體

欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

阿里秘密研發新模型將發布，影響力指標成最重要考核

本文被轉載1次

隨意打賞