阿里通義千問發布小尺寸模型Qwen3
阿里通義千問8月7日宣布,其新發布的Qwen3-4B模型系列中的兩個新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已經在魔搭社區和HuggingFace平臺上正式開源。Qwen3-4B-Instruct-2507全面超越了閉源的小尺寸模型GPT4.1-Nano,并在性能上接近中等規模的Qwen3-30B-A3B(non-thinking)。在推理領域,Qwen3-4B-Thinking-2507的表現甚至可以與Qwen3-30B-A3B(thinking)相媲美。官方指出,2507版本的Qwen3-4B模型特別適合在手機等端側硬件上部署,這將使得手機等移動設備能夠高效地運行這些模型。
文章評價

發布
發布