目前新模型已在魔搭社区、HuggingFace正式开源。据介绍,在非推理领域,Qwen3-4B-Instruct-2507全面超越闭源的GPT4.1-Nano。

在推理领域,Qwen3-4B-Thinking-2507甚至可以媲美中等规模的Qwen3-30B-A3B(thinking)。官方表示,2507版本的Qwen3-4B模型对手机等端侧硬件部署尤为友好。
Qwen3-4B-Instruct-2507
通用能力均大幅提升,超越商业闭源的小尺寸模型GPT-4.1-nano,与中等规模的Qwen3-30B-A3B(non-thinking)性能接近。
新模型覆盖更多语言的长尾知识,在主观和开放性任务中增强了人类偏好对齐,可提供更符合人们需求的答复。上下文理解扩展至256K,小模型也能处理长文本。
Qwen3-4B-Thinking-2507
推理能力大幅增强,AIME25高达81.3分,Qwen3-4B-Thinking-2507的推理表现可媲美中等模型Qwen3-30B-Thinking。
特别是在聚焦数学能力的AIME25测评中,以4B参数量斩获81.3分成绩。Agent分数爆表,相关评测均超越更大尺寸的Qwen3-30B-Thinking模型。256K tokens上下文的理解能力,支持更复杂的文档分析
下一篇:没有了