通义千问 Qwen3-4B 新模型发布,端侧性能大跃升

科技讯
2025
08/07
09:16
IT之家
分享

  8 月 7 日消息,昨日(8 月 6 日),通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,实现了性能的大幅提升。

  官方指出,小型语言模型(SLM)在智能体人工智能(Agentic AI)的发展进程里具有极高价值。而 “2507” 版本的 Qwen3-4B 模型,具备体积小巧但性能强劲的特点,尤其适合在手机等端侧硬件上进行部署。

  根据相关博文介绍,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著增强了通用能力,目标是成为更为全能的端侧得力工具。

  该模型掌握了更丰富的语言知识以及长尾知识,其上下文理解长度扩展到了 256K,即便作为小模型也能够处理长文本。在通用能力方面,该模型超越了闭源的小尺寸模型 GPT-4.1-nano,性能与同等规模的 Qwen3-30B-A3B(non-thinking)相近。

  官方表示,该模型更像是一位高效的 “执行专家”,能够严格遵循指令,迅速给出响应,在内容创作、工具调用等方面更为适用。

  在推理(thinking)领域,Qwen3-4B-Thinking-2507 的推理能力有了大幅提升,在 AIME25 测评中获得了高达 81.3 分的成绩。Qwen3-4B-Thinking-2507 的推理表现可与中等模型 Qwen3-30B-Thinking 相媲美,在聚焦数学能力的 AIME25 测评中,以仅 4B 的参数量取得了 81.3 分的优异成绩。

  官方称此模型如同一位严谨的 “学术专家”,面对复杂问题时能够逐步展开推理,完成任务的过程更加深入且可靠 。

THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一点科技的观点和立场。
猜你喜欢

创业版企业上市条件解析

本文详细解析了创业版企业上市所需的基本条件,包括财务标准、业务模式、市场审核等方面的内容,为企业成功上市提供了全面的指南。

未来科技的五大趋势

探索未来科技的五大趋势,包括人工智能、量子计算、生物工程、虚拟现实和可再生能源技术,它们将如何塑造我们的未来生活和社会。

未来科技:人工智能与人类生活的融合

探索人工智能如何改变人类生活,分析其对社会和经济的影响,以及如何应对可能带来的挑战。

免费AI机器人软件的探索之旅

本文介绍了市场上几款优秀的免费AI机器人软件,包括OpenAI的GPT系列模型、InVision的A/B Testing工具以及Google Cloud提供的免费AI服务。还推荐了一些适合初学者的开源AI项目和机器学习框架,帮助用户在不花费一分钱的情况下,充分利用AI的强大功能。

未来科技:AI与人类共生的新篇章

本文探讨了人工智能(AI)与人类共生的未来趋势,分析了技术进步带来的机遇与挑战,并提出了相应的对策建议。文章强调了在享受AI便利的同时,必须关注其对就业市场的影响以及伦理道德问题的重要性。

探索未来科技:人工智能如何重塑我们的世界

本文探讨了人工智能如何改变我们的日常生活、工作方式以及医疗领域等多个方面。通过分析AI技术的优势与挑战,提出了应对策略和建议。