微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型,推理性能大幅跃升

数码
2025
07/11
15:52
IT之家
分享

  7 月 11 日消息,科技媒体 NeoWin 于 7 月 10 日发布博文称,微软推出了 Phi-4-mini-flash-reasoning 小语言模型,旨在显著提升端侧 AI 模型在数学和逻辑推理方面的能力。在当下 AI 技术迅猛发展的时代,边缘设备、移动应用和嵌入式系统等对先进推理功能的需求愈发迫切,而 Phi-4-mini-flash-reasoning 模型的诞生,正好满足了这些资源受限场景的需求。

  在架构设计上,Phi-4-mini-flash-reasoning 创新性地引入了 SambaY 架构。其中,名为 Gated Memory Unit(GMU)的组件是一大亮点。该组件能够在模型内部各部分之间高效地共享信息,极大地优化了模型的运行效率。这一特性使得模型在面对超长输入时,也能够迅速生成答案并完成任务,同时还能高效处理大量数据,理解复杂且冗长的文本或对话,为用户带来流畅且智能的交互体验。

  性能层面,Phi-4-mini-flash-reasoning 相较于其他 Phi 模型取得了重大突破。其吞吐量最高提升了 10 倍,意味着在相同时间内,该模型可以处理远超以往的请求数量,或生成多达 10 倍的文本内容,大大提高了工作效率。同时,模型延迟降低至其他 Phi 模型的 1/2~1/3.这使得应用响应更加迅速,为实际应用场景带来了质的飞跃,无论是实时交互类应用,还是对响应速度要求严苛的业务,都能从中受益。

  目前,Phi-4-mini-flash-reasoning 新型模型已在 Azure AI Foundry、NVIDIA API Catalog 和 Hugging Face 三大平台上线。这为广大开发者和用户提供了便捷的接入途径,助力他们将该模型集成到各类应用中,进一步推动端侧 AI 在不同领域的广泛应用与发展,为智能设备和应用的智能化升级注入强大动力 。

THE END
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表一点科技的观点和立场。
猜你喜欢

姜超回应红魔游戏平板5 Pro延期:水冷、屏幕等都遇到技术难关

红魔游戏平板5Pro将于6月30日正式发布,随着发布会临近,官方已启动新品预热,并率先公布外观设计。今日,红魔游戏手机产品总经理姜超发文提到,“很抱歉平板发布的确实比预期晚了很多,我们在水冷、屏幕、高

红魔

6天前

荣耀X80 Pro Max 11000mAh电池太猛!续航刷新世界纪录

荣耀X80ProMax将于今晚19:00正式发布,新机主打超长续航、防水和抗摔能力。据了解,荣耀X80ProMax搭载11000mAh第四代青海湖电池,是目前行业电池容量最大的智能手机。新机续航到底有

红魔最强游戏平板亮相!这设计行业唯一 透明机身超酷炫

红魔游戏平板5Pro将于6月30日正式发布,今日官方正式揭晓了新机外观。红魔游戏平板5Pro提供黑色和银色两款配色,采用号称是“行业独一份”的RGB水冷设计。平板通过透明机身直接展示内部水冷管路,运行

红魔

6天前

苹果20款新品蓄势待发 首款折叠屏iPhone领衔

据MacRumors报道,科技记者马克·古尔曼日前透露,苹果计划从今年下半年到2027年推出约20款新品,覆盖iPhone、Mac、iPad、AppleWatch、智能家居及AI穿戴设备等多个产品线。

14999元起 你买苹果or华为!折叠屏iPhone开产 今年9月发布

从供应链流出的最新动态显示,苹果筹备多年的首款折叠屏iPhone已经正式进入试产阶段,距离正式和消费者见面的日子越来越近。有参与项目配套的苹果供应链企业对外爆料,公司近期已经开始向这款首款折叠屏iPh

高通联发科首发台积电第二代2nm工艺:苹果落后整整一年

今年9月,苹果A20系列、高通骁龙8E6系列和联发科天玑9600系列将集中亮相,三大旗舰芯片首次采用台积电2nm工艺节点,先进制程的竞争迎来全新拐点。尽管三家大厂均交由台积电代工,但制程版本却有明显分