您当前的位置:首页 > 新闻资讯 > 科技

微软推出iPhone能跑的ChatGPT级模型,性能超Llama-3

时间:2024-04-24 10:11:04  来源:虎嗅APP  作者:

Llama 3发布刚几天,微软就出手截胡了?

今天发布的Phi-3系列小模型技术报告,引起AI圈热议。

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B

为了方便开源社区使用,还特意设计成了与Llama系列兼容的结构。

微软这次打出手机就能直接跑的小模型”的旗号,4bit量化后的phi-3-mini在iphone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

这意味着,现在手机上能本地运行的最佳开源模型,已经做到ChatGPT水平。

在技术报告中还玩了一把花活,让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

除了mini杯之外,小杯中杯也一并发布:

Phi-3-small,7B参数,为支持多语言换用了TikToken分词器,并额外增加10%多语种数据。

Phi-3-medium,14B参数,在更多数据上训练,多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

作者阵容一看也不简单,一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

那么,Phi-3系列到底有什么独特之处呢?

根据技术报告中披露,其核心秘诀就在于数据

去年团队就发现,单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据,尤其是利用大语言模型本身去生成合成数据,配合严格过滤的高质量数据,反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据,Textbooks are all you need

Phi-3也延续了这一思路,这次他们更是下了血本:

  • 投喂了多达3.3万亿token的训练数据(medium中杯是4.8万亿);

  • 大幅强化了数据的“教育水平”过滤;

  • 更多样化的合成数据,涵盖逻辑推理、知识问答等多种技能;

  • 独特的指令微调和RLHF训练,大幅提升对话和安全性。

举个例子,比如某一天足球比赛的结果可能对于大模型是良好的训练数据,但微软团队删除了这些加强知识的数据,留下更多能提高模型推理能力的数据

这样一来,对比Llama-2系列,就可以用更小的参数获得更高的MMLU测试分数了。

不过小模型毕竟是小模型,也不可避免存在一些弱点。

微软透露,模型本身参数中没能力存储太多事实和知识,这一点也可以从TriviaQA测试分数低看出来。

缓解办法就是联网接入搜索引擎增强。

总之,微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去,未来还打算继续增强小模型的多语言能力、安全性等指标。

对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。

参考链接:  [1]https://arxiv.org/abs/2404.14219



Tags:微软   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
微软推出iPhone能跑的ChatGPT级模型,性能超Llama-3
Llama 3发布刚几天,微软就出手截胡了?今天发布的Phi-3系列小模型技术报告,引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。为了方便开源社区使用...【详细内容】
2024-04-24  Search: 微软  点击:(0)  评论:(0)  加入收藏
微软解锁 Copilot 特性:字符上限最高调至 1.6 万、支持梳理 PDF 等文件内容
IT之家 4 月 24 日消息,微软公司近日通过服务器更新,上调了 Windows 10、Windows 11 系统、网页版以及 Edge 浏览器中 Copilot 的字符上限,最高可以达到 1.6 万个;此外微软还支...【详细内容】
2024-04-24  Search: 微软  点击:(0)  评论:(0)  加入收藏
微软发布小型AI模型 可生成社交帖子
微软 今日发布了一种具有成本效益的小型语言AI模型,可以创建社交媒体帖子等任务,同时使用较少的数据量。微软在一份声明中称,该AI模型被称为“Phi-3-mini”,在评估语言、编码和...【详细内容】
2024-04-24  Search: 微软  点击:(3)  评论:(0)  加入收藏
网易再牵暴雪的手,实际想搂微软的腰
是复婚,也是新婚不论是网易和暴雪复婚的声明,还是见证重归于好的合影中,都有一个第三方:微软。在微软的斡旋和推动下,网易在这次复合中拿到了更多的运营权和后续改编暴雪IP的空间...【详细内容】
2024-04-11  Search: 微软  点击:(11)  评论:(0)  加入收藏
网易暴雪官宣「复合」,微软为何甘心「屈服」?
2023 年 1 月24 日,网易和暴雪娱乐的合约「拉闸」,在中国市场合作多年的「网易暴雪」就此画上句号。由于事发突然,从消息曝光到服务器停机中间只过了两个月,不少玩家在短时间内...【详细内容】
2024-04-10  Search: 微软  点击:(13)  评论:(0)  加入收藏
微软被点名批评:34 页报告称其安全措施不到位
IT之家 4 月 10 日消息,美国网络安全审查委员会(CSRB)近日发布了 34 页安全报告,点名批评微软安全措施不够到位,导致来自美国 22 个组织、影响 500 多人的电子邮件被泄露。该安全...【详细内容】
2024-04-10  Search: 微软  点击:(12)  评论:(0)  加入收藏
暴雪、微软和网易共同官宣:暴雪旗下游戏今年夏季重返中国大陆市场
新浪科技讯 4月10日上午消息,暴雪娱乐、微软游戏与网易今日共同宣布,暴雪娱乐旗下的游戏作品,将根据更新后的游戏发行协议自今年夏季开始陆续重返中国大陆市场。更新后的游戏出...【详细内容】
2024-04-10  Search: 微软  点击:(11)  评论:(0)  加入收藏
移动版 Outlook 解锁新技能,可验证登录 OneDrive 等微软服务
IT之家 4 月 9 日消息,微软公司近日发布新闻稿,宣布用户可以使用 Outlook 手机应用,轻松登录 Teams、OneDrive、Microsoft 365 以及 Windows 等微软账号服务。移动端 Outlook...【详细内容】
2024-04-09  Search: 微软  点击:(8)  评论:(0)  加入收藏
微软 Win11 Linux 子系统(WSL)发布 2.2.2 版本
IT之家 4 月 8 日消息,微软近日更新 Windows Subsystem for Linux(WSL),最新 2.2.2 版本中带来了诸多改进,重点更新了 nft 规则,可以让 IPv6 流量通过 Linux 容器。图源: dev.to,AI...【详细内容】
2024-04-08  Search: 微软  点击:(12)  评论:(0)  加入收藏
微软已修复 Win10 中 sysprep.exe 系统准备工具无法使用问题
IT之家 4 月 6 日消息,上个月,微软为 Win10 发布了最新的 KB5035941 更新,引入了新的锁屏小部件、用于桌面背景的 Windows 聚焦以及许多其他功能改进。除此之外,此次更新还解决...【详细内容】
2024-04-07  Search: 微软  点击:(18)  评论:(0)  加入收藏
▌简易百科推荐
微软推出iPhone能跑的ChatGPT级模型,性能超Llama-3
Llama 3发布刚几天,微软就出手截胡了?今天发布的Phi-3系列小模型技术报告,引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。为了方便开源社区使用...【详细内容】
2024-04-24    虎嗅APP  Tags:微软   点击:(0)  评论:(0)  加入收藏
微软解锁 Copilot 特性:字符上限最高调至 1.6 万、支持梳理 PDF 等文件内容
IT之家 4 月 24 日消息,微软公司近日通过服务器更新,上调了 Windows 10、Windows 11 系统、网页版以及 Edge 浏览器中 Copilot 的字符上限,最高可以达到 1.6 万个;此外微软还支...【详细内容】
2024-04-24    IT之家  Tags:Copilot   点击:(0)  评论:(0)  加入收藏
微软发布小型AI模型 可生成社交帖子
微软 今日发布了一种具有成本效益的小型语言AI模型,可以创建社交媒体帖子等任务,同时使用较少的数据量。微软在一份声明中称,该AI模型被称为“Phi-3-mini”,在评估语言、编码和...【详细内容】
2024-04-24    环球市场播报  Tags:AI模型   点击:(3)  评论:(0)  加入收藏
从大模型爆发到AI PC面世 人工智能个人化时代来了吗?
中新网上海4月18日电(记者 郑莹莹 刘育英)1981年,IBM公司推出第一台真正意义上的个人电脑,开启了PC,Personal Computer的浪潮。联想集团(简称:联想)董事长兼CEO杨元庆还记得当年...【详细内容】
2024-04-19    中国新闻网  Tags:人工智能   点击:(17)  评论:(0)  加入收藏
李彦宏新目标,押注AI原生应用
文 / 道哥“未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。” 4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 20...【详细内容】
2024-04-18    节点财经  Tags:李彦宏   点击:(6)  评论:(0)  加入收藏
李彦宏的三个AI猛药,能让百度翻盘吗?
“你只要会说话,就可以成为一名开发者!”李彦宏在第五届百度AI开发者大会自信宣告上这样说道。过去一年,AI破圈的故事屡见不鲜, 我们不断能看见“AI让写作变成零门槛”“不会画...【详细内容】
2024-04-18    太平洋科技  Tags:李彦宏   点击:(9)  评论:(0)  加入收藏
斯坦福发布2024 AI报告:中国AI专利全球第一,顶级AI模型主要来自美国
近日,由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(Stanford HAI)发布了《2024 年人工智能指数报告》(Artificial Intelligence Index Report 2024)。这份长达 300 多页...【详细内容】
2024-04-18    学术头条  Tags:AI报告   点击:(18)  评论:(0)  加入收藏
Create 2024百度AI开发者大会:李彦宏带来三大AI开发工具,让人人都是开发者
“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”4月16日,Create 2024百度AI开发者大会在深圳举办。百度创始人、董事长兼...【详细内容】
2024-04-17    每日经济新闻  Tags:AI开发   点击:(17)  评论:(0)  加入收藏
Google成了“AI界汪峰”,全都怪OpenAI?
  2016 年,Google CEO 桑达尔·皮查伊在 I/O 开发者大会上豪情满怀地向全世界宣布:Google 已经成为了搜索的代名词,Alphabet 未来将成为一家 AI 优先的公司。  凭借...【详细内容】
2024-04-15    APPSO  Tags:Google   点击:(12)  评论:(0)  加入收藏
人工智能耗电凶猛,科技巨头寻求核聚变发电
第一财经 作者:朱颖人工智能(AI)是电老虎,每天在吞噬巨大的电能。据报道,OpenAI的ChatGPT每天消耗超过50万千瓦时的电力,以响应2亿个用户的请求,而美国一个家庭平均每天的用电量...【详细内容】
2024-04-15    第一财经  Tags:人工智能耗电   点击:(12)  评论:(0)  加入收藏
站内最新
站内热门
相关头条
  • · 斯坦福发布2024 AI报告:中国AI专利全球第一,顶级AI模型主要来自美国
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • 站内头条