您当前的位置:首页 > 新闻资讯 > 科技

比人类算法快70%!谷歌DeepMind用AI改进数据排序,登上Nature

时间:2023-06-09 14:17:06  来源:  作者:智东西

智东西

编译 | 程茜

编辑 | 心缘

智东西6月8日消息,昨晚,人工智能研究实验室google DeepMind发布三大AI工具AlphaZero、MuZero、AlphaDev,这些工具可以提高数据中心资源利用率、提升视频压缩效率、发现更快算法,从而优化整个计算生态系统。

昨天,AlphaDev的相关进展已经登上国际学术顶刊Nature。AlphaZero的专用版本AlphaDev还发现了新算法,可以将短元素序列的排序效率提高70%。

现在,AlphaDev的新排序算法已发布到C++库中。Google DeepMind的博客称,这是十多年来排序库算法的第一次变化,也是第一次将通过强化学习设计的算法添加到该库中。散列算法也已经发布到开源Abseil库中。

C++库开源链接:https://reviews.llvm.org/D118029

论文链接:https://www.nature.com/articles/s41586-023-06004-9

Google DeepMind正在努力创建对世界具有广泛理解的AI工具来优化计算生态系统,作为构建更加强大和通用人工智能系统的一部分。

研究人员还在扩展基于强化学习的谷歌AI模型AlphaZero、MuZero的能力,用来帮助优化数据中心的视频压缩,使得数据中心未充分利用的硬件数量减少19%,以及在不损失视频质量的同时,进一步降低比特率。

这些工具目前实现了整个计算生态系统中效率的提升,但这些结果也证明了未来更通用的人工智能工具具有变革的潜力。

一、AlphaDev:排序效率提升70%、检索效率提升30%,数百万开发人员已应用

此前,Google DeepMind开发了一个用于玩围棋游戏的AI系统AlphaZero,现在研究人员将这一系统应用到了构建算法排序中打造了AlphaDev,其结果显示,AlphaDev创建的算法在转换为标准编程语言C++时,排序数据的速度是人类生成版本的三倍。

“我们有点震惊。”领导这项工作的Google DeepMind计算机科学家Daniel Mankowitz说,“起初我们不相信(这个结果)。”

AlphaDev可以被用于快速排序(faster sorting)和散列算法(hashing algorithms),这两种算法每天会被使用数万亿次来对数据进行排序、存储、检索。

1、下象棋到找算法,短元素排序效率提高70%

排序算法会影响所有数字设备处理和显示信息的方式,包括一些在线搜索结果的呈现、社交媒体上帖子的排名以及一些用户推荐内容。

AlphaDev研发了一种可以提升排序效率的算法,并且该算法与C++库中人类设计的算法相比可以将短元素序列的排序效率提高70%,将超过25万个元素的序列排序效率提高约1.7%。这也使得当用户提交搜索查询时,AlphaDev的算法可以快速对结果进行排序,以更快找到与用户搜索相关度高的答案。

刚开始,研究人员将AlphaDev应用于按大小对数字进行排序的任务,刚开始只是让其一次对3、4、5个数字进行排序,这对于后续让其进行较多数字排序很重要。

▲对两个数字进行排序

AlphaDev的工作方式与AlphaZero类似,后者结合了计算机版本的深思熟虑和直觉来选择棋盘游戏中的动作。AlphaDev则不会选择动作,它会选择指令添加到一个过程中。

AlphaDev通过从头开始而不是改进现有算法来发现更快的算法,并且它会关注计算机的汇编指令。汇编指令用于为计算机创建二进制代码以执行操作,Google DeepMind的研究人员认为,在这个较低层次上会有很多可以改进的地方。

在构建算法时,AlphaDev会通过将算法的输出与预期结果进行比较来检查它是否正确。对于排序算法,这意味着无序数字进入,正确排序的数字出来。研究人员会奖励AlphaDev对数字的正确排序以及排序的速度和效率。

2、数据存储节省近70%时间,算法已经开源

Google DeepMind团队还将AlphaDev应用于非排序算法,它用于将特定格式存储的数据转换为字节的算法版本比标准版本少用了67%的时间,用于数据存储和检索的散列算法比标准算法花费的时间少30%。

散列信息算法通常用于在数据库中进行存储和检索。散列算法通常使用一个关键词来生成一个对应的唯一散列,这一散列就会对应于需要检索的数据值,如输入关键词用户名“Jane Doe”,会生成检索对应的“订单号164335-87”。

一个较为相似的场景是,图书管理员通过分类系统来快速查找特定书籍,计算机借助散列算法,就可以快速理解它要找什么以及在哪里能找到。

▲输入关键词检索对应数据值

当应用于数据中心9-16字节范围的散列算法时,AlphaDev的算法能将检索效率提升30%。

去年1月,Google DeepMind的研究人员在LLVM项目的C++标准库中发布了基于机器学习的排序算法,在Abseil库发布了散列算法,目前,已经有云计算、在线购物、供应链管理等行业的数百万开发人员和公司正在应用这些算法。

二、AlphaZero:优化数据中心资源,硬件充分利用率提高19%

数据中心需要管理从提供搜索结果到处理数据集的一切任务。谷歌大规模集群管理系统Borg管理着谷歌的数十亿个任务,同时这一系统还要去分配工作负载来优化数据中心的内部基础设施,并处理谷歌搜索等用户使用的服务,管理批处理。

分配工作负载这一过程就像Borg在玩俄罗斯方块,如何在有限的空间内,最大程度地放置更多的方块,把空余的位置都利用起来。

▲将分配工作负载比喻为俄罗斯方块游戏

此前,Borg需要使用手动编码的规则来安排任务,优化工作负载。但面对庞大如数十亿个任务的规模时,这些手动编码的规则无法考虑不断变化的工作负载分布的多样性,因此它们被设计为“最适合所有人的一种尺寸”,也就是选择了一个中间值。

在这一场景下,AlphaZero就派上了用场,其构建的算法能够自动创建单独的最佳定制规则,这些规则使得Borg在分配工作负载时更加高效,能找到适合不同任务的规则。

研究人员在实验期间发现,AlphaZero还能识别进入数据中心的任务的模式,以及预测管理容量的最佳方法,并做出具有最佳长期结果的决策。

当AlphaZero应用于Borg时,研究人员的实验表明,这种方法可以将未充分利用的硬件数量减少多达19%,优化谷歌数据中心的资源利用率。

三、MuZero:编码视频图片组,压缩比特率降低4%

在互联网中,视频流会占据其流量的相当大一部分,因此,如果能提升视频传输的效率,将会对每天观看视频的数百万人产生巨大影响。

去年,Google DeepMind与视频网站YouTube合作,通过MuZero来压缩和传输视频,其结果显示,这一工具能在不影响视频质量的情况下将比特率降低4%。

早期,研究人员将MuZero应用于优化视频中每个单独帧的压缩,现在,他们将其扩展至决定在编码过程中如何对帧进行分组和引用。

最开始,MuZero会定义要压缩的GOP(group of pictures,图片组)帧,然后根据图片的视觉相似性进行分组。MuZero会将其中一个图片组的关键帧进行压缩,再参考关键帧去压缩其它帧,在这一过程中,该算法会通过块搜索(block search)来查找图片中变化最小的区域,使得压缩效果更好还能保证视频质量。

▲MuZero压缩图片组

最后,一组图片组压缩完成后,MuZero再按照同样的步骤完成视频其它部分图片组的压缩。

这些研究的早期结果表明MuZero有潜力成为一个更通用的工具,帮助研究人员在视频压缩过程中找到最佳解决方案。

结语:通用人工智能工具的变革潜力已经凸显

当下,Google DeepMind的AI工具正在使得数十亿用户在使用计算机的过程中节省时间和精力,包括从玩游戏到解决每台计算机设备核心的复杂工程问题。研究人员认为,这仅仅是个开始。

未来,越来越多的通用人工智能工具或许可以优化为数字世界提供动力的整个计算生态系统,但与此同时,支持这些工具背后的数字基础设施需要更快、更高效、更可持续。因此,这一愿景的实现需要更多理论和技术上的突破。

不可否认的是,通用人工智能工具的变革潜力已经显现出来,并且研究人员已经开始考虑将其应用于技术、科学和医学等领域。



Tags:DeepMind   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AGI,距离现实仅五年?阿尔特曼等科技领袖大胆预测,DeepMind提出6大原则
“五年内,AGI很可能就会到来。”这不是科幻小说的情节,而是业界大佬的预言。近日,随着Anthropic最新一代大模型Claude 3被曝表现出“自我意识”,以及马斯克正式起诉OpenAI及其首...【详细内容】
2024-03-13  Search: DeepMind  点击:(24)  评论:(0)  加入收藏
大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好
面对当前微调大模型主要依赖人类生成数据的普遍做法,谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。图片来源:由无界 AI生成如你我所见,大语言模型(LLM)正在改变深度学习...【详细内容】
2023-12-26  Search: DeepMind  点击:(140)  评论:(0)  加入收藏
OpenAI 工程师自曝开发 ChatGPT 仅用时 8 天,长文揭秘谷歌 DeepMind 等硅谷顶流如何诞生
OpenAI 的出现,源自马斯克和拉里佩奇的一场争论。那是在 2015 年,特斯拉刚刚盈利,佩奇还是谷歌的 CEO。就是这场争吵的几周后,OpenAI 在一次晚饭上诞生。最近,OpenAI 工程师惊人...【详细内容】
2023-12-18  Search: DeepMind  点击:(72)  评论:(0)  加入收藏
Transformer+强化学习,DeepMind让大模型成为机器人感知世界大脑
在开发机器人学习方法时,如果能整合大型多样化数据集,再组合使用强大的富有表现力的模型(如 Transformer),那么就有望开发出具备泛化能力且广泛适用的策略,从而让机器人能学会很好...【详细内容】
2023-09-22  Search: DeepMind  点击:(355)  评论:(0)  加入收藏
谷歌DeepMind开发新模型,能预测哪些DNA突变引起遗传疾病
9月20日消息,谷歌旗下人工智能团队DeepMind开发了一款全新的人工智能模型,名为AlphaMissense。它能够快速分析错义突变对人体的影响,加速科学家研究罕见遗传病。相关成果于本周...【详细内容】
2023-09-20  Search: DeepMind  点击:(136)  评论:(0)  加入收藏
DeepMind联合创始人:生成式AI只是一个阶段,接下来是交互式AI(智能体)可通过调用其他软件和其他人来完成为他们设置的任务
DeepMind 联合创始人 Mustafa Suleyman 希望构建一个聊天机器人,其功能远不止聊天。在我最近与他的一次谈话中,他告诉我生成式人工智能只是一个阶段。接下来是交互式人工智能:...【详细内容】
2023-09-18  Search: DeepMind  点击:(314)  评论:(0)  加入收藏
GPT-5正秘密训练!DeepMind联创爆料,这模型比GPT-4大100倍
新智元报道 【新智元导读】GPT-5仍在秘密训练中!DeepMind联合创始人在近日采访中透露,未来3年,Inflection模型要比现在的GPT-4大1000倍。近来,DeepMind联合创始人Mustafa Suley...【详细内容】
2023-09-04  Search: DeepMind  点击:(120)  评论:(0)  加入收藏
机器人可“自我学习”!谷歌DeepMind发布首个机器人算法模型,“潘多拉魔盒”打开了?
谷歌正在把先进的人工智能(AI)模型植入机器人,给机器人配一个AI大脑。美东时间7月28日周五, 谷歌DeepMind宣布推出应用于机器人领域的新产品——名为Robotics Transfo...【详细内容】
2023-07-29  Search: DeepMind  点击:(55)  评论:(0)  加入收藏
谷歌DeepMind自曝正开发新型AI模型Gemini,号称“比 GPT-4 强”
IT之家 6 月 28 日消息,在上个月的谷歌(Google) I / O 开发者大会上,谷歌公司首次透露了其正在开发的大型语言模型 Gemini。现据 Wired 报道,DeepMind 联合创始人兼 Google DeepM...【详细内容】
2023-06-28  Search: DeepMind  点击:(77)  评论:(0)  加入收藏
碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体
新智元报道编辑:编辑部【新智元导读】谷歌DeepMind CEO Hassabis全新爆料:全新Gemini模型将结合进AlphaGo和大语言模型,成本预计是数千万美元,甚至数亿。谷歌,是真的破釜沉舟了。...【详细内容】
2023-06-27  Search: DeepMind  点击:(65)  评论:(0)  加入收藏
▌简易百科推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(7)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条