您当前的位置:首页 > 资讯 > 科技

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

时间:2023-11-16 12:01:30  来源:IT之家  作者:

IT之家 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。

谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。

借助 Mirasol AI 模型,该团队试图解决两个关键挑战:

  • 需要以高频采样同步视频和音频,但要异步处理标题和视频描述。
  • 视频和音频会生成大量数据,这会让模型的容量紧张。

谷歌在 Mirasol 中使用合路器(combiners)和自回归转换器(autoregressive transformer)模型。

该模型组件会处理时间同步的视频和音频信号,然后再将视频拆分为单独的片段。

转换器处理每个片段,并学习每个片段之间的联系,然后使用另一个转换器处理上下文文本,这两个组件交换有关其各自输入的信息。

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

名为 Combiner 的新颖转换模块从每个片段中提取通用表示,并通过降维来压缩数据。每个段包含 4 到 64 帧,该模型当前共有 30 亿个参数,可以处理 128 到 512 帧的视频。

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

在测试中,Mirasol3B 在视频问题分析方面达到了新的基准,体积明显更小,并且可以处理更长的视频。使用包含内存的组合器变体,该团队可以将所需的计算能力进一步降低 18%。

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

IT之家在此附上 Mirasol 的官方新闻稿,感兴趣的用户可以深入阅读。



Tags:谷歌   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
IT之家 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解...【详细内容】
2023-11-16  Tags: 谷歌  点击:(0)  评论:(0)  加入收藏
谷歌改善Gboard输入法横屏体验:调用浮动键盘、记忆历史位置
IT之家 11 月 14 日消息,谷歌旗下的 Gboard 输入法自去年 6 月开始为折叠屏设备推出分离式键盘模式,当用户在折叠屏手机上打字时,该模式会将键盘分成两半,以便于用户在大屏中输...【详细内容】
2023-11-15  Tags: 谷歌  点击:(6)  评论:(0)  加入收藏
谷歌调整Play商店应用上架政策:至少经20人测试,开发商需完成资质认证
IT之家11月14日消息,为防范诈骗软件及提升 App 质量,谷歌日前宣布将调整Play商店应用上架政策,要求 App 在封测阶段至少经过 20 人测试,应用开发商还需要经过账号资质验证。据悉...【详细内容】
2023-11-14  Tags: 谷歌  点击:(8)  评论:(0)  加入收藏
从谷歌 20 年的站点可靠性工程(SRE)中学到的 11 个经验教训
作者 | Adrienne Walcer, Kavita Guliani, Mikel Ward, Sunny Hsiao, and Vrai Stacey译者 | 刘雅梦策划 | Tina让我们回到 2016 年,当时 YouTube 提供了大家最喜欢的视频,例...【详细内容】
2023-11-14  Tags: 谷歌  点击:(8)  评论:(0)  加入收藏
谷歌提出6条通用人工智能分级,ChatGPT只在初级
【导读】谷歌DeepMind创始人Shane Legg带领的研究团队发表了一篇关于AGI时间表的论文。他指出,LLM已经是AGI雏形,提出了6条定义AGI的标准。而且根据AI能力,他们提出了5个AGI的...【详细内容】
2023-11-13  Tags: 谷歌  点击:(9)  评论:(0)  加入收藏
科技巨头PK“云战场” 谷歌微软策略有何不同?
作者: 钱童心[ 微软和谷歌都承诺将在人工智能方面继续加大投入,以满足不断增长的需求。微软今年的支出总额有望达到创纪录的440亿美元。 ]在经历了艰难的成本缩减策略后,美国的...【详细内容】
2023-10-26  Tags: 谷歌  点击:(17)  评论:(0)  加入收藏
谷歌安卓 14 减少后台活动,可提高性能、延长续航
IT之家 10 月 25 日消息,在最新一期 #TheAndroidShow 活动,谷歌的安卓工程副总裁 Dave Burke 表示,安卓 14 系统更改了处理器和内存的工作负载平衡机制,不仅可以提升设备性能,而...【详细内容】
2023-10-25  Tags: 谷歌  点击:(6)  评论:(0)  加入收藏
苹果据称每年将投资10亿美元开发生成式AI 追赶谷歌和微软
新浪科技讯 北京时间10月23日晚间消息,据报道,ChatGPT和其他人工智能(AI)工具的崛起让苹果公司感到措手不及。如今,苹果正在人工智能的各个方面投入巨资,预计每年的投资额将达到约...【详细内容】
2023-10-24  Tags: 谷歌  点击:(29)  评论:(0)  加入收藏
日本开始调查谷歌是否违反反垄断法
新浪科技讯 北京时间10月23日下午消息,日本反垄断监管机构已开始调查谷歌是否滥用其市场地位来屏蔽竞争对手的服务,这家互联网领导者的商业行为在全球面临更多审查。日本公平...【详细内容】
2023-10-23  Tags: 谷歌  点击:(24)  评论:(0)  加入收藏
密码的末路!谷歌将密钥设为所有用户的默认登录方式
作者丨Carly Page编译丨诺亚近日,谷歌宣布,密钥正在成为所有用户的默认登录方法。因此,密钥也被这家科技巨头吹捧为密码“终结的开始”。密钥是一种防网络钓鱼的密码替代品,允许...【详细内容】
2023-10-19  Tags: 谷歌  点击:(44)  评论:(0)  加入收藏
▌简易百科推荐
谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
IT之家 11 月 16 日消息,谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解...【详细内容】
2023-11-16    IT之家  Tags:谷歌   点击:(0)  评论:(0)  加入收藏
微软推出首款自制AI芯片,发布自定义AI助手平台
名为Maia 100的AI芯片和名为Cobalt 100的中央处理器将为微软Azure数据中心提供算力。微软暂不打算对外出售这些芯片。·微软还发布了新平台Copilot Studio,让用户可以...【详细内容】
2023-11-16    澎湃新闻  Tags:微软   点击:(7)  评论:(0)  加入收藏
李彦宏谈AI原生时代:两个冷思考和三个热驱动
新浪科技讯 11月15日下午消息,在深圳2023西丽湖论坛上,百度创始人、董事长兼首席执行官李彦宏谈及国内AI行业现状分享了关于AI原生时代的两个“冷思考”和三个“热驱动”。李...【详细内容】
2023-11-16    新浪科技  Tags:AI   点击:(5)  评论:(0)  加入收藏
微软推出首款AI自研芯片 力求避免供应链瓶颈
微软首款自研AI加速器芯片Azure Maia 100微软发布了首款自研人工智能(AI)芯片和云计算处理器,试图在竞争日益激烈的AI计算市场掌握更多技术并增加产品供应。该公司还发布可以让...【详细内容】
2023-11-16    环球市场播报  Tags:芯片   点击:(4)  评论:(0)  加入收藏
人工智能大模型:从“吟诗作画”到赋能千行百业
【经济界面】只需输入简短的文字,就能生成图画、创意、文本;30秒生成未来10天全球气象高精度预报结果……当前,人工智能大模型蓬勃发展,从“吟诗作画”,到赋能千行百...【详细内容】
2023-11-16    光明日报  Tags:人工智能   点击:(8)  评论:(0)  加入收藏
大厂们别再摇一摇了,听说苹果要治你们了。
想起来了么?情绪到位了吧,那差评君开始了。要说这几天让差评君最兴奋的事情,不是双十一省了多少钱,领了商家送的多少小样,而是昨天这么一条消息:苹果要整治摇一摇广告了。据时代财...【详细内容】
2023-11-15    差评  Tags:摇一摇   点击:(5)  评论:(0)  加入收藏
谷歌改善Gboard输入法横屏体验:调用浮动键盘、记忆历史位置
IT之家 11 月 14 日消息,谷歌旗下的 Gboard 输入法自去年 6 月开始为折叠屏设备推出分离式键盘模式,当用户在折叠屏手机上打字时,该模式会将键盘分成两半,以便于用户在大屏中输...【详细内容】
2023-11-15    IT之家  Tags:谷歌   点击:(6)  评论:(0)  加入收藏
苹果iOS 17明年开放第三方应用商店
快科技11月14日消息,业内人士Mark Gurman透露,明年iOS 17将会支持侧载,用户可以在苹果App Store之外下载应用程序。Mark Gurman表示,苹果iOS系统将面向欧洲推送更新,与此同时,苹果...【详细内容】
2023-11-14    快科技  Tags:苹果iOS   点击:(8)  评论:(0)  加入收藏
最强AI芯片升级!英伟达H200登场:推理速度翻倍,明年二季度交付
  AI芯片H100的热度还没过,芯片巨头英伟达(Nasdaq:NVDA)又打出一张新王牌——H100的升级版。  当地时间11月13日,英伟达正式宣布,在目前最强AI(人工智能)芯片H100的基...【详细内容】
2023-11-14    澎湃新闻  Tags:英伟达   点击:(10)  评论:(0)  加入收藏
AI向端侧靠近!AI手机正处爆发前夜
浙商证券指出,多家科技巨头“盯上”各类端侧AI应用,已竞相布局,AI PC已接近产业落地的转折点,到2027年60%的PC将具备人工智能功能。AI手机有望成为个人智能助理,为手机行业带来创...【详细内容】
2023-11-13    华尔街见闻  Tags:AI   点击:(16)  评论:(0)  加入收藏
站内最新
站内热门
相关头条
  • · 谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频
  • · 最强AI芯片升级!英伟达H200登场:推理速度翻倍,明年二季度交付
  • · 亚马逊与Meta罕见“结盟”:Instagram和Facebook可一键直达亚马逊购物网
  • · 科幻作家江波对谈脑机接口专家李远宁:从科幻到现实,脑机接口如何连接AI与人类智慧?
  • · AI应用“龙头”浮现:Adobe!
  • · OpenAI被曝“在憋大招”:构建ChatGPT应用成本暴降95%
  • · 星链会“砸死人”?SpaceX驳斥美政府:荒谬、不合理......
  • · 7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据
  • · 狂飙300天,6500亿的 OpenAI 渴望独步全球
  • · Meta正式推出聊天机器人
  • · ChatGPT再迎重磅升级:终于能“联网”了 不再局限于旧数据
  • · 机器人同传来了!Spotify推AI语音翻译功能,马斯克惊叹
  • · OpenAI年入10亿美元,大模型商业化走到哪一步了?
  • · 微软秋季发布会:Windows的AI时代从下周开始 Office也将在11月跟进
  • · 断网也能用AI的电脑来了!英特热新一代架构首款AI芯片年底问世
  • · GPT-5来了?OpenAI被曝加急训练多模态大模型Gobi,一举狙杀谷歌Gimini!
  • · 寻找外星人重大突破:NASA发现“超级地球”,或有人居住
  • · AI监管立法在望?美参院峰会召集大佬热议,马斯克、盖茨、扎克伯格、黄仁勋齐聚
  • · 阿里云通义千问宣布向全社会开放,近期将开源更大参数规模大模型
  • · 蚂蚁发布金融大模型:两大应用产品支小宝2.0、支小助将在完成备案后上线
  • 站内头条