Gemini 开启大模型路线之争，新战场将“数流成河”

时间：2023-12-15 12:22:21 来源：零壹财经作者：

谷歌上演了一出“ 那些没有杀死我的，将使我更强大”。

互联网高速发展了几十年，但全世界超过10亿用户的业务或者应用一共没超过20个，而谷歌拥有6个。在绝大很多网民心目中，google是人类历史上最伟大的公司，没有之一，而且在人工智能方面的先发优势不可撼动。

这一信念嘎然而止在2022年11 月 20 号 ChatGPT发布的历史性时刻，众人纷纷倒向新观点“像ChatGPT这样的人工智能聊天机器人将像搜索引擎杀死黄页一样摧毁谷歌”（GmAIl的创始人Paul Buchheit语）。谷歌Bard发布当天，市值下跌千亿美金，似乎正好印证了这个论断。

但Gemini的发布惊艳世人，改变了大模型领域ChatGPT独领风骚的局面。

Gemini 不仅在很多性能上超过了ChatGPT 4，它同时带来了另一种可能性：具有原生数据优势的互联网巨头，可能在多模态大模型竞争中占据优势。这意味着，谷歌、马斯克、Meta以及中国的腾讯、抖音、阿里、百度等公司都有可能在Gemini 开创的路线上加速迭代大模型。

大模型战局，进入第二阶段。第一阶段只用一年时间，就搅翻了整个全球互联网和人工智能，在摩尔定律的加持下，第二个阶段，又将是怎样突破人类的想象力？

史诗级的一年

从2022年11 月 20 号 ChatGPT发布之后这一年，几乎日日充斥“奇点时刻”的惊爆与 “AI下半场”的狂欢，GPTs 和GPT4 Turbo 也意料之外情理之中地发布了。还有一系列 Sam Altman作为CEO 被OpenAI董事会开除、又王者归来的桥段出现，吃瓜群众应接不暇。

然而即便是在这样的乱世里，由Google + DeepMind用尽洪荒之力推出的 AGI 里程碑“双子星 Gemini”发布仍然可以算是核弹级的。为什么？不妨让从资本市场这个最敏感的仪表盘看看大模型的史诗级影响：

1、投资 OpenAI 百亿美金的大赢家微软市值大涨 50% 来到3万亿美元，无疑成AI最大受益者。

2、大模型淘金热的万卡起步，让英伟达股价飙升了 245%，市值解锁万亿后停不下来，已突破1.2万亿美元，超过Facebook母公司Meta或特斯拉，跻身所谓“七巨头”。

3、作为登上巅峰后迄今为止在互联网搜索领域的完全统治地位的 Google，这一年天天度日如年，这一年内讨论 Google 被颠覆话题占有史以来的99%以上，如果谷歌输掉这场AI之战会怎么样？二级市场已经给出了回答。Bard发布当天的一次回答错误，就让Google母公司Alphabet市值减少了1000亿美元。

然而就在上周 ChatGPT 一周年庆之后，Google高调发布“史上功能最强的通用人工智能大模型”，据称通过大型语言模型领域中广泛使用的32个基准测试，几乎全部（其中30 个）表现出了“最先进的性能”，不仅击败了OpenAI的GPT-4，甚至在MMLU（大规模多任务语言理解）基准测试中，成为第一个超越人类专家的模型。

如果这是真的，意味着什么？“这巨大飞跃将影响几乎所有的Google产品。” 要知道 Google是（至少目前还是）全球最大的互联网公司、搜索引擎的绝对霸主，而搜索无处不在，仍是绝大多数人获取信息的第一方式；Google母公司Alphabet的名字也说明了它的产品布局是无孔不入的。

Gemini 开启大模型路线之争，新战场将“数流成河”

2020 年GPT-3以来的标志性大模型产品

谷歌的洪荒之力

那么，姗姗来迟的 Google AGI，Gemini，究竟有没有力挽狂澜的底气？

实际上，Gemini项目需溯源至 2023年4月20日，是 Google 吹响了“红色警报”之后的关键战略抉择。那天，谷歌选择将Google Brain与DeepMind合并，成立了Google DeepMind，并宣布将公司在AI领域的世界级人才、计算能力及 TPU基础设施等资源加以结合，创新研发大模型以对标OpenAI的GPT-4，可谓押上了全部赌注，殊死背水一战。

“Gemini是Google的下一代多模态大模型”的战书已下，让外界对Gemini关注度持续升高、好奇心拉满。7月，辞职已有四年的谷歌联合创始人Sergey Brin（谢尔盖·布林）重返谷歌，其回归无疑是助阵Gemini系统，也让业界预感“Gemini将会是下半年大模型赛道的焦点。”

Gemini特征有如下三个：

1、原生多模态、多语言多国度、从海量云存储数据中做预训练

在谷歌给出的长达60页的Gemini技术报告中，最值得关注的是，Gemini模型的训练数据集既多模态又多语言。其中，前期训练数据集使用来自网络文档、书籍和代码的数据，包括图像、音频和视频数据等。

“Google拿自家海量云存储的图片进行了预训练，确实把模型的多模态能力拉升了一大截。”谷歌在Gemini技术报告中写到，“当模型多模态能力被真正探索出来时，会提供更多细节。”

实际搭载Gemini Pro的Bard与GPT-4进行的对比测试表明：通过识别不同图片中的人物、地点、文字、动物甚至其中可能蕴含的科学知识，综合对比，Gemini Pro的多模态能力确实足以抗衡GPT-4，前者的响应速度也“快很多”，另外，前者可以免费使用，但后者已经有了“3小时40次的限制”。

2、多尺寸、分场景，发挥Google 布局生态优势

Gemini分Ultra、Pro和Nano三种不同尺寸和万能应用场景的设计，其中Ultra版可用于大型数据中心等，属于处理高复杂度任务的模型；Pro版则用于各种扩展任务，属于日常使用模型，且已搭载于谷歌的对话机器人Bard中；Nano版则是应用于智能手机等移动设备终端上的模型。

Google 在多年的布局中，早就通过收购拥有了 TPU 计算集群、YouTube内容入口、Andriod 移动操作系统等无处不在的生态优势，若 Gimini 能堪与GPT-4在AGI 能力上“掰手腕”的大任，那么胜负的天平无疑将反过来倒向守成者Google 一边

3、人海战术

前面提及长达60页的Gemini技术报告，最令其惊讶的是光报告的作者就多达9页，“每页90人，八百余人，超过OpenAI公司的总人数。”

要知道，OpenAI员工总数目前不足800人，虽然在 AI 人才争夺战中 OpenAI 虹吸了不少来自各个巨头 AI 部门的大咖，当然 Google Brain 和 Deepmind也不会幸免，在其中贡献了最大比例。

Gemini 开启大模型路线之争，新战场将“数流成河”

OpenAI 人才来源

数据统计来自Leadgenious Punks & Pinstripes

但即便如此，瘦死的骆驼比马大，Google Brain内部仍然人才济济，仍然有超过800位以上来自世界各地的顶尖科学家；DeepMind目前拥有大约1000名员工，而且高薪养人，平均每名员工工资接近47万英镑，相当于人民币400万。

两者合并得到 Gemini，这也不难看出谷歌在Gemini模型开发与技术创新方面投入的AI人才之多。更何况 Google 毕竟是一个拥有将近 20 万员工的巨无霸，AI 巅峰之战提到最高议事日程上以后，内部优势兵力一定会向主战场汇集。

Gemini带来的，是“路线之争”

但这是否表明Gemini 的发布已经形势占优，甚至对GPT-4形成了“全面超越”？由于目前还无法完成全面的测评，只能为大家提供以下重要参考：

1、Gemini在中文识别理解能力上，相较GPT-4略逊一筹，也就是说“Gemini仍无法可靠处理‘非英语’的任务。”

2、谷歌专门针对测试相关领域进行了优化，Gemini只在既定领域中的指标表现好，并不能够说明模型真正的泛化能力强。“至于真正能力，需要在更多的数据集上进行测评。”

演示视频被质疑夸大造假，而且是用尚未发布的 Ultra 而不是可测的 Pro版本，一时间招致很多抨击，风波不断，但旋即谷歌也甩出演示视频制作的记录文章，大方承认视频经过剪辑合成。原来，在专业提示词循循善诱的前提下才调度到的多模态推理能力，这多少有些“强力粉饰”的魔术效果和心理暗示，但多模态的基础推理能力还是确实在的。

由此可见与ChatGPT巅峰对决的难度之大！连昔日AI 绝对王者也需要做对公众先做这样的心理诱导，等不及产品的完整实用化～

Gemini 开启大模型路线之争，新战场将“数流成河”

如图：发布视频中只保留了模型输出的反馈，没有充分暴露提示

3、原生多模态训练的范式经验证能走通，那么新的训练范式的上限极高，这条技术路线将吸引大多数拥有内容数据的平台型企业追随。Google产品线积累的海量高质量多模态数据，是后续Gemini的快速、持续迭代的保障。

Gemini的技术报告中也有这样一段表述，“谷歌发现数据质量对于高性能模型至关重要，并认为在寻找预训练的最佳数据集分布方面，仍有许多有趣的问题。”

为拓展多模态模型的训练数据集，谷歌还对外表示，Bard将在超过 170 个国家和地区提供 Gemini Pro 版本服务，并计划未来扩展到不同的模态，支持更多语言和地区。

不仅明年初将推出升级的Bard Advanced版本，在接下来的几个月里，谷歌还将陆续把Gemini应用于搜索、广告、Chrome等更多的产品和服务中。

新战局开始了

ChatGPT 一骑绝尘的情况下，其他选手本已望尘莫及，Gemini的发布让人看到了未来世界风云变幻的一种现实可能性，就是从数据优势出发，走原生多模态技术路线。

而这一新赛道（如果将来成功翻盘就算是新的）也将必然成为在互联网领域原来已经深耕多年、有数据优势的大厂之必选。

谷歌之外，Meta拥有全球 30 亿用户，它的大模型 Llama在下一战局中不可小觑；而中国的腾讯、阿里、抖音、百度等互联网巨头都是拥有 10 亿级用户的大厂，并且都在发布了自己的大模型。

至于下阶段哪家率先宣布也有了原生多模态的竞争力，需拭目以待。

不过要说每一家有江湖名号的都重新获得追赶甚至超越的机会，那得看“硬核”马斯克（Elon Musk）同不同意。现在，他已经拥有了庞大的原生数据来源。

作为实干冒险家，马斯克向来生死看淡、不服就干。他曾天使投资OpenAI一亿美金，想以特斯拉吸收OpenAI被拒，最终被踢出局。马斯克可谓初恋爱之深、未婚恨之切，携数据优势与宇宙情怀重新杀回 AI争霸之路——X改名自马斯克四百亿美金买回来的 Twitter，xAI于今年7月12日官宣成立。

马斯克是一个把太多不可能变成现实的人，他以“X”入道肩负起“为全人类发展的希望，了解宇宙的真实本质，确保人工智能的发展有助于人类意识的持久发展”。

xAI在通过X 平台实时了解世界方面具有独特而根本的优势，且能够回答其他人工智能系统拒绝回答的尖锐问题，这源于其设计初衷是通过智慧和一些叛逆的倾向来回答问题，“如果您不喜欢幽默，请不要使用它。”果然骨骼惊奇，非常马斯克。

更重要的是，马斯克的拥有庞大的原生数据来源：从推特改名而来的X（与 xAI几乎同名），全球特斯拉数据，以及星链可能带来的庞大数据。

前几个月出版的《埃隆·马斯克传》写道：

“喂养人工智能，靠的是数据。新诞生的这些聊天机器人正在接受海量信息的训练，包括互联网上的数十亿个网页和其他文档。谷歌和微软拥有搜索引擎、云服务和电子邮箱，他们手头有大量的数据可以帮他们训练这些系统。”

“马斯克能给这场战局带来什么呢？马斯克坐拥的一大数据资产是推特的信息流，其中包括多年来所有人发布的超过1万亿条推文，还有每天新增的5亿条。它是人类集体意识的体现，是世界上更新最及时的数据集，包含了现实生活中人类的各种对话、新闻、兴趣、趋势、争论和术语。”

“此外，它还是一个很好的训练场，可以让聊天机器人测试真人对其回复做出的反应。马斯克在收购推特时并没有考虑到这些数据的价值，他说：‘实际上这算是一个附带的好处，我是在买下推特以后才意识到的。’”

“马斯克还拥有另一个数据宝库：特斯拉每天从自家车辆上的摄像头接收并处理的1 600亿帧视频画面。这些数据不同于为聊天机器提供信息的文本文件，这是人类在真实世界中导航的视频数据，它有助于为实体机器人打造人工智能系统，而不再是只能⽣成文本的聊天机器人。”

“通用人工智能的王冠是打造出能够像人类⼀样在物理空间（比如工厂、办公室和火星表面）运行的机器，而不仅是⼀些让我们感到惊艳的虚拟聊天机器人。特斯拉和推特可以共同为这两个研究方向提供数据集和数据处理能力：不管是教机器在物理空间中自主导航，还是教它们用自然语言回答问题。”

2023年1月，马斯克在推特会议室召开了一系列深夜会议，研究如何针对这项服务收费的问题。他认为这是一个将推特数据集变现的好机会。且能限制谷歌和微软使用这些数据改进自家的人工智能聊天机器人。

我们可以脑补一下，如果这些具有庞大原生数据的大厂在竞争中采用数据收费甚至数据垄断策略，下一阶段的战况，将会怎样？！

Google 王者业已归来， Gemini 出场花式秀魔术引发全员关注和质疑争论，但宣传目的已经基本达到了，并就此掀起大模型战局的新篇章。

毫无疑问，大模型PK精彩程度将愈演愈烈。在这个每 72 小时就必有大事件的时代，请紧跟了别掉队，一起洞见未来～

（作者聂镭，龙马智芯创始人，零壹智库特约专家，国防科技大学人工智能博士、副研究员，广东省领军人才）

来源：零壹财经

Tags：Gemini 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

如何免费访问和使用Gemini API？

Gemini是谷歌开发的一个新模型。有了Gemini可以为查询提供图像、音频和文本，获得几乎完美的答案。我们在本教程中将学习Gemini API以及如何在机器上设置它。我们还将探究各...【详细内容】

2024-02-19　　Search: Gemini 点击:(59)　　评论:(0)　　加入收藏

从Google Gemini到OpenAI Q*：生成式AI研究领域全面综述

新智元报道来源：专知【新智元导读】这项综述性研究报告批判性地分析了生成式AI的发展现状和发展方向，并探究了谷歌Gemini和备受期待的OpenAI Q*等创新成果将如何改变多个领域...【详细内容】

2024-01-09　　Search: Gemini 点击:(161)　　评论:(0)　　加入收藏

谷歌Gemini大逆转？斯坦福Meta华人证明其推理性能强于GPT-3.5

新智元报道编辑：编辑部【新智元导读】谷歌放出的Gemini，在对标GPT的道路上似乎一直处于劣势，Gemini真的比GPT-4弱吗？最近，斯坦福和Meta的学者发文为Gemini正名。Gemini的推理能力...【详细内容】

2024-01-02　　Search: Gemini 点击:(71)　　评论:(0)　　加入收藏

谷歌创始人亲自给Gemini写代码，很核心那种

西风发自凹非寺量子位 | 公众号 QbitAI身价1050亿美元，每天还在亲自动手敲代码！？就连谷歌最新大招Gemini大模型的核心贡献者名单中，也有他的名字。没错，他就是谷歌联合创始人谢...【详细内容】

2023-12-26　　Search: Gemini 点击:(106)　　评论:(0)　　加入收藏

谷歌Gemini扳回一局！多模态能力和GPT-4V不分伯仲｜港中文128页全面测评报告

量子位 | 公众号 QbitAI谷歌扳回一局！在Gemini开放API不到一周的时间，港中文等机构就完成评测，联合发布了多达128页的报告，结果显示：在37个视觉理解任务上，Gemini-Pro表现出了和GP...【详细内容】

2023-12-22　　Search: Gemini 点击:(117)　　评论:(0)　　加入收藏

谷歌Gemini“抄袭”百度文心一言？AI训练数据陷入大难题

谷歌过于心急，Gemini推出不到半月，就遭遇两次“危机”。美东时间12月6日，谷歌推出了迄今为止规模最大，能力最强的大模型Gemini。其原生多模态的能力，通过一条约6分钟的演示视频，展...【详细内容】

2023-12-21　　Search: Gemini 点击:(124)　　评论:(0)　　加入收藏

谷歌Gemini自曝用百度文心一言训练

作者：匡达界面新闻记者 |李京亚赵一帆临近欧美圣诞假期，就在业界吐槽GPT变懒之际，谷歌这边出现了更大纰漏。12月18日，有微博大V@阑夕及《AI研究局》等自媒体爆出，在对谷歌Gemini...【详细内容】

2023-12-18　　Search: Gemini 点击:(95)　　评论:(0)　　加入收藏

Gemini 开启大模型路线之争，新战场将“数流成河”

谷歌上演了一出“ 那些没有杀死我的，将使我更强大”。互联网高速发展了几十年，但全世界超过10亿用户的业务或者应用一共没超过20个，而谷歌拥有6个。在绝大很多网民心目中，Goog...【详细内容】

2023-12-15　　Search: Gemini 点击:(88)　　评论:(0)　　加入收藏

一个GPT的幽灵在Gemini上空徘徊

原文来源：硅基立场图片来源：由无界 AI生成每次Google在生成式人工智能领域祭出大招，都能让人感到一种隐秘且巨大的情绪力量：隐忍、不甘与较量。在5月的Google I/O上，Google发布Pa...【详细内容】

2023-12-11　　Search: Gemini 点击:(234)　　评论:(0)　　加入收藏

谷歌Gemini：被神话的多模态和被低估的隐忍

Google最强大的大模型Gemini发布了，陆续读了技术报告和一些评测/分析，周末记录和分享一下：一、几点值得Mark的笔记 Gemini Ultra的得分为90.0%，是第一个在MMLU（大规模多任务语言...【详细内容】

2023-12-11　　Search: Gemini 点击:(86)　　评论:(0)　　加入收藏

▌简易百科推荐

多方热议人工智能产业新机遇

编者按&emsp;&emsp;从前沿科技展会到高层对话平台，从上海、重庆到博鳌，从线上到线下……一场场高规格、大规模的盛会中，人工智能正在成为各界热议的高频词。赋能千...【详细内容】

2024-04-08　　　　中国家电网　　Tags:人工智能　点击:(4)　　评论:(0)　　加入收藏

人形机器人时代来了吗

日前，由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】

2024-04-08　　　　中国青年报　　Tags:人形机器人　点击:(4)　　评论:(0)　　加入收藏

AI重塑社交：腾讯与字节跳动的新赛场

文|新火种一号编辑|美美最近，腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品，尽管腾讯和字节跳动在前段时间刚刚“破冰”，但这一举措不仅意味着这两大巨头之...【详细内容】

2024-04-07　　　　蓝鲸财经　　Tags:AI 　点击:(7)　　评论:(0)　　加入收藏

第一批用 Kimi 做内容的网红已经杀疯了

作者：王东东文章来自：斗战圣佛小组技术信仰派 VS 市场信仰派朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是：大模型有没有戏。技术派...【详细内容】

2024-04-04　　　　斗战圣佛小组　　Tags:Kimi 　点击:(4)　　评论:(0)　　加入收藏

昆仑万维发布面向人工智能时代的六条人才宣言

过去的一年多，是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里，我们见证了人工智能的快速发展和广泛的影响，人工智能已经迅速地融入了我们的生活，深刻...【详细内容】

2024-04-03　　　　砍柴网　　Tags:昆仑万维　点击:(7)　　评论:(0)　　加入收藏

AI干掉声优？音频大模型追逐“图灵时刻”

七十年前，“人工智能之父”图灵提出，如果人无法判断屏幕的另一侧究竟是人还是机器，就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般，指引着AI行业的工作者们不...【详细内容】

2024-04-03　　　　第一财经网　　Tags:AI 　点击:(5)　　评论:(0)　　加入收藏

生成式人工智能有哪些新趋势？

相较于去年，当下我们所能体验的人工智能技术的范围已经大幅提升。从搜索引擎、电商平台再到社媒平台，只要是以搜索结果为导向的内容，都会出现它的身影。但其实，人工智能的应用场...【详细内容】

2024-04-03　　品谈教师帮　　　　Tags:人工智能　点击:(6)　　评论:(0)　　加入收藏

AI世界的新难题：互联网的信息不够用了！

高质量数据的紧缺正成为AI发展的重要障碍。4月1日，据媒体报道，随着OpenAI、Google等企业不断深入发展AI技术，科技巨头们遇到了一个新问题：现有的互联网信息量可能不足以支撑他们...【详细内容】

2024-04-02　　硬AI　　　　Tags:AI 　点击:(6)　　评论:(0)　　加入收藏

今天起，ChatGPT无需注册就能用了！

　来源：量子位　　　　金磊克雷西发自凹非寺　　就在刚刚，OpenAI狠狠地open了一把：从今天起，ChatGPT打开即用，无需再注册帐号和登录了！　　像这样，直接登录网站，然后就可以开启对...【详细内容】

2024-04-02　　　　量子位　　　Tags:ChatGPT 　点击:(7)　　评论:(0)　　加入收藏

AI时代，面对死亡有了第二种选择？

今年春节期间，罗佩玺瞒着妈妈用AI技术“复活”了外婆，她将妈妈现在的模样和外婆留下的老照片合成在一起。时隔60多年，妈妈和外婆终于又“见面”了，这是她送给妈妈的生日礼物。收...【详细内容】

2024-04-02　　　　中国青年报　　Tags:AI时代　点击:(7)　　评论:(0)　　加入收藏

推荐资讯

访问网站显示不安全是	掌握独立站SEO策略，提
快手蓝色小钥匙跳转微	微信朋友圈如何置顶
Facebook新用户扩展怎	详解微信里面的分期可
微信表情包更新：原创设	微信朋友圈功能大改版