您当前的位置:首页 > 电脑百科 > 人工智能

AI十年浮沉,与改变命运的大模型

时间:2023-04-21 10:26:41  来源:  作者:远川研究所

来源:远川研究所

2019年,前谷歌CEO埃里克·施密特向白宫递交了一份颇为“诡谲”的报告。这份长达750页的文件,核心观点其实只有一句话:若美国再不加大投资,中国将彻底主导AI领域[1]。

施密特此举其实有“骗经费”之嫌:一年前,谷歌曾迫于舆论压力退出了一个政府AI项目,他一直对此耿耿于怀。但报告本身却并非胡诌。同年,美国数据创新中心也发布了一份报告,声称中国AI实力全球第二,且在数据等层面比美国更具优势[2]。

在全民追赶GPT的今天,这则旧闻读起来颇有几分“魔幻感”。

报告甚至上升到了“国家安全”的高度

然而,施密特口中的AI,与如今人们谈论的GPT并非一个东西。

以GPT为代表的AI,指的其实是大模型。它拥有生成图像、音频、视频等内容的能力,像是个文艺青年。但彼时让美国人深感威胁的,多指识别型AI(小模型)。它擅长各类数据分析工作,如同一个木得感情的运算机器。

大模型走红前,识别型AI曾被寄予了太多改变世界的厚望,在中国催生了一段群雄并起、热钱涌动的黄金岁月。巅峰时期,中国AI初创企业的融资金额甚至超过了美国——李开复将其形容为“有三个AI专家就能估值7亿、靠AI概念就能忽悠投资人”,也不怪美国人感到焦虑。

只是好景不长:后来VC陆陆续续退出,曾经风头无两的独角兽也褪去了身上的光环,残暴的欢愉最终以残暴终结。

对此,百度集团执行副总裁、百度智能云事业群总裁沈抖曾打过这么一个比方:大模型出现前的AI像是氧气——本身很有价值,但自己不会燃烧,必须找到可燃物才能把价值给发挥出来。这里的“可燃物”,指的是落地场景。

AI起起落落这十年,成也场景,败也场景。

旧范式的困境

2016年,谷歌AlphaGO不仅彻底颠覆了围棋,也改变了当时的AI创业。一时间,VC、科学家、大学教授,乃到各路乡镇企业家,无一不在谈论着AI商业化的可能性。短短一年时间,国内诞生了528家AI企业,催生371起AI投融资,同比涨幅达到了38.9%;同一时间,中国AI企业申请了9000多项AI专利,几乎是美国新增专利数的两倍有余[3]。

不过,整个行业闭眼狂奔的同时,鲜有人会注意到初冬的号角已经悄悄吹响。2019年,繁荣戛然而止。

首先是融资遇冷:这一年的AI融资金额仅有186亿元,相比2018年直接腰斩了一个0。受此影响,AI初创企业的数量也大幅缩水,仅有鼎盛时期的1/20。至于那些从竞争中幸存、成功“上岸”的AI企业,其财务状况仍旧惨不忍睹。据不完全统计,近九成AI企业都处于严重亏损的状态[4]。

大起大落背后,是AI长期以来的产业化困境。

2021年之前,业界三大主流AI技术分别是计算机视觉、语音识别、自然语言识别,本质都属于识别型AI。单从技术层面来看,上述技术都具备着充分的下游应用空间,想象力充足。

例如在“AI+安防”领域,2020年时已有453亿元的市场,且增速可观,预计到2025年时市场规模将再翻一番[6]。

可下游需求不断扩大,并无法拯救亏钱的AI企业。识别型AI的技术特点,决定了它是一门技术、投入与产出不成正比的生意。

识别型AI采用的是小模型——这是一种专为特定任务而生的技术。在实际训练小模型时,研究员只需给AI灌入标注过的特定数据,便能让AI获得对应的能力。如果想要一个能抓“闯红灯”的AI,那么无需教它语文数学,只要让它从小学习各种闯红灯的视频即可。

小模型的优点在于简单、高效,专用向的AI能够很好地完成对应任务。但其缺点同样明显:由于没学过其他知识,一个AI只能解决一个问题。譬如一个抓闯红灯的AI,显然不会具备识别超速、违规变道的能力。

识别不同元素需要不同的标注数据

由于小模型不具备通用性,导致识别型AI只能成为一门类手工作坊的定制生意。

且具体到实际应用中,一个需求有时还需要定制不止一个AI。例如在工业领域,在制造冶金钢卷时有缺陷检测这一步骤。如果将这项工作交由AI,定制起来其实相当麻烦。因为钢卷分为冷轧、热轧,所以AI企业需要同时用“冷轧-合格”“冷轧-缺陷”“热轧-合格”“热轧-缺陷”四组数据训练四遍[7]。其繁琐程度,与“五彩斑斓的黑”有的一拼。

定制需求繁琐的同时,对人力要求还不低——这活儿可不是月薪三千的大学生能干的。

出于业务需要,头部AI企业都聘请了大批科学家、博士生与教授作为研究员,而AI研究员又是出了名的“高薪岗位”。2015年,谷歌为了不让知名研究员伊利亚(Ilya Sutskever)跳槽,曾开出过200万美元/年的高薪——后来桑达尔·皮查伊继任谷歌CEO时,其基本工资是同一个数字。

财新曾对国内AI企业招股书做过一笔测算,发现:它们每挣1块钱,就要花掉0.75元的人力成本。再算上定制AI的算力、数据开销、以及其他成本,几乎做一单亏一单。

人们这才惊奇地发现,AI这门生意似乎远不如想象中那么性感。

陷入死局后,AI企业们只能寄希望于一场“推翻重来”式变革。幸运的是,没过几年,暴风雨真的来了。

通用性的价值

红杉资本率先嗅到了风雨欲来的气息。2022年9月,红杉发表了文章《Generative AI: A Creative New World》,预言一场全新的科技竞赛即将来临。投资人同行很快闻风而动,一度冷清的AI圈再度人声鼎沸。

这篇文章发布仅半年,有头有脸的科技公司们几乎全部一头扎进了AI浪潮之中,要用人工智能把每个行业都重新做一遍。

例如当下火热的直播行业,大模型应用的空间就相当广阔。对于那些养不起专业直播团队的商家,如今只需输入商品信息,百度的文心一言能够自动生成话术、配音以及数字人主播,直接包揽了整个流程。

企业无需再花钱雇主播、想话术、搞培训,能轻松实现7*24小时直播,对中小企业而言无疑是个重大利好。

在沈抖看来,大模型创业带来的众多机会,将带动数字化经济更进一步,有机会在全球范围内掀起一股产业再造的浪潮。

他认为,随着大模型深入数字经济,更多产业会出现新的改变。智能化不仅让整个生产流程大幅提效,也改变了很多原有的生产关系,包括人和人、人和设备、人和系统的关系。以前没有智能时,很多工作实际上是靠人来操作;有了智能以后,机器、设备、系统都可以按照人的思想去学习。

未来的工作模式,很有可能是一个聪明的人去指导一堆机器人。这些机器人执行人类的决定,重塑整个生产线。沈抖说道,“生成式AI已经形成全球性的‘AI再造业务’趋势,企业迎来‘智能化跃迁’的历史机遇。”

AI产业能够二度迎来春天,背后其实是大模型技术迈向成熟。

这场变革的起点发生在2017年:彼时,谷歌几位研究员公开了深度学习模型Transformer。以此为基础,OpenAI等机构开始尝试研究大模型,一种不同于识别型AI的全新技术。

其研究成果,正是如今备受关注的GPT,即Generative Pre-trained Transformer(生成式预训练Transformer)。

众所周知,一个AI由模型、数据、算力三要素构成。相比于传统的识别型AI(小模型),以GPT为代表大模型在数据、模型等方面均有不同程度的革新,赋予了大模型更强的通用性。这恰好改善了小模型时代的产业化痛点,AI实现即插即用。AI企业终于能摆脱手工作坊般的生产模式,有机会变成一门好生意。

大模型的这一价值,几乎吸引了全球所有的目光。连早已退休、专心搞慈善的比尔盖茨,都为此兴奋不已。他在一篇文章中写道,自己有幸亲历了人类可能最重要的两场革命的开端:第一次发生在windows萌芽、PC市场刚刚兴起的80年代,而第二次正是去年——大模型刚刚开始涌现的时候。

而沈抖认为,作为“通才”的大模型还催生一种全新的产业化路径:MaaS(Model as a Service),模型即服务。“根据我们提供的文心一言的大模型服务,企业能够以此为基础,结合他们所在行业去微调出一个行业大模型,再用这个行业大模型去服务整个行业。”

未来,大模型可能会成为一个类似于Android/ target=_blank class=infotextkey>安卓的“超级底座”, 每个行业都迎来AI再造的机会,并给应用端带来大量的机会。

而在美国,已经诞生了依托于大模型开展业务的独角兽。在德克萨斯州,一家初创企业凭借微调后的AI应用,在短短18个月时间做到了15亿美元估值,年收入已有3000万美元,比直接做大模型的企业还赚钱[10]。

不过,产业化潜力仅仅是大模型价值的一个方面。不同于过去两年流行的元宇宙、Web3等概念,大模型带来了实打实的生产力提升。

例如长安汽车在参与百度文心一言的邀测时,就体验了一回大模型的生成PPT功能。过去,制作一份PPT通常要花费半天甚至一天时间;如今,只需三分钟即可做出一份内容齐全、格式精美的PPT。未来,机械的重复性工作将完全可以交给AI,员工可以集中于创造更大价值的工作,企业竞争力增加同时增加社会财富。

百度智能云举行的闭门沟通会上,现场演示文心一言生成PPT

毫无疑问,大模型将是未来十年科技圈最重要的叙事之一。

百模大战

“百模大战”来了,一如当年的“百团大战”。

国内大公司纷纷扎堆推出大模型,百度文心一言最先,360、腾讯、阿里、商汤、科大讯飞、字节等纷纷紧追。大模型产品大多同时兼具对话问答、文章创作、代码写作等多项技能。市场上供给多了,但这些产品的“智力”水平却参差不齐,如何挑选成为了一个难题。

目前主流观点认为,可以有以下两个标准:

第一,从芯片到框架、模型再到应用的全链路环节都具备极为优秀的性能。

芯片决定了算力,这是AI训练的基础。OpenAI曾做过一笔测算:2012年开始,全球AI训练所用的计算量平均每3.43个月便会翻一倍,远超摩尔定律。在肉眼可见的未来,“算力不足”都将会是制约AI发展的最大因素。因此,芯片要做到性能过硬。

只有制造出算力极强的高端芯片,才能满足智算时代的计算需求,让云好用,这是基础条件。

而在框架和模型层面,软件适配程度要更高,算法积累足够,大模型能力要更强。深度学习框架需要做到全栈自主可控,推动大模型不断迭代升级。在此基础上,推出多样云服务使得大模型适应各产业的数字、智能化需求,做好模型即服务(MaaS)。

第二,能为大家提供全链路的服务保障。

服务商不仅要具备多元的能力,还需要将它们有机地结合起来:如此一来不仅能带来更高的可靠性、帮助企业降本增效,还降低AI使用门槛,既易用,又好用。

好的智算基础设施,就是要高效解决算力、算法、数据处理等多维度的问题,而且这些维度之间不是独立存在的,而是互相依赖,相互优化、紧密耦合,从而提升整体基础设施效能。

比如芯片解决算力问题,框架解决算法开发问题,大模型解决模型泛化问题,他们三者就犹如三人四足比赛中的团队合伙人,只有彼此心有灵犀、协调互补,才能打出完美的团队配合,赢得比赛胜利。

百度的解决方案,是将文心一言大模型与百度智能云服务结合起来,提供一种更便捷的一站式服务,即“云智一体”。

该方案同时提供了算力与大模型服务,企业只需提供自身行业的数据做微调,即可快速生产出符合市场需求的AI产品。不过,百度智能云能做的还不止微调一项,它还额外集成了推理与托管服务。

推理是大模型所具备的一项能力,指利用训练好的AI去进行结论推导的过程。如果说微调是将已有的房子重新装修一遍,那么推理则相当于给你空地和材料,搭建一个全新的房子。虽然推理的成本高于微调,但能让大模型新增更多原本不具备的能力,满足企业更深层次的开发需求。

至于托管,则能帮助较为早期的大模型创业者解决搭建团队的难题。高薪的AI研究员一直是市场上最抢手的资源之一,初创企业不仅资金有限,且很难在人才竞争中获得太多优势。相比之下,托管服务则会提供一支高度专业的团队,帮助第三方企业管理他们的AI解决方案。

由此可见,微调、推理、托管三大服务的功能各不相同,能够满足不同阶段企业的需求。

如今,上述“云智一体”服务已成为一种行业共识。百度智能云作为这一概念的提出者,具备一些独有的优势。

2022年,百度副总裁沈抖升级了原有的架构,正式对外官宣了“云智一体3.0”。该架构的优势在于,形成了“芯片-框架-大模型-行业应用”的智能化闭环路径,百度是全球唯一在每一层都有自研产品的公司。比如芯片层有昆仑芯,框架有中国市场份额第一的飞桨。

沈抖认为,四层架构的高效协同,能实现更高的运转效率,“我们能在同等算力投入下,把某个应用的性能提高100%,相当于让算力需求降低了50%。”这是百度智能云非常独特的优势,也使得百度智能云成为国内第一个训练出大模型的云。

如今,“云智一体”不仅仅只是一项服务,更有可能成为数字时代的一种新基建。经济学博士任泽平曾在2023年跨年演讲中预测,智能云将成为数字经济的重要技术支撑,并在未来20年成为支撑中国经济繁荣发展的新型基础设施。

对当今社会而言,这些变化既是将来时,也是进行时——AI正在以肉眼可见的速度重塑这个社会。对此,舆论上充斥着许多不安的声音。不过,当时代的浪潮扑面而来,企业、个体最好的选择,只有拥抱它。

尾声

不论是红杉资本还是黄仁勋,都喜欢将当下称为“AI的iphone时刻”。

初代IPhone发布于2007年。彼时,摩托罗拉、诺基亚才是手机市场的霸主,张小龙还在忙着做QQ邮箱,百度搜索的网页访问量每天都在增长,没人知道世界上第一款智能手机到底会带来些什么。

然而,当乔布斯讲出那句“今天,苹果将重新发明手机”时,世界依旧为之沸腾,变革的伏笔已经埋下。相比于市面上的其他产品,初代IPhone的革新之处其实只有两个方面:一是取消了键盘,改用触屏设计;二是借鉴了电脑的设计,尝试在手机中加入浏览器、股票、天气等应用。

10年之后,初代IPhone的这两大设计已然成为了智能手机的设计标准,以此构建的移动互联网改写了数十亿人的生活。

沈抖曾在采访时提到,初代IPhone的出现,将手机分成了两类:智能手机与非智能手机,而非智能手机最终被淘汰了。大模型出来后,同样会把企业分成两类:一类是智能企业,一类是非智能企业——类似的故事有可能会再次上演。

关于大模型的未来,如今看来仍有些模糊,但唯有一点是确信的——新时代的序幕正缓缓拉开,一场重新定义时代的比赛已经开始。



Tags:AI   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11  Search: AI  点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11  Search: AI  点击:(2)  评论:(0)  加入收藏
数字水印国标将出,AI生成内容标识成新焦点
日前,全国网络安全标准化技术委员会就国家标准《信息安全技术数字水印技术实现指南》公开征求意见,这是数字水印技术方面的首份国家标准,旨在解决由于缺乏统一实施流程、服务接...【详细内容】
2024-04-10  Search: AI  点击:(1)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10  Search: AI  点击:(7)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: AI  点击:(6)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09  Search: AI  点击:(3)  评论:(0)  加入收藏
AI+数字人成为市场关注焦点,大屏AI数字人助力展厅设计创意升级
随着各行业产业的数字化转型加速,人工智能时代的到来,展馆展厅行业也步入数字时代,各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】
2024-04-09  Search: AI  点击:(4)  评论:(0)  加入收藏
聚焦AI自动驾驶 热闹背后的三个灵魂拷问
2024年,如果还有人没听说过人工智能,那恐怕就不是一句OUT能够形容的了。Artificial Intelligence简称AI,已经是老少皆知、无远弗届的存在。从美国瑰丽七股(Magnificent Seven)、...【详细内容】
2024-04-09  Search: AI  点击:(4)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  Search: AI  点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09  Search: AI  点击:(4)  评论:(0)  加入收藏
▌简易百科推荐
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10    钛媒体APP  Tags:行业大模型   点击:(3)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10    九派新闻  Tags:AI课   点击:(7)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(4)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(6)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(3)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(5)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(6)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
站内最新
站内热门
站内头条