您当前的位置:首页 > 电脑百科 > 人工智能

大模型激战正酣?“小模型”或许才是出路

时间:2023-08-03 11:26:10  来源:钛媒体APP  作者:

图片来源@视觉中国

文 | 青橙财经,作者丨青沐编辑丨六子

7月26日,AI target=_blank class=infotextkey>OpenAI推出Android/ target=_blank class=infotextkey>安卓版ChatGPT,虽然目前仅限在美国、印度、孟加拉国和巴西四国使用,但OpenAI也表示,下周将在更多国家推广安卓版ChatGPT。这让近期热度稍降的ChatGPT重回大众视野

ChatGPT在上线之初,用仅仅两个月的时间,就一跃成为历史上最快突破1亿用户的应用,沉寂了许久的全球科技市场再次沸腾,国内的投资人与创业者,纷纷飞往硅谷取经问道。

面对这一汹涌的AI浪潮,中国的创业者和投资人们行动很快。数月之后,中国科技行业已呈现“百模大战”的壮观姿态。2023年上半年,国内就已出现了80多个大模型产品,在最新的数据中,国内市场上已经有130家公司在做大模型。而在全球范围内,今年上半年新发布的大模型已超过400个。

中国的大模型玩家们在追逐商业利益和科技未来的同时,也被冠以民族情怀:做中国版的OpenAI

7月24日消息,安卓版ChatGPT上线前夕,IDC发布的大模型技术能力评估报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一。百度副总裁吴甜表示,新版本的文心一言3.5能力已超越ChatGPT 3.5,这是在我们国内开展相关技术工作重要的里程碑。

科大讯飞则在此前就宣布,将在10月24日对星火大模型进行第三次迭代,全面对标ChatGPT,中文能力实现超越GPT3.5,英文能力与GPT3.5相当。

01 场景,场景

事实上,正如前google科学家、出门问问创始人兼CEO李志飞所说的那样,中国或许不会存在一个跟OpenAI一样的组织。

相比ChatGPT这种通用大模型,国内的大模型产品,更多注重应用和场景,即垂直大模型、行业大模型、产业大模型。对此,科技创投圈大佬们的意见几乎表达了同一个意思。

百度创始人李彦宏早就公开表示:“创业公司重新做一个ChatGPT其实没有多大意义。我觉得基于这种大语言模型开发应用机会很大,没有必要再重新发明一遍轮子,有了轮子之后,做汽车、飞机,价值可能比轮子大多了。”

金沙江创投董事总经理朱啸虎在朋友圈写道:“不要迷信通用大模型,因为明年GPT-3.5就成commodity(通用基础设施),而三年后,GPT-4也会是。对于大部分创业者,场景优先,数据为王!”

猎豹移动董事长兼CEO傅盛认为,大模型会分两条路。一条叫越来越牛的大模型,是“造一个爱因斯坦”。但很多工作岗位不需要“爱因斯坦”,大学毕业生就能做。这是另一条路。我相信一定有大量的人做“平民化大模型”。

华为云CEO张平安在盘古大模型3.0发布会上表示:“盘古大模型没有时间作诗和聊天。参数再多、对话能力做得再好,但如果解决不了实际问题,也没有多大用处。”

近期国内发布的大模型,大多都面向垂直产业落地,如京东发布的言犀大模型,携程发布的旅游行业垂直大模型“携程问道”,阅文集团发布的阅文妙笔大模型,网易有道发布的教育领域垂直大模型“子曰”等。

京东言犀大模型沉淀了京东在零售、物流、健康金融等行业多年积累的知识,融合70%通用数据与30%京东数智供应链原生数据进行训练,带来了商品推荐、金融政策、理财规则、物流体验等领域的能力。京东云事业部总裁曹鹏认为,单一的大模型技术本身无法直接产生价值,技术只有放到场景里,才能产生实际价值

携程旅游大模型问道筛选了200亿非结构性旅游数据,结合携程现有的结构性实时数据,以及携程历史训练的机器人和搜索算法,进行了自研垂直模型的训练,同时投入了巨大人力对旅行通用回复内容进行生成和校验。携程创始人、董事局主席梁建章表示,携程会不遗余力地为大模型投入,投资数额不设限

在应用方面,百度近日与联想在AIGC领域达成合作,联想私人定制业务全面引入百度文心一格,消费者可通过官网 AIGC 主题绘画活动定制笔记本电脑外观。华为云盘古大模型与美图视觉大模型MiracleVision合作推出的AI模特试衣功能,可以有效提升服装类产品的电商上架效率。

垂直大模型虽然不如通用大模型那样对参数和算力有太高的要求,但对场景和数据有着更高的要求,需要开发者具备专业的知识、丰富的行业应用实践积累,对错误的容忍程度也更低,需要AI具备超强的稳定性和可靠性。所以越到垂直行业,垂直模型的优势也就更大。

“通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。企业如果基于行业大模型,再加上自身数据进行精调,可以建构专属模型,打造出高可用性的智能服务,而且模型参数比通用大模型少,训练和推理的成本更低,模型优化也更容易。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示。

从这个角度来说,“小模型”或许更性感,更能解决具体的问题。

商汤推出了千亿参数的大模型,也在推出针对不同垂直领域的百亿参数小模型。大模型的长处在于能够找到新的解法,帮助解决新问题,一旦解决以后可以在狭窄领域产生大量数据,重新训练小模型。有的小模型甚至可以跑在终端上,成本更低。但如果没有大模型,小模型也不会存在。

02 大厂赢家通吃,创业公司的机会在哪?

行业里有一种观点认为,中国版的ChatGPT只会在5家公司产生:百度、阿里、腾讯、字节、华为

互联网时代,是典型的“721”,第一名吃香喝辣,第二名勉强生存,第三名往后朝不保夕。

眼下,百模混战,谁都想在大模型里分一杯羹。但有一个很现实的问题是,大厂做大模型,有着创业公司无法比拟的优势。小而美的创业公司,想靠三五个人就干翻大厂,大概率只是一种幻觉。

大模型离不开云平台。大模型落地需要不断进行微调、训练、都需要在云平台上运行。百度、阿里、腾讯、字节、华为都有自己的云业务,百度和华为还完成了从还完成了从芯片到应用的布局,百度是“昆仑芯+飞桨平台+文心大模型”,华为是“昇腾芯片+MindSpore框架+盘古大模型”,这都是创业公司难以企及的优势。

此外,在资金储备、人才资源、使用场景、数据积累方面,大公司都有着天然的优势。创业公司没有落地场景,技术就没法迭代,无法持续优化,无法形成数据网络效应。

那么小公司就一点机会都没有了吗?

不妨重提那个淘金时代的喻言:“这个时代跟淘金时代很像,如果你那个时候去加州淘金,一大堆人会死掉。但是卖勺子、卖铲子的人永远可以赚钱。”这也是奇绩创坛创始人兼CEO陆奇在近期对创业者的分享。陆奇希望帮助中国创业者认清这次历史性的拐点时刻,定位今天的时代坐标、找准自己的位置。

7月初,加州大学伯克利分校计算机科学教授、《人工智能——现代方法》作者斯图尔特·罗素(Stuart Russell)发出警告称,ChatGPT等人工智能驱动的机器人可能很快就会“耗尽宇宙中的文本”,通过收集大量文本来训练机器人的技术“开始遇到困难”。

上周,8500多名作家签署了一封信,要求OpenAI、微软、Meta和Alphabet等公司领导者不要在未经许可或未支付报酬的情况下使用这些作家的作品来训练人工智能系统,并要求这些人工智能公司赔偿其版权损失。

存量的互联网数据即将被耗尽,优质数据正变得越来越稀缺。一个模型的好坏,20%由算法决定,80%由数据质量决定。在数据、算力、算法“三驾马车”里,数据是最核心、最长远、最基础性的要素。大模型需要用海量数据进行喂养,才能持续优化、迭代。

接下来,真正的价值将会变成可持续性的高质量数据。如何持续获取合法合规、合商业逻辑的数据源,将成为大模型性能提升的关键因素。因此,数据运营商或将成为制约大模型发展的重要角色。

比较理想的状态是,模型不断为用户提供服务,用户不断为模型生成新的数据。至于下一步,则会拼私有数据。更个性化的服务,意味着需要更私有化的数据,而人类不太可能将私人化数据毫无保留地展示给大模型。

任何时代,“卖水人”永远是一门好生意。颇具意味的是,无论是开创者、探索者还是掘金者,都离不开水。当然也可以卖勺子、卖铲子。

03 结语

前几个月,社交平台上有一则帖子流传甚广:

把AI想象成一个小孩。欧美的AI属于精英教育路线,出生后家里就一路砸钱供他读书到博士,等到毕业后,一出场就王炸,惊艳全场。

中国的AI属于功利教育路线,出生就接受生存养育,养到15岁,就开始逼着他想办法给家里挣钱,学的都是如何市场化的技巧。

寥寥数语,细细品来,滋味万千。

虽然不一定对,但这或许也在某种程度上解释了OpenAI、ChatGPT为什么没有出现在中国。事实上,国内的一些投资人和创业者,在刚开始也是信心满满,要做中国版的OpenAI。在折腾了几个月后,发现还是要寻找盈利模式,探索业务应用场景和商业化的能力。

值得一提的是,近来部分C端用户感知到ChatGPT-4在某些任务上性能表现太差,这被认为是OpenAI使用混合专家模型(MOE)进行降本增效,将重心转向企业级服务的动作之一

放眼望去,苹果也在研发自己的大语言模型Apple GPT,高通则已经在研究如何在今年底实现,让100亿-150亿参数级别的模型在手机上离线运行,无需云端处理运算。

大模型是生产力的重塑,是范式转换。200年前,人类用蒸汽机第一次把热能变成动能,工业化时代开启。今天,人类用大模型把电能转换成脑力和通用智力,一个新的时代正在开启。

轮子固然不需要太多,但我们仍然需要好用的轮子。

任重道远。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(2)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(18)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(1)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(1)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(1)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(2)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(2)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(4)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(5)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
第一批用 Kimi 做内容的网红已经杀疯了
作者:王东东 文章来自:斗战圣佛小组技术信仰派 VS 市场信仰派 朱啸虎和月之暗面老板杨植麟在前几天有一场不算 battle 的 battle。battle 的争论点是:大模型有没有戏。技术派...【详细内容】
2024-04-04    斗战圣佛小组  Tags:Kimi   点击:(4)  评论:(0)  加入收藏
昆仑万维发布面向人工智能时代的六条人才宣言
过去的一年多,是人工智能取得非凡进步的一年。在这充满突破性技术飞跃和备受争议的一年里,我们见证了人工智能的快速发展和广泛的影响,人工智能已经迅速地融入了我们的生活,深刻...【详细内容】
2024-04-03    砍柴网  Tags:昆仑万维   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条