您当前的位置:首页 > 电脑百科 > 人工智能

鱼龙混杂大模型:谁在蹭热点?谁有真实力?

时间:2023-05-09 11:25:10  来源:新浪网  作者:价值研究所

来源 :价值研究所

进入5月,国产大模型的风口非但没有熄火,反倒越烧越旺。过去一个星期,就有多家企业发布AI大模型相关产品:

5月5日,网易有道发布了基于“子曰”大模型开发的AI口语老师剧透视频,介绍其基于教育场景的类ChatGPT产品布局;5月6日,科大讯飞发布认知大模型“讯飞星火”,董事长刘庆峰表示有信心超越ChatGPT;同日,淘云科技发布“国内首个”儿童认知大模型“阿尔法蛋”……

在上述公司之外,还有很多企业宣布进军大模型,类ChatGPT产品正在密锣紧鼓研发中,预计不久便会正式上线。企业的热情毋庸置疑,AI大模型似乎已经不是一条选择题,而是必做题。

然而,狂热背后不乏担忧。大模型技术应用范围虽广,目前落地的场景毕竟有限。而这群入局大模型的企业,分别来自游戏、教育、动漫等诸多行业,和大模型的应用场景离得很远。

当国产大模型变得泛滥,我们该如何分辨优劣?

没技术不要紧

有公司靠“外援”捣鼓大模型

要评判一个大模型的优劣,首先看技术,其中最核心的是算法和算力,即训练参数量。因为参数量越大,系统的知识面就会越广,表现也会越稳定。资料显示,OpenAI在2020年推出的ChatGPT-3参数量已经达到1750亿,谷歌在一年后发布的PaLM则达到5400亿,更不用说最新的ChatGPT-4了。

参照此技术标准,我们可以精准识别一批蹭热点的企业:它们要么确实拿出了产品,但参数量和ChatGPT等有较大差距,功能也较单一;更有甚者,套用别家公司的硬件、数据库来预训练参数,本身缺乏核心技术。

当中的代表,有昆仑万维。

4月10日,昆仑万维宣布联合奇点智源研发“天工3.5”国产大语言模型。根据发布会上的介绍,“天工3.5”定位为“中国第一个真正实现智能涌现”的大模型产品,具备智能问答、聊天互动、文本生成等多种应用功能以及丰富的科学、技术、文化、艺术和历史知识储备。

根据官方资料,昆仑万维最早在2020年布局AIGC业务,投入数亿元组建研发团队。去年12月,“昆仑天工”首次亮相,初代产品提供图像、音乐、文本及代码AI生成功能。作为对比,大模型领头羊 openAI在2019年发布ChatGPT-1,每一代产品的研发周期都在一年左右。

乍一看,昆仑万维的“天工3.5”功能全面对标ChatGPT,比起百度“文心一言”、阿里“通义千问”等国产大模型毫不逊色。在研发速度上,昆仑万维也领先于大多数国内同行。不过昆仑万维的缺点也很突出——“天工3.5”是和阿里云合作的产物,后者的参数、硬件设备帮了昆仑万维很大忙。

事实上,昆仑万维一直抱紧阿里云的大腿。资料显示,过去几年昆仑万维的海外数据基本都在使用阿里云公有云储存服务,2020年布局AIGC时也是在阿里云的协助下建立算力集群。在“天工3.5”发布后,还有媒体爆出昆仑万维缺乏文本生成、数据处理专利的消息,和百度、阿里形成鲜明对比。

同样遭遇技术质疑的,还有“AI四小龙”之一的商汤科技。

商汤科技在4月10日发布了自研大模型系统“日日新SenseNova”,内含AI数字人视频生成平台“如影”,3D内容生成平台“琼宇”和“格物”,类ChatGPT产品“SenseChat”等产品。别人都是发布单个产品,商汤科技一次过拿出一套“全家桶”,可见其野心之大。

然而,商汤的大模型全家桶在发布那天就有翻车迹象。演示视频公布后,就有媒体和网友发现商汤“妙画”生成的图片和AI网站Civitai的图片撞车,甚至还有来自Civitai的文字注释。SenseChat则在一些基础问题上表达含糊不清,其训练参数量也遭到质疑。

在价值研究所(ID:jiazhiyanjiusuo)看来,缺乏数据源,是昆仑万维和商汤科技共同的命门。

“文心一言”背后有百度的海量搜索数据和语料库,阿里的“通义千问”则有来自电商、云计算等领域的语料库,流量大、用户覆盖面广,能提供足够的参数。缺乏面向C端用户的通用产品、没有参数积累,强行上马大模型,昆仑万维和商汤科技的尴尬处境完全可以预料。

没应用场景又如何?

这些企业硬要和AI攀关系

除了缺乏核心技术、产品缺陷明显的昆仑万维等企业,另一类企业的行为更让人迷惑:在缺乏应用场景的情况下,硬要给自身产品贴上大模型标签、 “硬蹭”热点。

这一类企业,以专注C端服务的互联网公司为主,尤其是近年来处境不佳的教育、科技金融、游戏公司。

比如专注于智能教育硬件研发的淘云科技,在5月6日发布了首个儿童认知大模型“阿尔法儿童认知大模型”和GPT机器人,并宣布把平台的儿童原始语料加入科大讯飞的“讯飞星火”大模型中。同样来自教育领域的学而思,也在近日宣布研发数学大模型MathGPT,目前已取得阶段性成果,预计年内推出。

这类企业最大的问题在于,大模型的应用场景、目标用户和它们的业务有巨大差异。强推大模型,根本无法为它们的用户带来多少帮助。

根据淘云科技董事长刘庆升的说法,“阿尔法儿童认知大模型”基于儿童场景提供更贴近幼儿理解力的生成式内容,让儿童用户在轻松的氛围下积累新知识。问题在于,类ChatGPT应用仍无法保证100%准确率,常识性的错误屡见不鲜。对于认知能力有限的儿童来说,并不稳定的大模型反倒可以带来反作用。

当然,上面这些公司蹭热点的目的虽然很明确,但好歹拿出了实打实的产品或规划。还有一些企业,不仅业务场景和大模型相去甚远,甚至还没有拿出实际产品就开始往自己脸上贴金。

比如定位于“国漫IP孵化平台和漫画分享社区”的快看漫画,就在4月27日宣布成立AIGC事业部。创始人兼CEO陈安妮更是在内部信中表示,AI将会给内容产业带来“颠覆式”生态变革。

再比如最近一边捣鼓直播电商、一边忙着进军本地生活的小红书,也没忘记筹备大模型团队。根据36氪报道,小红书在今年3月开始组建研发团队,主要成员来自广告NLP技术部门。4月,小红书悄悄上线了一款名为“Trik”的AI创作应用,主打AI绘画,但没有大规模宣传,至今没有引发多少关注。

总的来说,这两类企业的大模型布局都经不起推敲。但蹭上大模型风口,确实为其带来了可观的流量,也掀起资本市场的狂欢。前面提到昆仑万维,在发布“天工3.5”次日股价暴涨16%。或许正因为市场过于狂热,才会反过来迫使这些企业主动迎合热点。

可惜这种热度是无法持续的,而且还会遭到监管机构的重点关照。在“天工3.5”发布次日,昆仑万维就收到了深交所的关注函,要求前者结合项目研发进度、行业政策风险、对公司财务的影响等情况,说明该业务可能面临的风险。

虽然深交所没有把话挑明,但明眼人都看得出这封关注函写满对昆仑万维蹭热点的怀疑。在价值研究所(ID:jiazhiyanjiusuo)看来,蹭热点的行为正在损坏行业生态。给大模型降降火、让市场回归理性,对踏实搞研发的企业来说非常重要。

追赶ChatGPT

一场艰苦的马拉松竞赛

不可否认,除了上面这些蹭热点的公司外,国内有不少企业在认真打磨大模型产品,也有一定的技术积累和丰富的应用场景。不过从百度、阿里,再到360,几乎所有头部企业都承认自己的技术不如openAI的ChatGPT。

5月7日,周鸿祎应邀来到东方甄选直播间,和俞敏洪、董宇辉大谈国内的大模型创业热潮。周鸿祎直言,openAI比国内企业领先至少两年,国产大模型有机会在一年内追上ChatGPT-3.5,但openAI已经开始训练ChatGPT-5了。

“上来就说能超越ChatGPT,那叫吹牛。”

周鸿祎最后这番话,不少媒体认为是在影射5月6日发布“讯飞星火”认知大模型的科大讯飞。科大讯飞董事长刘庆峰在发布会上表示,“讯飞星火”在文本生成、知识问答、数学能力上已经超过ChatGPT,目标是到今年10月,通用认知能力对标ChatGPT,并在中文上超越ChatGPT。

周鸿祎是否意有所指不得而知,可以肯定的是,投资者、用户对国产大模型的耐心正在流失,要求变得更加苛刻,外部的竞争也更加激烈——留给国产大模型的时间已经不多了。

5月4日,微软宣布Bing预览版全面开放,该系统此前已接入openAI的ChatGPT-4;一天后,谷歌也宣布向所有拥有wordspace账号的用户开放Bard AI工具访问权限。

微软和谷歌先后走向开放,意味着新一轮用户争夺战正式打响。一旦它们渗透进国内市场,面对技术上的差距,国产大模型并没有太多应对方法。比起那群蹭热点的企业,追赶openAI的骨干力量更值得我们关注——特别是百度、阿里、腾讯三巨头,周鸿祎治下的360,疑似被其揶揄的科大讯飞实力也不容小觑。

这几家公司的优势是相似的:雄厚的资金储备;拥有诸多面向用户的产品/服务,语料库十分丰富;主营业务贴近大模型应用场景,如百度和360的搜索,腾讯的社交媒体,阿里的云计算和电商,科大讯飞的智慧办公等。现阶段,这些企业的产品距离ChatGPT当然还有一定差距,但并非没有追赶的机会。

要知道,即便是技术领跑全行的openAI,也有自己的苦恼。过去一年,随着ChatGPT走红openAI的估值也是一路走高,成为全球范围内升值最快的独角兽——可惜随之飙升的,还有亏损额。

据外媒报道,openAI上一财年净亏损达到5.4亿美元,同比几乎放大一倍。每一次预训练参数都要耗费巨资,要提升系统稳定性又必须不断加大参数量和预训练频次,亏损自然成为无解难题。国盛证券的研报指出,通过测算,2800亿参数量的大模型预训练成本约为200万美元/次,谷歌的PaLM号称拥有5400亿参数,单次预训练成本将高达1200万美元。

今年2月推出的付费版ChatGPT和其他商业化尝试收效甚微,短时间内不可能覆盖预训练所需成本。CEO Sam Altman曾暗示,公司未来几年可能需要筹集约1000亿美元的资金,才能进一步提升技术,打磨下一代产品。

openAI的经历表明,AI大模型研发如同一场漫长且艰难的马拉松——不要总是奢望弯道超车,踏踏实实和参数打交道是成功的基础。

写在最后

水能载舟亦能覆舟,狂热的市场氛围既给企业带来了资金和关注度,也带来了难以预估的风险。近段时间,证监会等监管机构已经加大管控力度,不少公司也主动出面自证清白:据不完全统计,4月底至今已有世纪天鸿、万兴科技、中科信息、唐德影视等多家上市企业发布股票交易异常波动公告,澄清自身业务和AI、大模型的关系。

经过移动互联时代的洗礼,蹭热点、追风口的情况太过常见了。似乎任何一个风口都逃不过从萌芽到爆发,再走向混乱、重塑秩序的过程。但在乱战过后,有的风口出清泡沫、置之死地而后生;有的赛道却彻底沉沦,如一颗流星般结束自己绚烂却短暂的一生。

走在时代前沿的AI大模型,似乎更有可能成为前者,不过需要所有从业者、监管机构的共同努力才能保证健康发展。大模型是一条技术门槛、资金门槛都很高的赛道,蹭热点的企业注定无法长久。加强监管、净化行业环境、驱逐不良玩家可能会带来短期混乱,但对行业的长期发展肯定是有益的。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
华为笔记本将接入盘古大模型!全新华为MateBook X Pro即将发布
快科技4月10日消息,华为官方宣布,华为将于4月11日举办新品发布会。据了解,此次发布会将推出全新的华为MateBook X Pro,而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】
2024-04-10  Search: 大模型  点击:(4)  评论:(0)  加入收藏
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(6)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(19)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
▌简易百科推荐
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10    钛媒体APP  Tags:行业大模型   点击:(3)  评论:(0)  加入收藏
互联网充斥“针对小白的AI课”,能相信吗?普通人不学AI课程会被淘汰?
早前,一位标榜清华大学博士和多家公司AI顾问名头的百万级粉丝量博主,向用户大力推介“所有人都需要学”的AI入门课程。不过,这些课程最终因贩卖焦虑、蒙骗学员而被平台下架。然...【详细内容】
2024-04-10    九派新闻  Tags:AI课   点击:(7)  评论:(0)  加入收藏
藏在AI背后的“吃电狂魔”
人工智能时代的能耗黑洞据估算,到2027年,人工智能行业每年将消耗85~134太瓦时的电力,相当于瑞典或荷兰一年的总用电量。马斯克判断,电力缺口最早可能会在2025年发生,“明年你会看...【详细内容】
2024-04-09    雪豹财经社  Tags:AI   点击:(3)  评论:(0)  加入收藏
OpenAI和谷歌再起纷争:AI的尽头是内容
日前,纽约时报的一篇报道称,人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频,也...【详细内容】
2024-04-09  小编也疯狂  新浪网  Tags:AI   点击:(3)  评论:(0)  加入收藏
AI产业的灰色暗面:OpenAI、谷歌、META如何搞训练语料
财联社4月7日讯(编辑 史正丞)种种迹象显示,目前站在全世界AI领域潮头浪尖的这些公司,早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】
2024-04-09    财联社  Tags:AI产业   点击:(4)  评论:(0)  加入收藏
和“数字人”交朋友,当心隐私被出卖......
在虚拟社交中如何在保护用户隐私和数据安全的同时提供高质量的社交体验?如何避免过度依赖虚拟社交找到虚拟与真实之间的平衡点?《中国消费者报》记者就此展开了调查APP里有个...【详细内容】
2024-04-09    中国消费者报  Tags:数字人   点击:(6)  评论:(0)  加入收藏
AI“复活”成产业链:成本可降至数百元
大模型应用落地,带火数字人(11.560, 0.29, 2.57%)赛道。文|《中国企业家》记者李艳艳 实习生 孙欣编辑|姚赟头图来源|《流浪地球2》电影画面截图清明节前,预估会有需求的庞立...【详细内容】
2024-04-09    中国企业家  Tags:AI“复活”   点击:(3)  评论:(0)  加入收藏
多方热议人工智能产业新机遇
编者按  从前沿科技展会到高层对话平台,从上海、重庆到博鳌,从线上到线下……一场场高规格、大规模的盛会中,人工智能正在成为各界热议的高频词。赋能千...【详细内容】
2024-04-08    中国家电网  Tags:人工智能   点击:(5)  评论:(0)  加入收藏
​人形机器人时代来了吗
日前,由中国人形机器人(11.080, -0.05, -0.45%)百人会主办的人形机器人大赛在北京经济技术开发区开赛。工作人员向参观者展示一款人形机器人。参观者与一款陪护型人形机器人...【详细内容】
2024-04-08    中国青年报  Tags:​人形机器人   点击:(6)  评论:(0)  加入收藏
AI重塑社交:腾讯与字节跳动的新赛场
文|新火种 一号编辑|美美最近,腾讯和字节跳动这两大互联网巨头几乎同步推出了各自的AI社交产品,尽管腾讯和字节跳动在前段时间刚刚“破冰”,但这一举措不仅意味着这两大巨头之...【详细内容】
2024-04-07    蓝鲸财经  Tags:AI   点击:(8)  评论:(0)  加入收藏
站内最新
站内热门
站内头条