您当前的位置:首页 > 新闻资讯 > 财经

大模型激战半年,腾讯字节姗姗来迟

时间:2023-08-15 10:25:25  来源:时代财经_od  作者:
图片来源:Pixabay

作者 | 谢斯临

编辑 | 史成超

国产通用大模型的混战远未结束。在半年左右的蛰伏期过后,大部分玩家都浮出了水面。

在这之中,有人加速迭代。8月8日,由搜狗搜索创始人王小川创立的百川智能发布了旗下第三款大模型产品 BAIchuan-53B,背后训练参数高达530亿。此时距离王小川宣布进军大模型战场不过4个月的时间,这家创业公司进展神速。

这还只是一个开始,百川智能方面向时代财经透露,后续还会有多款产品发布,包括规模更大、参数超千亿的大模型。

也有人黯淡退场。由美团联合创始人王慧文创立,吸引源码资本、五源资本等知名VC机构,以及美团创始人王兴、快手创始人宿华等互联网大佬投资的光年之外,曾一度被市场认为是国内大模型战场上最强有力的玩家之一。

然而,随着6月下旬王慧文因健康问题离岗退出,无法继续执掌光年之外,这家备受期待的大模型创业公司只能卖身美团,一众投资人也随之退股。

还有人另辟蹊径。AI大牛周明创立的澜舟科技,强调轻量化模型,希望用更低的成本解决B端场景问题。而曾帮助谷歌将BERT模型的训练时间从3天降到76分钟的新加坡国立大学校长青年教授尤洋,则成立了潞晨科技,试图用低成本训练大模型的解决方案突围。

相比之下,大厂自研的大模型则姗姗来迟。直到8月初,腾讯自研的混元大模型和字节打造的AI对话类产品Grace才先后传出内测消息,具体面世时间仍未可知。

同样停留在测试阶段的,还有李开复创立的AI 2.0企业“零一万物”。在7月3日举办的对外交流会上,李开复透露,该公司在三个月内已实现百亿参数规模的模型内测,目前正向300亿—700亿参数规模扩大。不过,该产品至今仍未向市场开放。

这些仍未发布的大模型产品将为科技行业带来什么样的改变,值得市场期待。从这个角度来看,这场混战或许还要持续很久。

进击的王小川

由王小川创立的百川智能,正以其惊人的产品发布速度吸引市场的关注。

在其4月宣布下场做大模型后,仅用了两个月零五天的时间,就在6月15日发布70亿参数开源大模型Baichuan-7B。不到一个月时间,又发布了130亿参数开源大模型Baichuan-13B。

8月8日发布的Baichuan-53B,已经是这家大模型创业公司半年内发布的第三款产品,百川智能进展神速。

百川智能相关负责人回复时代财经表示,公司在创立之前就已经花了很多时间做前期准备,开始就把路线和方法想得比较清楚。

其指出,做大模型都会考虑三个层面:数据、算法和算力。抛开算力不说,做搜索的公司天然有优秀的数据能力,百川智能的核心团队此前已经做了20年的数据抓取、抽取、清洗、去重、反垃圾等操作,可以更快拿到高质量数据集。

而算法是以自然语言处理为中心,将算法工程进行迭代,不是单一的工程问题,而是在文本数据驱动下,算法和工程共同运行。此前在搜索领域积累的经验在这里也能很好地发挥作用,利用数据评价推动模型进步。

“有了之前多年的技术和经验积累,百川智能做大模型产品的速度才会又快又好。”

不过,在发布会上,王小川亦指出,当下国产通用大模型仍处在一个分型复刻的阶段。各家厂商基本都在对标OpenAI,不可避免地会出现同质化的问题。

正因如此,在他看来,与美国闭源大模型的头部格局已定的情况不同,“中国谁的大模型最好”现在并没有结论。在这场混战之中,钱是重要的,但最终决定的力量还是人和团队、组织能力。大厂钱多、人多、算力多,但组织效率通常不一定够好,创业公司的组织效率可能好,也可能不好。

“大家都在争取机会,而且不一定落在大厂里。”

王小川还在采访中谈及退场的王慧文。其指出,王慧文是国内几个主流做大模型里唯一一个没有强势技术背景的,对他的挑战比其他家要大。工作中要做大量的技术决策,招什么人、走什么技术路线图、需要多少计算资源,一定会面临非常多的决策压力。

“不是做大模型压力大,是没有技术背景做决策压力会大很多。但是技术足够的话,其实挺愉悦的。”

图片来源:Pixabay

腾讯、字节姗姗来迟

大模型混战开启之初,互联网大厂因为坐拥更多算力、人才、资金和数据,被认为是强大的竞争对手。

百度自研的文心一言早在今年3月底就已率先落地;阿里打造通义千问紧随其后,在4月11日举办的阿里云峰会上揭晓。就在阿里发布通义千问的前一天,王小川才刚刚宣布下场,成立百川智能。

相比之下,同为一线大厂的腾讯跟字节,推出通用大模型的步调要慢许多。

8月3日,据36Kr报道,腾讯自研的 “腾讯混元大模型”已经进入应用内测阶段。三天后,8月6日,字节旗下的AI对话类产品Grace也被爆出历经两个月的研发后,终于进入测试阶段。

此时距离百度发布文心一言已经过去4个月。对于腾讯通用大模型产品步调稍慢的原因,马化腾曾公开表示,“腾讯也一样在埋头研发,但是并不急于早早做完,把半成品拿出来展示。”

不过,“并不着急”的腾讯,还是在今年6月中旬率先公布了“行业大模型”的路线,一口气抛出10大行业超过50个解决方案。无独有偶,字节跳动也同样在6月发布大模型服务平台“火山方舟”,通过集成多家AI科技公司及科研院所的大模型,向企业提供全方位的平台服务。

市场曾一度认为,行业大模型将成为这两家大厂突围的方法。

但事实或许并非如此。当下被鼓吹的行业大模型始终存在着被替代的风险。科大讯飞总裁吴晓如曾向时代财经指出,10年前,在语音识别技术上,也曾诞生过诸多聚焦在通话、行车、办公等不同场景的专用模型,但随着通用模型技术的成熟,专用模型也随之退场。

“我认为大模型也会经历一样的阶段。”

相比之下,从更长远角度看,通用大模型才真正代表着一个平台级或颠覆性的大机会。正是因此,腾讯和字节都不可能放任自己错过,哪怕进度缓慢,但它们必定要坚持在场。

有腾讯内部人士向时代财经指出,腾讯的计划一直是两条腿走路,通用和行业齐头并进。只是与一些激进的厂商相比,旗下产品涵盖社交、游戏、广告、内容创作等多个领域的腾讯,要更为谨慎一些。

图片来源:Pixabay

学院派创业者另辟蹊径

在大模型战场上,来自高校、研究机构的学院派创业公司组成了竞争的第三极。

它们既不是王小川、王慧文这样的种子选手,在创业之初就能凭借人脉吸引到数亿美元的投资,并以此迅速起步。也不像腾讯、阿里、百度这样的大厂,在算力、人才、资金等各个方面都占据难以逾越的优势。

但凭借着他们对于人工智能技术的深度理解,这些创业者仍然能在夹击之下,另辟蹊径找到新的发展方向。

比如由原微软亚洲研究院副院长周明创立的澜舟科技,不同于市面上一众追逐千亿乃至万亿参数的大模型产品,这位从1980年就开始研究NLP(自然语言处理)的华人AI大牛希望以更轻量级模型解决B端场景的问题。

其推出的孟子大模型曾以十亿参数,刷新此前被百亿、千亿级别参数模型轮番霸榜的中文语言理解权威评测基准 CLUE 榜单。

这是一项务实的决策。出于数据安全考虑,绝大部分企业都不会将数据上传,而是会要求本地化部署,成本因此被显著拉高。在接受媒体采访时,周明指出,哪怕只是本地部署推理,拿训练好的大模型来用,千亿参数大模型也需要8到16块 A100,换算下来至少是一两百万元的投入,“对很多场景来说,客户需要便宜和够用”。

由新加坡国立大学校长青年教授尤洋创立的潞晨科技,则希望利用算法技术降低大模型的调用成本。

现如今,无论是大厂,还是创业公司,都必须面对国产大模型同质化趋势愈发明显的问题。如果这一问题不被解决,未来大模型极有可能陷入当下云服务厂商面临的低毛利困境。

尤洋对时代财经表示,这是因为底层技术基座迭代成本过于高昂。他以GPT举例,OpenAI每一次的训练成本高达6000万美元,每隔三四个月就需要训练一次,迭代一次则需要四五次训练。以此计算,每迭代一次技术基座可能需要2亿到3亿美元。

过于高昂的成本导致市场上的技术基座极其稀缺。基本上只有GPT、LLAMA,还有国内的GLM。各家厂商基本都是在模仿这几家大模型做产品,才导致了同质化的问题愈发凸显。

长期研究高性能计算的尤洋因此成立了潞晨科技。该公司目前推出的开源系统Colossal-AI 可通过高效多维并行、异构内存等技术,显著降低AI大模型训练、微调和推理的开发与应用成本。

尤洋认为,只有伴随大模型训练成本快速下降,或者采取更好的优化技术,使得参数控制在200亿左右,还依然能够达到和千亿参数一样的效果时,才会真正迎来大模型百花齐放的那一天。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(2)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(18)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
探访“中国黄金第一家”:疯狂的黄金,谁是最后接盘侠?
文 | 新浪财经 刘丽丽大妈们在买黄金,央行也在买黄金。黄金金价自2月底以来一路飙升,国际金价再次创下历史新高,不少品牌金店的饰品金价也水涨船高,甚至超过了700元/克的大关。...【详细内容】
2024-04-09    新浪财经  Tags:黄金   点击:(2)  评论:(0)  加入收藏
看1280份年报:大消费复苏春意盎然 科技创新助推产业升级
新华财经上海4月9日电(记者 高志刚) 随着2023年年报披露渐入高峰,A股公司的业绩已“显山露水”,也透露出行业冷暖。据记者统计,截至4月8日19时,A股共有1280家上市公司披露2023年年...【详细内容】
2024-04-09    上海证券报  Tags:年报   点击:(2)  评论:(0)  加入收藏
热门黄金ETF瞬间跌停!黄金行情开始"冷静"了?
今日(4月8日),A股收跌,两市股指盘中震荡下探,受益于近期金价高涨,贵金属板块持续火爆,盘中逆市上涨。从盘面上看,贵金属板块逆市活跃,晓程科技收涨18.13%、中润资源(维权)盘中涨停,金贵...【详细内容】
2024-04-09    券商中国  Tags:黄金ETF   点击:(2)  评论:(0)  加入收藏
滴滴扭亏为盈 高德以轻量聚合模式迅速长大
网约车的故事进入下半场。下架18个月重新归来的滴滴,虽然2023财年经调整EBITA仍亏损22亿元,但首次录得年度净利润转正。行业老大的扭亏为盈,似乎指向了一个拐点。而在滴滴暂离...【详细内容】
2024-04-08    21世纪经济报道  Tags:滴滴   点击:(4)  评论:(0)  加入收藏
3月末外汇储备规模32457亿美元 黄金储备17个月连增
本报记者 刘 琪4月7日,国家外汇管理局公布2024年3月末外汇储备规模数据。数据显示,截至2024年3月末,我国外汇储备规模为32457亿美元,较2月末上升198亿美元,升幅为0.62%。对于外汇...【详细内容】
2024-04-08    证券日报  Tags:外汇储备   点击:(3)  评论:(0)  加入收藏
社保基金去年四季度重仓股揭秘:12股社保基金持股比例超5%
证券时报网讯,证券时报•数据宝统计显示,社保基金最新出现在203只个股前十大流通股东名单中,合计持股量47.99亿股,期末持股市值合计720.87亿元。持股变动显示,不变64只,减持39...【详细内容】
2024-04-08    证券时报网  Tags:社保基金   点击:(3)  评论:(0)  加入收藏
管你降不降息 黄金狂飙站上2300美元背后:已视美联储为无物?
财联社4月7日讯(编辑 潇湘)本周五的金融市场走势,再度给所有贵金属交易员“上了一课”:在本轮极为特殊的黄金牛市里,再按照传统的宏观央行政策逻辑进行交易,可能会倒上大霉。国际...【详细内容】
2024-04-08    财联社  Tags:黄金   点击:(3)  评论:(0)  加入收藏
假期A股值得关注的资讯
  这个假期,国内外值得关注的资讯很多。  例如美国3月非农大增30.3万,6月降息悬了;耶伦访华,强调无意对华“脱钩”等。  节前最后一个交易日,盘面发酵了几个新题材。  生...【详细内容】
2024-04-07    财闻私享  Tags:A股   点击:(9)  评论:(0)  加入收藏
黄金价格暴涨!历史新高!最新研判来了
今年3月以来,黄金价格迭创新高。截至最新收盘,国际金价伦敦金现涨至2330美元/盎司附近,国内金价上海黄金交易所AU9999也报收537.50元/克。在此背景下,投资者对黄金的关注度持续...【详细内容】
2024-04-07    中国基金报  Tags:黄金   点击:(8)  评论:(0)  加入收藏
超九成券商投行业务营收下滑!下一步怎么走?
尽管股权融资收紧始于去年8月底,但2023年年报显示,已有多家券商投行业务出现亏损。由于过去一年投资银行业务的外部市场环境及监管政策出现较大调整,证券公司2023年投行业务“...【详细内容】
2024-04-07    券商中国  Tags:券商   点击:(7)  评论:(0)  加入收藏
站内最新
站内热门
站内头条