您当前的位置:首页 > 新闻资讯 > 科技

张勇亲自挂帅,阿里加入大模型中国战事

时间:2023-04-12 10:16:49  来源:中国企业家  作者:

是大厂的游戏,但不能只是大厂的游戏

文|《中国企业家》记者 赵东山 邓双琳

编辑|李薇

头图摄影|邓攀

一场AI大模型追逐赛,激战正酣。

4月11日,阿里云旗下大模型产品通义千问面世。阿里云峰会上,阿里巴巴集团董事会主席兼CEO张勇首次以阿里云智能CEO的身份亮相,介绍了通义千问的最新进展。

一向以正装公开示人的张勇,穿了一身休闲装,呼应其新身份——去年年底,他宣布亲自挂帅阿里云,“躬身”业务四个多月后,张勇带来了首个待检验的作品通义千问。他表示,阿里巴巴所有产品未来都将接入通义千问大模型,进行全面改造。

ChatGPT的问世和迭代速度,重新定义了技术变化的日新月异。在阿里之前,百度已率先“交卷”,推出基于新一代大语言模型研发的生成式AI产品文心一言,并展示了其在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

更多不甘落后的互联网大厂和创业者正在路上。

3月底,腾讯总裁刘炽平在财报电话会上说,腾讯正在加速推进大模型混元;3月29日,360集团创始人周鸿祎在一次活动上预演示了360尚未正式发布的大模型应用产品,他称:“GPT是场新工业革命,其意义超越了互联网、iphone的发明。”

《中国企业家》从接近字节跳动人士获悉,字节跳动版的ChatGPT已在内测,但内测之后,体验效果不好,预计在9月上线,也有可能提前。不久前,原阿里达摩院大模型M6带头人杨红霞加入字节AI lab,参与语言生成大模型的研发,直接向副总裁杨震原汇报。

随着时间的推进,行业的紧迫感越来越强,节奏越来越密集,仅在4月10日这一天,就有3家公司宣布推出大模型及应用产品:搜狗创始人王小川正式官宣入场大模型创业,年底发布大模型产品,已获得5000万美元启动资金;商汤宣布推出商汤日日新大模型;昆仑万维(45.700, -0.06, -0.13%)和奇点智源合作自研的国产大语言模型将于4月17日启动邀请测试。

这场AI大模型之争,让沉寂了很久的中国互联网市场突然变得亢奋,即使在当年“百团大战”、生鲜电商缠斗最激烈的时刻,头部大厂也没有拿出“All in”押注未来的架势。对标ChatGPT的大模型,显然被大厂当作开启下个时代的钥匙——谁能最先触摸到AI生态的潜能边界,谁就能掌握话语权。

然而,训练大模型并非易事,大厂和创业者们互相竞逐背后是一场财力、技术、算力、人才等资源的综合较量。但在大厂内部看来,此轮关于大模型的创业,如果只是一个大厂的游戏,说明中国的创新还是没有走出原来的怪圈,AI大模型创业应该是一个万众创新的游戏。

技术、算力、人才的角逐

从发布信息来看,阿里对通义千问的定位,已经不局限于简单的AIGC概念上,而是如何让AI的能力真正应用在更实际、更多样的场景上。

阿里的大模型分内外部两个路线——一方面将与集团内部产品结合,可以预见,通义千问将对天猫、淘宝、高德、钉钉等业务应用带来直接的商业价值,据了解,钉钉、天猫精灵将率先接入测试,将在评估认证后正式发布新功能;另一方面,阿里云表示将开放通义千问的能力,帮助每家企业基于通义千问打造具备自己行业能力的专属大模型。

来源:视觉中国(19.120, 1.70, 9.76%)

阿里大模型由阿里云智能CTO周靖人负责,周靖人毕业于中国科学技术大学,获哥伦比亚大学计算机博士学位,曾任微软研发合伙人,2016 年加入阿里,任阿里云首席科学家。他告诉《中国企业家》,阿里选择在此刻公布通义千问,并非完全为了“赶时髦”。

“阿里从2019年开始,就在投入各种各样训练大模型的研发中。但ChatGPT以一个非常好的产品形态出现,教育了全社会,现在的确是一个很好的时间节点。如果我们在去年9月、10月讲预训练大模型,也许大家都不会感兴趣。”周靖人说。

事实上,无论是阿里还是百度,能快速推出自己的大模型及应用,都源于两家在过往的技术积累。

2019年,百度便推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿次用户的搜索请求,这让文心一言能够基于一个庞大的、高效的数据池,快速地学习和改进;阿里则于2021年连续发布语言大模型 Plug(后更名为AliceMind)和多模态大模型M6,去年9月,两个大模型合并为阿里通义大模型。

再看看文心一言由的团队——由百度CTO王海峰出任总指挥,团队核心成员还包括百度集团副总裁吴甜、百度技术委员会主席吴华等人。王海峰先后负责百度搜索、百度地图、百度翻译、百度智能云等业务。他同时是自然语言处理领域世界上最具影响力的国际学术组织ACL50多年历史上首位华人主席。

除了人才外,大模型训练也堪称“暴力美学”,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。

据《中国企业家》了解,文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。

此外,浙商证券(10.490, 0.04, 0.38%)的一份研报指出,支撑ChatGPT算力基础设施至少需要上万颗英伟达GPU A100,与之相对应,AlphaGO只需要8块GPU。

这只是最低门槛。大模型的爆发会导致训练的应用场景越来越多,对训练算力的需求会大幅增长,增长幅度能达到10倍甚至100倍。

大模型带来的产业变革

ChatGPT及相关的大模型应用,除了给个人带来工作是否会被取代的担忧外,也给产业带来很多变革。

在李彦宏看来,当人类进入人工智能时代,IT技术的技术栈发生了根本性变化。过去基本分为三层:芯片层、操作系统层和应用层。而现在可以分为四层:芯片层、框架层、模型层和应用层。百度目前是在这四层进行全栈布局的人工智能公司。

谈及全栈布局,百度智能云云计算产品解决方案和运营部总经理宋飞告诉《中国企业家》:“AI产品对于资源的要求越来越高,只有每一层都有自主可控的东西,才有可能纵深地做持续闭环的优化。”

宋飞举例,如果芯片不是自己的,你在优化到底下硬件的时候,就是个黑盒了,能发挥的空间绝对是有限的,你有什么需求它也不一定听你的。如果用自己的框架,有什么需求就很快可以调整。全栈的布局和专门的优化,是百度在基础架构的核心优势。

AI大模型的盛行,也在衍生众多的商业机会。

在李彦宏看来,对于大部分创业者和企业来说,真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型,这很不现实,也不经济,重复造轮子是没有意义的。而是基于通用大语言模型,抢先开发重要的应用服务,“就像移动互联网时代,最成功的商业产品不见得是Android/ target=_blank class=infotextkey>安卓和IOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。”

阿里持相同的观点。

周靖人表示,阿里将开放通义千问的能力,帮助每家企业基于“通义千问”打造具备自己行业能力的专属大模型。未来每一个企业在阿里云上既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

来源:视觉中国

王海峰认为,大模型时代将产生三大产业机会:

第一类是新型云计算公司。大模型将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。

第二类是进行行业模型精调的公司。这是通用大模型和企业之间的中间层,他们具有行业Know-how,调用通用大模型能力,为行业客户提供解决方案。

第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。目前,基于文本生成、图像生成、音频生成、视频生成、数字人(8.980, 0.06, 0.67%)、3D等场景,已经涌现出很多明星创业公司。

反思、挑战和局限

略显遗憾的是,目前多数中国大公司在做的大模型和基于模型的应用,均是追随OpenAI的脚步,而且随着ChatGPT的惊人迭代速度,差距越拉越大。

李彦宏在接受36氪采访时表示,百度“文心一言”在研发阶段时,百度技术团队曾与ChatGPT进行对比测试,当时差距是40分的水平,一个月能追得上。可过了一个月,技术团队再次测试后,发现差距反而拉大了。

周靖人也坦诚承认,目前通义千问与ChatGPT仍有差距,“GPT还是属于各方面都领先的地位”。但他认为“你追我赶”是科技进步的必然阶段,“今天别人的技术比较领先,我们就需要取长补短。也许下一个阶段,通义千问也能贡献自己的一系列技术创新”。

在此前的采访中,周鸿祎也曾告诉《中国企业家》,其实国内也很早关注到GPT-1,然而当时的关注还是抱着一种实用主义的观点,认为应该找场景,要解决自己业务中遇到的问题。所以,中国的人工智能都用来解决人脸识别、图像滤镜做得更漂亮。

“如果一个人工智能技术和自己的业务不能结合,可能就会认为没太大意义,所以,没有人想到用GPT NLP的模型解决通用知识理解和推理的问题,更没有人想到大算力大数据做出一个大模型,能够产生一种连OpenAI自己都想不到的智能化的结果。”周鸿祎感慨道。

当然,中国更广阔的市场需要中国自己的大模型,中国厂商也有天然的本土优势。只是放到中西对比这一更大维度的竞争,国内大厂也有自己的局限。

周鸿祎认为,要把ChatGPT训练好,要用全人类的知识,一定要有开放的思路。全世界中文网页大概是其他语言网页的1/10,书籍的数目也不足。此外,国内移动互联网的迅猛发展,也在制造更多的数据孤岛。

“国外虽然App也取代了Web,但国外很多APP基本保留了Web版,用浏览器还是能在网页之间跳来跳去,能够自由使用。国内信息都被APP私有化了,如果这些巨头互相把握着,谁的数据都不全,最后训练出来的大脑肯定能力上是比不上的。”周鸿祎表达了一定程度的悲观。

事实上,除了语料库之外,算力也是一个巨大的挑战。2022年8月底,美国政府宣布禁止美国公司向中国(包括中国香港地区)和俄罗斯出口高端GPU,设定的红线是:算力超过4800 TOPS,且带宽传输速率超过600 GB/秒,受限产品就包括英伟达A100和后续产品H100。

面向未来的AI大模型,中国互联网大厂还需更大的勇气和努力,去突破算力、语料、人才等各种限制。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
华为笔记本将接入盘古大模型!全新华为MateBook X Pro即将发布
快科技4月10日消息,华为官方宣布,华为将于4月11日举办新品发布会。据了解,此次发布会将推出全新的华为MateBook X Pro,而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】
2024-04-10  Search: 大模型  点击:(4)  评论:(0)  加入收藏
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(6)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(6)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(19)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
▌简易百科推荐
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
AI(人工智能)芯片紧缺之际,越来越多科技巨头选择自行研发。当地时间4月10日,社交巨头Meta公布了自主研发芯片MTIA的最新版本。MTIA是Meta专门为AI训练和推理工作设计的定制芯片...【详细内容】
2024-04-11    澎湃新闻  Tags:Meta   点击:(1)  评论:(0)  加入收藏
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
高质量的数据,越来越值钱。你能想象,那些被遗忘在网盘的陈年老图,有朝一日能价值千金?就在最近,路透社报道称,苹果公司正与图像托管网站Photobucket协商,希望得到这家公司近130亿张...【详细内容】
2024-04-10    镁客网  Tags:AI模型   点击:(0)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
站内最新
栏目相关
  • · Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 科技巨头狂撒千亿美元 “买照片”,只为训练AI模型?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条