您当前的位置:首页 > 新闻资讯 > 科技

中国10亿参数规模以上大模型已发布79个,集中在北京和广东

时间:2023-05-29 15:43:55  来源:澎湃新闻  作者:

文章转载来源:AI之势

来源:澎湃新闻

记者 张静

·据不完全统计,目前中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。中国大模型中,已有半数以上大模型开源,高校/科研机构是开源主力。

·北京、江苏、广东、上海等是大模型人才相对较多的地区,为大模型研发提供关键智力要素支撑。但人才总量仍然稀缺,大模型具有较高门槛,需要高素质AI人才,目前各地大模型人才数量均不充足。

图片来源:由无界 AI工具生成图片来源:由无界 AI工具生成

中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东。

5月28日,在2023中关村(5.930, -0.03, -0.50%)论坛平行论坛之一的人工智能大模型发展论坛上,中国科学技术信息研究所所长赵志耘发布《中国人工智能大模型地图研究报告》,目前中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。中国大模型中,已有半数以上大模型开源,高校/科研机构是开源主力。

2017年谷歌发布的Transformer网络结构是大模型发展的源头技术,自此以后大模型技术在自然语言理解、计算机视觉、智能语音等方面都取得了标志性的技术突破,在模型精度、通用性和泛化能力等方面都实现了跨越式发展。ChatGPT又进一步激发了语言大模型爆发式涌现,也吸引了大量研发团队投入到通用视觉、多模态等更多大模型研发方向。赵志耘表示,仅用5年多时间,大模型技术已形成庞大技术群,衍生出涵盖各种参数规模、各种技术架构、各种模态、各种场景的大模型家族。

从全球大模型发展态势来看,美国谷歌、OpenAI等机构不断引领大模型技术前沿,欧洲、俄罗斯、以色列等越来越多的研发团队也在投入到大模型的研发中。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高,中国从2020年进入大模型快速发展期,目前与美国保持同步增长态势。

在中国大模型的发展态势中,赵志耘表示,据不完全统计,到目前为止中国10亿参数规模以上的大模型已发布79个,14个省市/地区都在开展大模型研发,主要集中在北京和广东,其中北京38个大模型,广东20个大模型。在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。在研发主体分布上,大学、科研机构、企业等不同创新主体都在参与大模型研发,学术界和产业界之间的联合研发仍不足。“今年以来大模型有着快速发展的态势,但我们同时也观察到了合作收缩的趋势,接下来需要注意。”

与此同时,算力-模型匹配度高,公共算力发展迅速。北京、广东、浙江、上海等地的大模型数量最多,这四个地方也是近三年人工智能服务器采购数量最高的地区。各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支持。

人才也是人工智能的重要支柱。北京、江苏、广东、上海等是大模型人才相对较多的地区,为大模型研发提供关键智力要素支撑。但人才总量仍然稀缺,大模型具有较高门槛,需要高素质AI人才,目前各地大模型人才数量均不充足。

“通过大模型的论文发布,我们可以看到中国大模型的学术影响力正在逐步形成。从区域影响力来看,北京、广东、上海三地无论是论文数量还是论文引用量都在国内最高。”赵志耘表示,清华大学与阿里和百度联合开发的CogView模型论文引用数最高。但与国外领先大模型的学术影响力相比差距仍然较大。

从开源创新生态上看,中国大模型中,已有半数以上大模型开源,北京、广东、上海三地开源数量和开源影响力均居国内前三。高校/科研机构是开源主力,“清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型开源影响力最高。”赵志耘表示。

中国大模型的产业化应用沿着两条路径发展,第一种是通用类大模型持续拓展应用领域,文心一言、通义千问、紫东太初、星火认知等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。第二种是垂直领域专业类大模型不断深化落地,一批针对生物医药、遥感气象等垂直领域的专业大模型发挥其领域纵深优势,提供针对特定业务场景的高质量专业化解决方案。

倡导加强资源和研发力量的统筹,促进大模型有序发展。

针对大模型发展的不足,赵志耘提出4点建议与展望:

一是加强资源和研发力量的统筹,促进大模型有序发展。通过加强智算中心、超算中心、云计算中心等计算资源的统筹,制定公共数据共享目录和共享规则,推动数据分级分类有序开放。

二是加快基础研究和技术创新,提升学术和开源影响力。大模型技术仍处于发展初期,潜在的基础理论和技术创新空间巨大。通过蒸馏、量化等小型化技术实现模型“瘦身”,为大模型小型化、绿色化发展提供技术支撑。进一步加强产学研合作,鼓励大模型开源开放,也将加速大模型技术进步。

三是强化大模型发展中的场景牵引作用,打造大模型标杆项目。以行业专有训练数据集为基础,打造金融、医疗、电力等领域的专业大模型,在特定业务场景实现高质量应用突破,也希望通过应用场景和应用数据反向促进大模型技术迭代升级。

四是强化国际合作,积极参与全球人工智能治理。以负责任的态度共同推动大模型的治理,希望人工智能的治理原则和伦理规范能够进一步在大模型的全链条中落地生根。同时在增进共识的基础上加强人工智能治理的全球合作。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
华为笔记本将接入盘古大模型!全新华为MateBook X Pro即将发布
快科技4月10日消息,华为官方宣布,华为将于4月11日举办新品发布会。据了解,此次发布会将推出全新的华为MateBook X Pro,而预热海报的主题是“轻且强”。这里的“强”不仅仅是指性...【详细内容】
2024-04-10  Search: 大模型  点击:(4)  评论:(0)  加入收藏
行业大模型快速落地的一年,如何做?
生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一...【详细内容】
2024-04-10  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09  Search: 大模型  点击:(6)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(19)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
▌简易百科推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(7)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条