您当前的位置:首页 > 电脑百科 > 人工智能

王小川大模型25天再升级!13B版本开源免费可商用,3090即可部署

时间:2023-07-11 15:39:29  来源:凹非寺  作者:

衡宇 金磊 发自 凹非寺

量子位 | 公众号 QbitAI

就在刚刚,王小川的开源大模型又有了新动作——

百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B-Base)。

并且官方对此的评价是:

性能最强的中英文百亿参数量开源模型。

与此一同出道的,还有一个对话模型Baichuan-13B-Chat,以及它的INT4/INT8两个量化版本。

但更重要的一点是(划重点),完全开源!免费可商用!

就在不久前的6月15日,百川智能才刚刚发布其第一款70亿参数量的中英文语言模型Baichuan-7B。

当时的版本便已经拿下多个世界权威Benchmark榜单同量级测试榜首;同样作为开源大模型,据说清华北大都已经用上了。

仅仅时隔25天,更大、更强的版本再次袭来,不得不说,王小川在技术上的动作是有够紧锣密鼓的了。

那么这次号称的“最强开源大模型”,具体表现又是怎样呢?

多领域超越ChatGPT

老规矩,先提纲挈领地说一下Baichuan-13B的基本个“模”资料:

中英双语大模型,130亿参数,在1.4万亿token数据集上训练,完全开源、免费可商用。

1.4万亿ztoken这个训练数据量,超过LLaMA-13B训练数据量的40%,是当前开源的13B尺寸模型世界里,训练数据量最大的模型。

此外,Baichuan-13B上下文窗口长度为4096——这就不得不提到其与7B版本完全不同的编码方式。

7B版本采用RoPE编码方式,而13B使用了ALiBi位置编码技术,后者能够处理长上下文窗口,甚至可以推断超出训练期间读取数据的上下文长度,从而更好地捕捉文本中上下文的相关性,让预测或生成更准确。

作为一款中英文双语大模型,Baichuan-13B采用了相对平衡的中英文语料配比和多语言对齐语料,从而在中英两种语言上都有不俗表现。

主流百亿参数13B开源模型benchmark成绩

来看看Baichuan-13B在中文领域的测评成绩。

在评测集C-EVAl上,Baichuan-13B在自然科学、医学、艺术、数学等领域领先LLaMA-13B、Vicuna-13B等同尺寸的大语言模型。

社会科学和人文科学领域,水平比ChatGPT还要好上一点。

英文领域的表现也算不错,能比同尺寸的其他开源模型,如LLaMA-13B、Vicuna-13B都有更好的表现。

通常而言,非专业用户和有具体需求的企业,对有对话功能的对齐模型有更重的好奇心。

鉴于这个情况,百川智能此次在发布与训练模型底座Baichuan-13B-Base的同时,还发布了其对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本。

来看看对话模型的实际表现效果——

让它写个商品介绍邮件,它能写出酱婶儿的:

 

数据推理能力如何?

也浅测了一番:

至于互联网上远古或新近流行的各种梗,Baichuan-13B-Chat好像也没在怕的:

官方介绍,为了保证模型的纯净度,Baichuan-13B-Base和Baichuan-13B-Chat没有针对任何benchmark测试进行专项优化,具有更高的效能和可定制性。

为什么要完全开源、可商用?

正如我们刚才提到的,这次百川智能推出的Baichuan-13B-Base是对学术研究完全开放。

不仅如此,所有开发者均可通过邮件向百川智能申请授权,在获得官方商用许可后即可免费商用。

而且据官方的说法,百川智能是为了降低使用的门槛,才同时开源了Baichuan-13B-Chat的INT8和INT4两个量化版本。

这样一来,在近乎无损的情况下,便可以将模型部署在如3090等消费级显卡上。

想必很多小伙伴就要问了,百川智能为什么要走这么一条路?

其实如果看下Meta在大模型上的开源之路,便可窥知一二。

我们都知道大模型在训练的成本极高,因此像OpenAI和谷歌两大科技巨头最初选择的是闭源的“路数”,它们为的就是以此保证自己的优势。

而Meta后来所推出的LLaMa则与之“背道而驰”,但所迸发出来的潜力却是有目共睹——

迅速吸引大批开发者,在LLaMa基础上迭代出了各种ChatGPT的替代品,甚至在性能的表现上是可以匹敌GPT-3.5的那种。

加之业界对大模型未来发展态势已经达成了一个共识:

类似Android/ target=_blank class=infotextkey>安卓和IOS,将会是开源和闭源共存的状态。

因此,开源在大模型的发展中已然成为一股不可或缺的中坚力量。

……

那么你对于王小川的新大模型,有何看法呢?



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
就在刚刚,王小川的开源大模型又有了新动作——百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B-Base)。...【详细内容】
2023-07-11  Tags: 大模型  点击:(0)  评论:(0)  加入收藏
引言 又几个月过去了,大模型(LLM)行业有什么新进展、新趋势?(0)总结——太长不看关键结论:开源社区模型不具备真正智能,更好的小模型来自大模型的 Scale DownGPT-4模型信...【详细内容】
2023-07-11  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
2023世界人工智能大会上多家企业展示AI大模型产品和应用出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“看得多、投得少”,“观望气氛比较浓厚”。谈及投资机构今年对AI大模型创...【详细内容】
2023-07-11  Tags: 大模型  点击:(2)  评论:(0)  加入收藏
科大讯飞表示,下半年将“all in”大模型。AI龙头第二季度扭亏昨日盘后,AI龙头科大讯飞发布上半年业绩预告。公司预计上半年实现归母净利润5500万元~8000万元,同比下降71%~80%;扣...【详细内容】
2023-07-11  Tags: 大模型  点击:(4)  评论:(0)  加入收藏
2023年7月7日,华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和...【详细内容】
2023-07-10  Tags: 大模型  点击:(8)  评论:(0)  加入收藏
作者|卓心月出品|零态LT(ID:LingTai_LT)大模型从概念到落地,到底有多快?近期科技圈最引人注目的2023世界人工智能大会(WAIC 2023),给出了让所有人震惊的答案:半年!半年,对于任何一个科技...【详细内容】
2023-07-10  Tags: 大模型  点击:(7)  评论:(0)  加入收藏
  当下,如火如荼的大模型热潮,已经蔓延了数月之久,在各种关于大模型的测评中,优先级最高,也最被人看重的,莫过于各类大模型所展现出的IQ能力。  无论是写代码、做数学题,还是各...【详细内容】
2023-07-10  Tags: 大模型  点击:(10)  评论:(0)  加入收藏
作者|于惠如 编辑|刘宇国内大模型之战,华为终于出手了。7月7日,华为在开发者大会2023(Cloud)上发布盘古大模型3.0。但与此前诸多公司的大模型发布会不同,华为没有在现场展示大模型...【详细内容】
2023-07-09  Tags: 大模型  点击:(12)  评论:(0)  加入收藏
与3、4月份人们充满期待的科幻想象相比,当下做大模型的人,关注的话题更接近现实。他们发现,数据是难题,算力也是难题,大模型这条路,前景美好但现实艰难。作者:任晓宁 卷数量7月6日...【详细内容】
2023-07-09  Tags: 大模型  点击:(7)  评论:(0)  加入收藏
 生成式人工智能“飞入寻常百姓家”  今年世界人工智能大会开幕式的开场曲与往年一样炫酷。绚丽的灯光、舞动的3D机械手、生动的视频画面,配合着“90后”二胡演奏家兼作曲...【详细内容】
2023-07-08  Tags: 大模型  点击:(13)  评论:(0)  加入收藏
▌简易百科推荐
就在刚刚,王小川的开源大模型又有了新动作——百川智能,正式发布130亿参数通用大语言模型(Baichuan-13B-Base)。...【详细内容】
2023-07-11    凹非寺  Tags:大模型   点击:(0)  评论:(0)  加入收藏
引言 又几个月过去了,大模型(LLM)行业有什么新进展、新趋势?(0)总结——太长不看关键结论:开源社区模型不具备真正智能,更好的小模型来自大模型的 Scale DownGPT-4模型信...【详细内容】
2023-07-11   鹤啸九天的科技思考  企鹅号  Tags:LLM   点击:(2)  评论:(0)  加入收藏
最近,ChatGPT对GPT Plus用户开放了Code Interpreter功能,这次看起来并没有掀起很多讨论,可能是Code Interpreter这个名字起的太差了。简单的说,这个功能就是一个在ChatGPT上的代...【详细内容】
2023-07-11   TechVerse  企鹅号  Tags:ChatGPT   点击:(2)  评论:(0)  加入收藏
2023世界人工智能大会上多家企业展示AI大模型产品和应用出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“看得多、投得少”,“观望气氛比较浓厚”。谈及投资机构今年对AI大模型创...【详细内容】
2023-07-11    搜狐科技  Tags:AI大模型   点击:(2)  评论:(0)  加入收藏
作者:范昕茹 来源:IT时报2023年是亚马逊云科技进入中国的第十年。十年间,亚马逊云科技见证了中国云计算产业的萌芽,并通过持续引进云计算的最新技术和理念,助力中国千行百业的数...【详细内容】
2023-07-11    IT时报  Tags:AIGC   点击:(2)  评论:(0)  加入收藏
撰文 | 文烨豪来源 | 光子星球过去两年,消费电子赛道始终被笼罩在长夜之中,任由刺骨的寒风呼啸而过——纵使是苹果这样的赢家,也试图通过Vision Pro开启新故事。然而...【详细内容】
2023-07-11    光子星球   Tags:AI   点击:(2)  评论:(0)  加入收藏
2023世界人工智能大会虽然已经闭幕,但由ChatGPT掀起的大模型热潮还将继续涌动,人工智能的布局和探索也将是近些年的一大主题。“先上牌桌”“抢下先手棋”是掀起这一轮“百模...【详细内容】
2023-07-11    国际金融报  Tags:AI   点击:(4)  评论:(0)  加入收藏
译者 | 李睿如今,很多企业高管都将人工智能视为未来发展方向,许多技术领导者也将ChatGPT视为人工智能的代名词。但是OpenAI的旗舰产品ChatGPT并不是唯一的大型语言模型—...【详细内容】
2023-07-10    51CTO  Tags:大型语言模型   点击:(5)  评论:(0)  加入收藏
2023年7月7日,华为开发者大会2023(Cloud)7月7日在中国东莞正式揭开帷幕,并同时在全球10余个国家、中国30多个城市设有分会场,邀请全球开发者共聚一堂,就AI浪潮之下的产业新机会和...【详细内容】
2023-07-10  环球Tech    Tags:盘古大模型   点击:(8)  评论:(0)  加入收藏
ChatGPT推出至今 最强最有用的功能是什么?可能要非 代码解释器(Code Interpreter)莫属了。这项功能下周才会正式向所有Plus用户开放,但不少提前进行测试的网友都不约而同地发现:...【详细内容】
2023-07-10    量子位  Tags:ChatGPT   点击:(8)  评论:(0)  加入收藏
站内最新
站内热门
站内头条