您当前的位置:首页 > 电脑百科 > 程序开发 > 编程百科

开源与自研的“战火”在大模型时代重燃

时间:2023-11-17 13:47:07  来源:IT168  作者:

这几天朋友圈异常热闹,导火索来自前阿里AI科学家贾扬清的一则消息,他说某国产大模型抄袭了META 的LLaMA架构,并且只换了几个变量名称就说成是自研,谴责这种行为没有底线。就在很多人拿着国产大模型一对一比对,猜测是哪家公司这么干的时候,“肇事者”终于“浮出了水面”,原来是创新工场董事长兼 CEO 李开复推出的“零一万物”(Yi-34B)。

关于抄袭的“大锅”

有国外开发者直接点名,在零一万物的Hugging Face开源主页上,开发者ehartford质疑称该模型使用了META LLaMA的架构,只修改了两个tensor(张量)。零一万物曾在几天前表述,最新发布的开源大模型Yi-34B性能卓越,一鸣惊人。该公司有冲进第一阵营的初心和决心,拥有可以对标 OpenAIgoogle等一线大厂的团队。抄袭事件出来以后, 零一万物公开致歉,并表示会在各开源平台重新提交模型及代码,补充LLaMA 协议副本的流程,尽速完成各开源社区的版本更新。

很明显,零一万物光明正大地承认自己在模型训练过程中,沿用了GPT/LLaMA的基本架构,正是因为LLaMA社区在开源上的贡献,使得零一万物可以快速起步。

至此,我们不去评价功过是非,当所有国内大模型都松了一口气,这口“锅”没砸在自己的头上时,关于开源与自研的问题再次引起争议。

其实,在之前的软件时代,国产软件的自主创新能力就遭遇过质疑。由于我国基础软件基础薄弱,起步较晚,我们最早大量采用开源,导致我们的软件被称为是“开源套壳”。的确,国产软件在研发过程中,确实存在着一部分功能采用欧美企业软件来实现,导致我们现在还在受这些企业的专利限制,并支付专利费用。事实上,在全球化科技环境中,跨国竞争与合作是一种常态,各种技术创新都建立在前人实践的成果之上。换言之,开源的使用并不意味着缺乏自主创新能力,而是基于社区可靠性和广泛性支持,可以帮助更多企业构建更稳定的应用。

只不过,不管你是开源的玩法,还是选择自研创新,都要遵守游戏规则。你是怎样一种状况,就要清清楚楚告诉用户,尊重各自的劳动成果,这是一家企业最基本的行为准则。

开源,还是闭源?

从去年底开始,国内外均以肉眼可见的速度奔向大模型,各种文生文、文生图、文生视频等应用,如雨后春笋般诞生,这背后开源的基础架构带来了强大的推动力。因为,有了开源的数据、算法和框架,其他企业就不用重复造轮子,可以让科技创新更高效。那么,到底如何评价一个模型是不是自研?业内有一种说法是,如果你采用的算法和框架是自己实现的,同时数据是自己收集、清洗的,那就算自研;如果其中三项均来自开源,那就不能被认为是自研。

需要特别注意的是,在开源环境下,模型的自研性并不是唯一的考量标准,还需要考虑模型的实用性、性能和可靠性等因素。所以,如果你使用了开源的框架,同时遵守了开源社区的规范和准则,不侵犯他人知识产权,并且尽可能回馈给开源社区,促进开源社区的发展,那这个模型就可以被认定为是自研。

事实上,当大模型开始狂飙,很多企业都在这个问题上纠结过。有了开源,我们还需要自研吗?最终,大多数企业的选择都是同一个,那就是只能借鉴,不能全盘照抄!模型训练不是开黑盒,只要做不到完全透明,就存在安全风险。

目前,大模型正在向各个行业和企业渗透,比如:金融行业的信息评估预测、医疗行业的影像分析和药物研发、零售行业的销售分析和市场预测、制造业的生产数据分析和调度计划等,都会受到前所未有的影响,我们必须要构建出属于自己的可以自主可控的模型,才能拥有最终话语权。

现实情况是,对于很多互联网大厂来说,如果没有自己的大模型生态,那意味着未来的发展会受阻,甚至出局,所以大模型是必选项。而一些小企业,则依附更大的生态来发展自己垂直领域的模型。所以,大模型看起来非常热闹,已经演变成“百模之争、千模大战”,但背后的竞争也会更加残酷。对于每一个入局的玩家而言,只有找准“赛点”,才能在白热化的竞争中存活下来。



Tags:大模型   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-08  Search: 大模型  点击:(4)  评论:(0)  加入收藏
AI程序员上岗 垂类大模型应用迎来井喷期
能自动写代码的“AI员工”、逐渐告别不够好用的智能客服,无需费时费力开发的工业AI控制器……随着人工智能大模型能力开始深入多个行业,IT、工业生产、金融、服务...【详细内容】
2024-04-07  Search: 大模型  点击:(3)  评论:(0)  加入收藏
AI干掉声优?音频大模型追逐“图灵时刻”
七十年前,“人工智能之父”图灵提出,如果人无法判断屏幕的另一侧究竟是人还是机器,就证明机器具备了人一样的智能。这一经典的图灵测试如同北斗星一般,指引着AI行业的工作者们不...【详细内容】
2024-04-03  Search: 大模型  点击:(5)  评论:(0)  加入收藏
大模型Kimi火了,长文本“卷”出新高度
近日,AI智能助手Kimi宣布支持200万字无损上下文,在长上下文窗口技术上再次取得突破,引燃人工智能领域新一轮投资热情。  摄影/宁颖OpenAI官方去年11月发布的GPT-4 Turbo,支持1...【详细内容】
2024-03-29  Search: 大模型  点击:(13)  评论:(0)  加入收藏
大模型应用的 10 种架构模式
作者 | 曹洪伟在塑造新领域的过程中,我们往往依赖于一些经过实践验证的策略、方法和模式。这种观念对于软件工程领域的专业人士来说,已经司空见惯,设计模式已成为程序员们的重...【详细内容】
2024-03-27  Search: 大模型  点击:(13)  评论:(0)  加入收藏
超长文本是AI大模型的能力突破口吗?
◎记者 刘怡鹤近日,能“一口气读完20万字小说”的AI大模型应用Kimi再次为国内AI产业添了一把火。业内认为,国产大模型能力提升或成今年国内AI领域最核心的主线。超长上下文是...【详细内容】
2024-03-26  Search: 大模型  点击:(8)  评论:(0)  加入收藏
百度AI“咬”了一口苹果 大模型商用有戏了?
百度3月25日突传利好。据知情人士透露,百度将为苹果今年发布的iPhone16、Mac系统和ios18提供AI功能。消息人士称,苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定...【详细内容】
2024-03-26  Search: 大模型  点击:(17)  评论:(0)  加入收藏
Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
从ChapGPT到Sora,从数千亿参数到千万长文本,大模型浪潮下,永远不缺热点。近日,“Kimi概念股暴涨”“Kimi为宕机道歉”等词条先后冲上微博热搜,让月之暗面这家刚成立一年的人工智...【详细内容】
2024-03-25  Search: 大模型  点击:(15)  评论:(0)  加入收藏
Kimi爆了 国产大模型应用元年还远吗?
国产大模型应用Kimi近日可谓横空出世。根据Similarweb数据,Kimi智能助手的周度访问量由23年12月初的15万提升至近期(3.10-3.16)的超过200万,APP端下载量也快速提升,从2月初的效率...【详细内容】
2024-03-22  Search: 大模型  点击:(14)  评论:(0)  加入收藏
国产大模型开卷“比谁长”?Kimi爆火点燃长文本竞争赛道
来源:财联社近日,又一现象级AI应用Kimi爆火出圈,在用户端和资本市场都掀起波澜,引发多个Kimi相关概念股异常波动。海天瑞声(688787.SH)、中广天择(603721.SH)等上市公司纷纷回应“无...【详细内容】
2024-03-22  Search: 大模型  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
即将过时的 5 种软件开发技能!
作者 | Eran Yahav编译 | 言征出品 | 51CTO技术栈(微信号:blog51cto) 时至今日,AI编码工具已经进化到足够强大了吗?这未必好回答,但从2023 年 Stack Overflow 上的调查数据来看,44%...【详细内容】
2024-04-03    51CTO  Tags:软件开发   点击:(5)  评论:(0)  加入收藏
跳转链接代码怎么写?
在网页开发中,跳转链接是一项常见的功能。然而,对于非技术人员来说,编写跳转链接代码可能会显得有些困难。不用担心!我们可以借助外链平台来简化操作,即使没有编程经验,也能轻松实...【详细内容】
2024-03-27  蓝色天纪    Tags:跳转链接   点击:(12)  评论:(0)  加入收藏
中台亡了,问题到底出在哪里?
曾几何时,中台一度被当做“变革灵药”,嫁接在“前台作战单元”和“后台资源部门”之间,实现企业各业务线的“打通”和全域业务能力集成,提高开发和服务效率。但在中台如火如荼之...【详细内容】
2024-03-27  dbaplus社群    Tags:中台   点击:(8)  评论:(0)  加入收藏
员工写了个比删库更可怕的Bug!
想必大家都听说过删库跑路吧,我之前一直把它当一个段子来看。可万万没想到,就在昨天,我们公司的某位员工,竟然写了一个比删库更可怕的 Bug!给大家分享一下(不是公开处刑),希望朋友们...【详细内容】
2024-03-26  dbaplus社群    Tags:Bug   点击:(5)  评论:(0)  加入收藏
我们一起聊聊什么是正向代理和反向代理
从字面意思上看,代理就是代替处理的意思,一个对象有能力代替另一个对象处理某一件事。代理,这个词在我们的日常生活中也不陌生,比如在购物、旅游等场景中,我们经常会委托别人代替...【详细内容】
2024-03-26  萤火架构  微信公众号  Tags:正向代理   点击:(10)  评论:(0)  加入收藏
看一遍就理解:IO模型详解
前言大家好,我是程序员田螺。今天我们一起来学习IO模型。在本文开始前呢,先问问大家几个问题哈~什么是IO呢?什么是阻塞非阻塞IO?什么是同步异步IO?什么是IO多路复用?select/epoll...【详细内容】
2024-03-26  捡田螺的小男孩  微信公众号  Tags:IO模型   点击:(8)  评论:(0)  加入收藏
为什么都说 HashMap 是线程不安全的?
做Java开发的人,应该都用过 HashMap 这种集合。今天就和大家来聊聊,为什么 HashMap 是线程不安全的。1.HashMap 数据结构简单来说,HashMap 基于哈希表实现。它使用键的哈希码来...【详细内容】
2024-03-22  Java技术指北  微信公众号  Tags:HashMap   点击:(11)  评论:(0)  加入收藏
如何从头开始编写LoRA代码,这有一份教程
选自 lightning.ai作者:Sebastian Raschka机器之心编译编辑:陈萍作者表示:在各种有效的 LLM 微调方法中,LoRA 仍然是他的首选。LoRA(Low-Rank Adaptation)作为一种用于微调 LLM(大...【详细内容】
2024-03-21  机器之心Pro    Tags:LoRA   点击:(12)  评论:(0)  加入收藏
这样搭建日志中心,传统的ELK就扔了吧!
最近客户有个新需求,就是想查看网站的访问情况。由于网站没有做google的统计和百度的统计,所以访问情况,只能通过日志查看,通过脚本的形式给客户导出也不太实际,给客户写个简单的...【详细内容】
2024-03-20  dbaplus社群    Tags:日志   点击:(4)  评论:(0)  加入收藏
Kubernetes 究竟有没有 LTS?
从一个有趣的问题引出很多人都在关注的 Kubernetes LTS 的问题。有趣的问题2019 年,一个名为 apiserver LoopbackClient Server cert expired after 1 year[1] 的 issue 中提...【详细内容】
2024-03-15  云原生散修  微信公众号  Tags:Kubernetes   点击:(5)  评论:(0)  加入收藏
站内最新
站内热门
站内头条