您当前的位置:首页 > 电脑百科 > 站长技术 > 服务器

Huggingface榜首开源模型惹争议:魔改Apache协议,达到一定门槛要收钱

时间:2023-05-29 13:21:36  来源:机器之心  作者:

我们知道,Huggingface 是 AI 领域著名的开源平台,任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集,为业内提供了研究便利。因此它深受 AI 圈的喜爱,其最受欢迎的 Transformer 库已在 Github 上收获 102k 的 Star 量。

不过近日,由 TII 开发并发布在 Huggingface 上的一个大模型引发了广泛争议。该大模型是 400 亿参数的因果解码器模型 Falcon-40B,它在 RefinedWeb 的 1000B token 上进行训练,并使用精选数据集增强。它在 Huggingface 的 OpenLLM 排行榜上排首位,其性能优于 LLaMA、MPT、RedPajama 和 StableLM 等。

 

排行榜地址:https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

虽然 Falcon-40B 模型本身很强大,但其遵循的开源协议却在开源圈引起了轩然大波。它在一个允许商业使用的许可证下可用,即如下 TII Falcon LLM License。

 

开源协议:https://huggingface.co/tiiuae/falcon-40b/blob/main/LICENSE.txt

该许可证部分基于 Apache License Version 2.0。Apache License 2.0 协议来自著名的 Apache 基金会,它对商业应用友好。使用者可以在需要的时候修改代码来满足需要并作为开源或商业产品发布 / 销售。

但有人发现了 TII Falcon LLM License 的一些「猫腻」。推特用户 @natfriedman 总结了它与 Apache License 2.0 开源许可的相似与不同之处。其中相似之处在于都授予使用、修改和分发许可作品的广泛许可,要求在分发中包含许可文本和归属,并具有责任限制、担保豁免权。

不过区别在于,TII Falcon LLM License 要求一旦达到收入门槛,需支付商业用途特许权使用费,而大多数开源许可不需要。TII Falcon LLM License 对如何发布或分发作品也有额外限制, 比如要求归属于「Falcon LLM technology from the Technology Innovation Institute」。

同时,TII Falcon LLM License 不允许在其他不同的许可下重新授权作品,而大多数开源许可允许衍生作品根据不同的协议获得许可。TII Falcon LLM License 还明确地排除了 Falcon LLM 的某些版本 / 大小的许可,而开源许可通常适用于所有版本。

最后,TII Falcon LLM License 对修改源代码和目标代码都有额外的要求,除非分发编译的模型。总之,该许可允许开放使用和修改,但同时又保留了很多自有权利。

 

@natfriedman 的观点得到了很多人的附和,另一位推特用户 @_msw_直截了当地指出,将专有许可基于受信任的 Apache License 2.0 之上并称其为「开源」(实际上不是真正的开源),这种利用 Apache 软件基金会来之不易的信誉和品牌的做法是不对的。

 

又有人问了,这意味着 Falcon-40B 不开源或不是免费软件?@_msw_回复称它既不开源也不是免费软件。

 

吃瓜群众有的同意并认为 TII Falcon LLM License 根本不是开源许可,但也有的指出 TII Falcon LLM License 本就是「部分」基于开源协议。

   

业内从事开源人士发表了观点,认为魔改 Apache 或其他主流开源许可证不叫开源,甚至算不上开放内核。

 

Falcon-40B 是否开源但又不完全开源呢?机器之心的读者们,你们怎么看?

参考链接:https://huggingface.co/tiiuae/falcon-40b



Tags:Huggingface   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
我们知道,Huggingface 是 AI 领域著名的开源平台,任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集,为业内提供了研究便利。因此它深受 AI 圈的喜爱,其最受欢迎...【详细内容】
2023-05-29  Tags: Huggingface  点击:(0)  评论:(0)  加入收藏
▌简易百科推荐
我们知道,Huggingface 是 AI 领域著名的开源平台,任何人和机构都可以在该平台上发布自己以及使用他人的模型、数据集,为业内提供了研究便利。因此它深受 AI 圈的喜爱,其最受欢迎...【详细内容】
2023-05-29    机器之心  Tags:Huggingface   点击:(0)  评论:(0)  加入收藏
在本指南中,你学习了如何在 RHEL 9 / Rocky Linux 9 上安装和配置 DHCP 服务器。请在下面的评论部分发表你的疑问和反馈。DHCP 是 “动态主机配置协议Dynamic Host Configura...【详细内容】
2023-05-24    Linux中国  Tags: DHCP   点击:(11)  评论:(0)  加入收藏
本文将讨论火山引擎EMR团队针对 Iceberg 组件的优化思路,通过引入索引来提高查询性能。Apache Iceberg 是一种开源数据 Lakehouse 表格式,提供强大的功能和开放的生态系统,如:Ti...【详细内容】
2023-05-23  火山引擎EMR团队    Tags:Apache   点击:(12)  评论:(0)  加入收藏
多家云服务厂商大降价 有企业直接打1折价格战折射云巨头焦虑本报记者 袁璐云服务市场正在经历新变局。继4月底“阿里云史上最大规模降价”后,几家云服务巨头日前宣布核心产品...【详细内容】
2023-05-18    北京日报  Tags:云服务   点击:(11)  评论:(0)  加入收藏
来源:e公司受AI(人工智能)大模型发展热潮影响,市场算力需求大增,AI服务器作为算力基础设施之一,由于具备图形渲染和海量数据的并行运算等优势,能够快速准确地处理大量数据,市场价值...【详细内容】
2023-05-17    中国基金报  Tags:AI服务器   点击:(24)  评论:(0)  加入收藏
为什么要用Netty?首先当然是NIO的使用,本身比较复杂,而且还存在一些问题。除此之外,如果在项目的开发中,要实现稳定的网络通信,就得考虑网络的闪断、客户端的重复接入、客户端的...【详细内容】
2023-05-16  架构师之道  今日头条  Tags:Netty   点击:(14)  评论:(0)  加入收藏
在Apache服务器上配置多个监听端口是一项重要的任务,因为这样可以为不同的网络服务提供支持,从而提高服务器的效率和灵活性。下面,小秋将介绍如何在Apache服务器中配置监听多个...【详细内容】
2023-05-09  永远的小秋    Tags:Apache   点击:(8)  评论:(0)  加入收藏
选择云服务器时,重要的是要确定服务器的操作系统。不过,要做出适合您的选择,您需要了解 Windows 和 Linux云服务器之间的主要区别。以下内容旨在提供有关性能、使用情况、安全...【详细内容】
2023-05-05  恒创科技    Tags:云服务器   点击:(16)  评论:(0)  加入收藏
Nginx可以用来实现gRPC的反向代理,这里简要介绍一下如何配置Nginx实现grpc反向代理。要实现grpc反向代理,需要进行以下步骤: 安装gRPC和protobuf在Nginx服务器上安装好gRPC和pr...【详细内容】
2023-04-21  大厂背锅侠  今日头条  Tags:Nginx   点击:(28)  评论:(0)  加入收藏
Nginx是一个高性能的Web服务器,代理服务器和反向代理服务器。它能够处理高并发的请求,并且拥有强大的扩展性和灵活性。在Nginx中,map是一个非常有用的指令,它可以让您定义一个映...【详细内容】
2023-04-21  网络系统技艺者    Tags:Nginx   点击:(51)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条