您当前的位置:首页 > 新闻资讯 > 科技

马斯克硬刚OpenAI,用户惨遭池鱼之殃

时间:2023-07-05 10:37:42  来源:新浪网  作者:字母榜

只听说过社交媒体想方设法让用户多停留的,没听说过主动给人加个上限的。如今开眼了,埃隆·马斯克正在给所有推特用户加“未成年人保护”,而这一切,居然是被AI逼的?

如今推特用户每天最多能浏览多少推特,不取决于手速或者舍不舍得熬夜,而是有一个明确的数字:已验证(也就是付费的“蓝鸟”服务)账户10000条、未验证账户1000条,而新注册的未验证账户只有500条。

就这,还是马斯克面对愤怒的用户,两次提高后的标准。至于原因,是“为了解决极端水平的数据抓取和系统操纵问题”。

他指的正是AI公司们,为了训练模型,这些企业需要大量数据作为喂养的饲料。去年12月,马斯克切断了与OpenAI的数据联系,今年4月又指责微软非法使用推特的数据。

在马斯克为阻止数据抓取采取激进措施的同时,OpenAI正在面临一项集体诉讼。诉讼的原告有16名,都是个人,换句话说,都是普通的互联网冲浪人。他们指控OpenAI秘密地“从互联网抓取了3000亿字词”,未经允许从互联网那个用户那里窃取“大量私人信息”,以培训ChatGPT

一边是互联网用户和多年来积累大量UGC内容的平台,另一面是新兴的AIGC企业,一场围绕数据抓取、隐私安全的战争已经打响。

周五周五,敲锣打鼓。好不容易要周末了,推特的用户却傻了,屏幕上显示报错信息,提醒其已经超过了“速率限制”,违反了推特的规则,查看了过多推文。

人们压根不知道这是什么意思,推特老板马斯克站了出来,表示的确是有速率限制,而且宣布:为了解决极端水平的数据抓取和系统操纵问题,已验证、未验证、新注册未验证账户每天的浏览上限是6000、600和300条推文。

在此之前,马斯克刚宣布推特开始禁止未登录的用户浏览内容,用户尚且能接受。限制实锤,用户麻了,继而看着这验证与否的区别对待,眉毛挑起来了:你个老六该不会是想用这招推行“蓝鸟订阅”吧?在评论区,不止一位用户评论:“现在得用钱制胜了?”

不满的声音很大,推特的竞品Hive、Mastodon、Tumblr等出现在热门话题里,一张推特墓碑的梗图被大量使用。争议声中,马斯克两次提高标准至验证用户10000条浏览、未验证用户1000条。

一个马斯克的高仿号调侃道:“我设置限制,是因为你们这些推特成瘾者需要出去走走。我这是在为世界做好事啊”。这种上价值的思路好,马斯克反手就是一个转发,自己还单独发了条“去拜访下你的朋友和家人吧”。

不过玩笑归玩笑,马斯克为自己的这次“测试”给出了明确的解释:应对数据爬取。用户的不满,也在于限流的做法是否有效,而不在数据爬取的问题上。

AI初创公司跑来推特“扒数据”的情况有多严重呢?马斯克在一条推文中说,流量激增,推特不得不启用备用服务器:“在紧急情况下启用大量在线服务器,仅仅是为了给某些AI初创公司高得离谱的估值帮忙,这太令人恼火了。”

在限流风波的前一天,Epic Games的CEO蒂姆(Tim Sweeney)还发推抱怨推特也在建墙,马斯克回复:“数百个(甚至更多)阻止正在极其激进地爬取推特数据,到了影响用户体验的地步。我们应该怎么做?我对所有想法都保持开放。”

刚才还在抱怨的蒂姆,很快就给出了认真的建议,如在推特的服务条款中加入禁止数据爬取、以信息安全工程保护平台,以及针对大规模滥用推特的公司采取法律行动。

值得注意的是,马斯克在回复中提到,“绝对”会对那些窃取数据的人采取法律行动:“(乐观地说)从现在起2到3年,期待在法庭上看到他们。”

不管“为付费订阅添柴”的猜想是不是以小人之心度了马斯克之腹,马斯克高举用户隐私大旗之外,多少有可能抱有私心。4月,马斯克被传出成立X.AI新人工智能公司,要对抗ChatGPT。如果真的要训练大语言模型,推特的用户数据,当然是只给自己用最好。

不论如何,主动给平台限流都做得出来,马斯克已经做好准备,要和AI初创公司们硬刚到底了。

就在马斯克重拳出击给全平台限流的时候,这场AICG热潮的“始作俑者”、ChatGPT的造物主OpenAI,正卷入一场集体诉讼中。

这起诉讼在美国加州北区地方法院发起,原告16人,均为匿名,均为个人。诉状很长,足足有157页,以斯蒂芬·霍金的一句话作为开头:“强大人工智能的崛起,要么是人类有史以来最好的事,要么是最糟的。”被告除了OpenAI,还有为其注资上百亿美元的微软。

核心指控是,ChatGPT使用从互联网上收集的数据来“训练其技术”时,侵犯了“无数人的版权和隐私。”

起诉书中称,OpenAI从互联网上秘密抓取3000亿字词,窃听了“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。其中就提到了OpenAI爬取大量网络数据,包括社交媒体中的数据。

他们还指出OpenAI有个专有AI语料库,积累了大量个人数据,包括从Reddit帖子及其链接到网站中获取的数据。

这是训练模型方面的指控,此外,原告还称用户与OpenAI的产品的互动、在产品中的私人信息,也都被OpenAI非法访问、大规模盗用。

这已经不是OpenAI第一次在美国面临集体诉讼。去年11月,就有Github程序员对Github、OpenAI和微软发起集体诉讼的事件,指控OpenAI涉嫌违反开源许可,使用他们贡献的代码训练专有AI工具GitHub Copilot。

彼时ChatGPT还没有上线,如今回头看,AI训练的问题那时就已经暴露。如今,最新的集体诉讼针对的是用户更为广泛、被侵犯人群也更加广泛(基本上就是全员受害)的ChatGPT,更重要的是,在AIGC的狂潮之下,任何法律先例都可能影响未来。

代理该案的克拉克森公益律师事务所(Clarkson)在一封声明中,将这次的集体诉讼称作“里程碑式”的联邦案件,是对整个人工智能的警告。

从这个角度看,OpenAI肩上的担子的确很重。

OpenAI因数据抓取和隐私安全已经惹上诸多麻烦,平台上锁、用户翻脸都只是冰山一角。

在欧洲,OpenAI已经遭到了多个国家的调查,甚至在今年4月,意大利担心ChatGPT会违反欧洲数据保护法,暂时封禁过ChatGPT。

针对整个人工智能领域的监管正在推进。法国于5月推出人工智能行动计划,其中在AIGC方面,法国隐私监管机构特别关注一些AI模型从互联网上搜集数据、建立数据集,用来训练大语言模型的做法。

最重磅的是欧盟人工智能监管法案(EU AI Act),目前已经走向收尾阶段。该法案将有可能成为全球AI治理的范本。   

平台、用户、监管,三股力量已经形成合围之势,誓要尽早给AIGC立立规矩,并且要从大模型训练这个起点开始。

一方面,时间紧迫,AIGC发展得太快。

马斯克说“估值高得离谱的AI初创公司”指的是谁,咱也不知道。但这话一出,中箭的确实不少,毕竟现在AIGC领域融资一波接一波,全是热钱。

在初创公司里,OpenAI估值近300亿美元,融资总规模113亿美元,是AIGC里最有钱的;然后是Anthropic,第二有钱,估值超过40亿美元。而前几天才以13亿美元融资震惊硅谷的Inflection,估值也已经有40亿美元,而它成立不过一年多。

大的可能还在后头。Inflection用的是自家的大语言模型,这次13亿美元到手,宣布要搞2.2万张英伟达H100芯片,做全球最大的人工智能集群。如此大规模算力,目标参数量和数据集势必也是惊人的。

另一方面,ChatGPT横空出世,等它暴露出问题时,想“修补”并不是那么容易。OpenAI的几代大语言模型,GPT-2数据集有40GB文本,GPT-3(也就是ChatGPT发布时用的模型)训练数据有570GB,至于今年才发布的GPT-4,数据集大小压根没透露。

海量的数据并没有从一开始就做好记录。谷歌前研究科学家尼西亚·桑巴斯万曾在采访中表示,科技公司不会记录它们是如何收集或注释AI训练数据的,甚至不知道数据集中到底有什么。

木已成舟的ChatGPT就像一个黑匣子,而且是一个打造在密室里的黑匣子,如今要做透明化、隐私保护,比如罗列到底爬取了哪些数据、阐释使用过程中会如何使用这些数据、应用户要求删除某条数据,其实很难。

互联网冲浪人和监管死咬OpenAI们,还有一个不容忽视的原因——在社媒发展壮大的那些年,对个人网络数据保护的意识还在襁褓中,待要抗衡时,发现已错过太远。

当扎克伯格2018年首次坐上国会听证席时,他的社交媒体平台Facebook已经推出了14年。彼时Facebook身陷“剑桥丑闻”,公司首席技术官称有8700万用户受影响。那也是一次因数据抓取酿成的大错。

等到今年5月阿尔特曼坐上美国国会听证席,议员频频表达着在社媒时代行动不足的悔恨,意思很明了:这一次,就算不能超前,也至少要跟上AIGC的脚步。

一个接一个的大模型仍然在训练当中,数据抓取是一根线头,攥住它才有望理清AIGC的糊涂账。



Tags:马斯克   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
特斯拉的第三次危机:钝刀子割肉,马斯克有多疼?
当“第一性原理”撞上商业逻辑2024年前三个月,特斯拉股价累计下跌近30%,马斯克丢掉了世界首富的宝座。质疑与危机对马斯克来说是家常便饭。从成立至今,特斯拉数次陷入危机,曾三...【详细内容】
2024-04-09  Search: 马斯克  点击:(8)  评论:(0)  加入收藏
外媒:超过马斯克!扎克伯格成全球第三大富豪
中新网4月8日电 据《华尔街日报》8日报道,近日,Meta首席执行官马克·扎克伯格成为全球第三大富豪,自2020年以来首次超过特斯拉CEO马斯克。资料图:马克·扎克伯格。...【详细内容】
2024-04-09  Search: 马斯克  点击:(4)  评论:(0)  加入收藏
营销号们,让马斯克和罗翔成了毒鸡汤批发部。
马斯克大家都熟,他的称谓有很多,比如企业家、工程师、发明家。但现在,老马又多了一个新的头衔——五星评论家麦克阿瑟的竞争对手,中国年轻人的人生导师。不知道从什么...【详细内容】
2024-04-07  Search: 马斯克  点击:(5)  评论:(0)  加入收藏
放弃推出低价车型?马斯克驳斥路透社散布谎言
[环球时报综合报道]路透社5日援引多位消息人士的话报道称,特斯拉已放弃推出一直以来承诺要推的一款低价车型的计划,并分析认为这是因为近年来中国车企推出大量低成本电动汽车...【详细内容】
2024-04-07  Search: 马斯克  点击:(4)  评论:(0)  加入收藏
马斯克成美国奥斯汀最大私人雇主,坐拥6000英亩土地!特斯拉、SpaceX均有工厂
根据特斯拉向特拉维斯县提交的年度合规报告,该公司在大奥斯汀地区的员工人数去年激增了约86%,至22777人。这使特斯拉超越了食品连锁店H-E-B,成为奥斯汀最大的私营雇主。奥斯汀...【详细内容】
2024-04-03  Search: 马斯克  点击:(14)  评论:(0)  加入收藏
马斯克称AI造福人类概率远大于毁灭人类
在最近的一次讲话中,特斯拉和SpaceX首席执行官埃隆·马斯克在超级人工智能对人类的潜在影响方面的立场似乎发生了令人惊讶的转变。周四,零重力公司(Zero Gravity)的CEO彼...【详细内容】
2024-03-29  Search: 马斯克  点击:(18)  评论:(0)  加入收藏
马斯克:人形机器人成本将不到一辆汽车的一半
特斯拉CEO埃隆·马斯克周二表示,他认为人形机器人的成本最终将不到一辆汽车的一半。马斯克是在回应一位X用户的帖子,该用户写道:“人形机器人的重量还不到汽车的十分之一...【详细内容】
2024-03-27  Search: 马斯克  点击:(17)  评论:(0)  加入收藏
马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
马斯克脑机接口公司的首位志愿者,又给我们展现了一段“绝活”:  肩部以下全无知觉的他,只靠脑中的一块芯片,就打起了马里奥赛车游戏。  只见赛车前进、转弯,控制得相当灵活。...【详细内容】
2024-03-26  Search: 马斯克  点击:(23)  评论:(0)  加入收藏
瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
一名因潜水事故导致肩部以下瘫痪八年的 29 岁男子,正在借助脑机接口设备重温在线国际象棋和杀时间大作游戏《文明 6》。这是脑机接口公司 Neuralink 最新一场直播的内容,迅速...【详细内容】
2024-03-21  Search: 马斯克  点击:(24)  评论:(0)  加入收藏
真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
xAI成了更“open”的AI。当地时间3月17日,特斯拉CEO埃隆·马斯克旗下的人工智能初创公司xAI正式宣布开源大模型Grok-1,遵循Apache 2.0协议开放模型权重和架构。官网显示...【详细内容】
2024-03-18  Search: 马斯克  点击:(33)  评论:(0)  加入收藏
▌简易百科推荐
英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
新华财经上海4月11日电 当地时间4月9日,英特尔在Vision 2024客户和合作伙伴大会上宣布推出最新AI芯片产品Gaudi 3加速器。英特尔称,相比英伟达的H100 GPU,Gaudi3 AI芯片的模型...【详细内容】
2024-04-11    上海证券报  Tags:英特尔   点击:(2)  评论:(0)  加入收藏
AI“复活”亲人成生意,哪些红线待划定?
提供一张照片、一段10多秒的音频,即可让逝者在视频中“活”过来——AI“复活”亲人成生意,哪些红线待划定?本报记者 陶稳《工人日报》(2024年04月11日 06版)阅读提示...【详细内容】
2024-04-11    工人日报  Tags:AI   点击:(2)  评论:(0)  加入收藏
谷歌推出适用于安卓设备的“查找我的设备”网络
IT之家 4 月 9 日消息,谷歌今日推出了适用于安卓设备的“查找我的设备”网络,其功能类似于苹果的“查找”网络,旨在帮助用户定位丢失、被盗的安卓产品。IT之家注意到,与苹果的“...【详细内容】
2024-04-09    IT之家  Tags:安卓   点击:(2)  评论:(0)  加入收藏
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
2026年的数据荒越来越近,硅谷大厂们已经为AI训练数据抢疯了。它们纷纷豪掷十数亿美元,希望把犄角旮旯里的照片、视频、聊天记录都给挖出来。不过,如果有一天AI忽然吐出了我们的...【详细内容】
2024-04-09    新智元  Tags:硅谷   点击:(2)  评论:(0)  加入收藏
谷歌搜索史上最大变革!考虑对AI搜索收费
快科技4月7日消息,据国外媒体报道,谷歌正计划对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务历史上最大的一次变革。自2000年以来,谷歌的搜索产品一直依靠广告盈利...【详细内容】
2024-04-08    快科技  Tags:谷歌搜索   点击:(8)  评论:(0)  加入收藏
为训练AI,OpenAI等科技巨头花式淘数据
[环球时报特约记者 甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习...【详细内容】
2024-04-08    环球网  Tags:AI   点击:(9)  评论:(0)  加入收藏
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了!外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算...【详细内容】
2024-04-08    新智元  Tags:GPT-5   点击:(2)  评论:(0)  加入收藏
当“机器人”有了“AI大脑” 人形机器人时代来了吗
数智风向标当“机器人”有了“AI大脑”​人形机器人时代来了吗简单明了的口令下达后,机器人便开始搬箱子、运小球,在各类不同的地形行走……这些身上布满芯片和传...【详细内容】
2024-04-08    中国青年报  Tags:机器人   点击:(5)  评论:(0)  加入收藏
报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
IT之家 4 月 7 日消息,本周早些时候,《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了 AI 公司处理此问题的一些方法,其中涉及到...【详细内容】
2024-04-07    IT之家  Tags:OpenAI   点击:(7)  评论:(0)  加入收藏
量子计算会和经典计算一样融入人们的日常生活
作为2024中国网络媒体论坛打造的创新活动之一,“技术赋能·八点见”创新项目发布会于3月30日晚在云南昆明举行。活动现场,本源量子计算科技(合肥)股份有限公司(以下简称“...【详细内容】
2024-04-03    人民网  Tags:量子计算   点击:(8)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 英特尔发布新一代AI芯片并首推AI芯片代工 “单挑”英伟达和台积电
  • · AI“复活”亲人成生意,哪些红线待划定?
  • · 谷歌推出适用于安卓设备的“查找我的设备”网络
  • · 你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · 为训练AI,OpenAI等科技巨头花式淘数据
  • · 训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
  • · 当“机器人”有了“AI大脑” 人形机器人时代来了吗
  • · 报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4
  • · 量子计算会和经典计算一样融入人们的日常生活
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 谷歌为了结集体诉讼,同意删除 Chrome 无痕模式下收集的用户数据
  • · 哥伦比亚大学华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
  • · 谷歌服务现已支持使用 Windows Hello 人脸和指纹解锁登录
  • · GPT商店热度不尽人意 仅用在写论文和炒股票上较受欢迎
  • · 距实现全球安全量子通信更近一步:量子点源产生近乎完美纠缠光子对
  • · 中国三大运营商共同发布通过GSMA Open Gateway认证的一次性密码 API
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · 国家数据局局长刘烈宏:充分发挥数据要素价值 培育新质生产力
  • · 谷歌Chrome巨变:第三方Cookie的终结将重塑互联网格局
  • 站内热门
    相关头条
  • · 谷歌搜索史上最大变革!考虑对AI搜索收费
  • · ChatGPT官宣免注册,全球互联网变天!OpenAI将取代谷歌搜索?
  • · 马斯克脑机接口再造奇迹:瘫痪小伙意念玩赛车击败正常人
  • · Kimi引燃大模型“长文本竞赛”,阿里360百度急出手
  • · 瘫痪8年小哥植入马斯克脑机接口,狂打8小时「文明6」!Neuralink首个人类植入者直播来了
  • · 英伟达“算力核弹”强在哪里?
  • · AI大模型之争远未落幕
  • · 世界首款!英伟达重磅发布人形机器人模型
  • · 全程回顾黄仁勋GTC演讲:Blackwell架构B200芯片登场
  • · 真“Open ” AI?马斯克旗下大模型Grok宣布开源:参数量全球最大
  • · 全球首位AI程序员诞生 人类程序员会失业吗?
  • · 谷歌宣布更新搜索算法:打击AI生成内容,提高搜索结果质量
  • · 英伟达、微软等巨头“抱团”,AI有望助推6G时代到来 国内产业如何接招?
  • · OpenAI Sora已开放对外申请 网友爆料:可能还有其它重磅产品发布
  • · 周鸿祎再谈Sora:真正给人工智能补上了“眼睛”
  • · Sora爆火超100小时:美国狂“卷”算力,国内则卖 AI 课程“捞金”一年5000万|钛媒体AGI
  • · 爆火Sora参数规模仅30亿?谢赛宁等大佬技术分析来了
  • · “AI女友”霸占GPT商店,OpenAI苦不堪言:开发者也难出头!
  • · 从居家到工作,CES 2024上演 AI硬件大秀
  • · OpenAI新年头号重磅!GPT Store上线,企业客户新品也来了
  • 站内头条