您当前的位置:首页 > 电脑百科 > 虚拟现实

AIGC不仅会污染互联网 还会严重威胁大模型开发的未来

时间:2023-06-20 14:22:51  来源:北青网  作者:

过去几天有关“AI污染中文互联网环境”的讨论又重新热闹起来,这个话题也带出了另一个AI“终极命题”:如果世界上绝大部分内容都依靠AI生成,届时我们还能使用这些内容训练出更“聪明”的AI大模型么?

先说结论:情况将变得非常困难且棘手。在目前为数不多但颇受认可的研究中,这种情况被称为“递归的诅咒”:如果大模型的训练高度依赖AIGC内容,将很容易出现“崩溃”的情形。

此话怎讲?

虽然现在互联网上能找到的文字大部分都是真人写的,但不可否认的是,目前AIGC内容正在以非常快的速度出现在广告营销、流量资讯平台以及各式各样的数字载体中。从增量的角度来看,随着大模型的应用在未来半年、一年里开花结果,AIGC内容如潮水一般涌入互联网平台只是时间问题。

科技的进步从来不是单方面的祝福,往往也会伴随着诅咒。

正如温室气体,以及人类向海洋里排放的各种奇奇怪怪物质,互联网的“海洋”也在面临类似的威胁。

牛津大学、剑桥大学、伦敦帝国学院、多伦多大学等机构的研究人员近期在预印本平台上发表的一篇论文,恰好就是论述这个话题的。

来源:arxiv

研究人员发现,在使用AIGC内容训练模型时,会造成模型出现“不可逆的缺陷”,并且这种情况在变分自编码器、高斯混合模型和大语言模型中都会出现。

同样是内容,为何AIGC的内容会导致“模型崩溃”呢?

研究人员解释称:

模型崩溃是一种影响学习生成模型的退化过程,其中生成的数据最终会污染下一代模型的训练集;使用被污染数据进行训练,会导致模型误解现实。这里还有两种特殊情况:早期模型崩溃和晚期模型崩溃。在早期模型崩溃中,模型开始丧失关于分布尾部的信息;在晚期模型崩溃中,模型将原始分布的不同模式相互纠缠,并收敛到与原始模型相差甚远的分布,通常方差非常小。

这个过程与灾难性遗忘的过程不同,因为我们考虑的是随时间推移的多个模型,这些模型不会忘记以前学习的数据,而是开始误解他们认为的真实。

遭到AIGC内容干扰后丧失能力的模型,来源:论文

考虑到大多数人可能看不太懂这两段话,这篇论文的作者之一,牛津大学的Ilia Shumailov接受媒体采访时举了一个AIGC图片的例子:假设在训练模型时,使用了100张狗狗的照片,里面有90只狗狗有黄色眼睛,还有10只有蓝色眼睛。由于数据集中黄眼睛狗狗的数量占据绝大多数,那么这样训练出的模型中,蓝眼睛狗狗实际的颜色会变得更加绿(黄加蓝=绿)一些。如果有人从互联网上抓取这样生成的图片,重复进行生成—抓取—训练的过程,将会导致模型识别蓝眼睛狗狗的能力最终消失。这种对信息的丧失或扭曲,就是模型崩溃。

引申开来,这也引发了另一层竞争:先行的GPT模型们,可能会堵住后来者开发更强大模型的路。或者说,想要“弯道超车”的后来者,需要花在可信赖数据上的时间和金钱,将远远超越领跑的这一批科技巨头。

研究人员总结称,训练大语言模型的特质预示着“先行者优势”的存在。这篇论文证明了使用AIGC语料训练会导致分布改变,以及模型崩溃。为了确保模型在长期内学习持续进行,需要确保非AIGC语料的可及性。但目前为止,如何跟踪和识别大模型生成内容的机制尚不明确,如果继续大规模地从互联网上爬取数据,训练新版本的大模型将变得原来越困难。

编辑/范辉



Tags:AIGC   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
AIGC飞向“寻常人家”,专家称解决应用落地的“最后一公里”
中新网北京1月5日电 (记者 夏宾)AIGC可谓是2023年的热词之一。从GPT为代表的大模型涌现,到应用层的快速创新,接着继续向深度业务场景挺进,其服务实体经济的作用愈加明显。近日,I...【详细内容】
2024-01-05  Search: AIGC  点击:(109)  评论:(0)  加入收藏
科技部发文规范 AI 使用,禁用 AIGC 直接生成申报材料
IT之家 1 月 3 日消息,科技部监督司上个月编制印发《负责任研究行为规范指引(2023)》,《指引》从研究选题与实施、数据管理、成果署名、同行评议、伦理审查、监督管理等 11 个方...【详细内容】
2024-01-04  Search: AIGC  点击:(60)  评论:(0)  加入收藏
AIGC重塑基础设施,高密数据中心为何众望所归?
凯文·凯利在《必然》中认为,科技在本质上有所偏好,使得它朝往某种特定方向。毫无疑问,进入到数字经济时代,人工智能技术飞速发展与加速应用之际,这个特定方向逐渐明朗:即算...【详细内容】
2023-12-26  Search: AIGC  点击:(49)  评论:(0)  加入收藏
抖音拿下首张AIGC系统软件著作权,生成式内容或受法律保护!概念股砸出“坑”
研究机构表示,2023年我国AIGC市场规模约为14.4万亿元。抖音AIGC系统软件著作权获登记批准12月20日,天眼查App显示,抖音视界有限公司“基于人工智能的内容生成系统”软件著作权...【详细内容】
2023-12-22  Search: AIGC  点击:(112)  评论:(0)  加入收藏
关于“AIGC是什么意思”
当谈到AIGC时,人们可能会有不同的理解和观点。AIGC可以指代多种概念,包括人工智能全球大会、人工智能全球中心、人工智能全球竞赛等。在不同的背景下,AIGC可能代表着不同的含义...【详细内容】
2023-12-05  Search: AIGC  点击:(85)  评论:(0)  加入收藏
AIGC创业公司还没盈利,微软Adobe已赚得盆满钵满
衡宇 萧箫 发自 凹非寺量子位 | 公众号 QbitAI一出奥特曼在OpenAI“来去之间”的戏码,以回归暂告一段落。过程很抓马,吃瓜群众很激动,当然了,最开心的还得是微软。不仅因为这出...【详细内容】
2023-11-24  Search: AIGC  点击:(81)  评论:(0)  加入收藏
“大模型+小应用” 京东云激发AIGC生产力
大模型全面落地下的首个11.11,AIGC掀起了新一轮智能应用潮流。数百个智能场景落地京东:京东云智能客服处理咨询超14亿次,自动为客户推荐“一键价保”等超337万次;京小智服务商家...【详细内容】
2023-11-17  Search: AIGC  点击:(184)  评论:(0)  加入收藏
信息流场景下的AIGC实践
一、个性化的标题生成个性化的标题生成,指使用用户内容以及个性化的信息生成针对不同用户或者不同应用场景的标题。主要使用场景有以下三种: 推荐场景:在推荐系统中,不同用户或...【详细内容】
2023-10-16  Search: AIGC  点击:(192)  评论:(0)  加入收藏
AIGC浪潮“卷”至广告业,AI营销到底靠不靠谱?
今年以来,AIGC浪潮席卷各行各业,尤其是在营销领域,几乎每个月都有公司展开新动作,例如在刚刚过去的9月,蓝标发布营销行业模型,另有数家传媒类A股上市公司已陆续推出AI工具。一方面...【详细内容】
2023-10-13  Search: AIGC  点击:(266)  评论:(0)  加入收藏
美图秀秀上车最新自研大模型,各类AIGC玩法可直接体验
图片来源:由无界 AI生成美图自研大模型3.0,正式发布!并且全面应用于美图旗下影像与设计产品。这是自美图大模型面世100天后的最新迭代。相较于最初版本,3.0版能够生成更加真实细...【详细内容】
2023-10-10  Search: AIGC  点击:(166)  评论:(0)  加入收藏
▌简易百科推荐
用户吐槽苹果Vision Pro:佩戴后头疼、眼睛疲劳、黑眼圈
快科技4月10日消息,据媒体报道,不少用户抱怨,佩戴苹果Vision Pro后,身体健康出现问题。某公司的营销主管Emily Olman表示,第一次佩戴Vision Pro后,她患上了“黑眼圈”。咨询公司Si...【详细内容】
2024-04-10    快科技  Tags:Vision Pro   点击:(2)  评论:(0)  加入收藏
AI是万灵药?Meta要把大模型塞进AR眼镜里
寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下...【详细内容】
2024-04-09    三易生活  Tags:AR眼镜   点击:(5)  评论:(0)  加入收藏
AI+数字人成为市场关注焦点,大屏AI数字人助力展厅设计创意升级
随着各行业产业的数字化转型加速,人工智能时代的到来,展馆展厅行业也步入数字时代,各式的展馆展厅设计在融合了全息投影、虚拟现实、数字沙盘、互动投影、互动桌面等多种技术后...【详细内容】
2024-04-09  世优科技虚拟人    Tags:数字人   点击:(4)  评论:(0)  加入收藏
近百万家公司抢滩,“定制分身”低至几千元 数字人“淘金热”迎来下半场
(开栏语:“大模界”是每日经济新闻推出一档专注生成式AI与大模型技术的前沿科技报道栏目。在这里,我们将聚焦生成式AI技术浪潮,展现从文字、图像、音频、视频的大模型如何编织数...【详细内容】
2024-04-07    每日经济新闻  Tags:数字人   点击:(2)  评论:(0)  加入收藏
Meta:Quest 手势追踪不会用于模拟手柄
IT之家 3 月 28 日消息,Meta Quest 用户期待的“空气手柄”功能可能要落空了。近日,Meta 的一位产品经理明确表示,手势追踪功能不会用于模拟传统的实体手柄控制器。据IT之家了...【详细内容】
2024-03-29    IT之家  Tags:Quest   点击:(8)  评论:(0)  加入收藏
月入25万,批量AI美女,收割中年男人的钱包
  文|刘奕琦  号称“最难被电商撬动”的中年男人们,拜倒在了AI美女们的石榴裙下。  “中年男人不如狗”这句话,一直被视为是中年男性在消费鄙视链里的真实写照。爱捯饬...【详细内容】
2024-03-22    电商在线  Tags:AI美女   点击:(7)  评论:(0)  加入收藏
你关注的网红博主 可能是“假人”
在社交平台上,卡塔琳娜是一位在中国生活了5年的俄罗斯女孩,今年1月开始发布视频,多数附带着商品链接。她拥有超过10万粉丝,看起来只是众多带货网红中的一个。但如果留意就会发现...【详细内容】
2024-03-22    中国宁波网  Tags:网红博主   点击:(12)  评论:(0)  加入收藏
数字人下半场:奔向“真”生产力
作者:产业家如果说2023年,大家关心数字人,更多在于好奇心和新鲜感。如今的2024年,人们则更加看重其是否真正解决行业中的某些痛点。 随着技术的深入发展,数字人正在成为生产生活...【详细内容】
2024-03-21    砍柴网  Tags:数字人   点击:(7)  评论:(0)  加入收藏
IDC:预计2028年全球VR/AR设备规模达2470万台
日前,IDC发布最新市场调研数据,2023年全球VR/AR设备出货量暴跌23.5%,不过IDC也表示伴随着苹果Vision Pro的大规模上市以及全球宏观经济的改善,预计2024年将迎来爆发,出货量预计增...【详细内容】
2024-03-20    PChome电脑之家  Tags:VR   点击:(14)  评论:(0)  加入收藏
虚拟偶像的崛起:科技与艺术的完美结合!
随着科技的飞速发展,我们见证了无数领域的巨大变革。其中,虚拟偶像的崛起是近年来最为引人注目的现象之一。这些虚拟人物不仅引领了新的潮流,还为艺术与科技的结合提供了无限...【详细内容】
2024-02-01    简易百科  Tags:虚拟偶像   点击:(116)  评论:(0)  加入收藏
站内最新
站内热门
站内头条