您当前的位置:首页 > 资讯 > 科技

只需 15 分钟,iPhone 就能「复制」你的声音

时间:2023-06-08 10:15:33  来源:中国家电网   作者:

史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。

但那并不是霍金自己的声音。

在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。

到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。

最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。

只需 15 分钟「调教」,就能生成你的声音

  ▲ 图自 Fastcompany  ▲ 图自 Fastcompany

在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。

我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。

据介绍,iphone、iPad 和 mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。

相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。

另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。

结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。

用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?

素材随机化。

在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。

物理距离屏障。

在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。

在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。

语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。

即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。

如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。

自己的声音,失去了才懂多重要

人是感性的生物,而声音是很强烈的情感触发器。

有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。

这听起来有点抽象。

但当我们失去它时,重要性就变得显而易见了。

2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。

ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。

Brunton 的行动很果断,确诊后马上找公司去做语音生成。

来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。

那家公司用的是一种名为「单元选择(unit selection)」技术。

简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。

  ▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》  ▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》

这种技术生成的语音能听清,但会有点电音,听起来不太自然。

结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。

困在这个声音里,Brunton「只会在必要的时候说话,不再是因为想说话而说话」。

从前和丈夫打闹聊天的心情消失了,Brunton 也不怎么愿意参加多人对话。

即便是说「我爱你」,用一个不像自己的声音来说,意义也似乎被削弱了。

六个月后, Brunton 和丈夫争取回了最初录制的语音素材,找了另一家公司,用 AI 技术合成了一个更像她自己的声音:

这听起来也许有点傻,但重新获得自己的声音让我更有自信了。

在波士顿儿童医院负责「增强沟通」项目的 John M. Costello 留意到,那些采用了更真实生成语音的病人,似乎更能够和亲近的人建立深厚的联结。

2022 年圣诞节,「重获新声」的 Brunton 还用语音录制的一段节日祝语。

然而,圣诞刚过,Brunton 就染上了新冠,最后在今年 2 月离世了。

她离开的那晚,丈夫 David 一整夜都握着她的手:

我们有两年时间来告别。

我们说好了,我们要说尽一切我们想说的。

难以想象,如果 Brunton 后来没换上更像自己的声音,她又是否能自在地说出想说的一切。

无障碍思维点亮灵感,AI 燃起生产力

我一直认为,无障碍设计所挖掘的,其实就是人类多样性创造的想象力资源。

我们去到和自己有着截然不同生活体验的人面前,聆听更少被诉说的故事和体验,创造出我们之前没想象过,但却能对更多人友好的的新生活方式。

Personal Voice 能让失语的 ALS 患者重新获得自己的声音;也可以帮助在经历「刀片嗓」的我用自己的声音去和其他人对话;甚至,我也很难避免会去想象,是否应该用这为自己「备份」声音留给亲近的人,以免哪天自己会突然离世。

而 AI 技术,就是实现这些想象力生产力。

正如杜编辑之前说的,虽然不赶生成式 AI 的热闹,但苹果一直都把 AI 用来提升用户体验 —— 提升效率,保护隐私。

提升效率,在于提升本地执行的机器学习算法和模型。

除了 Personal Voice 以外,苹果这次预览的另一个无障碍功能 Point and Speak 也采用了本地设备端的机器学习技术。

未来,视障用户在 iPhone 自带的放大器里,结合 Point and Speak 和旁白功能,就能凭自己手指把 iPhone 变成「点读机」—— 点到哪儿,让 iPhone 给你把文字读到哪儿。

去年的「门检测」功能道理也类似,让设备端的机器学习帮视障用户识别出门,并朗读出门上面的信息和周围的标识。

至于隐私,按乔布斯说的,就是 「如果你需要他们(用户)的数据,那就向他们(用户)请求。每一次都如此。」

这在无障碍设计方面也尤其重要 —— 因为这些功能设计起源就是服务被所谓「常规设计」忽略的人,常常都是更弱势的群体,因此更有必要确保这些用户的隐私不受侵害。

在这个语境下,我们也可开启更多关于数据应用权和透明度的讨论。

苹果这次做 Personal Voice 时,和帮助 ALS 患者的非盈利机构 Team Gleason Foundation 合作。

  ▲ Team Gleason Foundation CEO Blair Casey(右)

 

  ▲ Team Gleason Foundation CEO Blair Casey(右)

该机构的 CEO Blair Casey 一直也在推动语音生成公司设定一套标准录制素材设定,让用户能直接录这部分素材,并体验不同公司生成出来的语音效果,而不是像现在一样「盲赌」。

同时,Casey 也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了),以免他们未来想把这些数据用在其他技术上:

如果更好的技术出来了,你会不想试一试吗?

如果你没法拿回自己的语音素材,你就没法去试。

AI 也许是我们时代最强的生产力。

但是,这力该怎么使,也许以人为本的无障碍设计能给它不少指引。



Tags:声音   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除。
▌相关推荐
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。但那并不是霍金自己的声音。在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己...【详细内容】
2023-06-08  Tags: 声音  点击:(0)  评论:(0)  加入收藏
【今日视点】◎本报记者 张佳欣1970年4月,披头士乐队解散,数百万歌迷们伤心不已。50多年后的今天,人工智能(AI)正在将“逝去的记忆”复活,重新创作和重新想象披头士乐队的演唱。...【详细内容】
2023-06-08  Tags: 声音  点击:(1)  评论:(0)  加入收藏
原标题:93万亿重磅,最新权威发声!中国基金报 米洛  93万亿A股如何再上台阶?权威声音来了摘要中国证监会党委委员、副主席王建军:不造假、不背信、强主业、谋创新、重回报国务院...【详细内容】
2023-05-28  Tags: 声音  点击:(23)  评论:(0)  加入收藏
笔记本电脑 在使用的过程中,突然没有声音的话,对于人们来说会很麻烦。那么笔记本电脑没有声音了怎么恢复呢?下面小编为大家整理了笔记本电脑没有声音的恢复方法,一起来看看吧。...【详细内容】
2023-04-27  Tags: 声音  点击:(31)  评论:(0)  加入收藏
在需要进行音频的专业化处理时,很多小伙伴都会选择使用Adobe audition这款软件,在该软件中如果有需要我们还可以进行修音操作,让声音更好听。那小伙伴们知道Adobe audition中进...【详细内容】
2023-03-24  Tags: 声音  点击:(108)  评论:(0)  加入收藏
如果你在iPhone上使用TikTok、Instagram或任何其他社交媒体应用程序,现在你可以不用手指就能滚动屏幕了。没错,你所要做的就是用你的声音,你的iPhone就会为你滚动。这是一个非...【详细内容】
2023-03-17  Tags: 声音  点击:(85)  评论:(0)  加入收藏
​概括前一阵子想着语音识别作为物联网不可或缺的一部分,前提是获取到语音的声音数据。对于声音收录数字化,stm32有很多现成的样例,而OpenHarmony方面较少该方面的资料。便想着...【详细内容】
2023-03-16  Tags: 声音  点击:(58)  评论:(0)  加入收藏
如果您的计算机没有声音,您可以采取以下步骤来尝试解决问题:检查音量:这看起来很明显,但请确保您的计算机上的音量已调高且未静音。 在任务栏上寻找扬声器图标,并确保音量滑块未...【详细内容】
2023-03-06  Tags: 声音  点击:(46)  评论:(0)  加入收藏
很多小伙伴对电脑屏幕进行录制的时候,却发现自己辛苦录制的视频没有录到声音。录屏可以录声音吗?当然可以!只需要使用录屏软件进行录制就可以解决。还不知道录屏可以录声音的小...【详细内容】
2023-02-01  Tags: 声音  点击:(71)  评论:(0)  加入收藏
我们在使用手机过程中,经常会遇到的一个问题,那就是啊,我们的手机声音总是很小,音量总是不清晰,特别是在打电话的时候啊,一旦出现这些情况啊,就会导致我们听不清楚,然后呢,就容易把一...【详细内容】
2023-01-12  Tags: 声音  点击:(130)  评论:(0)  加入收藏
▌简易百科推荐
史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。但那并不是霍金自己的声音。在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己...【详细内容】
2023-06-08    中国家电网   Tags:声音   点击:(0)  评论:(0)  加入收藏
《科创板日报》6月7日讯(记者 黄心怡)今日(6月7日),华为全球智慧金融峰会2023在上海开幕。华为副董事长、轮值董事长、CFO孟晚舟在会上表示,当前,技术的奇点正在临近,生成式AI、云、...【详细内容】
2023-06-08    财联社  Tags:孟晚舟   点击:(1)  评论:(0)  加入收藏
智东西编译 | Glu编辑 | 李水青智东西6月6日消息,据路透社报道,在最近的非公开股票交易中,美国特斯拉公司创始人埃隆·马斯克(Elon Musk)旗下的脑机接口初创公司Neuralink...【详细内容】
2023-06-07    智东西  Tags:Nearalink   点击:(2)  评论:(0)  加入收藏
据华为中国官方微信号6月6日消息,第31届中国国际信息通信展日前在北京国家会议中心隆重举行,会议期间,华为面向全球发布首款800GE数据中心核心交换机——CloudEngine...【详细内容】
2023-06-07    每日经济新闻  Tags:交换机   点击:(4)  评论:(0)  加入收藏
 IMF第一副总裁戈皮纳特认为,ChatGPT等AI创新可能提高生产率和经济产出,但也带来“很大的”风险,各国应迅速草拟法规进行监管,不要重蹈应对制造业自动化淘汰工作不力的覆辙。 ...【详细内容】
2023-06-07    华尔街见闻  Tags:AI   点击:(3)  评论:(0)  加入收藏
今年3月以来,随着人工智能ChatGPT火爆全网,相关职位的需求量迎来爆发性增长。根据猎聘大数据研究院发布的《2023Q1就业趋势大数据报告》,从新发职位数量看,今年一季度AI大模型领...【详细内容】
2023-06-07    时代在线  Tags:AI行业   点击:(2)  评论:(0)  加入收藏
新浪科技讯 6月7日上午消息,在今日的华为全球智慧金融峰会上,华为常务董事、华为云CEO张平安发表演讲。他表示,金融数字化转型是从集中式走向分布式,分布式新核心要实现高性能、...【详细内容】
2023-06-07    新浪科技  Tags:GaussDB   点击:(4)  评论:(0)  加入收藏
IT之家 6 月 6 日消息,苹果在今天召开的 WWDC 2023 开发者大会上,在介绍 macOS Sonoma 过程中,宣布为为 Safari 浏览器引入多项改进和新功能。IT之家根据相关媒体报道,汇总信息...【详细内容】
2023-06-06    IT之家  Tags:Safari浏览器   点击:(7)  评论:(0)  加入收藏
苹果亮出M2系列芯片收官之作,统一内存再立大功!作者 | ZeR0编辑 | 漠影芯东西6月6日报道,今日凌晨,苹果公布了其M2家族的最后一款芯片猛兽——M2 Ultra。这是苹果迄...【详细内容】
2023-06-06    芯东西  Tags:苹果   点击:(8)  评论:(0)  加入收藏
新智元报道 编辑:编辑部【新智元导读】终于来了!苹果首款头显Vision Pro深夜登场,令人叹为观止的设计、无与伦比的交互,必将引领下一个十年智能终端设备新形态!苹果的头显,终于让...【详细内容】
2023-06-06    新智元  Tags:苹果Vision Pro   点击:(10)  评论:(0)  加入收藏
站内最新
栏目相关
  • · 只需 15 分钟,iPhone 就能「复制」你的声音
  • · 孟晚舟现身上海!华为“根技术”发力国产数据库
  • · 获批人体试验后,传马斯克的Nearalink估值达70亿美元
  • · 业界首款!华为发布多元算力数据中心交换机
  • · IMF二把手警告:AI可能“严重破坏”就业市场
  • · 谁在“追捧”AI行业:岗位需求暴涨,工作一年能赚五十万?
  • · 华为发布自研分布式数据库GaussDB 启动生态发展计划
  • · 苹果宣布新版Safari浏览器:增强隐私保护、支持创建多账号
  • · 苹果最强芯片深夜炸场!192GB统一内存,单台设备能跑AI大模型
  • · 7年憋出最强头显,苹果Vision Pro一夜封神!售价2万5,M2+R1双芯,革了计算机的命
  • · 一文读懂苹果 Vision Pro:最好最贵的头显,重新定义下一代计算
  • · 苹果首款头显 Vision Pro 正式发布!它是 iPhone 之后最重要的产品
  • · MR头显Vision Pro压轴,苹果用新系统、新硬件开启下一个十年
  • · 全新macOS亮相:新增游戏模式 提升Safari浏览器安全性
  • · 苹果公司推出市场期待已久的混合现实(MR)头戴式设备
  • · 苹果推出iPadOS 17:小组件更加丰富 升级对PDF文档支持
  • · 大事件!全国一体化算力调度平台来了,天翼云、华为云、阿里云已接入
  • · 苹果发布15英寸MacBook Air:搭载M2处理器 售价1299美元
  • · 云上鏖战:阿里云再降价,1个月内4家厂商跟进
  • · ChatGPT在前,华为盘古Chat在后
  • 站内热门
    相关头条
  • · 孟晚舟现身上海!华为“根技术”发力国产数据库
  • · 苹果最强芯片深夜炸场!192GB统一内存,单台设备能跑AI大模型
  • · 7年憋出最强头显,苹果Vision Pro一夜封神!售价2万5,M2+R1双芯,革了计算机的命
  • · 一文读懂苹果 Vision Pro:最好最贵的头显,重新定义下一代计算
  • · 全新macOS亮相:新增游戏模式 提升Safari浏览器安全性
  • · 苹果推出iPadOS 17:小组件更加丰富 升级对PDF文档支持
  • · 大事件!全国一体化算力调度平台来了,天翼云、华为云、阿里云已接入
  • · AI巨头们给白宫交卷:谷歌、OpenAI、牛津等12家顶尖机构联合发布「模型安全性评估框架」
  • · 阿里云正式发布“通义听悟” 首款面向消费者端产品
  • · 176比特!“祖冲之号”量子计算云平台今日上线
  • · 突发!ChatGPT 之父警告 AI 可能灭绝人类,350 名 AI 权威签署联名公开信
  • · 开源大模型新SOTA!支持免费商用,比LLaMA65B小但更强
  • · Meta继续与苹果“开战”?Quest 3或将成为苹果混合现实头显最大挑战者
  • · TikTok据悉正测试AI聊天机器人“Tako”,可帮助用户发现短视频内容
  • · 可直训ChatGPT类模型!华师大、NUS开源HugNLP框架:一键刷榜,全面统一NLP训练
  • · 微软全面更新AI产品线:ChatGPT可抓取必应搜索结果
  • · 让企业更易上手生成式AI!英伟达连宣多项重磅合作,从Azure云到本地化部署
  • · 微软吹响AI集结号:全面打通ChatGPT携手冲击谷歌
  • · ChatGPT重塑Windows!微软王炸更新:操作系统全面接入,Bing也能用插件了
  • · OpenAI正探索AI集体决策,提出类似维基百科条目模式
  • 站内头条