AI的下一站

时间：2020-03-11 10:57:27 来源：苏宁金融研究院作者：

我们处在一个智能变革的时代，人工智能技术正在“赋能”各行各业。大数据就像新能源，AI算法就像发动机，装载了大数据和人工智能技术的企业就像搭上了一班通往未来的快速列车，把竞争对手远远地甩在后面。

一

隐私

然而，这样的快速发展不是没有代价的。我们每个人的手机号、电子邮箱、家庭地址和公司地址经纬度坐标、手机识别码、消费记录、App使用记录、上网浏览记录、搜索引擎结果的点击习惯、刷脸记录、指纹、心跳等等这些信息都是我们不愿意轻易给出的隐私数据，但在AI时代，这很可能已经成为某个公司用来训练AI算法的数据集中的一条。

正是众多不起眼的一条条个人隐私数据，构成了足够多的训练集，让AI从中学习到认知能力，让从未跟我们谋面的AI算法认识、了解我们，知道我们的喜好和动机，甚至还认识我们的家人、朋友。我们的隐私便是实现这些智能的“代价”。

当然，这个代价并不一定是你愿意拱手付出的。

那如何保护隐私？我不用行吗？

你以为关闭手机GPS就无法定位你的位置？你的手机还有陀螺仪、内置罗盘、气压计等装置，还是可以用来定位你的位置。只要使用手机，就不存在绝对的隐私保护。

对于很多手机应用来说，要么不用，用了就很难避免泄露隐私，比如很多APP必须用手机号注册，或者需要手机验证才能继续使用，还有的需要刷脸验证等等。那么，个人想保护隐私能做什么？什么也做不了，加上AI算法的黑盒性质，我们甚至对于AI背后的逻辑和动机一无所知。

一

监管

隐私保护靠个人防护真的很难实现，需要强有力的法律法规来限制。

2018年5月25日，欧盟的《通用数据保护条例》（GDPR）正式生效，这是在欧盟范围内的一个数据保护监管框架，这是目前最完善、最严格的隐私保护规定。根据DLA Piper公布的数据，在不到两年的时间内，GDPR已产生1.14亿欧元的罚款，其中开出的最大罚单是法国依据GDPR对谷歌罚款5000万欧元，理由是谷歌在向用户定向发送广告时缺乏透明度、信息不足，且未获得用户有效许可。下图是GDPR生效以来至2020年1月份欧盟各个国家罚款的金额分布图。

对于企业，GDPR要求在收集用户的个人信息之前，必须以“简洁、透明且易懂的形式，清晰和平白的语言”向用户说明将收集用户的哪些信息、收集到的信息将如何进行存储、存储的信息将会被如何使用，并告知企业的联系方式。

对于个人，GDPR赋予数据主体七项数据权利：知情权、访问权、修正权、删除权（被遗忘权）、限制处理权（反对权）、可携带权、拒绝权。目前GDPR在真实地影响到我们每个人的生活，最直观的影响就是当你浏览网页的时候，你会发现经常遇到网站弹出类似下图的提示，这是网站基于信息透明性的规定，向你征询信息收集的许可。

欧盟的GDPR具有全球影响力，它让用户对自己的个人数据有绝对的掌控权，让全球在发展新技术的同时必须开始关注隐私问题，世界各国已经纷纷出台自己的数据保护法规。

关于隐私保护，一切才刚刚开始。

欧盟在上个月正式启动了称为“打造欧洲数字未来”的新战略，打算通过制定一系列针对AI、隐私和安全的法规，成为AI发展的全球领导者。该战略的启动也被看成是在应对美国和中国的AI崛起。

可以预见，关于AI的隐私安全与监管将逐渐成为重点话题，实际上，就像欧盟委员会副主席Margrethe Vestager说的：“人工智能本身并没有好坏之分，而是完全取决于人们为什么以及如何使用它。让我们尽可能做到最好，控制人工智能可能给我们的价值观带来的风险——不伤害，不歧视。”

保护隐私已经成为AI发展不可绕过的“槛”，是AI技术的难题，也是AI良性发展的契机。

三

趋势

可以说，保护隐私的各种法规的出台必然是未来不可避免的趋势，这势必让企业的数据收集、使用及流通的合规成本大幅增加，也容易让企业内部或者企业间形成数据孤岛问题，制约企业获取数据价值。因此，保护隐私的AI技术的落地使用成为AI领域最亟待实现的目标。

保护隐私的AI主要通过数据加密、分布式计算、边缘计算、机器学习等多种技术的结合来保护数据安全，近期比较热门的有Differential Privacy（差分隐私）、FederatedLearning（联邦学习，也叫联盟学习、联合学习、共享学习）。

保护隐私不是说完全不收集数据，而是要通过技术的手段防止个人隐私数据的泄露。差分隐私是一种数学技术，比如，假设要分析数据集并计算其统计数据（例如数据的平均值、方差、中位数、众数等），如果通过查看输出，我们无法分辨原始数据集中是否包含了任何个体的数据，那么这种算法就被称为差异私有。

举个非常简单的例子，假设你的工作部门每个月都会用一个表格统计部门每个人的工资发放金额，除了制表人，别人无法查看这个表格，只能通过一个查询函数S知道这个表的总额，某个月你调去了别的部门，那么别人就可以通过上个月表格A，和这个月表格B来知道你的工资，道理很简单，只需用S(A)减去S(B)。B表格称为A表格的相邻数据集，它俩只相差一条数据，差分隐私技术就是要让相邻数据集的查询结果差不多，从而无法推出个人的信息来，这个差不多的程度可以看作隐私保护的力度。苹果和Facebook已经使用这种方法来收集聚合数据，而不需要识别特定的用户。MITTechnology Review将差分隐私技术列为2020全球十大突破性技术之一。

联邦学习采用了分布式机器学习方法，近年来越来越受欢迎，该技术假设用户数据不会被存储到中心化的服务器，而是私有的、保密的，仅存储在个人的边缘设备上，比如手机，因此与传统机器学习方法相比，联邦学习从根本上增强了用户隐私。联邦学习不依赖从用户设备端收集的数据来训练，而是在用户移动设备端训练AI模型，然后将训练得到的参数信息传输回一个全局模型，这个过程不需要用户数据离开个人设备。

从近两年在arXiv（一个提交论文预印版的平台）上提交的论文数可以看出，该技术发展的快速趋势：

四

巨头的技术布局

从去年起全球最流行的两个机器学习框架，TensorFlow和PyTorch都增加了联邦学习等解决方案来保护隐私。

（1）google

联邦学习的概念最早是由Google在2017年首次引入，去年又发布了TensorFlow Federated（TFF）框架，利用Tensorflow的机器学习框架简化联邦学习。

如下图所示，基于TFF框架搭建的学习模型在众多手机（如手机A）上进行本地化模型训练，更新权重并聚合（步骤B），进而更新提升后的全局模型（模型C），将全局模型再应用到各手机终端来提升算法应用效果。

（2）Facebook

为了在保护隐私的机器学习领域取得进展，去年Facebook旗下优秀的深度学习框架PyTorch与OpenMined宣布开发一个联合平台的计划，以加速隐私保护技术的研究。

OpenMined是一个开源社区，专注于研究、开发和升级用于安全、保护隐私的AI工具。OpenMined发布了PySyft，是第一个用于构建安全和隐私保护的开源联邦学习框架。

PySyft很受欢迎，在Github已经拥有5.2k个Star，目前支持在主要的深度学习框架（PyTorch、Tensorflow）中用联邦学习、差分隐私和加密计算（如多方计算，同态加密），实现将隐私数据与模型训练解耦。

五

国内发展现状

国内的AI巨头们也早已开启保护隐私的技术布局，特别是金融领域，金融领域由于监管严格，数据的隐私性要求极高，因此，金融机构一方面在保护隐私数据方面面临技术难题，另一方面由于金融数据的孤立性，“数据孤岛”问题导致金融机构无法发挥出数据的真正价值。

国内多家金融机构以及金融科技公司已经尝试在获客、授信、风险控制等方面，利用联邦学习解决数据隐私的合规问题和数据分享的数据孤岛问题，最大化的发挥金融数据价值。

目前国内关于保护隐私的监管还不够成熟，个人和企业对于隐私保护的意识还不强。随着全球环境中对保护隐私的关注逐渐加强，以及保护隐私的AI技术的发展，我相信AI技术终究会向着更好的方向发展，希望通过科学家们的努力，AI的黑盒不会是潘多拉之盒。

本文由“苏宁财富资讯”原创，作者为苏宁金融研究院研究员李加庆

Tags：AI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com)，我们将及时更正、删除，谢谢。

▌相关推荐

2021又一款Ps智能Ai修饰插件Retouch Pro来了！小白也变修图大神

Retouch Pro是一款优秀的图像修饰插件，帮助ps用户更快地进行图像照片的修饰。由于其强大的人工智能系统，您可以轻松就获得专业的效果，并且比以往的手动更快，效果更好，操作更简单...【详细内容】

2021-12-27　　Tags: AI 点击:(7)　　评论:(0)　　加入收藏

下一代 CSS：@container

Chrome 正在试验 CSS @container 查询器功能，这是由 Oddbird 的 Miriam Suzanne 和一群网络平台开发者支持的 CSS 工作组 Containment Level 3 规范。@container 查询器使我...【详细内容】

2021-12-23　　Tags: AI 点击:(8)　　评论:(0)　　加入收藏

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

作为数据科学家或机器学习从业者，将可解释性集成到机器学习模型中可以帮助决策者和其他利益相关者有更多的可见性并可以让他们理解模型输出决策的解释。在本文中，我将介绍两个...【详细内容】

2021-12-17　　Tags: AI 点击:(16)　　评论:(0)　　加入收藏

JetBrains全新数据科学IDE DataSpell正式发布

JetBrains 宣布，全新数据科学 IDE DataSpell 已正式发布！DataSpell 是 JetBrains 的新 IDE，专为参与探索性数据分析和 ML 模型原型设计的人员而设计。DataSpell 在一个符合人体...【详细内容】

2021-12-15　　Tags: AI 点击:(25)　　评论:(0)　　加入收藏

关于苹果耳机AirPods固件升级最新版

AirPods固件升级最新版。没有什么可可以说的，赶紧生吧，感觉很完美。重低音加强隔音加强。看来苹果要出新耳机了，如果你还想换耳机苹果，你是苹果手机就在等等，相信在明年的五月份...【详细内容】

2021-12-14　　Tags: AI 点击:(16)　　评论:(0)　　加入收藏

一文看懂"async"和“await”关键词是如何简化了C#中多线程的开发过程

一文看懂"async"和“await”关键词是如何简化了C#中多线程的开发过程当我们使用需要长时间运行的方法（即，用于读取大文件或从网络下载大量资源）时，在同步的应用程序中，应用程序本...【详细内容】

2021-12-01　　Tags: AI 点击:(24)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

基于算法的业务或者说AI的应用在这几年发展得很快。但是，在实际应用的场景中，我们经常会遇到一些非常奇怪的偏差现象。例如，Facebook将黑人标记为灵长类动物、城市图像识别系统...【详细内容】

2021-11-08　　Tags: AI 点击:(32)　　评论:(0)　　加入收藏

白帽黑客如何使用Baidu搜索引擎高级搜索技巧

一、背景介绍在网上冲浪少不了用到搜索引擎，而很多朋友都习惯把Google视为第一个选择对象。当然Google无论在搜索速度还是结果关联性方面都是十分优秀的。但百度（http://www.b...【详细内容】

2021-11-05　　Tags: AI 点击:(31)　　评论:(0)　　加入收藏

gmail谷歌邮箱账号注册教程，轻松解决手机号码无法用于验证问题

由于一些特殊原因，使用国内手机号码注册谷歌邮箱会有各种限制，最常见的一种就是此电话号码无法用于进行验证，这就让人很无语了，很多朋友都卡在了这里。本期就针对国内手机号码注...【详细内容】

2021-10-27　　Tags: AI 点击:(39)　　评论:(0)　　加入收藏

李开复：AI自动化、先进计算架构等4个领域存在巨大机会

新京报贝壳财经讯（记者罗亦丹）10月25日，创新工场董事长兼首席执行官李开复在2021科大讯飞全球1024开发者节上表示，AI自动化、先进计算架构、新能源技术和生命科学技术四个领域...【详细内容】

2021-10-26　　Tags: AI 点击:(31)　　评论:(0)　　加入收藏

▌简易百科推荐

可解释的AI (XAI)：如何使用LIME 和 SHAP更好地解释模型的预测

2021-12-17　　deephub　　　　Tags:AI 　点击:(16)　　评论:(0)　　加入收藏

AI系统中（机器学习算法）导致偏差的原因总结

2021-11-08　　数据学习DataLearner　　　　Tags:机器学习　点击:(32)　　评论:(0)　　加入收藏

人工智能会超过人类吗？顶尖科学家：人工智能在常识判断方面具有局限

11月2日召开的世界顶尖科学家数字未来论坛上，2013年诺贝尔化学奖得主迈克尔·莱维特、2014年诺贝尔生理学或医学奖得主爱德华·莫索尔、2007年图灵奖得主约瑟夫·斯发斯基、1986年图灵奖得主约翰·霍普克罗夫特、2002...【详细内容】

2021-11-03　　张淑贤　　证券时报　　Tags:人工智能　点击:(39)　　评论:(0)　　加入收藏

火爆业界的边缘计算，到底是什么？

鉴于物联网设备广泛部署、5G快速无线技术闪亮登场，把计算、存储和分析放在靠近数据生成的地方来处理，让边缘计算有了用武之地。边缘计算正在改变全球数百万个设备处理和传输...【详细内容】

2021-10-26　　　　计算机世界　　Tags:边缘计算　点击:(45)　　评论:(0)　　加入收藏

这725个机器学习术语表，太全了

这是几位机器学习权威专家汇总的725个机器学习术语表，非常全面了，值得收藏！英文术语中文翻译 0-1 Loss Function 0-1损失函数 Accept-Reject Samplin...【详细内容】

2021-10-21　　Python部落　　　　Tags:机器学习　点击:(43)　　评论:(0)　　加入收藏

程序员10 个入门级的机器学习开源项目

要开始为开源项目做贡献，有一些先决条件：1. 学习一门编程语言：由于在开源贡献中你需要编写代码才能参与开发，你需要学习任意一门编程语言。根据项目的需要，在后期学习另一种语言...【详细内容】

2021-10-20　　TSINGSEE青犀视频　　　　Tags:机器学习　点击:(37)　　评论:(0)　　加入收藏

Logistic Regression：最基础的神经网络

SimpleAI.人工智能、机器学习、深度学习还是遥不可及？来这里看看吧~ 从基本的概念、原理、公式，到用生动形象的例子去理解，到动手做实验去感知，到著名案例的学习，到用所学来实现...【详细内容】

2021-10-19　　憨昊昊　　　　Tags:神经网络　点击:(47)　　评论:(0)　　加入收藏

直击痛点 NLP技术的价值和落地｜超级观点

语言是人类思维的基础，当计算机具备了处理自然语言的能力，才具有真正智能的想象。自然语言处理（Natural Language Processing, NLP）作为人工智能（Artificial Intelligence, AI）的核心技术之一，是用计算机来处理、理解以及运...【详细内容】

2021-10-11　　　　36氪　　Tags:NLP 　点击:(49)　　评论:(0)　　加入收藏

边缘计算是个啥？为什么说发展5G离不开它？

边缘计算是什么？近年来，物联网设备数量呈线性增长趋势。根据艾瑞测算， 2020年，中国物联网设备的数量达74亿，预计2025年突破150亿个。同时，设备本身也变得越来越智能化，AI与互联网在...【详细内容】

2021-09-22　　汉智兴科技　　　　Tags: 　点击:(55)　　评论:(0)　　加入收藏

学了这些基础算法，人工智能就算入门了

说起人工智能，大家总把它和科幻电影中的机器人联系起来，而实际上这些科幻场景与现如今的人工智能没什么太大关系。人工智能确实跟人类大脑很相似，但它们的显著差异在于人工智能...【详细内容】

2021-09-17　　异步社区　　　　Tags:人工智能　点击:(57)　　评论:(0)　　加入收藏

推荐资讯

聊聊如何自定义数据脱	河南人到底有多爱吃面
人称“犬中四煞”的4	离婚后，约定每月给孩子
“三皇五帝”分别是哪	印度低种姓群体如何翻
日本研发“飞行摩托”	2021年Steam最畅销游