Facebook产品营销副总裁Graham Mudd在Facebook官网发文称,未来Facebook将研发一系列隐私增强技术(Privacy-enhancing technologies,简称PETs) ,使得Facebook在保障个人隐私的同时还能够做广告效果度量和优化,这其中广告主和平台任何一方都不能得到用户的个人信息。
PETs主要涉及到密码学和统计学技术。总体来说,这些技术能够通过最小化数据处理量来保护个人信息安全,与此同时保留广告度量、个性化等核心功能。这其中,Facebook主要介绍了三种常用技术:secure multi-party computation(安全多方计算技术,简称MPC)、on-device learning和differential privacy(差分隐私)。
- 安全多方计算(MPC)
安全多方计算(MPC)是一种密码学技术,即多方将各自数据分别加密,再进行交换与学习,从而实现对广告效果的度量与优化。在数据传输、存储、应用等过程中,数据全程处于加密状态,任何一方都不会看到其他方数据。
在广告效果度量场景中,以往,广告主会对数据加密,然后传输给平台方或第三方,而平台或第三方在接收到数据之后可以解密,从而获得洞察,这意味着至少其中一方会看到用户从点击到购买的全路径数据。
如果MPC技术得到应用,则意味着一方只能看到其所拥有的用户点击数据,另一方只能看到用户购买数据,在加密条件下,双方交换各自已经加密的数据包并对另一方数据再次加密,这样两个数据包都各自上了两道锁,保证双方最终除了匹配结果之外不会获得其他信息,也无需再将数据授权给其他方,从而降低数据隐私泄露风险。
而在广告优化场景中,例如广告主想知道点击用户在该品牌的平均消费金额,MPC技术也能实现在不泄露任何个人数据的情况下给到广告主最终计算结果。大致原理是,对每位转化用户的消费数据进行拆分,然后重新洗牌、聚合、加和,最终除以总人数得到平均消费金额。这样广告主既得到了想要的广告效果数据以优化后续投放策略,又保证了个人消费数据的安全。
Facebook透露,目前MPC技术已经开始投入使用。去年,其已经开始测试一个叫Private Lift Measurement的解决方案,其中包括利用MPC技术帮助广告主进行效果度量,预计明年就会面向全部广告主开放使用。此外,Facebook也已经推出了隐私计算开源框架,任何开发人员都可以使用 MPC 创建以隐私为中心的测量产品。
- On-device learning
On-device learning,即系统可直接在用户设备上基于历史数据来找到一些有用的模式,并通过不断学习优化算法模型,此过程无需再将个人数据发送到远程服务器或云,即可实现预测。例如如果爱健身的人群可能也是蛋白奶昔的潜在购买用户,那么On-device learning就能通过学习找出二者之间的关联模型,这一过程中,用户个人信息不会上传到Facebook的服务器,只会保留在设备上,避免了隐私泄露风险。
那么On-device learning又是通过什么原理来实现对隐私的保护的呢?
通俗来讲,在每个设备上,都有一个独立、安全的“小房子”,用来收集用户在各个APP内的数据,通常称之为Sandbox(沙箱)。
像APP下载、购买记录等数据都会保存在这里,不会与其他方共享。在沙箱里,系统就可以根据用户在设备上的一系列行为来学习得到一些模式,如一个人喜欢听摇滚乐,经常在晚上网购等,然后对这些模式进行汇总,保证其不会被识别。当有更新时,系统可直接更新模式,无需再去通过汇总个人数据来重新学习,这样虽然每一个设备只是完成了一次微小的模式更新,但成千上万个设备汇总起来就会生成一个安全、不可识别的报告,完成一次模型的优化,Facebook只需学习最终汇总成的模型,就能更好地为每个用户推荐匹配的广告。
总体来看,通过学习—汇总—预测的循环,On-device learning无需将用户数据外传就能实现较为精准的定向推荐。
事实上,这项技术已经在很多苹果设备上广泛应用了。不过根据Graham,目前On-device learning应用的最大挑战其实还是运营系统,平台能否利用所需的计算资源来执行,掌控权还在苹果手中。“如果未来可以围绕这些资源的访问和使用(以公平竞争的方式)建立一系列标准,那么就会很有意义。”
- Differential privacy(差分隐私)
差分隐私是保护个人数据被破解的一种技术手段,可以单独使用也可以与其他技术联合应用。基本原理就是在数据集中混入一定比例的“噪声”,这样就很难会利用第三方数据反向推导出个人信息。例如,Facebook上一则广告有118人在点击后进行了购买,那么差分隐私技术就会从中添加或抽取随机数量,最后使用该系统的人可能看到的数字会是120或是114。