“赤裸”的网络社交:揭开社交网匿名用户的面具

作者:埃里卡•劳尼2009-06-0619:26:00发布于:博客中国分类:默认分类
0000

摘要:

打印收藏
选择字号:


研究者发现了一种在理应匿名的社交网络数据中识别个人的方法。


社交网络赚钱的一种方法就是与广告商以及那些有兴趣弄清楚消费者行为、并开发网络趋势的人共享用户的信息。


为了保护用户的隐私,社交网络通常承诺在共享数据之前删除“个人身份信息”。但是,德克萨斯大学奥斯汀分校(University of Texas at Austin)的研究人员发现,与其他网络资源那里获得的现成数据联合,这些匿名数据仍然有可能泄露用户的敏感信息。


在涉及图片共享网站Flickr以及微博客服务网站Twitter的测试中,简单地通过在匿名网络数据中搜索可识别样本,德克萨斯的研究人员就能够确定三分之一在两个网站上都拥有账号的用户。Twitter和Flickr都公开地展示用户的信息,因此研究人员将许多数据匿名以测试他们的算法。


研究人员想看看他们是否能够仅仅利用用户间的联系提取个人的敏感信息,哪怕姓名、地址等几乎所有形式的个人身份信息都已被删除。他们发现,他们可以做到,只要他们能将这些样本与来自其他可获得用户信息的社交网络图的样本进行比较。


这项研究的参与者、德克萨斯大学奥斯汀分校计算机科学教授维塔利•施玛蒂科夫(Vitaly Shmatikov)表示,从社交网络获得的数据——尤其是用户间的友谊样本——对广告商来说很有价值。大多数的社交网络都计划通过共享这些信息来赚钱,而广告商希望利用它,打个比方,找到一个特别有影响力的用户,以她为广告目标,进而到达她的朋友圈。但施玛蒂科夫表示,这些信息也使得网络变得易受攻击。“当你发布这些数据的时候,你必须保持社交网络的结构,”他说。“如果你不这么做,你发布数据所想达到的目的可能就是徒劳的。”


研究人员表示,找到非匿名的社交网络数据非常简单:许多网络如Twitter上的朋友关系被设置为默认公开。同时,努力创建一个全球“社交图”,例如OpenSocial,提供了更多的资源。研究人员的算法错误率仅为12%,哪怕社会关系样本截然不同:从Twitter到Flickr,只有14%的用户关系相重叠。


“你周围的网络结构如此丰富,而且有这么多不同的可能性,即使参与网络的人有上百万,结果都以我们周围不同的网络告终,” 施玛蒂科夫说,“当你处理充足而又复杂的人类行为的时候,无论你谈论的是人们的购买行为还是他们看的电影,或者——在这个案例中——他们交的朋友以及他们在社交方面的行为,人们往往是很独特的。每个人都会做一些古怪的、个性的事情,最终,这会被清晰地识别。”


为了给这个算法一个起点,研究人员还需要从一个匿名的社交网络图中确定一些用户。但他们表示,在许多社交网络上,这很容易。例如,Facebook的部分用户选择将他们的个人资料公开,而攻击者就可以以此作为起点。在他们的试验中,研究人员发现,他们只需要确定30个人就能够运行涉及10万网络用户甚至更多人的算法。


研究人员还表示,该算法用了可行的最小量数据,在实践中,决定好的调查还能发现更多。“假如我们真的使用了(名字和地址)删除后通常会留下的信息,那么这个攻击就会强大得多,”施玛蒂科夫说。“所以,我们真正展示的是最小量,就足够了。”


“这是重要的研究,” 亚历山德罗•阿奎斯蒂(Alessandro Acquisti)说,他是卡内基梅隆大学(Carnegie Mellon University)信息技术与公共政策副教授,也是一个网络隐私专家。该研究强调了看似不重要的数据确实为攻击者提供了一个揭露真正敏感信息的手段。例如,技术上这个算法能利用用户最喜爱品牌的名字,以及一起去音乐会的朋友,从理应匿名的信息中解码敏感的细节,如性取向。阿奎斯蒂相信,这个结果描绘了关于互联网隐私未来的暗淡图画。“没有彻底的匿名,”他说。“那是不可能的。”


施玛蒂科夫认为,技术上没有解决这个问题的方法。他建议,隐私法和企业行为可能都需要改变,要认识到没有办法将社交网络数据匿名。用户也应当首先决定是否允许共享他们的数据,施玛蒂科夫说。






本文作者:埃里卡•劳尼

文本出处:博客中国

链接地址:http://boyuan.blogchina.com/729243.html

00
打印收藏
看这篇文章的人还看了什么
精华推荐
    正在为您准备内容……
精彩图文
正在为您准备内容……

网站定位 历史由来 发展历程 管理团队 联系主编 友情链接 联系我们 广告服务 诚聘精英

Copyright 2001 - 2012 blogchina.com, All Rights Reserved
增值电信业务经营许可证编号:B2-20100256    京ICP证050706 京公网安备110108902019号
客户服务热线:400-101-8080