原来用户隐私是这样被泄露:超八成搜索网站将信息出售

VSole2022-09-15 08:05:11

互联网时代给用户带来了极大地便利,但也让个人隐私信息无处躲藏。打开电商购物平台,APP的精准推荐总是让人感到不安;打开搜索平台,跳出的智能搜索记录着浏览行为;打开娱乐软件,推荐算法让用户逐渐沉迷其中......

虽然“隐私”在数字化的世界已经无处安放,但我们却很少去认真思考,隐私究竟是怎样被泄露的?

近日,诺顿LifeLock实验室研究后发现,超过8成带有搜索栏的网站会将访问者的搜索字词泄露给谷歌等在线广告商。

很明显这是在赤裸裸地侵犯用户隐私,并公然将敏感信息泄露给庞大的第三方服务商,借助这些信息,谷歌等在线广告商可以提供有针对性的广告或跟踪用户的网络行为。这些数据甚至有可能在这些服务商之间共享,又或者是多次转手出售给更多的企业,由此带来的恶果是,用户的隐私信息将会一直存在互联网上,一直被曝光。

虽然一些网站可能会在其用户政策中声明这种做法,但访问者通常不会阅读这些内容,并认为他们在嵌入式搜索字段中输入的信息是与大数据代理隔离的。

用爬虫发现信息泄露

为了研究用户隐私信息泄露的普遍程度,诺顿LifeLock实验室开发了一个基于Chrome 浏览器的网络爬虫。该爬虫可以使用前100万个网站内部的搜索功能并执行搜索,最后搜索后捕获所有网络流量,以此查看用户的搜索词会流转到哪里。

为了区别于其他的普通搜索,实验室使用了一个特定的搜索词“jellybeans”,以确保可以在网络流量中轻松找到测试的搜索词。

众所周知,一个典型的 HTTP 网络请求由三部分组成:URL、Request Header 和 payload。HTTP 请求标头是浏览器自动发送的元数据(见下文),有效负载是脚本或表单请求的附加数据,可能包括更详细的跟踪信息,例如浏览器指纹或点击流数据。

CNN 加载的广告的 HTTP 网络请求

在实际研究中,安全研究人员在网络请求的Referer 请求标头、URL 和有效负载中寻找关键词“jellybeans”。

结果令人感到非常惊讶。在具有内部站点搜索功能的顶级网站中,安全研究人员发现,81.3%的网站都在以某种形式向第三方泄露搜索字词:75.8% 的网站通过Referer标头,71% 的网站通过URL,21.2%的网站通过有效载荷。这也就意味着网站通常会以多个向量泄露关键词。

研究人员强调,八成只是最低的数字,因为他们仅在三个特定位置查找“jellybeans”搜索字符串,还有不少有效载荷被混淆以避免被工具检查,因此有效载荷的实际数量将会更高。

鉴于如此严峻的结果,安全研究人员很好奇这些网站是否都告知用户,其搜索关键词将会被发给第三方服务商。事实上,自欧洲通用数据保护条例 (GDPR) 和加利福尼亚州消费者隐私法 (CCPA) 通过以来,许多网站都更新了各自的隐私政策,那么又有多少网站明确告知了这些内容?

为此安全研究人员再次使用爬虫爬取了隐私政策,并建立了一个人工智能逻辑来阅读隐私政策,结果发现只有13% 的隐私政策明确提到了用户搜索词的处理,如此之低的比例再次让安全研究人员感到震惊。这不仅侵犯了用户隐私,而且还侵犯了用户的知情同意权。

隐私泄露隐私
本作品采用《CC 协议》,转载必须注明作者和本文链接
近日,APP用户隐私保护问题再次受到关注。当前,医疗APP过度收集信息、泄露隐私等现象日益常见,民众对此关注度持续升高。有专家表示,医疗APP获取的隐私信息范围大到惊人,远超出国家规定范围。互联网诊疗发展势头迅猛,通过移动终端开展诊疗也是必然趋势,作为互联网诊疗的重要载体,医疗APP有望迎接井喷式发展。
作为近年来才被提出来的新技术,隐私计算目前仍处于高速发展和不断完善的阶段。隐私计算架构的主要环节包括隐私信息抽取、场景描述、脱敏和销毁等操作、保护方案选择、保护效果评估、侵权取证与溯源等。因此,隐私计算的全生命周期保护理论与方法在数据交易中将发挥不可替代的重要作用。另外,隐私计算的核心目标是在减少隐私泄露风险的同时,最大限度地提升数据可用性。
近日,“发原图或暴露隐私”话题冲上微博热搜。一时间,保护个人隐私信息再次得到广泛关注。潘博文提醒,“所以在拍摄过程中去掉地理位置信息确实能够提高隐私安全性,但也不能一劳永逸。”鉴于工作中常见的情况,潘博文提示,即使互联网平台遵守合规要求,重视用户的隐私安全和数据安全,用户因为自身原因导致的个人隐私泄露风险问题依然会存在。
德国汉堡大学的研究人员进行了一项现场实验,捕获了数十万路人的WiFi连接探测请求,以此探究哪些隐私信息是在用户无法察觉的情况下泄露出去的。 众所周知,WiFi探测是智能手机和调制解调器/路由器之间建立连接所需的双边通信的一部分。在日常生活中,智能手机会一直搜索可用的WiFi网络并自动连接那些可连接的信号。
再进一步说,今后将要发生的事情,大数据还是有可能知道。如果构成“满意画像”的素材确实已经证实,至少主体是事实,“人肉搜索”就成功了。其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。历史地来看,人类在自身隐私保护方面,整体处于优势地位,在网络大数据挖掘之前,“隐私泄露”并不是一个突出的问题。因此,必须多管齐下。
一起涉及盗取儿童隐私的案件被曝光。不仅如此,免费WiFi也被证实可以在一天内定位六万次。这些事件引发了公众对个人信息保护的关注和讨论。这些情况不仅是隐私泄露的问题,也可能威胁到孩子的安全和健康。在这种情况下,WiFi公司需要确保用户隐私得到有效的保护。政府、技术公司和公民社会将共同努力,确保公民受到充分保护,以免受到黑客和第三方软件的威胁。因此,我们需要规范市场,强化监管,设立严格的行业标准。
德国汉堡大学的研究人员进行了一项现场实验,捕获了数十万路人的WiFi连接探测请求,以此探究哪些隐私信息是在用户无法察觉的情况下泄露出去的。 众所周知,WiFi探测是智能手机和调制解调器/路由器之间建立连接所需的双边通信的一部分。在日常生活中,智能手机会一直搜索可用的WiFi网络并自动连接那些可连接的信号。
伴随着数字时代的快速发展,用户隐私保护意识正在觉醒,对于隐私保护关注度明显上升。与此同时,全球也拉开了隐私保护的大潮流,从GDPR到个人信息保护法,隐私问题已经成为互联网科技巨头必须直面的“深坑”。
摘要:数字基础设施的发展加速了个人隐私数据在机器学习中的应用。随着机器学习即服务的市场规模逐步扩大,服务提供商和用户在双向获利的同时也面临着严重的隐私泄露风险。因此,安全推理作为隐私保护机器学习的一个分支,成为科学界和工业界的研究热点。安全多方计算是安全推理最重要的密码学工具。从机器学习推理中潜在的隐私问题出发,引入安全多方计算技术,进一步对基于安全多方计算实现的安全推理框架进行分析研究,重点分析
VSole
网络安全专家