有限样本下的暗网指纹识别

VSole2021-11-10 19:06:57

简介

该文为发表于PETS 2021的GANDaLF: GAN for Data-Limited Fingerprinting。目前Tor是使用最广泛的匿名网络之一,虽然Tor具有一定的匿名性,但已经存在一些手段能够恢复有关Tor流量的部分信息。其中已有大量针对Tor网站指纹的研究。利用暗网网站指纹技术,能够通过Tor连接中发送和接收的流量模式来识别连接是否指向特定的目的地。由于大多数暗网网站会定期更新和修改,因此训练指纹识别分类器面临数据较少或者需要经常重新收集数据的问题。为此,在本篇论文中,作者提出了一种基于对抗生成网络的指纹识别方法:GANDaLF。GANDaLF旨在使用很少的训练样本,并通过使用对抗生成网络生成大量“假”数据来帮助训练深度神经网络来区分实际训练数据的类别。

方法

首先在数据集层面上,作者不仅关注模型在实验环境下的性能,更关注开放世界环境下的指纹分辨能力。因此做出两种假设,在封闭世界的假设下,受害者正在访问一个攻击者感兴趣并可以训练的一组固定站点,称为受监控的集合。相比之下,开放世界环境的假设下,还允许受害者访问非受监控集中的站点。此外,作者还将数据集分为只包含网站索引页和包含网站子页面数据两类。

之后,针对上述四种数据(是否假设为开放世界环境、是否包含网站子页面数据)集分别训练模型,进行实验。神经网络结构如下图所示。

该网络为作者优化过的SGAN网络,SGAN是对抗生成网络结合了半监督学习的一个变种。SGAN同时训练生成器与半监督式分类器,通过在无监督模式下的训练,使得网络能够从大量未标记的数据集中学习有用的特征提取功能,然后将这些特征用于监督模式下的分类任务,从而得到一个效果更好的半监督式分类器。SGAN的判别器通常为多分类,类型数量为N+1(N种有标签的类型和1种生成器伪造的假数据)。作者基于SGAN,并针对网络流量分类的特点对模型做出改进。由于网络流量并不像图像那样存在二维层面上的特征,因此作者使用更深的1D卷积结构对流量隐含特征进行提取,并尝试引入dropout、批归一化和不同的损失函数进行实验。

实验

作者主要针对GANDaLF的效果与相关工作进行对比。如下表所示,在封闭世界环境的假设下,针对只包含网站索引页的数据集的测试中,GANDaLF的综合效果不错,但是在任何一组测试中都没有取得完全击败相关工作的分类准确率。

相似的,在封闭世界环境的假设下,针对包含网站子页面的数据集的测试中,GANDaLF同样没有超过其相关工作。但是这组实验中,GANDaLF的速度快于第二名20%以上。

但是,在切换到开放世界环境的假设下(用户不仅会流量受监控的网站,还会浏览不受监控的网站),GANDaLF的表现很强。如下图所示,GANDaLF的效果明显优于在封闭世界假设下表现出色的TF和k-FP分类器。GANDaLF能够在保持不错的准确率的情况下保持查全与查准的平衡。

显然,开放世界环境的假设更加贴近现实情况,并且查全、查准也确实需要进行一定的取舍与平衡,不能简单地追求高准确率。由上述实验中可以看到,不同训练源的组合使GANDaLF能够从更广泛的角度进行学习,从而仅使用少量标记样本进行训练就可以进行更精确的网站指纹分类。相比之下,当使用少量训练样本时,有监督的方法由于学习能力受限于数据分布,从而导致性能显着降低。

暗网指纹识别
本作品采用《CC 协议》,转载必须注明作者和本文链接
该文为发表于PETS 2021的GANDaLF: GAN for Data-Limited Fingerprinting。目前Tor是使用最广泛的匿名网络之一,虽然Tor具有一定的匿名性,但已经存在一些手段能够恢复有关Tor流量的部分信息。其中已有大量针对Tor网站指纹的研究。利用网站指纹技术,能够通过Tor连接中发送和接收的流量模式来识别连接是否指向特定的目的地。由于大多数网站会定期更新
一种名为“RisePro”的新型信息窃取恶意软件正在通过由 PrivateLoader 安装付费 恶意软件分发服务运营的虚假破解站点进行分发。RisePro 旨在帮助攻击者从受感染的设备中窃取受害者的信用卡、密码和加密钱包。
网络研究院一种名为“RisePro”的新型信息窃取恶意软件正在通过由 PrivateLoader 安装付费 恶意软件分发服务运营的虚假破解站点进行分发。RisePro 旨在帮助攻击者从受感染的设备中窃取受害者的信用卡、密码和加密钱包。此外,Sekoia 发现 PrivateLoader 和 RisePro 之间存在广泛的代码相似性,这表明恶意软件分发平台现在可能正在传播自己的信息窃取程序,无论是为自身还是作为服务。另一种假设是,RisePro 是 PrivateLoader 的演变,或者是现在推广类似 PPI 服务的流氓前开发人员的创建。
Resecurity 的研究人员最近发现了一个新的网络钓鱼即服务平台 EvilProxy,该平台正在中大肆宣传。此前,针对 Twilio 的供应链攻击导致双因子验证代码泄露。EvilProxy 尝试使用反向代理与 Cookie 注入来绕过双因子认证,以此代理受害者的会话。
在过去的2023年里,Malwarebytes Labs的研究人员发现通过恶意广告实现网络攻击的活动数量有所增加,特别是通过搜索引擎投放的针对企业组织的恶意广告行为。如果要将社工活动包括进来的话,相当于是基于浏览器的攻击活动数量增加了不少。
依法从严打击侵犯公民个人信息犯罪是检察机关办案的政策导向。法院经审理认为,李某具有坦白情节,且自愿认罪认罚,对其依法从宽处理,以侵犯公民个人信息罪判处李某有期徒刑三年,缓刑三年,并处罚金。2021年6月23日,闵某将郭某杀害。此案中,闵某先后支付陈某甲39500元。案件审理期间,韦某主动退赔违法所得。韦某和按摩中心经营者被以侵犯公民个人信息罪追究刑责。
随着加密技术的广泛应用以及新型网络技术的不断更迭,网络结构日趋复杂,加密流量呈现爆炸式增长,尤其随着TLS1.3等加密协议的演进和推广,全加密时代悄然来临。加密技术在保护用户隐私的同时也深刻改变了网络安全威胁形势,让恶意服务有机可乘,而传统的检测技术路线在面对恶意加密流量时往往无能为力。在此背景下,基于加密流量的检测与防御势在必行。
网络空间测绘是2016年出现的一个概念
数据泄露事件频频发生,让撞库攻击事件也急剧上升。根据安全厂商Akamai的报告指出,2020年全球撞库攻击事件达到1930亿次,比2019年增加3.6倍。撞库攻击的增多,不仅在于数据泄露事件中被盗凭证的增加,另一重要原因在于该攻击自身的低成本与高回报。
VSole
网络安全专家