Price TAG:半自动的电子商务威胁TTP提取

VSole2022-03-15 18:23:41

简介

电子商务中的网络安全威胁体现在欺诈行为、声誉操纵等方面,这些攻击行为会对用户数据的完整性造成破坏,例如销售量膨胀,商品排名升级,或操纵搜索引擎的结果以在短时间内获得流量。如常见的刷销量行为,就是通过虚假订单伪造出高销售量来提高人气,从而促销某种目标商品,也被称作”拍A发B“。由于电子商务威胁不同于拒绝服务、入侵攻击等传统网络安全威胁,之前的研究工作对于识别这类威胁行为并不适用。因此,作者设计了TAG(TTP Semi-Automatic Generator)的新方法,提取电子商务领域的TTP。

电子商务TTP的示例

方法

上图是TAG的总体结构图,主要包含四个部分:语料库收集器、文本预处理器、主题词标识器、TTP实体识别器。

  1. 语料库收集:利用阿里的”先知“平台,从900多个网站中收集威胁文章,并与阿里合作,人工定义了34种电子商务TTP,如下表所示。利用这些TTP作为种子,以关键词匹配的方式收集电子商务威胁相关的页面。
  2. 文本预处理:首先,关键词匹配后的文章有可能存在重复,通过计算两篇文章的SimHash值的汉明距离比较它们的相似性,如果汉明距离大于2bits,则删除其中一篇。对于电子商务威胁的中文分词,jieba和LTP等工具都不能正确分词,因此作者设计了一种基于n-gram的邻居词频率统计方法来辅助分词。若相邻词的频率相等,则两个都丢弃,采用更长的n-gram继续统计;否则保留频率较高的那一个,如下图所示。
  3. 主题词标识:在这一场景中,文章的主题词一般与上述定义的34种TTP有相似的语义和结构,因此分别计算词汇的语义相似度和结构相似度,加权后取其中的最大值;其中语义相似度由词向量的余弦相似度得到,结构相似度由编辑距离得到。
  4. TTP实体识别:由于语料库中收集到的文章还包含了广告等其他内容,TTP在其中的分布比较稀疏,因此首先删除了文章中的不相关信息。预处理后,剩余的内容从语法结构入手,定义了6种规则来提取TTP实体。

实验

作者分两个时期共收集了22380篇文章作为实验数据集,使用分层抽样从每个时期中抽取500篇文章人工标记,再进行五折交叉验证来评估模型,各个部分的实验结果如下:

  • 预处理在识别:53.55%的准确率和83.12%的召回率;
  • 过滤不相关TTP句子:正确与错误的数量分别为483条和203条;
  • 主题词识别:49.33%的准确率和95.41%的召回率;
  • TTP识别:45.56%的准确率和88.47%的召回率;

从结果上看,这一算法可以达到较高的召回率,但代价则是准确率相对较低。

作者在自己收集的语料库中对比了几种方法的实验结果,如下图所示,作者的方法要优于其他一些主流的方法。

虽然作者的这一方法要比其他NLP方法有着更高的准确性和覆盖面,但攻击者也有可能通过省略某些词汇、调换黑话的顺序等方式来绕过模型的检测,同时对于人类理解而言不会有很大的影响,即模型的抗干扰能力还存在一定的改进空间。

电子商务
本作品采用《CC 协议》,转载必须注明作者和本文链接
不受信任的数据被注入 Web 应用程序,并诱使该应用程序执行命令和访问数据。XSS 是最普遍的安全风险之一。正确转义所有不受信任的数据并包括白名单输入验证,维护更新 Web 应用程序。在 DDoS 攻击期间,攻击者用虚假流量淹没接入路由器,直到系统过载并失败。DDoS 攻击涉及来自许多不同来源的协同攻击。缓解 DDoS 攻击的直接方法是监控传入流量。
电子商务中的网络安全威胁体现在欺诈行为、声誉操纵等方面,这些攻击行为会对用户数据的完整性造成破坏,例如销售量膨胀,商品排名升级,或操纵搜索引擎的结果以在短时间内获得流量。如常见的刷销量行为,就是通过虚假订单伪造出高销售量来提高人气,从而促销某种目标商品,也被称作”拍A发B“。由于电子商务威胁不同于拒绝服务、入侵攻击等传统网络安全威胁,之前的研究工作对于识别这类威胁行为并不适用。因此,作者设计了TA
虽然电子商务的增长改善了在线交易,但它也同样吸引了不良行为者的注意。电子商务网络犯罪报告显示,该行业是网络犯罪中最脆弱的行业之一。
巴西电子商务公司在错误配置Elasticsearch服务器后无意中暴露了近18亿条记录。
TeleSign的最新信任指数显示了为什么CIO、CISO及其团队必须首先将预防电子商务欺诈视为核心业务挑战,并考虑基于AI的技术如何提供帮助。客户的信任岌岌可危。
数据显示 ,网络攻击是在线零售商的日常现象,企业每月遭受约 206,000 次网络攻击。随着技术变得越来越复杂,零售商不应该问自己是否会成为网络攻击的目标。
研究人员发现了一个流氓 WordPress 插件,它能够创建假管理员用户并注入恶意 JavaScript 代码以窃取信用卡信息。
安全研究人员发现一个配置错误的云托管数据库泄露了超过 300,000 条记录,包括电子商务买家的敏感个人信息。
软件WAF由于功能及性能方面的缺陷,已经逐渐被市场所淘汰。纵观国内外的硬件WAF产品,通常一个产品会支持多种部署模式。前三种模式也被统称为在线模式,通常需要将WAF串行部署在WEB服务器前端,用于检测并阻断异常流量。WAF偷偷的代理了WEB客户端和服务器之间的会话,将会话分成了两段,并基于桥模式进行转发。后台服务器接收到请求后将响应先发送给WAF设备,由WAF设备再将应答发送给客户端。
随着互联网和电子商务的普及,中小型企业也逐渐意识到保护客户数据和建立信任关系的重要性。而目前在数据安全方面,最值得信赖的互联网协议之一是安全的超文本传输协议,也就是HTTPS。HTTPS是基于HTTP进行通信,同时利用SSL/TLS来加密HTTP数据的。因此为了保证隐私数据能加密传输,就要通过部署SSL证书来实现HTTPS加密。那么中小型企业网站在实现SSL证书加密时有什么需要注意的呢?具体请往下
VSole
网络安全专家