自研机器学习助SOC捕获网络入侵者

VSole2022-12-05 21:51:37

法国一家银行的信息安全团队利用日志数据训练内部开发的机器学习模型,发现此模型可检测基于规则的安全设备无法捕获的三类新型数据渗漏。

下周举行的2022年欧洲黑帽大会上,法国农业信贷集团基础设施平台(CA-GIP)网络安全工程师Carole Boijaud将登台详细介绍这项技术,议程题为“阈值适用于旧日威胁:解密用AI和机器学习增强SOC检测”。该团队从日志文件获取每日汇总数据,从中提取感兴趣的特征,以之找出该银行Web流量中的异常。 

这项研究专注如何更好地检测数据渗漏,并由此发现了该公司旧有系统未能检测到的攻击。

Boijaud表示:“我们实现了我们自己的威胁模拟,模拟了我们想要看到的东西,所以我们能够看到我们流量中能发现什么。检测不到特定威胁时,我们尝试找出是哪里不一样,试图搞清到底发生了什么。”

机器学习已经成为网络安全行业风潮,一些公司和学术研究人员仍在用自己的数据做实验,想要找出可能潜藏在噪音里的威胁。比如说,微软就在利用来自40万客户的遥测数据识别特定攻击团伙,并采用这些分类预测攻击者未来的行动。其他公司也在用遗传算法等机器学习技术帮助检测云计算平台上权限过多的账户。

Boijaud表示,用自研系统分析自家公司的数据有一系列好处。安全运营中心(SOC)可以更好地了解自己的网络流量和用户活动,安全分析师也能够更深入全面地了解攻击自家系统的各类威胁。法国农业信贷集团固然有自己的平台小组管理基础设施、处理安全事件和进行调查研究,但规模较小的企业亦可从应用机器学习和数据分析中获益。

“开发自己的模型没那么昂贵,我相信大家都能做到。”Boijaud称,“只要能访问数据,有了解日志的人员,就可以建立自己的管道,至少开始时是这样。”

找对监测数据

该网络安全工程团队使用名为聚类的数据分析技术来识别需要跟踪的重要特征。其中最重要的几个特征包括域名流行程度、系统访问特定域名的次数,以及访问请求用的是IP地址还是标准域名。

Boijaud表示:“基于数据表示和我们对机器日常行为的持续监测,我们已经能够识别这些特征。机器学习就是数学和模型,但重要的是你如何表示数据,而数据表示需要理解这些数据,也就是说我们需要了解这一领域的人手,比如网络安全工程师。”

选择了对分类而言最重要的特征后,该团队运用名为“孤立森林”的异常检测算法来找出数据中的离群值。孤立森林算法根据数据的值将数据组织成多棵逻辑树,然后分析这些逻辑树,确定异常值的特征。该方法易于扩展,可以处理大量特征,而且相对轻量。

Boijaud团队的初步成果是让模型学会了检测三种新型渗漏攻击,这三种攻击是该公司用现有安全设备检测不出来的。Boijaud表示,总的来说,可以检出大约一半的渗漏攻击,且误报率很低。

不是所有的网络异常都是恶意的

网络工程师还必须找到确定异常指证恶意攻击还是良性流量的方法。发往第三方跟踪服务器的广告标签和请求也会被此系统捕获,因为这些流量通常匹配异常的定义,但可以在最终结果中滤掉这些内容。

自动化安全事件的初步分析可以帮助公司更快分类和识别潜在攻击。Boijaud表示,安全团队可以自己进行这些研究,从而深入了解自己的数据,更便于确定哪些是攻击而哪些可能是良性流量。

CA-GIP计划扩展这一分析方法,使之不仅仅用于检测利用Web攻击进行的数据渗漏。

大数据机器学习
本作品采用《CC 协议》,转载必须注明作者和本文链接
这篇技术干货 带你了解深信服的AI技术
近日,Mintegral通过了2022年网络安全等级保护第三级测评,表明Mintegral的信息安全管理能力,已达到国内非银行机构的最高标准。据了解,Mintegral在算法技术上持续投入,是首批将DCO动态创意优化技术与互动创意相结合的广告平台之一。在每次广告请求筛选广告时,Mintegral的算法会自动增加一个创意组合维度、产生更多的候选结果,让Mintegral的投放效率具备一定的比较优势。
近年来,移动金融发展迅速,新业态、新模式层出不穷。用户通过智能手机终端进行投资理财、消费借贷、交易支付等金融业务操作,大大提升了金融业务的便捷性。各商业银行也都推出了手机银行、直销银行、微信银行等多元化移动金融渠道。
近日,国际权威IT研究机构Gartner发布《2022中国网络安全技术成熟度曲线》报告。快速满足等级保护要求,为600多朵私有云提供安全资源池服务。可视化的安全监控与态势感知,统一管理提升运维处置效率。态势感知建立基于全国的纵横联动态势感知Gartner认为,中国态势感知技术是安全信息和事件管理平台的现代、集中和发展版本。数据分类分级对数据安全、数据治理和合规项目至关重要。
Github渗透测试文档资料集合
没有数据安全就没有国家安全,数据安全治理作为数据安全体系重要的组成部分引起了各行各业越来越多的关注。从数据环境下海量数据面临的安全风险出发,结合数据在使用过程中的安全需求,给出了一种动态防御的数据安全治理架构,并对该架构下的关键技术进行了研究。该架构能够为数据安全治理提供体系化安全治理思路,其中的关键技术可以为该架构的实现提供有效支撑。 《中华人民共和国数据安全法》(下文简称:数据安全法)的正
数据质量的高度敏感要求,数据质量的优劣极大程度影响AI模型的应用效果,必须进行多维度的质量检查,以及对实时性高要求,实时数据分析、推荐和预警时,数据源更强调具备实时性接入能力。最后是AI引擎的自我迭代阶段。达到AI模型上线后的持续迭代优化。考虑到数据训练规模扩张,数据类型异构,数据噪声指数级增加,对此AI 引擎能针对性地进行数据自动发现。
数据暴政与数据光明
2022-06-09 11:26:54
背景:现如今,空前且大规模的人类行为数据的可用性正在深刻地改变着我们所处的世界,经济学、公共卫生学、医学、生物学、城市科学等在这一趋势中都受到影响。各个组织、公民个人正在积极尝试、创新和改编算法决策工具以了解全球人类行为模式,并为解决社会重要性问题提供决策支持。
此前,本公号发表过的关于数据要素治理的相关文章包括: 《非个人数据在欧盟境内自由流动框架条例》全文中文翻译(DPO沙龙出品) 简析欧盟《数字市场法》关于数据方面的规定 数据流通障碍初探——以四个场景为例 对“数据共享合法化”的分析与思考系列之一:以《关于欧洲企业间数据共享的研究》为起点 对“数据共享合法化”的分析与思考 系列之二 ——欧盟B2B数据共享的案例研究 对“数据共享合法化”的分析与思考
VSole
网络安全专家