Adobe 发布开源工具 Stringlifier 识别随机生成的字符串
Adobe已经发布了一个名为Stringlifier的开源工具,该工具允许用户识别任何纯文本中随机生成的字符串,该工具可用于清理日志。
Stringlifier工具是用Python编写的,它使用机器学习来识别插入普通文本中的随机字符序列。
开源工具可用于出于多种目的分析日志,例如研究意外暴露的凭证。
“ Stringlifier是我们最新的开源项目,它可以帮助您解决这一通常很困难的任务。该项目是一个开放源代码的python软件包,可让您检测类似于任何纯文本中随机生成的字符串的代码/文本。它使用机器学习来区分正常字符序列和随机字符序列。它也可以适用于更细粒度的分类(密码,API密钥,哈希等)。” 阅读Adobe发布的帖子写道。
Stringlifier能够在源代码或配置文件中查找API密钥,哈希,随机生成的字符串,包括密码,日志。
“字符串分类器–是用于检测随机字符串和散列文本/代码的python模块。” Adobe在Github上发布的描述中写道。
“典型的使用场景包括:
- 清理应用程序或安全日志
- 检测意外暴露的凭据(复杂的密码或API密钥) “
Stringlifier工具的源代码可从Adobe的公共GitHub存储库中获得。Adobe还发布了一个Python包安装程序,包括一个预先训练好的模型。
您可以通过pip-installation快速使用stringlifier:
$ pip安装stringlifier
API示例:
来自 stringlifier。api 导入 Stringlifier
stringlifier = Stringlifier()
小号 = stringlifier(“com.docker.hyperkit -A -u -F虚拟机/ 0 / hyperkit.pid -c 8 -m 8192M -b 127.0.0.1 --pass = \” NlcXVpYWRvcg \” -s 0:0,hostbridge -s 31,lpc -s 1:0,virtio-vpnkit,path = vpnkit.eth.sock,uuid = 45172425-08d1-41ec-9d13-437481803412 -U c6fb5010-a83e-4f74-9a5a-50d9086b9“)
之后,
s
应为:
'/System/Library/DriverExtensions/AppleUserHIDDrivers.dext/AppleUserHIDDrivers com.apple.driverkit.AppleUserUSBHostHIDDevice0 <RANDOM_STRING>'
您还可以选择查看完整的标记化和分类输出:
小号,令牌 = stringlifier(“com.docker.hyperkit -A -u -F虚拟机/ 0 / hyperkit.pid -c 8 -m 8192M -b 127.0.0.1 --pass = \” NlcXVpYWRvcg \” -s 0:0 ,hostbridge -s 31,lpc -s 1:0,virtio-vpnkit,path = vpnkit.eth.sock,uuid = 45172425-08d1-41ec-9d13-437481803412 -U c6fb5010-a83e-4f74-9a5a-50d9086b9“,return_tokens = 真)
s
与以前相同,tokens
将包含以下数据:
[[('0' ,33,34,'<NUMERIC>' ),
('8' ,51,52,'<NUMERIC>' ),
('8192' ,56,60,'<NUMERIC>' ),
('127.0.0.1' ,65,74,'<IP_ADDR>' ),
('NlcXVpYWRvcg' ,83,95,'<RANDOM_STRING>' ),
('0' ,100,101,'<NUMERIC>' ),
('0' ,102,103,'<NUMERIC>' ),
('31' ,118,120,'<NUMERIC>' ),
('1' ,128,129,'<NUMERIC>' ),
('0' ,130,131,'<NUMERIC>' ),
('45172425-08d1-41ec-9d13-437481803412' ,172,208,'<UUID>' ),
( 'c6fb5010-a83e-4f74-9a5a-50d9086b9',212,244, '<UUID>')]]
Adobe已使用该工具识别数据集中的随机字符串,以及另一个名为Tripod的开源工具。
Adobe透露,用于处理长字符串并将其转换为数字形式的多种方法在遇到随机字符串时会遇到问题。
专家们将所有随机字符序列替换为 ;以便更容易地对类似类型的命令行进行分组,即使它们在参数中使用了随机hash。
Adobe总结道:“我们希望你觉得stiringlifier有用。整个源代码都可以在Adobe的GitHub存储库中找到。您还可以在该存储库中找到来自整个Adobe安全团队的所有其他开源项目。”
