【技术分享】sqlmap源码解读(1)
介绍
作为web渗透界的神器之一,无论是挖掘src或者渗透测试,不少的师傅们都离不开这个工具。他的强大也不只是简单地自动化注入,后续文章我会逐渐带大家熟悉这个工具的原理。其实网上已有大佬做了很多的分析,我将更细致更基础地进行分析
当然,一开始就直接拿最新版本分析是不妥的,目前该工具已经趋于完善,内置各种插件脚本,直接阅读将会受到很大的影响,因此我找到一个比较老且稳定的版本
初始化
sqlmap全局变量如下
# 路径相关paths = advancedDict()# 配置相关conf = advancedDict()# 共享一些对象kb = advancedDict()# 临时对象temp = advancedDict()# 每个DBMS用到的语句queries = {}# 日志logger = LOGGER
全局变量使用的是自带dict和它实现了的advancedDict类型,具体代码并不是很复杂,初始化加入一个__initialised属性。在执行__init__的self.__initialised = True及之前时都会调用__setattr__,执行到第一个if条件进入,做到了在初始化的时候进行一些属性的赋值。后续以advancedDistObj.attr=value对advancedDictObj赋值时会直接走第2个和第3个条件。额,其实说这么多,sqlmap这样做是为了区别赋值方式,全局变量中凡是使用到advancedDict类型的在后续使用中只有advancedDistObj.attr=value这样的格式,而全局变量中的dict类型会使用dictObj[key]=value这样的格式
class advancedDict(dict): ...... def __init__(self, indict=None, attribute=None): ...... self.attribute = attribute dict.__init__(self, indict) self.__initialised = True ...... def __setattr__(self, item, value): if not self.__dict__.has_key('_advancedDict__initialised'): return dict.__setattr__(self, item, value) elif self.__dict__.has_key(item): dict.__setattr__(self, item, value) else: self.__setitem__(item, value)
main函数
# 在全局变量path中初始化一些路径相关(输出目录等)setPaths()# 打印banner信息banner()# 解析命令行输入参数cmdLineOptions = cmdLineParser()# 初始化init(cmdLineOptions)if conf.start: # 启动 start()
初始化部分代码量不小,简单概括如下:
- 合并命令行的一些参数
- 初始化日志相关
- 初始化全局变量conf和kb
- 过滤命令行参数的多于字符
- 设置Cookie/Referer/UA头
- 设置请求方法默认为GET
- 处理HTTP基础认证头
- 处理HTTP代理相关
- 是否已知DBMS
- 如果用户使用了谷歌语法这个功能进行处理
- 初始化urllib2的opener
- 尝试更新sqlmap版本和mssql的xml
- 解析query的xml
mssql.xml:mssql的xml是一个类似数据库的文件,保存了每个版本的mssql的指纹信息(为了方便具体版本的识别)
<root> <signatures release="2008"> <signature> <version> 10.00.1750 version> <servicepack> 0+Q956718 servicepack> signature> ...... signatures>root>
queries.xml:保存了注入需要用到的一些SQL语句
<dbms value="MySQL"> <cast query="CAST(%s AS CHAR(10000))"/> <length query="LENGTH(%s)"/> <isnull query="IFNULL(%s, ' ')"/> <delimiter query=","/> <limit query="LIMIT %d, %d"/> <limitregexp query="\s+LIMIT\s+([\d]+)\s*\,\s*([\d]+)"/> <limitgroupstart query="1"/> <limitgroupstop query="2"/> <limitstring query=" LIMIT "/> ......
准备工作
根据输入参数得到URL后做基本的校验
def initTargetEnv(): # 正则结合分割字符串方式拿到url的host,port等基本信息 parseTargetUrl() # 如果是GET注入的方式直接分割字符串拿到请求参数 # 如果是POST或HTTP头注入需要输入参数存在data文件,解析得到具体参数 __setRequestParams() # 处理恢复功能(如果程序中断下次启动用到) __setOutputResume()
检测是否连接成功(并没有采用requests而是使用原生urllib2)
checkConnection()
然后进行Cookie的封装,向用户询问使用新Cookie或提供的输入参数。如果没有进行Cookie注入会进行所有可能参数的注入检测,这也是核心的一部分
检测闭合符号
值得一看的是检测注入前先进行稳定性检测,延时请求三次目标页面,如果三次结果不一致认为是不稳定的
firstResult = Request.queryPage() time.sleep(0.5) secondResult = Request.queryPage() time.sleep(0.5) thirdResult = Request.queryPage() condition = firstResult == secondResult condition &= secondResult == thirdResult
检测每个参数是否动态,如果该参数不是动态的,也就是改变它不会造成页面改变,那么认为它不存在注入,将会检测下一个参数是否动态。而动态检测类似稳定性检测,都是三次请求页面对比结果
# 构造随机数 randInt = randomInt() # 这个agent相当于是做了个字符串拼接 payload = agent.payload(place, parameter, value, str(randInt)) dynResult1 = Request.queryPage(payload, place) # 如果改变这个参数但返回页面一致,认为它不是动态的 if kb.defaultResult == dynResult1: return False logMsg = "confirming that %s parameter '%s' is dynamic" % (place, parameter) logger.info(logMsg) payload = agent.payload(place, parameter, value, "'%s" % randomStr()) dynResult2 = Request.queryPage(payload, place) payload = agent.payload(place, parameter, value, "\"%s" % randomStr()) dynResult3 = Request.queryPage(payload, place) condition = kb.defaultResult != dynResult2 condition |= kb.defaultResult != dynResult3
检测到可能存在注入的参数后,将会进行核心函数checkSqlInjection,检测是否存在注入以及注入类型。注意这里的注入类型不是报错注入盲注这样的意思,而是检测它的闭合符号,是id=0这样的数字注入还是key=value这样的字符串注入,而字符串注入又分为单双引号。下文的parenthesis是处理括号问题,例如select * from table where id=((1));,默认范围是0-4,即没有括号或最多三个括号,一般不会有超过三个括号的情况
注意到首先构造一个true的payload,如果返回结果和不包含payload的页面相等,进入第一个if。这时候构造一个false的payload,将结果再次对比,如果false和true的结果不一致,可以初步确认存在注入
payload = agent.payload(place, parameter, value, "%s%s AND %s%d=%d" % (value, ")" * parenthesis, "(" * parenthesis, randInt, randInt)) trueResult = Request.queryPage(payload, place) if trueResult == kb.defaultResult: payload = agent.payload(place, parameter, value, "%s%s AND %s%d=%d" % (value, ")" * parenthesis, "(" * parenthesis, randInt, randInt + 1)) falseResult = Request.queryPage(payload, place) if falseResult != kb.defaultResult: ......
进行最终确认的代码如下,由于这里是判断数字型注入,注意上面的初步判断使用的是randint随机数字,而不是randstr随机字符串。下方随机的字符串构造的payload在存在数字注入的情况下不可能注入成功,根据这个条件最终确认数字注入
payload = agent.payload(place, parameter, value, "%s%s AND %s%s" % (value, ")" * parenthesis, "(" * parenthesis, randStr)) falseResult = Request.queryPage(payload, place) if falseResult != kb.defaultResult: ...... return "numeric"
单双引号类型的注入基本逻辑类似,最终确认payload如下,and后的条件也是不可能满足的
payload = agent.payload(place, parameter, value, "%s'%s and %s%s" % (value, ")" * parenthesis, "(" * parenthesis, randStr))
最终判断出注入类型会添加到injData中,如果有多个注入点会调用__selectInjection让用户自行选择一个
if injType: injData.append((place, parameter, injType)) ......if len(injData) == 1: injDataSelected = injData[0]elif len(injData) > 1: injDataSelected = __selectInjection(injData) checkForParenthesis()检查最终是几个括号进行闭合的。createTargetDirs()函数创建输出目录。action()是核心部分的函数if condition: checkForParenthesis() createTargetDirs() action()
检测DBMS
action()函数首先在确认目标DBMS,因为不同数据库的语句和注入方式都有区别,首先初始化Handler,最后调用getFingerprint()方法
conf.dbmsHandler = setHandler()......conf.dbmsHandler.getFingerprint()
setHandler()中具体识别的插件是这里的每个Map。遍历dbmsMap拿到Map插件,直接()调用,并在后续使用checkDbms()函数进行检测
dbmsMap = ( ( MYSQL_ALIASES, MySQLMap ), ( ORACLE_ALIASES, OracleMap ), ( PGSQL_ALIASES, PostgreSQLMap ), ( MSSQL_ALIASES, MSSQLServerMap ), ) for dbmsAliases, dbmsEntry in dbmsMap: if conf.dbms and conf.dbms not in dbmsAliases: debugMsg = "skipping to test for %s" % dbmsNames[count] logger.debug(debugMsg) count += 1 continue dbmsHandler = dbmsEntry() if dbmsHandler.checkDbms(): if not conf.dbms or conf.dbms in dbmsAliases: kb.dbmsDetected = True return dbmsHandler return None
注意到一个基类,各种数据库的识别插件都继承自此类,其中的escape和unescape主要做编码和解码的作用
class Fingerprint: @staticmethod def unescape(expression) @staticmethod def escape(expression) def getFingerprint(self) def checkDbms(self)
无需具体分析每一个DBMS,可以重点关注大家最常用的MySQL,它的初始化又调用了Enumeration,无需关心,只是简单的一个类,包含很多MySQL相关的属性
class MySQLMap(Fingerprint, Enumeration, Filesystem, Takeover): def __init__(self): self.excludeDbsList = MYSQL_SYSTEM_DBS Enumeration.__init__(self, "MySQL") unescaper.setUnescape(MySQLMap.unescape)
跟入MySQL的checkDbms(),首先就看到大家比较熟悉的一个细节,判断是否大于5.0,因为MySQL5.0以上有至关重要的information_schema
if int(kb.dbmsVersion[0]) >= 5: self.has_information_schema = True
初步判断版本逻辑,根据CONCAT语法逻辑进行判断。其中inject.getValue这个函数很复杂,后续分析,现在认为它是根据注入的语句返回注入的结果即可。这里有一个小坑:randInt * 2是什么意思?如果randInt是1,那么答案应该是11而不是2,因为randInt = str(randomInt(1))
randInt = str(randomInt(1))query = "CONCAT('%s', '%s')" % (randInt, randInt) if inject.getValue(query) == (randInt * 2): logMsg = "confirming MySQL"
使用LENGTH函数再次确认
query = "LENGTH('%s')" % randInt if not inject.getValue(query) == "1": warnMsg = "the back-end DMBS is not MySQL"
尝试从information_schema获取数据,如果可以拿到,说明是MySQL5.0以上
if inject.getValue("SELECT %s FROM information_schema.TABLES LIMIT 0, 1" % randInt) == randInt: setDbms("MySQL 5") self.has_information_schema = True
MySQL6某些小版本的检测。例如PARAMETERS表存放这存储过程和存储函数的参数信息以及存储函数的返回值,及我们一般意义上的存储过程和函数;PROFILING表提供了语句分析信息。这两个表分别在6.0.5和6.0.3版本提供
if inject.getValue("SELECT %s FROM information_schema.PARAMETERS LIMIT 0, 1" % randInt) == randInt: if inject.getValue("SELECT %s FROM information_schema.PROFILING LIMIT 0, 1" % randInt) == randInt: kb.dbmsVersion = [">= 6.0.5"] else: kb.dbmsVersion = [">= 6.0.3", "< 6.0.5"]
后续的代码可以跳过了,都是根据information_schema中某些表是否存在进行精确版本判断
最后一个else使用了我们常用的函数self.banner = inject.getValue("VERSION()")
判断结束后,会在conf.dbmsHandler.getFingerprint()中格式化输出,而格式化输出中有再次校验DBMS的一个函数__commentCheck,这里用到一个技术正是大家绕WAF常用的:内敛版本注释。首先/* NoValue */请求确认响应和默认响应一致,然后构造内敛版本注释判断语句是否能正常执行,对版本信息进行再次确认
query = agent.prefixQuery("/* NoValue */")query = agent.postfixQuery(query)payload = agent.payload(newValue=query)result = Request.queryPage(payload) if result != kb.defaultResult: warnMsg = "unable to perform MySQL comment injection" logger.warn(warnMsg) return None # MySQL valid versions updated at 10/2008versions = ( (32200, 32233), # MySQL 3.22 (32300, 32354), # MySQL 3.23 (40000, 40024), # MySQL 4.0 (40100, 40122), # MySQL 4.1 (50000, 50072), # MySQL 5.0 (50100, 50129), # MySQL 5.1 (60000, 60008), # MySQL 6.0)......randInt = randomInt()version = str(version)query = agent.prefixQuery("/*!%s AND %d=%d*/" % (version, randInt, randInt + 1))query = agent.postfixQuery(query)payload = agent.payload(newValue=query)result = Request.queryPage(payload) if result == kb.defaultResult: ...... 确认完DBMS之后,将进行具体的注入,下一篇文章将分析,顺便分析至关重要的inject.getValue是如何做到传入一个注入表达式得到结果的
