简介

kali系统自带的一款工具,会根据网页的内容,自动生成字典。

详解

cewl -h查看帮助文档。

┌──(root㉿kali)-[/usr/share/wordlists]
└─# cewl -h
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Usage: cewl [OPTIONS] ... <url>

    OPTIONS:
        -h, --help: Show help.
        -k, --keep: Keep the downloaded file.
        -d <x>,--depth <x>: Depth to spider to, default 2.
        -m, --min_word_length: Minimum word length, default 3.
        -o, --offsite: Let the spider visit other sites.
        --exclude: A file containing a list of paths to exclude
        --allowed: A regex pattern that path must match to be followed
        -w, --write: Write the output to the file.
        -u, --ua <agent>: User agent to send.
        -n, --no-words: Don't output the wordlist.
        -g <x>, --groups <x>: Return groups of words as well
        --lowercase: Lowercase all parsed words
        --with-numbers: Accept words with numbers in as well as just letters
        --convert-umlauts: Convert common ISO-8859-1 (Latin-1) umlauts (ä-ae, ö-oe, ü-ue, ß-ss)
        -a, --meta: include meta data.
        --meta_file file: Output file for meta data.
        -e, --email: Include email addresses.
        --email_file <file>: Output file for email addresses.
        --meta-temp-dir <dir>: The temporary directory used by exiftool when parsing files, default /tmp.
        -c, --count: Show the count for each word found.
        -v, --verbose: Verbose.
        --debug: Extra debug information.

        Authentication
        --auth_type: Digest or basic.
        --auth_user: Authentication username.
        --auth_pass: Authentication password.

        Proxy Support
        --proxy_host: Proxy host.
        --proxy_port: Proxy port, default 8080.
        --proxy_username: Username for proxy, if required.
        --proxy_password: Password for proxy, if required.

        Headers
        --header, -H: In format name:value - can pass multiple.

    <url>: The site to spider.

参数讲解

-h、 --help显示帮助
-k、 --keep保留下载的文件
-d,--depth探测网站路径的深度,默认值为2
-m、 --min_word_length最小单词长度,默认值为3
-o、 --offsite访问其他站点
--exclude包含要排除的路径列表的文件
--allowed路径必须匹配才能遵循的正则表达式模式
-w、 --write将输出写入文件
-u、 --ua<agent>要发送的用户代理
-n、 --no words不输出单词列表
-g,--groups同时返回单词组
--lowercase小写所有已分析的单词
--with-numbers接受带数字和字母的单词
--convert-umlauts转换常见的ISO-8859-1(拉丁语-1)元音变音(ä-ae,ö-oe,ü-ue,ß-ss)
-a、 --meta包括元数据
--meta_file file元数据的输出文件
-e, --email包括电子邮件地址
--email_file<file>电子邮件地址的输出文件
--meta temp dir<dir>exiftool在解析文件时使用的临时目录,默认为/tmp
-c、 --count显示找到的每个单词的计数
-v、 --verbose显示详细信息
--debug额外的调试信息
--auth_type摘要或基本
--auth_user身份验证用户名
--auth_pass身份验证密码
--proxy_host代理主机
--proxy_port代理端口,默认8080
--proxy_username代理的用户名(如果需要)
--proxy_password代理的密码(如果需要)
--header,-H格式为name:value-可以传递多个

实例

┌──(root㉿kali)-[~]
└─# cewl -d 0 -m 8 http://onlinebooks.library.upenn.edu/
CeWL 5.5.2 (Grouping) Robin Wood (robin@digi.ninja) (https://digi.ninja/)
Listings
Everything
centered
February
Subjects
Everybody
Libraries
FEATURES
Celebration
ARCHIVES
Language
Specialty
Involved
Progress
Requested
Ockerbloom
onlinebooks
copyrights
licenses

结语

注意通过 -d 参数控制探测网站路径的深度。如果网站比较大,速度很慢,需要很长时间。