wcheet [options] file
※ file には解析を開始するHTMLファイルをフルパスで指定します。
以下のオプションを指定できます。([]の中の値はデフォルト値です。)
-h, --help ヘルプを表示して終了する
-a, --access-check .htaccessのアクセス判定を行う
-r, --recursive 再帰的にリンクを辿る
-L, --link-err-check リンク切れ検出を行う
-I, --ip=IPADDR .htaccessのアクセス判定に使用するIPアドレス
-D, --domain=NAME .htaccessのアクセス判定に使用するドメイン名
-u, --user ユーザー用ディレクトリについてもリンクを辿る
-p, --parent 親ディレクトリについてもリンクを辿る
-e, --extra ファイル名以外の情報も出力する
-d, --depth=NUMBER 再帰的にリンクを辿る深さ [3]
--size=NUMBER HTMLファイルの最大サイズ [10240000]
--accept=LIST リストアップするファイルの拡張子
[html,htm,pdf]
※ 全ての場合は'*'とする
--html=LIST HTMLファイルの拡張子
[html,htm]
--element=LIST リンクを辿るHTMLの要素と属性の組み合わせ
[a:href,frame:src,area:href]
※ 全ての場合は'*'とする
--idrctv=LIST 無視するディレクティブ
[AddType,ErrorDocument]
--cache-in=FILE 読み込み用キャッシュファイル
--cache-out=FILE 書き込み用キャッシュファイル
Webサーバーの設定:
--server-name=NAME WebサーバーのServerName
--document-root=DIR WebサーバーのDocumentRoot
--directory-index=NAME WebサーバーのDirectoryIndex [index.html]
--user-dir=NAME WebサーバーのUserDir [public_html]
--access-file-name=NAME WebサーバーのAccessFileName [.htaccess]
例 1: /var/www/html/foo.html からリンクしているページと
ページを構成するファイルを全て抽出する
% wcheet -u -p -e --accept='*' --element='*' /var/www/html/foo.html
※ 存在しないファイルには、行の先頭に '!' が付加されます。
例 2: /var/www/html/foo.html が外部サイトからアクセス可能かどうかを
Webサーバー上の .htaccess ファイルを解析して調べる
% wcheet -a -I 192.0.2.1 -D example.net /var/www/html/foo.html
※ ここでは、外部サイトのIPアドレスを 192.0.2.1、
ドメイン名を example.net としています。
※ アクセス可能の場合は 'OK'、アクセス不可の場合は 'NG'、
エラーの場合は 'Err' と表示します。
例 3: 外部サイトからアクセス可能なページについて、
/var/www/html/foo.html から深さ5までリンクを辿ってリストアップする
% wcheet -a -r -u -p -e -d 5 \
-I 192.0.2.1 -D example.net /var/www/html/foo.html
※ ここでは、外部サイトのIPアドレスを 192.0.2.1、
ドメイン名を example.net としています。
例 4: /var/www/html/foo.html から深さ5までリンクを辿って
リンク切れ検出を行う
% wcheet -L -d 5 --accept='*' --element='*' /var/www/html/foo.html
※ 存在しないファイルには、行の先頭に '!' が付加されます。
Copyright(C) 2006
MURATA Yasuhisa.
All rights reserved.