wcheet [options] file
※ file には解析を開始するHTMLファイルをフルパスで指定します。
以下のオプションを指定できます。([]の中の値はデフォルト値です。)
-h, --help ヘルプを表示して終了する -a, --access-check .htaccessのアクセス判定を行う -r, --recursive 再帰的にリンクを辿る -L, --link-err-check リンク切れ検出を行う -I, --ip=IPADDR .htaccessのアクセス判定に使用するIPアドレス -D, --domain=NAME .htaccessのアクセス判定に使用するドメイン名 -u, --user ユーザー用ディレクトリについてもリンクを辿る -p, --parent 親ディレクトリについてもリンクを辿る -e, --extra ファイル名以外の情報も出力する -d, --depth=NUMBER 再帰的にリンクを辿る深さ [3] --size=NUMBER HTMLファイルの最大サイズ [10240000] --accept=LIST リストアップするファイルの拡張子 [html,htm,pdf] ※ 全ての場合は'*'とする --html=LIST HTMLファイルの拡張子 [html,htm] --element=LIST リンクを辿るHTMLの要素と属性の組み合わせ [a:href,frame:src,area:href] ※ 全ての場合は'*'とする --idrctv=LIST 無視するディレクティブ [AddType,ErrorDocument] --cache-in=FILE 読み込み用キャッシュファイル --cache-out=FILE 書き込み用キャッシュファイル Webサーバーの設定: --server-name=NAME WebサーバーのServerName --document-root=DIR WebサーバーのDocumentRoot --directory-index=NAME WebサーバーのDirectoryIndex [index.html] --user-dir=NAME WebサーバーのUserDir [public_html] --access-file-name=NAME WebサーバーのAccessFileName [.htaccess]
例 1: /var/www/html/foo.html からリンクしているページと ページを構成するファイルを全て抽出する % wcheet -u -p -e --accept='*' --element='*' /var/www/html/foo.html ※ 存在しないファイルには、行の先頭に '!' が付加されます。 例 2: /var/www/html/foo.html が外部サイトからアクセス可能かどうかを Webサーバー上の .htaccess ファイルを解析して調べる % wcheet -a -I 192.0.2.1 -D example.net /var/www/html/foo.html ※ ここでは、外部サイトのIPアドレスを 192.0.2.1、 ドメイン名を example.net としています。 ※ アクセス可能の場合は 'OK'、アクセス不可の場合は 'NG'、 エラーの場合は 'Err' と表示します。 例 3: 外部サイトからアクセス可能なページについて、 /var/www/html/foo.html から深さ5までリンクを辿ってリストアップする % wcheet -a -r -u -p -e -d 5 \ -I 192.0.2.1 -D example.net /var/www/html/foo.html ※ ここでは、外部サイトのIPアドレスを 192.0.2.1、 ドメイン名を example.net としています。 例 4: /var/www/html/foo.html から深さ5までリンクを辿って リンク切れ検出を行う % wcheet -L -d 5 --accept='*' --element='*' /var/www/html/foo.html ※ 存在しないファイルには、行の先頭に '!' が付加されます。Copyright(C) 2006 MURATA Yasuhisa. All rights reserved.