wcheet : 使用方法

書式

wcheet [options] file

※ file には解析を開始するHTMLファイルをフルパスで指定します。

オプション

以下のオプションを指定できます。([]の中の値はデフォルト値です。)

-h, --help            ヘルプを表示して終了する
-a, --access-check    .htaccessのアクセス判定を行う
-r, --recursive       再帰的にリンクを辿る
-L, --link-err-check  リンク切れ検出を行う
-I, --ip=IPADDR       .htaccessのアクセス判定に使用するIPアドレス
-D, --domain=NAME     .htaccessのアクセス判定に使用するドメイン名
-u, --user            ユーザー用ディレクトリについてもリンクを辿る
-p, --parent          親ディレクトリについてもリンクを辿る
-e, --extra           ファイル名以外の情報も出力する
-d, --depth=NUMBER    再帰的にリンクを辿る深さ [3]
    --size=NUMBER     HTMLファイルの最大サイズ [10240000]
    --accept=LIST     リストアップするファイルの拡張子
                      [html,htm,pdf]
                          ※ 全ての場合は'*'とする
    --html=LIST       HTMLファイルの拡張子
                      [html,htm]
    --element=LIST    リンクを辿るHTMLの要素と属性の組み合わせ
                      [a:href,frame:src,area:href]
                          ※ 全ての場合は'*'とする
    --idrctv=LIST     無視するディレクティブ
                      [AddType,ErrorDocument]
    --cache-in=FILE   読み込み用キャッシュファイル
    --cache-out=FILE  書き込み用キャッシュファイル

Webサーバーの設定:
    --server-name=NAME       WebサーバーのServerName
    --document-root=DIR      WebサーバーのDocumentRoot
    --directory-index=NAME   WebサーバーのDirectoryIndex [index.html]
    --user-dir=NAME          WebサーバーのUserDir [public_html]
    --access-file-name=NAME  WebサーバーのAccessFileName [.htaccess]

使用例

例 1: /var/www/html/foo.html からリンクしているページと
      ページを構成するファイルを全て抽出する

    % wcheet -u -p -e --accept='*' --element='*' /var/www/html/foo.html

    ※ 存在しないファイルには、行の先頭に '!' が付加されます。

例 2: /var/www/html/foo.html が外部サイトからアクセス可能かどうかを
      Webサーバー上の .htaccess ファイルを解析して調べる

    % wcheet -a -I 192.0.2.1 -D example.net /var/www/html/foo.html

    ※ ここでは、外部サイトのIPアドレスを 192.0.2.1、
       ドメイン名を example.net としています。
    ※ アクセス可能の場合は 'OK'、アクセス不可の場合は 'NG'、
       エラーの場合は 'Err' と表示します。

例 3: 外部サイトからアクセス可能なページについて、
      /var/www/html/foo.html から深さ5までリンクを辿ってリストアップする

    % wcheet -a -r -u -p -e -d 5 \
          -I 192.0.2.1 -D example.net /var/www/html/foo.html

    ※ ここでは、外部サイトのIPアドレスを 192.0.2.1、
       ドメイン名を example.net としています。

例 4: /var/www/html/foo.html から深さ5までリンクを辿って
      リンク切れ検出を行う

    % wcheet -L -d 5 --accept='*' --element='*' /var/www/html/foo.html

    ※ 存在しないファイルには、行の先頭に '!' が付加されます。
Copyright(C) 2006 MURATA Yasuhisa. All rights reserved.
Last modified: 2006-03-23