お気に入りのサイトを勝手にミラー


概要

お気に入りのサイトがあるのだが、Homepage Builderなどの方法で作られている場合、RSSが無いので更新状況が分からず、サイトの全容も把握しにくい。

RSSを生成する手段がないか検討していたら、サイト丸ごとミラーすればいろいろ便利だということが分かった。

wgetによる丸ごとミラー

wgetコマンドにミラーを作ってくれるオプション -m がある。 下記のコマンドを実行すれば、カレント・ディレクトリの下に www.example.jp というディレクトリを作ってミラーを作ってくれる。

cd ~/backup
wget -m --limit-rate=20k http://www.example.jp/foo/

元のサイトに迷惑がかからないように帯域制限をかけた。

検索

ファイル名にスペースが混じっている場合、xargs がうまくいかなくなるので、 区切り文字をnullにするオプションを付ける必要がある。

find ~/backup/www.example.jp -name "*.html" -print0 | xargs -0 grep $*

アクセス解析

fc2.comのスクリプトによるアクセス解析が働かないように /etc/hosts に下記のようなエントリを加えておく。

127.0.0.1 analyzer52.fc2.com

通常のサイトのブラウズの際にも妨害してしまうが、問題ないであろう。


トップ   一覧 検索 最終更新   ヘルプ   最終更新のRSS