お気に入りのサイトを勝手にミラー


概要

お気に入りのサイトがあるのだが、Homepage Builderなどを使って作られている場合、RSSが無いので更新状況が分からず、サイトの全容も把握しにくい。

RSSを生成する手段がないか検討していたら、サイト丸ごとミラーすればいろいろ便利だということが分かった。

wgetによる丸ごとミラー

wgetコマンドにミラーを作ってくれるオプション -m がある。 下記のコマンドを実行すれば、カレント・ディレクトリの下に www.example.jp というディレクトリを作ってミラーを作ってくれる。

cd ~/backup
wget -m --limit-rate=20k http://www.example.jp/foo/

元のサイトに迷惑がかからないように帯域制限をかけた。

検索

ファイル名にスペースが混じっている場合、xargs がうまくいかなくなるので、 区切り文字をnullにするオプションを付ける必要がある。

find ~/backup/www.example.jp -name "*.html" -print0 | xargs -0 grep $*

ローカルアクセス

ミラーが保存してあるフォルダにローカルホストだけからアクセスできるようにするapacheの設定。 勝手にミラーしているので一般に公開するとまずいことになると思われるので、デスクトップのブラウザだけからアクセスできるようにする。

Alias /example/ /home/otsuka/backup/www.example.jp/
<Directory /home/otsuka/backup/www.example.jp>
 order deny,allow
 deny from all
 allow from localhost.localdomain
</Directory>

アクセス解析

fc2.comのスクリプトによるアクセス解析が働かないように /etc/hosts に下記のようなエントリを加えておく。

127.0.0.1 analyzer52.fc2.com

通常のサイトのブラウズの際にも妨害してしまうが、問題ないであろう。


免責事項

ここに記載されている内容を実際に運用した場合のトラブルに関しては一切責任を負えませんのでご了承ください。
Copyright 2000-2011 Koichi Otsuka


トップ   差分 バックアップ リロード   一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2011-08-03 (水) 10:22:49 (4643d)