''魔除けのおふだ''
昨日今日と立て続けにサーチエンジンのクローラがやってきて、
公開しているページや画像を根こそぎ持って行くので、重くてしょうがない。
特に目立つのが、MSNBot と Yahoo! Slurp だ。
クローラに対していろいろ注文を付ける方法が規約((http://www.robotstxt.org/wc/robots.html などが詳しい))で決まっている。
サイトのトップに robots.txt というファイルを置いて、この中に
いろいろ書けば、まともな相手なら従ってくれるというものだ。
-http://help.yahoo.com/help/us/ysearch/slurp/slurp-03.html
これによると、
User-agent: Slurp
Crawl-delay: 60
と書いておけば、アクセスの間隔を1分とってくれるらしい。
MSNの場合も同様だ。
(([[MSNサーチのトップ画面:http://search.msn.com/]]を初めて見たが、笑えるほどGoogleと似てる。))
-[[MSN Search | Troubleshooting issues with MSNBot and site crawling:http://search.msn.com/docs/siteowner.aspx?t=SEARCH_WEBMASTER_FAQ_MSNBotIndexing.htm&FORM=WFDD]]
とりあえず、
User-agent: *
Crawl-delay: 120
とでも書いて貼っておくか。人間の言葉に直すと、
このサイトを訪れるボットさん各位
アクセスの間隔を最低でも2分とってください。
効果あるかな?効きすぎて Google で検索できなくなったらとても困る。
そういえば Google bot と最近あまり遭遇しないのだが、最近の更新は
しっかり捕捉されてたりするので、クローラの優秀さがわかる。
と、ここまで書いて負荷が高い原因が別にあることに
気が付いた。spamの踏み台にされて恐ろしい状態になっているではないか。
以後詳しい経緯は『[[Double Bounce攻撃>OpenBlockS/DoubleBounce]]』に
書くことにする。
-カテゴリ/インターネット
-カテゴリ/セキュリティ
-カテゴリ/OpenBlockS
-カテゴリ/トラブル
-[[カテゴリ/インターネット]]
-[[カテゴリ/セキュリティ]]
-[[カテゴリ/OpenBlockS]]
-[[カテゴリ/トラブル]]