''魔除けのおふだ'' 昨日今日と立て続けにサーチエンジンのクローラがやってきて、 公開しているページや画像を根こそぎ持って行くので、重くてしょうがない。 特に目立つのが、MSNBot と Yahoo! Slurp だ。 クローラに対していろいろ注文を付ける方法が規約((http://www.robotstxt.org/wc/robots.html などが詳しい))で決まっている。 サイトのトップに robots.txt というファイルを置いて、この中に いろいろ書けば、まともな相手なら従ってくれるというものだ。 -http://help.yahoo.com/help/us/ysearch/slurp/slurp-03.html これによると、 User-agent: Slurp Crawl-delay: 60 と書いておけば、アクセスの間隔を1分とってくれるらしい。 MSNの場合も同様だ。 (([[MSNサーチのトップ画面:http://search.msn.com/]]を初めて見たが、笑えるほどGoogleと似てる。)) -[[MSN Search | Troubleshooting issues with MSNBot and site crawling:http://search.msn.com/docs/siteowner.aspx?t=SEARCH_WEBMASTER_FAQ_MSNBotIndexing.htm&FORM=WFDD]] とりあえず、 User-agent: * Crawl-delay: 120 とでも書いて貼っておくか。人間の言葉に直すと、 このサイトを訪れるボットさん各位 アクセスの間隔を最低でも2分とってください。 効果あるかな?効きすぎて Google で検索できなくなったらとても困る。 そういえば Google bot と最近あまり遭遇しないのだが、最近の更新は しっかり捕捉されてたりするので、クローラの優秀さがわかる。 と、ここまで書いて負荷が高い原因が別にあることに 気が付いた。spamの踏み台にされて恐ろしい状態になっているではないか。 以後詳しい経緯は『[[Double Bounce攻撃>OpenBlockS/DoubleBounce]]』に 書くことにする。 -カテゴリ/インターネット -カテゴリ/セキュリティ -カテゴリ/OpenBlockS -カテゴリ/トラブル -[[カテゴリ/インターネット]] -[[カテゴリ/セキュリティ]] -[[カテゴリ/OpenBlockS]] -[[カテゴリ/トラブル]]