Baiduのクロール

 Webサービスで取得したデータをキャッシュ。トリガーは外部から当方のサーバーへのアクセス。「PEARのCache_Liteでオブジェクトもキャッシュ&古いキャッシュも利用する: point of view point」の続き。
 一日で1Gバイトとかいうすごい容量。数日分はとっておきたかったのに。と思いつつログをチェック。
 ほぼバイデゥ。24時間休まずにクロールしつづけているくらいの勢い。10秒に1回はアクセスしてきてる。これはびっくり。
 どうせ、バイデゥ経由でのトラフィックなんて望めないわけだから、アクセス制限しておいた。さっぱり。でも、どうしよう、これからバイデゥが大ブームになったりしたら。
音楽の世界へようこそ そういえば、川本真琴の新譜とベストが出ているのに気づいた。リリースのニュースは聞いてたんだけど、発売日をまったく認識していなかった。さて、どうしよう。いや、まあ、買うんだろうけども。
 で、日本アカデミー賞は「沈まぬ太陽」。かつらがおもしろい。

コメント