今更ぷららのホームページサービスもアーカイブを試みる。
Googleで
site:www{1~20}.plala.or.jp -filetype:html -filetype:htm -filetype:pdf
site:www{1~20}.plala.or.jp/*/index.html
site:www{1~20}.plala.or.jp/*/index.htm
で検索すれば、だいたい全サイト見つかるだろうという見立て。
参考: https://wiki.archiveteam.org/index.php/Plala
@meandherv2@infosec.place
とりあえず何も考えず既知のURLを起点にしてgrab-siteでクロール……。
@meandherv2@infosec.place
www1とwww2のローカルへのアーカイブが終わった。ファイルサイズはめちゃくちゃ小さいが、なんだかんだでファイル数は結構多い。