投稿のネタが切れ気味なので、昔役に立ったことは何だったろうかと思い返していたところ、まず思い当たったのがタイトルの通り「Web開発をしている時に本番ファイルを上書きや消去で壊してしまった……しかもバックアップ取ってない……場合に普及させる(させられるかもしれない)便利な方法」です。
有名すぎてWebのひとには常套手段ではあるんですが、当時は「おっ!マジ!助かった!」ってなり、とても印象に残っています。
その方法とは「昔のウェブサイト(ウェブページ)」を保存しているサービスのデータ内に残っていないか探して、極力事故が発生した日時と近しいものをダウンロードして普及させる方法です。
これ意外と頼りになることが多く、昔のJavascriptのファイルやCSSファイルなどから普及することが比較的容易に出来ます。何度もお世話になったことがある方は多いんじゃないでしょうか?(そもそもファイル消失するなよとツッコミがあるはずですが)
Webサイトの構築に従事する方で、初心者向けの記事になりますので、読まなくても構いません。
真っ先にWaybackmachineを確認すること
世の中便利なサービスを運営する方がいらっしゃってとても助かります。この「Waybackmachine」はその代表格で、過去の特定の日付(時間含む)のページデータを保存して公開しているというサービスです。
Waybackmachineはトラフィックが多いサイトを中心にクローラー(スクレイピング)を介してデータを自身のサーバーに溜め込んでいます。もちろん、毎日毎時間訪れるのではなく、(体感)ランダムで小さい規模だと月1あるかないか、大きい規模だと週3,4日程度アクセスしてきます。
気になるURLですが、「https://web.archive.org/」が公式サイトになります。
また、Chromeの拡張機能(正確にはChromeアプリ)をリリースされています。(https://chromewebstore.google.com/detail/wayback-machine/fpnmgdkabkmnadcjpehmlllkndpkmiak?hl=ja)お好みでどちらか利用してみてください。
ページのロゴ右にURLの入力欄があるので、そこに開発中のウェブサイト(単一ページ可)を入れて検
索してみます。試しにご自分の作業しているURLを入れてみてください。検索するとカレンダーが出てくるはずです。
注意点としては極端にアクセスが少ないサイトや、URLのトップページから階層が深かったり、そもそもリンクされていないようなガラパゴスページだと、該当データが無いことのほうが多いです。スクレイピングを禁止しているサイトなどはデータは無いはずです。データがないときはこの方法は諦めてください。おそらくゼロから組み直すか、数日前のバックアップで代用する必要があります。
もし特定のページを収集してほしい場合は、Wayback Machineのページにある”Save Page Now”から依頼すると、その時点の特定ページが保存されます。 保存されるのはURLで指定したページとその関連ファイル(画像等)のみです。リンクをたどってサイト全体を保存することはしません。
国立国会図書館の説明文から引用してしまいました。ページの登録申請が出来ます。あんまり習慣が無いと思いますが、もしかしたら年4回くらい登録申請しておいても良いかもしれませんね。
Waybackmachineに類似したサービス
Archive-It!というサービスもウェブアーカイブサービスの一つです。こちらは自分で申請する方式をとっています。しかも有料なので少しでも経費を抑えたい皆さんには不向きかと思います。こんなのあるんだよ、程度で聞き流してもOKです。詳しく知りたい方はリンクから除いてみてみてください。
OpenWaybackはすでにスクレイピングが終了してしまっているので、大昔の記事を見たい時に使います。本内容とあまり関連が無いので聞き流してください。(ただ、リニューアル前のデータをもう一回使いたい時とかには有効かもしれません)
Stanford Web Archive Portalはスタンフォード大学が行っているWaybackmachineと同等のサービスです。数が少ないのですが、Waybackmachineになかったらこっちのサービスも確認すると良いかもしれません。
UK Parliament Web Archiveは英国議会が運営しているというちょっと不思議なサービス形態です。Waybackmachineと使い心地はほぼほぼ同じなので、Waybackmachineに慣れているならそこまでつまずかないで検索できるでしょう。これもWaybackmachineにデータが保存されていなかった時用に重宝します。
この他にもありますがここでは割愛します。「Waybackmachine△類似」でGoogleですぐ見つかりますので興味あればしらべてみてください。
Waybackmachineからソースを復旧させる方法
Waybackmachineで表示されるアーカイブページはGoogle Chromeなどのデベロッパーツールからソースの確認などが可能です。
復旧したい対象のファイルを開いて、ローカルにコピペすればOKです。たまに、ソースにゴミが混ざっている(たしか混ざっていたことが過去にあった気がする…・・・)ので、念の為、ファイル内を精査してから本番に戻してあげましょう。