ニュース画像

ビジネス
特集
“消えた”ウェブサイトを後世に

スマートフォンやパソコンでちょっとした調べものをしたときに、お目当てのサイトがいつの間にか消えていたり、内容が変わったりしていて、残念に感じた経験も多いのではないでしょうか。こうしたサイトを保存する取り組みを進めているのが国立国会図書館です。これまでに保存したサイトのデータ量は700テラバイト余り。今、この膨大なデータを活用しようと新たな試みも始まっています。

“消えた”日韓ワールドカップ

今から14年前、日本中が熱狂した2002年のサッカー・日韓ワールドカップ。私もチケットの情報や試合の日程を調べるために、毎日のように公式サイトをチェックしていました。当時は、通信環境も今ほどよくなく、サイトを見るためにわざわさネットカフェに出かけたのを覚えています。しかし、今、このアドレスにアクセスしてもサイトを見ることはできません。大会が終わってほどなく閉鎖され、サイトを運営していた大会の組織委員会も解散してしまったからです。

日々、公開される多くのウェブサイトは、頻繁に内容が更新され、役割が終われば消えていきます。国立国会図書館によりますと、国の機関のサイトだけでも、5年前に存在したサイトの約60%が閉鎖されたということです。

“消えた”サイトを保存する

こうした“消えた”サイトを保存する取り組みを進めているのが、国立国会図書館のインターネット資料保存事業(Warp)です。国や自治体、独立行政法人や大学などのサイトを定期的に収集して保存しています。収集の頻度は、国のサイトが毎月で年12回、自治体や大学などは四半期ごとで年4回です。また、各地で行われるイベントや祭りなどのほか、東日本大震災に関連するサイトも幅広く保存の対象にしています。

当初は、サイトの運営者に許諾を得たものだけでしたが、2010年に国立国会図書館法が改正され、国や自治体などのサイトについては、網羅的に収集・保存できるようになりました。また、保存したサイトのうち公開の許諾が得られたものは、Warpのサイトで誰でも閲覧することができます。

ニュース画像

http://warp.da.ndl.go.jp/

(NHKサイトを離れます)

“消えた”自治体

Warpのなかでも、特に目をひくのが“消えた”自治体のサイトです。合併前の自治体の取り組みや地域文化の紹介などの貴重な資料を当時のままの状態で見ることができます。事業の開始が、いわゆる「平成の大合併」と重なったこともあり、当初、合併でなくなる自治体や合併協議会のサイトは集中的に収集したということです。保存したサイト数は989に上り、合併で消えた自治体の約3分の2をカバーしています。

また、Warpが保存したことで、今でも多くの人に利用されているサイトもあります。東京電力福島第一原子力発電所の事故原因などの解明に取り組んできた国会の原発事故調査委員会のサイトです。2012年7月5日に報告書を衆参両院の議長に提出されたあと、10月にサイトが閉鎖され、Warpが保存を引き継ぎました。今でも月に7万近いアクセスがあり、この4年間だけでも合わせて600万以上のアクセスを記録しています。

Warpを担当する国立国会図書館関西館・電子図書館課の前田直俊課長補佐は「インターネット上の情報は日々、内容が変わり、そして、消えていきます。これだけネットが身近になった社会で、例えば、100年後の人々が当時の私たちの生活を知る材料として、できるだけ多くのウェブサイトを保存し、後世に伝えていくことは大きな意義があると考えています」と話しています。

保存データを可視化する

事業が始まって14年、これまでに保存されたサイトは約1万種類、データ量にして700テラバイト余りに上ります。先月30日、こうした膨大なデータを活用する新たな取り組みが行われました。

2010年、13年、15年に保存したすべての自治体のサイトを検索できるシステムを試験的に公開し、検索結果を分析して分かった新たな“発見”を、グラフや地図で可視化してもらうイベントを開いたのです。イベントにはプログラマーやデザイナーなど41人が参加し、思い思いのキーワードで検索したデータを手がかりに見つけた、各自治体の隠れた特徴や自治体どうしの意外なつながりを可視化しました。

こちらは、全国各地のご当地キャラクター「ゆるキャラ」と自治体の関係を表現したグラフです。2つのキーワードのつながりの深さに応じてグラフに可視化しました。グラフからは有名なゆるキャラのほとんどが、実は熊本県と深い関係があることが分かりました。例えば、去年、ゆるキャラグランプリに選ばれた浜松市の「出世大名家康くん」は、地元の静岡県に次いで、2位に熊本県が入っています。

制作したプログラマーの1人は「ゆるキャラ業界では、やはり、くまモンの影響力が大きいことが分かりました。もう少し詳しく分析すれば、くまモンが全国各地に積極的に営業に行っているのか、各地のゆるキャラたちがくまモン人気にあやかって、熊本詣を繰り返しているのかが分かると思います」と話していました。

また、好きなアニメの舞台になった土地を巡ることを指す「聖地巡礼」というキーワードを自治体ごとに視覚化した地図では、2015年になって使用頻度が爆発的に増えたことが分かりました。制作したデザイナーの1人は「キーワードを調べるたけでも、聖地巡礼ブームが自治体の観光戦略と密接に関わっていることが分かった。観光PRのための予算額などのデータと重ね合わせれば、より具体的に裏付けられると思う」と話していました。

イベントを企画した国立国会図書館・電子情報部電子情報流通課の橋詰秋子さんは「書籍などの紙の資料とは異なり、デジタルの形で保存されたウェブページは、単に『見る』だけでなく、分析したり、可視化したりするなど、さまざまな形で活用することができます。今後もこうしたイベントなどを通じて、Warpの可能性について考えていきたい」と話していました。

ニュース画像

ウェブサイトを後世に残す

気がつけば、スマホやSNSが生活の一部になり、毎日、膨大な量の情報が目まぐるしいスピードで私たちの前を流れていくようになりました。こうしたなか、日々、生まれては消えていくウェブサイトをどのように後世に残し、そして、役立てていくのか。少し立ち止まって考えてみてもよいのではないかと感じました。

山本智
ネット報道部
山本 智