GitHubは今月、北極圏内にある山の地中深くに、AIによってデザインされた巨大なスチール製貯蔵庫を設置し、GitHub Arctic Code Vaultを完成させました。その中には硬化処理を施した188リール(巻)のアーカイブフィルムが収められています。2020年2月2日時点でGitHub上に公開されていた、すべてのアクティブなパブリックリポジトリのスナップショットが1,000年間にわたり保存されます。現在は、これ以外にTech Treeも保管されており、人間が読み取り可能な形式で記述した、ソフトウェア、コンピューター、およびそれらの基盤となるテクノロジーについて厳選された作品に加えて、Wikipedia、Stack Overflow、その他のデータソースの全文コピーが記録されています。
北極圏の中でも極点に近い場所に位置する、ノルウェーの山の地中深くに、閉鎖された炭鉱があります。その炭鉱内の補強された安全な空間に、硬化処理された188リールのアーカイブフィルムが保管されました。各リールは経年劣化を防ぐために密封されています。これらのリールには、2020年2月2日時点でGitHub上に公開されていたすべてのアクティブなパブリックリポジトリのスナップショット、すなわち約400万人の開発者による集合作品がエンコードされています。これが、GitHub Arctic Code Vaultです。
GitHub Archive Programのプロジェクトとして実施されている本件は、現代文明の隠れた基盤であり、全人類の共有財産でもある「オープンソースソフトウェア」を、将来の世代のために1,000年間の保存を目指しています。これは非常に壮大な目標です。現在のテクノロジー企業の中で、1世紀または2世紀後も確実に存続している企業はほとんどないでしょう。
1,000年はとても長い歳月です
アンコール・ワット、グレート・ジンバブエ遺跡、マチュピチュなど、私たちが非常に古いと考えている遺跡ですら、1,000年前にはまだ建造されていませんでした。問題は、私たちが2年前に保管したアーカイブリールが物理的に残るかどうかではなく、このリールを管理、参照するための十分な知識や関心を持つ誰かがいてくれるかということです。そのためには、リールの重要性を視覚的に示す必要があります。私たちのパートナーであるLong Now Foundation (ロング・ナウ協会)のエグゼクティブディレクターを務めるAlexander Rose氏が、当然のことのように「美しくなければ受け継がれない」と語ったのはこのためです。私たちが、機関パートナー向けのリールである「ベストアルバム」を美術館品質のケースに収めた理由、そして今月、GitHub Arctic World Archive内に設置した巨大なスチール製貯蔵庫に、アーティストのAlex Maki-Jokela氏がAIを使って作成した印象的なアートのエッチングを施した理由は、まさにそこにあるのです。GitHub Arctic Code Vaultは文字通りvault(貯蔵庫)のようなもので、約1,400kg (3,000ポンド) の構造物の中にアーカイブフィルムのリールが安全に保管されています。これから何世紀も後にこれらを継承する人々は、たとえそれらが何であるか分からなくても、「特別な何か」であることは確実に認識できるはずです。
なぜGitHub Arctic Code Vaultに取り組むのか
「そもそも継承者たちはアーカイブを利用して何をするのだろうか?」と不思議に思われるかもしれません。説得力のある実用的な目的はたくさんあります。現在、世界中で、憂慮すべき膨大な量の知識が一時的なメディアに保存されています。例えば、ハードドライブやCD-ROMは数十年間の使用を想定しており、バックアップテープの寿命は理論上30年に留まります。スペースシャトル「チャレンジャー号」の悪夢のような出来事の後、封印されていたサターンVの設計図をNASAが探し回ったように、予期せぬタイミングで過去のソフトウェアが必要になるシナリオは容易に想像できます。しかし、ソフトウェアを放っておけば、ビット腐敗によって失われてしまうのです。
また、アーカイブの価値は主にその歴史性にあるという説明も理にかなっています。GitHubのアーカイブは既にパンデミック前のタイムカプセルのような役割を担っており、わずか2年後の今日でさえ、2020年の「常識」は大きく変化しているのです。未来の歴史家は、私たちの時代のオープンソースのユビキタス性、ボランティアのコミュニティ、ムーアの法則などについて、歴史的に重要な情報であると評価するかもしれません。この点が、2020年2月2日時点のスナップショットを非常に幅広く大衆的なものにした理由の1つです。アドバイザーの一人である、歴史家・SF作家のAda Palmer氏によれば、ルネサンス時代の裕福な貴族が書いた手紙はたくさんある一方で、現代の歴史家が本当に欲しがっている庶民の買い物リストはほとんど残っていません。GitHubが何百万ものリポジトリを保存し、インデックスを作成することで、現代のソフトウェア世界の貴重な断面を捉えられるようにすることを願っています。
Tech Tree
もちろん、私たちの世界はソフトウェアだけで成り立っているのではありません。実際、アーカイブの継承者たちにとって、その概念自体が馴染みのないものになっているかもしれません。私たちが、現代のコンピューティング、オープンソースとそのアプリケーション、現代のソフトウェア開発、よく使われるプログラミング言語などに関する深い理解のため、いわゆる「Tech Tree」を構築してアーカイブし、今月、Code Vaultに併せて保管したのはこのためです。各リールには、アーカイブとそのコンテンツについて人間が読み取りが可能な5つの言語で記載したガイドが既に含まれています。一方、Tech Treeはその大半がエンコードされておらず、人間が読み取り可能な形式で文書化された作品を厳選したもので、より幅広いコンテキストを提供するものです。
Tech Treeでは、今日の世界におけるソフトウェアの作成方法と使用方法を、コンピューター自体とその基盤となるテクノロジーの概要と共に説明しています。また、文化的背景として芸術的、文化的、歴史的な作品もいくつか厳選して取り入れています。さらに、アーカイブの全5言語 (アラビア語、中国語、英語、ヒンディー語、スペイン語) で記載されたWikipedia全文のスナップショット、そしてもちろんStack Overflowの完全なダンプも含まれています。
今後のアーカイブの展望
GitHub Arctic World Archiveにスチール製貯蔵庫を据え付け、Tech Treeを保管し、さらにInternet Archive (インターネットアーカイブ)およびSoftware Heritage Foundation (ソフトウェア遺産財団)と「ウォームバックアップ」のパートナーシップを締結し、3大陸に存在する世界的に有名な3つの図書館で「ベストアルバム」リールの安全を確保したことで、GitHub Archive Programバージョン1.0は基本的にすべての目的を達成しました。私たちはこれまでに達成したアーカイブの実績に満足するつもりはありません。Archive Programは進行中であり、今後も新たな取組みを発表できることを楽しみにしています。