日本の天文学のナショナルセンターであり、世界最先端の観測施設を擁する国立天文台。緑に囲まれた広大な東京都三鷹市のキャンパスの一画に、世界中の観測データをアーカイブする天文データセンターはあります。この観測データを活用した天文学研究手法は,データベース天文学あるいはデータ活用型天文学として確立されています。ソニービジネスソリューションでデジタルアーカイブの推進を担当する千明悟が天文データセンターを訪ね、天体のアーカイブの歴史と、天文学の“いま”を学びます。
今回は、国立天文台特任教授の大石雅寿さん(左)、天文データセンター助教の白崎裕治さん(中)、天文データセンター特任専門員のザパート・クリストファーさん(右)の3名にお話を伺いました。
大石雅寿さん(以下、大石):「ハワイにあるすばる望遠鏡をはじめ、望遠鏡の建設・運営には莫大なお金がかかります。すばる望遠鏡の場合は、建設費が400億円で、運営経費が毎年10億〜20億円。多くの研究者に観測データを使ってもらわなければ、コストに合いませんよね。そういった事情から、観測したデータを世界中の研究者間で共有し、皆で使えるようにしようという考え方が出てきたんです。
効率化という面でも、データの共有が求められました。例えば、南半球でしか観測できない天体のデータを取るために、昔は南半球にある天文台まで行く必要がありました。でも、南半球の天文台で撮ったデータを共有してもらえれば、わざわざ観測しに行かなくても研究を進められます。
世界中で観測したデータをデータベース化してオンラインに乗せることで、天文学者は研究室にいながらにして、さまざまな観測データを活用できるようになりました。ここ国立天文台の天文データセンターは、日本の天文学の中心施設として、そのアーカイブ機能を世界中に提供しているのです」
千明 悟 | ソニービジネスソリューション株式会社 デジタルアーカイブ推進担当
大石:「国内の一番古い記録は、鎌倉時代の藤原定家による『明月記』ですね。その中に、超新星爆発の残骸である“かに星雲”が肉眼で見えたという記録が残っています。非常に明るく光る星が出現し『客星あらわる』と文章に書いて残したというのが、国内の最初のアーカイブといわれています。
また、150年ほど前に写真乾板が発明され、天体を撮影することが可能になりました。天体の撮影によって、客観的なアーカイブを残せるようになったんです。国立天文台にも、100年以上前の貴重な写真乾板が保管されています」
白崎裕治さん(以下、白崎):「The International Virtual Observatory Alliance (IVOA)という機関が2002年に形成されて、現在ここには、世界各国の21の天文データセンターが参加しています。この機関では、主にデータ共有を行うための標準仕様の策定を行っています。データベースにどうやってアクセスして、結果をどのように返すかといった仕様を、この機関で決めているんです。最近ようやく仕様が固まり、それぞれのデータセンターでVO (Virtual Observatory)に則ったサービスが作られ始めているという段階ですね。私たちは今、そのフロント部分の開発をしています。研究者がデータベースにアクセスしたときに、世界中のデータセンターからデータを取得できるシステムを作っているところです」
大石:「まだインターネットがなかった時代は、海外の天文台で観測したデータを、磁気テープに記録していました。ところが、記録の形式が天文台ごとに違うと、データを持ち帰ってきても処理できません。そこで、1980年くらいに、共通のフォーマットが作られることになったんです。そういう風に、お互いにデータ交換できるようにしようという素地があり、自然な流れでオンライン化されて、今に至るといったところでしょうか」
白崎:「それから、天文学の場合は、メタデータが割と単純なんです。天体の位置や、いつ観測したか、どの場所から観測したか、どのくらい露出したかなど、世界各国で記録の仕方はだいたい同じです。データの種類が限られていて、標準化しやすかったことも、アーカイブデータの共有が進んでいる理由ですね」
ザパート・クリストファーさん(以下、ザパート):「先ほど大石も言いましたが、コストや効率化の面も大きいと思います。アーカイブデータを共有すれば、多くの研究者が閲覧できるという利便性がありますから」
大石:「天文学では、望遠鏡の使用料をお互いに取らない習慣になっています。そういった文化も、アーカイブデータ共有の素地になっているかもしれませんね。例えば、アメリカの研究者が日本に来て、すばる望遠鏡でデータを取るときも、使用料はいただきません」
白崎:「国立天文台では、スーパーコンピューターも無料で利用できます。どういった計算をしたいか書類に記載し、それが通れば誰でも利用が可能です」
大石:「10ペタバイトほどの大容量のストレージがあり、そこにデータを蓄積しています。もちろん、ストレージだけだと何もできませんので、データを読み込んだり、書き出したりするためのサーバーコンピューターも備えています。それから、データを取り出して解析するための解析サーバーも、キャンパス内にたくさんあります」
ザパート:「現在、1ファイルのサイズがテラバイトに近づいていますので、今後はさらにストレージの容量が必要になるでしょうね。今計画されているSKA(Square Kilometre Array)望遠鏡のデータは、1ファイルあたり256テラバイトになる予定です。5年以内にそういう時代が来ますよ。もう、自宅からダウンロードはできないですね(笑)」
白崎:「ひと昔前は、観測したデータをデータ転送して、自分の研究室のパソコン上で解析していたんですよ。今は、ストレージと解析サーバーを集約して、リモートのサーバーに入って解析するのが当たり前になっています。そういう環境を作らないと、とてもじゃないけど、大規模データを利用する現代の天文学の研究は成り立ちません」
白崎:「Sgr A*(サジタリウス・エー・スター)という電波源が、最近になって約百倍も明るくなっていることが判明し、話題になっています。過去からずっとモニタリングしていないと、そういうことはわからないんですよね。
天文学というと、望遠鏡をのぞきこんで天体を観測する学問と考えられがちですが、アーカイブデータと自分の持っているデータを組み合わせて研究するというやり方が、今は一般的になっています。可視光で観測したデータだけでなく、電波や赤外線、X線など、幅広い波長で研究しないとなかなか研究が進んでいきません。そういった研究をするためにも、やはりデータアーカイブは必要不可欠です」
大石:「望遠鏡というのは、これまでは天体を観察するために作られるものでした。ところが、バーチャル天文台のようなシステムがあると、望遠鏡の概念が変わってきます。高性能の巨大望遠鏡はデータマシンになり、取ったデータを次々公開します。多くのデータがそろえば、インターネットの中に仮想の宇宙を作ることができ、さまざまな天体現象のデータに基づいた詳細な理解が可能になります。空が曇っていると、天体の観測はできませんが、インターネットの中の宇宙はいつでも誰でも観測できます。そういうふうに、今後は研究スタイルそのものが変わってくるでしょうね」
ザパート:「例えば、写真を撮ったとき、今はJPEGなどの保存形式が使われていますよね。でも、10年後には保存形式が変わっているかもしれません。今のデータをどう次の書式に変換するか、将来の技術で過去の書式をどう読み込むかなど、デジタルデータの長期保管にはさまざまな課題があります」
大石:「天文データというのは、長く保管しておくことで、価値が高まっていく性質があります。国が学術クラウドを提供できるようになり、そこに100年、200年のあいだデータを置き続けられれば、後世の人たちがある程度クオリティを確保したデータに常にアクセスできるようになります。そういったデータは、国全体の資産になると思います。
誰しも“生命はどこから来たのか”“宇宙でどのような現象が起きているのか”といった、素朴な疑問を持っていると思うんですよね。私たち研究者の一番大きな仕事は、そのような素朴な疑問を少しずつ解明して、世の中に還元することだと考えています。天体データアーカイブを使うというのは、そういった仕事を達成するための手段の一つです」
天文学の研究や教育目的のために、世界中の観測データを有効かつ便利に利用できるよう、サービスを提供している国立天文台天文データセンター。100年後、200年後の未来の研究者のために、質の高いデータを残し、天文学の発展に貢献したいという研究者の情熱を感じました。アーカイブデータを共有し、管理・運用していくためには、フォーマットの統一やルールの徹底が不可欠です。今回の訪問は、デジタルアーカイブに顕在する課題に対して、解決の大きなヒントになるのではないかと考えました。(千明 悟)