210 likes | 315 Views
天文学 DB 用検索言語仕様の考察. 白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ), 安田直樹 ( 東大宇宙線研 ), 増永良文 ( お茶の水大 ). はじめに. バーチャル天文台 ( VO) 計画. 世界中の天文データベースを自動連携 データベースと解析ツールの統合環境 学校教育等、一般社会での利用 参加国 アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。. 国内の望遠鏡 すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台)
E N D
天文学 DB 用検索言語仕様の考察 白崎裕治, 田中昌宏, 本田敏志, 大石雅寿, 水本好彦 (国立天文台), 安田直樹 (東大宇宙線研), 増永良文 (お茶の水大)
バーチャル天文台 (VO) 計画 • 世界中の天文データベースを自動連携 • データベースと解析ツールの統合環境 • 学校教育等、一般社会での利用 • 参加国 • アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。
国内の望遠鏡 • すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、ALMA(国立天文台) • あすか, はるか, Astro-F, Astro-E2 (宇宙航空研究開発機構) • 海外の望遠鏡 • ハッブル宇宙望遠鏡, VLT,Gemini, VLA, チャンドラX線望遠鏡、XMMニュートンX線望遠鏡、Integral、GLAST、HETE-2、Swift 等… 現在・将来の望遠鏡 望遠鏡は年々巨大化・高機能化し、データ量も爆発的に増加 野辺山電波~1TB/年, すばる~20TB/年, ALMA~1PB/年
ウェッブブラウザを利用して誰でもデータベースへアクセス可能ウェッブブラウザを利用して誰でもデータベースへアクセス可能 • 国内 • SMOKA http://smoka.nao.ac.jp/ • NRO http://nrodb.nro.nao.ac.jp/ • Darts http://www.darts.isas.jaxa.jp/ • 海外 • MAST http://archive.stsci.edu/ • SDSS http://skyserver.sdss.org/dr1/en/ • VizieR http://cdsweb.u-strasbg.fr/viz-bin/VizieR • NED http://nedwww.ipac.caltech.edu/ 天文 DB の現状 データはこれからますます増えつづける。 これらのDBへのポータルサイト、バーチャルオブザバトリ (VO) が必要。
天体カタログ:天体の属性(座標、明るさ、形状等)についてのテーブル。天体カタログ:天体の属性(座標、明るさ、形状等)についてのテーブル。 • 画像データ:天体の外観・構造や局所的・大局的分布についての情報を視覚的に表現するデータ形式。 • スペクトルデータ:天体の波長毎の明るさの分布。元素組成、その天体までの距離の情報。 • フォトンデータ:光子毎の属性データ(座標、エネルギー、時刻)。 • ライトカーブデータ:天体の明るさの時間変動。ブラックホールの質量推定。 天文データの種類 異なる形式のデータに対する統一的な検索言語 データモデルの共通化
天体観測というものは、空間座標と波長軸からなる三次元空間(データキューブ) 内の明るさ分布を測定する、ということである。 • 画像データはデータキューブを空間平面へ射影である。 • スペクトルデータは波長軸への射影である。 観測データモデル
データキューブからのデータの切り出し • 切り出し条件(3次元空間内の部分空間を指定) • 射影方法(画像かスペクトル) • データへのポインタ(実データを得るためのURL) • これらをテーブルの要素・カラムとする無限個のレコードからなる仮想テーブルを考え、それに対する検索とみなす。 データキューブの仮想テーブル化 SQLによる検索、RDBであるカタログデータとの親和性
分散 DB 対応 • 観測所毎に管理されているDBへの一括検索要求。 • 天球座標上での検索条件指定 • 特異点(極、経度360度)の取り扱い方法。 • 天球座標に基づくテーブル Join の方法 • 天体の ID は座標である。複数テーブルの Join は座標の近さで行う。テーブル毎に座標値の精度は異なる。 • 画像データやスペクトルデータの検索 • データキューブからのデータ切り出し方法を記述。 • テーブル名やカラム名のアブストラクト指定 • 大量にあるテーブルの中から、必要なテーブルを条件付けて指定する方法。カラム名の共通化。 • 読みやすく分かりやい言語 VO用検索言語への要求事項
データサービス データサービス データサービス Registry サービス 天文 DB 天文 DB 天文 DB Metadata DB SkyQuery は ユーザがVOポータルを経由して利用する検索言語 VOにおける検索システム VO ポータル SkyQuery • テーブル・カラム名の解決 • 天体座標の解決 • データサービスURLの解決 ADQL ADQL ユーザ 他のVO ADQL ADQL (Astronomical Query Language) はデータサービスへの検索言語。SkyQuery は ADQL の上位互換言語。ADQLはSQLの上位互換言語。
分散DBへの対応 • テーブル名、カラム名の URI を記述する。 • [[[Authority.]DBname.]TableName.](ColumnName|UCD) • Authority はDB管理組織に対して一意に割り当てられる名称。 • 各DB管理組織はその内部でDB名の重複がないよう管理する。 • UCD (Unified Column Description) は天文データのカラムを意味づける標準名。フランス CDS を中心に取り決め。 • ファイル形式のテーブルの指定 • File:FileName • 例 国立天文台のすばるデータベースにある銀河カタログの天体名カラム • naoj.subaru.galaxy.objectName テーブル・カラム指定
テーブル・カラム名のアブストラクト指定 テーブル名を指定するのではなく、テーブルの属性で検索候補を指定したい。 FROM TABLE OF [Keyword] “文字列” Keyword はテーブルのメタデータキーワードを利用する。(IVOAにより標準化作業中) UCD名の候補を列挙,ワイルドカードの使用。 SELECT (PHOTO_MAG_* | SPECT_FLUX_NORM) これらの文法は SkyQuery のみサポート。 データサーバに対してはテーブル名・カラム名は解決した状態のSQLを渡すこと。
位置指定文 天球上の位置を記述する文 POINT(第一座標, 第二座標[, 座標系[, 座標のEpoch]]) POINT(天体名) 第一座標は赤経 (赤道座標) または銀経 (銀河座標)、第二座標は赤緯または銀緯。 座標系は赤道座標 (RA_DEC) または銀河座標 (GLON_GLAT)。 座標の Epoch は B1950 または J2000。 例 POINT(207.2, +23.3, RA_DEC, J2000) POINT(23:23:47.22, +02:35:10.00) POINT(“SN1987A”)
領域指定文 • 位置領域指定文 • BOX(位置指定文, 縦サイズ, 横サイズ[, ポジションアングル]) • CIRCLE(位置指定文, 半径サイズ) • POLYGON(位置指定文のリスト[,(LARGE|SMALL)]) • HTM(HTMインデックスのリスト) • スペクトル範囲指定文 • SPECTRUM(境界1, 境界2) | SPECTRUM(波長帯名) • 境界値は波長, 周波数, エネルギーのいずれかを単位つきで指定する。 • 波長帯名は “optical”, “IR”, “radio”, “X-ray”, “gamma-ray”。
テーブル Join • テーブルJoin文 (クロスマッチ文) • XMATCH(テーブル1, [!]テーブル2) <精度 • [NEAREST|BRIGHTEST|ALL] • テーブル1の天体を基準に、テーブル2の天体とのジョインをその座標に基づき指定された精度で行う。 • NEARESTがつくと最も近くの天体とジョインを行う。 • BRIGHTEST がつくと最も明るい天体とのジョインを行う。 • ALL がつくと「精度」内のすべての天体とのジョイン。 • テーブル2に「!」がつく場合は排他的ジョイン。 • Where 節で使用。
画像・スペクトルデータの検索 • SELECT Image(条件指定文) | Spectrum(条件指定文) • FROM Authority.DBName.DataCube • WHERE 条件指定文 • 条件指定文は「領域指定文」、「スペクトル範囲指定文」、「キーワードに対する条件文」のうち複数を指定可。 • キーワードは別途定義の必要がある。例えば、 spatialRegion, spectrumBand, observatinTime, imagePixsize, integration 等。 • 検索結果はデータへのポインタ (アクセスURL) を返す。 • 画像・スペクトルデータの検索もカラム名の代わりにImage(), Spectrum()といった関数を使うという以外、テーブルデータと同様の文法で記述される。 画像・スペクトル検索