1 / 21

天文学 DB 用検索言語仕様の考察

天文学 DB 用検索言語仕様の考察. 白崎裕治 , 田中昌宏 , 本田敏志 , 大石雅寿 , 水本好彦 ( 国立天文台 ), 安田直樹 ( 東大宇宙線研 ), 増永良文 ( お茶の水大 ). はじめに. バーチャル天文台 ( VO) 計画. 世界中の天文データベースを自動連携 データベースと解析ツールの統合環境 学校教育等、一般社会での利用 参加国 アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。. 国内の望遠鏡 すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、 ALMA (国立天文台)

ivy-richard
Download Presentation

天文学 DB 用検索言語仕様の考察

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 天文学 DB 用検索言語仕様の考察 白崎裕治, 田中昌宏, 本田敏志, 大石雅寿, 水本好彦 (国立天文台), 安田直樹 (東大宇宙線研), 増永良文 (お茶の水大)

  2. はじめに

  3. バーチャル天文台 (VO) 計画 • 世界中の天文データベースを自動連携 • データベースと解析ツールの統合環境 • 学校教育等、一般社会での利用 • 参加国 • アメリカ、ヨーロッパ連合、カナダ、ロシア、インド、オーストラリア、中国、韓国、日本、等。

  4. 国内の望遠鏡 • すばる望遠鏡、野辺山45m電波望遠鏡、野辺山電波干渉計、ALMA(国立天文台) • あすか, はるか, Astro-F, Astro-E2 (宇宙航空研究開発機構) • 海外の望遠鏡 • ハッブル宇宙望遠鏡, VLT,Gemini, VLA, チャンドラX線望遠鏡、XMMニュートンX線望遠鏡、Integral、GLAST、HETE-2、Swift 等… 現在・将来の望遠鏡 望遠鏡は年々巨大化・高機能化し、データ量も爆発的に増加 野辺山電波~1TB/年, すばる~20TB/年, ALMA~1PB/年

  5. ウェッブブラウザを利用して誰でもデータベースへアクセス可能ウェッブブラウザを利用して誰でもデータベースへアクセス可能 • 国内 • SMOKA http://smoka.nao.ac.jp/ • NRO http://nrodb.nro.nao.ac.jp/ • Darts http://www.darts.isas.jaxa.jp/ • 海外 • MAST http://archive.stsci.edu/ • SDSS http://skyserver.sdss.org/dr1/en/ • VizieR http://cdsweb.u-strasbg.fr/viz-bin/VizieR • NED http://nedwww.ipac.caltech.edu/ 天文 DB の現状 データはこれからますます増えつづける。 これらのDBへのポータルサイト、バーチャルオブザバトリ (VO) が必要。

  6. データモデル

  7. 天体カタログ:天体の属性(座標、明るさ、形状等)についてのテーブル。天体カタログ:天体の属性(座標、明るさ、形状等)についてのテーブル。 • 画像データ:天体の外観・構造や局所的・大局的分布についての情報を視覚的に表現するデータ形式。 • スペクトルデータ:天体の波長毎の明るさの分布。元素組成、その天体までの距離の情報。 • フォトンデータ:光子毎の属性データ(座標、エネルギー、時刻)。 • ライトカーブデータ:天体の明るさの時間変動。ブラックホールの質量推定。 天文データの種類 異なる形式のデータに対する統一的な検索言語 データモデルの共通化

  8. 天体観測というものは、空間座標と波長軸からなる三次元空間(データキューブ) 内の明るさ分布を測定する、ということである。 • 画像データはデータキューブを空間平面へ射影である。 • スペクトルデータは波長軸への射影である。 観測データモデル

  9. データキューブからのデータの切り出し • 切り出し条件(3次元空間内の部分空間を指定) • 射影方法(画像かスペクトル) • データへのポインタ(実データを得るためのURL) • これらをテーブルの要素・カラムとする無限個のレコードからなる仮想テーブルを考え、それに対する検索とみなす。 データキューブの仮想テーブル化 SQLによる検索、RDBであるカタログデータとの親和性

  10. 要求事項・検索システム

  11. 分散 DB 対応 • 観測所毎に管理されているDBへの一括検索要求。 • 天球座標上での検索条件指定 • 特異点(極、経度360度)の取り扱い方法。 • 天球座標に基づくテーブル Join の方法 • 天体の ID は座標である。複数テーブルの Join は座標の近さで行う。テーブル毎に座標値の精度は異なる。 • 画像データやスペクトルデータの検索 • データキューブからのデータ切り出し方法を記述。 • テーブル名やカラム名のアブストラクト指定 • 大量にあるテーブルの中から、必要なテーブルを条件付けて指定する方法。カラム名の共通化。 • 読みやすく分かりやい言語 VO用検索言語への要求事項

  12. データサービス データサービス データサービス Registry サービス 天文 DB 天文 DB 天文 DB Metadata DB SkyQuery は ユーザがVOポータルを経由して利用する検索言語 VOにおける検索システム VO ポータル SkyQuery • テーブル・カラム名の解決 • 天体座標の解決 • データサービスURLの解決 ADQL ADQL ユーザ 他のVO ADQL ADQL (Astronomical Query Language) はデータサービスへの検索言語。SkyQuery は ADQL の上位互換言語。ADQLはSQLの上位互換言語。

  13. 検索言語仕様

  14. 分散DBへの対応 • テーブル名、カラム名の URI を記述する。 • [[[Authority.]DBname.]TableName.](ColumnName|UCD) • Authority はDB管理組織に対して一意に割り当てられる名称。 • 各DB管理組織はその内部でDB名の重複がないよう管理する。 • UCD (Unified Column Description) は天文データのカラムを意味づける標準名。フランス CDS を中心に取り決め。 • ファイル形式のテーブルの指定  • File:FileName • 例 国立天文台のすばるデータベースにある銀河カタログの天体名カラム • naoj.subaru.galaxy.objectName テーブル・カラム指定

  15. テーブル・カラム名のアブストラクト指定 テーブル名を指定するのではなく、テーブルの属性で検索候補を指定したい。 FROM TABLE OF [Keyword] “文字列” Keyword はテーブルのメタデータキーワードを利用する。(IVOAにより標準化作業中) UCD名の候補を列挙,ワイルドカードの使用。 SELECT (PHOTO_MAG_* | SPECT_FLUX_NORM) これらの文法は SkyQuery のみサポート。  データサーバに対してはテーブル名・カラム名は解決した状態のSQLを渡すこと。

  16. 位置指定文 天球上の位置を記述する文 POINT(第一座標, 第二座標[, 座標系[, 座標のEpoch]]) POINT(天体名) 第一座標は赤経 (赤道座標) または銀経 (銀河座標)、第二座標は赤緯または銀緯。 座標系は赤道座標 (RA_DEC) または銀河座標 (GLON_GLAT)。 座標の Epoch は B1950 または J2000。 例 POINT(207.2, +23.3, RA_DEC, J2000) POINT(23:23:47.22, +02:35:10.00) POINT(“SN1987A”)

  17. 領域指定文 • 位置領域指定文 • BOX(位置指定文, 縦サイズ, 横サイズ[, ポジションアングル]) • CIRCLE(位置指定文, 半径サイズ) • POLYGON(位置指定文のリスト[,(LARGE|SMALL)]) • HTM(HTMインデックスのリスト) • スペクトル範囲指定文 • SPECTRUM(境界1, 境界2) | SPECTRUM(波長帯名) • 境界値は波長, 周波数, エネルギーのいずれかを単位つきで指定する。 • 波長帯名は “optical”, “IR”, “radio”, “X-ray”, “gamma-ray”。

  18. テーブル Join • テーブルJoin文 (クロスマッチ文) • XMATCH(テーブル1, [!]テーブル2) <精度 • [NEAREST|BRIGHTEST|ALL] • テーブル1の天体を基準に、テーブル2の天体とのジョインをその座標に基づき指定された精度で行う。 • NEARESTがつくと最も近くの天体とジョインを行う。 • BRIGHTEST がつくと最も明るい天体とのジョインを行う。 • ALL がつくと「精度」内のすべての天体とのジョイン。 • テーブル2に「!」がつく場合は排他的ジョイン。 • Where 節で使用。

  19. 画像・スペクトルデータの検索 • SELECT Image(条件指定文) | Spectrum(条件指定文) • FROM Authority.DBName.DataCube • WHERE  条件指定文 • 条件指定文は「領域指定文」、「スペクトル範囲指定文」、「キーワードに対する条件文」のうち複数を指定可。 • キーワードは別途定義の必要がある。例えば、 spatialRegion, spectrumBand, observatinTime, imagePixsize, integration 等。 • 検索結果はデータへのポインタ (アクセスURL) を返す。 • 画像・スペクトルデータの検索もカラム名の代わりにImage(), Spectrum()といった関数を使うという以外、テーブルデータと同様の文法で記述される。 画像・スペクトル検索

  20. まとめ

  21. SkyQuery, ADQLの拡張機能

More Related