230 likes | 384 Views
ATLAS 実験における シミュレーション & 解析環境. 東大 ICEPP 田中純一. 概要. 道具 プログラミング言語は? 環境は?フレームワークは? データ 実験データ MC データ どこにある?どうやってアクセスする? データの流れ:どうやってつくる? 我々の現状 何をやっているか?. 話の中で、 “ローマ”という言葉が でてきたら、 今年 6 月にある ATLAS 物理 WS のこと. プログラミング言語. C++ 言語 ATLAS 実験専用の解析フレームワーク ROOT Python
E N D
ATLAS実験におけるシミュレーション&解析環境 東大ICEPP 田中純一 第一回LHC物理解析研究会
概要 • 道具 • プログラミング言語は? • 環境は?フレームワークは? • データ • 実験データ • MCデータ • どこにある?どうやってアクセスする? • データの流れ:どうやってつくる? • 我々の現状 • 何をやっているか? 話の中で、 “ローマ”という言葉が でてきたら、 今年6月にある ATLAS物理WSのこと 第一回LHC物理解析研究会
プログラミング言語 • C++言語 • ATLAS実験専用の解析フレームワーク • ROOT • Python • 解析ジョブの引数に与えるテキストファイル内でオプションを記述する。例:>> athena Higgs_VBF_tautau.py [return] • Fortran • Generator周辺の仕事 • C++はSherpaだけ(?)、Herwig++とPythia7はまだ。 第一回LHC物理解析研究会
解析環境 • Athena “アセナ” • ATLAS実験専用の巨大なフレームワーク • 何もかも行う(予定)。 • 実験データのReconstruction • MCデータの生成 • 物理解析 • Grid “グリッド” • 世界規模で接続されたPCの集合体 • 約60000CPUs(3GHz Xeon換算)@2008 • 約16PB(テープ)+約30PB(ディスク)@2008 第一回LHC物理解析研究会
Athena環境の開発状況 ローマ 第一回LHC物理解析研究会
データ 基本は以下の3種類。 • RAW • 実験データ、1.6MB/evt、HLT=~200Hz例:物理事象=100Hzと仮定すると、100x1年分(107)x1.6MB/evt = 1.7PB/年 • MCデータ(Full)も実験データと同じ形式にする。2.0MB/evt • ESD • Event Summary Data、0.5MB/evt • Reprocessに耐える内容を保持する予定。 • AOD • Physics Analysis Object Data、0.1MB/evt 第一回LHC物理解析研究会
流れ Generator Geant4 - simulation - digitization Fast simulation RAW Reconstruction ESD AOD Analysis 第一回LHC物理解析研究会
シミュレーション • Full Simulation • Geant4とGeant3 • Geant4の実装は終了して、テスト段階に入った。 • Fast Simulation • ハドロンコライダーでは必須。 • Full Simulationで統計的に十分なイベントを生成することはできない。 • 例:s=1nbのプロセス、10fb-1相当、1イベント5分を1ヶ月で生成する。(10-9x10x1015x5) / (1ヶ月=5x104) = 103CPU(10-9x10x1015x5) x 2MB/evt = 108MB = 100TB • Full Simulationのパフォーマンスを再現するように再調整が必要。 第一回LHC物理解析研究会
データアクセス ESD • AODは必要最小限の情報のみ保持。 • データ解析中にAODにない情報(例えばセル)にアクセスしようとすると、該当するESDを探し出し必要な情報を取得することができる。 • Athena環境では実現している。 AOD Analysis 第一回LHC物理解析研究会
データ生成 • グリッドを利用する。 • データ管理 • 実験データのReprocess • MCデータの生成 • “ローマ”ための公式データが生成されている。 • データチャレンジ(DC)プロジェクト:DC1、DC2(now)、DC3 • グリッド上で実験データをきちんとプロセスできるかどうか? • グリッド上でMCデータを生成できるかどうか? • グリッド上のデータを利用して解析できるかどうか? 等の検証するR&Dが行われている。 第一回LHC物理解析研究会
CERN グリッド 日本 CERN分室 第一回LHC物理解析研究会
我々の現状 第一回LHC物理解析研究会
流れ(現状) • ESDとAODはやっと姿を見せたところ。 • CBNT • Combined ntuple • ROOTファイル • CBNTを生成してROOTで解析している。 • 我々はこれでローマを目指す。 Generator Geant4 - simulation - digitization Fast simulation RAW Reconstruction ESD AOD Analysis CBNT 第一回LHC物理解析研究会
単位はMeVとmm 第一回LHC物理解析研究会
B.WebberTeV4LHC@FNAL Jet cone/kT Fragmentation N(N)LO ME+PS p p PDF PDF Underlying Event Generator周辺の話題 • Matrix Element • Grappa(日本製), Alpgen, MadGraphなどなど。 • General tool • Hadronization • Parton Shower • Pythia, Herwigなど • Sherpa • これらの道具を駆使してデータを生成している。 • Signal:Higgs & SUSY(mSugra) • BG:tt、W+njets、Z+njets、… 第一回LHC物理解析研究会
Higgsの話題:VBF H->tt • HiggsのFirst Discoveryを目指して! • Full Simulationでやるべきこと • TauIDの研究(進行中) • Et missingの研究 • Forward Jetの研究 • Fast Simulationでやるべきこと • Z+njetsの影響(進行中) 第一回LHC物理解析研究会
Forward Jets Tau 第一回LHC物理解析研究会
解析ツール • Particle ID関連は整備中@CERN • B-tagging … モニター中 • E/gamma • Jet & MissingEt … ここをやりたい。 • Muon • Tau … 参戦中 開発はどんどん進んでいる。 複数の開発が同時に進むことも多い。 どれも使おうと思えば使えるが、Performanceには?が多い。 ATLAS Physics TDR(1999)と比較して。 第一回LHC物理解析研究会
資源 • データ生成はICEPPの計算機で行っている。 • NonGrid • 約100CPUs • 約30TB • データはICEPPの計算機に存在する。 • ICEPPの計算機ではAthena環境が利用できる。 • CERNからミラーしている。 • 来年度からはCERN分室もフル活用。 • 我々(人の話)もCERNへお引越し。 第一回LHC物理解析研究会
まとめ • 解析環境 • 実験開始に向け整いつつある。 • データ生成と管理 • @グリッドを目指している。 • 自前の解析環境 • CERN & TOKYO • 資源:データ保持とそのReprocessは十分可能(30fb-1ぐらいまで) 第一回LHC物理解析研究会
予定 • ATLAS物理ワークショップ • 2005年6月7日ー11日@ローマ • 予想:Full simulationのValidationが中心 • アトラス物理本 • ポスト・ローマはこれ! • 2006年後半リリースを目指す。 • 実験データの解析(発見論文)のため、大きな貢献をすることが最重要課題。 第一回LHC物理解析研究会
…To CERN • 2007年に向け本拠地CERNへ 第一回LHC物理解析研究会