320 likes | 433 Views
キャッシュ・リーク電力削減 アルゴリズムに関する定量的評価. 福岡大学 ●小宮礼子 井上弘士 モシニャガ・ワシリー 九州大学 村上和彰. 発表手順. はじめに キャッシュ・リーク削減手法 切り替えアルゴリズムとその分類 比較対象モデルの決定 評価 おわりに. はじめに. プロセッサの消費電力 =リーク消費電力+動的消費電力. ARM-110. 70%. プロセッサ中のリーク電力の割合 *. Power: 43 %. キャッシュ・メモリのリーク消費電力削減が必要 !!.
E N D
キャッシュ・リーク電力削減アルゴリズムに関する定量的評価キャッシュ・リーク電力削減アルゴリズムに関する定量的評価 福岡大学 ●小宮礼子 井上弘士 モシニャガ・ワシリー 九州大学 村上和彰
発表手順 • はじめに • キャッシュ・リーク削減手法 • 切り替えアルゴリズムとその分類 • 比較対象モデルの決定 • 評価 • おわりに
はじめに プロセッサの消費電力 =リーク消費電力+動的消費電力 ARM-110 70% プロセッサ中のリーク電力の割合* Power: 43 % キャッシュ・メモリのリーク消費電力削減が必要!! * Fred Pollack (Intel Fellow): New Microarchitecture Challenges in the Coming Generations of CMOS Process Technologies [Micro32]
キャッシュ・リーク削減手法 リーク削減方式 従来方式 sleepモード (低リーク・低速) awakeモード (高速・高リーク) • 共通点 • ある粒度単位でsleepモードとawakeモードを用意 • sleepモード領域が増加→リーク削減 • sleepモードへのアクセス→ペナルティによる性能低下 • 使用されない領域のみsleepモードへ変更
相違点 • 各モードを適用する範囲 • sleepモード時のデータ取り扱い • モード切替えのタイミング →粒度 → データ → アルゴリズム • <粒度> • ライン • セット • ウェイ • キャッシュ全体 • <データ> • 破壊 リーク0 ,ミス数増加 • 非破壊 リーク極少,ミス数変化なし 複雑 小 制御 リーク 簡単 大
研究目的 • 問題点 • 大域的な整理なし • 各手法の相互評価なし 研究目的: リーク削減アルゴリズムの分類と 定量的評価 • 研究手段 • リーク削減手法の大域的分類 • 各手法の定量的評価 • 粒度はライン単位, データ保持状態は非破壊型に固定
リーク削減アルゴリズム • Sleep切替アルゴリズム • 対象ラインの状態を「低リーク/低速モード」へ変更 • 将来、参照されないであろうラインを検出 • Awake切替アルゴリズム • 対象ラインの状態を「高リーク/高速モード」へ変更 • 近い将来、参照されるであろうラインを検出 リーク消費エネルギーと性能オーバヘッドに影響
非同期 同期 t T Time - Window No - Time - Window 切り替えアルゴリズムの分類 Sleepモードへの切替えアルゴリズム
< TW 同期型 > 判定時期 t T モード 切替 え 判定期間 < TW 非同期型 > 判定時期 t T モード 切替 え 判定期間 < NTW 非同期型 > 判定時期 t モード 切替 え 判定期間 < NTW イベント 型 > 判定時期 t モード 切替 え 判定期間 イベント 発生 条件成立 T : Time - Window 切替えタイミング
ZonC ベンチマーク 入力 プログラム SPARC シミュレータ 抽出 アドレス 実行 サイクル トレース トレース 入力 出力 実行時間 リーク 削減率 増加率 キャッシュ ・ シミュレータ 評価 • ベンチマーク:SPEC2000 • (int 12個,float 14個) • SPARCプロセッサ (アウト・オブ・オーダ実行) • 128KB,連想度2 ,データL1キャッシュ • 性能・リーク消費エネルギーの測定 • sleepラインへのアクセス・ペナルティ (SHP = Sleep Hit Penalty) →1~3cycle • sleep/awakeモードでの • リーク消費エネルギー • →0.08 : 1 K.Flautner, “Drowsy Caches: Simple Techniques for Reducing Leakage Power,” Proc. of the 29th Int, Symp. on Computer Architecture, pp.148-157, May 2002.
消費エネルギー・モデル LEtotal = CSize × CC × LEbit キャッシュ・サイズ(128K) プログラム実行時間:CC = CCconv + CCextra 削減方法なし 増加実行時間 サイクル当たりのSRAMセルリーク消費エネルギー: LEbit = SR × LEsbit + (1-SR) × LEabit 1bit-sleep-SRAMセル平均リーク消費エネルギー →0.08LEabit キャッシュ内のsleepモード部分の割合
SHPがリーク消費エネルギー削減率に与える影響(L-S)SHPがリーク消費エネルギー削減率に与える影響(L-S)
消費エネルギー・モデル LEtotal = CSize × CC × LEbit キャッシュ・サイズ(128K) SHPにより増加!! プログラム実行時間:CC = CCconv + CCextra 削減方法なし 増加実行時間 サイクル当たりのSRAMセルリーク消費エネルギー: LEbit = SR × LEsbit + (1-SR) × LEabit 1bit-sleep-SRAMセル平均リーク消費エネルギー →0.08LEabit キャッシュ内のsleepモード部分の割合
おわりに • まとめ • モード切替えアルゴリズムの分類 • 比較評価 • sleepアクセス・ペナルティの影響 • →リーク削減率・実行時間へ悪影響を与える • 各アルゴリズム比較 →sleep : 無条件, awake : Load/Store命令発行 • 今後の課題 • 未評価アルゴリズム・粒度・データの評価 • 実行時間増加による性能低下を抑える • 制御回路を含めた評価 • マルチスレッド環境下での評価
ZonCプロセッサ・モデル • SPARC64プロセッサ • トレースドリブン • Out-of-order実行方式 • ノード数 1 • CPU数 1 • コア数 1 • CPUのクロック周波数 1250MHz • ウォームアップ命令数 3,000,000 • 測定対象命令数 6,000,000