230 likes | 342 Views
実行頻度の偏りを利用した命令コード割当てによる命令 ROM の低消費電力化. ○ 井上弘士 1 V. Moshynaga 1 村上和彰 2 1 福岡大学 工学部 2 九州大学大学院 システム情報科学研究院. 発表手順. 1.はじめに 2.命令 ROM の消費エネルギー 3.低消費エネルギー化技術(従来手法) 4.低消費エネルギー化技術(提案手法) 5.評価 6.おわりに. はじめに . 組み込みシステムの低消費エネルギー化. E total = E cpu + E ram + E rom + E logic. 高機能化に伴う コード・サイズの増大.
E N D
実行頻度の偏りを利用した命令コード割当てによる命令ROMの低消費電力化実行頻度の偏りを利用した命令コード割当てによる命令ROMの低消費電力化 ○井上弘士1V. Moshynaga1 村上和彰2 1福岡大学 工学部 2九州大学大学院 システム情報科学研究院 Koji Inoue 軽井沢WS
発表手順 1.はじめに 2.命令ROMの消費エネルギー 3.低消費エネルギー化技術(従来手法) 4.低消費エネルギー化技術(提案手法) 5.評価 6.おわりに Koji Inoue 軽井沢WS
はじめに 組み込みシステムの低消費エネルギー化 Etotal = Ecpu + Eram + Erom + Elogic 高機能化に伴う コード・サイズの増大 アプリケーション プログラム Inst. ROM CPU Other Logic Data RAM Koji Inoue 軽井沢WS
最大約50%の低消費エネルギー化を達成* *)50%のビットライン・スイッチング回数を削減 はじめに 組み込みシステムの低消費エネルギー化 Etotal = Ecpu + Eram + Erom + Elogic 高機能化に伴う コード・サイズの増大 アプリケーション プログラム Inst. ROM CPU Other Logic Data RAM Koji Inoue 軽井沢WS
Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS
Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS
Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS
BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ 0 1 0 1 0 1 1 1 Ref. V Sense Amp. Sense Amp. Sense Amp. Sense Amp. 読出しデータ 命令ROMの消費エネルギー Koji Inoue 軽井沢WS
Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ • センシング 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS
BL0 BL1 BL2 BL3 WL 0 0 0 0 0 1 0 1 CB CB UCB UCB 0 1 1 1 Ref. V Sense Amp. Sense Amp. Sense Amp. Sense Amp. 読出しデータ CB: Conforming Bit UCB: UnConforming Bit(ディスチャージ発生) 命令ROMの消費エネルギー Erom = Edec + Ewl + Ebl + Esa • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ • センシング ビットライン・スイッチング回数は 格納された0/1パタンに比例 (つまり、読出されるUCB数に比例) Koji Inoue 軽井沢WS
従来の低消費エネルギー化手法 HSI: Horizontal Strip Inversion バス・インバーティング技術を活用してUCB数(0の数)を削減 反転フラグ(0:反転) 通常のROM HSI Adr.0 0 0 0 0 0 0 1 0 0 1 1 1 1 1 1 0 1 Adr.1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 Adr.2 0 1 1 1 1 0 1 0 0 1 1 1 1 0 1 0 1 Adr.3 1 0 0 0 0 0 1 1 0 0 1 1 1 1 1 0 0 Invert? Adr. 0, 1, 2, 3とアクセスした場合 #of UCBs = 8 + 2 #of UCBs = 16 Koji Inoue 軽井沢WS
Encoding 110111 (1) 111011 (1) 111101 (1) 111110 (1) 111111 (0) Encoding 10111 (1) 11011 (1) 11101 (1) 11110 (1) 11111 (0) 提案低消費エネルギー化手法(1/2) IE: Instruction Encoding 命令実行頻度の偏りを利用してUCB数(0の数)を削減 OP code binary pattern (#of UCBs) 出現頻度(OP-field) Base (dlxsim) Others BNEZ: SW: LW: ADDI: Special: 000101 (4) 101011 (2) 100011 (3) 001000 (5) 000000 (6) 出現頻度(Rs1,Rs2,Rd-field) Base (dlxsim) Others R31: R3: R2: R29: R1: 11111 (0) 00011 (3) 00010 (4) 11101 (1) 00000 (5) Koji Inoue 軽井沢WS Benchmark:mpeg2dec (executed on the fast dlx simulator)
提案低消費エネルギー化手法(2/2) HSI + IE Op-, Reg-, Func-fieldにはIE、imm-fieldにはHISを適用 26bit-imm用 反転フラグ 16bit-imm用 反転フラグ 命令フォーマット(32ビット) R-type Op Op Rs1 Rd sha Func Rs2 Imm 16 Op I-type Op Op Rs1 Rd Imm 16 Imm 26 Op J-type Op Imm 26 Invert? HSI + IE Invert? Koji Inoue 軽井沢WS
命令コード割当てアルゴリズム • 命令レベル・シミュレーションによりアプリケーションを実行 • プロファイル・データの採集 • 命令出現頻度、ならびに、レジスタ参照頻度に関するランキング・リストを作成 • Op, Func, Reg-fieldに関して、出現/参照頻度の高い順にUCBの少ない符号(0の少ないビットパタン)割り当て • Imm-field(即値)に関して、HSI手法を適用 • バイナリ・コード変換 Koji Inoue 軽井沢WS
IE手法のまとめ Koji Inoue 軽井沢WS
評価 -評価対象モデルー BASE:基本モデル(従来型ROM) dlxsimシミュレータで定義された命令コードを使用 ROMに格納される全てのデータは反転 HSI:ワード単位で反転/非反転を決定 命令コードはBASEと同じ IEsp:実行頻度に基づいた命令コードの割当て 即値フィールドに関してはBASEと同じと仮定 プログラムそれぞれに対し、個別に命令コードを決定 IEall: BASEに対し、実行頻度に基づいた命令コードの割当て 即値フィールドに関してはBASEと同じと仮定 全てのプログラム共通の命令コードを1種類決定 HSI+IEsp: HSIとIEspの組み合わせ HSI+IEall: HSIとIEallの組み合わせ Koji Inoue 軽井沢WS
評価 -命令ROMアクセス(1/2)ー 099.go 命令ROMアクセス 消費エネルギー 129.compress Normalized Energy Normalized Energy HSI IEsp IEall BASE HIS+IEsp HIS+IEall Invert-Flag Op-Field Func-Field Reg-Field Imm-Field HSI IEsp IEall BASE HIS+IEsp HIS+IEall Koji Inoue 軽井沢WS
評価 -命令ROMアクセス(2/2)ー mpeg2dec 命令ROMアクセス 消費エネルギー adpcmdec Normalized Energy Normalized Energy HSI IEsp IEall BASE HIS+IEsp HIS+IEall Invert-Flag Op-Field Func-Field Reg-Field Imm-Field HSI IEsp IEall BASE HIS+IEsp HIS+IEall Koji Inoue 軽井沢WS
評価 -入力データ依存性ー 異なる入力データ・セットにおける 命令ROM消費エネルギー削減率 Koji Inoue 軽井沢WS
おわりに • 命令実行頻度の偏りを利用した命令ROMの低消費エネルギー化手法を提案 • 従来技術との組み合わせ(HSI+IE) • 最大約50%の低消費エネルギー化(ビットライン・スイッチング回数の削減) • データバス、命令デコーダにおけるオーバヘッド 今後の予定 より詳細な消費エネルギー・モデルを用いた評価 Koji Inoue 軽井沢WS
Backup Slides….. Koji Inoue 軽井沢WS
評価 -データバス・オーバヘッドー データバス消費エネルギー Normalized Bus-Switching Activity IEsp IEall Koji Inoue 軽井沢WS
評価 -命令デコーダ・オーバヘッドー IEsp IEall IEsp w/o Renaming IEall w/o Renaming 命令デコーダ 消費エネルギー Normalized I-decoder Power *)全配線における負荷容量はαと仮定 **)各配線のスイッチング確立=バススイッチング確立と仮定 Koji Inoue 軽井沢WS