1 / 23

実行頻度の偏りを利用した命令コード割当てによる命令 ROM の低消費電力化

実行頻度の偏りを利用した命令コード割当てによる命令 ROM の低消費電力化. ○ 井上弘士 1 V. Moshynaga 1  村上和彰 2 1 福岡大学 工学部 2 九州大学大学院 システム情報科学研究院. 発表手順. 1.はじめに 2.命令 ROM の消費エネルギー 3.低消費エネルギー化技術(従来手法) 4.低消費エネルギー化技術(提案手法) 5.評価 6.おわりに. はじめに . 組み込みシステムの低消費エネルギー化. E total = E cpu + E ram + E rom + E logic. 高機能化に伴う コード・サイズの増大.

gavan
Download Presentation

実行頻度の偏りを利用した命令コード割当てによる命令 ROM の低消費電力化

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 実行頻度の偏りを利用した命令コード割当てによる命令ROMの低消費電力化実行頻度の偏りを利用した命令コード割当てによる命令ROMの低消費電力化 ○井上弘士1V. Moshynaga1 村上和彰2 1福岡大学 工学部 2九州大学大学院 システム情報科学研究院 Koji Inoue 軽井沢WS

  2. 発表手順 1.はじめに 2.命令ROMの消費エネルギー 3.低消費エネルギー化技術(従来手法) 4.低消費エネルギー化技術(提案手法) 5.評価 6.おわりに Koji Inoue 軽井沢WS

  3. はじめに  組み込みシステムの低消費エネルギー化 Etotal = Ecpu + Eram + Erom + Elogic 高機能化に伴う コード・サイズの増大 アプリケーション プログラム Inst. ROM CPU Other Logic Data RAM Koji Inoue 軽井沢WS

  4. 最大約50%の低消費エネルギー化を達成* *)50%のビットライン・スイッチング回数を削減 はじめに  組み込みシステムの低消費エネルギー化 Etotal = Ecpu + Eram + Erom + Elogic 高機能化に伴う コード・サイズの増大 アプリケーション プログラム Inst. ROM CPU Other Logic Data RAM Koji Inoue 軽井沢WS

  5. Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー  BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS

  6. Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー  BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS

  7. Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー  BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS

  8. BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ 0 1 0 1 0 1 1 1 Ref. V Sense Amp. Sense Amp. Sense Amp. Sense Amp. 読出しデータ 命令ROMの消費エネルギー  Koji Inoue 軽井沢WS

  9. Sense Amp. Sense Amp. Sense Amp. Sense Amp. 命令ROMの消費エネルギー  BL0 BL1 BL2 BL3 Erom = Edec + Ewl + Ebl + Esa WL 0 0 0 0 • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ • センシング 0 1 0 1 0 1 1 1 Ref. V 読出しデータ Koji Inoue 軽井沢WS

  10. BL0 BL1 BL2 BL3 WL 0 0 0 0 0 1 0 1 CB CB UCB UCB 0 1 1 1 Ref. V Sense Amp. Sense Amp. Sense Amp. Sense Amp. 読出しデータ CB: Conforming Bit UCB: UnConforming Bit(ディスチャージ発生) 命令ROMの消費エネルギー  Erom = Edec + Ewl + Ebl + Esa • ビットライン・プリチャージ • アドレス・デコード • ワードラインの活性化 • ビットライン・ディスチャージ • センシング ビットライン・スイッチング回数は 格納された0/1パタンに比例 (つまり、読出されるUCB数に比例) Koji Inoue 軽井沢WS

  11. 従来の低消費エネルギー化手法  HSI: Horizontal Strip Inversion バス・インバーティング技術を活用してUCB数(0の数)を削減 反転フラグ(0:反転) 通常のROM HSI Adr.0 0 0 0 0 0 0 1 0 0 1 1 1 1 1 1 0 1 Adr.1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 0 Adr.2 0 1 1 1 1 0 1 0 0 1 1 1 1 0 1 0 1 Adr.3 1 0 0 0 0 0 1 1 0 0 1 1 1 1 1 0 0 Invert? Adr. 0, 1, 2, 3とアクセスした場合 #of UCBs = 8 + 2 #of UCBs = 16 Koji Inoue 軽井沢WS

  12. Encoding 110111 (1) 111011 (1) 111101 (1) 111110 (1) 111111 (0) Encoding 10111 (1) 11011 (1) 11101 (1) 11110 (1) 11111 (0) 提案低消費エネルギー化手法(1/2)  IE: Instruction Encoding 命令実行頻度の偏りを利用してUCB数(0の数)を削減 OP code binary pattern (#of UCBs) 出現頻度(OP-field) Base (dlxsim) Others BNEZ: SW: LW: ADDI: Special: 000101 (4) 101011 (2) 100011 (3) 001000 (5) 000000 (6) 出現頻度(Rs1,Rs2,Rd-field) Base (dlxsim) Others R31: R3: R2: R29: R1: 11111 (0) 00011 (3) 00010 (4) 11101 (1) 00000 (5) Koji Inoue 軽井沢WS Benchmark:mpeg2dec (executed on the fast dlx simulator)

  13. 提案低消費エネルギー化手法(2/2)  HSI + IE Op-, Reg-, Func-fieldにはIE、imm-fieldにはHISを適用 26bit-imm用 反転フラグ 16bit-imm用 反転フラグ 命令フォーマット(32ビット) R-type Op Op Rs1 Rd sha Func Rs2 Imm 16 Op I-type Op Op Rs1 Rd Imm 16 Imm 26 Op J-type Op Imm 26 Invert? HSI + IE Invert? Koji Inoue 軽井沢WS

  14. 命令コード割当てアルゴリズム  • 命令レベル・シミュレーションによりアプリケーションを実行 • プロファイル・データの採集 • 命令出現頻度、ならびに、レジスタ参照頻度に関するランキング・リストを作成 • Op, Func, Reg-fieldに関して、出現/参照頻度の高い順にUCBの少ない符号(0の少ないビットパタン)割り当て • Imm-field(即値)に関して、HSI手法を適用 • バイナリ・コード変換 Koji Inoue 軽井沢WS

  15. IE手法のまとめ  Koji Inoue 軽井沢WS

  16. 評価 -評価対象モデルー BASE:基本モデル(従来型ROM) dlxsimシミュレータで定義された命令コードを使用 ROMに格納される全てのデータは反転 HSI:ワード単位で反転/非反転を決定 命令コードはBASEと同じ IEsp:実行頻度に基づいた命令コードの割当て 即値フィールドに関してはBASEと同じと仮定 プログラムそれぞれに対し、個別に命令コードを決定 IEall: BASEに対し、実行頻度に基づいた命令コードの割当て 即値フィールドに関してはBASEと同じと仮定 全てのプログラム共通の命令コードを1種類決定 HSI+IEsp: HSIとIEspの組み合わせ HSI+IEall: HSIとIEallの組み合わせ Koji Inoue 軽井沢WS

  17. 評価 -命令ROMアクセス(1/2)ー 099.go 命令ROMアクセス 消費エネルギー 129.compress Normalized Energy Normalized Energy HSI IEsp IEall BASE HIS+IEsp HIS+IEall Invert-Flag Op-Field Func-Field Reg-Field Imm-Field HSI IEsp IEall BASE HIS+IEsp HIS+IEall Koji Inoue 軽井沢WS

  18. 評価 -命令ROMアクセス(2/2)ー mpeg2dec 命令ROMアクセス 消費エネルギー adpcmdec Normalized Energy Normalized Energy HSI IEsp IEall BASE HIS+IEsp HIS+IEall Invert-Flag Op-Field Func-Field Reg-Field Imm-Field HSI IEsp IEall BASE HIS+IEsp HIS+IEall Koji Inoue 軽井沢WS

  19. 評価 -入力データ依存性ー 異なる入力データ・セットにおける 命令ROM消費エネルギー削減率 Koji Inoue 軽井沢WS

  20. おわりに • 命令実行頻度の偏りを利用した命令ROMの低消費エネルギー化手法を提案 • 従来技術との組み合わせ(HSI+IE) • 最大約50%の低消費エネルギー化(ビットライン・スイッチング回数の削減) • データバス、命令デコーダにおけるオーバヘッド 今後の予定 より詳細な消費エネルギー・モデルを用いた評価 Koji Inoue 軽井沢WS

  21. Backup Slides….. Koji Inoue 軽井沢WS

  22. 評価 -データバス・オーバヘッドー データバス消費エネルギー Normalized Bus-Switching Activity IEsp IEall Koji Inoue 軽井沢WS

  23. 評価 -命令デコーダ・オーバヘッドー IEsp IEall IEsp w/o Renaming IEall w/o Renaming 命令デコーダ 消費エネルギー Normalized I-decoder Power *)全配線における負荷容量はαと仮定 **)各配線のスイッチング確立=バススイッチング確立と仮定 Koji Inoue 軽井沢WS

More Related