マイクロプロセッサ

マイクロプロセッサ 第７回コンピュータにおける算術論理演算（その３）関根　優年

除　算 2進数の除算商 1001 1001010 -1000 0010 0101 1010 -1000 10 除数被除数＝商×除数＋剰余 1000 被除数除算の各ステップ１．被除数の数字が１　　　⇒　除数を適切な位置にした値を　　　　　　被除数から引く剰余２．被除数の数字が０　　　⇒　何もしない基本的な流れは10進数の場合と同じ（長くなるので4ビットで記述)

除算アルゴリズムとハードウェアの第1のバージョン除算アルゴリズムとハードウェアの第1のバージョン開始１. 剰余レジスタから除数レジスタを引き、結果を剰余レジスタに収める除数右シフト 64ビット剰余を判定剰余<0 剰余≧0 商 64ビット ALU 左シフト 32ビット 2b. 剰余レジスタ＋除数レジスタ⇒剰余レジスタ商レジスタを左シフトし、右側の新しいビットを０制御剰余 2ａ. 商レジスタを左シフトし、右側の新しいビットを１書き込み 64ビット初期状態では３. 除数レジスタを1ビット右にシフト商レジスタ　０剰余レジスタ　右半分　32ビットの被除数　左半分０繰返回数の判定 33回未満 33回終了

例題）　第１の除算アルゴリズム 710÷210(01112÷00102)を計算せよ例題）答）商 3 剰余 1

除算アルゴリズムとハードウェアの第３のバージョン除算アルゴリズムとハードウェアの第３のバージョン開始除数１. 剰余レジスタを1ビット左にシフト 32ビット２. 剰余レジスタの左半分から除数レジスタを引き、結果を剰余レジスタの左半分に収める 32ビット ALU 左シフト剰余を判定剰余<0 剰余≧0 剰余制御右シフト書き込み 64ビット 3b. 剰余レジスタの左半分＋除数レジスタ⇒ 剰余レジスタの左半分剰余レジスタを左シフトし、右側の新しいビットを０ 3ａ. 剰余レジスタを左シフトし、右側の新しいビットを１初期状態では剰余レジスタ　右半分　32ビットの被除数　左半分０繰返回数の判定 33回未満 33回終了　：剰余レジスタの左半分を1ビット右にシフト

例題）　第３の除算アルゴリズム 例題） 710÷210(01112÷00102)を計算せよ答）商 3 剰余 1

符号付き除算　I １）除数・被除数の符号を記憶させる．２）両者の符号が異なる場合には、　　　絶対値に対する除算を行い，　　　商の符号を反転させる　　→　剰余の符号をどうするかが問題　　　　被除数　=　商　×　除数　＋　剰余被除数と除数の符号が違っても、演算で得られた商と剰余の絶対値は変わらないでほしい例）７ ÷ ２　　　　　　　⇒　商３, 剰余１（－７） ÷ ２　　　　⇒　商ー３, 剰余－１７ ÷（－２）　　　　⇒　商ー３, 剰余１（－７） ÷ （－２）　⇒　商３, 剰余－１

符号付き除算　II 除数と被除数の符合の積が商の符号となる，　　　　　　　剰余　=　被除数　－　商　×　除数　 =　－７　－　（－３×２）　=　－１しかし， =　－７　－　（－４×２）　=　＋１　もある．こうならないように，　　　　“被除数と除数の符号は同じでなければならない” という規則を適用する．ー（x÷y）　と（－x）÷yも共に，同じように，絶対値　|x|÷|y|　で計算して，後で，　　　　　　　商の符号＝被除数の符号×除数の符号　　を決めるようになる．　　

MIPSにおける除算 除算は基本的には乗算と同じハードウェアで実現 ⇒　除算命令終了時、剰余 : ３２ビットレジスタ(Hi) 商　：　３２ビットレジスタ(Lo) MIPS命令 div : 符号なし除算(divide)の命令 divu: 符号あり除算(unsigned divide)の命令除算結果をレジスタHi, Loに格納する命令（乗算と同じ） mflo : move from lo 命令（商） mfhi: move from hi 命令（剰余）オーバーフロー情報をソフトウェアで見知する必要あり。それ以外に０による除算をチェックする必要あり

データ処理と制御 データ処理：　データは経路（パス）を通っていくうちに処理される．この経路を　データーパス　という　　　　または，Register Transfer LevelModel　という記憶:　　データを一時的に記憶する　　　　レジスター，ラッチ　　　　　データを長期的に記憶する　　　　メモリ　　　　　制御：　　　　流れの経路の制御，処理内容の選択の制御　　　　　処理2 処理4 処理1 処理3 処理5

設計レベルと設計原理 機能設計：　命令と命令セット　　　　　　　　符号化の方式と計算方式　　構造設計：　システムのアーキテクチャー　　　　　　　　処理の流れの設計詳細設計，実現方式，　具現化（implementation）：　　　　　　　　論理素子を構成して実現する．　　　　　　　　論理素子を配置して素子間を配線する． CMOS素子等で論理素子を実現し，　　　　　　　　金属配線で繋ぐ　⇒　LSIパターンデータを作成 LSIを製造する　　　　　　　　設計原理：一般的な場合を高速化せよ単純性は規則性につながる

命令実行の制御の概要 全ての命令に必要とされる２つのステップ 1. メモリから命令をフェッチするために、プログラムカウンタの値をコードが　保持されているメモリに送る 2. 命令のレジスタフィールドに指定されるレジスタの値を読みだすロード・ストア命令 : メモリアドレスの計算整数算術論理演算命令 : 演算分岐命令 : 比較この後は、ALUを用いた処理が行われることがほとんど MIPS命令の実現方式の概念図レジスタ命令メモリデータ PC データ・メモリ ALU アドレスレジスタ番号命令アドレスレジスタ番号レジスタ番号データ

論理要素とクロック方式 MIPSの具体的な機能ユニットデータパス部：　組み合わせ論理要素(combinational element) －データの値に何らかの操作を与える　　　　　　　　　　　　　　例）　ALU ，PC，メモリ，レジスタ制御部：　状態論理要素(state element) －　状態を記憶する　　　　　　　　　　　　　　例）　命令・データメモリ、レジスタレジスタ命令メモリデータ PC データ・メモリ ALU アドレスレジスタ番号命令アドレスレジスタ番号レジスタ番号データ状態論理要素－最低でも入力２、出力１が必要　　　　　　　　（データ入力、タイミング信号、データ出力）

クロック方式 クロック信号: 時間を離散化する．読出し可能・書込み可能かを定義する信号：　読出し、書込みタイミングの分離　読出し、書込みタイミングが同時だと、両者の情報が交じり合い、不確定性を生む組み合わせ論理回路状態論理要素１状態論理要素２クロック信号

エッジトリガクロック方式の利点 エッジトリガクロック方式: クロック信号のエッジのみで状態更新を行う方式　　　　　　　　　　　　　　　　同一クロックサイクルで、読み出し・書込みを両方行えるクロック信号状態更新状態更新（立ち上がり動作で、状態更新を行うとした場合）状態論理要素組み合わせ論理回路書き込み読み出しエッジ立ち上がり以外で更新（エッジ立下り，エッジ立ち上がり）

データパスの構築 すべての命令：クロック・エッジから実行を開始し，次のクロックエッジまでに実行を完了する　⇒　一番実行時間が長い命令が実行できるように，　　　　　　　　　　　　　クロック幅を長くする．　　　⇒長い実行時間の命令は複数クロックで実行するようにする．　 • 　各命令ごとに，データを処理する部品を逐次的に並べる．　 • 　　　処理が似たものは同じような部品の配置になる．（R形式命令，．．．） • 　一時に，一つの命令しか実行しないので，共通に使える部品をまとめる． • 　命令ごとに異なる処理は，場合わけを制御する． • 　　　制御は後でまとめて設計することにし，データの処理手順だけに注目

プログラム命令を送出するデータパス 加算 4 命令メモリ命令アドレス PC 命令命令を格納し、それをアクセスするには状態論理要素が２つ、次の命令を計算するためには加算器が一つ必要命令アドレス必要となる論理要素命令メモリ PC 命令加算和プログラムカウンタ（命令アドレスを格納する）命令アドレスの計算命令を格納するデータパスの一部命令フェッチRead(PC) PC＝PC＋４

プログラム命令を送出するデータパス • module 記述 insAdr InstMem Inst module mem(input iAdr, output oData); reg [31:0] m [0: 1023]; assign oData = m[iAdr]; endmodule Reg [31:0] PC; PC

1bit ALU のHDL module ALU( input iA, iB, iC, input [1:0] cmd, output oS, oC ); wire wand, wor, waddr; assign wand = iA & iB; assign wor = iA | iB; Fadder adder(.iA(iA), .iB(iB), .iC(iC), .oC(.oC), .oS(wadder)); assign oS = mux(cmd, wand, wor, wadder);

MULTIPLEXER(MUX）のHDL記述 function mux( input [1:0] cmd, input iand, ior, iadder); begin case (cmd) 2’b00: mux = iand; 2’b01: mux = ior; 2’b10: mux = iadder; endcase end endfunction endmodule

Add 4 InstMem 命令アドレス PC Inst プログラム命令を送出するデータパス always @(posedge CLK)begin if(!nReset)begin PC <= 32’b0; end else begin PC <= oS0; end end assign insAdr = PC; ALU alu0(.iA(PC), iB(32’b4), iC(0), icmd(2’b10), .oC(wC0), .oS(oS0));

プログラム命令を送出するデータパス mem instMem(.iAdr(insAdr), .oData(Inst)); Inst を解読して、　レジスタA,B,を定める ALU alu1(.iA(wa), iB(wb), iC(wc), icmd(wcmd), oS(wS), oC(wC) );

算術論理演算命令のデータパス 5 5 5 R形式命令（算術論理演算命令）のデータパス　レジスタを読出し、ALUで演算し、演算結果をレジスタに書き込む 6ビット 5ビット 5ビット 6ビット 5ビット 5ビット必要となる論理要素 rs rt データ読出アドレス読出 reg１レジスタ ALU操作 3 レジスタ番号 ALU 読出アドレス読出 reg2 ゼロ判定書込アドレス ALU ALU結果書込データ acm データ RegWrite

データパスでの流れ 命令メモリ（レジスタファイル） PC　⇒ 6ビット 5ビット 5ビット 6ビット 5ビット 5ビット • どこかで命令が • 　解読され， • 　制御信号が • 　出されている． • データ出力の • 　ゲートを制御 • 　する ALU操作 3 読出アドレス読出 reg１レジスタゼロ判定読出アドレス ALU 書込アドレス ALU結果命令読出 reg2 書込データ RegWrite

assign oDATA = m[PC] assign opcode = oData[31:26]; assign rs = oData[25:21]; assign rt = oData[20:16]; assign rd = oData[15:11]; assign shant = oData[10: 6]; assign func = oData[ 5: 0]; 命令メモリ（レジスタファイル） PC　⇒ 6ビット 5ビット 5ビット 6ビット 5ビット 5ビット

register register( input [4:0] rs, rt, rd, input [31:0] wData, output [31:0] A, B , input RegWrite ); 読出アドレス読出 reg１レジスタ読出アドレス書込アドレス読出 reg2 書込データ RegWrite

ロード／ストア命令のデータパス 32 16 必要となる論理要素（追加分）符号拡張 MemWrite 読出アドレス読出データデータメモリ書込アドレス書込データ例) lw $t1,offset($t2) 　（$t2の値）+offsetを行う際に offsetを16ビットから32ビットに符号拡張 MemRead データパス ALU操作 3 読出 reg１読出 reg１レジスタ命令 MemWrite ゼロ判定読出 reg2 ALU 読出データデータメモリ書込 reg アドレス ALU結果読出 reg2 書込データ書込データ RegWrite 符号拡張 32 16 MemRead

浮動小数点と科学記数法 数値演算には、小数の表現はどうする？固定小数点 X = a+b 例） 44.125 (8ビット整数　、8ビット小数） b a 00101100 00100000 小数部分整数部分 44 0.125 小数点の位置が固定浮動小数点固定小数点では、表現可能な範囲が狭い X = b x 2a b a 指数部分仮数部分符号次のような表記を2進法に適用する小数点の位置が浮動 2.4888 x 1058 指数部分仮数部分正規化

浮動小数点表現形式の数値表現I IEEE754による表現:(-1)S x (1+仮数) x 2(指数-ゲタ) 単精度浮動小数点形式(32bit) (Cではfloat型に相当) LSB MSB ゲタ=127 S 指数仮数 1bit 8bit 23bit 符号：　Sは浮動小数点表現による数値の符号仮数：　数値が0以外に必ず存在する先頭の1を仮数では持たない指数：　２の補数表現のままでは，-1=11111111,1=00000001　であり，　　　　　最上位ビットで，指数の大小比較が出来ない．　　⇒　　下駄を履かせる．　　　　　最も小さな負の指数を　　0000…02に設定し、　　　　　最も大きな正の指数を　　1111…12に設定する．

浮動小数点表現形式の数値表現II 倍精度浮動小数点形式(64bit) (Cではdouble型に相当) ゲタ=1023 S 指数 52bit 仮数 11bit 1bit 単精度(singleprecision）では28⇒256/2=128(10000000) が中心値　下駄は　128-1=127=01111111，　2128 = 3.4x1038 倍精度(doubleprecision)では，　211=2048/2=>1024が中心値，下駄は　1024-1=1023，　　　21024 = 1.8x10308 これ以上の数値はオーバーフローこれ以下の数値はアンダーフロー

例題）浮動小数点形式による表現 例題)-0.75を単精度、倍精度(IEEE754)で表現する答） -0.75 = - (1 x 0.5 + 1 x 0.25) = -1.12 x 2-1 単精度　:S=1, 仮数=0.12, 指数=127-1=126 10111111 01000000 00000000 00000000 倍精度　:S=1, 仮数=0.12, 指数=1023-1=1022 10111111 11101000 00000000 00000000 00000000 00000000 00000000 00000000 例題)単精度(IEEE754)で表現する 11000000 10100000 00000000 00000000を10進数に答）単精度　:S=1, 仮数=0.012=0.25,指数=129 (-1)1 x (1+ 0.25) x 2(129-127) = -1.25x 4 = -5.0

浮動小数点加算 例）　9.99910×101 + 1.61010×10-1（仮数を4桁、指数を2桁と仮定した10進の例）ステップ１）小数点の位置合わせ 9.99910×101　⇒　 9.99910×101 1.61010×10-1⇒　 0.01610×101 指数が大きい方に合わせるステップ２）仮数の加算 9.99910×101 + 0.01610×101＝　10.015× 101 ステップ３）値の正規化 10.015× 101 ＝ 1.0015× 102 ステップ４）仮数の有効桁あわせ 1.0015× 102 ⇒ 1.002× 102 (四捨五入）もし、四捨五入して桁が増えた場合はステップ３へ

浮動小数点数の加算専用の算術演算ユニット

IEEE754：浮動小数点表現 WilliamKahan　１９５３年トロント大学学部在学中にプログラムを習得 1960：　IBM７０９０，FORTRANを利用航空大学の大学院生が翼の安定性，失速の研究（シミュレーション）単精度，倍精度でも結果は同じで，翼は失速した． Kahanが対数プログラムの新バージョンを作り，実行．　　今度は，単精度でも，徐々に失速するとの結果が出た． IBM７０９０から７０９４に更新，倍精度浮動点小数ハードが不可．　　倍精度で計算した時に限って，突然の失速が発生する．解明には膨大な時間が必要であった．倍精度用のガード桁がなかった．ユーザは1.0-x　の変わりに，　（０．５－ｘ）+0.5と記述してガード桁の不備を回避

マイクロプロセッサ

マイクロプロセッサ

Presentation Transcript