210 likes | 439 Views
情報数学1 第 3-2 章. 情報量と二進法での四則演算. 香川大学工学部 富永浩之 tominaga@eng.kagawa-u.ac.jp. 概 要. ■ 情報量と単位 ビットとバイト、キロ・メガ・ギガ・テラ ■ 情報量とデータ 基底表現と整除表現 ■ 多進数への変換 多進数への変換 ■ 整数の記数法 多進数からの変換 ホーナー法 ■ 符号付二進数の あ. 第 01 節 [1] 情報量と情報量の単位. ● 情報量の単位 ・ その 情報の存在により、何通りの異なる状態を区別できるかという尺度
E N D
情報数学1 第3-2章 情報量と二進法での四則演算 香川大学工学部 富永浩之 tominaga@eng.kagawa-u.ac.jp
概 要 • ■ 情報量と単位 • ビットとバイト、キロ・メガ・ギガ・テラ • ■ 情報量とデータ • 基底表現と整除表現 • ■ 多進数への変換 • 多進数への変換 • ■ 整数の記数法 • 多進数からの変換 ホーナー法 • ■ 符号付二進数の • あ
第01節 [1] 情報量と情報量の単位 • ● 情報量の単位 • ・ その情報の存在により、何通りの異なる状態を区別できるかという尺度 • ・ ある状態であるかないか(1か0か)を表すのに必要な情報を最小単位 • ・ これを1ビット[bit]といい、ビットを表す単位記号として、小文字の頭文字 bを用いる • ● ビット列 • ○ ビット列0と1の数字の列 010010, 1011 • ・ 長さ nのビット列は、 n ビットの情報を表し、 2n通りの異なる状態が区別される • ○ 自由桁二進数 通常の表記の二進数で、0を例外として、他は1から始まるビット列 • ○ 固定桁二進数 二進数の先頭に0を追加した表記も許すことにし、桁を揃える • n桁の固定桁二進数をnビット二進数ともいう • 1011[2]=11[10] は4ビットの情報であり、256 通りの中で11番目の状態を表している。 • 2ビット二進数の 00[2]=0[10] は、 通りの中で0番目の状態を表している。
第01節 [2] ビットとバイトの単位 • 8 b (ビット) = 1 B (バイト) • 現実の計算機の構造上、8ビット単位でデータ処理が基本 • 1バイトの情報量は、 2^8=256 通りの情報を区別する。 • 英数字は、1バイトの情報量があれば区別される。 • ハードディスクやメモリの容量は、普通、バイト単位で表す。 • 8 b = 1 B 256 ※ ASCIIコード文字(英数字) • 8ビットマイコン 色階調指定 • 16 b = 2 B 65,536 ※ JISコード文字(日本語文字) • 16ビットDOS ハイカラー表示 • 24 b = 3 B 16,777,216 ※ フルカラー表示 • 32 b = 4 B 約43億 ※ 32ビットOS(Windows) IPアドレス • 64 b = 8 B 約1800京 ※ 64ビット次世代OS • 128 b = 16 B 約3.4×10^38 ※ 次世代IPアドレス
第01節 [3] 情報量の上位単位 • ○ キロ 1KB= 1024B • ※ 原稿用紙1枚と1/4(約500字) • ○ メガ 1MB= 1024KB • ※ FDの容量 1.44MB(原稿用紙1800枚) • ○ ギガ 1GB= 1024MB ≒ 100万KB ≒ 10億B • ※ CD-ROMの容量 0.65GB=650MB(FD約450枚) ステレオ音声70分 • ○ テラ 1TB= 1024GB ≒ 100万MB ≒ 10億KB ≒ 1兆B • ※ ビデオ配信サーバなどの記憶容量(CD約1600枚 DVD約200枚 BD約) • ○ ペタ 1PB= 1024TB ≒ 100万GB ≒ 10億MB ≒ 1兆KB ≒ 1000兆B • ※ 大規模データベースサーバの記憶容量 • ○ エクサ 1EB= 1024PB≒ 100万TB ≒ 10億GB ≒ 1兆MB ≒ 1000兆KB
第02節 [1] 情報量と文字データ • ○ 英字 52個 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z • a b c d e f g h i j k l m n o p q r s t u v w x y z • ○ 数字 10個 0 1 2 3 4 5 6 7 8 9 • ○ 記号 32個 ! ? # $ % & | \ , . ; : @ ' " ` ^ ~ _ + - * / = < > ( ) [ ] { } • ○ 空白 1個 • 英語圏で必要な文字は、約100個程度 • これらの文字を区別するには、27=128 より、7ビットあれば十分 • これに、エラーチェック用の1ビットを加えると、 • 8ビットすなわち1バイトで1文字が表される • これが、計算機がバイト単位が基本となっている理由
第02節 [2] 情報量と文字データ • 英数字と記号および空白は、ASCIIコード文字と呼ばれる。 • 俗に、半角文字ということがある。 • 日本語をには、漢字、ひらがな、カタカナと文字種が多く、 • 1文字に2バイトが必要である。 • これらは、JISコード文字と呼ばれる。俗に、全角文字ということがある。 • 他の言語でも、2バイト以上必要な文字をマルチバイト文字という。 • ● 情報量の概算 • 日本人約1億2000万人分の電話番号の情報量を概算しよう。 • 電話番号は最大11桁であり、各桁はBDCでは4ビットで表されるから、44ビットとなる。 • よって、120,000,000×44÷8 = 660,000,000B ≒ 660MBであり、CD 1枚程度となる。 • 電話番号DBとして活用するには、氏名と電話番号の組として収録する必要がある。 • 氏名の長さは不定であるが、漢字10字以内と仮定すれば、1人につき20バイトとなる。 • よって、120,000,000×20 = 2,400,000,000B ≒ 2.4GBであり、DVD 1枚程度である。
第02節 [3] 情報量と画像データ • ● モノクロ画像データ ‥ 各画素(画面上のドット)の輝度情報 • ○ VGA 640×480 = 307,200 • ○ SVGA 800×600 = 480,000 • ○ XGA 1024×768 = • ○ SXGA 1280 × 1024 = • 計算機のディスプレイ上の画像は、ドット(画素)から構成されている。 • 各画素に白/黒の1ビットの情報量を割り当てれば、モノクロ二値の画像が表現される。 • 1画素に8ビットを割り当てれば、黒から白への輝度を256段階の階調として • 表現することができる。これをモノクロ階調という。
第02節 [4] 情報量と画像データ • ● カラー画像データ ‥ 光の三原色(RGB)の輝度情報の組合せ • ○ フルカラー 24ビット(RGB 8,8,8) 約1677万色 • ○ ハイカラー 16ビット(RGB 5,6,5) 65536色 • ○ 8ビット(RGB 3,3,2) 256色 • 色彩を表すために用いるビット数を色深度という。 人間の視覚は 緑に対する感度が高く青に対する感度が低い
第02節 [5] 情報量と画像データ • ● 第02-06節 スキャナ画像の情報量 [展開] • スキャナでは、解像度の単位として、dpiが使われている。 • これは、dot per inch の略であり、1インチ(2.54cm)当たりのドット数を意味している。 • 例えば、スナップ写真E判(11.7cm×8.3cm)を300dpiの解像度、フルカラー24ビットで取り込むと、 • (11.7÷2.54×300)×(8.3÷2.54×300)×24÷8÷1024÷1024=3.88 より • 、約4MBの情報量が必要になる。
第03節 [1] 情報量と音声データ • ● 音声(音波) ‥ 空気の振動(各時刻の振幅) • ○ A/D変換 アナログ波形(振幅量) ⇒ 離散近似 ⇒ デジタル信号 • ○ D/A変換 デジタル信号(ビット列) ⇒ 連続補間 ⇒ アナログ波形 • ● 音声データの標本化と量子化 • ○ 標本化(時間的)一定時間ごとに振幅量を記録 標本化周波数 • ○ 量子化(空間的)振幅量を離散値で近似 量子化ビット数 • ● 音声データの情報量 • ○ CDの音質 標本化 44,100Hz量子化 16bit (65536段階) ステレオ2ch(左右) • ○ 1秒間44,100×16×2 = 1,411,200 bit (÷8÷1024)= 172.2 KB • ○ 記録容量650MB 650×1024÷172.2 = 3865.‥ 秒 ≒ 約64分 • ○ 通信容量 1,411,200÷1024÷1024=1.34‥≒ 1.4 Mbps • 100Mbpの通信回線で74人まで
第03節 [2] 情報量と映像データ • ● 動画データの情報量 • 動画は、定期的な間隔で再生される静止画の列である。 • 動画の構成要素として再生される静止画をフレームという。 • 動画データが、アナログかデジタルかは、個々の静止画がアナログかデジタルかによる。 • したがって、LDはアナログであり、DVDはデジタルである。 • フレームを再生していく間隔すなわち標本化の周波数をフレームレートという。 • 人間の視覚の残像効果により、1秒間に30コマの割合で、 • 連続的にフレームを再生すれば、滑らかな動画として認識される。 • 例えば、320×240サイズで16ビットカラーの静止画データを • 1秒間に30コマの割合で再生するとすれば、 • 1秒間に 320×240×16×30=73,728,000 ビットで、73,728,000÷8÷1024=9 • すなわち9MBの情報量が必要となる。 • 動画の場合、実用的には、人間の視覚特性を考慮した大幅なデータ圧縮が必要となる。
第03節 [3] 情報量と映像データ • ● 第03-05節 マルチメディアデータの標準規格 [参考] • ○ MPEG-2 DVDの動画データの記録形式 高品位を保ちながら高圧縮 • 圧縮と解凍に高性能の処理装置を要求(現在は普通のPCでもOK) • ハイビジョンのデジタルテレビ放送では、MPEG-2が用いられている。 • なお、インターネット上での音声データの標準規格となっているMP3は、 • MPEG-2 Layer-3の略である。すなわち、MPEG-2規格の音声部分のみを利用している。 • やや古いメディアであるビデオCDでは、MPEG-1という規格を用いている。 • これは、MPEG-2より画質が劣る。 • また、インターネットテレビなど、通信容量が低くてもある程度の品質を保ち、 • ユーザからの操作を受け付ける双方向的な映像通信では、MPEG-4が採用されている。 • なお、Windowsや各種のソフトでは、独自のデータ形式を用いている場合がある。
第04節 [1] 二進法での加法と減法 • 二進法での加減算は、 • 各桁同士の計算結果を表す加法表および減法表に基づき、 • 筆算の形で行う。 • 加法表・減法表においては、 • 0-1=-1 のような1桁の数同士の単独の計算結果ではなく、 • 筆算の途中の各桁において、計算結果として現れる数字と、 • 繰上り、繰下りの有無を記入しておく。
第05節 [1] 二進法での乗法 • 二進法の乗法 = 乗法表(論理積) + 左桁シフト
第06節 ロシア乗算法と二分累乗法 43 × 29 101011 × 11101 • 43×29 = 43 × 1 1 1 0 1 [2] • = 43 × (1+4+8+16) • = 43 + (43×2)×2 + (43×4)×2 + (43×8)×2 • = 43 + 172 + 344 + 688 • = 1247 2倍 半分 奇偶 二進数での乗算
第07節 整数の記数法 • ● 符号付二進数 ‥ 符号桁 + 数値桁 in 固定桁 • ・ 整数の記数法には、符号と数値が必要 • ・ 符号付二進数では、符号も含め、ビット列(0/1のみ)として整数を表記 • ・ 上位桁の0を省略しない、固定長のビット列で考える • ・ 最上位での繰上りは、桁溢れ(オーバーフロー)となる • ・ 固定桁の最上位桁を符号桁に使う (0 正 1 負) • 0 0 0 0 0 0 0 1正数 • 10 0 0 0 0 0 1負数 • ・ 数値部分は、符号無二進数より1ビット減 (絶対値での範囲が縮小) • ・ 正負を含めた範囲は同じ • ・ 数値桁の解釈の相違で2通りの方式がある (絶対値表示 / 補数表示) • ・ どの方式も自然数の表記は、符号無二進数と同じ • ・ 符号付二進数として、通常は補数表示を採用
第08節 符号付二進数の方式 ○ 符号無[U]、絶対値表示[A]、補数表示[S] の相互変換 ○ ビット列の各方式での解釈 ○ 十進数からの各方式への変換 • ● 絶対値表示 • ・ 数値桁は絶対値 • ・ 変換は簡単 • ・ 加減算には別の算法が必要 • ・ 0に +0 と -0 の2つの表記が存在 • ・ 範囲は8ビットで -127 ~ +127 • +107 = 0110 1011 [A] • -107 = 1110 1011 [A] • 1100 1010 [U] = +202 • 1100 1010 [A] = -74 = -(202-128) ● 補数表示 ・ 数値桁は補数 ・ 変換には手順が必要 ・ 加算は符号無と全く同様 ・ 減算は反数の加算として実行 ・ 範囲は8ビットで -128 ~ +127 +107 = 0100 1011 [S] -107 = 1011 0101 [S] 1100 1010 [U] = +202 1100 1010 [S] = -54 = 202-256