1 / 46

スイッチと MIN

スイッチと MIN. コンピュータアーキテクチャ特論 テキスト92ページ~13 0 ページ. バス結合型の問題点. メモリへのパスが単一. 一度に1つのプロセッサしかアクセスできない. 接続可能なプロセッサ数は最近の情勢では4. スイッチ結合型 UMA. ..... Local Memory. CPU. Interface. Switch. … .. Main Memory. Local Memory は持たない場合もある. スイッチ結合型 UMA. ..... CPU. Interface. Switch. … .. Main Memory.

asher
Download Presentation

スイッチと MIN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. スイッチとMIN コンピュータアーキテクチャ特論 テキスト92ページ~130ページ

  2. バス結合型の問題点 • メモリへのパスが単一 一度に1つのプロセッサしかアクセスできない 接続可能なプロセッサ数は最近の情勢では4

  3. スイッチ結合型UMA .... LocalMemory CPU Interface Switch …. MainMemory LocalMemoryは持たない場合もある

  4. スイッチ結合型UMA .... CPU Interface Switch …. MainMemory CPUに直結しているMainMemoryをHome Memoryと呼ぶ場合がある

  5. スイッチ結合型UMAの特徴 • 複数のメモリモジュールが同時にアクセス可能 • 行列のアクセス等科学技術計算に向いている • キャッシュのコンシステンシィを取ることが難しい

  6. クロスバスイッチ 交点がスイッチ n スイッチ数 (クロスポイント数)が nxm m

  7. ノンブロッキング性 行き先が異なれば 衝突しない n m

  8. X クロスバのハードウェア 量はクロスポイント数 だけでは決まらない 出線競合 各バスにはアービタが必要 n 入力にはバッファも 必要 m

  9. クロスバの利点欠点 • ノンブロッキング性 • 単純な構造、制御 • ハードウェア量が大きすぎるというのはある意味では嘘 • 1チップで閉じる性質があり、チップのピン数ネックとなり、拡張が困難

  10. MIN(MultistageInterconnectionNetwork)多段接続網 • 小規模なクロスバを多段に接続することにより、大規模なスイッチを構成 • 等距離間接網に属する • クロスポイント数はクロスバより有利 • バンド幅、レイテンシィともに不利になる

  11. 分類 • ブロッキング網:あて先が違っても衝突する:NlogNタイプ、π網他 • リアレンジブル網:衝突なしにスケジュールすることができる:Benes網、Clos網(構成による) • ノンブロッキング網:衝突なしが保証される:Clos網、Batcher-Banyan網

  12. MINの性質 • ランダム転送における通過率 • 並び替え(permutation)能力 • ブロック化能力(partition) • 耐故障性(fault torelance) • 制御法

  13. ブロッキング網 • NlogN網 • Omega網 • GeneralizedCube網 • Baseline網 • ランダム転送における通過率はまったく同じ • π網

  14. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Omega網 • スイッチングエレメント(この場合2x2のクロスバ)数は、1/2NxLogN

  15. 000 010 100 110 001 011 101 111 PerfectShuffle • 1ビット左にローテーションする 000 001 010 011 100 101 110 111 InverseShuffle 右ローテーション

  16. 000 000 001 001 010 010 011 011 0 100 100 1 101 101 1 110 110 111 111 1 0 1 DestinationRouting 1→3 あて先の番号を上の桁からチェック 0ならば上、1ならば下に進む 5→6

  17. 0→0 4→2 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Blocking X • 行き先が違っていても同一リンクを使う

  18. 00 00 01 01 2 10 10 11 11 20 20 1 21 21 30 30 31 31 Omega網の一般化(Delta網) 接続も同様のシャッフル 0 1 2 3 • スイッチングエレメントはサイズの大きいクロスバを利用するのが有利 0 1 2 3

  19. Omega網の特徴 • 結線パタンが全て同じ • destination routingが可能 • 有用なpermutationが多い • partitioning,拡張性はダメ

  20. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Generalized Cube 000 000 000 100 001 010 100 100 110 101 1bit違ったもの同士を同一スイッチに繋ぐ

  21. 000 000 001 001 010 010 0 011 011 1 0 100 100 101 101 110 110 111 111 Generalized Cubeのルーティング 出発地と目的地のビットを比較(Ex-Or): 一致(0):まっすぐ 不一致(1):クロス方向 001→011 010

  22. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Partitioning 互いに他の交信を妨害しない

  23. ブロック拡張性

  24. GeneralizedCube網の特徴 • ルーティングはsourceとdestinationの差を見る • partitioning,拡張性に優れる • destination routingはできない

  25. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Baseline網 最初のシャッフルはない 001 001 010 100 逆シャッフルする範囲を狭くしていく

  26. 000 000 001 001 1 010 010 011 011 100 100 1 101 101 0 110 110 111 111 Baseline網のDestinationRouting Omega網同様のDestinationRoutingが可能

  27. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Baseline網のPartitioning

  28. Baseline網 • Omega網とGeneralizedCube網の利点を併せ持つ • DestinationRouting • Partitioning • 拡張性 • NECのCenjuシリーズに用いられている

  29. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 π網 • Omega網を2つ接続

  30. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 ビット逆順並べ替え 0 1 2 3 0 4 2 6 1 5 3 7 • Omega網では衝突が起きる 4 5 6 7

  31. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 ビット逆順並べ替え 0 5 2 7 1 4 3 6 0 4 2 6 1 5 3 7 最初の網:上からの入力を優先 次の網:通常のDestinationRouting 衝突しない

  32. 並び替え能力の強化 • すべてのパタンの並び替えが可能=    リアレンジブル網 • シャッフル接続ではOmega網3段で可能 • シャッフル接続と逆シャッフル接続だと2段で可能:Benes網

  33. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 Benes網 • 最もハードウェアの少ないリアレンジブル網

  34. ノンブロッキング網 • Clos網 • m>n1+n2-1でノンブロッキング • m>=n2でリアレンジブル • そうでなければブロッキング

  35. Clos網 n1xm r1xr2 mxn2 ... ... r2 m r1 m=n1+n2-1:ノンブロッキング m=n2:リアレンジブル m<n2:ブロッキング

  36. Batcher網 5 7 4 0 1 2 6 3 0 4 5 7 6 3 2 1 5 7 0 4 2 1 3 6 0 1 2 3 4 5 6 7

  37. 7 4 0 1 2 6 3 0 4 5 7 6 3 2 1 5 7 0 4 2 1 3 6 0 1 2 3 4 5 6 7 Batcher-banyan網

  38. Batcher-banyan網の問題点 • 同一あて先のパケットが複数あると衝突が防げない。 • banyan網の拡張等の方法で解決可能

  39. Banyan網 • 出発地と目的地間にパスが1本のみ存在 • 途中ステージ数等は問わない • グラフ理論的アプローチ • SW-Banyan,CC-Banyan,BarrelShifter 不規則でもかまわない

  40. 分類 Clos網 Nonblocking Batcher Banyan網 Banyan Omega網 Benes網 Baseline網 π網 Rearrageble GeneralizedCube網 Blocking

  41. 耐故障性を持つ網 • 複数の経路を持たせる。 • 冗長性が必要。 • 実際は制御が困難 • 最近はチップ歩留まりの向上を狙う場合も多い。

  42. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 ExtraStageCube(ESC) • 1段余計に接続+Bypass X 故障があれば、もう一つのパスがある

  43. 000 000 001 001 010 010 011 011 100 100 101 101 110 110 111 111 バッファの構造 • 混雑した場合は、バッファに溜めておく

  44. 000 001 010 011 100 101 110 111 Hot spot Contention 混雑 • Tree状にバッファが飽和していく(Tree Saturation)

  45. Hot Spotの緩和のために • MessageCombining • 複数のパケットをひとまとめにする • 実装が難しい • 仮想チャネル • NORAのところで詳説 • コンパイラで調節

  46. 本日の課題 • 8入出力のOmega網について、DestinationRoutingが可能なことを証明(説明)せよ

More Related