1 / 39

卒業制作最終発表 LinkPoint: ネットワーク負荷軽減のために DNS による近接性を取り入れた P2P システム

卒業制作最終発表 LinkPoint: ネットワーク負荷軽減のために DNS による近接性を取り入れた P2P システム. 慶應義塾大学環境情報学部 黒宮 佑介( kuro ) 親 : 斉藤( ks91 )さん サブ親 : 重近( nazo )さん. 目的. P2P ネットワークにおいて  下位層トポロジを考慮した網の構築 を可能にする ネットワーク・計算機資源の有効活用 近接通信で完結するデータ転送 バックボーンへの負荷を低減 利便性の向上・新しいサービスの創発. 背景. P2P システムの普及

doli
Download Presentation

卒業制作最終発表 LinkPoint: ネットワーク負荷軽減のために DNS による近接性を取り入れた P2P システム

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 卒業制作最終発表LinkPoint: ネットワーク負荷軽減のためにDNSによる近接性を取り入れたP2Pシステム 慶應義塾大学環境情報学部 黒宮 佑介(kuro) 親: 斉藤(ks91)さん サブ親: 重近(nazo)さん

  2. 目的 P2Pネットワークにおいて  下位層トポロジを考慮した網の構築を可能にする • ネットワーク・計算機資源の有効活用 • 近接通信で完結するデータ転送 • バックボーンへの負荷を低減 • 利便性の向上・新しいサービスの創発 卒業制作最終発表

  3. 背景 • P2Pシステムの普及 • クライアント・サーバモデルとは異なる応用方法によって構築されたネットワークシステム • 特徴 • ○利点:負荷分散性・耐障害性に優れる • 動画などの大容量コンテンツの配信 • インターネットクラウドなどの高負荷な処理への対応 • ×欠点:管理・制御が難しい • 展開されるネットワークの全容を把握することが困難 • ネットワークトポロジが流動的 卒業制作最終発表

  4. 問題点 • P2Pシステムにおける管理性・制御性の欠如 • 不規則なP2Pネットワークトポロジを形成 • 下位層を考慮しないトポロジにより • 必要以上のトラフィックが発生しバックボーンを圧迫 同じデータなのに遠くから… 組織A 組織B 卒業制作最終発表

  5. 考え方:ネットワーク距離 • 下位層ネットワークトポロジ • そのものを取得するには大量のコストが必要 • 間接的に表現する指標 • ネットワーク距離「指標」を用いることでコストを低減 卒業制作最終発表

  6. P2Pネットワークにおけるネットワーク距離 • 既存手法ではRTTやHop Countが使用される • RTTはデータ転送パフォーマンスの向上のため本研究の目的には適さない • Hop Countは計測ができないノードが多い • トラフィックを集約するための指標が必要 卒業制作最終発表

  7. アプローチ • DNSを利用したネットワーク距離 • 管理ドメインに着目 • 管理ドメインのラベル: FQDN • 同一のドメイン名を持つノード • 単一の組織に属しているためネットワーク的に近い • 優先的に接続する • トラフィックの削減・集約が可能に a b c d 卒業制作最終発表

  8. FQDNの解析 • Fully Qualified Domain Name(FQDN) • 組織名・地理情報・ネットワークIDなどが含まれる • FQDNの解析手順 • ドメインレベルの判定一致しなかったところで終了 • レーベンシュタイン距離を計算自分のホスト名との差を求める レーベンシュタイン距離 ドメインレベル p1234-ipbf5678marunouchi.tokyo.ocn.ne.jp p1234-ipbf2222marunouchi.tokyo.ocn.ne.jp 卒業制作最終発表

  9. レーベンシュタイン距離 • 2つの文字列の類似度を示す数値 • 編集距離ともいわれる • 文字列操作 • 置換 • 挿入 • 削除 必要な手順の最小回数を求める • 類似度が低いほど大きな数値が出る 出典: Wikipedia 例)レーベンシュタイン距離: 3 kitten sitten (“k”を“s”に置換) sittin (“e”を“i”に置換) sitting (“g”を挿入して終了) 卒業制作最終発表

  10. FQDNによる優先度 • FQDNを解析、「優先度」としてスコアを求める • ドメインレベル • ドメインレベルごとに64点を加算 • レーベンシュタイン距離 • 64点からレーベンシュタイン距離を引いた点を加算 • 64点 • “.”で区切られる最大長(63文字)+1点 • FQDNを詳しく解析すること • ネットワーク距離を細かく分析することにつながる 卒業制作最終発表

  11. 評価 • 実測データを用いた検証 • FQDNによる優先度を実測データによって検証する • OCN • BBTEC • 提案アルゴリズムの検証 • FQDNの解析アルゴリズムを他のドメインのFQDNの命名規則をもとに検証する • 実ネットワークを用いた評価 • FQDNによる優先度によってトラフィックの影響範囲が集約される様子を評価する 卒業制作最終発表

  12. 実測データを用いた検証 • 実P2Pネットワーク上のノードに対して検証 • 対象: Winny・Share • 取得した実測データ • FQDN • Hop Count • 観測期間とノード数 • OCN:12/11~12/17(168時間) 35,000ノード • BBTEC:1/16~1/17(48時間) 13,750ノード 卒業制作最終発表

  13. Hop Countを指標として用いること • 本手法の目的 • インターネットにおけるトラフィックの局所化ネットワーク負荷の軽減 • ネットワーク負荷 • フロースループット×リンク数 • Hop Count • 経由するリンク数を示している • 小さくすることでネットワーク負荷は低減されるHop Countを小さくすることが重要 卒業制作最終発表

  14. OCNから取得した実測データ • Hop CountとFQDNによる優先度の比較 30 アルゴリズムの境界 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 12 分布: 粗 20 10 分布: 密 8 10 5 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp 295 300 305 310 315 320 0 64 128 192 256 320 384 優先度が高くなるにつれてHop Countが小さくなる 卒業制作最終発表

  15. BBTECから取得した実測データ • Hop CountとFQDNによる優先度の比較 アルゴリズムの境界 30 30 softbank************.bbtec.net 分布: 粗 分布: 密 20 20 10 10 178 180 182 184 186 188 190 0 64 128 192 優先度が高くなるにつれてHop Countが小さくなる 卒業制作最終発表

  16. Hop CountとFQDN優先度の一致率 • OCN • BBTEC • 一致率 • 実測データから任意の2つのノードを抜き出す • 優先度の高いノード=Hop Countが小さい 卒業制作最終発表

  17. 他のドメインの命名規則 • 地域名・IDのみが入るもの • p123a45.tokynt01.ap.so-net.ne.jp • nttkyo123456.tkyo.nt.ngn.ppp.infoweb.ne.jp • pl123.nas955.p-tokyo.nttpc.ne.jp • OFSfb-123p123-123.ppp11.odn.ad.jp • IPアドレスのみが入るもの • 123-45-67-89.eonet.ne.jp • 89.67.45.123.dy.bbexcite.jp • IPアドレスの一部が入るもの • q6789.dynamic.ppp.asahi-net.or.jp • 地域名・ID とIPアドレスが入るもの • FL1-123-45-67-89.tky.mesh.ad.jp • i123-45-67-89.s05.a015.ap.plala.or.jp • 123x45x67x89.ap123.gyao.ne.jp 卒業制作最終発表

  18. FQDN評価アルゴリズムの検証 • 本アルゴリズム • ドメインレベル+レーベンシュタイン距離 • 他のアルゴリズム • ドメインレベルアルゴリズム • レーベンシュタイン距離アルゴリズム • 最長一致アルゴリズム 卒業制作最終発表

  19. ドメインアルゴリズム • 特徴 • レーベンシュタイン距離を計算しなくて良い • ホスト名の類似度が低い場合同じ優先度になってしまう • 例) p3002-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 256pt: p3044-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 256pt: p8210-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 卒業制作最終発表

  20. ドメインアルゴリズム • OCNの場合 優先度256 30 12 20 10 8 10 5 2 0 64 128 192 256 208 224 240 256 272 288 304 320 Hop Countに関わらず1つの優先度に集約 卒業制作最終発表

  21. レーベンシュタイン距離アルゴリズム • 特徴 • ドメインレベルの判定を行う必要が無い • 本来優先度の低いノード群を選ぶ場合がある • 例)本アルゴリズム • 1位群: p****-ipbf****hodogaya.kanagawa.ocn.ne.jp • 2位群: p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp • 例)レーベンシュタイン距離 • 1位群: p****-ipbf****hodogaya.kanagawa.ocn.ne.jp • 2位群: p****-ipbf****kagawa.kagawa.ocn.ne.jp 卒業制作最終発表

  22. レーベンシュタイン距離アルゴリズム • OCNの場合 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 優先度32 p****-ipbf****kagawa.kagawa.ocn.ne.jp 30 15 12 20 10 8 10 5 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp 0 10 20 30 40 50 30 35 40 45 50 第2位群が神奈川から香川へ p****-ipbf****hodogaya.kanagawa.ocn.ne.jp 卒業制作最終発表

  23. 最長一致アルゴリズム • 文字列を右(後方)から最長一致する • 特徴 • 最も単純なアルゴリズム • 有効に働く場合と働かない場合がある • 例1) p3002-ipbf1710hodogaya.kanagawa.ocn.ne.jp • 有効に働く • 例2) softbank219209190116.bbtec.net • 有効に働かない(ネットワークIDがあるため) 卒業制作最終発表

  24. 最長一致アルゴリズム • OCNの場合 優先度 30 下位 上位 p****-adsao01yokonib1-acca.kanagawa.ocn.ne.jp 20 10 8 10 5 p****-ipbf****hodogaya.kanagawa.ocn.ne.jp 0 10 20 30 40 20 25 30 35 本アルゴリズムと同じ傾向に 卒業制作最終発表

  25. 最長一致アルゴリズム • BBTECの場合 優先度 30 30 下位 上位 10% 90% 20 20 10 10 Hop Count: 10以下 0 2 5 8 10 12 9 10 11 12 13 14 近いものも優先度が低くなる 卒業制作最終発表

  26. FQDN評価アルゴリズムの検証 • ドメインレベルアルゴリズム • ホスト名が違う場合に対応できない • レーベンシュタイン距離アルゴリズム • 第2位群の精度の判定を間違う場合がある • 最長一致アルゴリズム • 有効に働く場合と働かない場合がある • 本アルゴリズム • すべての場合に適用可能であり、汎用性がある 卒業制作最終発表

  27. 実装 • LinkPoint • ネットワーク距離にFQDNを用いたP2Pシステム • 動作 • メタ情報管理 • P2Pシステム内のファイルの情報を管理 • FQDNをメタ情報に付加 • データ転送 • メタ情報に含まれるFQDNから接続ノードを決定 • ネットワーク距離の近いノードからデータを取得 卒業制作最終発表

  28. 評価 • 実ネットワークを用いた実験 • 実装のテスト:データ転送時のノード選択 • 自分以外のノードが同じデータを保持自分にとって近いノードからデータを取得するか確認 • アルゴリズムの評価:データ拡散時のノード選択 • 各ノードがそれぞれ個別のデータを保持データ拡散時にデータ転送が近接で収束するか検証 • データを3種類用意 • 10MB, 100MB, 1000MB • ノードあたりのデータ転送量を取得 卒業制作最終発表

  29. 実験環境 卒業制作最終発表

  30. FQDNによる優先度 • 本アルゴリズムによって計算した優先度 卒業制作最終発表

  31. 実験結果(データ通常転送時) • 異なるドメイン間の結果 遠くからもデータを受信 bbexcite ocn bbtec 400 300 200 100MB 15 16 17 18 11 12 13 14 15 15 16 17 18 19 20 同じドメインがいない場合ネットワーク距離は関係ない 卒業制作最終発表

  32. 実験結果(データ通常転送時) • 同じドメイン間の結果 近くからデータを受信 dmc sfc ics 600 500 400 300 200 100MB 8 10 12 15 18 20 8 10 12 15 18 20 8 10 12 15 18 同じドメインがいる場合ネットワーク距離は有効に働く 卒業制作最終発表

  33. 実験結果(データ拡散時) • 異なるドメイン間の結果 遠くからもデータを受信 ①bbexcite ③ocn ⑤bbtec 3000 2000 1250 1500 1000 2000 750 1000 500 1000 500 250MB 15 16 17 18 11 12 13 14 15 15 16 17 18 19 20 同じドメインがいない場合ネットワーク距離は関係ない 卒業制作最終発表

  34. 実験結果(データ拡散時) • 同じドメイン間の結果 近くからデータを受信 ②dmc ④sfc ⑥ics 5000 5000 1250 4000 4000 1000 3000 3000 750 2000 2000 500 1000 1000 250MB 8 10 12 15 18 20 8 10 12 15 18 8 10 12 15 18 20 同じドメインがいる場合ネットワーク距離は有効に働く 卒業制作最終発表

  35. 実ネットワークによる実験 • 同じドメイン名を持つノードが存在しない場合 • ネットワーク距離は有効に働かない遠くからもデータを取得 • 同じドメイン名を持つノードが存在する場合 • ネットワーク距離は有効に働く近くからデータを取得 • ネットワーク負荷の軽減が可能 卒業制作最終発表

  36. まとめ • 目的: P2Pネットワークにおけるネットワーク資源の有効活用 • 問題点:不規則なネットワークトポロジ • アプローチ:DNSの管理ドメイン • FQDNに着目 • 評価:FQDNの解析アルゴリズム • ドメインレベル+レーベンシュタイン距離 • 汎用性・精度の面において優位(80%の一致率) 卒業制作最終発表

  37. 今後の展望 • 新しい指標の検討 • FQDN以外のパラメータの導入 • BGPのルーティング情報の利用 • 評価方法の検討 • スループット・セッション数に着目 • 研究成果の社会への貢献 • 様々なP2Pシステムへの対応 • ISPへの提言 • 近傍性の判定に有用になるようなFQDNの利用 卒業制作最終発表

  38. ご清聴ありがとうございました kuro@sfc.wide.ad.jp 卒業制作最終発表

  39. 参考文献 [1] ISPを取り巻く状況と提案 http://www.soumu.go.jp/joho_tsusin/policyreports/chousa/internet_policy/pdf/080627_2_si5-2.pdf 卒業制作最終発表

More Related