1 / 23

Google のページランク

S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. Google のページランク. 基本的な仕組は数学的 グラフの行列による表現 隣接行列(推移行列、遷移行列) 固有値と固有ベクトル. 行列の上と左の W, S, C, G は注釈 であり行列に含まれない. S 学部. C 学科. W 大学. G 研究室. WEB ページのリンクの関係. 隣接行列を転置する. 隣接行列       を 転置 する リンクを「出す」側から「受ける」側へ. 1. 1. 1. 1/3. 1/3. S 学部. C 学科. 1/3. W 大学.

gordon
Download Presentation

Google のページランク

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. S学部 C学科 W大学 G研究室 WEBページのリンクの関係 Googleのページランク • 基本的な仕組は数学的グラフの行列による表現隣接行列(推移行列、遷移行列)固有値と固有ベクトル 行列の上と左のW, S, C, Gは注釈であり行列に含まれない

  2. S学部 C学科 W大学 G研究室 WEBページのリンクの関係 隣接行列を転置する • 隣接行列       を転置するリンクを「出す」側から「受ける」側へ

  3. 1 1 1/3 1/3 S学部 C学科 1/3 W大学 G研究室 WEBページのリンクの関係 隣接行列から推移確率行列へ • 列(column)の総和が1または0になるように調整ページの評価値をリンク先に渡す

  4. 推移確率行列の固有値と固有ベクトル • 固有値λと固有ベクトルr • 行列 M を掛ける(乗算)ということは、グラフの辺に沿って(確率的に)推移するということである • 固有ベクトルの各要素は M を掛けても定数倍しか変化しない。(安定している)固有ベクトルの各要素がランクになる(ただし要素の和が1となるように正規化する)

  5. 2/9 S学部 C学科 1/3 1 1 1/3 1/3 W大学 G研究室 1/3 1/3 固有ベクトルの具体例 • GNUOctaveを使って計算する。固有値λ=1が最大の固有値であり、固有ベクトルは下の左のようになる。 • これを正規化したページランクは上の右である。 ページランクを記入した図 1/9

  6. S学部 C学科 W大学 G研究室 Googleにおける工夫 • サイズの大きな疎(sparse)行列の固有ベクトルの計算 • ユーザがランダムにページを渡り歩くと仮定

  7. S学部 C学科 W大学 G研究室 Googleにおけるページランク • 次の行列の固有ベクトルを求めて、要素の和が1になるように正規化する。

  8. より深く調べるために • 本資料の例題は簡単にするために4つのサイトに閉じていた。現実のPageRankは早稲田大学(8/10)、理工学部(6/10)、CS学科(5/10)、後藤研(4/10)。 • 次の資料が参考になるhttp://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html本資料は上記を参考にした。ただしOctaveのスクリプトは若干改良した。 • Googleの創始者による論文も入手できる。Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', 1998,http://www-db.stanford.edu/~backrub/pageranksub.ps Taher H. Haveliwala, 'Efficient Computation of PageRank', Stanford Technical Report, 1999,http://dbpubs.stanford.edu:8090/pub/1999-31

  9. 特集:情報数学の演習問題 • 2006年度の定期試験問題の解答を解説します。2007年度の諸君の勉強の参考にして下さい。 • 次の事実に注意してください。2004年度の金曜日(前半)の担当は上田和紀教授、2005年度から担当を交代して後藤滋樹です。 • 本日の授業では3題を解説します。残り2題は来週以降の授業の範囲です。順次解説する予定。

  10. 問1.集合 X={ 1, 2, 3, 4, 5 }, 集合 Y={ 3, 5, 7 }とするとき、次の(1-1)~(1-6)の集合を外延的に表現せよ。 • ヒント: 記号の意味を覚えておく必要がある

  11. 問1.解答 • ヒント: 各集合の要素の数を考えてみる

  12. 問2.自然数の集合 N は無限集合である。(2—1) N 2=N×Nに属する要素(元)を3つ以上具体的に記述せよ。(2—2) N 2が可算無限集合 (enumerable set, countable set) であることを示すには、次の関数 f (x,y)を使えば良い。f (x,y)={(x+y)2+3x+y}÷2具体的に、この関数をどのように使うのか説明せよ。 • ヒント: N 2という表記法を誤解しないように

  13. (2—1) 解答 (次は解答の一例である。正解は、これに限らない。)<0,0>, <0,1>, <1,0>. (2—2) 解答関数 f(x,y)はNからN2への全単射である。よってNとN2とは対等で同じ濃度を持つ。集合Nが可算無限集合であるから、集合N2も可算無限集合である。

  14. 問3.次の(3—1)~(3—4)で定義する各々の二項関係は、(a)反対称律、(r)反射律、(s)対称律、(t)推移律のどれを満たすか? (3—1)~(3—4)の各々について、満たす性質すべてを記号(a, r, s, t)で答えよ。(3—1) Aは2次元平面上のすべての直線の集合で、関係 Rは「直線 xと直線 yが平行である」と定義される。

  15. (3—2) Aは自然数の集合で、関係Rは「自然数 xは自然数 yよりも小さい、または xとyは等しい」と定義される。 (3—3) A は2次元平面上のすべての点の集合で、関係 R は「点 x は点 y よりも原点より遠くない」と定義される。 (3—4) 有限集合 A={0, 1, 2, 3, 4} の上でRは R={<0,0>,<1,1,>,<2,2>,<3,3>,<4,4>}というグラフで定義される。

  16. 問3.解答 (3—1) r, s, t (3—2) a, r, t (3—3) r, t (3—4) a, r, s, t

  17. 補足 (3—4) 有限集合 A={0, 1, 2, 3, 4} の上でRは R={<0,0>,<1,1,>,<2,2>,<3,3>,<4,4>}というグラフで定義される。 Rが推移律を満たすかどうかを検討するxRy ∧ yRzが成立つ <x,z>は必ずx=zとなる。つまり xRzを満たす。 注意1)xRy は x=y と書ける。 注意2)xRy ∧ yRzが成立たない<x,y>,<y,z>については、xとzの間に何の関係がなくても良い

  18. レポートの提出方法(2007年度 後藤担当) • レポート用紙を下記のURLからプリントする http://www.goto.info.waseda.ac.jp/~goto/infomath.html1班 (奇数班), と2班 (偶数班) で用紙が異なる • 提出場所は、60号館2階のCS学科事務所の中のレポートBOX • 締切厳守のこと提出期間は、2007年6月11日(月)~15日(金)の間

  19. CS連絡事務室開室時間 • 月曜日から金曜日の 9:00~17:15 • 12:30~13:30は昼休みのため閉室 • 土曜は休日

  20. 問1 集合と非順序対 • 集合 A={u, v, w},集合 B={1, 2, 3}とするとき、次のように内包的に定義される集合 C を考える。 すなわち、Cの要素は集合{{a},{a,b}}である。 • この集合Cの要素をすべて示せ。ただし集合として同じものを重複して掲げないこと。また集合Cの要素の数を答えよ。

  21. 問2 関数とグラフ (2—1)有限集合 B={t, f} を考える。B3という集合を直積と考えて、B3の要素を列挙せよ。 (2—2) 3を自然数の集合 {0, 1, 2}と考えると、B3は集合3から集合 Bへの関数の全体となる。このように考えた場合には、B3の各要素は個々の関数となる。B3の各要素を関数のグラフとして表現せよ。 ヒント: 要素を列挙するため、解答が相当の分量になるのではないか、と懸念するかもしれない。実際には要素の数は多くない。

  22. 問3 集合の濃度(可算集合) • 自然数の集合 N={0,1,2,…}の直積 N2=N×Nから N への関数 f(x,y)={(x+y)2+3x+y}÷2 を考える。(3-1) f(0,0), f(0,1), f(1,0) ,f(0,2), f(1,1), f(2,0)の値を具体的に計算せよ。(3-2) f(x,y) が全単射であることを、全単射の定義に照らして丁寧に説明せよ。

  23. 問4 二項関係 集合Aは、2次元平面上の点の集合である。 (4—1)Aの上の関係Rが次のように定義されているとき、この関係Rが反射率を満たすか否かを解答せよ。 (4—2) 関係Rが推移律を満たすか否かを解答せよ。 (4—3) Aの上の関係Dが次のように定義されているとき、この関係Dが同値関係であるか否かを解答せよ。

More Related