370 likes | 456 Views
Term észeti és emberi hálózatok statisztikus fizikája. Vicsek Tamás ELTE, Biológiai Fizika Tanszék http://angel.elte.hu/~vicsek. Munkatársak : A.-L. Barabási, I. Derényi, I. Farkas, Z. Néda, Z .-N . Oltvai, E. Ravasz, and A. Schubert. Miért hálózatok ? ( kapcsolatok topológiája ? )
E N D
Természeti és emberi hálózatok statisztikus fizikája Vicsek Tamás ELTE, Biológiai Fizika Tanszék http://angel.elte.hu/~vicsek Munkatársak: A.-L. Barabási, I. Derényi, I. Farkas, Z. Néda, Z.-N. Oltvai, E. Ravasz, and A. Schubert Miért hálózatok ? (kapcsolatok topológiája ?) A legegyszerübb megközelités a sok hasonló, de egyben specifikus kölcsönhatásokkal rendelkező (komplex) rendszerek leirásához
Hazai kutatócsoportok Rényi Intézet (Tusnády Gábor és mások, gráfelmélet) SZTAKI (gráfelmélet, internet) ELTE (Vattay Gábor, internet) BMGE (Kertész János, és mások, internet) BKAE (üzleti hálózatok) és további helyek
Elemi bevezető a gráfelmélet fogalmaiba • Példák hálózatokra • Determinisztikus • Társzerzők hálózata • Biokémiai hálózat • „Valódi” gráfok sajátérték spektruma
Korrelálatlan véletlen gráf (Erdős, Rényi) P. Erdős, A. Rényi, Publ. Math.6, 290-297 (1959) Fokszám eloszlás: Poisson Gráf modellek Egy csúcs foka: élek száma Minden csúcs-pár egy adott p valószinüséggel van összekötve egy éllel
Graph models Kis világ modell (Watts, Strogatz) D. J. Watts, S. H. Strogatz, Nature393, 440-442 (1998) (uncorrelated) random regular small-world • kiindulás: rács • éleket véletlenszerüen átkötjük pr valószinüséggel pr= 0 pr= 1 increasing randomness 1 C(p)/C(0) átlagos szomszédsági viszonynak megfelelő paraméter L(p)/L(0) átlagos távolságnak megfelelő paraméter 0.5 0 pr= 0 0.01 1
Skálafüggetlen modell (Barabási, Albert) A.-L. Barabási, R. Albert, Science286, 509-512 (1999) Növekedő hálózatok: • kezdés: m0 csúcs • iteráció:hozzáadunk 1 csúcsot és m élet: lineárisan „preferáljuk” a csúcsokat fokszám szerint fokszám eloszlás skálázik: P(k) = C k -3 Mért eloszlások: power grid actors www
Determinisztikus skálázó modell A.-L. Barabási, E.Ravasz, T. Vicsek, PhysicaA299 (3-4):559-564 (2001) Előnyei: • Skálafüggetlen topológia vizuális demonstrációja • Egzakt eredmény P(k)- ra
P. Erdős R. Faudree Társszerzői hálózatok topológiája A.-L. Barabási, H.Jeong, Z.Néda, E.Ravasz, A. Schubert, T. Vicsek (Physica A) Az Erdős gráf co-author first in 1973 1976 L. Lovász 1979 A Science Citation Index-ben 1991-98 közöttpublikált adatok alapján Együttmüködési hálózatok (M) Matematikaés (NS) Idegtudományok terén
Kumulativ adatok, 1991-98 (log bins) Fokszám eloszlás: Hatványfüggvény, a kitevő: Egyenes: Preferenciális csatlakozás:
Kumulativ csatlakozási ráta: kvadratikusk1 k2 szerint lineárisk1 k2szerint Belső preferenciális csatlakozás: Mért adatok szerint:
Bejövő csúcsok: konstans ráta • Új csúcsok preferenciális csatlakozási szabály szerint létesitenek éleket a régi csúcsokhoz • További új élek kölcsönös preferenciával A tudományos hálózatok modellezése
Eredmény Egy csúcs foka Fokszám eloszlás
Fokszám eloszlás Monte Carlo szimuláció
Fehérje hálózat Jeong et al, Nature (2001)
GENOME Protein-gene interactions Transcription PROTEOME TRANSCRIPTOME Microarray (DNS chip) Protein-protein interactions METABOLISM Biochemical reactions Citrate Cycle Biokémiai hálózat A sejtekben igy tárolódik és fejti ki hatását az információ
300 (egyenkénti) génkilövés (1 kisérlet per gén) 300 kisérlet (transcriptomes) 6200 gén adatok: Hughes et.al., Cell 102: 109-126 (2000) Két kisérlet (a megfelelő kilőtt gének) kapcsolódik, ha hasonló lokális mintázatok vannak a génexpressziós értékek sorozatában Transcriptome hasonlósági gráf
A transzkripciós hasonlósági gráf • csúcs:egy kisérlet • él:sok hasonló tartomány ( | C | > 0.8 ) • Egy él szine: korreláció erőssége
A gráf strukturájának analizise Teszt gráfok: Ugyanannyi él és csúcs + Mért gráf ER teszt gráf Kis-világ teszt gráf Skálafüggetlen teszt gráf
“Valódi” gráfok spektrum analizise I. Farkas, I. Derényi, A.-L. Barabási, and T. Vicsek,Phys. Rev. E64, 026704 (2001) 2 1 3 4 Iterativ módszerek (pl., Lánczos) Explicit módszerek • sajátért.: legnagyobbak • Memória: O ( N) • idő: O ( N ) • sajátértékek: mind • Memória: O ( N 2 ) • idő: O ( N ) NAGY gr. KIS gráfok Módszer Szomszéds. mátr. spektrum gráf eloszl. hisztogramm
Spectral analysis (measured spectral densities) Sparse ER graph (Bauer et.al) M. Bauer, O. Golinelli, J. Stat. Phys.103 (2001) 301 • spectral density NOT semi-circular: • continuum is not semi-circular • singularities appear
Széle skál. Háromszög-szerü spektrum average for 300 graphs m = m0 = 5 N = 20 000 Skála független gráf ( pN = 2m = const. )
Kis –világ gráf Növekvő pr ( pr N = const. ) véletlen Kis világ reguláris • FÉLKÖR: • sima • szimmetrikus • szingularitások • aszimmetria N = 1000, average for 1000 graphs • ssimább • aszimmetrikus
Summary • Gene expression and collaboration networks are scale-free graphs • The topology of real-world networks can be characterized by spectral methods • Anomalous eigenvalue spectra • Characteristic inverse participation ratio
Spectral analysis Inverse participation ratio of an eigenvector: measures the localization of an eigenvector Spectral analysis of the transcriptome similarity graph Testing the structure of a small measured graph Question: Given a measured graph, which of the graph models describes it well ? (a test graph: same number of edges and vertices) • Answers: • For large graphs ( N > 1000 ) the degree sequence can be informative: power-law, exponential, … • For small graphs ( N = 100 - 500 ) alternative structural tests can be also useful.
Transcriptome similarity graph Spectral analysis Test graphs: same number of vertices and edges + Measured graph (largest component) ER test graph Small-world test graph Scale-free test graph The transcriptome similarity graph is scale-free Structural analysis of the transcriptome similarity graph Go to last page
Collaboration network Monte Carlo simulations diameter • apparent diameter: decreasing • real diameter: increasing with time (size) apparent real • possible correction method for the collected data -3 Degree distribution -2 Measured data shows: diameter decreases with time
Collaboration network Modeling the Web of Science • Incoming nodes: constant rate • Incoming nodes connect to old nodes with pref. a. • New internal links: with preferential attachment: • No aging (of nodes) Continuum theory Degree distribution:
Spectral analysis DETAILS: applying the Lanczos algorithm to obtain internal eigenvalues • Lanczos alg.: finds the extremal eigenvalues of the adjacency matrix, A, together with their eigenvectors • Modified Lanczos algorithm: Question: What are the eigenvalues of A closest to ? Answer: 1, Find (with Lanczos) the top z eigenvalues of The corresponding eigenvectors are b1, b2, ... , bz . 2, Find the eigenvectors of A for b1, b2, ... , bz . These will be the eigenvalues of A closest to .
Spectral analysis ER model complete spectrum # of edges ~[# of vertices]2 • N = 20.000 • pN = 10 Spectral density: semi-circle Edges are “expensive” more realistic: central part Sparse ER model # of edges <<[# of vertices]2 Spectral density: NOT semi-circle Spectral densities of the graph models
Scale-free graph (cont’d) quickly growing first eigenvalue m = 1, 2,4,8 N