120 likes | 382 Views
The convergence of social and technological networks. JON KLEINBERG Communications of the ACM Vol. 51 No. 11, Pages 66-72, November. 2008. 報告人:簡振聖 2011/10/24. 大綱. 簡介 新研究的興起 小世界現象及分散式搜尋 社會傳播和思想散佈 社會資訊系統設計原則 未來方向. 簡介. 社會和技術網路的融合 -- 以網際網路資料為基礎對人類互動連結科學的研究
E N D
The convergence of social and technological networks JON KLEINBERG Communications of the ACM Vol. 51 No. 11, Pages 66-72, November. 2008 報告人:簡振聖 2011/10/24
大綱 簡介 新研究的興起 小世界現象及分散式搜尋 社會傳播和思想散佈 社會資訊系統設計原則 未來方向
簡介 社會和技術網路的融合 --以網際網路資料為基礎對人類互動連結科學的研究 網路技術發達促使電腦透過網際網網路連結,伴隨而來的是社會網路之興起 例如:facebook, LinkedIn, MySpace, Wikipedia, digg, del.icio.us, YouTube, 以及flickr 現象: • 更大量的工作處理 • 透過線上空間與他人連結的活動模式正在持續成長 • 建立虛擬社群以及從事自我表現 即使這些新媒體引導我們改變溝通的方式,但仍然被長期間的人類社會原則所支配 這種現象可以透過展新的線上世界所產生之資料加以觀察及量化
新研究的興起 • 起因: 社會科學家洞察到較早於網際網路時代的社會學問題,是了解現代計算機系統不可或缺的本質,事實上,過去五年內形成大部分高形象的網際網路應用,不只被技術的考量所支配,同時也被遞迴及量化的人類社會互動原則所支配 • 方向: 蒐集社會網絡資訊在傳統上是一件困難的工作 透過線上設置的社會互動網絡,我們可以重複播放觀察在Facebook上人們尋求連結以及友誼的管道,或者在 Wikipedia 和flickr是如何相互配合以及從事創造性的表達 • 困難點: 大量的資料集可以允許我們看到真正的模式,那是在較小範圍所無法看見的 大範圍的操作所導致的困難: 其一,並不知道任何一個特定的個人或社會的連接意味著什麼,並且在網上所揭示的友誼、意見以及個人信息的可靠性是不確定的 另一是可以觀察社會活動的總和,但在較細級別的數據卻更難以解釋(例如:一個人擁有比較多的連結,是否代表這個人比較具有影響力) 討論兩個集合: 小世界現象 (我們所有人都透過小串熟人而連結) 思想如何透過人群傳染性傳播的相關問題
小世界現象及分散式搜尋 小世界現象 • 六度分隔: 作者 John Guare提出了“六度分隔”說明我們在全世界社會網路只是幾步之隔的概念。 他參考了社會心理學家 Stanley Milgram在 1960年代一系列的實驗 實驗內容: Milgram要求住在波士頓和中西部中的幾百個人,試著將信寄給一個網路中指定的「目標人物」:一個住在馬薩諸塞州沙龍鎮的股票經紀人。 實驗規則: • 給予關於目標的基本個人資訊包括他的地址及職業 • 每個參加者只能把信寄給他或她認為最接近的目標人物 • 照著指示盡快向目標轉寄信件 成功的信件在六個步驟內達到目標
小世界現象(MSN的六度分隔理論驗證) • 微軟MSN中的六度分隔理論驗證: 微軟的研究人員Jure Leskovec和 Eric Horvitz從將近兩億五千萬個MSN Messenger的即時通帳戶,建立了一個虛擬的社會網路。 當其中任意兩個人進行交談超過一個月的觀察期,便將他們相連結。 研究者發現:兩個人之間,最短路徑的平均長度大約是6.6,這個數字非常接近Milgram的實驗,並以完全不同方式得到了這個數字。
分散式搜尋 • 短路徑: • Watts 和Strogatz以表面對照的方式觀察到世界高度的被叢集化,而熟人往往是由一些在地理上和社會上彼此相似的人們所組織而成。 • 他們表示,即使在一個高度叢集的網路加入小量的隨意的社會連結,這些新加入的連結仍然會迅速演變成小世界,大部分人們之間會顯示出短路徑 • 依照Milgram的實驗設計,一個人不會知道如何跨越大半個國家去傳遞一封信,但是社會網絡卻有這種能力將資訊匯注到遠方 • 平方反比定律: • 假設人們居住在二維空間中,友誼建立的可能性隨著距離的平方成反比而逐漸下降,在每一個解析範圍內,例如在距離1–10, 10–100, 100–1000,人們平均擁有朋友的比例是相同的,這個特性使得信息的傳遞也同樣隨著這些距離的範圍逐漸下降 • 就如Milgram所觀察到的,最好的解決模式是找到一些方法去有效的接近目標,並且在這個方法上完成短鏈 • 非地理性的距離因子: 另外一些研究使用線上數據去觀察友誼和通訊,如何相依於非地理性的距離因子,例如,你知道一個人被你影響的機率,是因為你是否和他們有類似的職業、文化背景或者是在大型組織裡的角色, Adamic和 Adar研究溝通如何取決於這類的距離
分散式搜尋 • 分散式計算機系統的設計原則: • 這些模型(六度分隔、短路徑、非地理性距離因子)可以被迅速轉換為分散式計算機系統的設計原則 • 現代的點對點檔案分享系統是建構在沒有中央索引的內容分享原則下 • (相反的,例如,像谷歌搜索引擎的方式,提供一個 Web頁面的中央索引) • 這樣的結果,在點對點系統中搜尋內容,依據Milgram的方法,其中參與的主機系統只必須轉遞一個本地視圖(Local View)的要求 • 就好像透過熟人傳遞信件一般,只要傳遞給自己認識的朋友即可,沒有中央控制系統告訴你要傳給誰。
社會傳播和思想散佈 • 人與人之間的相互影響 • Milgram實驗的過程是集中某個訊息在一個特定目標人物上 • 社會網路的訊息往往朝許多方向往外擴展 • 信息在人們之間傳播的例子:一個謠言,一個政治消息,或是一個線上視頻的連結 • 我們必須去充分了解這個重要的過程,因為它是人們經過一段時間後影響另外一個人的大量樣式的一部分 • 擴散創新 無論是以線上或離線的社會網絡為基礎,去形成新的政治或社會信任,採用新技術,以及轉變人們的行為,社會學家認為這就是擴散創新的過程 當許多這些過程的成果變得顯而易見,但它們內部的作業仍然是無從捉摸的 現象: 人們的新行為取決於他們在社會網絡中鄰居行為的概率: • 愈來愈多妳的朋友購買一個新產品或參加一個新活動,你會更喜歡去做同樣的事 • 當一個重要客戶收到推薦電子郵件增加時,從大型線上零售商購買書本、DVDs、以及音樂的機率會增加 • Hill, Provost, 和Volinsky分析,一個個人所採用的消費者電信服務方案,取決於她要連結的人們採用這個服務方案的概率
社會傳播和思想散佈 • 報酬遞減模式: • 當採用行為的概率因為朋友已經採用它的次數而增加,會產生”報酬遞減”模式,每一個相繼朋友其採用行為的邊際效應會逐漸減少,在許多案例中,可以觀察到一個有趣的偏差數,就是”0-1-2效應” • Centola和 Macy最近所主張的,我們遠端的友誼在以下的情境對散佈訊息可能是沒有太多幫助的:例如你可以從廣泛的朋友中第一次學習到一些事情,但是獲得第二次的驗證,你可能需要等待本地接觸者傳送給你相同的訊息 • 這樣的模式可能會降低訊息傳遞的進度,因此與其利用廣泛的捷徑不如加強訊息在本地連結中快速行進,會更快讓世界變小。 如此大量和豐富的人際交往數據的可用性,已經準備好了一個重要的反饋迴路,允許我們去發展和評估大範圍社會現象的模型,並在新計算機應用的設計中使用這些模型
社會資訊系統設計原則 • 早期:分散式計算系統的設計 • 早期在分散式計算的作業基於”蔓延演算法”觀念的假設,主機之間傳播信息的更新,將根據概率蔓延規則 • 這種演算法可以非常強勁和相對簡單的配置在每個單獨的節點,只需要向鄰居結點傳送Local View • 例如之前介紹的點對點檔案分享系統 • 最近:流行和串連行為應用 流行和串連行為已經被使用在社會計算應用,例如: • Yahoo拍賣評價制度 • Amazon亞馬遜的推薦制度 • Facebook的社群活動 大範圍的社會傳播數據,提供了識別在社會網路中具有高度影響力的人們的方法,一但他們採用一個創新,就可以觸發大規模的串連。
未來方向 • 我們大部份一直在討論涉及社會網路中的個人動態行為,但一個重要和互補的調查領域,是網路本身結構如何隨時間演變。 • 最近對大型資料集研究所揭示出重要網路演進的原則: • 擇優原則:在已經有許多連結的節點,往往會以更快的速度獲得更多連結。 • 三元封閉:當兩個人有一個共同朋友時,彼此之間更容易形成連結。 • 細密化:每個節點的連結數量,隨著網路的發展而增加。 • 直徑收縮:當節點總數逐漸增加的時候,其中兩個節點間最短路徑的步驟會減少。