1 / 27

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI. Thực hiện : Tiêu Thị Phương Ngô Quang Hiểu Nguyễn Anh Vũ. Phân công công việc và đánh giá. Nội dung. Đặt vấn đề Định nghĩa cơ bản Bài toán xác định sự kiện liên quan đến bùng nổ sự kiện từ truyền thông xã hội .

haley
Download Presentation

DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DỰ BÁO BÙNG NỔ SỰ KIỆN TRONG MẠNG XÃ HỘI Thực hiện: TiêuThịPhương NgôQuangHiểu NguyễnAnhVũ

  2. Phâncôngcôngviệcvàđánhgiá

  3. Nội dung • Đặtvấnđề • Địnhnghĩacơbản • Bàitoánxácđịnhsựkiệnliênquanđếnbùngnổsựkiệntừtruyềnthôngxãhội. * Bàitoántínhxácsuấtxảyra 1 phầntửtrongchuỗitrạngthái * Bàitoánđođộmịncủachuỗitrạngthái * Bàitoánxácđịnhbùngnổtừ 1 luồnghoạtđộng * Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng 5. Kếtquảthựcnghiệm. 6. Địnhhướngnghiêncứutiếptheo

  4. Đặtvấnđề Cácchủđềhoạtđộngtruyềnthôngxãhội: thịtrường, bầucử, kinhtếvĩmô, Movie box-office, thông tin phổbiến=> truyềnthôngxãhộigiúpxácđịnhbùngnổsựkiệnxảyrabênngoàithếgiớithực.

  5. Đặtvấnđề (tt) • Đặcđiểmcủatruyềnthôngxãhội • Gồmsốlươnglớncácloaihoatđôngkhácnhaudiễnratrongthờigianthực. • Tínhkhôngthườngxuyên, tínhkhôngđoántrước, tínhgiảmạo. => cầnxácđịnhchínhxácđâulàbùngnổsựkiện

  6. Đặtvấnđề (tt) Vídụbùngnổsựkiệntrong Twitter

  7. Địnhnghĩacơbản Hoạtđộng: mộthoạtđộngmàđềcậpđếnmộtsốloạihànhđộngmàngườisửdụngthựchiệnkhihọquantâmđếnmộtsốchủđềhoặcsưkiện. Luồnghoatđộng: mộtluồnghoạtđộngcóđộdài N vàloại m là 1 chuỗisố (n1m ,n2m , …, nNm) ở đómỗinimbiểuthịsốlượnghoạtđộngloạimmàxảyratrongkhoảngthờithứi Truyvấn: mộttruyvấnQ làmộtchuỗicácquanhệ q1, …, q|Q|nócóthểbiểudiễnnhucầuthông tin củangườisửdụng.

  8. Địnhnghĩacơbản Event-related Burst: chomộttruyvấn Q, môtsựkiệnliênquanđếnvụnổđượcđịnhnghĩanhưtrongkhoảngthờigian[ts ,te]có 1 sốsựkiệnquanhệvới Q, ở đótsvàtelàthờigianbắtđầuvàthờigiankếtthúccủasưkiệntươngứngvớichuỗithờigian.

  9. Bàitoánxácđịnhbùngnổsưkiệnthông qua truyềnthôngxãhội • Bàitoántínhxácsuấtxảyra 1 phầntửtrongchuỗitrạngthái. • Bàitoánđođộmịncủachuỗitrạngthái. • Bàitoánxácđịnhbùngnổtừ 1 luồnghoạtđộng. • Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng.

  10. BàitoántínhxácsuấtxảyramộtphầntửtrongchuỗitrạngtháiBàitoántínhxácsuấtxảyramộtphầntửtrongchuỗitrạngthái Input: Cho mộtluồnghoạtđộng (n1m , …., nTm) trongkhoảngthờigianT. Output: sácxuấtxảyraphầntửzitrongchuỗitrạngthái z = (z1m,…,zTm)

  11. Bàitoántínhxácsuấtxảyramộtphầntửtrongchuỗitrạngthái (tt) • PhânphốiPossionđồngnhất: • Xácsuấtcủaphầntửthứ i làzi = 0 hay zi =1 đượctínhnhưsau: • ʎ0làsốlượngcáchoạtđộngtrongmộtkhoảngthờigian.

  12. Bàitoánđođộmịncủachuỗitrạngthái • Input: Cho chuỗitrạngtháiz1 , z2…. zT • Output: độmịncủachuỗi. • Côngthức: ở đó: T làđộdàicủachuỗitrạngthái I(.) làmộthàmmànóchỉtrảvềgiátrị1 nếuzi# zi+1 Vídụ: chuỗitrạngthái “0000100000” => g1 = 10 - 2 = 8 chuỗitrạngthái “0000000000” => g1 = 10 – 0 = 10

  13. Bàitoánđođộmịncủachuỗitrạngthái (tt) • Vớichuỗi “0000111100” cógiátrị g1=8 • Chuỗi “0000100000” cógiátrị g1= 8 => Cùnggiátrị g1nhưngkhôngphảicả 2 đềulàbùngnổsựkiện => g1 chưapháthiệnrõràngtínhchấtcủachuỗi => ảnhhưởngđếnviệcxácđịnhchínhxácvụnổcó ý nghĩa.

  14. Bàitoánđođộmịncủachuỗitrạngthái(tt) • Giảipháp: g1đượccảitiếnthành g2: sivàeilàvịtríbắtđầuvàchỉsốkếtthúccủachuỗicon tươngứngthứi. Ràngbuộc: Vídụ: g2(0000111100) = 42 + 42+ 22 = 36. g2 (0000100000) = 42 + 12 + 52 = 42

  15. Bàitoánxácđịnhbùngnổtừmộtluồnghoạtđộng • Input: Cho mộtluồnghoạtđộng (n1m , …., nTm) trongkhoảngthờigian T. • Output: chuỗitrạngtháiz = (z1m,…,zTm) cóthểxảyranhất. => chuỗitrạngthái z = (z1m,…,zTm) cóthểxảyranhấtlàchuỗiphảichịu chi phíthấpnhất.

  16. Bàitoánxácđịnhbùngnổtừmộtluồnghoạtđộng • Hàmtínhtổng chi phíđượcxácđịnh: • ở đó γ1làmộthệsốtỉlệ. • Φ(.) làhàmxácđịnhđộ min, cóthểthiếtlậpgiátrịchonólàgiátrịcủa g1(.) hoặc g2(.). • f(.) làhàmđượctínhtheophânphốiPossion

  17. Bàitoánxácđịnhbùngnổtừmộtluồnghoạtđộng Thayvìtínhđộmịncủacảchuỗi => tínhđômịncủatấtcảcácchuỗi con cóchiềudài L gọilà “local smoothness”theocôngthức:

  18. Bàitoánxácđịnhbùngnổtừmộtluồnghoạtđộng Thuậttoánxácđịnhchuỗicó chi phínhỏnhấttheo (4)

  19. Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng • Input: Cho cácluồnghoạtđộng {(n1m , …., nTm)}m=1Mtrongkhoảngthờigian T. • Output: M chuỗitrạngtháicóthểxảyranhất. => M chuỗitrạngtháicóthểxảyranhấtlàcácchuỗimàlàmchohàm chi phícógiátrịbénhất. => Chuỗitrạngtháitoàncục

  20. Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng • Hàmtínhtổng chi phícủa M chuỗitrạngtháiđượctínhtheocôngthức: • γ2là chi phícho 1 cặptrạngtháicho 2 luồnghoatđộngkhácnhautrongcùng 1 thờigian

  21. Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng ThuậttoánxácđịnhM chuỗicó chi phínhỏnhấttheo (5)

  22. Bàitoánxácđịnhbùngnổtừnhiềuluồnghoạtđộng • Từ M chuỗitrạngtháicụcbộđểtạoramộtchuỗitrạngtháitoàncục ta cócáccáchsau: • CONJUNCT: trạngtháitoàncầuzilàbùngnổnếutấtcảtrạngtháicụcbộlàbùngnổ • DISJUNCT: trạngtháitoàncầuzilàbùngnổnếumộttrongcáctrạngtháiđịaphươnglàbùngnổ • BELIEF: : trạngtháitoàncầuzimangtrạngtháicủamộttrạngtháicụcbộnếutrạngtháicụcbộđócóđộtin tưởngcaonhất ở đó :

  23. Kếtquảthựcnghiệm • Thựchiệntrêntậpdữliệugồm 200 triệu tweets với 3 luồnghoạtđộngtrong Twitter • Stđạidiệnchobài posting tweet • Srđạidiệnchoretweet • Sulà tweet cónhúng URL

  24. Kếtquảthựcnghiệm • Bàitoánxácđịnhbùngnổtừmộtluồnghoatđộng. thiếtlậphàm Φ trongphươngtrình 4 tươngứngnhư g1và g2, ápdung cho3 luồng (St, Sr, Su). • Thựcnghiệmchorakếtquảcủađộđo F nhưbảngsau:

  25. Kếtquảthựcnghiệm Bàitoánxácđịnhbùngnổtừnhiềuluồnghoatđộng chokếtquảthựchiệntốtnhất

  26. Địnhhướngnghiêncứutiếptheo L làthamsốđượcxácđịnhtrướcvàkhôngthểthayđổikhichạychươngtrình. L lớnlàmtăngđộphứctạpcủathuậttoán. Khôngcần L cógiátrịlớnchotấtcảcáctrangthái. => thiếtlập L làbiếnthaycógiátrịthayđổiđểxácđịnhchínhxácchiềudàichomỗitrạngthái

  27. Tàiliệuthamkhảo [ZSJSL12] Wayne Xin Zhao, BaihanShu, Jing Jiang, Yang Song, Hongfei Yan and Xiaoming Li (2012). Identifying Event-related Bursts via Social Media Activities, EMNLP-CoNLL'12:1466-1477, 2012 [GZRSW12]. Sabrina Gaito, MatteoZignani, Gian Paolo Rossi, Alessandra Sala, Xiao Wang, HaitaoZheng, Ben Y. Zhao: On the Bursty Evolution of Online Social Networks CoRR abs/1203.6744: (2012)

More Related