240 likes | 363 Views
微博实体与百科条目链接的多策略研究. 西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉. 微博实体与百科条目链接的多策略研究. 2012 年数据. 微博实体与百科条目链接的多策略研究. 2012 年数据. 微博实体与百科条目链接的多策略研究. 新浪微博用户的最新数据,截至2012年12月底,新浪微博注册用户数已超过 5 亿,同比增长74%。日活跃用户数达到4620万,微博用户数与活跃用户数保持稳定增长。. 2013 年数据. 微博实体与百科条目链接的多策略研究. 对于海量微博数据进行挖掘. 微博实体与百科条目链接的多策略研究.
E N D
微博实体与百科条目链接的多策略研究 西南大学计算机系 郭云龙 徐潇 向宇 曾维刚 李莉
微博实体与百科条目链接的多策略研究 2012年数据
微博实体与百科条目链接的多策略研究 2012年数据
微博实体与百科条目链接的多策略研究 • 新浪微博用户的最新数据,截至2012年12月底,新浪微博注册用户数已超过5亿,同比增长74%。日活跃用户数达到4620万,微博用户数与活跃用户数保持稳定增长。 2013年数据
微博实体与百科条目链接的多策略研究 • 对于海量微博数据进行挖掘
微博实体与百科条目链接的多策略研究 • “微博实体与百科条目链接”的应用: 有助于利用社交媒体内容进行知识库的构建与扩展; 帮助用户阅读; 广告;市场; · · ·
微博实体与百科条目链接的多策略研究 • “微博实体与百科条目链接”的难点: 一对多消歧 一对零消歧 · · ·
TTT Model 微博实体与百科条目链接的多策略研究 Term crawler lexicon Tweet context + tags corpus Tweets Machine Learning Statistics
Term Level 微博实体与百科条目链接的多策略研究
Term Level 微博实体与百科条目链接的多策略研究
Term Level 微博实体与百科条目链接的多策略研究
Term Level 微博实体与百科条目链接的多策略研究
Term Level 微博实体与百科条目链接的多策略研究
Tweet Level 微博实体与百科条目链接的多策略研究
Tweet Level 微博实体与百科条目链接的多策略研究 Polysemy page of Target Key on baike.baidu.com
Tweet Level 微博实体与百科条目链接的多策略研究 Each target entry and labels
Tweet Level 微博实体与百科条目链接的多策略研究 Build label lists for target entry
Tweet Level 微博实体与百科条目链接的多策略研究 Calculating label list’s weight by basal list. The entry whose label list is the most weight is the real entry that target key map to.
Tweets Level 微博实体与百科条目链接的多策略研究
Tweets Level 微博实体与百科条目链接的多策略研究
Tweets Level 微博实体与百科条目链接的多策略研究 (4) Computing the similarity of two words based on Mi. (2) Constructing a word-matrix for each “Key Term” Matrix Matrix Matrix Matrix “Key Terms” related tweets (5) Clustering similarity- matrix M* Similarity based on the co-occurrences in the same paragraph Dividing tweets for each “Key Term” 1)Extracting words from each tweet (3) Computing the co-occurrences of two words that appear in the same tweet (6) Analyzing and Tagging in each cluster Cip
Tweets Level 微博实体与百科条目链接的多策略研究
Tweets Level 微博实体与百科条目链接的多策略研究 评测结果:我们评测结过为84.99%,改进后为88.38%。
Thank You ! 西南大学 计算机系 郭云龙 Email:zqlong@swu.edu.cn