1 / 23

CCDM 竞赛回顾与总结

CCDM 竞赛回顾与总结. 陈文强 2014/03/26. 1. 2. 3. 目录. 第一页. 比赛基本介绍. 多标记分类任务. 多分类任务. 比赛基本介绍. 第二页. 主办单位:中国计算机学会 & 中国人工智能学会. 协办单位:中国计算机学会模式识别与人工智能专委会 中国人工智能学会机器学习专委会. 指导专家:周志华等. 评审专家: 郭茂祖 、朱军等. 比赛基本介绍. 第三页. 竞赛时间: 2014/01/05 —— 2014/03/15. 数 据 集:医学诊断数据.

Download Presentation

CCDM 竞赛回顾与总结

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. CCDM竞赛回顾与总结 陈文强 2014/03/26

  2. 1 2 3 目录 第一页 比赛基本介绍 多标记分类任务 多分类任务

  3. 比赛基本介绍 第二页 主办单位:中国计算机学会&中国人工智能学会 协办单位:中国计算机学会模式识别与人工智能专委会 中国人工智能学会机器学习专委会 指导专家:周志华等 评审专家:郭茂祖、朱军等

  4. 比赛基本介绍 第三页 竞赛时间:2014/01/05 ——2014/03/15 数 据 集:医学诊断数据 比赛任务:Task1 多标记 Task2 多分类

  5. 比赛基本介绍 第四页 目 标 : 前三名 02/13 02/20 02/21 02/28 02/29 03/05 03/06 03/12 03/13 03/15 排名 1 2 3 4 5 6 jikicaxi JHHT FZU_BRRF CUG_Miners Yuri xmu_dmlab xmu_dmlab jikicaxi JHHT CUG_Miners Yuri xmu_dmlab JHHT jikicaxi jikicaxi JHHT xmu_dmlab CUG_Miners JHHT xmu_dmlab Jikicaxi Yuri

  6. 1 2 3 目录 第五页 比赛基本介绍 多标记分类任务 多分类任务

  7. 多标记分类任务 数据集概况和人员 第六页

  8. 多标记分类任务 数据集分析 第七页 特征分布:稀疏

  9. 多标记分类任务 数据集分析 第八页 相关标记分布

  10. 多标记分类任务 评价指标 第九页 AveragePrecision Bipartition: a bipartition of the labels into relevant and irrelevant 1 0 0 1 Confidences: the probability of each label being positive 0.87 0.33 0.26 0.67 2 3 4 1 Ranking: the rank of each label, ranging from 1 to array length

  11. 多标记分类任务 解决思路 第十页 Predictions Feature Pool Ensemble C1 C2 CK … ClassifierPool

  12. 多标记分类任务 解决思路 第十一页 Predictions Feature Pool GainRatio Ensemble RAkEL HOMER MLkNN … ClassifierPool

  13. 多标记分类任务 解决思路 第十二页 GainRatioAttributeEval Top 120 Tsoumakas G, Katakis I, Vlahavas I. Mining multi-label data[M]//Data mining and knowledge discovery handbook. Springer US, 2010: 667-685.

  14. 1 2 3 4 目录 第十三页 比赛基本介绍 多标记分类任务 多分类任务 总结

  15. 多分类任务 数据集概况和人员 第十四页

  16. 多分类任务 数据集分析 第十五页 特征:nominal&numeric PCA: Retain 95% variance.

  17. 多分类任务 数据集分析 第十六页 样本分布

  18. 多分类任务 评价指标 第十七页 F1Score 相关 不相关 Precision = TP FN 检索到 未检索到 FP TN F1-Score = Recall =

  19. 多分类任务 解决思路 第十八页 Predictions Feature Pool PCA Gain Ratio Scale Ensemble L1 C1 C2 CK … RBM MID /MIQ ClassifierPool Cost-Sensitive Bagging SVMs RF LR GBDT AdaBoost DT

  20. 多分类任务 解决思路 第十九页

  21. 多分类任务 解决思路 第二十页 Tsoumakas G, Katakis I, Vlahavas I. Mining multi-label data[M]//Data mining and knowledge discovery handbook. Springer US, 2010: 667-685.

  22. 第二十三页

  23. 再次感谢老师指导和关心 以及同学们的努力 邹权副教授 林琛副教授 胡始昌(研三) 唐振坤(研三) 宋莉(本科) 曾建沧(本科) 赵雪薇(本科) 陈文强(研三) 陈伟程(研三)

More Related