170 likes | 308 Views
信息技术产业导论报告. 1101213412 高 振 龙 2012-5-23. 内容提要. Yale Computer Science 调研报告 数据挖掘产业分析 总结. Yale Computer Science 基本情况. http://www.yale.edu/index.html http:// www.cs.yale.edu/index.html Computer Science 专业成立于 1969 年 4 个主要研究 领域 Theory of Computation Artificial Intelligence
E N D
信息技术产业导论报告 1101213412 高振龙 2012-5-23
内容提要 • Yale Computer Science调研报告 • 数据挖掘产业分析 • 总结
Yale Computer Science基本情况 • http://www.yale.edu/index.html • http://www.cs.yale.edu/index.html • Computer Science专业成立于1969年 • 4个主要研究领域 • Theory of Computation • Artificial Intelligence • Numerical Analysis • Systems • 21个普通教职人员,50多个研究生
Research Areas • http://www.cs.yale.edu/research/topics.html
Yale CS • 相对规模较大的研究领域 • Artificial Intelligence • Algorithms & Complexity Theory • Computer Systems and Networking • 我感兴趣的三位导师 • Daniel Abadi(database) • Julie Dorsey (computer graphics) • Paul Hudak (computer music)
论文研读 • 《HadoopDB: An Architectural Hybrid of MapReduce and DBMS Technologies for Analytical Workloads》 • http://db.cs.yale.edu/hadoopdb/hadoopdb.pdf • HadoopDB亮点 • Tradeoff • Applicable for future system design
HadoopDB特点 high performance high efficiency not support heterogeneous machines parallel databases HadoopDB Superior scalability fault tolerance flaxibility to handle unstructured data low performance MapReduce-based
数据挖掘产业应用分析 • 概念 • 特点 • 核心技术 • 应用领域 • 零售业中的应用 数据挖掘 Data Mining
数据挖掘-概念 • 数据挖掘是指从大量的数据中抽取或“挖掘”知识。 知识 大量的数据 数据挖掘
数据挖掘-特点 • 新兴 young & 有前途promising • 始于1980s • 热门 • 受到学术界广泛关注,大量相关论文 • 应用广泛 • 与产业紧密结合
数据挖掘-核心技术 • 数据预处理Data Preprocessing • 数据仓库 Data Warehouse & OLAP • 频繁模式挖掘 Frequent Patterns mining • 分类与预测 Classification and Prediction • 聚类分析 Cluster Analysis • 多媒体、文本、Web挖掘 Multimedia, Text, Web Mining
数据挖掘-应用领域 • 零售业 • 数据仓库、促销成效分析、客户保留、产品推荐 • 零售业 • 数据仓库、促销成效分析、客户保留、产品推荐 • 金融业 • 贷款偿还预测、客户信誉政策分析、客户分类聚类、洗钱及金融案件发现 • 电信行业 • 欺骗模式分析、电信数据分析及可视化 • 信息安全 • 入侵检测、流数据分析 • 生物科学 • 结构模式发现、遗传网络和蛋白通路分析、关联和路径分析
数据挖掘-零售业中的应用 • 关联规则挖掘 • 分析客户购物规律,制定促销策略 • 分析促销活动的成效 • 协同过滤推荐系统 • 推荐客户可能喜欢的商品 • 制定相应的捆绑销售打折策略
数据挖掘-创业计划 • 设计并实现一套可扩展性好的用户行为挖掘系统。 • 针对不同的商业模式和需求,开发基于上述系统的组件。
总结 • Yale Computer Science调研报告 • 数据挖掘产业分析 • 概念 • 特点 • 核心技术 • 应用领域 • 零售业中的应用