200 likes | 408 Views
基于 hadoop 与 hive 的大数据分析体系构建. 指导教师:张曙. 开发环境与技术难点. 项目背景 / 研究现状. 系统概要设计. 工程概览. 系统详细实现. 基础理论相关技术. 项目背景 / 研究现状. 项目背景 / 研究现状 —— 项目背景. 2012 年 3 月 29 日,美国政府发布了“大数据研究和发展倡议”。. 2012 年 8 月北京知识发现与数据挖掘 (KDD) 国际会议,大数据成为重要议题. 2011 年 5 月, EMC 公司 EMC World 年度大会 提出了“大数据” (Big Data) 概念.
E N D
基于hadoop与hive的大数据分析体系构建 指导教师:张曙
开发环境与技术难点 项目背景/研究现状 系统概要设计 工程概览 系统详细实现 基础理论相关技术
项目背景/研究现状 ——项目背景 2012年3月29日,美国政府发布了“大数据研究和发展倡议”。 2012年8月北京知识发现与数据挖掘(KDD)国际会议,大数据成为重要议题 2011年5月,EMC公司 EMC World年度大会 提出了“大数据”(Big Data)概念 2011年11月26日,中国软件开发联盟(CSDN)在北京成功举办了中国大数据技术大会
系统概要设计 ——微博信息获取及信息存储 NoSQl数据库 api获取数据 OAuth授权 传统web爬取
系统概要设计 ——数据存储与数据仓库 数据操作 hive封装 NoSQL数据库
系统概要设计 ——微博信息分析 分析结果存储 聚类 数据读取(hive) 数据预处理(向量化和归一化) 支持向量机 其它
系统概要设计 ——数据可视化 d3js可视化及交互层 express框架(控制层) 数据分析模块 hive封装
Thank you for watching! 开发环境与技术