60 likes | 202 Views
大数据时代. 人类在 物理世界和信息空间 中获取数据的能力迅速发展. 高维海量. 异构复杂. 大数据: 大小 和复杂度 超出常用 方法和 工具 在 可承受的运行时间内 进行数据捕获、管理和处理的 能力 的数据集。. 动态. 关联. 数据获取能力的发展对 理解、分析和应用 数据提出了更高的挑战和机会。. 异构. 高维. 图 像. 网 页. 图 像. 关联广泛. 动态模糊. 音 频. 图 像. 标 签. 标 签. 标 签. 数据分析是科研和创新的必需.
E N D
大数据时代 人类在物理世界和信息空间中获取数据的能力迅速发展 高维海量 异构复杂 大数据:大小和复杂度超出常用方法和工具在可承受的运行时间内进行数据捕获、管理和处理的能力的数据集。 动态 关联 数据获取能力的发展对理解、分析和应用数据提出了更高的挑战和机会。 异构 高维 图 像 网 页 图 像 关联广泛 动态模糊 音 频 图 像 标 签 标 签 标 签
数据分析是科研和创新的必需 • 2009年,微软研究院出版”科学研究的第四范式”一书:数据密集型科学成为科学研究新范式。 • 2011年2月《 Science》刊登“Dealing with Data”专辑:分析数据的能力远落后于获取数据能力。 • 2012年3月29日美国政府公布了“大数据研发计划”:基于大数据推动科研和创新。 Big Data Research and Development Initiative, 2012 Dealing with Data, 331(6018), 2011, Science The fourth paradigm, 2009, MS
可视化与数据挖掘 从大量数据中识别有效的、新颖的、潜在有用的,最终可理解的规律。 需人工解释和干预 难以处理: • 模式未知 • 搜索空间过大 • 特征模式模糊 • 参数难以设置 数据 数据挖掘 日志 网页 图像 视 频 图 像 计算 标签 音频 可视化 视频 仅用于数据的视觉表达 网 页 将数据以形象直观的方式展现,让用户以视觉理解的方式获取数据中蕴含的信息。
人类智能与机器智能的互补性 基于Foldit多用户在线游戏的蛋白质结构 预测 Nature466,765-770,2010 Foldit表明,在处理某些复杂的科学问题上,人类的直觉胜于机器智能。 Scientific American, 2011
新发展:可视分析 核心思路:让机器做机器擅长的,让人做人擅长的,取长补短,互相促进。 2005 美国国家可视分析中心 2006 首次IEEE VAST会议 2009 欧洲可视分析战略联盟 2010 首次EuroVAST会议 2012 Big Data下CVADA项目 数据挖掘 + 日志 数据 视 频 图 像 计算 网页 可视化 图像 标签 可视分析:面向非常大而复杂的数据,利用视觉感知通道,将自动分析技术与交互可视化结合,完成理解、推理和决策等任务。 网 页 音频 视频
国内研究现状 [罗迒哉VAST2008] 2012年6月,北戴河,信息可视化研讨会 北京大学 清华大学 中科院 北京九所 [屈华民TVCG2008] 浙江大学 香港科大 天津大学 华东师大 国防科大 应当自主研发可视分析的基础理论和方法,培养可视分析的人才队伍,不能任由国外科研机构和公司垄断。 [罗雄飞VAST2009] [陈为 TVCG 2009] 2010年8月,中国计算机学会举办首届信息可视化与可视分析高级研讨班 [袁晓如TVCG2010]