1 / 71

第 1 章 数据整理

第 1 章 数据整理. 1.1 Excel 中的数据整理工具. 1. 数据排序 Excel 可以根据用户的要求对数据清单的行或列数据进行排序。排序时, Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。. 2. 频数分布函数 频数分布函数是 Excel 的一个工作表函数,是编 制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。 3. 数据透视表

hayes-snow
Download Presentation

第 1 章 数据整理

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第1章 数据整理

  2. 1.1 Excel中的数据整理工具 1. 数据排序 Excel可以根据用户的要求对数据清单的行或列数据进行排序。排序时,Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。

  3. 2. 频数分布函数 频数分布函数是Excel 的一个工作表函数,是编 制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。 3. 数据透视表 数据透视表是一种交互式工作表,用于对已有数据清单、表和数据库中的数据进行汇总和分析的一种工具,这可用于单向表,双向表的制作,能够非常容易地展现数据的分布状况。

  4. 4. 统计图 Excel可以绘制许多图表,其中大部分是统计 图,可用于数据的整理与分析,能够直观形 象地描述现象的数量规律性。 5. 直方图分析工具 直方图分析工具是Excel分析工具的一种,它在给定 工作表中数据单元格区域和接收区间的情况下,计算 数据的个别和累积频率,用于统计有限集合中某个数 值元素的出现次数。

  5. 1.2 数据排序与分组

  6. 1.2.1 利用Excel进行数据排序 例 某集团公司欲在某地区投资于医疗卫生事 业,为了减少风险,获得利润,该集团企划 部门决定先了解一下市场潜力。企划部王经 理随机访问了该地区几家医院中就医的36名 患者,询问其等候看病的时间,根据这些数 据,王经理会得到什么信息呢?

  7. 对数据进行排序 ①打开 “第1章 数据整理.xls” 工作簿,选定“等候时间”工作表。 ②利用鼠标选定单元格 A1:B37区域。

  8. ③在菜单中选择“数据”中的“排序”选项,则弹出排序对话框。

  9. ④在排序对话框窗口中,选择“主要关键字”列表④在排序对话框窗口中,选择“主要关键字”列表 中的“等候时间”作为排序关键字,并选择按“递增” 排序。由于所选取数据中 已经包含标题,所以在 “当前数据清单”中选择 “有标题行”,然后单击 “确定”按钮,即可得到 排序的结果如图所示。

  10. 从数据排序结果可以看出,数据按等候时间从1分钟到55分钟的递增顺序排列,从而提供了患者等候时间的变动范围。从数据排序结果可以看出,数据按等候时间从1分钟到55分钟的递增顺序排列,从而提供了患者等候时间的变动范围。 • “排序”功能不能对总体的分布状况进行描述。 • 如果想知道每个时间段上有多少个患者等待,可利用Excel中的“分类汇总”功能完成这个任务。 • 分类汇总不需要建立数学公式,只需在“数据”菜单中选择“分类汇总”选项,Excel便会自动地创建公式,生成自动分级显示的数据清单。 • 但要注意在分类汇总前需要先对数据进行排序。

  11. 在数据清单中使用分类汇总的方法如下: 先选择需要分类汇总 的数据区域A1:B37, 然后选择“数据”菜单 中的“分类汇总”选项, 则打开“分类汇总”对 话框如图所示。 上一页 下一页 返回本节首页

  12. 在“分类字段”的下拉式列表中选择要进行分类的列标题,在“分类字段”的下拉式列表中选择要进行分类的列标题, 在“汇总方式”的下拉式列表中选择进行汇总的方式,本例中选择按 “等候时间”进 行分类,选择 按“计数”进行 汇总,单击“确 定”按钮,便得 到分类汇总的 结果如图所示。 上一页 下一页 返回本节首页

  13. 在对数据进行了分类汇总之后,可以观察到等候时间为1分钟的人次为1,等候时间为3分钟的人次为2等等。在对数据进行了分类汇总之后,可以观察到等候时间为1分钟的人次为1,等候时间为3分钟的人次为2等等。 尽管分类汇总可以给出各个数值所出现的次数,但从这些次数中还是无法得出其数据分布的规律性。这是因为没有将数值相近的数据进行合并,因而不能理想地抽象概括现象的数量特征。 上一页 下一页 返回本节首页

  14. 常用函数 • 财务函数 • 日期与时间函数 • 数学和三角函数 • 统计函数 • 查找与引用函数 • 数据库函数 • 文本函数 • 逻辑函数 • 信息函数 • 工程函数 统计函数模块中有76个统计函数,这些函数 覆盖了统计基本理论与分析方法。频数分布 函数是其中的一个。 1.2.2 利用Excel频数分布函数进行分组

  15. 频数分布函数 (FEQUENCY) 可以对一列垂直数组返回某个区域中数据的频数分布。 频数分布函数 (FEQUENCY)的语法形式为: FREQUENCY(data_array,bins_array) 其中:Data_array为用来编制频数分布的数据,Bins_array为频数或次数的接收区间。

  16. 建立频数分布的步骤如下: • 先对数据进行排序,以了解全部数据的变动范围; • 选择全部数据的分组组数; • 确定分组的组限, • 最后对各组数值所出现的频数进行计数。

  17. ①打开“第1章.xls”工作簿,选择“等候时间”工作表。①打开“第1章.xls”工作簿,选择“等候时间”工作表。 ②在单元格C2中输入“分组”,在单元格D2中输入“频数”。 ③在C3:C8区域中依次输入10,20,30,40,50,60,作为频数接受区域,它们分别表明 等候 时间在10分钟以下 的人数,等候时间在10 分钟以上,20 分钟以下 的人数等。 ④选定D3:D8区域,在 “插入”菜单中单击“函数” 选项,打开“粘贴函数”对 话框如图所示。

  18. ⑤在“函数分类”列表中选择“统计”,在“函数名”列表中选择“FREQUENCY”,单击“确定”按钮,Excel弹出“频数分布”对话窗口。

  19. ⑥在数据区域“Data_array”中输入单元格B2:B37,在数据接受区间Bins_array 中输入单元格C3:C8,在对话窗口中可以看到其相应的频数是6,7,9,8,5,1,0。 ⑦由于频数分布是数组操作, 所以,此处不能直接单 击“确定”按钮,而应按 Ctrl +Shift组合键,同时 敲“回车”键,得到频数分 布如图所示。

  20. 另外,直接利用Excel函数公式也可以得到同样结果。另外,直接利用Excel函数公式也可以得到同样结果。 用鼠标选定单元格D3:D6,注意不要释放选定区域。 在D3单元格中输入频数分布函数公式: =FREQUENCY(B2:B37,C3:C8) 在这个公式中,数据区域为B2:B37,接受区间为 C3:C8,按Ctrl +Shift组合键,同时敲“回车”键,得到 频数分布与上面相同。 从频数分布结果可以看出,大多数据患者的等候时间 为30分钟,从整体来讲,分布是比较均匀的,即以30 分钟为中心而对称分布。

  21. 1.3 利用透视表进行数据整理 利用透视表进行数据整理可分为单变量表格 与双变量表格,前者称为单向表,后者称为 交叉表。

  22. 1.3.1 单向表 例 某移动通讯公司要制定新一年的销售计划,需要向市场了解移动用户对数字移动电话类型的需求。 • 经过问卷设计,在该地区抽取了1000个样本进行问卷调查,获得关于移动电话用户消费行为的一些数据资料 • 试根据工作表中的数据分析该地区移动电话用户的电话类型偏好。 上一页 下一页 返回本节首页

  23. ①打开“第1章工作簿,选定“移动电 话调查”工作表 上一页 下一页 返回本节首页

  24. ②单击“数据”菜单中的“数据透视表和图表报告”选项,Excel弹出数据透视表向导对话框如图所示。 上一页 下一页 返回本节首页

  25. ③根据向导要求,第1步是指定“数据源类型”和确定所需创建的“报表类型”。选择“数据清单或数据库”作为数据源,选择“数据透视表”作为报表类型。最后单击“下一步”。③根据向导要求,第1步是指定“数据源类型”和确定所需创建的“报表类型”。选择“数据清单或数据库”作为数据源,选择“数据透视表”作为报表类型。最后单击“下一步”。 上一页 下一页 返回本节首页

  26. ④第2步是确定数据区域,本例中数据所覆盖区域为A1:D1001单元格,单击“下一步”按钮,向导给出第3步操作对话框窗口如图所示。④第2步是确定数据区域,本例中数据所覆盖区域为A1:D1001单元格,单击“下一步”按钮,向导给出第3步操作对话框窗口如图所示。 ⑤第3步确定数据透视表的位置。选择现有工作表,并利用鼠标将数据透视表的位置确定在E1单元格中,如果单击“完成”按钮,可以结束操作。

  27. ⑥单击“版式”,Excel弹出如图 对话框窗口,选择 右边的“数字移 动电话类型”字 段,并将它拖 到左边的“行” 区,再选择“数 字移动电话类型” 字段,将其拖放 在“数据”区域中, 显示为“计数项: 数字移动电话类 型”,以便进行数据汇总。

  28. ⑦双击数据区域中的“计数项:数字移动电话类型”字段,打开“数据透视表字段”对话框,在“汇总方式”列表中选择“计数”。⑦双击数据区域中的“计数项:数字移动电话类型”字段,打开“数据透视表字段”对话框,在“汇总方式”列表中选择“计数”。 上一页 下一页 返回本节首页

  29. ⑧如果想选择数据显示方式,可单击图右侧的 “选项”按钮,则EXCEL 弹出“数据显示方式”。 在“数据显示方式”的下拉选 项中确定“占同列数据总和 的百分比”选项, 单击“确定” 按钮,则版式调整完毕。 再单击 “确定”按钮,回到 数据透视表步骤3,如图所 示。

  30. ⑨单击数据透视表步骤3中的“完成”按钮,数字移动电话调查单向表如图所示。⑨单击数据透视表步骤3中的“完成”按钮,数字移动电话调查单向表如图所示。 • 单向表描述了各移动电话用户对移动电话类型偏好的分布情况。从图中可以看出“全球通”是该地区的主要消费特征,其次是“长白行”,因而该公司应当注重这两种电话类型的开发与服务。

  31. 1.3.2 交叉表 交叉表用于表示两个用文字表示的品质变量之间 的关系,用于市场研究,进行市场机会、市场细 分分析等。

  32. 例该公司市场部经理希望根据上例中的调查结果,例该公司市场部经理希望根据上例中的调查结果, 确认不同性别的用户,其移动电话类型偏好是否存 在着不同。

  33. ①打开“第2章 数据整理.xls”工作簿,选定“移动电话调查”工作表。 ②从“数据”菜单中选择“数据透视表和图表报告”选项,得到“数据透视表对话框”窗口。在第1步之中选择“数据清单或数据库”与“数据透视表”,单击“下一步”按钮。 ③在第2步中,确定数据区域A1:D1001,单击“下一步”按钮。

  34. ④在第3步中,确定数据透视表的位置,如图所示, 但将其位置 调整到“H1”单元格。然后,单击“版式”按钮,打开“版式”对 话框如图所示。

  35. ⑤将对话框右边的“数字移动电话类型”字段拖到左边的⑤将对话框右边的“数字移动电话类型”字段拖到左边的 “行”区作为分组变量,再将右边的“性别” 字段拖到“列” 区,作为交叉分析的变量,最后将右边的“性别” 字段拖放到“数据”区域中,并选择计数项。如果希望结果是以百分比的形式显示,则可双击数据区域中的“计数项,性别”,则会弹出“数据透视表字段”对话框。选择“占同列数据总和的百分比”选项,来表示所出现的频率,最后,单击“确定”按钮,又回到“版式”对话框。

  36. ⑥单击“确定”按钮,回到第3步,要注意数据透视表的位⑥单击“确定”按钮,回到第3步,要注意数据透视表的位 置定在单元格H1,最后,单击“完成”按钮,得到交叉表如图所示。

  37. 从上面的交叉表中可以看出,对于移动电话类型来讲,从上面的交叉表中可以看出,对于移动电话类型来讲, 其性别之间并无太大的差异,无论是“长白行”,还是“全 球通”,或是“神州行”,其男女之间的偏好程度都不是特 别大,这说明在移动电话类型的生产与营销过程中可以 不考虑性别的差异。当然这只是一种数据整理的结果, 要想准确地说明移动电话消费是否存在着性别差异,还 需要使用推断统计方法进行假设检验。

  38. 1.4 统计图 •1.4.1 绘制统计图的基本步骤 •1.4.2 条形图与柱形图 •1.4.3 折线图 •1.4.4 饼形图

  39. 1.4.1 Excel绘制统计图的基本步骤 Excel 提供“图表向导”工具,帮助创建适合于数据 信息和分析目的的各种图表,下面先简单描述一 下图表操作的基本步骤。 ①使用“图表向导”工具制作图表之前,选定数据 所在的单元格,如果希望数据的行列标题显示 在图表中,则选定区域还应包括含有标题的单 元格。

  40. ②单击“插入”菜单中的“图表”选项,按照“图表向导”②单击“插入”菜单中的“图表”选项,按照“图表向导” 中4个步骤的指令进行操作。 • 第1步“图表类型”:每种类型的图表都有两种以上的子类型,选中所需要的图形以及它的子图形,单击“下一步”按钮。 • 第2步“图表数据源”:选定包含数据和行列标志的工作表单元格,即便工作表包含多个行列标志,也能在图表中显示它们。生成图表时,应将各行列标志包含到选定区域中。若预览图表看去很合适,则表示所选数据区正确。单击“下一步” 按钮。

  41. 第3步“图表选项”:为选定的图表设置某些标准选项。修改这些设置时,随时查看预览图表可以帮助我们确定设置是否合适。单击“下一步” 按钮。 • 第4步,“图表位置”:可以将图表放置在工作表上,或者单独置于一张新的图表工作表上,在这一步中,我们为图表工作表命名,或者选择现有工作表的名称,单击“完成”按钮。

  42. 1.4.2 条形图与柱形图 条形图和柱形图可交换使用。 • Excel的条形图是水平条形,Excel柱形图为竖直条形。 • 两种图表都可以用来表示与一组或几组分类相关的数值,它可用于不同现象的比较,也可以采用时间顺序描述现象的发展趋势。 • 在条形图或柱形图中,各长条或柱的宽度与各长条间的距离彼此均等,条的长度与所代表的变量值成比例。

  43. 例薪酬是众人所关心的主题,也更是当代经理人所例薪酬是众人所关心的主题,也更是当代经理人所 关心的主题。 • 北京、上海、深圳三个城市经理人的薪酬是我国经理人“薪酬市场”的晴雨表。 • 1999年《经理人》杂志所作的薪酬调查发现:所调查的经理人中,平均月收入最高的是上海经理人,为7767元;其次是深圳经理人,为7602元;最后是北京经理人,为7288元。 • 结论应当是最高为上海经理人。那么此结论是否可以用图形来表示呢?

  44. ①打开“第1章 数据整理xls“工作簿,选择“薪酬”工作表。 ②在Excel的“插入”菜单中选择 “图表”选项,Excel会启动图表向导, 弹出“图表向导”对话框窗口。 在 “图表类型”列表中选择 “柱形图”,在“子图表类型”列表中选择“三维簇状柱形图”, 单击“下一步” 按钮,进入数据源对话框。

  45. ③在这步对话框中,主要是选择数据源如图所示。单击“数据区③在这步对话框中,主要是选择数据源如图所示。单击“数据区 域”右端的“压缩对话框”按钮,打开工作表,在工作表上将鼠标指 向单元格A1,按下鼠标左键,拖到B4单元格,再单击“压缩对话框” 按钮,回到源数据对话框。确 定A1:B4单元格作为此图的数 据源,同时,也应注意数据系 列是以行还是以列方式排列, 如果正确,此时,便有一个预 览的图形如图所示,如满意可 单击“下一步”按钮,进入“图表 选项”对话框。

  46. ④如上图所示, 单击对话框上方 的“标题”页面, 在标题中输入“三 城市薪酬比较”; 在“图例”页面中选 择底部,至于其他 功能则不需改动与 填加,这些过程都 会在图表预览框中 看到,如果满意, 单击“完成”按钮结束, 得到图形如下图。

  47. ⑤双击所绘制的图形,则会得到如图的对话框。单击“字体”页面,在“字体”列表中选择“宋体”,在“字形” 列表中选择“常规”,在“字号”列表选择“10”。

  48. ⑥单击“图案”页面,选择“阴影”,选择“园角”,单击⑥单击“图案”页面,选择“阴影”,选择“园角”,单击 “确定”按钮结束,得图2.25所示。 从图中我们清楚地看到,就三个城市经理人的月收入 来讲,上海位居首位,其次是深圳。而在1998年的调 查中,深圳位居榜首,这说明上海经济及其经理人收 入在这一年内都有很大变化。

  49. 1.4.3 折线图 将平面中的交点相继联接起来所得图形称为折线 图,它一般用于描述某一变量在一段时期内的变 动情况。 例 已知1990年至1999年各月社会商品零售总额, 试观察一下社会商品零售总额的发展趋势及其变 动规律。

  50. ①打开“第1章 数据整理.xls”工作簿,选择“零售额”工作表。

More Related