1 / 59

第六章 树和二叉树

第六章 树和二叉树. 6.1 树的定义和基本概念 6.2 二叉树 6.2.1 树的定义和基本术语 6.2.2 二叉树的性质 6.2.3 二叉树的存储结构 6.3 遍历二叉树 6.3.1 遍历二叉树 6.3.2 线索二叉树 6.4 树和森林 6.4.1 树的存储结构 6.4.2 森林与二叉树的转换 6.4.3 树和森林的遍历 6.6 赫夫曼树及其应用 6.6.1 最优二叉树(赫夫曼树) 6.6.2 赫夫曼编码.

quincy
Download Presentation

第六章 树和二叉树

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第六章 树和二叉树 6.1 树的定义和基本概念 6.2 二叉树 6.2.1 树的定义和基本术语 6.2.2 二叉树的性质 6.2.3 二叉树的存储结构 6.3 遍历二叉树 6.3.1 遍历二叉树 6.3.2 线索二叉树 6.4 树和森林 6.4.1 树的存储结构 6.4.2 森林与二叉树的转换 6.4.3树和森林的遍历 6.6 赫夫曼树及其应用 6.6.1 最优二叉树(赫夫曼树) 6.6.2 赫夫曼编码

  2. 树型结构是一类重要的非线性结构。树型结构是结点之间有分支,并且具有层次关系的结构,它非常类似于自然界中的树。树结构在客观世界国是大量存在的,例如家谱、行政组织机构都可用树形象地表示。树在计算机领域中也有着广泛的应用,例如在编译程序中,用树来表示源程序的语法结构;在数据库系统中,可用树来组织信息;在分析算法的行为时,可用树来描述其执行过程。等等。树型结构是一类重要的非线性结构。树型结构是结点之间有分支,并且具有层次关系的结构,它非常类似于自然界中的树。树结构在客观世界国是大量存在的,例如家谱、行政组织机构都可用树形象地表示。树在计算机领域中也有着广泛的应用,例如在编译程序中,用树来表示源程序的语法结构;在数据库系统中,可用树来组织信息;在分析算法的行为时,可用树来描述其执行过程。等等。

  3. 6.1 树的定义和基本术语 定义:树(Tree)是n(n>=0)个结点的有限集T,T为 空时称为空树,否则它满足如下两个条件: (1)有且仅有一个特定的称为根(Root)的结点; (2)其余的结点可分为m(m>=0)个互不相交的子集T1,T2,T3…Tm,其中每个子集又是一棵树,并称其为子树(Subtree)。

  4. ADT{ DO D:D是具有相同特性的数据元素的集合。 DR R:若D为空集,则R为空集,否则R={H},H是如下二元关系: (1)在D中存在唯一的称为根的数据元素root,它在H下无前驱; (2)若D-{root}≠ Ø,则存在D-{root}的一个划分D1,D2,…,Dm(m>0),对任意j!=k(1≤j,k≤m)有Dj∩Dk=Ø,且对任意的i(1≤i≤m),唯一存在数据元素xi∈Di,有<root,xi>∈H; (3)对应于D-{root}的划分,H-{< root,x1>,…, < root,xm >}有唯一的一个划分H1,H2,…,Hm(m>0),对任意j!=k(1≤J,k≤m)有Hj∩Hk=Ø,且对任意的i(1≤i≤m),Hi是Di上的二元关系,(Di,{Hi})是一棵符合本定义的树,称为根root的子树。 FO: }

  5. 树的表示形式: //(PAGE120图6.2) 节点-分支树型表示; 嵌套集合表示; //节点的层次决定图形的嵌套深度. 广义表表示; //节点的层次决定表项的深度. 凹入表示. //节点的层次决定图条的长度.

  6. 基本术语: 树, 子树, 树的度 结点, 结点的度 叶子结点, 分支结点/内部结点 孩子, 双亲 兄弟, 堂兄弟 祖先, 子孙 层次, 深度/高度 有序树, 无序树 森林(Tree=(root,F),F=(T1,T2,…,Tm))

  7. 6.2 二叉树 二叉树在树结构的应用中起着非常重要的作用,因为对二叉树的许多操作算法简单,而任何树都可以与二叉树 相互转换,这样就解决了树的存储结构及其运算中存在的复杂性。 6.2.1 二叉树的定义 定义:二叉树是由n(n>=0)个结点的有限集合构成,此集合或者为空集,或者由一个根结点及两棵互不相交的左右子树组成,并且左右子树都是二叉树。 这也是一个递归定义。二叉树可以是空集合,根可以有空的左子树或空的右子树。二查树不是树的特殊情况,它们是两个概念。

  8. 二叉树结点的子树要区分左子树和右子树,即使只有一棵子树也要进行区分,说明它是左子树,还是右子树。这是二叉树与树的最主要的差别。图6.8列出二差树的5种基本形态,图6.8(C) 和图6.8(d)是不同的两棵二叉树。 (a) 空二叉树 A A A A B B B C (b) 根和空的左右子树 (e) 根和左右子树 (c) 根和左子树 (d) 根和右子树 图6.8 二叉树的5种形态

  9. 6.2.2 二叉树的性质 二叉树具有下列重要性质: 性质1: 在二叉树的第i层上至多有2i-1个结点(i>=1)。 采用归纳法证明此性质。 当i=1时,只有一个根结点,2i-1=20 =1,命题成立。 现在假定多所有的j,1<=j<i,命题成立,即第j层上至多有2j-2个结点,那么可以证明j=i时命题也成立。由归纳假设可知,第i-1层上至多有2i-2个结点。 由于二叉树每个结点的度最大为2,故在第i层上最大结点数为第i-1层上最大结点数的二倍, 即2×2i-2=2i-1。 命题得到证明。

  10. 性质2:深度为k的二叉树至多有2k-1个结点(k>=1).性质2:深度为k的二叉树至多有2k-1个结点(k>=1). 深度为k的二叉树的最大的结点数为二叉树中每层上的最大结点数之和,由性质1得到每层上的最大结点数,: ∑kI=1(第i层上的最大结点数)= ∑kI=12i-1=2k–1 性质3: 对任何一棵二叉树,如果其终端结点数为n0,度为2的结点数为n2,则n0=n2+1。 设二叉树中度为1的结点数为n1,二叉树中总结点数为N,因为二叉树中所有结点均小于或等于2,所以有:N=n0+n1+n2 (6-1) 再看二叉树中的分支数,除根结点外,其余结点都有一个进入分支,设B为二叉树中的分支总数, 则有:N=B+1。

  11. 由于这些分支都是由度为1和2的结点射出的,所有有:由于这些分支都是由度为1和2的结点射出的,所有有: B=n1+2*n2 N=B+1=n1+2×n2+1 (6-2) 由式(6-1)和(6-2)得到: n0+n1+n2=n1+2*n2+1 n0=n2+1 下面介绍两种特殊形态的二叉树:满二叉树和完全二叉树。 一棵深度为k且由2k-1个结点的二叉树称为满二叉树。图6.9就是一棵满二叉树,对结点进行了顺序编号。

  12. 1 2 3 如果深度为k、由n个结点的二叉树中个结点能够与深度为k的顺序编号的满二叉树从1到n标号的结点相对应, 4 5 7 6 图6.9 满二叉树

  13. 则称这样的二叉树为完全二叉树,图6..10(b)、则称这样的二叉树为完全二叉树,图6..10(b)、 c)是2棵非完全二叉树。满二叉树是完全二叉树的 特例。 1 1 1 2 3 2 3 2 3 4 4 7 5 6 5 7 6 (a)完全二叉树 ( c)非完全二叉树 (b)非完全二叉树 图6.10 完全二叉树

  14. 完全二叉树的特点是: (1)所有的叶结点都出现在第k层或k-1层。 (2)错任一结点,如果其右子树的最大层次为1,则其左子树的最大层次为1或l+1。 性质4:具有n个结点的完全二叉树的深度为[log2n]+1。 符号【x】表示不大于x的最大整数。 假设此二叉树的深度为k,则根据性质2及完全二叉树的定义得到:2k-1-1<n<=2k-1 或 2k-1<=n<2k 取对数得到:k-1<log2n<k 因为k是整数。所以有:k=【log2n】+1。

  15. 性质5: 如果对一棵有n个结点的完全二叉树的结点按层序编号(从第1层到第【log2n】+1层,每层从左到右),则对任一结点i(1<=i<=n),有: (1)如果i=1,则结点i无双亲,是二叉树的根;如果i>1,则其双亲是结点【i/2】。 (2)如果2i>n,则结点i为叶子结点,无左孩子;否则,其左孩子是结点2i。 (3)如果2i+1>n,则结点i无右孩子;否则,其右孩子是结点2i+1。

  16. 如图6.11所示为完全二叉树上结点及其 左右好在结点之间的关系。 i ┗i/2┙ i+1 i i+1 2i 2i+1 2i 2i+1 2(i+1) 2i+3 2(i+1) 2i+3 (b)i和i+1结点不在同一层 (a)i和i+1结点在同一层 图6.11 完全二叉树中结点i和i+1

  17. 在此过程中,可以从(2)和(3)推出(1),所以先证明(2)和(3)。在此过程中,可以从(2)和(3)推出(1),所以先证明(2)和(3)。 对于i=1,由完全二叉树的定义,其左孩子是结点2,若2>n,即不存在结点2,此是,结点i无孩子。结点i的由孩子也只能是结点3,若结点3不存在,即3>n,此时结点i无右孩子。 对于i>1,可分为两种情况: (1)设第j(1<=j<=[log2n])层的第一个结点的编号为i,由二叉树的性质2和定义知i=2j-1 结点i的左孩子必定为的j+1层的第一个结点,其编号为2j=2×2j-1=2i。如果2i>n,则无左孩子:

  18. 其右孩子必定为第j+1层的第二个结点,编号为2i+1。若2i+1>n,则无右孩子。其右孩子必定为第j+1层的第二个结点,编号为2i+1。若2i+1>n,则无右孩子。 (2)假设第j(1<=j<=┗log2n┙)层上的某个结点编号为i(2j-1<=i<=2j-1),且2i+1<n,其左孩子为2i,右孩子为2i+1,则编号为i+1的结点时编号为i的结点的右兄弟或堂兄弟。若它有左孩子,则其编号必定为2i+2=2×(i+1):若它有右孩子,则其编号必定为2i+3=2×(i+1)+1。 当i=1时,就是根,因此无双亲,当i>1时,如果i为左孩子,即2×(i/2)=i,则i/2是i的双亲;如果i为右孩子,i=2p+1,i的双亲应为p,p=(i-1)/2= ┗ i/2 ┙. 证毕。

  19. 6.2.3 二叉树的存储结构 1.顺序存储结构 它是用一组连续的存储单元存储二叉树的数据元素。因此,必须把二叉树的所有结点安排成为一个恰当的序列,结点在这个序列中的相互位置能反映出结点之间的逻辑关系,用编号的方法: #define MAX_TREE_SIZE 100 Typedef TElemType SqBiTree[MAX_TREE_SIZE]; SqBiTree bt ; 从树根起,自上层至下层,每层自左至右的给所有结点编号缺点是有可能对存储空间造成极大的浪费,在最坏的情况下,一个深度为H且只有H个结点的右单支树确需要2h-1个结点存储空间。而且,若经常需要插入与删除树中结点时,顺序存储方式不是很好!

  20. 完全二叉树 A C B D E F G H I J K L 1 2 3 4 5 6 7 8 9 10 11 12

  21. 一般二叉树 Ø 表示该处没有元素存在仅仅为了好理解

  22. (2)二叉链表法 存储二叉树经常用二叉链表法

  23. 二叉树的二叉链表存储表示 Typedef struct BiTNode { TelemType data; struct BiTNode *lchild,*rchild; } BiTNode,*BiTree; 有时也可用数组的下标来模拟指针,即开辟三个一维数组Data ,lchild,rchild 分别存储结点的元素及其左,右指针域;

  24. 链式存储结构的算法: Status CreateBiTree(BiTree *T) { scanf(&ch); if(ch= =") T=NULL; else{ if(!(T=(BiTNode *)malloc(sizeof(BiTNode)))) exit(OVERFLOW); T–>data=ch; CreateBiTree(T–>lchild); CreateBiTree(T–>rchildd); } return OK; }

  25. (3)三叉链表 其它见书P127

  26. 6.3 遍历二叉树和线索二叉树 6.3.1遍历二叉树 在二叉树的一些应用中,常常要求在树中查找具有某 种特征的结点,或者对树中全部结点逐一进行某种处 理。这就引入了遍历二叉树的问题,即如何按某条搜 索路径巡访树中的每一个结点,使得每一个结点均被 访问一次,而且仅被访问一次。 遍历对线性结构是容易解决的,而二叉树是非线性的, 因而需要寻找一种规律,以便使二叉树上的结点能排 列在一个线性队列上,从而便于遍历。 (根结点) 由二叉树的递归定义, 二叉树的三个基本组成 单元是:根结点、左子 树和右子树。 a (右子树) b c (左子树)

  27. 假如以L、D、R分别表示遍历左子树、遍历根结点和假如以L、D、R分别表示遍历左子树、遍历根结点和 遍历右子树,遍历整个二叉树则有DLR、LDR、LRD、 DRL、RDL、RLD六种遍历方案。若规定先左后右,则只有前三种情况,分别规定为: DLR——先(根)序遍历, LDR——中(根)序遍历, LRD——后(根)序遍历。

  28. 1、先序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)访问根结点; (2)先序遍历左子树; (3)先序遍历右子树。 2、中序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)中序遍历左子树; (2)访问根结点; (3)中序遍历右子树。 3、后序遍历二叉树的操作定义为: 若二叉树为空,则空操作;否则 (1)后序遍历左子树; (2)后序遍历右子树; (3)访问根结点。

  29. 例如图(1)所示的二叉树表达式 (a+b*(c-d)-e/f) 若先序遍历此二叉树,按访问结点的先后次序将结点排列起来,其先序序列为: (波兰式) -+a*b-cd/ef 按中序遍历,其中序序列为: a+b*c-d-e/f (中缀式) 按后序遍历,其后序序列为: abcd-*+ef/- (逆波兰式) 人喜欢中缀形式的算术 表达式,对于计算机,使 用后缀易于求值 图 (1) - / + f e a * b - c d

  30. TREENODE *creat_tree() { TREENODE *t; char c; c=getchar(); if(c= =‘#’) return(NULL); else{ t=(TREENODE *)malloc(sizeof(TREENODE)) t – >data=c; t –>lchild=create_tree(); t –>rchild=create_tree(); } return(t); }

  31. 中序遍历算法: #include<stdio.h> #include<stdlib.h> #define NULL 0 typedef struct node{ char data; struct node *lchild,*rchild; }TREENODE; TREENODE *root; TREENODE *creat_tree(); void inorder(TREENODE *p) { if(p!=NULL){ inorder(p–>lchild); printf(“%c”,p–>data) inorder(p–>rchild); } }

  32. 遍历二叉树是指以一定规则将二叉树中的结点排列成一个线性序列,得到二叉树中结点的先序序列、中序序列或后序序列。(即非线性序列线性化)遍历二叉树是指以一定规则将二叉树中的结点排列成一个线性序列,得到二叉树中结点的先序序列、中序序列或后序序列。(即非线性序列线性化)

  33. 6.3.2线索二叉树: 当以二叉链表作为存储结构时,只能找到结点的左右孩子的信息,而不能直接找到结点的任一序列的前驱与后继信息,这种信息只有在遍历的动态过程中才能得到,为了能保存所需的信息,可增加标志域; 其中: 0 lchild 域指示结点的左孩子 ltag={ 1 lchild 域指示结点的前驱 0 rchild 域指示结点的右孩子 rtag={ 1 rchild 域指示结点的后驱 以这种结构构成的二叉链表作为二叉树的存储结构,叫做线索链表,其中指向结点前驱与后继的指针叫做线索.加上线索的二叉树称之为线索二叉树。 对二叉树以某种次序遍历使其变为线索二叉树的过程叫线索化。

  34. 二叉树的二叉线索存储表示: Typedef enum{Link,Thread}PointerTag; Link= =0:指针,Thread= =1:线索 Typedef struct BiThrNode{ TelemType data; struct BiTreeNode *lchild,*rchild; PointerTag LTag, Rtag; }BiTreeNode,*BiThrTree; 模仿线性表的存储结构,在二叉树的线索链表上也添加一个头结点,令其lchild域的指针指向二叉树的根结点,其rchild域的指针指向中序遍历时访问的最后一个结点; 同时,令二叉树中序序列中的第一个结点lchild域的指针和最后一个结点rchild域的指针均指向头结点;就像为二叉树建立了一个双向线索链表, 就好比人在一个圆圈上走路,有可能存在好走的可能性.

  35. 如何在中序线索树中找结点的后继、前趋? 结点的后继:应该是遍历其右子树时访问的第一个结点,即右子树中最左下的结点。 结点的前趋:若其左标志为“1”,则左链为线索,指示其前驱,否则遍历左子树时的最后访问的一个结点(左子树最右下的结点)为其前驱。 什么时候采用线索链表做存储结构? 程序中所用二叉树需要经常遍历或查找结点在遍历所得线性序列中的前驱和后继时。

  36. 前提条件:线索树已经建好 Status InorderTraverse_Thr(BiThrTree T,status(*visit)(TElemType)){ //T指向头结点,头结点的lchild左链指向根结点 //中序遍历二叉线索树的非递归算法,对每个数据元素调用函数Visit P=T–>lchild; while(p!=T){ //空树或访问结束时, P=T while(p –>LTag = =Link) p=p –>lchild; if(!visit(p –>data)) return error; //访问其左子树为空的结点 while(p –>RTag = =Thread&&p –>rchild!=T) { p=p –>rchild; Visit(p –>data);//访问后继结点 } p= p–>rchild; } return OK; }//InorderTraverse_Thr

  37. 中序建立线索树 P134 : Status InorderThreading(BiThrTree &Thrt,BiThrTree T){ if(!(Thrt =(BiThrTree)malloc(sizeof(BiThrNode)))) exit(OVERFLOW); Thrt –>LTag =Link; //头结点的处理 Thrt –>RTag =Thread; Thrt –>rchild=Thrt; if (!T) Thrt –>lchild=Thrt;//若二叉树空,则左指针回指 else{ Thrt –>lchild=T; pre=Thrt; InThrTreading(T);//中序遍历进行中序线索化 pre –>rchild=Thrt; pre –> RTag =Thread; Thrt –>rchild=pre; } return OK; }//InorderThreading

  38. void InThreading(BiThrTree p) { if(p){ InThreading(p –>lchild); if(!p –>lchild) {p –> LTag =Thread; p –>lchild=pre;} if(!pre –>rchild) {pre –>RTag =Thread; pre –>rchild=p;} pre=p; InThreading(p –>rchild); } } //在线索树上插入一棵左子树(Ins_lchild)和删除一棵左子(Del_lchild)

  39. 如何在后序线索树中找结点的后继? 1:若结点X是二叉树的根,则其后继为空; 2:若结点X是其双亲的右孩子或是其双亲的左孩子且其双亲没有右子树,则其后继即为双亲结点; 3:若结点X是其双亲的左孩子,且其双亲有右子树,则其后继为双亲的右子树上按后序遍历列出的第一个结点。

  40. 由于在后序线索树上找后继时需要知道结点的双亲,由于在后序线索树上找后继时需要知道结点的双亲, 所以需要带标志域的三叉链表作存储结构。

  41. E F G F D B C A G G B D D C E A A F E B C (a) 先序线索二叉树(b) 中序线索二叉树 (c) 后序线索二叉树 图6.11线索二叉树

  42. 6.4 树和森林 6.4.1 树的存储结构 1:双亲表示法 #define MaxTS 100 Typedef struct ptnode{ telemtype data; int parent;} ptnode; Typedef struct { ptnode nodes[MaxTS]; int n;} Ptree;

  43. 2:孩子表示法: (a)多重链表; (b)把每个结点的孩子结点排列起来,看成一个线性表,且以单链表做存储结构.且N个头指针也组成一个线性表.

  44. 双亲表示和孩子表示相结合:

  45. 3:孩子兄弟表示法://二叉树表示法或二叉链表表示法3:孩子兄弟表示法://二叉树表示法或二叉链表表示法 以二叉链表做树的存储结构,链表中结点的两个链域分别指向该结点的第一个孩子结点和下一个兄弟结点(fchild 和nsibling) Typedef struct CSNode{ ElemType data; Struct CSNode * fchild ,*nsibling; }CSNode,*CSTree;

  46. 6.4.2 森林与二叉树的转换 二叉树和树都可用二叉链表作存储结构,则以二叉链表作为媒介可导出树与二叉树之间的一一对应关系。 从树的二叉链表表示定义知道:任何一棵和树对应的二叉树的右子树必空。若将森林中第二棵树的根结点看成第一棵树的根结点的兄弟,则可以导出森林和二叉树的对应关系。

  47. 一、森林转换成二叉树

  48. 二、二叉树转换成森林

  49. 6.4.3 树和森林的遍历 树: 先根 //相当于二叉树的先序遍历 后根 //相当于二叉树的中序遍历 森林:先序 1.访问森林中第一棵树的根结点; 2.先序遍历第一棵树中根结点的子树森林; 3.先序遍历除去第一棵树之后剩余的树构成的森林. 中序 1.中序遍历第一棵树中根结点的子树森林; 2.访问森林中第一棵树的根结点; 3.中序遍历除去第一棵树之后剩余的树构成的森林.

  50. 6.6 哈夫曼树及其应用 • 6.6.1最优二叉树(哈夫曼树) • 基本术语: • 路径, • 路径长度, • 权,带权路径长度,WPL=Σwklk • 最优二叉树/哈夫曼树 • 带权路径长度最短的树(WPL值最小) • 例1 P(144图6.22) • 例2 P(144~145“%制”-“5分制”) n K=1

More Related