850 likes | 980 Views
图搜索基础. 一、图搜索概论. 1 树与图的回顾 树和图的定义、基本术语 图的存储结构 树和图的遍历方法 2 显式图 & 隐式图 3 图搜索术语 & 方法分类. 二 、 广度优先搜索 三、深度优先搜索. 国务院. 北京市. 山东省. …. 西藏自治区. 青岛市. 济南市. …. 威海市. 历下区. 市中区. …. 历城区. 1 树与图的回顾. 结点之间有分支. 树的意义?. 树型结构 ( 非线性结构 ). 具有层次关系. 自然界:树. 家谱. 人类社会. 例. 行政组织机构. 编译:用树表示源程序的语法结构.
E N D
一、图搜索概论 • 1 树与图的回顾 • 树和图的定义、基本术语 • 图的存储结构 • 树和图的遍历方法 • 2 显式图&隐式图 • 3 图搜索术语&方法分类 二、广度优先搜索三、深度优先搜索
国务院 北京市 山东省 … 西藏自治区 青岛市 济南市 … 威海市 历下区 市中区 … 历城区 1 树与图的回顾 结点之间有分支 树的意义? 树型结构(非线性结构) 具有层次关系 自然界:树 家谱 人类社会 例 行政组织机构 编译:用树表示源程序的语法结构 数据库系统:用树组织信息 计算机领域 算法分析:用树描述执行过程
树的定义和基本术语 • 定义: 树(Tree) 是 n (n≥0) 个结点的有限集。若 n = 0,称 为空树;若 n > 0,则它满足如下两个条件: (1) 有且仅有一个特定的称为根(Root) 的结点; (2) 其余结点可分为 m (m≥0) 个互不相交的有限集 T1, T2, T3, …, Tm,其中每一个集合本身又是一棵树,并称为 根的子树(SubTree)。 树的定义是一个递归的定义。
A B C D E F G H I J 双亲 兄弟 孩子 K L M 结点:数据元素+ 指向子树的分支 根结点:非空树中无前驱结点的结点 • 基本术语: 第 1 层 结点的度:结点拥有的子树数。 度= 0 叶子 终端结点 T1 T2 T3 第 2 层 第 3 层 度 ≠ 0 分支结点 非终端 结点 根结点以 外的分支 结点称为 内部结点 第 4 层 树的度:树内各结点的度的最大值。 树的逻辑结构:树中任一结点都可以有零个或多个直接后继结点 但至多只能有一个直接前趋结点。 森林:是 m (m≥0) 棵互不相交的树的集合。 结点的祖先:从根到该结点所经分支上的所有结点。 堂兄弟 双亲在同一层的结点 结点的子孙:以某结点为根的子树中的任一结点。 把根结点删除树就变成了森林。 一定是 树的深度:树中结点的最大层次。 树 森林 一棵树可以看成是一个特殊的森林。 不一定是 有序树:树中结点的各子树从左至右有次序(最左边的为第一个孩子)。 无序树:树中结点的各子树无次序。 给森林中的各子树加上一个双亲结点,森林就变成了树。
图的定义和基本术语 • 定义: 图(Graph) 是一种复杂的非线性数据结构,由顶 点集合及顶点间的关系(也称弧或边)集合组成。可 以表示为: G=(V, {VR}) 其中 V是顶点的有穷非空集合; VR是顶点之间关系 的有穷集合,也叫做弧或边集合。弧是顶点的有序对, 边是顶点的无序对。
图的意义 • 图是一种限制最少的数据结构。 • 更接近现实; • 实际问题中很多数据关系都可以抽象成图,相关问题则可利用图的基本算法进行求解,很早就有专门研究图的是一门数学学科“图论”。 • 图论中著名算法:求最小生成树的Kruskal算法、求最短路径的Dijkstra算法和Floyd算法、求二分图最大匹配(指派问题)的匈牙利算法、求一般图最大匹配的Edmonds“花”算法、求网络最大流量和最小割集算法等。其中一些算法在数据结构课程中已经学习过。
G1 G2 v1 v2 v1 v2 v3 v3 v4 v4 v5 • 基本术语: 顶点:图中的数据元素。 弧:若 <v, w>∈VR,则 <v, w> 表示从 v 到 w 的 一条弧,且称 v为弧尾,称 w为弧头, 此时的图称 为有向图。 有向图 G1 = (V1, {A1}) V1 = {v1, v2, v3, v4} A1 = {< v1, v2>, < v1, v3>, < v3, v4>, < v4, v1>} 边:若 <v, w>∈VR 必有<w, v>∈VR,则以无序 对 (v, w) 代表这两个有序对,表示 v 和 w 之间的一条 边,此时的图称为无向图。 G2 = (V2, {E2}) V2 = {v1, v2, v3, v4, v5} E2 = {(v1, v2), (v1, v4), (v2, v3), (v2, v5) , (v3, v4), (v3, v5)} 无向图
v1 v2 v3 v4 v5 v1 v2 v3 v4 无向图中边的取值范围:0≤e≤n(n-1)/2。 (n 表示图中顶点数目, e表示边的数目,且不 考虑顶点到自身的边) 完全图:有n(n-1)/2 条边的无向图(即:无向图中每两个顶点间都存在一条边)称为完全图。 有向图中弧的取值范围:0≤e≤n(n-1)。 (n 表示图中顶点数目, e表示弧的数目,且不 考虑顶点到自身的弧) 有向完全图:有 n(n-1) 条弧的有向图(即:有向 图中每两个顶点间都存在着方向相反的两条弧)称 为有向完全图。 简单图:没有环且每两个顶点间最多只有一条边相连的图。
7 V1 V2 12 V1 V2 15 稀疏图:含有很少条边或弧的图。 稠密图:含有很多条边或弧的接近完全图的图。 权:与图的边或弧相关的数,这些数可以表示从一个顶点到 另一个顶点的距离或耗费。 网:带权的图。
v1 v2 v3 v4 v5 v1 v1 v1 v1 v2 v1 v2 v1 v2 v1 v2 v2 v4 v3 v3 v3 v4 v4 v5 v4 v5 v4 v5 v1 v2 v5 子图:如果图G = (V, {E}) 和G´= (V´, {E´}),满足:V´ V且 E´ E,则称 G´为G的子图。 邻接点:若 (v, v´) 是一条边,则称顶点 v 和 v´互为邻接点, 或称 v 和 v´相邻接;称边 (v, v´) 依附于顶点 v和 v´,或称 (v, v´) 与顶点 v和 v´ 相关联。 若 <v, v´> 是一条弧,则称顶点 v邻接到v´,顶点 v´ 邻接自顶点 v。并称弧 <v, v´> 与顶点 v和 v´ 相关联。
v1 v1 v2 v2 v3 v3 v4 v4 v5 度:无向图中顶点 v的度是和 v相关联的边的数目,记为TD(v)。 入度:有向图中以顶点 v为终点的弧数目称为 v的入度,记ID(v)。 出度:有向图中以顶点 v为起点的弧数目称为 v的出度,记OD(v)。 度:入度和出度之和,即:TD(v) = ID(v) + OD(v)。 如果顶点 vi的度为 TD(vi),则一个有 n个顶点 e条边(弧) 的图,满足如下关系: 终端顶点:有向图中把出度为 0的顶点称为终端顶点。
v1 v2 v3 v4 v5 v1 v1 v2 v2 v3 v3 v4 v4 v5 路径:从顶点v到v´的路径是一个顶点序列 (v= vi, 0, vi, 1, …, vi, m=v´),满足(vi, j-1, vi, j)VR或 <vi, j-1, vi, j >VR (1 j m)。 对于有向图,路径也是有向的。 路径长度:路径上边或弧的数目。 回路(环):第一个顶点和最后一个顶点相同的路径。 简单路径:序列中顶点(两端点除外)不重复出现的路径。 简单回路(简单环):前后两端点相同的简单路径。 连通:无向图中从顶点v到v´有路径,则说v和v´是连通的。 连通图:无向图中任意两个顶点都是连通的。
v1 v2 v1 v2 v1 v2 v3 v4 v5 v3 v3 v4 v4 v1 v1 v2 v2 v3 v3 v4 v4 v5 连通分量:无向图的极大连通子图;任何连通图的连通分量只有一个,即其本身;非连通图有多个连通分量(非连通图的每一个连通部分)。 强连通图:有向图G中,若对于V(G)中任意两个不同的顶点vi和vj,都存在从vi到vj以及从vj到vi的路径,则称G是强连通图。 强连通分量:有向图的极大强连通子图;任何强连通图的强连通分量只有一个,即其本身;非强连通图有多个强连通分量。
图的存储结构之数组表示法(邻接矩阵表示法) 对于一个具有n个顶点的图,可用两个数组存储。其中一个一维数组存储数据元素(顶点)的信息,另一个二维数组(图的邻接矩阵)存储数据元素之间的关系(边或弧)信息。 邻接矩阵:设 G = (V, {VR}) 是具有 n个顶点的图,顶点的顺序依次为 {v1, v2, …, vn},则 G 的邻接矩阵是具有如下性质的 n阶方阵:
G1 G2 v1 v2 v1 v2 v3 v3 v4 v4 v5 v1v2v3v4v5 v1v2v3v4 v1 v2 v3 v4 v5 v1 v2 v3 v4 特点: • 无向图的邻接矩阵对称,可压缩存储;有n个顶点的无向图需存储空间为n(n-1)/2。 • 有向图邻接矩阵不一定对称;有n个顶点的有向图需存储空间为n²,空间复杂度O(n2),用于稀疏图时空间浪费严重。 • 无向图中顶点vi的度TD(vi) 是邻接矩阵中第i行1的个数。 顶点vi的出度是邻接矩阵中第i行1的个数。 • 有向图中 顶点vi的入度是邻接矩阵中第i列1的个数。
5 v2 v1 4 8 3 7 v3 9 v6 6 5 1 v4 v5 5 网的邻接矩阵可定义为: v1v2v3v4v5 v6 v1 v2 v3 v4 v5 v6
v1 0 v2 1 v3 2 v4 3 v5 4 G2 v1 v2 邻接点域,存放与vi邻接的 结点在表头数组中的位置。 链域,指示下一条边或弧。 v3 v4 v5 图的存储结构之邻接表(类似于树的孩子链表表示法) 1 3 ^ 2 0 4 ^ 3 1 4 ^ 0 2 ^ 1 2 ^ 顶点表结点 边表结点 特点: • 若无向图中有n个顶点、e条边,则其邻接表需n个顶点表结点和2e个边表结点。适宜存储稀疏图。 • 无向图中顶点 vi的度为第 i个单链表中的结点数。
v1 0 3 ^ v2 0 1 ^ v3 2 0 ^ v4 2 3 ^ G1 v1 v2 v3 v4 邻接表 逆邻接表 v1 0 1 2 ^ v2 1 ^ v3 2 3 ^ v4 0 3 ^ 找出度易,找入度难。 找入度易,找出度难。 特点: • 顶点 vi的入度为第 i个单链 表中的结点个数。 • 顶点 vi的出度为第 i个单链 表中的结点个数。 • 顶点 vi 的出度为整个单链表 中邻接点域值是i -1的结点 个数。 • 顶点 vi 的入度为整个单链表 中邻接点域值是i -1的结点 个数。
根结点 左子树 右子树 二叉树的遍历 得到树中所有结点的一个线性排列。 目的: 方法: 依次遍历二叉树中的三个组成 部分,从而遍历整个二叉树。 假设:L:遍历左子树 D:遍历根结点 R:遍历右子树 则遍历整个二叉树方案共有: DLR、LDR、LRD、DRL、RDL、RLD六种。
A D B E H J A M I L B C 若规定先左后右,则只有前三种情况: DLR —— 先(根)序遍历 LDR —— 中(根)序遍历 LRD —— 后(根)序遍历 递归的定义
A B C E D 一般树的遍历 1、先根(次序)遍历: 若树不空,则先访问根结点,然后依次先根遍历各棵子树。 2、后根(次序)遍历: 若树不空,则先依次后根遍历各棵子树,然后访问根结点。 3、按层次遍历: 若树不空,则自上而下自左至右访问树中每个结点。 遍历结果: 先根遍历: A B C D E 后根遍历: B D C E A 按层次遍历: A B C E D
V1 V2 V3 V5 V4 V6 V7 V8 图的遍历 从图的任意指定顶点出发,依照某种规则去访问图中所有顶点,且每个顶点仅被访问一次,此过程叫做图的遍历。 图的遍历按照广度优先和深度优先规则去实施,通常有广度优先遍历法( Breadth_Frist Search——BFS)和深度优先遍历法(Depth_First Search——DFS )两种。
V1 V2 V3 V5 V4 V6 V7 V8 图的遍历之广度优先遍历(BFS) 方法:从图的某一结点出发,首先依次访问该结点的所有邻接顶点 Vi1, Vi2, …, Vin,再依次访问与 Vi1, Vi2, …, Vin相邻接的所有未被访问的顶点,重复此过程,直至所有顶点均被访问为止。 例: 广度优先遍历: V2 V3 V4 V5 V6 V7 V8 V1 V3 V2 V7 V6 V5 V4 V8 V1 V2 V3 V5 V4 V7 V6 V8 V1
V1 1 4 ^ 5 6 ^ 7 ^ 6 ^ 2 ^ 0 1 0 1 2 2 3 3 7 ^ 5 ^ 4 ^ V2 V3 V5 V4 V6 V7 1 1 1 1 1 1 1 1 R V8 F F F F F F F F F R R R R R R R R 0 1 2 3 4 5 6 7 V1 V2 V3 V4 V5 V6 V7 V8 实现: V6 V5 V4 0 1 2 3 4 5 6 7 V3 V8 V2 V1 V2 V3 V4 V5 V6 V7 V8 V7 V1
V1 V2 V3 V5 V4 V6 V7 V8 图的遍历之深度优先遍历(DFS) 方法:首先访问指定的起始顶点,然后在与该顶点邻接的顶点中选择一个未被访问的顶点进行访问,接着再从现在访问的顶点的 邻接顶点中任意选择一个未被访问的顶点进行访问,如此继续,若 到达无未被访问的邻接顶点的顶点时,则退回到最近访问过的那 个顶点,若它还有未被访问的邻接顶点,则选择一个进行访问。重复上述过程,直到全部顶点都访问完毕 。 例: 深度优先遍历: V2 V4 V8 V5 V3 V6 V7 V1 V2 V5 V8 V4 V3 V6 V7 V1 V2 V4 V8 V5 V3 V7 V6 V1 V2 V5 V8 V4 V3 V7 V6 V1 V3 V6 V7 V2 V4 V8 V5 V1
V1 1 6 ^ 7 ^ 5 ^ 4 ^ 3 7 ^ 6 ^ 4 ^ 3 0 1 5 2 ^ 1 2 2 0 V2 V3 V5 V4 V6 V7 1 1 1 1 1 1 1 1 V8 0 1 2 3 4 5 6 7 V1 V2 V3 V4 V5 V6 V7 V8 实现: V5 V8 V7 0 1 2 3 4 5 6 7 V6 V4 V3 V2 V1 V2 V4 V8 V5 V3 V6 V7 V1
V1 V2 V3 V5 V4 V6 V7 V8 1 5 7 ^ 6 ^ 7 ^ 3 ^ 1 2 ^ 6 ^ 1 1 1 1 1 1 1 1 0 1 2 3 4 5 6 7 V1 V2 V3 V4 V5 V6 V7 V8 V8 V7 0 1 2 3 4 5 6 7 V4 V6 V3 V2 V1 V2 V4 V8 V3 V6 V7 V5 V1 V5
2 显式图&隐式图 • 在路径问题、连通性问题和网络优化等问题中,图的结构是显式给出的,包括图中的顶点、边及权重,这类图称为显式图,即一般意义上的图。 • 隐式图是由问题的初始结点,为了求解或求证问题,根据问题的规则(一般是由题目的意思隐含给出的),也就是生成子结点的约束条件,逐步扩展结点,直至得到目标结点为止的一个隐式的图。 • 两种典型的隐式图:子集树,排列树
2 显式图&隐式图-子集树 • 当要求解的问题需要在n 个元素的子集中进行搜索,其搜索空间树被称作子集树(subset tree)。这n个元素都在子集中或被选取记为1,不在子集中或被舍去记为0,这样搜索空间为: (0,0,……,0,0), (0,0,……,0,1), (0,0,……,1,0), (0,0,……,1,1), …… (1,1,……,1,1)。
2 显式图&隐式图-子集树 • 共2n个状态。若表示为树形结构就是一棵有2n个叶结点的二叉树,对树中所有分支进行遍历的算法都必须耗时O(2n)
2 显式图&隐式图-排列树 • 当要求解的问题需要在n个元素的排列中搜索问题的解时,解空间树被称作排列树(permutation tree)。 • 搜索空间为: (1,2,3,……,n-1,n), (2,1,3,……,n-1,n), (2,3,1,……,n-1,n), (2,3,4,1,……,n-1,n), ……. (n,n-1,……,3,2,1) • 第一个元素有n 种选择,第二个元素有n-1种选择,第三个元素有n-2种选择,……,第n个元素有1种选择,共计n!个状态。若表示为树形就是一个n度树,这样的树有n! 个叶结点,所以每一个遍历树中所有节点的算法都必须耗时O(n! )
3 图搜索术语&方法分类 • 搜索分为两大类: • 穷举搜索(盲目搜索)是对图的最基本的搜索算法,是蛮力策略的一种表现形式。即不考虑给定问题的特有性质,按事先定好的顺序,依次运用规则,盲目搜索的方法。 • 启发式搜索是利用一些启发信息,提前判断出先搜索哪些状态可能尽快找到问题的解或某些情况不可能取到最优解,从而可以提前舍弃对这些状态的尝试。即考虑给定问题的特有性质,选用合适的细则,提高搜索的效率。 隐含地检查所有可能情况
3 图搜索术语&方法分类 • 问题状态:树中的每一个结点确定所求解问题的一个问题状态。 • 状态空间:由根结点到其它结点的所有路径(分支),就确定了这个问题的状态空间。 • 解状态:是这样一些问题状态S,对于这些问题状态,由根到S的那条路径确定了该解空间中的一个元组。 • 答案状态:是这样一些解状态S,对于这些解状态而言,由根到S的这条路径确定了这问题的一个解(即它满足隐式约束条件)。 • 状态空间树:解空间的树结构,又称隐式图。
3 图搜索术语&方法分类 • 活结点:如果已生成一个结点而它的所有儿子结点还没有全部生成,则这个结点叫做活结点。 • E-结点:当前正在生成其儿子结点的活结点叫E-结点(正在扩展的结点)。 • 死结点 :不再进一步扩展或者其儿子结点已全部生成的结点就是死结点 。
3 图搜索术语&方法分类 …… …… …… 问题状态 状态空间 解状态 答案状态 • n皇后问题 • 要在n*n的国际象棋棋盘中放n个皇后,使任意两个皇后都不能互相吃掉。规则:皇后能吃掉同一行、同一列、同一对角线的任意棋子。求所有的解。
3 图搜索术语&方法分类 • 显式图的穷举搜索: • 广度优先搜索 • 深度优先搜索 • 隐式图的穷举搜索: • 回溯算法 • 分支算法 • 在这些算法中都可以加入“启发信息”,将算法优化为对应的启发式搜索,如分支限界算法。
二、广度优先搜索 • 1 图的广度优先遍历/搜索算法 • 2 广度优先搜索的应用 • 例7.1 求经过城市最少的路线问题 • 例7.2 走迷宫问题
V1 V2 V4 V3 V5 V6 1 广度优先遍历/搜索 • 遍历/搜索 • 二叉树:先/中/后序(根),层次; • 树和森林:先根/后根,层次; • 图:深度/广度优先; • 遍历所有结点的目的是对结点进行各种操作。 • 算法的推广/退化 • 二叉树是特殊的树; • 树是特殊的图。
V1 V2 V3 V5 V4 V6 V7 V8 1 广度优先搜索 • 广度优先搜索 • 首先访问出发点V,接着依次访问V的所有邻接点{Wi},再依次访问分别与{Wi}邻接的所有未曾访问过的顶点,……,直至与V相通的顶点都已访问,若此时还有未访问的顶点,则按相同的过程继续。 • 活结点的扩展是按先来先处理的原则进行。 “先被访问的顶点”的邻接点先于“后被……”被访问
1 广度优先搜索-算法要素 • 广度优先搜索:活结点的扩展是按先来先处理的原则进行;但搜索过程中还需暂时保存部分活结点。 • 在算法中用“队”来存储每个E-结点扩展出的活结点。实际应用中,用数组或链表实现队列。 • 开辟数组visited[ ]记录结点的搜索情况。
V1 1 4 ^ 5 6 ^ 7 ^ 6 ^ 2 ^ 0 1 0 1 2 2 3 3 7 ^ 5 ^ 4 ^ V2 V3 V5 V4 V6 V7 1 1 1 1 1 1 1 1 R V8 F F F F F F F F F R R R R R R R R 0 1 2 3 4 5 6 7 V1 V2 V3 V4 V5 V6 V7 V8 实现: V6 V5 V4 0 1 2 3 4 5 6 7 V3 V8 V2 V1 V2 V3 V4 V5 V6 V7 V8 V7 V1
2 广度优先搜索-算法的基本思路 • 算法设计的基本步骤 • 1)确定图的存储方式; • 2)图的遍历过程中的操作,其中包括为输出问题解而进行的存储操作; • 3)输出问题的结论。
1 广度优先搜索-一般算法 //从顶点v 开始的广度优先搜索 把顶点v标记为已到达顶点; 初始化队列Q,其中仅包含一个元素v; while(Q不空) { 从队列中删除顶点w; 令u 为邻接于w 的顶点; while(u) { if( u 尚未被标记) { 把u 加入队列; 把u 标记为已到达顶点; } u = 邻接于w 的下一个顶点; } } • 图的搜索的不同实现 • 图:邻接表/邻接矩阵 • 队列:链表/数组 • 机制:递归/非递归 • 广度优先搜索用非 递归实现方便。
1 广度优先搜索-邻接表表示图的算法 int visited[n]; //n 为结点个数 bfs(int k,graph head[]) { int i; queue Q; edgenode *p; //定义队列InitQueue(Q); //队列初始化print(“visit vertex”,k); visited[k]=1; //访问源点vk EnQueue(Q,k); //vk已访问,将其入队while(!QueueEmpty(Q)) //队非空则执行{ i=DeQueue(Q); // vi出队为E-结点p=head[i].firstedge; //取vi的边表头指针while(p<>null) //扩展E-结点 { if(visited[p->adjvex]=0) //若vj未访问过{ print (“visit vertex”,p->adjvex);//访问vj visited[p->adjvex]=1; EnQueue(Q,p->adjvex); } //访问过的vj入队p=p->next; } //找vi的下一邻接点 }
1 广度优先搜索-邻接矩阵表示图的算法 bfsm(int k, graph g[][100],int n) { int i,j;queue Q; InitQueue(Q); print (“visit vertex”, k); //访问源点vk visited[k]=1; EnQueue(Q,k); while(not QueueEmpty(Q)) { i=DeQueue(Q); //vi出队for(j=0;j<G->n;j++) //扩展结点if(g[i][j]==1 and visited[j]=0) { print(“visit vertex”,j); visited[j]=1; EnQueue(Q,j);} //访问过的vj入队} }
2 广度优先搜索的应用-例7.1 例7.1 已知若干个城市的地图,求从一个城市到另一个城市 的路径,要求路径中经过的城市最少。 如上图表示的是从城市A到城市H的交通图。从图中可以看出,从城市A到城市H要经过若干个城市。现要找出一条经过城市最少的一条路线并输出该路线。
2 广度优先搜索的应用-例7.1-分析 图的广度优先搜索类似与树的层次遍历,逐层搜索正好可以尽快找到一个结点与另一个结点相对而言最直接的路径。 A B C D E F G H A B C D E F G H 城市交通图对应的邻接距阵
2 广度优先搜索的应用-例7.1-分析设计 A B C D E F G H A B C D E F G H 1)将城市A(编号1)入队,队首qh置0,队尾qe置1。 2)将队首所指的城市所有可直通的城市入队(如果这个城市在队中出现过就不入队),然后将队首加1,得到新的队首城市。重复以上步骤,直到城市H入队为止。当搜到城市H时,搜索结束。 3)输出最少城市线路。