680 likes | 1.28k Views
模拟退火 算法 _ 简要介绍. 指导教师:钟翠萍 主讲人:崔旭辉. 爬山算法 ( Hill Climbing ). 介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。. 爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图 1 所示:假设 C 点为当前解,爬山算法搜索到 A 点这个局部最优解就会停止搜索,因为在 A 点无论向那个方向小幅度移动都不能得到更优的解。. 图 1.
E N D
模拟退火算法_简要介绍 指导教师:钟翠萍 主讲人:崔旭辉
爬山算法 ( Hill Climbing ) • 介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。
爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。 图1
爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。 爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。 • 模拟退火其实也是一种贪心算法,但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。
以图1为例,模拟退火算法在搜索到局部最优解A后,会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点,于是就跳出了局部最大值A。以图1为例,模拟退火算法在搜索到局部最优解A后,会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点,于是就跳出了局部最大值A。 图1
关于爬山算法与模拟退火,有一个有趣的比喻:关于爬山算法与模拟退火,有一个有趣的比喻: • 爬山算法:兔子朝着比现在高的地方跳去。它找到了不远处的最高山峰。但是这座山不一定是珠穆朗玛峰。这就是爬山算法,它不能保证局部最优值就是全局最优值。 • 模拟退火:兔子喝醉了。它随机地跳了很长时间。这期间,它可能走向高处,也可能踏入平地。但是,它渐渐清醒了并朝最高方向跳去。这就是模拟退火。
模拟退火算法简介: • 模拟退火算法(Simulated Annealing,SA)最早的思想是由N. Metropolis[1]等人于1953年提出。
Metropolis准则提出 • 固体在恒定温度下达到热平衡的过程可以用MorteCarol算法方法加以模拟,虽然该方法简单,但必须大量采样才能得到比较精确的结果,因而计算量很大。 • 鉴于物理系统倾向于能量较低的状态,而热运动又妨碍它准确落到最低态。采样时着重选取那些有重要贡献的状态则可较快达到较好的结果。因此,Metropolis等在1953年提出了重要的采样法,即以概率接受新状态。
Metropolis准则: 假设在状态xold时,系统受到某种扰动而使其状态变为xnew。与此相对应,系统的能量也从E(xold)变成E(xnew),系统由状态xold变为状态xnew的接受概率p:
模拟退火算法原理: • 模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。 物理退火过程: (1)加温过程 (2)等温过程 (3)冷却过程
根据Metropolis准则,粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。根据Metropolis准则,粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。 • 用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t。
即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解。 • 这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。
根据热力学的原理,在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:根据热力学的原理,在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为: P(dE) = exp( dE/(kT) ) • 其中k是一个常数,exp表示自然指数,且dE<0。这条公式说明的就是:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(否则就不叫退火了),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。 • 随着温度T的降低,P(dE)会逐渐降低。 • 我们将一次向较差解的移动看做一次温度跳变过程,我们以概率P(dE)来接受这样的移动。
模拟退火算法描述: • 若J( Y(i+1) )>= J( Y(i) ) (即移动后得到更优解),则总是接受该移动。 • 若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要差),则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定)。 • 这里的“一定的概率”的计算参考了金属冶炼的退火过程,这也是模拟退火算法名称的由来。
模拟退火算法模型: • 模拟退火算法可以分解为解空间、目标函数和初始解三部分。 • 模拟退火的基本思想: (1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L (2) 对k=1,……,L做第(3)至第6步: (3) 产生新解S′ (4) 计算增量Δt′=C(S′)-C(S),其中C(S)为评价函数 (5) 若Δt′<0则接受S′作为新的当前解,否则以概率exp(-Δt′/T)接受S′作为新的当前解. (6) 如果满足终止条件则输出当前解作为最优解,结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法。 (7) T逐渐减少,且T->0,然后转第2步。 自然常数e为底的指数函数
算法对应演示图: 第一步是由一个产生函数从当前解产生一个位于解空间的新解。 为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法。 如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。
算法对应演示图: 第二步是计算与新解所对应的目标函数差。 因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。
算法对应演示图: 第三步是判断新解是否被接受。 判断的依据是一个接受准则,最常用的接受准则是Metropolis准则: 若Δt′<0则接受S′作为新的当前解S,否则以概率exp(-Δt′/T)接受S′作为新的当前解S。
算法对应演示图: 第四步是当新解被确定接受时,用新解代替当前解。 这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。
模拟退火算法参数的选择: 冷却进度表 我们称调整模拟退火法的一系列重要参数为冷却进度表。它控制参数T的初值及其衰减函数,对应的MARKOV链长度和停止条件,非常重要。一个冷却进度表应当规定下述参数: 1.控制参数t的初值;2.控制参数t的衰减函数;3.马尔可夫链的长度。(即每一次随机游走过程,要迭代多少次,才能趋于一个准平衡分布,即一个局部收敛解位置)4.结束条件的选择
有效的冷却进度表判据: 一.算法的收敛:主要取决于衰减函数和马可夫链的长度及停止准则的选择。 二.算法的实验性能:最终解的质量和CPU的时间。
参数的选取: 一)控制参数初值的选取 一般要求初始值的值要充分大,即一开始即处于高温状态,且Metropolis的接收率约为1。 (1) 均匀抽样一组状态,以各状态目标值的方差为初温。 (2) 随机产生一组状态,确定两两状态间的最大目标值差|Δmax|,然后依据差值,利用一定的函数确定初温。比如,=-Δmax/pr,其中pr为初始接受概率。
二)衰减函数的选取 • 衰减函数用于控制温度的退火速度,一个常用的函数为:T(n + 1) = K*T(n),其中K是一个非常接近于1的常数。 模拟退火算法的全局搜索性能也与退火速度密切相关。一般来说,同一温度下的“充分”搜索(退火)是相当必要的,但这需要计算时间。实际应用中,要针对具体问题的性质和特征设置合理的退火平衡条件。
三)马可夫链长度L的选取 在衰减参数T的衰减函数已选定的前提下,L应选得在控制参数的每一取值上都能恢复准平衡。
四)终止条件 有很多种终止条件的选择,各种不同的条件对算法的性能和解的质量有很大影响,我们只介绍一个常用的终止条件。即上一个最优解与最新的一个最优解的之差小于某个容差,即可停止此次马尔可夫链的迭代。
模拟退火算法伪代码 • 代码 • /* • * J(y):在状态y时的评价函数值 • * Y(i):表示当前状态 • * Y(i+1):表示新的状态 • * r: 用于控制降温的快慢 • * T: 系统的温度,系统初始应该要处于一个高温的状态 • * T_min:温度的下限,若温度T达到T_min,则停止搜索 • */ • while( T > T_min ) • { • dE = J( Y(i+1) ) - J( Y(i) ) ; • if ( dE >=0 ) //表达移动后得到更优解,则总是接受移动 • Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动 • else • { • // 函数exp( dE/T )的取值范围是(0,1) ,dE/T越大,则exp( dE/T )也 • if ( exp( dE/T ) > random( 0 , 1 ) ) • Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动 • } • T = r * T ; //降温退火 ,0<r<1 。r越大,降温越慢;r越小,降温越快 • /* • * 若r过大,则搜索到全局最优解的可能会较高,但搜索的过程也就较长。若r过小,则搜索的过程会很快,但最终可能会达到一个局部最优值 • */ • i ++ ; • }
使用模拟退火算法解决旅行商问题 • 旅行商问题,即TSP问题(Travelling Salesman Problem)是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市,他必须选择所要走的路径,路经的限制是每个城市只能拜访一次,而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。
使用模拟退火算法可以比较快的求出TSP的一条近似最优路径。使用模拟退火算法可以比较快的求出TSP的一条近似最优路径。 • 解空间:解空间S是遍访每个城市恰好一次的所有路经,解可以表示为{w1,w2 ,……, wn},w1, ……, wn是1,2,……,n的一个排列,表明w1城市出发,依次经过w2, ……, wn城市,再返回w1城市。初始解可选为(1,……, n)。 • 目标函数:目标函数为访问所有城市的路径总长度。 • 我们要求的最优路径为目标函数为最小值时对应的路径。
新路径的产生: 随机产生1和n之间的两相异数k和m,不妨假设k<m,则将原路径:(w1,w2,…,wk,wk+1,…,wm,wm+1,…,wn) 变为新路径: (w1,w2,…,wm,wk+1,…,wk,wm+1,…,wn)上述变换方法就是将k和m对应的两个城市在路径序列中交换位置。
模拟退火算法是一种随机算法,并不一定能找到全局的最优解,可以比较快的找到问题的近似最优解。 如果参数设置得当,模拟退火算法搜索效率比穷举法要高。模拟退火算法是一种随机算法,并不一定能找到全局的最优解,可以比较快的找到问题的近似最优解。 如果参数设置得当,模拟退火算法搜索效率比穷举法要高。
优点:计算过程简单,通用,鲁棒性强,适用于并行处理,可用于求解复杂的非线性优化问题。优点:计算过程简单,通用,鲁棒性强,适用于并行处理,可用于求解复杂的非线性优化问题。
缺点:收敛速度慢,执行时间长,算法性能与初始值有关及参数敏感等缺点缺点:收敛速度慢,执行时间长,算法性能与初始值有关及参数敏感等缺点 • 经典模拟退火算法的缺点: (1)如果降温过程足够缓慢,多得到的解的性能会比较好,但与此相对的 是收敛速度太慢; (2)如果降温过程过快,很可能得不到全局最优解。
模拟退火算法的改进: (1) 设计合适的状态产生函数,使其根据搜索进程的需要表现出状态的全空间分散性或局部区域性。 (2) 设计高效的退火策略。 (3) 避免状态的迂回搜索。 (4) 采用并行搜索结构。 (5) 为避免陷入局部极小,改进对温度的控制方式。 (6) 选择合适的初始状态。 (7) 设计合适的算法终止准则。
也可通过增加某些环节而实现对模拟退火算法的改进。主要的改进方式包括:也可通过增加某些环节而实现对模拟退火算法的改进。主要的改进方式包括: (1) 增加升温或重升温过程。在算法进程的适当时机,将温度适当提 高,从而可激活各状态的接受概率,以调整搜索进程中的当前状态,避免算法在局部极小解处停滞不前。 (2) 增加记忆功能。为避免搜索过程中由于执行概率接受环节而遗失 当前遇到的最优解,可通过增加存储环节,将一些在这之前好的态记忆下来。 (3) 增加补充搜索过程。即在退火过程结束后,以搜索到的最优解为初始状态,再次执行模拟退火过程或局部性搜索。 (4) 对每一当前状态,采用多次搜索策略,以概率接受区域内的最优状态,而非标准SA的单次比较方式。 (5) 结合其他搜索机制的算法,如遗传算法、混沌搜索等。 (6)上述各方法的综合应用。