模拟退火算法 _ 简要介绍

模拟退火算法_简要介绍 指导教师：钟翠萍主讲人：崔旭辉

爬山算法 ( Hill Climbing ) • 介绍模拟退火前，先介绍爬山算法。爬山算法是一种简单的贪心搜索算法，该算法每次从当前解的临近解空间中选择一个最优解作为当前解，直到达到一个局部最优解。

爬山算法实现很简单，其主要缺点是会陷入局部最优解，而不一定能搜索到全局最优解。如图1所示：假设C点为当前解，爬山算法搜索到A点这个局部最优解就会停止搜索，因为在A点无论向那个方向小幅度移动都不能得到更优的解。爬山算法实现很简单，其主要缺点是会陷入局部最优解，而不一定能搜索到全局最优解。如图1所示：假设C点为当前解，爬山算法搜索到A点这个局部最优解就会停止搜索，因为在A点无论向那个方向小幅度移动都不能得到更优的解。图1

爬山法是完完全全的贪心法，每次都鼠目寸光的选择一个当前最优解，因此只能搜索到局部的最优值。 爬山法是完完全全的贪心法，每次都鼠目寸光的选择一个当前最优解，因此只能搜索到局部的最优值。 • 模拟退火其实也是一种贪心算法，但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解，因此有可能会跳出这个局部的最优解，达到全局的最优解。

以图1为例，模拟退火算法在搜索到局部最优解A后，会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点，于是就跳出了局部最大值A。以图1为例，模拟退火算法在搜索到局部最优解A后，会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点，于是就跳出了局部最大值A。图1

关于爬山算法与模拟退火，有一个有趣的比喻：关于爬山算法与模拟退火，有一个有趣的比喻： • 爬山算法：兔子朝着比现在高的地方跳去。它找到了不远处的最高山峰。但是这座山不一定是珠穆朗玛峰。这就是爬山算法，它不能保证局部最优值就是全局最优值。 • 模拟退火：兔子喝醉了。它随机地跳了很长时间。这期间，它可能走向高处，也可能踏入平地。但是，它渐渐清醒了并朝最高方向跳去。这就是模拟退火。

模拟退火算法简介： • 模拟退火算法(Simulated Annealing，SA)最早的思想是由N. Metropolis[1]等人于1953年提出。

Metropolis准则提出 • 固体在恒定温度下达到热平衡的过程可以用MorteCarol算法方法加以模拟，虽然该方法简单，但必须大量采样才能得到比较精确的结果，因而计算量很大。 • 鉴于物理系统倾向于能量较低的状态，而热运动又妨碍它准确落到最低态。采样时着重选取那些有重要贡献的状态则可较快达到较好的结果。因此，Metropolis等在1953年提出了重要的采样法，即以概率接受新状态。

Metropolis准则： 假设在状态xold时，系统受到某种扰动而使其状态变为xnew。与此相对应，系统的能量也从E(xold)变成E(xnew)，系统由状态xold变为状态xnew的接受概率p：

模拟退火算法原理： • 模拟退火算法来源于固体退火原理，将固体加温至充分高，再让其徐徐冷却，加温时，固体内部粒子随温升变为无序状，内能增大，而徐徐冷却时粒子渐趋有序，在每个温度都达到平衡态，最后在常温时达到基态，内能减为最小。物理退火过程：（1）加温过程（2）等温过程（3）冷却过程

根据Metropolis准则，粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT))，其中E为温度T时的内能，ΔE为其改变量，k为Boltzmann常数。根据Metropolis准则，粒子在温度T时趋于平衡的概率为exp(-ΔE/(kT))，其中E为温度T时的内能，ΔE为其改变量，k为Boltzmann常数。 • 用固体退火模拟组合优化问题，将内能E模拟为目标函数值f，温度T演化成控制参数t。

即得到解组合优化问题的模拟退火算法：由初始解i和控制参数初值t开始，对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代，并逐步衰减t值，算法终止时的当前解即为所得近似最优解。即得到解组合优化问题的模拟退火算法：由初始解i和控制参数初值t开始，对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代，并逐步衰减t值，算法终止时的当前解即为所得近似最优解。 • 这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制，包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。

根据热力学的原理，在温度为T时，出现能量差为dE的降温的概率为P(dE)，表示为：根据热力学的原理，在温度为T时，出现能量差为dE的降温的概率为P(dE)，表示为： P(dE) = exp( dE/(kT) ) • 其中k是一个常数，exp表示自然指数，且dE<0。这条公式说明的就是：温度越高，出现一次能量差为dE的降温的概率就越大；温度越低，则出现降温的概率就越小。又由于dE总是小于0（否则就不叫退火了），因此dE/kT < 0 ，所以P(dE)的函数取值范围是(0,1) 。 • 随着温度T的降低，P(dE)会逐渐降低。 • 我们将一次向较差解的移动看做一次温度跳变过程，我们以概率P(dE)来接受这样的移动。

模拟退火算法描述： • 若J( Y(i+1) )>= J( Y(i) ) (即移动后得到更优解)，则总是接受该移动。 • 若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要差)，则以一定的概率接受移动，而且这个概率随着时间推移逐渐降低（逐渐降低才能趋向稳定）。 • 这里的“一定的概率”的计算参考了金属冶炼的退火过程，这也是模拟退火算法名称的由来。

模拟退火算法模型： • 模拟退火算法可以分解为解空间、目标函数和初始解三部分。 • 模拟退火的基本思想: (1) 初始化：初始温度T(充分大)，初始解状态S(是算法迭代的起点)，每个T值的迭代次数L (2) 对k=1，……，L做第(3)至第6步： (3) 产生新解S′ (4) 计算增量Δt′=C(S′)-C(S)，其中C(S)为评价函数 (5) 若Δt′<0则接受S′作为新的当前解，否则以概率exp(-Δt′/T)接受S′作为新的当前解. (6) 如果满足终止条件则输出当前解作为最优解，结束程序。终止条件通常取为连续若干个新解都没有被接受时终止算法。 (7) T逐渐减少，且T->0，然后转第2步。自然常数e为底的指数函数

算法对应演示图： 第一步是由一个产生函数从当前解产生一个位于解空间的新解。为便于后续的计算和接受，减少算法耗时，通常选择由当前新解经过简单地变换即可产生新解的方法。如对构成新解的全部或部分元素进行置换、互换等，注意到产生新解的变换方法决定了当前新解的邻域结构，因而对冷却进度表的选取有一定的影响。

算法对应演示图： 第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生，所以目标函数差的计算最好按增量计算。事实表明，对大多数应用而言，这是计算目标函数差的最快方法。

算法对应演示图： 第三步是判断新解是否被接受。判断的依据是一个接受准则，最常用的接受准则是Metropolis准则: 若Δt′<0则接受S′作为新的当前解S，否则以概率exp(-Δt′/T)接受S′作为新的当前解S。

算法对应演示图： 第四步是当新解被确定接受时，用新解代替当前解。这只需将当前解中对应于产生新解时的变换部分予以实现，同时修正目标函数值即可。此时，当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时，则在原当前解的基础上继续下一轮试验。

模拟退火算法参数的选择： 冷却进度表我们称调整模拟退火法的一系列重要参数为冷却进度表。它控制参数T的初值及其衰减函数，对应的MARKOV链长度和停止条件，非常重要。一个冷却进度表应当规定下述参数： 1．控制参数t的初值;2．控制参数t的衰减函数；3．马尔可夫链的长度。（即每一次随机游走过程，要迭代多少次，才能趋于一个准平衡分布，即一个局部收敛解位置）4．结束条件的选择

有效的冷却进度表判据： 一．算法的收敛：主要取决于衰减函数和马可夫链的长度及停止准则的选择。二．算法的实验性能：最终解的质量和CPU的时间。

参数的选取： 􀂄一）控制参数初值的选取一般要求初始值的值要充分大，即一开始即处于高温状态，且Metropolis的接收率约为1。 (1) 均匀抽样一组状态，以各状态目标值的方差为初温。 (2) 随机产生一组状态，确定两两状态间的最大目标值差|Δmax|，然后依据差值，利用一定的函数确定初温。比如，=－Δmax/pr，其中pr为初始接受概率。

二）衰减函数的选取 • 衰减函数用于控制温度的退火速度，一个常用的函数为：T(n + 1) = K*T(n)，其中K是一个非常接近于1的常数。模拟退火算法的全局搜索性能也与退火速度密切相关。一般来说，同一温度下的“充分”搜索(退火)是相当必要的，但这需要计算时间。实际应用中，要针对具体问题的性质和特征设置合理的退火平衡条件。

三）马可夫链长度L的选取 在衰减参数T的衰减函数已选定的前提下，L应选得在控制参数的每一取值上都能恢复准平衡。

四）终止条件 有很多种终止条件的选择，各种不同的条件对算法的性能和解的质量有很大影响，我们只介绍一个常用的终止条件。即上一个最优解与最新的一个最优解的之差小于某个容差，即可停止此次马尔可夫链的迭代。

模拟退火算法伪代码 • 代码 • /* • * J(y)：在状态y时的评价函数值 • * Y(i)：表示当前状态 • * Y(i+1)：表示新的状态 • * r：用于控制降温的快慢 • * T：系统的温度，系统初始应该要处于一个高温的状态 • * T_min：温度的下限，若温度T达到T_min，则停止搜索 • */ • while( T > T_min ) • { • dE = J( Y(i+1) ) - J( Y(i) ) ; • if ( dE >=0 ) //表达移动后得到更优解，则总是接受移动 • Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动 • else • { • // 函数exp( dE/T )的取值范围是(0,1) ，dE/T越大，则exp( dE/T )也 • if ( exp( dE/T ) > random( 0 , 1 ) ) • Y(i+1) = Y(i) ; //接受从Y(i)到Y(i+1)的移动 • } • T = r * T ; //降温退火，0<r<1 。r越大，降温越慢；r越小，降温越快 • /* • 　　* 若r过大，则搜索到全局最优解的可能会较高，但搜索的过程也就较长。若r过小，则搜索的过程会很快，但最终可能会达到一个局部最优值 • 　　*/ • i ++ ; • }

使用模拟退火算法解决旅行商问题 • 旅行商问题，即TSP问题（Travelling Salesman Problem）是数学领域中著名问题之一。假设有一个旅行商人要拜访n个城市，他必须选择所要走的路径，路经的限制是每个城市只能拜访一次，而且最后要回到原来出发的城市。路径的选择目标是要求得的路径路程为所有路径之中的最小值。

使用模拟退火算法可以比较快的求出TSP的一条近似最优路径。使用模拟退火算法可以比较快的求出TSP的一条近似最优路径。 • 解空间：解空间S是遍访每个城市恰好一次的所有路经，解可以表示为{w1,w2 ,……, wn}，w1, ……, wn是1,2,……,n的一个排列，表明w1城市出发，依次经过w2, ……, wn城市，再返回w1城市。初始解可选为(1,……, n)。 • 目标函数：目标函数为访问所有城市的路径总长度。 • 我们要求的最优路径为目标函数为最小值时对应的路径。　　

新路径的产生： 随机产生1和n之间的两相异数k和m，不妨假设k<m，则将原路径：(w1,w2,…,wk,wk+1,…,wm,wm+1,…,wn) 变为新路径： (w1,w2,…,wm,wk+1,…,wk,wm+1,…,wn)上述变换方法就是将k和m对应的两个城市在路径序列中交换位置。

模拟退火算法是一种随机算法，并不一定能找到全局的最优解，可以比较快的找到问题的近似最优解。如果参数设置得当，模拟退火算法搜索效率比穷举法要高。模拟退火算法是一种随机算法，并不一定能找到全局的最优解，可以比较快的找到问题的近似最优解。如果参数设置得当，模拟退火算法搜索效率比穷举法要高。

优点：计算过程简单，通用，鲁棒性强，适用于并行处理，可用于求解复杂的非线性优化问题。优点：计算过程简单，通用，鲁棒性强，适用于并行处理，可用于求解复杂的非线性优化问题。

缺点：收敛速度慢，执行时间长，算法性能与初始值有关及参数敏感等缺点缺点：收敛速度慢，执行时间长，算法性能与初始值有关及参数敏感等缺点 • 经典模拟退火算法的缺点： (1)如果降温过程足够缓慢，多得到的解的性能会比较好，但与此相对的是收敛速度太慢; (2)如果降温过程过快，很可能得不到全局最优解。

模拟退火算法的改进： (1) 设计合适的状态产生函数，使其根据搜索进程的需要表现出状态的全空间分散性或局部区域性。 (2) 设计高效的退火策略。 (3) 避免状态的迂回搜索。 (4) 采用并行搜索结构。 (5) 为避免陷入局部极小，改进对温度的控制方式。 (6) 选择合适的初始状态。 (7) 设计合适的算法终止准则。

也可通过增加某些环节而实现对模拟退火算法的改进。主要的改进方式包括：也可通过增加某些环节而实现对模拟退火算法的改进。主要的改进方式包括： (1) 增加升温或重升温过程。在算法进程的适当时机，将温度适当提高，从而可激活各状态的接受概率，以调整搜索进程中的当前状态，避免算法在局部极小解处停滞不前。 (2) 增加记忆功能。为避免搜索过程中由于执行概率接受环节而遗失当前遇到的最优解，可通过增加存储环节，将一些在这之前好的态记忆下来。 (3) 增加补充搜索过程。即在退火过程结束后，以搜索到的最优解为初始状态，再次执行模拟退火过程或局部性搜索。 (4) 对每一当前状态，采用多次搜索策略，以概率接受区域内的最优状态，而非标准SA的单次比较方式。 (5) 结合其他搜索机制的算法，如遗传算法、混沌搜索等。 (6)上述各方法的综合应用。

Thanks!

模拟退火 算法 _ 简要介绍