180 likes | 396 Views
水文频率计算中回归方法 插补展延系列的研究. 2012.12 南京. 第一部分:目的及意义 第二部分:统计试验及其设计 第三部分:回归方法适用条件及结论. 第一部分 目的及意义. 目的及意义. 目前我国河流的实测资料一般都不长,在规划设计过程中,往往还会遇到实测资料短缺的情况,如若运用短系列资料进行计算,求得的成果可能有很大的误差。为保证成果的可靠性,我们常常利用插补展延的手段,将现有的短系列实测资料延长。 线性回归方法的适应性?. 第二部分 统计试验及其设计. 一、研究方法 —— 统计试验.
E N D
水文频率计算中回归方法 插补展延系列的研究 2012.12 南京
第一部分:目的及意义 第二部分:统计试验及其设计 第三部分:回归方法适用条件及结论
第一部分 目的及意义
目的及意义 目前我国河流的实测资料一般都不长,在规划设计过程中,往往还会遇到实测资料短缺的情况,如若运用短系列资料进行计算,求得的成果可能有很大的误差。为保证成果的可靠性,我们常常利用插补展延的手段,将现有的短系列实测资料延长。 线性回归方法的适应性?
第二部分 统计试验及其设计
一、研究方法——统计试验 在我国一般认为水文变量服从P-Ⅲ型偏态分布,而二元P-Ⅲ型联合分布比较复杂,迄今为止,还没有一种完善的生成方法。 三参数对数正态分布也属于偏态分布,与P-Ⅲ型分布参数个数相同,分布相近,并且其生成方法比较完善。因此本文统计试验仅采用三参数对数正态分布进行随机数的生成。 利用统计试验的方法,以设计值的不偏性及有效性为评价准则,在线性矩估计参数的条件下,对该方法的适用条件进行分析,得出结论。
二、统计试验的设计 1.总体参数及短系列的确定 在实际的生产和科研中,所需要的水文资料一般要40年左右。不同的试验方案取总体参数均为30年,插补延长系列10年。 不同的方案对应不同的离势系数及偏态系数,同时保证同一个系列的。设计频率P取0.1%。 为了计算简化,本文所用方法插补延长条件计算时,均不考虑历史洪水情况。
2 线型、相关系数R及参数估计方法的选取 本文以二元三参数对数正态分布为总体进行分析,相关系数根据不同的试验方案进行选取。最小取0.5,最大取1。考虑到线性矩的优良统计性能,本文采用线性矩进行参数的估计。 3 统计试验精度控制 丛树铮对Monte-carlo的精度控制作了较详细的分析,其结果表明:当生成组数K=500时,基本上能满足精度要求。为了保证其有足够分析的结果精度,本文所有的计算均取K=2000。
4 评价准则 从水文频率计算的角度来看,我们最终要求的,也就是实际使用的都是指具有一定频率的设计值,而不是参数,因此,比较插补方法的优劣,本文以设计值为目标。以设计值的不偏性及有效性作为评价指标。用统计试验方法得到K组样本及K个估计值,指标如下: 显然一种好的方法应该是插补延长之后系列 的尽量接近于0。而且插补延长之后系列的 要尽可能的小,并且 < 。由于在三参数对数正态总体下,利用线性矩法估计参数,所得的设计值偏大,因此,插补后系列的不偏性认为在-2%~10%比较合理。
第三部分 回归方法适用条件及结论
一、 对插补展延的影响 设计站均值EY0=100,参证站均值EX0=100。 不同条件下设计值不偏性及有效性计算结果表 表:BXPD在3.4%~4.9%之间,BXPL在1.1%~2.5%之间, BXPD均大于BXPL,因此在运用线性矩估计参数的条件下,插补延长之后长系列的设计值更接近于设计值真值 ,并且长系列设计值均大于设计值真值。SXPL在30%~34%之间,SXPD在37%~42%之间,SXPD均大于SXPL,即长系列的有效性比短系列的有效性好。 根据评价准则,不管参证站与设计站离势系数比值为多少,在上述总体条件下,其不偏性及有效性都可以接受,利用该方法进行插补展延都是有利的。也就是说在用线性回归方法进行插补展延时,其他条件相同的情况下,比值在0.5~1.5之间都可以,离势系数比值对插补延长效果影响不明显。
二、相关系数R对插补展延的影响 回归方程的显著性检验只是为了排除R=0的情况,当R绝对值很小时,X只能在很小程度上控制Y的变化,这时利用该方法进行插补延长计算Y的资料,是否合理,是值得研究的问题。本文就此问题进行研究,确定一个相关系数的下限Rmin,当R<Rmin时,插补延长没有意义。只有在R大于等于Rmin时,插补延长才有意义。 研究表明当相关系数大于0.8时,才可以用线性回归进行插补展延。存在一个Rmin值,并且Rmin与Y和X的相对变异程度有关。本文考虑了参数估计方法及插补延长方法的误差,来决定插补延长方法的优劣,试验采用下表所示的总体参数进行统计试验研究。
表 相关系数Rmin结果表 从表看出,在不同的参数下,Rmin不同 ,并且不是所有的情况下都存在Rmin,有些条件下,无论R为多少,均不能利用该方法进行插补延长。也就是说并不是任何情况下都可以运用线性回归方法进行插补展延。从上面计算及分析可以看出,插补延长的结果与偏态系数的比值有很大关系,下面来分析偏态系数比值对插补延长结果的影响。
三、 对插补展延的影响 由表计算结果及评价准则可知,在R=0.95,ND=30,M=40及线性矩估计参数条件下,BXPL随着 的增大而增大,在 >1.8时,虽然,BXPL在10%之内,但是此时SXPL>SXPD,也就是说,插补延长之后系列的均方误变大,有效性变差,此时的插补是不利的。因此可以得出结论,利用线性回归方法进行插补延长,有利插补延长区间为0.6 ~1.8。
同样用统计试验分析,在上述有利的插补区间内,不同的 所对应的相关系数下限Rmin。R=0.5~1 表 有利插补展延区间内的Rmin值 从表可以看出,随着 的增大,相应的Rmin随之减小。当R=0.6时,CSX/CSY有利的插补区间为1.6~1.8;当R=0.65时, CSX/CSY有利的插补区间为1.5~1.8;当R=0.7时, CSX/CSY有利的插补区间为1.4~1.8;R=0.75时, CSX/CSY有利的插补区间为0.9~1.8;当R=0.85时, CSX/CSY有利的插补区间为0.7~1.8;当R=0.95时,CSX/CSY有利的插补区间为0.6~1.8。
四、结论 • 综上所述: • 两系列偏态系数的比值CSX/CSY,相关系数R都对插补展延的结果 有影响。 • 当R取值在0.6以上,CSX/CSY在区间0.6~1.8之内,才可以用回归方法进行插补延长系列。 • 比值CSX/CSY落在不利插补区间时,不管CVX/CVY及R的值是多少,插补延长总是不利的。 • 相关系数越小,回归方法的有利插补区间越小。 对于同期资料长度ND的限制条件及不同条件下的插补展延长度M有待于进一步的研究。