slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
系统预测 PowerPoint Presentation
Download Presentation
系统预测

Loading in 2 Seconds...

play fullscreen
1 / 77

系统预测 - PowerPoint PPT Presentation


  • 119 Views
  • Uploaded on

系统预测. 主要内容: 德尔菲定性预测方法 一元线性回归分析预测 一元非线性回归分析预测 多元线性回归分析预测 多元线性偏回归分析预测 时间序列分析模型 时间序列分析预测. 第1节 引 言. 系统预测是系统工程理论的重要组成部分,它把 系统 作为 预测对象 : 分析系统发展变化的规律性; 预测系统未来发展变化趋势; 为系统规划设计、经营管理和决测提供科学依据。 所谓系统预测,就是:

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '系统预测' - aggie


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

系统预测

  • 主要内容:
    • 德尔菲定性预测方法
    • 一元线性回归分析预测
    • 一元非线性回归分析预测
    • 多元线性回归分析预测
    • 多元线性偏回归分析预测
    • 时间序列分析模型
    • 时间序列分析预测

ldydc@126.com

slide2

第1节 引 言

  • 系统预测是系统工程理论的重要组成部分,它把系统作为预测对象:
    • 分析系统发展变化的规律性;
    • 预测系统未来发展变化趋势;
    • 为系统规划设计、经营管理和决测提供科学依据。
  • 所谓系统预测,就是:
  • 根据系统发展变化的实际情况和历史数据、资料,运用现代的科学理论方法,以及对系统的各种经验、判断和知识,对系统在未来一段时期内的可能变化情况,进行推测、统计和分析,并得到有价值的系统预测结论。

ldydc@126.com

slide3

系统预测方法分为三类:

  • 1.定性预测方法
  • 定性预测方法依据人们对系统发展变化规律的把握、判断,用经验和直觉作出预测,如专家打分、主观评价、市场调查。常见的定性预测方法是特尔斐(Delphi)法。
  • 2.因果关系预测方法
  • 因果关系预测方法以若干系统变量为分析对象,以样本数据为分析基础,建立系统变量之间因果数学模型。根据因果数学模型,预测某些系统变量的变化对其它系统变量的定量影响。因果关系预测方法主要有回归分析预测、状态空间预测等。
  • 3.时间序列分析预测方法
  • 时间序列分析预测主要考察系统变量随时间变化的定量关系,给出系统的演变发展规律,并对未来作出预测。
  • 第一类为定性方法,第二、三类为定量方法。

ldydc@126.com

slide4

系统预测的步骤:

  • (1)确定预测目标
  • (2)选择预测方案
  • (3)收集、整理资料和数据
  • (4)建立预测模型
  • (5)利用模型预测
  • (6)预测结果分析

ldydc@126.com

slide5

第2节 德尔菲定性预测方法

  • 系统预测的步骤:
  • (1)确定预测目标
  • (2)选择预测方案
  • (3)收集、整理资料和数据
  • (4)建立预测模型 (5)利用模型预测
  • 选择熟悉与所预测问题相关的领域的专家10到15人(对于重大预测问题,可适当增加人数),采用通信往来的方式与专家们建立联系,将预测问题的目标和任务告诉专家并提供所掌握的初步资料和数据,然后将专家关于预测分析的意见进行整理、综合、归纳,再以第一轮预测结果的形式匿名反映至各位专家进行第二轮征求意见,供他们分析判断,提出新的论证结果。如此经过多轮反复论证调查,各专家的意见逐轮趋向一致,结论的可信性也大大增加。
  • (6)预测结果分析

ldydc@126.com

slide6

德尔菲法是专家会议调查法的一种发展,但其效果往往比专家会议法要好,其原因在于:德尔菲法是专家会议调查法的一种发展,但其效果往往比专家会议法要好,其原因在于:

  • 1)克服了专家会议中常见的随大流或由某些权威一言定调的缺点,专家与专家之间互不见面,各专家的意见完全独立作出,消除了心理影响;
  • 2)为保证预测结果的可靠性,德尔菲法一般要经过多轮,并且在下一轮开始时让专家充分参考本轮甚至以前各轮的预测分析结果,不仅能保证过程和结果的客观性和公正性,而且能逐渐消弥个别固持已见的结论;
  • 3)尽管德尔菲法本质上是一类定性预测的方法,但其非常注重定性向定量的转化工作,使方法不仅具有定性的优点,同时也具有部分的定量优点。

ldydc@126.com

slide14

第3节一元线性回归分析预测

  • 实际系统中,存在着大量这样的情况:
  • 两个变量(例如x和y)彼此有一些依赖关系,由x可以部分地决定y的值(称两者具有因果关系)。
  • 然而,这种决定往往不是很准确的,一个熟知的例子是人的身高与体重之间的关系。
  • 众所周知,一般身材较高的人体重也较重,但这种因果关系是因人而异的,即仅由某一人的身高并不能准确知道他的体重。尽管如此,基于“人的身高与体重有一定联系”的认识,我们可以搜集足够多的人的身高体重数据,经过统计分析,可以发现身高和体重间服从某种统计规律。
  • 利用统计方法研究这种因果关系的方法就是回归分析,它主要处理连续型随机变量之间的相关关系,进行某种预测分析等等。

ldydc@126.com

slide15

引例:钢材消费量与国民收入的关系

为了研究钢材消费量与国民收入之间的关系,在统计年鉴上查得一组历史数据。

试分析预测若1981年到1985年我国国民收入以4.5%的速度递增,钢材消费量将达到什么样的水平?

ldydc@126.com

slide16

问题分析

钢材消费量--------试验指标(因变量)Y;

国民收入-----------自变量 x;

建立数据拟合函数 y = E(Y | x)= f(x);

作拟合曲线图形分析。

ldydc@126.com

slide17

y=a+bx

钢材消费量y与国民收入x的散点图

ldydc@126.com

slide18

如果函数 y = E(Y | x)= f(x)是一个

一元线性函数形式

那么模型变为y=a+bx

在坐标系中,该式可以用一条斜率为b,截距为a的直线表示,这种形式的回归分析叫做一元线性回归。

ldydc@126.com

slide38

n

n

1

1

1

1

å

å

n

n

2

=

=

2

å

å

x

x

,

xy

x

y

=

=

.

,

其中

x

x

y

y

i

i

i

i

i

n

n

n

n

=

=

1

1

i

i

=

=

i

1

i

1

ldydc@126.com

slide39

·

|

|

-1

-rα(n-2)

0

1

rα(n-2)

H0的拒绝域为:

回归模型的假设检验

模型:Y= a + bx+ε

提出问题:

1、相关系数检验

| r |≤1

| r |→1,线性相关

| r |→0,非线性相关

ldydc@126.com

slide42

二:多元线性回归分析

简介多元

非线性回归模型

MATLAB软件实现

多元线性回归模型

引例:某建材公司的销售量因素分析

ldydc@126.com

slide43

引例:某建筑材料公司的销售量因素分析

某建材公司对某年20个地区的建材销售量Y(千方)、推销开支、实际帐目数、同类商品竞争数和地区销售潜力分别进行了统计。试分析推销开支、实际帐目数、同类商品竞争数和地区销售潜力对建材销售量的影响作用。试建立回归模型,且分析哪些是主要的影响因素。

设:推销开支——x1

实际帐目数——x2

同类商品竞争数——x3

地区销售潜力——x4

ldydc@126.com

slide44

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

5.5

2.5

8.0

3.0

3.0

2.9

8.0

9.0

4.0

6.5

5.5

5.0

6.0

5.0

3.5

8.0

6.0

4.0

7.5

7.0

31

55

67

50

38

71

30

56

42

73

60

44

50

39

55

70

40

50

62

59

10

8

12

7

8

12

12

5

8

5

11

12

6

10

10

6

11

11

9

9

8

6

9

16

15

17

8

10

4

16

7

12

6

4

4

14

6

8

13

11

79.3

200.1

163.2

200.1

146.0

177.7

30.9

291.9

160.0

339.4

159.6

86.3

237.5

107.2

155.0

201.4

100.2

135.8

223.3

195.0

X=

x1 x2 x3 x4 y

1

1

1

1

.

.

.

1

1

1

1

1

ldydc@126.com

slide45

模型:

寻找关系:

y = E(Y|x1,x2,x3,x4) = f(x1,x2,x3,x4)

假设:

1、因变量Y是随机变量,并且它服从正态分布;

2、f(x1,x2,x3,x4)是线性函数(非线性);

ldydc@126.com

slide46

知识介绍

2、多元线性回归模型

模型要解决的问题可归纳为以下几个方面:

1)在回归模型中如何估计参数βi (i=0,1,…,m)和σ2?

2) 模型的假设(线性)是否正确?

3) 判断每个自变量xi (i=1,…,m)对Y的影响是否显著?

4) 利用回归方程对试验指标 Y进行预测或控制?

ldydc@126.com

slide47

假设有n个独立观测数据(xi1,xi2,…xim,yi),

i = 1,2,…,n, 要确定回归系数

由最小二乘法

参数估计

ldydc@126.com

slide48

y的估计值:

拟合误差e = y – y 称为残差,

残差平方和

求解结果

ldydc@126.com

slide49

1、β是β的线性最小方差无偏估计

统计分析

2、

3、残差平方和Q,

由此得σ2的无偏估计

4、对Y的样本方差S2进行分解

ldydc@126.com

slide50

注意:衡量y与x1,x2,…,xm相关程度的指标可以定义复相关系数R,R的值越接近于1,它们的相关程度越密切。注意:衡量y与x1,x2,…,xm相关程度的指标可以定义复相关系数R,R的值越接近于1,它们的相关程度越密切。

回归模型的假设检验

构造F-统计量及检验H0的拒绝域:

ldydc@126.com

slide51

由此可得

回归系数的检验

主要判断每个自变量xi对y的影响是否显著。

ldydc@126.com

slide52

MATLAB 统计工具箱常用命令

多元线性回归

  • b=regress( Y, X )

1、确定回归系数的点估计值:

ldydc@126.com

slide53

置信区间

显著性水平

(缺省时为0.05)

回归系数的区间估计

残差

  • 用于检验回归模型的统计量,
  • 有三个数值:相关系数r2、
  • F值、与F对应的概率p
  • 2、求回归系数的点估计和区间估计、并检验回归模型:
  • [b, bint,r,rint,stats]=regress(Y,X,alpha)
  • 3、画出残差及其置信区间:rcoplot(r,rint)

ldydc@126.com

slide54

回归系数β0,β1,…,βm以及它们的置信区间

相关系数R2,F-统计量和与F对应的概率p。

残差向量e=Y-Y及它们的置信区间

MATLAB软件实现

1、使用命令regress实现多元线性回归

b = regress (Y, X) 或

[b, bint, r, rint, stats] = regress(Y, X, alpha)

ldydc@126.com

slide55

引例求解:

输入:(jzhui.m)

x1=[5.5 2.5 8 3 ……8 6 4 7.5 7]’;(20维)

x2=[31 55 67 …… 55 70 40 50 62 59]';

x3=[10 8 12 …… 11 11 9 9]';

x4=[8 6 9 16 …… 8 13 11]';

y=[79.3 200.1 …… 135.8 223.3 195]';

X=[ones(size(x1)),x1,x2,x3,x4];

[b,bint,r,rint,stats]=regress(y,X)

ldydc@126.com

slide56

计算结果: (输出)

b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501

β0 β1 β2 β3 β4

bint = 103.1071 280.7245……(系数的置信区间)

r =[ -6.3045 -4.2215 ……8.4422 23.4625 3.3938]

rint=(略)

stats = 0.9034(R2) 35.0509(F) 0.0000(p)

Q = r’*r

σ2= Q/(n-2) = 537.2092 (近似)

ldydc@126.com

slide57

结果分析:

(1)回归模型中的参数估计值

b = 191.9158 -0.7719 3.1725 -19.6811 -0.4501

β0 β1 β2 β3 β4

σ2= Q/(n-2) = 537.2092 (近似)

即回归模型为

ldydc@126.com

slide58

(2) 模型检验

stats = 0.9034(R2) 35.0509(F) 0.0000(p)

(i) F检验法

F值由stats读取,F=35.0509,可查F分布表确定自变量与因变量

线性关系的显著程度.

(ii) 相关系数r的评价

Stats中的第一个值就是相关系数r的平方,即r2=0.9034,则

r=0.9505,一般地,相关系数的绝对值在0.8至1的范围内,可

判断回归自变量与因变量具有较显著的线性关系.

(iii) P检验

Stats中的第三个值就是p值,即p=0.0000,显然满足p<=0.05

同样说明回归自变量与因变量具有较显著的线性关系.

ldydc@126.com

slide60

以观测值序号为横坐标,残差为纵坐标所得到的散点图以观测值序号为横坐标,残差为纵坐标所得到的散点图

称为时序残差图.

图中的符号O表示某观测值的残差值,以符号O为中心上

下的一条直线表示某观测值的残差值的波动范围,拟合较好的模型的时序残差图中的残差值应落在以“y=0”为中轴线的带状区域内,且无明显的趋势.如果存在某个残差值偏离中轴线很远,则判断这个点为奇异点,应删除。删除奇异点后,应重新建立回归方程。

ldydc@126.com

slide61

最优回归方程的选取

如何分析四个因素x1,x2,x3,x4对试验指标Y的作用大小?

使用逐步回归方法。在MATLAB软件中使用以下命令:

stepwise(X, y, inmodel,alfha)

如上例,输入:X=[x1,x2,x3,x4];

stepwise(X,y,[1,2,3])

ldydc@126.com

slide62

模型中均方差历史数据记载表

参变量数据分析表

逐步回归图

ldydc@126.com

slide63

显示回归及方差分析的各种信息,有回归方程的系数,系数显示回归及方差分析的各种信息,有回归方程的系数,系数

区间估计值(95%的置信区间),均方差(RMSE),复相关系

数平方(R-square),F的统计值(F)和显著性概率值(p)。

与全回归不同的是,逐步回归的常数项用以下指令计算:

ldydc@126.com

slide64

均方差示意图,它用黄色填充的小圆圈表示对应模型的均方差,通过比较确立方差,可以评价回归模型的优劣。均方差示意图,它用黄色填充的小圆圈表示对应模型的均方差,通过比较确立方差,可以评价回归模型的优劣。

ldydc@126.com

slide67

最佳回归方程

ldydc@126.com

slide68

销售周期

本公司价格(元)

其它厂家价格(元)

广告费用

(百万元)

价格差

(元)

销售量

(百万支)

1

3.85

3.80

5.50

-0.05

7.38

2

3.75

4.00

6.75

0.25

8.51

29

3.80

3.85

5.80

0.05

7.93

30

3.70

4.25

6.80

0.55

9.26

建模范例 牙膏的销售量

建立牙膏销售量与价格、广告投入之间的模型

问题

预测在不同价格和广告费用下的牙膏销售量

收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价

ldydc@126.com

slide69

y

x1

y

x2

基本模型

y ~公司牙膏销售量

x1~其它厂家与本公司价格差

x2~公司广告费用

y~被解释变量(因变量)

x1, x2~解释变量(回归变量, 自变量)

0, 1, 2 , 3 ~回归系数

~随机误差(均值为零的正态分布随机变量)

ldydc@126.com

slide70

参数

参数估计值

置信区间

17.3244

[5.7282 28.9206]

1.3070

[0.6829 1.9311 ]

-3.6956

[-7.4989 0.1077 ]

0.3486

[0.0379 0.6594 ]

x= ~n4数据矩阵, 第1列为全1向量

R2=0.9054 F=82.9409 p=0.0000

0

1

2

3

模型求解

MATLAB 统计工具箱

由数据 y,x1,x2估计

[b,bint,r,rint,stats]=regress(y,x,alpha)

输出

输入

y~n维数据向量

b~的估计值

bint~b的置信区间

r ~残差向量y-xb

rint~r的置信区间

alpha(置信水平,0.05)

Stats~

检验统计量

R2,F, p

ldydc@126.com

slide71

参数

参数估计值

置信区间

17.3244

[5.7282 28.9206]

1.3070

[0.6829 1.9311 ]

-3.6956

[-7.4989 0.1077 ]

0.3486

[0.0379 0.6594 ]

R2=0.9054 F=82.9409 p=0.0000

0

1

2

3

结果分析

y的90.54%可由模型确定

F远超过F检验的临界值

p远小于=0.05

模型从整体上看成立

2的置信区间包含零点(右端点距零点很近)

x2对因变量y 的影响不太显著

x22项显著

可将x2保留在模型中

ldydc@126.com

slide72

通过x1, x2预测y

控制x1

(百万支)

销售量预测

价格差x1=其它厂家价格x3-本公司价格x4

估计x3

调整x4

控制价格差x1=0.2元,投入广告费x2=650万元

销售量预测区间为 [7.8230,8.7636](置信度95%)

上限用作库存管理的目标值

下限用来把握公司的现金流

若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在 7.83203.7 29(百万元)以上

ldydc@126.com

slide73

参数

参数

参数估计值

参数估计值

置信区间

置信区间

17.3244

29.1133

[13.7013 44.5252]

[5.7282 28.9206]

11.1342

1.3070

[0.6829 1.9311 ]

[1.9778 20.2906 ]

-3.6956

-7.6080

[-12.6932 -2.5228 ]

[-7.4989 0.1077 ]

x1和x2对y的影响有交互作用

0.3486

0.6712

[0.0379 0.6594 ]

[0.2538 1.0887 ]

R2=0.9054 F=82.9409 p=0.0000

-1.4777

[-2.8518 -0.1037 ]

R2=0.9209 F=72.7771 p=0.0000

0

1

0

1

2

2

3

3

4

模型改进

x1和x2对y的影响独立

ldydc@126.com

slide74

(百万支)

(百万支)

略有增加

两模型销售量预测比较

控制价格差x1=0.2元,投入广告费x2=6.5百万元

区间 [7.8230,8.7636]

区间 [7.8953,8.7592]

预测区间长度更短

ldydc@126.com

slide75

两模型 与x1,x2关系的比较

x1

x1

x2

x2

x2=6.5

x1=0.2

ldydc@126.com

slide76

价格优势会使销售量增加

x2

价格差较小时更需要靠广告来吸引顾客的眼球

交互作用影响的讨论

价格差 x1=0.1

价格差 x1=0.3

加大广告投入使销售量增加

( x2大于6百万元)

价格差较小时增加的速率更大

ldydc@126.com

slide77

x1

x2

从输出 Export 可得

完全二次多项式模型

MATLAB中有命令rstool直接求解

ldydc@126.com