1 / 31

Regressão

Regressão. Pontos mais importantes:. -objectivo -regressão linear -distribuição dos estimadores, limites de confiança para os coeficientes -limite de confiança para o valor previsto -coeficiente de correlação amostral -analise dos erros -transformação para um modelo linear

kanoa
Download Presentation

Regressão

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Regressão Pontos mais importantes: -objectivo -regressão linear -distribuição dos estimadores, limites de confiança para os coeficientes -limite de confiança para o valor previsto -coeficiente de correlação amostral -analise dos erros -transformação para um modelo linear -regressão polinomial -regressão linear múltipla 1

  2. Objectivo da regressão Uma tarefa frequente é determinar a relação matemática entre as variáveis de interesse: sistema {x} {y} {y}=f{x} f{x}=? e.g. -escoamento horizontal numa conduta: -desactivação dos microorganismos: -temperatura num cilindro (condução): -log(TR-T(t))= -(1/fh)t-log(jh(TR-T0)) 2

  3. Modelos matemáticos experiência Determinação dos parâmetros (e.g. propriedades físicas) previsão 1) estimação dos parâmetros dos modelos matemáticos Objectivo da regressão: 2) verificar se o modelo é adequado Condição: os dados são sujeitos a erros (aleatórios). 3

  4. regressão f(x)=ax+b a=? f(x) b=? x 4

  5. Regressão linear Seja Y uma função de x1, x2,..., xr variáveis independentes. A relação entre eles segue um modelo linear (múltiplo) quando a variável dependente (Y) pode ser escrita: Onde: -bi (i=0, 1,..., r) são os coeficientes de regressão -”e” representa o erro aleatório com N(0,s2) O caso mais simples é quando temos só uma variável independente: 5

  6. Suponha, que temos n conjuntos de pontos (xi,yi), i=1,2,...,n. Agora sejam: -A estimador de a -B estimador de b Assim: estimador de Y Escolhemos A e B tal que a soma dos quadrados dos resíduos, seja mínimo. 6

  7. Para encontrar o mínimo da SSR, temos, 1) ou 2) Aplicando, temos da primeira equação, 7

  8. Substituindo o resultado na segunda equação: 8

  9. Distribuição dos estimadores, limites de confiança para os coeficientes de regressão Para determinar a distribuição A e B, vamos supor que, B pode ser escrito, onde fi e x são constantes. 9

  10. Porque Y tem uma distribuição normal, B também tem com N(mB,s2B). A variância de B sem prova, 10

  11. Da mesma forma podemos ver que A também segue uma distribuição normal com os seguintes parâmetros: A variância de A sem prova, 11

  12. Assim, A e B são v.a. normais: , Antes de determinar os intervalos de confiança para os parâmetros de regressão, vamos definir: 12

  13. Para determinar os intervalos de confiança para b, temos que ter uma estimativa da s2 (desconhecida). Mas como, assim a distribuição O intervalo de confiança (com nível de conf. 1-a) é dada pela: 13

  14. Pela a mesma razão, a distribuição, Assim o intervalo de confiança (com nível de conf. 1-a) é dada pela: 14

  15. a Coefficients Standardi zed Unstandardized Coefficien Coefficients ts 95% Confidence Interval for Model B Std. Error Beta t Sig. Lower Bound Upper Bound 1 A -26.650 7.464 -3.570 .007 -43.863 -9.438 B .889 .050 .987 17.612 .000 .773 1.006 a. Dependent Variable: Y 15

  16. Limites de confiança para o valor previsto Para fazer uma previsão de Y para um dado valor de x0, talvez a melhor opção seja: Geralmente, temos mais interesse em definir um intervalo onde Y ocorre com um dado grau de confiança. Sem prova, 16

  17. 95% intervalo de confiança Y x O intervalo de confiança para Y é dado por, 17

  18. Coeficiente de correlação amostral, R No caso de duas v.a.s X e Y, a dependência linear entre eles é dada pela: A estimativa de Assim 18

  19. |R| alto (1) significa uma forte dependência linear entre Y e x 19

  20. Analise dos erros O modelo linear de forma, é um modelo adequado para descrever a relação entre Y~x se, 1) b0 (R é alto) 2) e tem IIDN(0,s2) A avaliação do segundo termo é através de visualização dos resíduos com alguns gráficos diagnósticos e o cálculo de coeficientes de auto-correlação 20

  21. - resíduos vs. Y: 21

  22. -resíduos sobre uma curva de distribuição normal: 22

  23. -resíduos vs. x 23

  24. Coeficiente de auto-correlação de “lag” k. 24

  25. Transformação para um modelo linear Muitas as vezes a relação entre duas variáveis, não pode ser escrita com uma função linear. E.g. cinética de degradação: Tirando o logaritmo Assim escolhendo: temos um problema de regressão linear 25

  26. -exemplo 26

  27. x ln Y ln 27

  28. Regressão polinomial Modelo Para estimar os coeficientes desta equação, temos que minimizar, igualando as respectivas derivadas de esta função a zero. O resultado é um sistema de equações lineares. A maior parte dos softwares oferecem a opção regressão polinomial. - [A] é uma função de xi [A]{B}={f} - {f} é uma função de xi e Yi. 28

  29. -exemplo 29

  30. Regressão linear múltipla Modelo: Para estimar os coeficientes da equação, temos que minimizar, O resultado é um sistema de equações com r+1 incógnitas de forma: 30

  31. R=1 31

More Related