1 / 26

Programa :

1. Programa. Programa :. Introdução aos MLG Regressão Logística MLG aplicados a variáveis resposta com distribuição contínua MLG aplicados a dados de contagens Análise de variância (ANOVA) com MLG. I. 2. Objectivo. Objectivo da Análise de Variância.

regis
Download Presentation

Programa :

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 1. Programa Programa: • Introdução aos MLG • Regressão Logística • MLG aplicados a variáveis resposta com distribuição contínua • MLG aplicados a dados de contagens • Análise de variância (ANOVA) com MLG I

  2. 2. Objectivo Objectivo da Análise de Variância Avaliar como uma ou mais variáveis categóricas influenciam uma variável aleatória (resposta). Modelos disponíveis MLG Normal MLG Gama MLG Gaussiana Inversa MLG Poisson MLG Binomial MLG Binomial Negativa I

  3. 3. Introdução Introdução à Análise de Variância Uma variável categórica também se designa por Factor. Os valores que toma são designados Níveis. Exemplos: I

  4. 4. ANOVA 1 factor ANOVA a um factor ANOVA a um factor Y tem distribuição Normal Y tem distribuição Binomial Negativa Questão: As populações têm a mesma distribuição? I

  5. 4. ANOVA 1 factor Pressupostos: • Foi recolhida uma amostra aleatória (plantas, animais, etc.) de cada uma das p populações. • Para cada unidade experimental registou-se o valor da variável resposta Y. • Y tem distribuição pertencente à família exponencial. • O parâmetro de dispersão f é constante. ANOVA a um factor Hipóteses: H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes (i.e., as médias das p populações não são idênticas). I

  6. 4. ANOVA 1 factor ANOVA a um factor Trabalho utilizado como exemplo: BUZZING BEES (HYMENOPTERA: APIDAE, HALICTIDAE) ON SOLANUM (SOLANACEAE): FLORAL CHOICE AND HANDLING TIME TRACK POLLEN AVAILABILITY Shelley, T.E., Villalobos, E., and students of the Fall 1997 OTS-USAP Florida Entomologist 83(2) June, 2000 Entre outros objectivos, pretendeu-se saber se o tempo [s] de recolecção de pólen em flores ‘novas’ de Solanum wendlandi difere entre 3 espécies de abelhas: Sp1: Pseudaugochloropsis graminea Sp2: Euglossa erythrochlora Sp3: Bombus pullatus X – espécie para a qual se registou o tempo de recolecção de pólen m – tempo médio de recolecção de pólen I

  7. 4. ANOVA 1 factor A variável resposta (tempo de recolecção) é uma variável contínua positiva. O MLG Gama poderá ser adequado ANOVA a um factor Configuração dos dados Formulação mais simples do modelo onde A análise que se pretende constitui um modelo linear (generalizado ou não, consoante a distribuição de Y I

  8. 4. ANOVA 1 factor ANOVA a um factor > summary(glm(e5a$Y~ -1+e5a$I1+ e5a$I2+e5a$I3, family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) e5a$I1 38.083 4.484 8.494 2.72e-13 *** e5a$I2 18.528 2.918 6.349 7.37e-09 *** e5a$I3 14.660 1.500 9.772 5.08e-16 *** (Dispersion parameter for Gamma family taken to be 0.4712827) Null deviance: NaN on 98 degrees of freedom Residual deviance: 53.109 on 95 degrees of freedom Valor médio de Y >1-pchisq(53.1,95) 0.9998438 Com esta formulação, é difícil testar a significância das diferenças entre níveis. m1 m2 m3 I

  9. 4. ANOVA 1 factor Formulação do modelo ANOVA a um factor O método de “Reference Cell Coding” RFC A espécie 3 pode ser descrita como “não sendo nem a espécie 1 nem a espécie 2”, se essas forem as 3 únicas alternativas A espécie 3 constitui o nível de referência Configuração dos dados (exemplo5a.txt) Eliminação da terceira coluna I

  10. 4. ANOVA 1 factor ANOVA a um factor Relação entre os m’s e os b’s Valor médio de Y m1 b1 m2 b2 m3 b0 Estimate Std. Error t value Pr(>|t|) (Intercept) 14.660 1.500 9.772 5.08e-16 e5a$I1 23.423 4.728 4.954 3.16e-06 e5a$I2 3.869 3.281 1.179 0.241 Estimate Std. Error t value Pr(>|t|) e5a$I1 38.083 4.484 8.494 2.72e-13 e5a$I2 18.528 2.918 6.349 7.37e-09 e5a$I3 14.660 1.500 9.772 5.08e-16 I

  11. 4. ANOVA 1 factor H0 é rejeitada ANOVA a um factor Teste à significância do factor H0: Para todos os p níveis do factor estudado, a variável resposta Y tem a mesma distribuição H1: Para pelo menos um dos p níveis a distribuição de Y é distinta dos restantes. Modelo Nulo Null deviance: 72.086 on 97 degrees of freedom Residual deviance: 53.109 on 95 degrees of freedom > 1-pchisq(72.086-53.109,97-95) [1] 7.57176e-05 I

  12. 5. ANOVA 2 fact. ANOVA a dois factores Objectivo: Saber se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã. 07h-09h exemplo5b.txt I

  13. 5. ANOVA 2 fact. ANOVA a dois factores Interacção entre “Início” e Sp2 Efeito do nível “Início” Interacção entre “Início” e Sp1 Início Início Fim Fim Sp3 Sp3 Sp2 Sp2 Sp1 Sp1 I

  14. 5. ANOVA 2 fact. ANOVA a dois factores Início Fim Sp3 Sp2 Sp1 I

  15. 5. ANOVA 2 fact. ANOVA a dois factores H0: Para todas as combinações dos factores estudado, a variável resposta Y tem a mesma distribuição,i.e.  Modelo Nulo Método: Aplicação da estatística de teste L para comparar o M. Nulo com o M. Completo > summary(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 8.0062 0.9407 8.510 1.15e-14 *** e5b$I1 7.2080 2.2390 3.219 0.001554 ** e5b$Iini 6.6536 1.7115 3.888 0.000148 *** e5b$I2 0.1993 1.7157 0.116 0.907654 e5b$I1:e5b$Iini 16.2153 5.0314 3.223 0.001537 ** e5b$Iini:e5b$I2 3.6693 3.5667 1.029 0.305123 Null deviance: 131.89 on 166 degrees of freedom Residual deviance: 82.00 on 161 degrees of freedom Início Fim Sp3 Sp2 Sp1 > summary(glm(e5b$Y~1,family=Gamma (link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 18.172 1.327 13.69 <2e-16 *** > 1-pchisq(131.89-82,5) [1] 1.459511e-09 Rejeita-se H0 I

  16. 5. ANOVA 2 fact. ANOVA a dois factores H0: O factor “Espécie” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. > summary(glm(e5b$Y~e5b$Iini, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 10.554 1.015 10.397 < 2e-16 *** e5b$Iini 12.982 2.154 6.028 1.05e-08 *** Residual deviance: 107.60 on 165 degrees of freedom Início Fim > 1-pchisq(107.60-82,165-161) [1] 3.809866e-05 Sp3 Sp2 Sp1 Rejeita-se H0 Desvio do M. Completo g.l. do M. Completo I

  17. 5. ANOVA 2 fact. ANOVA a dois factores H0: O factor “Altura do dia” não afecta a distribuição de Y (tempo de recolecção de pólen), i.e. > summary(glm(e5b$Y~e5b$I1+e5b$I2, family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 11.946 1.070 11.167 < 2e-16 *** e5b$I1 16.674 3.123 5.340 3.06e-07 *** e5b$I2 2.203 2.200 1.001 0.318 Residual deviance: 104.30 on 164 degrees of freedom Início Fim Sp3 Sp2 > 1-pchisq(104.30-82,164-161) [1] 5.649585e-05 Sp1 Rejeita-se H0 I

  18. 5. ANOVA 2 fact. ANOVA a dois factores H0: Os dois factores não interagem de forma significativa, i.e. > summary(glm(e5b$Y~e5b$I1+e5b$I2+ e5b$Iini,family=Gamma(link=identity))) Estimate Std. Error t value Pr(>|t|) (Intercept) 7.3973 0.8553 8.648 4.72e-15 *** e5b$I1 13.1891 2.3367 5.644 7.19e-08 *** e5b$I2 1.0142 1.5380 0.659 0.511 e5b$Iini 9.4337 1.5278 6.175 5.09e-09 *** Residual deviance: 87.131 on 163 degrees of freedom Início Fim Sp3 Sp2 Sp1 > 1-pchisq(87.131-82,163-161) [1] 0.07688073 Não se rejeita H0 A ANOVA foi concluída I

  19. 6. GOF Análise da qualidade de ajustamento (goodness of fit) Análise global (Desvio): > 1-pchisq(87.131,163) [1] 0.9999998 Análise dos resíduos (quantile residuals): > k<-(glm(e5b$Y~e5b$I1*e5b$Iini+ e5b$I2*e5b$Iini,family= Gamma(link=identity))) > qqnorm(qres.gamma(k, dispersion=0.45)) > abline(0,1) O modelo final parece estar bem ajustado I

  20. 7. Interpretação Interpretação do modelo Conclusões 1) As três espécies de abelhas estudadas possuem tempos de recolecção de pólen significativamente distintos. 2) Nas três espécies, o tempo de recolecção de pólen varia de forma significativa do início para o fim da manhã. 3) A alteração no tempo de recolecção discutido em 2) é sensivelmente idêntica para as três espécies Para além destas conclusões, típicas de uma análise de variância, pode-se ainda usufruir dos resultados do modelo final. I

  21. 7. Interpretação Interpretação do modelo Distribuição do tempo de recolecção [s] para Pseudaugochloropsis graminea (Sp1), no início da manhã Estimate (Intercept) 7.3973 e5b$I1 13.1891 e5b$I2 1.0142 e5b$Iini 9.4337 Dispersion parameter taken to be 0.4494806 Pr[Y≤60]=? 0.91 a = 1/f =2.22 0 60 …no final da manhã 0.98 0 60 Atenção: http://ic.net/~jnbohr/java/CdfDemoArgs.html I

  22. 8. ANCOVA Análise de variância e covariância (ANCOVA) Suponha-se que não foi feita uma categorização do factor “Altura do dia”. Originalmente, esta variável é contínua, podendo ser discretizada p.ex. como o tempo [minutos] decorrido desde as 07:00. Neste caso, como testar se o tempo de recolecção de pólen pelas 3 espécies de abelhas difere entre si e ao longo da manhã? 1 Preditor Categórico (Espécie) e 1 Preditor Discreto (minutos desde 07:00) ANCOVA Sp1 0 Sp2 Sp3 minuto desde 07:00 240 I

  23. 8. ANCOVA Análise de variância e covariância (ANCOVA) > k<-glm(e5c$Y~e5c$I1*e5c$T +e5c$I2*e5c$T, family=Gamma (link=identity)) > c(k$deviance,k$df.residual) [1] 70.35788 161.00000 Desvio do M. Completo g.l. do M. Completo Sp1 0 Sp2 Sp3 minuto desde 07:00 exemplo5c.txt 240 I

  24. 8. ANCOVA Análise de variância e covariância (ANCOVA) H0: A distribuição da variável resposta Y não depende do preditor discreto T, i.e. Método: Aplicação da estatística de teste L para comparar o M. Nulo com o M. Completo > j<-glm(e5c$Y~e5c$I1+e5c$I2, family=Gamma(link=identity)) > c(j$deviance,j$df.residual) [1] 80.4074 164.0000 > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] 0.01814984 Sp1 0 Rejeita-se H0 (para a = 0.05) Sp2 Sp3 T 240 I

  25. 8. ANCOVA Análise de variância e covariância (ANCOVA) H0: O efeito do tempo decorrido desde as 07:00 sobre a duração da recolha de polén é idêntico para as três espécies, i.e. > j<-(glm(e5c$Y~e5c$I1+e5c$I2 +e5c$T,family=Gamma(link=identity))) > summary(j) Estimate Std. Error t value Pr(>|t|) (Intercept) 22.65989 2.41458 9.385 < 2e-16 *** e5c$I1 21.55560 3.24785 6.637 4.52e-10 *** e5c$I2 2.19150 2.17282 1.009 0.315 e5c$T -0.06103 0.01350 -4.520 1.18e-05 *** (Dispersion parameter for Gamma family taken to be 0.4227247) Residual deviance: 72.721 on 163 d.f. Sp1 0 Sp2 Sp3 T 240 > 1-pchisq(j$deviance-k$deviance, j$df.residual-k$df.residual) [1] 0.3067945 Não se rejeita H0 I

  26. 9. Bibliografia Bibliografia • Fromentin, J.-M., 2003. The East Atlantic and Mediterranean bluefin tuna stock management: uncertainties and alternatives. Scientia Marina 67 (Suppl. 1): 51-62. • Shelly, T.E., et al., 2000. Buzzing bees (Hymenoptera : Apidae, Halictidae) on Solanum (Solanaceae): floral choice and handling time track pollen availability. Florida Entomologist 83(2): 180-187. • Terpes, G., et al., 2001. Assessment of the Mediterranean swordfish stock based on Greek and Italian fisheries data. ICCAT Col. Vol. Sci. Pap. 55(1): 94-106. PDF PDF PDF I

More Related