1 / 51

Taxas em pequenas áreas : uma abordagem bayesiana

Taxas em pequenas áreas : uma abordagem bayesiana. Análise Espacial - INPE. Ilka Afonso Reis. Quanto menor o n o. esperado de casos, maior a variabilidade na estimação . Taxas em pequenas áreas . y i é o número de casos da “doença” na área i ;

yitro
Download Presentation

Taxas em pequenas áreas : uma abordagem bayesiana

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Taxas em pequenas áreas : uma abordagem bayesiana Análise Espacial - INPE Ilka Afonso Reis

  2. Quanto menor o no. esperado de casos, maior a variabilidade na estimação Taxas em pequenas áreas • yié o número de casos da “doença” na área i ; • ei é o número esperado de casos da “doença” na área i ; • ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) • Taxa bruta :

  3. Qual é o problema com taxas brutas ? • Suponha uma “doença” com r = 0,10 e acontece um caso em cada área (y = 1) • Se Pop1 = 10000, e1 = 0,10 x 10000 = 1000 • Se Pop2 = 1000, e2 = 0,10 x 1000 = 100 • Se Pop3 = 100, e3 = 0,10 x 100 = 10 p1=1/10000 = 0,0001 e Var(p1) = 1/100002 = 1 x 10-8 p2=1/1000 = 0,001 e Var(p2) = 1/10002 = 1 x 10-6 p3=1/100 = 0,01 e Var(p3) = 1/1002 = 1 x 10-4

  4. Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

  5. Solução para o problema das taxas brutas • Suavizar as taxas • Como ? • Estimadores Bayesianos • Empíricos • Completos

  6. Uma Breve Introdução à Inferência Bayesiana Probabilidade Condicional Teorema de Bayes Verossimilhança Probabilidade a priori Probabilidade a posteriori

  7. Positivo (+|D) Doente (D) Negativo (-|D) Positivo (+|S) Sadio (S) Negativo (-|S) Um exemplo : medidas de qualidade de testes diagnósticos

  8. Especificidade (e) Avaliação da qualidade do teste Acertos : • Entre os doentes Sensibilidade (s) • Entre os sadios

  9. Avaliação da qualidade do teste

  10. Valor de Predição Negativa (VPN) Avaliação da qualidade do diagnóstico Acertos : • Entre os positivos Valor de Predição Positiva (VPP) • Entre os negativos

  11. Regra de Bayes Avaliação da qualidade do diagnóstico

  12. Probabilidade a priori “Verossimilhança” Probabilidade a posteriori Enfim ...

  13. Conceitos Básicos e Notação • Dados : provenientes de uma amostra da população de interesse • y = (y1, y2, ..., yn) • P(y), distribuição de probabilidade conjunta de y. • Parâmetros: quantidades, em geral desconhecidas, que estão presentes nos modelos probabilísticos para y e serão representadas por. • P(y|), função de verossimilhança de y.

  14. Exemplo : estimação de taxas • yi , casos da “doença” na área i • ei , número de casos esperados na área i segunda a taxa de referência • Parâmetros a serem estimados • ρi : o risco relativo (desconhecido) da “doença” em relação à taxa de referência • eiρi representa o número de casos esperados (média) na área i • Na inferência clássica, boas estimativas para ρi são os valores que maximizam a função de verossimilhança P(y|ρi ). Estes valores são a estimativa de máxima verossimilhança • O modelo para os dados é a função de verossimilhança P(y|). • Modelo : yi ∼ Poisson(eiρi)

  15. O Método da Máxima Verossimilhança • Na inferência clássica, os parâmetros de um modelo são tratados como quantidades fixas (não aleatórias), porém desconhecidas. • O método da máxima verossimilhança é considerado bom em muitos casos. • Porém, quando a forma de P(y|) é complexa e/ou quando o número de parâmetros envolvidos é grande, este método torna-se difícil de implementar.

  16. A abordagem Bayesiana • Na inferência Bayesiana, os parâmetros são tratados como quantidades aleatórias. • O modelo estatístico não é mais somente P(y|) e sim P(y,), a distribuição conjunta dos dados y e dos parâmetros  . • As estimativas para  não serão somente valores, mas sim uma distribuição de probabilidades. P(|y) é a distribuição de probabilidades dos parâmetros  “ à luz” dos dados y.

  17. Pela Regra de Bayes Probabilidade a priori Verossimilhança Probabilidade a posteriori A abordagem Bayesiana • Como obter P(|y) ?

  18. A abordagem Bayesiana • P() expressa a incerteza sobre  antes de observarmos os dadosy que dependem dele (a priori) . • P(|y) expressa a incerteza sobre  depois de observarmos os dados y que dependem dele (a posteriori). • De posse de P(|y), podemos examinar qualquer aspecto de  (média, variância, percentis, probabilidade de assumir determinados valores, etc.) (“Full Posterior Distribution”)

  19. Passos para obtenção de P(|y) • Escolher um modelo probabilístico para P(y|) – a função de verossimilhança; • Escolher um modelo probabilístico para P() – a distribuição a priori ; • Aplicar a regra de Bayes e calcular P(|y).

  20. Modelo para P(y|) : y ~ Poisson (e) Exemplo : modelo Gamma-Poisson • y é o número de casos da “doença” em certa área ; • eé o número esperado de casos da “doença” em certa área; • ρ é o risco relativo (desconhecido) da “doença” em relação à taxa de referência nesta área;

  21. hiperparâmetros Cálculo da posteriori P(|y) |y ~ Gamma ( +y ,  +e) Exemplo : modelo Gamma-Poisson Modelo para P() :  ~ Gamma (,)

  22. Exemplo : modelo Gamma-Poisson Suponha que y = 4 e e = 6.5 Priori´s :Gamma (0.5 , 0.5), Gamma (1,1) e Gamma (10,10) Posteriori´s :Gamma (4.5 , 7.0), Gamma(5,7.5) e Gamma(14,16.5)

  23. Intervalo de Credibilidade de 95% Exemplo : modelo Gamma-Poisson

  24. Modelo espacial bayesiano para taxas em pequenas áreas

  25. Quanto menor o no. esperado de casos, maior a variabilidade na estimação Modelo espacial bayesiano para taxas em pequenas áreas • Modelo geral • yi ∼ Poisson(µi) = Poisson(eiρi) • yié o número de casos da “doença” na área i ; • ei é o número esperado de casos da “doença” na área i ; • ρi é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; (padronização) • log µi = log ei + θi ; • θi denota o log do risco relativo (θi = log ρi , ou seja, ρi = exp(θi) ) • Modelo de efeitos fixos (máxima verossimilhança)

  26. Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

  27. Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

  28. Qual é o problema com taxas brutas ? Taxa bruta Taxa suavizada

  29. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo de efeitos aleatórios • ρi ∼ Gamma(ψi, fi) µρ = ψi/fi e σ2ρ = ψi/fi2 ; • Gamma “+” Poisson “=” Gamma ; • P(ρi|y) ∼ Gamma(ψi+ yi, fi+ ei). • Quanto maior o número de dados, mais próximo de yi/ei estará a estimativa do risco relativo ; • Quanto menor o número de dados, mais próximo de ψi/fi estará a estimativa de risco relativo.

  30. P(ρ, ψ, f|y) ∝ P(y|ρ)P(ρ|ψ, f)P(ψ)P(f) priori hiperprioris Exemplo: Mersey Modelo espacial bayesiano para taxas em pequenas áreas • Os parâmetros ψi e fi são os hiperparâmetros. • Como saber quem ψi e fi ? • Podem ser estimados (Bayes empírico) ; • Pode-se estabelecer uma distribuição a priori para ψ e φ (hiperprioris).

  31. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espacialmente estruturado (abordagem completa) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α + fi + i , onde • α é o log do risco relativo médio sobre todas as áreas ; • fi é a parte não-espacialmente estruturada do log do risco relativo da área i ; (média zero) • i é a parte espacialmente estruturada do log do risco relativo da área i;

  32. Modelo espacial bayesiano para taxas em pequenas áreas • Prioris : • α ~ Uniforme [- ;  ] (“flat”) • fi ~ Normal (0 ; 2f) • A priori para νi é um modelo autoregressivo condicional Gaussiano (CAR) • wij são pesos representando a adjacência das áreas. A definição mais comum para wij são valores binários : • wij = 1, se as áreas i e j são adjacentes; wij = 0, caso contrário.

  33. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo completo • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ α + i + i • α ~ Uniforme [- ;  ] • i ~ Normal (0 ; 2) • νi ~ CAR(2) • Hiperprioris Gamma para τ= 1/ 2 e para τ= 1/2 (τ e τrepresentam a precisão) Exemplo: leishmaniose visceral (leish_inpe_spatial)

  34. Modelo espacial bayesiano para taxas em pequenas áreas Leishmaniose Visceral Humana (BH – 1994/95) Taxa bruta Taxa bruta Taxa bruta Taxa suavizada Taxa suavizada Taxa suavizada

  35. Modelo espacial bayesiano para taxas em pequenas áreas

  36. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α + i + i + 0t + it, onde • α , i e i são definidos como antes ; • 0 ~ Uniforme [- ;  ] ei ~CAR(2) representam a parte temporal do modelo • Exemplo: leishmaniose visceral (leish_inpe_spatial_temporal)

  37. Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo: No. de parâmetros : 365 Tempo de simulação de 10000 iterações: 112 segundos AMD Athlon XP2000 1.67 GHz 512 Mb RAM

  38. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal (alternativo) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • Modelo linear para θi • θi= α0 + αi + i (t-1), onde • α0 ~ Uniforme [- ; ] • αi ~ CAR(2α) e i ~ CAR(2β) são parâmetros de uma equação de regressão ; • Exemplo: leishmaniose visceral (leish_inpe_dissert)

  39. Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo linear No. de parâmetros : 243 Tempo de simulação de 10000 iterações: 51 segundos

  40. Modelo espacial bayesiano para taxas em pequenas áreas • Modelo espaço-temporal (alternativo) • yi ∼ Poisson(µi) = Poisson(eiρi) • log µi= log ei+ θi ; θi = log ρi • θi= α0 + αi + i (t-1)+ i(t-1)2, onde • α0 , αi e i são definidos como antes ; • i ~CAR(2) ; • Exemplo: leishmaniose visceral (leish_inpe_dissert)

  41. Modelo espacial bayesiano para taxas em pequenas áreas Previsão para o quarto período Modelo quadrático No. de parâmetros : 364 Tempo de simulação de 10000 iterações: 69 segundos

  42. Referências Bibliográficas Assunção, R. M. ; Reis, I. A. ; Oliveira, C. L. Diffusion and Prediction of Leishmaniasis in a Large Metropolitan Area in Brasil with a Space-Time Model. Statistics in Medicine(2001), 20 : pp. 2319- 2335 Spiegelhalter, D. ; Thomas, A. ;Best, N. ;Lunn, D. WinBUGS User Manual , (References), version 1.4, (2003)

  43. Back-up slides

  44. Pelo Método dos Momentos • Então Bayes Empírico • yi ∼ Poisson(µi) = Poisson(eiρi) • ρi ∼ Gamma(ψi, i) E[ρi] = ψi/i e Var[ρi] = ψi/i2 E[yi] = Eρ[Ey[yi| ρi]] = Eρ[eiρi] = eiψi/i Var [yi] = Eρ[Vary[yi| ρi]] + Varρ[Ey[ yi| ρi]] = eiψi/i + (ei)2 ψi/i2

  45. Bayes Empírico • O que nos leva a • Igualando (1) e (2), temos

  46. Padronização direta das taxas • r é taxa de referência da “doença”; • Popi é a população sob risco da área i ; • ei = rx Popi , é o número esperado de casos na área i ; • i é o risco da “doença” na área i ; • ρi = i / r é o risco relativo (desconhecido) da “doença” em relação à taxa de referência ; • eixρi = (rx Popi) x (i / r) = Popi xi ;

  47. Cálculo da posteriori P(|y)

  48. - < yi <  , - <  <   > 0 , y = (y1, y2, ..., yn) y1, y2, ..., yn i.i.d Distribuição Gaussiana (Normal)

  49. Distribuição Beta

  50. Distribuição Gamma (, )

More Related