1.25k likes | 1.67k Views
Bioestatística Básica . Secretaria de Estado de Saúde do Distrito Federal Escola Superior de Ciências da Saúde (ESCS) Paulo R. Margotto Prof. Do Curso de Medicina da ESCS www.paulomargotto.com.br Brasília, 18/5/2012. Bioestatística Básica . Programa: Importância da Bioestatística
E N D
Bioestatística Básica Secretaria de Estado de Saúde do Distrito Federal Escola Superior de Ciências da Saúde (ESCS) Paulo R. Margotto Prof. Do Curso de Medicina da ESCS www.paulomargotto.com.br Brasília, 18/5/2012
Bioestatística Básica Programa: Importância da Bioestatística Variáveis População e Amostras Apresentação dos dados em tabelas Medidas de Tendência Central Distribuição Normal Correlação e Regressão Risco Relativo / Odds Ratio Teste de Hipóteses Exercício de Medicina Baseado em Evidências Teste de Fisher Teste t 13 Análise de Variância (ANOVA) 14 -Escolha de Teste Estatístico 15-Testes Estatísticos não Paramétricos 16- Sensibilidades/Especificidade/Curva ROC Margotto, PR (ESCS)
Depende, em boa parte, do conhecimento sobre Bioestatística • A condução e avaliação de uma pesquisa • Comparação entre dois ou mais grupos ou amostras (grupo tratado / grupo controle) Bioestatística Básica Avaliação da eficácia do tratamento (significação) Estar alerta a: variáveis interferentes nos resultados ¤ Variações mostrais ¤ Diferenças entre grupos Margotto, PR (ESCS) www.paulomargotto.com.br
Os testes estatísticos são utilizados para: ¤ Comparar amostras (houve modificação dos grupos inicialmente semelhantes após o início da intervenção) ¤ Detectar variáveis interferentes ¤ Analisar se o tratamento depende de outras variáveis (peso, idade, sexo) Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
A ciência não é um conhecimento definitivo sobre a realidade, mas é um conhecimento hipotético que pode ser questionado e corrigido. Ensinar ciências não significa apenas descrever fatos, anunciar leis e apresentar novas descobertas, mas Bioestatística Básica Ensinar o método científico Maneira crítica e racional de buscar conhecimento Vieira S., 1991. Margotto, PR (ESCS) www.paulomargotto.com.br
Variáveis (dados): • Qualitativas :(diferentes categorias sem valores numéricos): • -Nominal:: sexo, cor, grupo sanguíneo, causa da morte • -Ordinais: (ordenação natural): Grau de instrução, aparência, estágio da doença, status social • Quantitativos ou Contínuos: (dados expressos por nº): idade, altura, peso, renda familiar • -Discretas( associação entre valores e números inteiros): idade em anos completos • -Contínua (pode assumir qualquer valor no subconjunto de números reais): peso • População e Amostra: • População: Conj. de elementos com determinada característica • Amostra: Subconjunto com menor nº de elementos • Independentes: grupo selecionados com tratamento distinto • Dependentes: para cada elemento do grupo tratado existe um grupo controle semelhante (sexo, idade, etc) • Comparação intra-individuo (o grupo submetido ao tratamento é o seu próprio controle)
Apresentação dos Dados em Tabelas: • Componentes das tabelas: • Título: Explica o conteúdo • Corpo: Formado pelas linhas e colunas dos dados • Cabeçalho: específica o conteúdo das colunas • Coluna indicadora: específica o conteúdo das linhas • Opcional: fonte, notas, chamadas Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Nascidos vivos no Maternidade do HRAS segundo o ano de registro Título Cabeçalho (separado do corpo por um traço horizontal) Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Tabela de Contingência ou de Dupla Entrada (cada entrada é relativa a um dos fatores) Gestantes sem pré-natal/gestantes com pré-natal e mortalidade perinatal Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Tabelas de distribuição de freqüências: • Peso ao nascer de nascidos vivos, em Kg Bioestatística Básica Menor peso: 1570g Maior peso: 4600g Como transformar está tabela em uma Tabela de Distribuição de Freqüência ? Margotto, PR (ESCS) www.paulomargotto.com.br
Tabelas de distribuição de freqüências: 3 colunas • Definir as faixas de peso (Classes): Bioestatística Básica • Intervalo de classe (0,5Kg): intervalo coberto pela classe • Extremo de classe:limites dos intervalos de classe • 1,5 Ι— 2,0: fechado a esquerda (não pertencem a classe os • Valores 2; pertencem a classe os valores 1,5) • - Ponto médio: soma dos extremos da classe ÷ 2 • N º de classes: K = 1+ 3,222 log n (em geral: 5-20) • no exemplo: K = 1 + 3,222 log 100 = 7,444 (7 ou 8 classes) Margotto, PR (ESCS) www.paulomargotto.com.br
Bioestatística Básica Apresentação dos dados em gráficos -título (pode ser colocado tanto acima como abaixo) -escala (crescem da esquerda para a direita e de baixo para cima). - legendas devem ser colocadas à direita do gráfico.
Bioestatística Básica Gráfico de barras: é usado para apresentar variáveis qualitativas ou variáveis ordinais. Veja no gráfico de barras os dado da tabela 1.
Bioestatística Básica Gráfico de setores: é usado para apresentar variáveis qualitativas ou variáveis ordinais. Calcular os ângulos centrais das diversas categorias, marcando-os na circunferência e separando-os com o traçado de raios. Como calcular o ângulo central de cada categoria: 100 360 Freqüência relativa (f) valerá X e o ângulo central X = 360 x f 100
Bioestatística Básica Histograma: Os dados apresentados em tabelas de distribuição de freqüência são apresentados graficamente em histogramas. Freqência Peso ao nascer
Bioestatística Básica BOX PLOT: a caixa é formada por -mediana (linha central): estimativa da tendência central a sua posição indica a presença de simetria (central) e próxima a dos percentis (assimetria) -percentis 25 e 75 (obtidos pelo método Tukey´s Hinges): amplitude interquartil-estima a Variabilidade dos dados -whiskers(bigodes de gatos): -valores máximos e mínimos (distribuição normal) -distribuição assimétrica: os dados máximo e mínimos se desviam do P25-P75 ->1,5 AIQ: valores discrepantes(outliers) ->2,5 AIQ: valores extremos (extremes-assinalados com asterisco)
Bioestatística Básica Dias de internação na coleta da hemocultura por faixas de peso ao nascer Denise Nogueira da Gama Cordeiro
Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts. • A mediana da amplitude da “linha de base do EEG” foi significativamente maior • que a mediana da amplitude do EEG durante a administração do surfactante, • 10, 20 e 30 minutos depois, em todos os casos. ( P<0.008) Box-plot Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10 minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30 minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008.Os outliers não são mostrados no box-plot.
Box-plot Fig.1.Amplitude do EEG para o canal C3-C4 em microvolts. • A mediana da amplitude da “linha de base do EEG” foi significativamente maior • que a mediana da amplitude do EEG durante a administração do surfactante, • 10, 20 e 30 minutos depois, em todos os casos. ( P<0.008) Amplitude da linha de base é livre de medicação / surfactante durante os primeiros 10 minutos do estudo, seguido por administração de surfactante (SA) e 10, 20 e 30 minutos após a administração do surfactante. * Indica o nível significativo de P ≤ 0,008.Os outliers não são mostrados no box-plot. Shangle CE, 2012
Medidas de Tendência Central (Valor de ponto em torno do qual os dados se distribuem) Variância e Desvio Padrão: avalia o grau de dispersão quanto cada dado se desvia em relação a média) Média aritmética:soma dos dados nº deles (dá a abscissa do centro de gravidade do conjunto de dados) Bioestatística Básica A média aritmética (representa-se por X é: 2,5+3,0+3,5+ ... 4,0 = 2,45 10 Margotto, PR (ESCS) www.paulomargotto.com.br
Medidas de Tendência Central Média Aritmética Cálculo da média de dados em Tabela de Distribuição de Frequência Bioestatística Básica n=100 Média (X): ponto médio de cada classe x respectiva freqüência divido pelo n X = 1,75x3 + 2,25x16 + ... 4,25x4 + 4,75x1 = 300 3 Kg 100 100 Margotto, PR (ESCS) www.paulomargotto.com.br
Medida de Tendência Central • Medida de dispersão:indicadores do grau de variabilidade dos individuos em torno das medidas de tendência central • Variância: • Medir os desvios em relação a média • (diferença de cada dado e a média) • Não há média dos desvios pois sua soma é igual a zero • Ex.: 0,4,6,8,7 • X (média) : 0+4+6+8+7 = 25 = 5 • 5 5 • X – X (desvio em relação a média) • 0 - 5 = - 5 • 4 – 5 = -1 A soma dos desvios é igual a zero • 6 – 5 = 1 • 8 – 5 = 3 (-5 + -1)+1+3+2= - 6 + 6 = 0 • 7 – 5 = 2 Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Medidas de Tendência Central Variância Soma dos quadrados dos desvios Bioestatística Básica A soma do quadrado dos desvios não é usada como medida de dispersão, porque o seu valor cresce com o nº de dados Grupo I: 60, 70 e 80 Kg - Grupo II: 60, 60, 70, 70, 80, 80 Kg Margotto, PR (ESCS) www.paulomargotto.com.br
Medidas de Tendência Central Variância Cálculo da soma dos quadrados dos desvios Bioestatística Básica Então, para medir a dispersão dos dados em relação à média, usa-se a variância (S2) que leva em consideração o n S2 = soma dos quadrados dos desvios n – 1 Para os dados: 0, 4, 6, 8 e 7 a S2 = 40 = 40 = 10 5 –1 4 Margotto, PR (ESCS) www.paulomargotto.com.br
Medidas de Tendência Central Desvio Padrão Raiz quadrada da variância, sendo representava por S; tem a mesma unidade de medida dos dados Ex.: 0,4,6,8,7. S2 (variância) = 10 s (desvio padrão): √10 = 3,16 Coeficiente de variância (CV) Razão entre o desvio padrão a a média x 100 CV = sx 100 X Ex.: Grupo I: 3,1,5 anos (x = 3 anos; s2 = 4; s=2) : CV = 66,7% Grupo II: 55,57,53 anos (x = 55 anos; s2 = 4; s = 2) : CV = 3,64% Vejam à dispersão dos dados em ambos os grupos é a mesma, mas os CV são diferentes (no grupo I a dispersão relativa é ALTA) Bioestatística Básica I Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Variáveis aleatórias: variam ao acaso (peso ao nascer) • Gráficos com 2 extremos um máximo e um mínimo e entre eles, uma distribuição gradativa (maioria dos valores ao redor da média) : Curva de Gauss: As medidas que originam a estes • gráficos são variáveis com distribuição normal Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Características: • A variável (peso ao nascer) pode assumir qualquer valor real • O Gráfico da distribuição normal é uma curva em forma de sino, simétrico em torno da média () (se lê “mi”). • A área total da curva vale 1, significando que a probabilidade de ocorrer qualquer valor real é 1. • Pelo fato da curva ser simétrica em torno da média, os valores maiores do que a média e os valores menores do que a média ocorrem com igual probabilidade. Bioestatística Básica No SPSS, usamos o Kolmogorov-Smirnov ou Shapiro-Wilk na sua determinação Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Predicção de uma valor entre dois nº quaisquer: Ex.: A probabilidade de ocorrência de um valor > 0 é 0,5, mas qual é a probabilidade de ocorrer um valor entre 0 e z = 1,25? Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal Predicção de uma valor Usar tabela de Distribuição Normal Bioestatística Básica Como usar esta tabela? Localizar na 1a coluna o valor 1,2 Na 1a linha, está o valor 5. n0 1,2 compõe com o algarismo 5, o n0 z = 1,25. No cruzamento da linha 1,2 com a coluna 5 está o número 0,3944. Está é a probabilidade (39,44%) do ocorrer valor entre zero e z= 1,25. Margotto, PR (ESCS) www.paulomargotto.com.br
Bioestatística Básica Probabilidade de ocorrer valor entre zero e 1,25 Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Predicção de uma valor: qual é a probabilidade de um individuo apresentar um colesterol entre 200 e 225 mg% • (média); 200 mg% / = desvio padrão = 20 mg% Bioestatística Básica Cálculo da probabilidade associado à Distribuição normal: Z = X - = média ; = desvio padrão X = valor pesquisado A estatística Z mede quanto um determinado valor afasta-se da média em unidades de Desvio padrão (quando coincide c/ a média, o escore é Z = 0) Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Predicção de uma valor: • Z = X – 200 = 1,25 • 20 Bioestatística Básica Consultando a Tabela de Distribuição normal, vemos que a probabilidade de Z assumir valor entre 0 e Z = 1,25 é 0,3944 ou 39,44 Margotto, PR (ESCS) www.paulomargotto.com.br
Bioestatística Básica Probabilidade de ocorrer valor entre zero e 1,25 Margotto, PR (ESCS) www.paulomargotto.com.br
Distribuição Normal • Predicção de uma valor Bioestatística Básica Outro exemplo: Qual é a probabilidade uma pessoa apresentar menos do que 190mg% de colesterol. Para resolver este problema, é preciso "reduzir" o valor X = 190. Obtém-se então: Z = 190 - 200 = - 0,50 . 20 Margotto, PR (ESCS) www.paulomargotto.com.br
Na Tabela de Distribuição Normal, a probabilidade de ocorrer valor maior que a média 0 é 0,5;então, a probabilidade pedida é : 0,5 – 0,1915 = 0,3085 ou 30,85% Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão • Correlação Bioestatística Básica • Associaçao entre duas variaveis peso e altura; em quanto aumenta o peso à medida que aumenta a altura? • Diagrama de dispersão: • X = Horizontal (eixo das abscissas): variável independente ou explanatória • Y = Vertical (eixo das ordenadas) : variável dependente A correlação quantifica quão bem o X e Y variam em conjunto Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação + Correlação - Sem correlação Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão Bioestatística Básica Observem que à medida que o comprimento dos cães aumenta (variável explanatória) o peso aumenta (variável dependente) Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão • Coeficiente de correlação: (r de Pearson) : • Expressa quantitativamente as relações entre duas variáveis • r = 0,8 – 1 – forte • r = 0,5 – 0,8 – moderada • R = 0,2 – 0,5 – fraca • r = 0 – 0,2 – insignificante • Cálculo do r: • r = ∑xy - ∑x∑y • n 000000000 Bioestatística Básica Débito cardíaco e Pressão arterial r=0,38 (correlação fraca) Kluckow et al ∑x2 – (∑x)2 n ∑y2 – (∑y)2 n Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão • Correlação: grau de associação / Regressão: capacidade • entre 2 variáveis de predicção de um valor baseado no conhecimento do outro • (prever Y conhecendo-se o X) • Equação da Reta de Regressão: • Y = a + bx (a= Y – bx) • a : coeficiente angular (inclinação da reta) • b: coeficiente linear (intersecção da reta com o eixo X) Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão • Exemplo: a correlação entre o peso pré-gravídico e o peso do RN foi de 0,22. Aequação da reta: Y = 2547, 79 + 12,8 x • Assim, uma gestante com peso pré-gravídico de 60 Kg espera-se um RN c/ peso de 3,315g • R2 ( r squared): coeficiente de determinação: proporção da variação total que é explicada. Peso pré –gravídico e peso ao nascer : • r2 = 0,22 2 = 4,84 ≈ 5% • ( o peso ao nascer é explicado pelo peso da mãe em apenas 5%) • (Tese de Doutorado – Curvas de Crescimento Intra-uterinas Margotto, PR) Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Correlação / Regressão • Base excess e PaCO2 • Equação de regressão: Y = 1,07 BE + 40 ,98 • r = 0,94 / r = 0.88 = 88% Bioestatística Básica Margotto, PR (ESCS) www.paulomargotto.com.br
Crematócrito e a Composição Nutricional do Leite Materno Bioestatística Básica Crematócrito X Lipídio Leite congelado: -20oC por 7 dias Wang CD, 1999
Crematócrito e a Composição Nutricional do Leite Materno Bioestatística Básica Crematócrito X Caloria Y=5,99x+32,5 (leite fresco) Y=6,20x+35,1 (leite congelado) Equações de regressão Hoje terminamos por aqui! Wang CD, 1999