1 / 53

Estatística Computacional - 2370

Estatística Computacional - 2370. Estatística Computacional - 2370. Estatística Computacional - 2370. Estatística com Excel. Objetivos na aula do dia 19 e 22/02/08. Aplicação Pesquisa de Opinião da TCC; Pesquisa de Opinião da Qualidade de Vida. Apresentar os conceitos:

margo
Download Presentation

Estatística Computacional - 2370

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Estatística Computacional - 2370

  2. Estatística Computacional - 2370

  3. Estatística Computacional - 2370

  4. Estatística com Excel Objetivos na aula do dia 19 e 22/02/08 Aplicação Pesquisa de Opinião da TCC; Pesquisa de Opinião da Qualidade de Vida Apresentar os conceitos: Variáveis, casos (unidade amostral) Base de dados no Excel.

  5. Pesquisa de Opinião: Questionário Itens do questionário Variáveis Pesquisa agronômica: Medidas de interesse para pesquisa Pesquisa saúde: Medidas de interesse para pesquisa Peso, produtividade Variáveis IMC, hipertensão Variáveis Qualitativas e Quantitativas Identificando variáveis

  6. Pesquisa de Opinião: Entrevistado Um questionário Casos Pessoa, rato, prontuário planta ou parcela Pesquisa Agronômica: Planta, Parcela Pesquisa Saúde : Pessoa, Rato, prontuário Casos Casos Identificando a unidade amostral

  7. Base de dados É a disposição das informações coletadas Nos aplicativos : a linha representa os casos; a coluna representa as variáveis

  8. Exemplo de uma pesquisa de opinião

  9. Exemplo de uma pesquisa de opinião

  10. Questionário da TCC

  11. Continuação do questionário da TCC

  12. casos Variáveis Apresentação do Excel

  13. Planilha do Excel para o questionário da QV Identificar as questões na primeira linha

  14. Planilha do Excel para o questionário TCC

  15. Exercício 1 Na planilha do Excel para o questionário TCC, insira os 10 questionários Exercício 2 Crie uma planilha no Excel para o questionário QV

  16. Estatística com Excel Comandos de edição no Excel: Substituir ; Format; Excluir e incluir Funções no Excel: Soma multiplicação e divisão; freq Tabelas dinâmicas Histograma Tabelas e Gráficos

  17. Estatística descritiva • Trata-se de umconjunto de técnicas analíticas ; • Objetivo: resumir o conjunto de todos os dados coletados numa dada investigação; • Envolve basicamente: Distribuição de Freqüência Medidas da Tendência Central Medidas de Dispersão Avaliação quanto a simetria e homogeneidade A idéia básica é a de se estabelecer uma descrição dos dados relativos a cada uma das variáveis.

  18. DISTRIBUIÇÃO DE FREQÜÊNCIAS • Para dados categóricos, basta contarmos quantos casos ocorrem em cada categoria. • Para dados numéricos, inicialmente criamos os intervalos de classe e, posteriormente, contamos quantos casos ocorrem em cada intervalo. • As freqüências das categorias ou intervalos de classe podem ser expressas por seu número absoluto, pela proporção em relação ao total de casos ou pela porcentagem em tabelas e gráficos (os gráficos serão construídos no Statistica) Obtenção Apresentação

  19. DISTRIBUIÇÃO DE FREQÜÊNCIAS • A tabela deve ser auto-explicativa. • Elementos da tabela: • TÍTULO: deve responder as questões: • Do que se trata? aponta o fenômeno, • Onde ocorreu? local de ocorrência; • Quando ocorreu? época da ocorrência Tabelas Apresentação Título; Cabeçalho; Coluna indicadora; Corpo.

  20. Fonte cita o informante; Notas esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; Chamadas esclarecem pontos específicos da tabela. • DISTRIBUIÇÃO DE FREQÜÊNCIAS • CABEÇALHO: informa sobre o conteúdo das colunas; COLUNA INDICADORA: informa sobre o conteúdo das linhas; • CORPO: apresenta as informações. • Elementos complementares da tabela: Tabelas Apresentação Fonte cita o informante; Notas esclarecem o conteúdo e indicam a metodologia adotada na obtenção ou elaboração da informação; Chamadas esclarecem pontos específicos da tabela.

  21. DISTRIBUIÇÃO DE FREQÜÊNCIAS Tabela 1: Título Tabelas Apresentação Fonte: Nota: CORPO DA TABELA

  22. Tipo sangüíneo Contagem Freqüência O | | | | | | | | | | | | | | | | 16 A | | | | | | | | | | 10 B | | | 3 AB | 1 • DISTRIBUIÇÃO DE FREQÜÊNCIAS- Obtenção • Dados categóricos; • A variável tipo sangüíneo é proveniente de uma amostra, de 30 doadores de um hemocentro. • AAAAAAAAAA,BBB, AB, OOOOOOOOOOOOOOOO; Exemplo

  23. Peso Contagem Freqüência Menos de 2500g | | | 3 2500g a 3500g | | | | | | | | | | | | | | | | | 17 3500g ou mais | | 2 • DISTRIBUIÇÃO DE FREQÜÊNCIAS- Obtenção • Dados numéricos; • A variável peso ao nascer, em gramas, é proveniente de uma amostra, de 22 recém-nascidos de Maringá. • 2300,2354,2456,2576,2598,2670,2647,2691,2750,2789,2810, • 2860,2835,2904,2926,2954,3100,3250,3376,3400,3505,3940. Exemplo

  24. DISTRIBUIÇÃO DE FREQÜÊNCIAS- Apresentação Tabela 1: Distribuição dos doadores por tipo sangüíneo – Maringá 2005 Fonte: Hemocentro Nota: dados fictícios Exemplo

  25. DISTRIBUIÇÃO DE FREQÜÊNCIAS- Apresentação Exemplo Tabela 2: Distribuição do peso dos recém-nascidos – Maringá 2005

  26. Distribuição Normal

  27. Medidas da Tendência Central Fornecem indicadores da distribuição da variável, isto é indica o valor que ocorre mais tipicamente • Média: É a soma de todos os resultados dividida pelo número total de casos, podendo ser considerada como um resumo da distribuição como um todo. • Moda: É o evento ou categoria de eventos que ocorreu com maior freqüência, indicando o valor ou categoria mais provável. • Mediana : É o valor da variável aleatória a partir do qual metade dos casos se encontra acima dele e metade se encontra abaixo. • Observação: Na distribuição normal a Média=Mediana= Moda

  28. Avaliando a homogeneidade - Medidas de dispersão Amplitude, desvio médio, variância, desvio padrão, erro padrão e coeficiente de variação São medidas da variação de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos. Elas permitem se identificar até que ponto os resultados se concentram ou não ao redor da média de um conjunto de observações. Cada uma dessas medidas expressam diferentes formas de se quantificar a tendência que os resultados de um experimento aleatório tem de se concentrarem ou não em determinados valores (quanto maior a dispersão, menor a concentração e vice-versa). Avaliando a homogeneidade

  29. Avaliando a simetria Quartis, Amplitude interquartilica, Box Plot mínimo máximo * * Quartis: Q1 Q2Q3 É o valor da variável aleatória a partir do qual 25%, 50% e 75% dos casos se encontra acima dele respectivamente; Amplitude Interquartilica(AIQ) AIQ = Q3 – Q1 Avaliando a simetria: valores outliers Q1 Q2 Q3outliers

  30. Medidas de Assimetria e Curtose • Assimetria (AS) • AS = 0 distribuição simétrica • AS > 0 distribuição assimétrica positiva • AS < 0 distribuição assimétrica negativa • Curtose (K) • K= 0,263 distribuição mesocúrtica • AS > 0,263 distribuição platicúrtica (chata) • AS < 0,263 distribuição leptocúrtica (alta)

  31. Representação Gráfica de distribuições segundo simetria

  32. Representação Gráfica de distribuições segundo curtose

  33. Avaliando Presença de Outliers Os dados suspeitos são aqueles que estão muito distantes do centro da distribuição, que até podem ocorrer, mas que, às vezes, resultam de erro de medida, de anotação ou de digitação. Por exemplo, em um estudo sobre altura de crianças de idade escolar, encontramos casos com valor 220cm e 240cm. O mais provável é que tenha ocorrido erro de anotação ou de digitação. Se estes casos não forem retirados da amostra, haverá séria distorção da média, do desvio padrão e comprometimento dos testes estatísticos. Estes valores extremos são chamados de pontos fora da curva (outliers). Identificando Outliers Considera-se pontos fora da curva aqueles que são maiores que Q3+1,5AIQ ou menores que Q1-1,5AIQ, onde 1,5AIQ é 1,5 vezes a amplitude interquartil. Isto pode ser visto no Box -Plot

  34. Apresentação do Format celulas

  35. Substituir O nome ou valor que se deseja trocar O nome ou valor que será trocador

  36. Atividade Para a variável RAÇA, do arquivo perfil , atribua: 1 = Branca 2 = Negra 3 = Outras

  37. Formatar

  38. Atividade Considere as variáveis Peso Altura Formate com duas decimais

  39. Tabelas e gráficos para variáveis qualitativas No Excel é trabalhoso construir gráficos quando comparado ao Statistica por isto, veremos superficialmente os gráficos neste software Construindo a tabela e gráfico para raça da base de dados perfil No menu principal Clicar em : DADOS Fazer a opção:RELATÓRIO DE TABELA E GRÁFICO DINÂMICO, mostrado na tela abaixo:

  40. Etapas para construir tabelas e gráficos para variáveis qualitativas no Excel clicar Clicar para definir variável(is) Continua no próximo slide

  41. Continuação do slide anterior Definindo a variável raça Configurando a tabela Definindo a localização da tabela Selecionando a opção de freqüência

  42. Atividade Da base de dados “QV” construir a tabela de freqüência para as variáveis: questões 1, 3 e 5 , sexo e estado cívil

  43. Tabela de freqüência – variáveis quantitativas • Definir as classes: método visto em estatística geral; • Ferramentas e análise de dados e escolha a opção histograma. Caso a opção Análise de Dados não esteja disponível, siga os passos a seguir: Passo 1: Clicar em Ferramentas Passo 2: clicar em suplementos Passo 3: clicar Ferramentas de Análise e ok.

  44. CONSTRUINDO HISTOGRAMA Análise de dados

  45. CONSTRUINDO HISTOGRAMA Valores da variável Intervalo de classe

  46. Atividade • Construa a tabela de freqüência para o peso e para altura do arquivo perfil.

  47. Estatística Computacional – 2370 Aulas: 26/02/08 e 29/02/08 Medidas descritivas Para obter as medidas descritivas no Excel siga os passos a seguir Passo 1: Clicar em ferramentas , Análise de Dados Passo 2: na caixa de diálogo a seguir clicar em Estatística Descritiva Passo 3: clicar clicar

  48. Medidas descritivas em subgrupos da amostra Pode ser de interesse obter medidas descritivas de uma variável quantitativa por categorias de uma ou mais variáveis qualitativas . Passo 1: Clicar em Dados, Relatório de Tabela Dinâmica Passo 2: Seguir as mesmas etapas para construção da tabela Passo 3: no layout as variáveis qualitativas são colocadas na Linha e/ou Colunas da tabela e a quantitativa no centro ( Dados). No lugar de contagem ..., escolher a estatistica de interesse. A caixa de diálogo vai criar uma tabela com média e desvio padrão da idade para cada categoria da variável sexo

  49. Função SE - Sintaxe da expressão para categorizar uma variável no Excel Considere o exemplo do Excel com a planilha. Suponha que a variável A deve ser categorizada da seguinte forma: Categoria 1: Se A<59, atribuir o valor F Categoria 2: Se 59 ≤A<69, atribuir o valor D Categoria 3: Se 69 ≤A<79, atribuir o valor C Categoria 4: Se 79≤A<89, atribuir o valor B Categoria 5: Se A>89, atribuir o valor A Expressão : SE(A2>89;"A";SE(A2>=79;"B"; SE(A2>=69;"C";SE(A2>=59;"D";"F"))))

  50. Estatística Computacional – 2370 Aulas: 29/02/08 - Exercício Ver o arquivo “dados gordura no corpo.txt” • PEQUENO RESUMO DOS DADOS: Algumas medidas do corpo foram realizadas em 252 homens com objetivo de obter um método de baixo custo que estime a gordura corporal. As variáveis listadas abaixo da direita para esquerda são: • Densidade do corpo (gm/cm3) ; • Percentual de gordura no corpo usando a equação de Siri's (1956); • Idade (anos); • Peso (lbs) • Altura (inch) • Circunferência do pescoço (cm) • Circunferência do tórax (cm) • Circunferência do Abdômen (cm) • Circunferência do quadril (cm) • Circunferência do glúteo (cm) • Circunferência do joelho (cm) • Circunferência do tornozelo (cm) • Circunferência do Bíceps (estendido) (cm) • Circunferência do Antebraço(cm) • Circunferência do Punho (cm)

More Related