420 likes | 578 Views
Variáveis. Modelagem Estatística. Dois tipos de pesquisas empíricas. DE LEVANTAMENTO. Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação. EXPERIMENTAL. Grupos de indivíduos (ou animais, ou objetos) são manipulados para se
E N D
Variáveis ModelagemEstatística
Dois tipos de pesquisas empíricas • DE LEVANTAMENTO Características de interesse de uma população são levantadas (observadas ou medidas), mas sem manipulação. • EXPERIMENTAL Grupos de indivíduos (ou animais, ou objetos) são manipulados para se avaliar o efeito de diferentes tratamentos.
amostragem POPULAÇÃO: todos os possíveis consumidores Amostra: um subconjunto dos consumidores inferência Pesquisas de levantamento Ilustração de um levantamento por amostragem
Perguntas que precisam ser respondidas no planejamento de um levantamento • O quê? • características a serem observadas VARIÁVEIS • Quem? • os elementos a serem pesquisados POPULAÇÃO • Como? • o instrumento de coleta de dados QUESTIONÁRIO / ENTREVISTA ESTRUTURADA
População x amostra • População: conjunto dos elementos que se deseja estudar. • Amostra: subconjunto da população. • Amostragem: processo de seleção da amostra
universo do estudo (população) Amostragem inferência dados observados Amostragem e Inferência estatística
Planejamento de experimentos • Estudo experimental: Manipulam-se, de forma planejada, certas variáveis independentes ou fatores(A, B, C, ...) para verificar o efeito que esta manipulação provoca numa certa variável dependente ou respostaY
dados quantitativos quantitativa variável qualitativa ou categórica dados qualitativos ou categorizados Dados e variáveis
Distribuição de freqüências • A distribuição de freqüências consiste na organização dos dados de acordo com as ocorrências dos diferentes resultados observados. • Pode ser apresentada em tabela ou gráfico.
Distribuição de frequências variáveis qualitativas Tabela. Distribuição de frequências do provedor usado pelo visitante do site.
Distribuição de frequências variáveis qualitativas Gráfico de colunas para a apresentação da distribuição de frequências do provedor usado pelo visitante do site.
Distribuição de frequências variáveis qualitativas Gráfico de setores para a apresentação da distribuição de frequências do provedor usado pelo visitante do site.
Distribuição de frequências variáveis quantitativas discretas % de itens 16 14 12 10 8 6 4 2 0 0 1 2 3 4 5 6 7 Número de defeitos
amplitude dos dados 14,1 4,7 4 5 6 7 8 9 10 11 12 13 14 15 11 classes de amplitude unitária Variáveis contínuasConstrução da distribuição de frequências 5,2 6,4 5,7 8,3 7,0 5,4 4,8 9,1 5,5 6,2 4,9 5,7 6,3 5,1 8,4 6,2 8,9 7,3 5,4 4,8 5,6 6,8 5,0 6,7 8,2 7,1 4,9 5,0 8,2 9,9 5,4 5,6 5,7 6,2 4,9 5,1 6,0 4,714,1 5,3 4,9 5,0 5,7 6,3 6,0 6,8 7,3 6,9 6,5 5,9
1 00234 1 67888 2 0002233344 2 5779 3 00233 3 6689 Ramo-e-Folhas Taxa de Mortalidade Infantil dos Municípios da Micro-Região Oeste Catarinense, ano de 1982. Unidade = 1 valor discrepante = 6 | 2
Formas de uma distribuição de frequências • Distribuições diferentes em termos da posição central
Formas de uma distribuição de frequências • Distribuições diferentes quanto à dispersão
Formas de uma distribuição de frequências • Distribuições diferentes quanto à assimetria
Formas de uma distribuição de freqüências • Distribuições diferentes quanto à curtose
Medidas descritivas • A média aritmética: uma medida de posição central.
Turma A Turma B Turma C 0 2 4 6 8 10 12 notas Exemplo: notas dos alunos de três turmas
Dispersão • Embora as três distribuições apresentem a mesma média, as variabilidades são diferentes. • Esta característica é denominada dispersão. • Como é possível quantificar a dispersão?
4 5 6 7 8 Como medir a dispersão? Exemplo: Turma A (4 5 5 6 6 7 7 8) distância (desvio) em relação à média
Como medir a dispersão? Variância (da amostra):
Como medir a dispersão? Desvio padrão (da amostra):
X-X)2 2 = n Variância Populacional • Quando tratar-se de uma população, a variância (2) é calculada usando-se n no denominador.
Medidas descritivas das notas finais dos alunos de três turmas. Interprete.
Ex: Rendimento de um processo químico Interprete.
25% 25% 25% 25% Medidas baseadas na ordenação dos dados qi md qs Quartil inferior mediana Quartil superior
25% 25% 25% 25% Medidas baseadas na ordenação dos dados Dados ordenados: qi md qs Se fracionário interpolação linear
50% dos valores 50% dos valores 0 10 20 30 40 50 60 70 md = 22,5 Comparação entre média e mediana • A média é mais influenciada por valores discrepantes.
(b) distribuição (a) distribuição assimétrica simétrica 50% 50% 50% 50% mediana média = mediana média Comparação entre média e mediana
max qs + 1,5dq qs md qi min dq = qs - qi Diagrama em caixas
25% 25% 25% 25% 25% 25% 25% 25% Ÿ Diagrama em caixas e forma da distribuição
28 Renda 23 familiar 18 (sal. mín.) 13 8 3 Monte Encosta Verde do Morro Interprete o gráfico
Tabela Distribuição de freqüências Variável qualitativa Gráfico de barras, colunas ou setores Percentagens Análise univariada Histograma Distribuição de freqüências Variável quantitativa Ramo-e-folhas Medidas descritivas (média, desvio padrão, mediana, etc.) Orientação geral para análise exploratória dados não temporais
Medidas descritivas da variável quantitativa em cada categoria da qualitativa Uma variável quantitativa e outra qualitativa Diagrama em caixas múltiplo Análise biivariada Duas variáveis qualitativas Tabela de contingência (Cap. 10) Diagrama de dispersão (Cap. 11) Duas variáveis quantitativas Coeficiente de correlação (Cap. 11) Orientação geral para análise exploratória dados não temporais