280 likes | 517 Views
Estimação dos parâmetros. Pontos mais importantes:. -método dos momentos -método de máxima verosimilhança -intervalos de confiança para a média de distr. normal: s 2 conhecida -intervalos de confiança para a média de distr. normal: s 2 incógnita
E N D
Estimação dos parâmetros Pontos mais importantes: -método dos momentos -método de máxima verosimilhança -intervalos de confiança para a média de distr. normal: s2 conhecida -intervalos de confiança para a média de distr. normal: s2 incógnita -estimação de diferença na m entre duas populações normais -intervalos de confiança para a variância de distr. Normal -intervalos de confiança para a média de distr. Bernoulli -eficiência de um estimador pontual: “mean square error” e “bias” 1
Seja X1, X2,..., Xn uma amostra de F completamente definido pelo um vector dos parâmetros P (e.g. uma distr. normal P={m s2}). Teoria de probabilidades: o vector P é supostamente conhecido questões de probabilidade Estatística: o vector P é incógnito estimação dos parâmetros com estimadores estimação dos parâmetros estimador pontual (um valor só) estimação do intervalo a onde o parâmetro cai intervalo de confiança 2
Método dos momentos -Seja uma amostra X1, X2,..., Xn de F com parâmetro P incógnito. -Suponha: P=g(E[X]) -Assim: -Não todos os parâmetros podem ser escritas em função do E[X] só. E.g. a variância: 3
-Em geral: P=g(E[X], E[X2],..., E[Xr]) e -onde Mk representa o momento amostral de ordem k: 4
Exemplo: Determine o estimador da média e variância de uma população normal com o método dos momentos. solução: 5
Método de máxima verosimilhança Suponha que X1, X2,..., Xn são variáveis aleatórias. A função f(X1, X2,..., Xn) éassumida ser conhecida excepto P. Porque P é desconhecido, f(X1, X2,..., Xn) depende de P. A função f(X1, X2,..., Xn| P) representa a probabilidade (ou densidade de prob.) da mostra ser x1, x2,..., xn para o vector dos parâmetros P. A estimativa máxima verosimilhança do P é o vector que maximiza a probabilidade das observações serem x1, x2,..., xn,ou : f(X1, X2,..., Xn| P) também chama-se função de verosimilhança. 6
Amostra normal de tamanho n: X1, X2,..., Xn são v.a.s independentes, m e s? -tirando o logaritmo: 7
-a estimativa máxima verosimilhança de m e s é obtida nos pontos e igualando as derivadas a zero: 8
Intervalos da confiança para o valor média normal(s conhecido) m X mX -Por vezes, é vantajoso definir um intervalo () tal: -Sabemos que: ou, 9
-O intervalo ,chama-se intervalo de confiança (“bilateral”) a 95%. Porquê 1,96 ? P(Z<-1,96)=0,025, P(Z>1,96)=0,025 0,025+0,025=0,05 Assim a probabilidade que m está no intervalo é 1-0,05=0,95 -“unilateral” intervalo de confiança: “pelo menos” ou “não é maior que” 10
-em geral o intervalo de confiança com nível de confiança P=1-a: 12
Exemplo: Calcule o 95% intervalo de confiança para o coeficiente de transferência do calor (h) num permutador de calor se os valores calculados após 9 experiências são (W/m2K): 502, 488, 495, 504, 511, 493, 490, 512, 507 com s=8. mh=500,25,3 W/m2K com 95% confiança 13
Intervalos da confiança para o valor média normal(s incógnita) Geralmente a variância de população não é conhecida, mas podemos construir intervalos de confiança para a mesma forma. ou com (1-a) percentagem de confiança 14
Exemplo: Calcule o 95% intervalo de confiança para o coeficiente de transferência do calor (h) num permutador de calor se os valores calculados após 9 experiências são (W/m2K): 502, 488, 495, 504, 511, 493, 490, 512, 507. h=500,2 t0.025,8=2,306 mh=500,2 7,9 W/m2K com 95% confiança 15
Estimação de diferença na m entre duas populações normais Sejam X1,..., Xn e Y1,..., Ym duas mostras normais e independentes. Como podemos estimar mx-my e a correspondente intervalo de confiança? , 17
Assim já é fácil construir o intervalo de confiança para a diferença porque: (P(|Z|>za/2)=a) ou 18
-se sX e sY forem desconhecidos, é complicado determinar o tipo de distribuição: -de facto, só pode ser deduzida assumindo que sX = sY. 19
Intervalos da confiança para a variância da distribuição normal Podemos calcular os intervalos de confiança para s2 simplesmente usando a seguinte informação: (n-1)s2/s2 ~ c2n-1 assim ou 20
Exemplo: Tiramos uma amostra n=10 de vinho tinto e medimos a correspondente concentração de açúcar (C, kg/l). Determine o intervalo de confiança a 90% para o desvio padrão. Os resultados: 0,123, 0,124, 0,126, 0,120, 0,13, 0,133, 0,125, 0,128, 0,124 e 0,126 c20,05, 9 =16,917 c20,95, 9 =3,334 21
Intervalos da confiança (aproximado) para o valor média normal (p) de uma variável Bernoulli Se np for suficientemente grande, uma variável binomial pode ser aproximada: Onde, p é a probabilidade de sucesso ou valor de esperança de correspondente variável Bernoulli. Assim, uma aproximação do 1-a intervalo de confiança para o valor média pode ser obtida a partir: 23
Aplicando que um estimador pontual do P pode ser escrito: p=X/n Temos, Arengar a equação anterior para P temos: 24
Eficiência de um estimador pontual Seja X1,..., Xn uma amostra com parâmetro P não conhecida. Utiliza-se como estimador do P. Quanto é que vale ? O valor de estimador pode ser caracterizado por o “ mean square error” (desvio quadrático do parâmetro): r( ,P)=E[( -P)2] O estimador que minimiza r é o melhor estimador, infelizmente raramente existe. 25
Definição do enviesamento (bP( )): Um bom estimador diz-se não-enviesado se o seu valor de esperança matemática é igual com o parâmetro da população. Seja X1,..., Xn uma amostra. b=? se a estimador de m foram 1) X1 e 2) X 1) E[X1]= m -> b1=0 2) E[(X1+X2+,...,+Xn)/n]=m -> b2=0 Generalizando: bm=0 se: 26
-o “mean square error” de um estimador com b=0: -o “mean square error” de um estimador com b0: -combinação de dois estimadores independentes: minimizar r: 27
Exemplo: Suponha que mandamos duas amostras do rio Douro para dois laboratórios independentes com o objectivo de determinar (estimar) a concentração dos ácidos na água ma. Os resultados são (mg/l): 28