Estimação para a média

Estimação para a média

ProfCaio Dantas

Aula ministrada por

Texto da aula Prof. Gilberto A. Paula

Objetivo da aula

O objetivo éestimar a média de uma população (ou de uma variável aleatória)

Vamos inicialmente estudar de forma empírica a distribuição da média amostral de uma variável aleatória X.

Consideraremos quatro possíveis distribuições para X.

Distribuição da média amostral

Para cada distribuição (ou população), vamos gerar (ou extrair) com reposição amostras de tamanho n =2, 3 e 5.

Para cada amostra iremos calcular a média.

Suponha que um grande número de amostras tenha sido gerado, logo teremos um grande nºde médias amostrais.

Construímos então um histograma com essas médias amostraispadronizadas.Repetimos o procedimento para amostrasmaiores.

Interpretação

Nota-se para cada distribuição que a medida que o tamanho da amostra cresce a distribuição da média amostral se aproxima de uma distribuição normal e a variabilidade diminui. Portanto, para n grande nor mal ~X

Teorema Central do Limite

Temos na verdade um resultado formalmente conhecido como teorema central do limite:

,, Xn

Se X1 representa uma amostra aleatória de uma variável X de média µe desvio padrão σ, então para n grande

Portanto, para n grande a média amostral é normal de média µe desvio padrão σ/√n.

Teorema Central do Limite (forma equivalente)

,, Xn

é uma amostra de uma variável aleatória com média µe variância σ σσ então para n grande:

X = Σ ΣΣ ΣXi tem distribuição aproximadamente normal com média nµe variância nσ σσ

Simbolicamente X ~ N(nµ,nσ σσ

Aplicação

Sabe-se que o faturamento diário de um posto de gasolina segue uma certa distribuição de média R$ 20 mil e desvio padrão de R$ 2 mil. Qual a probabilidade num período de 60 dias do faturamento ultrapassar R$

Portanto, queremos saber qual a probabilidade da média nesses 60 dias ser superior a R$ 20,5 mil.

Continuando “ Aplicação”

Como vimos a pouco a média amostral éaproximadamentenormal de média µ µ µ

(no caso µ µ µ=20)edesvio padrão σ σσ σ/√ √√

P(> 20,5) 

Portanto, queremos calcular

Continuando “ Aplicação” (forma equivalente)

De forma equivalente vimos que X = Σ ΣΣ ΣXi é aproximadamente normal de médianµ µ µ

(no caso nµ µ µ=60x20 =1200)edesviopadrão σ√ σ√σ√ σ√n (no caso 2⌦ ⌦⌦

Assim, queremos calcular:

Estimativa pontual e intervalar para µ

A média amostral éuma estimativa pontual da média populacional µ.

Uma estimativa intervalar para µé dada por onde εéo erroou margem de erro.

Coeficiente de confiança γ γγ γ

Se chamarmos de γ γγ γ= P(ε εε ε)o coeficiente de confiança do intervalo acima, temos que:

n Zn

Portanto, para n grande ε −=ε nZn

Continuando “Coeficiente de confiança γ γγ γ”

Se chamarmos ε= n z

Então

Continuando “Coeficiente de confiança γ γγ γ”

Relação para n grande

Podemos estabelecer a seguinte relação para n grande:

Portanto, o tamanho da amostra depende para n grande do desvio padrão de X, do erro da estimativa e da precisão do intervalo.

Estimativa intervalar para a média µ

A estimativa intervalar para a média µ fica então dada por onde σéo desvio padrão de X.

Exemplo 1

A renda per-capita domiciliar numa certa região tem desvio padrão σ= 250 reais e média µdesconhecida. Se desejamos estimar µcom erro ε= 50 reais e confiabilidade γ γγ γ= P(ε) = 0,95, quantos domicílios deveremos consultar?

Continuando “Exemplo 1” Então,

Aproximadamente 96 domicílios.

Exemplo 2

A quantidade de colesterol no sangue das alunas de uma universidade tem desvio padrão σ= 50 mg/dl e média µ desconhecida. Se desejamos estimar µ com erro ε= 20 mg/dl e confiabilidade de 90%, quantas alunas deverão realizar exame de sangue?

Continuando “Exemplo 2” Então,

Aproximadamente 206 alunas.

Na prática não conhecemos σ2 e devemos substituí-lo por uma estimativa amostral, que pode ser

Situação prática

Continuando “Situação prática”

Assim, a estimativa intervalar para a média µfica dada por onde s éo desvio padrão amostral.

Exemplo 3

Na análise de 100 automóveis de uma determinada marca obteve-se consumo médio de combustível de 12 litros por

100 km, com desvio padrão amostral de

0,9 litros. Encontreuma estimativa intervalar de 95% para o consumo médio de combustível dessa marca de carro.

Continuando “Exemplo 3” A estimativa intervalar fica dada por:

Portanto, háuma chance de 95% do intervalo [1,82 ; 12,18]cobrir o verdadeiro valor de µ.

Exemplo 4

Para estimar o tempo médio de estudo (em anos) da população adulta de um município foram entrevistados n=240 indivíduos, obtendo-se para essa amostra, média de 10,5 anos e desvio padrão de 2,6 anos. Obteruma estimativa intervalar de 90% para o tempo médio populacional.

Continuando “Exemplo 4” A estimativa intervalar fica dada por:

Portanto, háuma chance de 90% do intervalo [10,23 ; 10,7]cobrir o verdadeiro valor de µ.

Caso particular

Se X éBernoulli, isto é, X assume valor

1 com probabilidade p e valor zero com probabilidade 1-p, então σ2 =p(1-p) e portanto (como vimos na aula passada):

Observação

Se X énormal, então a média amostral tem distribuição t de Studentpara qualquer tamanho de amostra e a estimativa intervalar fica dada por:

onde t sai de uma distribuição t de

Student com n-1 graus de liberdade. Para n grande, t e z coincidem.

Comentários