Metodos Estatisticos I

Metodos Estatisticos I

(Parte 1 de 6)

Métodos Estatísticos I Pinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

168 UNIDADE V – DISTRIBUIÇÕES AMOSTRAIS

Os capítulos anteriores abordaram vários aspectos do processo de tomada de decisões – formulação de teorias, tipos de amostragem e produção dos dados, tipos de estudos e, por último, modelos estatísticos que resumem a distribuição de uma resposta de interesse. O objetivo da Unidade V é introduzir mais um passo neste ciclo. Consiste em utilizar a informação obtida em uma amostra com o intuito de generalizar e tomar uma decisão a cerca de toda a população, ou seja, usar a inferência estatística para a tomada de decisão.

Figura 5.1: As etapas do método científico – fase entre sintetizar os resultados e a tomada da decisão.

Esta fase é realizada entre as etapas do método científico de sintetizar os resultados e da tomada de decisão propriamente dita. Como foi abordado anteriormente, o valor de um parâmetro é fixo e geralmente desconhecido, enquanto que o valor de uma estatística, embora conhecido a partir de uma determinada amostra, pode variar de amostra para amostra. O valor da estatística dependerá da amostra selecionada.

É importante, portanto, conhecer como se comporta os vários valores que a estatística pode assumir caso fossem avaliadas todas as amostras possíveis de serem retiradas de uma mesma população finita ou um número grande de amostras para uma

Formular teorias (hipóteses)

Sintetizar os resultados

Estimad or I

Coletar dados

Métodos Estatísticos IPinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

169 população teórica de tamanho infinito. Desta forma, a variação deste processo poderia ser medida e, com isso, dizer o quanto o valor esperado da estatística calculada em uma amostra é muito próximo do valor correspondente do parâmetro. Daí a importância que as técnicas de amostragem usadas na seleção da amostra têm neste processo, juntamente com o tamanho da amostra escolhido. Nesta Unidade, pretende-se mostrar que uma amostra aleatória simples retirada de uma população tem um padrão previsível de variação que permite fazer suposições sobre o quão próximo uma estatística amostral está do verdadeiro parâmetro, em média. Para colocar estas idéias em um nível mais prático, considere o exemplo a seguir.

Exemplo 5.1 Na vida, de um modo geral, as pessoas a uma determinada idade se deparam com a fase de procurar emprego. Uma das perguntas que surge é: Seu nível de habilidades requerido pelo mercado de trabalho tem aumentado nos últimos três anos? Uma pesquisa nacional desenvolvida pelo Census Bureau com 3000 empregadores com mais de 20 trabalhadores, 57% dos empregados responderam “sim”. ( Fonte: “National Survey Shows a

Rift Between Schools and Business”, New York Times, February 20, 1995 ).

O valor de 57%, ou a probabilidade de 0,57, é uma estatística amostral já que foi calculada com base na amostra de 3000 empregados. Imagine este processo sendo repetido várias vezes.

1. O resultado sempre seria o mesmo para todas as amostras distintas de tamanho 3000 – 0,57 ou 57%?

R: Não, o valor da proporção amostral varia de acordo com a amostra selecionada. 2. Uma proporção igual a zero seria possível? E uma proporção igual a um?

R: Sim, é possível obter proporção amostral igual a 0 ou 1, mas seriam pouco prováveis de obter valores tão extremos em uma amostra de tamanho 3000.

3. Alguma das proporções resultantes poderia ser maior que 0,75?

Métodos Estatísticos I Pinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

170 R: Também seria possível encontrar valores maiores que 0,75, mas baseado no resultado obtido pela amostra selecionada, a estimativa da proporção populacional seria em torno de 0,57.

4. Esta proporção amostral de 0,57 corresponde a um valor próximo do parâmetro, ou seja, da real proporção populacional?

R: Não, não se sabe o quão próximo o valor da proporção amostral está da real proporção populacional. Seria necessário conhecer a proporção populacional para medir a verdadeira distância.

5. Se este valor de 0,57 não estiver próximo da proporção populacional, por que estes resultados são divulgados e as conclusões delineadas a partir dos mesmos?

R: Tem-se uma amostra razoavelmente grande de 3000. Espera-se que a amostra obtida seja representativa da população e, assim, 0,57 pode ser utilizada para estimar o valor da proporção populacional com razoável nível de precisão.

Se a informação completa sobre o comportamento da variável em estudo e sobre os parâmetros populacionais fosse conhecida não se teria necessidade de colher uma amostra.

Mas isso raramente acontece!

Então, o uso de uma amostra ajuda a formar uma opinião sobre o comportamento da variável na população.

Como é possível basear-se na informação de uma única amostra para tirar conclusões sobre toda a população?

O fundamento da Inferência Estatística é fazer uma afirmação sobre os parâmetros da população através de uma única amostra (preferencialmente aleatória!). A resposta de interesse seria melhor compreendida se o comportamento da estatística, quando todas as amostras possíveis são retiradas de uma população finita, fosse conhecido.

Métodos Estatísticos IPinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

171 É necessário conhecer a

Em geral, o interesse consiste em conhecer sobre a distribuição amostral da estatística: • a média;

• a proporção;

• a variância;

• a forma funcional da distribuição.

O objetivo desta Unidade V é estudar a distribuição amostral de duas estatísticas: a proporção amostral e a média amostral. Pretende-se examinar como estas estatísticas variam em repetidas amostras aleatórias simples retiradas da população. Também será visto como se comporta a distribuição amostral destas estatísticas fazendo variar os tamanhos de amostras e o valor do parâmetro. Conhecendo-se a distribuição amostral da estatística, torna-se possível utilizar esta informação para com base em uma única amostra tirar conclusões sobre o parâmetro.

Definição 5.1: Distribuição amostral de uma estatística é a distribuição dos valores assumidos de uma estatística em todas as amostras possíveis, de mesmo tamanho n, retiradas da mesma população finita ou a distribuição limite dos valores de uma estatística, no caso de uma população infinita.

Procedimento para a construção de uma distribuição amostral: 1. A partir de uma população finita de tamanho N, obtêm-se todas as amostras possíveis de tamanho n; 2. Calcula-se a estatística de interesse para cada amostra (p. ex., média ou desvio padrão);

Métodos Estatísticos I Pinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

172 3. Constrói-se uma tabela de distribuição de freqüências correspondentes a cada valor da estatística obtida; 4. Visualiza-se em um histograma o comportamento da estatística, ou seja, da distribuição amostral da estatística.

Exercício 5.1: Suponha a população de tamanho N=5, consistindo de idades de 5 crianças saídas de um hospital e retire todas as amostras possíveis sem reposição de tamanho n=2 dessa população.

Amostra
Métodos Estatísticos IPinho, ALS; Spyrides, MHC

Departamento de Estatística - UFRN

Figura 5.2: Histograma das médias amostrais.

MOTIVAÇÃO • O valor de uma estatística é conhecido após a seleção da amostra;

• O valor de uma estatística pode variar de amostra para amostra.

Conclusão: A estatística é uma variável aleatória ( v.a.)!

(Parte 1 de 6)

Comentários