(Parte 1 de 5)

Estatística e Probabilidade

Profesores::

Daniela Carine Ramires de Oliveira Marcos Santos de Oliveira

Índice

1. Introdução à Estatística 1

1.1. O que é Estatística? 1 1.2. Estatística na Prática 1 1.3. Um pouco da história da Estatística 2 1.4. Exercícios 2

2. Variáveis 3

2.1. Definição de Variável 3 2.2. Classificação das Variáveis 3 2.3. Exercícios 5

3. Amostragem 6

3.1. Por que fazer Amostragem? 6 3.2. Quando o uso de amostragem não é interessante? 6 3.3. Tipos de Amostragem 6 3.3.1. Amostragem Aleatória Simples (AAS) 6 3.3.2. Amostragem Sistemática (AS) 7 3.3.3. Amostragem Estratificada (AE) 8 3.3.4. Amostragem por Conglomerado (AC) 9 3.4. Exercícios 10

4. Tabulação de Variáveis 1

4.1. Variáveis Qualitativas Unidimensionais 1 4.2. Variáveis Quantitativas Unidimensionais 12 4.3. Variáveis Qualitativas e Quantitativas Bidimensionais 13 4.4. Exercícios 14

5. Medidas de Posição 15

5.1. Mínimo e Máximo 15 5.2. Moda 15 5.3. Média 15 5.4. Mediana 16 5.5. Exercícios 18

6. Medidas de Dispersão 19

6.1. Motivação 19 6.2. Amplitude 19 6.3. Variância e Desvio Padrão 19 6.4. Intervalo Interquartil 21 6.5. Exercícios 21

7. Estatística Gráfica 2

7.1. Gráficos para as Variáveis Qualitativas 2 7.1.1. Gráfico em Barras 2 7.1.2. Gráfico de Composição em Setores (“Pizza”) 23 7.1.3. Gráfico de Pareto 23 7.2. Gráficos para as Variáveis Quantitativas 25 7.2.1. Gráfico em Barras 25 7.2.2. Gráfico de Pontos 26 7.2.3. Histograma 26 7.2.4. Gráfico em Linhas (ou Gráfico Temporal) 27 7.2.5. Ramo-e-Folhas 28 7.2.6. Desenho Esquemático ou Diagrama de Caixas (Box-Plot) 29 7.3 Exercícios 31

8. Correlação e Regressão 32

8.1. Estudo da relação entre variáveis 32 8.2. Diagrama de Dispersão 32 8.3. Coeficiente de Correlação 35 8.4. Regressão Linear Simples 37 8.5. Coeficiente de Determinação 39 8.6. Exercícios 40

Lista de Exercícios 1 41

9. Probabilidade 4

9.1. Processo ou Experimento Aleatório 4

9.2. Espaço Amostral (Ω) 4 9.3. Evento 45 9.4. Exercícios 46 9.5. Introdução à Probabilidade 47

9.6. Definição Clássica 48 9.7. Definição Freqüentista 49 9.8. Definição Subjetiva 51 9.9. Definição Moderna 51 9.10. Probabilidade Condicional 52 9.1. Independência de Eventos 53 9.12. Regra da Probabilidade Total 54 9.13. Teorema de Bayes 54

10. Variável Aleatória Discreta 56

10.1. Introdução 56 10.2. Esperança Matemática (Média) 57 10.3. Variância 58 10.4. Exercício 58 10.5. Modelo Bernoulli 58 10.6. Modelo Binomial 59 10.7. Exercícios 60 10.8. Distribuição Hipergeométrica 60 10.9 Exercício 61 10.10. Distribuição Poisson 61 10.1. Exercícios 62

1. Variável Aleatória Contínua 63

1.1. Esperança e Variância 65 1.2. Distribuição Normal 6 1.3. Tabela da Distribuição Normal Padrão 69 1.4. Exercícios 73

Lista de Exercícios 2 74

12. Estimação 7

12.1. Inferência Estatística 7 12.2. Estimação Pontual e Intervalar para Proporção 7 12.3. Exercícios 79 12.4. Estimativa Pontual e Intervalar para a Média Populacional 79 12.5. Exercícios 81 12.6. Estimativa para a Média Populacional com Variância Desconhecida 81 12.7. Exercício 83

13. Testes de Hipóteses 84

13.1. Introdução 84 13.2. Formulação das Hipóteses 84 13.3. Tipos de Erros possíveis nos Testes de Hipóteses 84

13.4. Nível de Significância de um Teste de Hipótese (α) 85 13.5. Teste de Hipóteses para a Proporção 85 13.6. Exercícios 87 13.7. Teste de Hipóteses para Média com Variância Conhecida 8 13.8 Exercícios 90 13.9 Teste de Hipóteses para Média com Variância Desconhecida 91 13.10. Exercícios 93

Lista de Exercícios 3 94

Apêndice

A Gabarito da Lista de Exercícios 1 95 B Gabarito da Lista de Exercícios 2 101 C Gabarito da Lista de Exercícios 3 102 D Aula no Laboratório de Computação 104

1. INTRODUÇÃO À ESTATÍSTICA

1.1. O que é Estatística?

Estatística é uma ciência que nos permite coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. Estamos denominando por dados a um (ou mais) conjunto de valores, numéricos ou não. A aplicabilidade das técnicas a serem discutidas se dá nas mais variadas áreas das atividades humanas. Assim, o principal objetivo da Estatística é nos auxiliar a tomar decisões ou tirar conclusões em situações de incerteza, a partir de informações numéricas.

1.2. Estatística na Prática

População: é o conjunto de todos os elementos que nos interessa estudar. Deve ser notado que na terminologia estatística, população refere-se não somente a uma coleção de indivíduos, mas ao alvo no qual reside nosso interesse. Exemplos: todos os clientes de um banco, todos os alunos de uma faculdade, todos os automóveis da Ford, todo o sangue no corpo de uma pessoa, etc.

Técnicas de Amostragem: ferramentas que nos auxiliam a coletar amostras.

Planejamento de Experimentos: cria esquemas e teorias para verificação de hipóteses científicas.

Amostra: é qualquer subconjunto da população.

Análise Descritiva: Conjunto de técnicas destinadas a descrever e resumir os dados a fim de tirarmos conclusões a respeito de características de interesse.

Probabilidade: Teoria utilizada para se estudar a incerteza associada a fenômenos aleatórios.

Inferência Estatística: Técnicas que possibilitam a extrapolação, a um grande conjunto de dados (população), das informações e conclusões obtidas a partir de um subconjunto de valores (amostra).

População (Características)

Informações contidas nos dados

Conclusões sobre as características da população

Análise descritiva

Inferência Estatística

Amostra Técnicas de amostragem

Análise descritiva

Planejamento de Experimentos

Cálculo de Probabilidades

1.3. Um pouco da história da Estatística

5000 AC Registros egípcios de presos de guerra; 2000 AC Censo Chinês; 695 Primeira utilização da média ponderada pelos árabes na contagem de moedas;

1654 Pierre de Fermat e Blaise Pascal estabelecem os Princípios do Cálculo das Probabilidades;

1763 Inferência Estatística (Reverendo Bayes); 1930 Controle de Qualidade nas indústrias; 1959 Estudo retrospectivo de doenças (Mantel & Haenszel); 1996 Profundidade da Regressão (Rousseeuw e Hubert); 1997 Modelos Fatoriais; 2001 100 anos da Biometrika.

Maiores detalhes sobre a história da Estatística no site: http://www.redeabe.org.br/historia.htm

1.4. Exercícios – Parte I – A1

1) Para as situações descritas a seguir, identifique a população e a amostra correspondente.

(a) Para avaliar a eficácia de uma campanha de vacinação no Estado de Minas Gerais, 200 mães de recém-nascidos durante o primeiro semestre de um dado ano, em uma dada maternidade em Belo Horizonte, foram perguntadas a respeito da última vez que vacinaram seus filhos.

População:

Amostra:

(b) Uma amostra de sangue foi retirada de um paciente com suspeita de anemia. População:

Amostra:

(c) Para verificar a audiência de um programa de TV, 563 indivíduos foram entrevistados por telefone com relação ao canal em que estavam sintonizados.

População:

Amostra:

2. VARIÁVEIS

2.1. Definição de Variável

Qualquer característica associada a uma população é chamada de variável. Porque o nome variável? Porque ela “varia” de alguma forma.

Exemplos: Idade: pode variar de 0, 1 , 2,anos

Sexo: pode ser masculino ou feminino Estado Civil: pode ser solteiro, casado, divorciado, etc.

2.2. Classificação das Variáveis

As variáveis podem ser classificadas como Qualitativas ou Quantitativas.

Algumas variáveis como sexo, grau de instrução, estado civil, região de procedência, apresentam como possíveis resultados uma qualidade (ou atributo) do indivíduo pesquisado, logo, estas variáveis são chamadas de variáveis Qualitativas.

As variáveis como número de filhos, salário, idade, apresentam como possíveis resultados números resultantes de uma contagem ou mensuração, logo, estas variáveis são chamadas de variáveis Quantitativas.

Exemplo: Um pesquisador está interessado em fazer um levantamento sobre alguns aspectos socio-econômicos dos empregados da seção de orçamentos de uma empresa. Usando informações obtidas do departamento pessoal, ele elaborou a Tabela 2.1.

Tabela 2.1: Informações sobre estado civil, grau de instrução, número de filhos, salário (expresso como fração do salário mínimo), idade (medida em anos e meses) e procedência de 36 empregados da seção de orçamentos de uma Empresa.

Idade

1 Solteiro Fundamental4,0 26 3 Interior

N° Estado Civil Grau de Instrução N° de Filhos Salário Anos Meses Região de Procedência 2 Casado Fundamental 1 4,56 32 10 Capital 35 Casado Médio 2 19,40 48 1 Capital 36 Casado Superior 3 23,30 42 2 Interior

Fonte: Bussab e Morettin (2002)

Observações sobre a Tabela 2.1.

De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais de um) resultado correspondendo à realização de uma característica (ou características). Por exemplo, considerando a variável estado civil, para cada empregado pode-se associar um dos resultados, solteiro ou casado (note que poderia haver outras possibilidades, como separado, divorciado, mas somente as duas mencionadas foram consideradas no estudo).

Dentre as variáveis Qualitativas, ainda podemos fazer uma distinção entre dois tipos:

Variável Qualitativa Nominal: para a qual não existe nenhuma ordenação nos possíveis resultados.

Exemplo: Região de Procedência, etc.

Variável Qualitativa Ordinal: para a qual existe uma ordem natural nos seus resultados. Exemplo: Grau de instrução, etc.

As variáveis Quantitativas também podem sofrer uma classificação dicotômica:

Variável Quantitativa Discreta: cujos possíveis valores formam um conjunto finito ou enumerável de números, e que resultam, freqüentemente, de uma contagem.

Exemplo: Nº de Filhos, etc.

Variável Quantitativa Contínua: cujos possíveis valores pertencem a um intervalo de números reais e que resultam de uma mensuração.

Exemplo: Salário, etc.

Resumindo Como as variáveis são classificadas e outros exemplos:

Nominal Sexo, Cor dos Olhos. Qualitativa

Ordinal Estado Civil, Classe social.

Discreta Números de carros. Quantitativa

Contínua Peso, altura.

Para cada tipo de variável existem técnicas apropriadas para resumir as informações dos dados obtidos da amostra. Por exemplo, a utilização de uma tabela é uma forma de escrever os dados de uma forma resumida.

Em algumas situações podem-se atribuir valores numéricos às várias qualidades ou atributos de uma variável qualitativa e depois se proceder à análise como se esta fosse quantitativa, desde que o procedimento seja passível de interpretação.

Existe um tipo de variável qualitativa para a qual essa quantificação é muito útil: a chamada variável dicotômica. Para essa variável podem ocorrer somente duas realizações, usualmente chamadas de sucesso e fracasso.

Exemplos: Sexo (Masculino ou Feminino), Hábito de Fumar (Sim ou Não), etc.

2.3. Exercícios – Parte I – A1

1) Um questionário foi aplicado aos alunos do primeiro ano de uma escola fornecendo as seguintes informações:

TV:Horas gastas assistindo TV, por semana

ID: Identificação do aluno; Turma: Turma a que o aluno foi alocado (A ou B); Sexo: Feminino (F) ou Masculino (M); Idade: Idade; Alt: Altura; Peso: Peso; Filh: Número de filhos na família; Fuma: Hábito de fumar (sim ou não); Toler: Tolerância ao cigarro: (I) Indiferente, (P) Incomoda Pouco e (M) Incomoda Muito; Exer: Horas de atividade física, por semana; Cine: Número de vezes que vai ao cinema por semana; OpCine: Opinião a respeito das salas de cinema na cidade: (B) regular a boa e (M) muito boa OpTV: Opinião da programação na TV: (R) Ruim, (M) Média, (B) Boa e (N) não sabe.

Tabela 2.2: Informações do questionário estudantil.

Classifique as variáveis da Tabela 2.2. como Variável Qualitativa Nominal:

Variável Qualitativa Ordinal:

Variável Quantitativa Discreta: Variável Quantitativa Contínua:

3. AMOSTRAGEM

A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o tempero de um alimento em preparação, podemos provar (observar) uma pequena porção deste alimento. Estamos fazendo uma amostragem, ou seja, extraindo do todo (população), uma parte (amostra) com propósito de avaliarmos sobre a qualidade do tempero de todo o alimento.

3.1. Por que fazer Amostragem?

Existem várias razões para o uso de amostragem em levantamento de grandes populações. Algumas delas são:

Economia: Em geral, torna-se bem mais econômico o levantamento de somente uma parte da população.

Tempo: Numa pesquisa eleitoral, a três dias de uma eleição presidencial, não haveria tempo suficiente para pesquisar toda a população de eleitores do país.

Operacionalidade: É mais fácil realizar operações de pequena escala. Um dos problemas típicos nos grandes censos é o controle dos entrevistadores.

3.2. Quando o uso de amostragem não é interessante?

População pequena: Não há necessidade de utilizar técnicas estatísticas, pois neste caso é aconselhável realizar o censo (análise de toda a população).

Característica de fácil mensuração: Talvez a população não seja tão pequena, mas a variável que se quer observar é de tão fácil mensuração, que não compensa investir num plano de amostragem. Por exemplo, para verificar a porcentagem de funcionários favoráveis à mudança no horário de um turno de trabalho, podemos entrevistar toda a população no próprio local de trabalho. Esta atitude pode ser politicamente mais recomendável.

Necessidade de alta precisão: A cada dez anos o IBGE realiza um Censo1 Demográfico para estudar diversas característica da população brasileira. Dentre estas características têmse o número total de habitantes, que é fundamental para o planejamento do país. Desta forma, o número de habitantes precisa ser avaliado com grande precisão e, por isto, se pesquisa toda a população.

3.3. Tipos de Amostragem

3.3.1. Amostragem Aleatória Simples (AAS)

A técnica de Amostragem Aleatória Simples (ou Amostragem Casual Simples) é o método mais simples e um dos mais importantes para a seleção de uma amostra. Para a seleção de uma AAS precisamos ter uma lista completa dos elementos da população. Este tipo de amostragem consiste em selecionar a amostra através de um sorteio. Sua principal característica está no fato de todos os elementos da população ter igual probabilidade de serem escolhidos.

1 Censo: estudo de todos os elementos da população.

Procedimento para o uso deste método: 1) Numerar todos os elementos da população (N elementos); 2) Efetuar sucessivos sorteios até completar o tamanho da amostra (n).

Para realizar este sorteio, podemos utilizar urnas, tabelas de números aleatórios ou algum software que gere números aleatórios. A Tabela abaixo foi feita usando o Excel®.

Tabela de Números Aleatórios

Exemplo: Estamos interessados em estudar a qualidade da gasolina nos postos de uma determinada cidade. Essa cidade possui N = 40 postos. A empresa que estudará a qualidade pode investigar apenas uma amostra de n = 4 postos. Para selecionarmos uma amostra, utilizando a amostragem casual simples, basta escolhermos uma posição de qualquer linha da tabela de números aleatórios e extrairmos conjuntos de dois algarismos (pois N, que é o tamanho da população, possui 2 casas decimais), até completarmos os 4 elementos da amostra. Se o número sorteado não existir, simplesmente não consideramos e prosseguimos o processo.

4 elementos:{09, 26, 29, 1}.

Escolhendo a primeira linha da Tabela de Números Aleatórios, temos a seguinte amostra de

Exemplo: Considere agora, uma população com 500 elementos e, deseja-se retirar dessa população 10 elementos. Obtenha uma AAS utilizando a primeira linha da Tabela de Números Aleatórios.

(Parte 1 de 5)

Comentários