@Ebook gratuito - Estatística Aplicada (2017)

@Ebook gratuito - Estatística Aplicada (2017)

(Parte 1 de 6)

LIVROS PUBLICADOS POR Uanderson Rébula de Oliveira

Prof. Uanderson Rébula. Doutorando em engenharia. Professor universitário. Vivência de 21 anos em ambiente industrial.

Além disso, você pode imprimir, desenhar, esquematizar ou usar qualquer leitor pdf, pois a maioria deles encontra-se desbloqueado.

Esses ebooks estão disponíveis na livraria Saraiva por preços bem acessíveis (menos de R$ 30,0).

uanderson.rebula@yahoo.com.br http://lattes.cnpq.br/1039175956271626 https://br.linkedin.com/in/uandersonrebula

Ver amostras dos livros

- 2 -

Doutorando em Engenharia-Universidade Estadual Paulista-UNESP

Mestrado em Engenharia de Produção-Universidade Estadual Paulista-UNESP

Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA

Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA

Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM

Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC

Técnico em Segurança do Trabalho-ETPC Operador Siderúrgico e Industrial-ETPC

Pesquisador pelo ITL/SEST/SENAT. Professor na UNIFOA no curso de Pós graduação em Engenharia de Segurança do Trabalho. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de Gestão Financeira de Empresas,

Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística para o curso de Engenharia de Produção, Análise Estatística para o curso de Administração, Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais (Gestão Ambiental), Gestão da Qualidade: programa 5S (curso de férias). Professor na Associação Educacional Dom Bosco para os cursos de Administração e Logística. Ex-professor na Universidade Barra Mansa – UBM nos cursos de Engenharia de Produção e de Petróleo. Ex-professor

Conteudista na UNESA (elaboração de Planos de Ensino e de Aula, a nível nacional). Ex-professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica, Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Ex-consultor interno, desenvolvedor e instrutor de cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais. Ex-Membro do IBS–Instituto Brasileiro de Siderurgia.

Conceito e fases de estudo. Variáveis. População e amostra. Técnicas de amostragem. Séries estatísticas: conceitos, tabelas, distribuição de frequência e representação gráfica. Medidas de Tendência Central. Medidas de Ordenamento. Medidas de Variação. Correlação e Regressão. Distribuição Normal. Intervalos de Confiança. Teste de Hipótese.

OBJETIVO: Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.

Resende - RJ – 2017

- 3 -

Amostragem Aleatória Simples, 5 Amostragem Estratificada, 6 Amostragem por Conglomerado, 7 Amostragem Sistemática, 9

Correlação linear simples, 11 Regressão linear simples, 14

Distribuição de frequência, 17 Gráfico de Pareto, 19

Medidas de variação, 26 Variância e Desvio Padrão, 27 Coeficiente de Variação, 29 Conceitos básicos de probabilidades, 29 Distribuição Normal, 30 Probabilidades na Distribuição Normal, 31 Z‐Escore e valor de “x” na Distribuição Normal, 34

Estimativa pontual e intervalar, 41 Intervalos de confiança – IC, 41 Intervalos de confiança para média (amostras grandes), 41 determinação do tamanho da amostra, 43 Intervalos de confiança para média (amostras pequenas), 43 Intervalos de confiança para proporções p, 45 Determinação do tamanho da amostra para p, 45 Intervalos de confiança para o desvio padrão, 46

Conceitos introdutórios, 50 Teste de hipótese para média (amostras grandes), 51 Teste de hipótese para média (amostras pequenas), 52 Teste de hipótese para proporção, 53 Teste de hipótese para o desvio padrão, 54 Teste para duas amostras – conceitos introdutórios, 57 Teste para diferença de duas médias (dependente), 57 Teste para diferença de duas médias (independente), 59

Gráficos e Tabelas, 61 Distribuição de frequências em classes, 65 Medidas de posição (média, mediana e moda), 68 Medidas de Ordenamento (Quartil, Decil e Percentil), 74 Vocabulário básico de Estatística, 76 População e amostra, 78 Estatística Descritiva e Inferencial, 80

- 4 -

O BioEstat é programa gratuito para estudantes de graduação e pós‐graduação, pesquisadores e professores, com 210 aplicativos estatísticos de fácil uso pelos iniciantes. Este programa contém o Manual (em formato de arquivo "pdf") que orienta o usuário com indicações simples e precisas para cada teste, exemplos práticos, gráficos de uso mais frequente, glossário vinculado à biometria e fórmulas estatísticas referentes aos aplicativos do BioEstat. A licença de uso deste programa também é gratuita, sendo permitida a instalação em vários computadores. Para outras informações, envie um e‐mail para mamiraua@mamiraua.org.br

CURSO DE ESTATÍSTICA PARA QUALIDADE/SEIS SIGMA ‐ https://goo.gl/9Ll32g PLANILHAS DE CÁLCULOS ESTATÍSTICOS NO EXCEL ‐ https://goo.gl/K1uZvn

PLANILHAS ESTATÍSTICAS PRONTAS NO EXCEL ‐ https://goo.gl/jaPfDx

CURSO DE ESTATÍSTICA AVANÇADA ‐ PROF. DR. BRUNO CHAVES ‐ https://goo.gl/cIJ1yA

- 5 -

São técnicas de seleção dos elementos de uma população, de modo a se obter uma amostra representativa da população. Devem ser utilizadas para assegurar que as inferências sobre a população sejam válidas.

Amostragem Aleatória Simples – É aquela na qual todos os elementos da população tem a mesma chance de ser selecionado.

Essa técnica usa mecanismos de casualidade para escolher os elementos da população, como a tabela de números aleatórios. O método é semelhante a um sorteio.

Tabela de números aleatórios

A tabela de números aleatórios consiste em uma série de números listados em uma sequência aleatoriamente gerada. Essa tabela tem duas características que a tornam adequada: primeiro, os números estão dispostos de tal maneira que a chance de qualquer um deles aparecer em determinada sequência é igual à chance do aparecimento em qualquer outra posição; segundo, cada uma de todas as combinações de algarismos tem a mesma chance de ocorrência. O Excel dispõe da função “ALEATÓRIO” para gerar números aleatórios (veja figura). A tabela de números aleatórios abaixo foi construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso, pelo Excel, identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...):

Tabela de números aleatórios

- 6 -

Como usar a tabela de números aleatórios 1º Numerar todos os elementos da população N;

2º Determinar as combinações dos algarismos. Exemplo: se o último número da população for 80, devem ser lidos números de dois algarismos; se o último for 456, devem ser lidos números de três algarismos, e assim por diante;

3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da direita para a esquerda ou vice‐versa), verticalmente ↓↑ (de cima para baixo ou vice‐versa), diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando uma letra. A opção, porém, deve ser feita antes de iniciado o processo;

4º Descartar os números maiores que o tamanho da população e/ou numeral repetido;

5º Usar os números escolhidos para identificar os elementos da população.

EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras de tamanho n = 12 (15% da população) para fazer exame de uma doença. Utilize o método de amostragem aleatória simples, considerando a tabela, a partir da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→).

SOLUÇÃO. Como a população N=80 tem dois algarismos, combinamos dois algarismos na tabela, descartando os números repetidos e os números que não pertencem a população (Ex.: 81, 95,...). Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então:

Descartadas por repetição:

Descartadas por não pertencer à população:

Amostragem Estratificada – É aquela na qual dividimos a população em subgrupos (estratos) de idênticas características e retiramos amostras aleatórias simples dos subgrupos.

Às vezes, a população é heterogênea (ex.: sexo masculino e feminino; peça A, B e C) e a amostra aleatória simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, estratos. Neste caso recorremos à amostragem aleatória estratificada. “Estratificar” sugere “formar‐se em camadas”.

Exemplo. A estratificação mais simples que encontramos na população do rebanho de tamanho N=80 é a divisão entre novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos:

São, portanto, dois estratos (novilhos e novilhas). Como queremos uma amostra de tamanho n=12 (15% da população), por estrato, temos:

Rebanho População 15% Amostra

População (80)

Número de amostras estratificadas

- 7 -

O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas. Tomando na tabela de números aleatórios, a partir da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números:

Notas importantes sobre este tipo de amostragem

Como é provável que a variável em estudo apresente, de estrato para estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que a amostragem seja feita por estratos. Portanto, a amostragem estratificada é, em geral, usada para reduzir a variação nos resultados.

A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, uma vez que fica assegurada a representatividade de elementos ao longo de toda a extensão da população. A homogeneidade de itens dentro de cada estrato proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante.

Amostragem por Conglomerado- É aquela em que dividimos a população em pequenos grupos (conglomerados), e retiramos amostras aleatórias simples dos conglomerados.

Normalmente usado para amostras grandes. É um método muito usado por motivos de ordem econômica e prática. Imagine uma população de 8.000 na qual se queira uma amostra de 400 elementos. É inviável usar os outros métodos pois implicaria em muito trabalho enumerar e escolher um a um. Exemplo. Na população de 8.0 novilhos, divida em 10 conglomerados e extraia uma amostra de tamanho 2.400,

Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória.

1º passo. Determine o número de elementos para cada conglomerado: 8000 / 10 = 800 novilhos por conglomerado

2º passo: Determine o número de algarismos que serão usados na tabela aleatória:

Como são 10 conglomerados, a contagem pela tabela aleatória será 1 ‐ 10

3º passo: Determinar o número de conglomerados amostrados Como queremos 2.400 novilhos, então serão 3 conglomerados , pois 800 + 800 + 800 = 2.400 novilhos

4º passo. Usar a tabela e selecionar as amostras. Então: Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória, temos, então:

Conglomerados selecionados: 06 07 02

Agora, é só coletar todos os elementos desses conglomerados selecionados e estudar todos os itens. Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem por áreas geográficas,

População (8.0)

Conglomerado 1 Conglomerado 2 Conglomerado 3 Conglomerado 5 Conglomerado 4 Conglomerado 6 Conglomerado 7 Conglomerado 8 Conglomerado 10 Conglomerado 9

800 novilhos para cada conglomerado

- 8 - como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, território de vendas etc. Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por conglomerados têm as seguintes características:

Todos os elementos contidos em cada conglomerado amostrado formam a amostra; Cada conglomerado é uma versão representativa em pequena escala da população inteira;

Tende a produzir melhores resultados quando os elementos neles contidos não são similares;

De um modo geral, é mais eficaz em termos de custo do que a amostragem aleatória simples, particularmente se a população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a amostragem por conglomerado geralmente demanda um maior tamanho de amostra para que sejam produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples ou estratificada.

Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional.

É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas envolvem a formação de grupos. Porém, a amostragem por conglomerado usa todos os elementos de um grupo selecionado, enquanto a amostragem estratificada usa amostras de elementos de todos os estratos.

Figura. Amostragem por Conglomerados em quarteirões de um bairro.

- 9 -

Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da população periodicamente, definida pelo pesquisador.

Utilizamos este tipo de amostragem quando os elementos de uma população se encontram ordenados, por exemplo, a coleta de amostras de um determinado produto em uma linha de produção.

Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da população. Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada, ou seja: N / n

EXEMPLO. Deseja-se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O intervalo de seleção é, então, 800/10 = 80. Desse modo, escolhemos um número de 1 a 80, o qual indicaria o primeiro elemento sorteado para amostra; os demais seriam periodicamente considerados de 80 em 80. Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória: o primeiro elemento será 31 (tabela aleatória) e os demais obtidos por progressão aritmética: 111, 191, 271, 351, 431, 511, 591, 671 e 751.

(Parte 1 de 6)

Comentários