Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Estatistica Descritiva - Apostilas - Ciências Biologicas Parte1, Notas de estudo de Ciências Biologicas

Apostilas de Ciências Biologicas sobre o estudo Estatistica Descritiva, definição, Principais propriedades do Censo, Principais propriedades da Amostragem.

Tipologia: Notas de estudo

2013

Compartilhado em 18/03/2013

Roseli
Roseli 🇧🇷

4.6

(78)

133 documentos

1 / 40

Documentos relacionados


Pré-visualização parcial do texto

Baixe Estatistica Descritiva - Apostilas - Ciências Biologicas Parte1 e outras Notas de estudo em PDF para Ciências Biologicas, somente na Docsity! 1                           INTRODUÇÃO O cidadão comum pensa que a estatística se resume apenas a apresentar tabelas de números em colunas esportivas e ou econômicas de jornais e revistas, ilustradas com gráficos, pilhas de moedas, etc. ou quando muito associam a estatística à previsão de resultados eleitorais. Mas estatístico de hoje não se limita a compilar tabelas de dados e os ilustrar graficamente. Pois á partir de 1925, com os trabalhos de Fisher, a estatística iniciou-se como método científico, então, o trabalho do estatístico passou a ser o de ajudara planejar experimentos, interpretar e analisar os dados experimentais e apresentar os resultados de maneira a facilitar a tomada de decisões razoáveis. Deste modo, podemos então definir estatística como sendo a ciência que se preocupa com a coleta, organização, apresentação, análise e interpretação de dados. Didaticamente podemos dividir a estatística em duas partes: a estatística descritiva e a inferência estatística. A estatística descritiva se refere à maneira de apresentar um conjunto de dados em tabelas e gráficos, e ao modo de resumir as informações contidas nestes dados a algumas medidas. Já a inferência estatística baseia-se na teoria das probabilidades para estabelecer conclusões sobre todo um grupo (chamado população), quando se observou apenas uma parte (amostra) desta população. É necessário ter em mente que a estatística é uma ferramenta para o pesquisador, nas respostas dos “por quês" de seus problemas. E que para ela ser bem usada é necessário conhecer os seus fundamentos e princípios, e acima de tudo que o pesquisador desenvolva um espírito crítico e jamais deixe de pensar. Pois "em ciência é fácil mentir usando a estatística, o difícil é falar a verdade sem usar a estatística". 1. CONCEITOS BÁSICOS 1.1 O QUE É A ESTATÍSTICA? Podemos dizer, de uma forma bem simplificada, que: ESTATÍSTICA é um conjunto de métodos e processos quantitativos que serve para estudar e medir os fenômenos coletivos. 1 Agradecimento especial à profa. Sandra Regina Peres da Silva por ter cedido o original para adaptação 2 Tentando ser um pouco mais rigoroso, podemos dizer que: ESTATÍSTICA é a ciência que estuda as técnicas necessárias para coletar, organizar, apresentar, analisar e interpretar os dados, a fim de extrair informações a respeito de uma população. POPULAÇÃO é o conjunto de todos os elementos (pessoas ou objetos) que interessam ao estudo de um fenômeno coletivo segundo alguma característica. AMOSTRA é qualquer subconjunto não vazio de uma população. PARÂMETRO é uma característica numérica estabelecida para toda uma população. ESTIMADOR é uma característica numérica estabelecida para uma amostra. Exemplo: Fenômeno coletivo: eleição para governador do Estado de Goiás. População: conjunto de todos os eleitores do estado. Parâmetro: proporção de votos de um certo candidato X. Amostra: grupo de 1.000 eleitores selecionados em todo o estado. Estimador: proporção de votos do candidato X, obtida na amostra. Dentre os modelos estatísticos podemos destacar os seguintes: CENSO é um levantamento estatístico (pesquisa) que abrange todos os elementos de uma população. AMOSTRAGEM é o processo de obter as amostras, com a finalidade de fazer generalizações sobre a população sem precisar examinar cada um de seus elementos. Principais propriedades do Censo: • Confiabilidade 100% • Custo elevado • Lento • Nem sempre é viável Principais propriedades da Amostragem: • Confiabilidade menor que 100% • Mais barata que o Censo • Mais rápida que o Censo • É sempre viável 5 Obs.: a variável idade, apesar de ser representada, geralmente, por números inteiros, é uma variável contínua, pois está relacionada com o tempo, que é uma variável contínua. 1.3.2 ORGANIZAÇÃO DE DADOS EM TABELAS Objetivo: apresentar resumidamente, de maneira clara e precisa, um conjunto de dados estatísticos. São elementos das tabelas: Título – texto conciso, indicador do conteúdo de uma tabela. Localizado no topo da tabela, responde às perguntas: O quê? Quando? Onde? Corpo – conjunto de linhas e colunas que contém informações sobre a variável em estudo. Cada cruzamento de uma linha com uma coluna constitui uma casa ou célula. Cabeçalho – parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora – parte da tabela que especifica o tipo de informação que cada linha contém. Fonte – identificador do responsável (pessoa física ou jurídica) pelo fornecimento dos dados. Não se indica a fonte no caso em que a tabela é apresentada pelo próprio pesquisador, ou pelo próprio grupo de pesquisadores, ou pela própria instituição que obteve os dados. É inscrita na primeira linha do rodapé (parte inferior da tabela) e deve ser precedida da palavra Fonte:. Notas – são informações de natureza geral que servem para esclarecer o conteúdo das tabelas ou para explicar o método utilizado no levantamento dos dados. As notas são colocadas logo após a fonte. Chamadas – são informações de natureza específica que servem para explicar ou conceituar determinados dados. As chamadas são inscritas no rodapé após a Fonte e as Notas. As chamadas devem obedecer às seguintes regras: a) A chamada deve ser indicada por algarismo arábico, ou por asterisco, entre parênteses. A chamada deve ser escrita à esquerda da casa, quando feita no corpo da tabela, e à direita da coluna indicadora, quando feita nessa coluna. b) Se houver mais de uma chamada na mesma tabela, elas devem ser numeradas sucessivamente, de cima para baixo e da esquerda para a direita. 6 c) As chamadas são colocadas no rodapé da tabela, em ordem numérica e separadas por pontos. d) Quando a tabela ocupa várias páginas, as chamadas devem ser apresentadas na página em que aparecem. Exemplo de tabela: PRODUÇÃO BRASILEIRA DE CAFÉ Título 1991-1995 Coluna ANOS PRODUÇÃO (1.000 t) Cabeçalho Indicadora 1991 2.535 1992 2.666 Casa ou célula 1993 2.122 1994 3.750 1995 2.007 Rodapé FONTE: IBGE Corpo 1.3.3 NORMAS PARA APRESENTAÇÃO DE TABELAS a) as tabelas devem ser delimitadas, no alto e em baixo, por traços horizontais; b) as tabelas não devem ser delimitadas, à direita e à esquerda, por traços verticais; c) o cabeçalho deve ser delimitado por traços horizontais; d) podem ser feitos traços verticais no interior da tabela, separando as colunas; e) as tabelas devem ter significado próprio, isto é, devem ser entendidas mesmo quando não se lê o texto em que estão apresentadas; f) as tabelas devem ser numeradas com algarismos arábicos; g) a tabela deve ser colocada no texto em posição tal que não exija, para a leitura, rotação da página em sentido horário; h) quando dois ou mais tipos de informação tiverem sido agrupados em um só conjunto, esse conjunto entra na tabela sob a denominação “outros”; i) as tabelas podem apresentar dados obtidos através de perguntas ou de entrevistas. Nesses casos, se parte das pessoas não respondeu a determinada pergunta, essa informação deve ser apresentada na tabela sob a especificação “sem declaração”; j) nenhuma célula da tabela deve ficar em branco. Toda célula deve apresentar um número ou um sinal, conforme a convenção: ... dado numérico não disponível 7 - dado numérico igual a zero não resultante de arredondamento. 0 quando o valor é muito pequeno para ser expresso pela unidade utilizada x dado omitido, a fim de evitar a individualização da informação k) as tabelas muito longas precisam ser apresentadas em duas ou mais páginas. Nesses casos, o cabeçalho deve ser repetido em todas as páginas, mas o título é escrito apenas na primeira. Nas demais páginas escreve-se, em lugar do título, “continua” e na última escreve-se “conclusão”. Só deve ser feito o traço inferior, que delimita a tabela, na última página; l) as tabelas com muitas linhas e poucas colunas ficam melhor apresentadas quando as colunas são organizadas em duas ou mais partes, escritas lado a lado. Essas partes são separadas por dois traços verticais. Nesses casos, o cabeçalho deve indicar o conteúdo das colunas em todas as partes; m) as tabelas com muitas colunas precisam ocupar duas páginas que se confrontam. Para facilitar a leitura, todas as linhas devem receber um número de ordem. O número de ordem deve ser escrito na primeira coluna da página à esquerda e na última coluna da página à direita; n) o total é geralmente apresentado na última linha, entre dois traços horizontais, embora também possa ser apresentado na primeira linha. 1.4 SÉRIES ESTATÍSTICAS Uma série estatística é toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função do tempo, do local ou do fenômeno. Tipos Básicos de Séries: • Temporal, Cronológica ou Histórica • Geográfica, Territorial ou de Localização • Categórica ou Específica Série Temporal: usada para apresentar dados observados em determinado local, discriminados ao longo do tempo. 10 • As variáveis devem ser claramente identificadas; • A escala deve iniciar-se na origem do sistema de eixos cartesianos. Quando os valores iniciais dos dados são muito altos, deve ser feita uma interrupção no eixo, com indicação clara da posição do zero; • O sistema de eixos cartesianos e as linhas auxiliares devem ter traçado mais leve do que a parte do gráfico que se pretende evidenciar; • Para facilitar a leitura, podem ser feitas linhas auxiliares. Nesses casos, o gráfico é feito dentro de um retângulo. Principais Tipos de Gráficos: • Diagramas • Cartogramas • Pictogramas Cartogramas: São representações através de mapas (cartas geográficas). Este gráfico é empregado quando o objetivo é o de relacionar os dados estatísticos diretamente com áreas geográficas ou políticas. Pictogramas: É a representação gráfica através de figuras. Por se tratar de uma apresentação atraente, é um gráfico que desperta muito a atenção do leitor. Diagramas: São gráficos geométricos construídos, em geral, no sistema cartesiano. Principais Diagramas: Gráfico em Linha, Gráfico em Colunas, Gráfico em Barras, Gráfico em Colunas ou em Barras Múltiplas e Gráfico em Setores. Gráfico em Linha: Usado para apresentar as séries temporais. Representado num sistema de coordenadas cartesianas, cada par de valores da série corresponde a um ponto. Estes pontos são unidos por segmentos de reta. Exemplo: Tabela 1 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 ANOS PRODUÇÃO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE 11 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 0 500 1.000 1.500 2.000 2.500 3.000 3.500 4.000 1991 1992 1993 1994 1995 ANOS P R O D U Ç Ã O ( 1. 00 0t ) Regras para a elaboração de um gráfico em linhas: • Fixe a largura (l) do gráfico; • Determine a altura máxima e a altura mínima de acordo com as normas a seguir: hmín = 60% da largura e hmáx = 80% da largura • Determine os limites da escala, dividindo o maior valor a representar pela altura máxima e pela altura mínima; • Determine a escala, escolhendo um valor, de preferência inteiro, entre os valores encontrados para limites; • Trace um sistema de coordenadas cartesianas; • Determine, graficamente, todos os pontos da série; • Ligue esses pontos, dois a dois, por segmentos de reta; • Identifique, claramente, as variáveis nos dois eixos; • Acrescente o Título, a Fonte e a Legenda (quando necessária). Gráfico em Colunas: Usado para representar as séries cronológicas, geográficas e categóricas. Representado por meio de retângulos de mesma base, dispostos verticalmente (em colunas). Exemplo: 12 Tabela 1 PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 ANOS PRODUÇÃO (1.000 t) 1991 2.535 1992 2.666 1993 2.122 1994 3.750 1995 2.007 FONTE: IBGE PRODUÇÃO BRASILEIRA DE CAFÉ 1991-1995 0 500 1.000 1.500 2.000 2.500 3.000 3.500 4.000 1991 1992 1993 1994 1995 ANOS P R O D U Ç Ã O ( 1. 00 0t ) Gráfico em Barras: Usado para representar as séries geográficas e categóricas. Representado por meio de retângulos dispostos horizontalmente (em barras). Exemplo: 15 Tabela 4 REBANHO SUINO DO SUDESTE DO BRASIL 1992 ESTADOS QUANTIDADE (mil cabeças) Minas Gerais 3.363,7 Espírito Santo 430,4 Rio de Janeiro 308,5 São Paulo 2.035,9 Total 6.138,5 FONTE: IBGE REBANHO SUÍNO DO SUDESTE DO BRASIL 1992 55% 33% 5% 7% Minas Gerais Espírito Santo Rio de Janeiro São Paulo Regras para a elaboração de um gráfico em setores: • Trace uma circunferência. A área do círculo representa o total, isto é, 100%, devendo ser dividida em tantos setores quantas sejam as partes. • Lembre-se de que uma circunferência tem 360°. Então, se ao total correspondem 360°, a cada parte corresponderá um setor cujo ângulo x é dado por: TOTAL PARTE x 360× = • Marque os valores dos ângulos calculados na circunferência e trace os raios, separando os setores. • Para facilitar a distinção, faça um tracejado diferente em cada setor. • Coloque título e legenda no gráfico. OBS.: Para clareza dos dados, deve-se usar no máximo sete setores. 16 1.6 DISTRIBUIÇÃO DE FREQUÊNCIAS Freqüentemente, ao coletar dados, o pesquisador se depara com uma grande massa de valores numéricos, que se repetem algumas vezes, dificultando sua análise e interpretação. Surge então a necessidade de organizar esses dados em uma tabela onde os valores observados se apresentam associados individualmente ou em classes com os números de suas repetições, isto é, com suas respectivas freqüências. Esta tabela recebe o nome de Distribuição de Freqüências. De acordo com a disposição dos dados têm-se dois tipos de distribuição: 1.6.1 Distribuição de Freqüências Simples (dados não agrupados ou não tabulados em classes de valores) É uma tabela onde os valores da variável analisada aparecem individualmente correlacionados com os números de suas repetições (freqüências). Esse tipo de distribuição é normalmente usado para representar variáveis discretas. Exemplo: Tabela 1 Construtora Aimorés – Número de Acidentes Registrados Janeiro de 2000 Nº de Acidentes Nº de Dias 0 18 1 5 2 2 3 2 4 3 5 1 Total 31 FONTE: Dados Hipotéticos 1.6.2 Distribuição de Freqüências por Classes (dados agrupados ou tabulados em classes de valores) Quando a variável analisada apresenta um grande número de valores torna-se mais vantajoso o agrupamento destes em classes de freqüência, evitando assim grande extensão da tabela e facilitando a visualização do fenômeno como um todo. 17 A distribuição de freqüências por classes é uma tabela onde os valores observados são agrupados em classes, isto é, em intervalos de variações da variável em questão. Esse tipo de distribuição é normalmente usado para representar variáveis contínuas. É utilizada também para representar variáveis discretas em um grande número de valores observados. Exemplo: Tabela 2 Salários dos funcionários da Loja XY Salários (R$) Nº de funcionários 1000 1200 2 1200 1400 6 1400 1600 10 1600 1800 5 1800 2000 2 Total 25 FONTE: Dados Hipotéticos A seguir são apresentados alguns conceitos fundamentais para a compreensão dessas séries. Dados Brutos É a apresentação dos dados observados na seqüência em que foram coletados, isto é, sem nenhuma ordenação numérica. Exemplo: O número de peças defeituosas obtidas da produção de uma máquina durante vinte dias foi: 2 – 4 – 2 – 1 – 2 – 3 – 1 – 0 – 5 – 1 – 0 – 1 – 1 – 2 – 0 – 1 – 3 – 0 – 1 – 2 Rol É a organização dos dados brutos em ordem crescente ou decrescente. Exemplo: O rol do exemplo anterior é: 0 – 0 – 0 – 0 – 1 – 1 – 1 – 1 – 1 – 1 – 1 – 2 – 2 – 2 – 2 – 2 – 3 – 3 – 4 – 5 20 A freqüência total de uma distribuição de freqüências é igual ao número total de observações (n). Exemplo: Na Tabela 3, temos: 6 i 1 2 3 4 5 6 i 1 F F F F F F F 4 8 3 3 1 1 20 = = + + + + + = + + + + + = Freqüência Relativa Simples, ou simplesmente, Freqüência Relativa Simbolizada por fi, a freqüência relativa simples fornece a proporção de cada valor ou de casos ocorridos em cada classe, em relação ao número total de observações. Portanto, é um número relativo. Para calcular a freqüência relativa, basta dividir a freqüência absoluta da ordem em questão pelo número de observações. n F f ii = As comparações expressas através de porcentagem são mais usuais. Para obter a porcentagem de cada valor ou de casos ocorridos em cada classe, multiplica-se o quociente obtido por 100, ou seja: i i F f 100 n = × Nota: k i i 1 f 1 = = ou 100% Exemplo: Na Tabela 3, temos: 1 1 F 4 f 0,20 100 20 20 20 = = = × = % 2 2 F 8 f 0,40 100 20 20 = = = × = 40% 3 3 F 3 f 0,15 100 15 20 20 = = = × = % 21 4 4 F 3 f 0,15 100 15 20 20 = = = × = % 5 5 F 1 f 0,05 100 5 20 20 = = = × = % 6 6 F 1 f 0,05 100 5 20 20 = = = × = % Freqüência Absoluta Acumulada Denotada por Faci, a freqüência absoluta acumulada fornece a informação de quantos elementos se situam até determinado valor. A freqüência acumulada do i- ésimo valor ou i-ésima classe (freqüência acumulada de ordem i) é obtida somando-se a freqüência desse valor ou classe com as freqüências anteriores, ou seja, é a soma de todas as freqüências de ordens menores ou igual a da ordem em questão. Exemplo: Fac3 = 3 i 1=  Fi = F1 + F2 + F3 Fac4 = 4 i 1=  Fi = F1 + F2 + F3 + F4 Exemplo: Na tabela 3, temos: Fac1 = F1 = 4 Fac4 = F1 + F2 + F3 + F4 = 15 + 3 = 18 Fac2 = F1 + F2 = 4 + 8 = 12 Fac5 = F1 + F2 + F3 + F4 + F5 = 18 + 1 = 19 Fac3 = F1 + F2 + F3 = 12 + 3 = 15 Fac6 = F1 + F2 + F3 + F4 + F5 + F6 = 19 + 1 = 20 Freqüência Acumulada Relativa Denotada por faci, fornece a proporção de elementos situados até determinado valor. Consiste na soma da freqüência relativa de cada valor ou classe com as freqüências relativas dos valores ou classes anteriores, ou seja, é a soma das freqüências simples relativas de ordens menores ou iguais a da ordem em questão. . 22 Exemplo: fac3 = 3 i 1=  fi = f1 + f2 + f3 Exemplo: Na tabela 3, temos: fac1 = f1 = 0,20 = 20% fac2 = f1 + f2 = 0,20 + 0,40 = 0,60 = 60% fac3 = f1 + f2 + f3 = 0,60 + 0,15 = 0,75 = 75% fac4 = f1 + f2 + f3 + f4 = 0,75 + 0,15 = 0,90 = 90% fac5 = f1 + f2 + f3 + f4 + f5 = 0,90 + 0,05 = 0,95 = 95% fac6 = f1 + f2 + f3 + f4 + f5 + f6 = 0,95 + 0,05 = 1 = 100% A freqüência relativa acumulada de ordem i pode ser também calculada através do quociente: =      Exemplo: 3 15 fac 0,75 75 20 = = = % Com relação à Tabela 3, utilizando todos os tipos de freqüências definidas anteriormente, podemos construir a seguinte distribuição de freqüências: Tabela 4 Número de Irmãos de 20 alunos da Turma PEST i xi Fi fi fi (%) Faci faci faci(%) 1 0 4 0,20 20 4 0,20 20 2 1 8 0,40 40 12 0,40 40 3 2 3 0,15 15 15 0,75 75 4 3 3 0,15 15 15 0,90 90 5 4 1 0,05 5 5 0,95 95 6 5 1 0,05 5 5 1,00 100 Total 20 1,00 100 − − − FONTE: Dados Fictícios 25 4. Dada a distribuição de freqüências: Indústria de Equipamentos Eletrônicos – IEE Número de Falhas em Componentes durante o período de garantia Janeiro de 2000 i Nº de Falhas (xi) Número de Equipamentos (Fi) 1 0 148 2 1 52 3 2 34 4 3 26 5 4 13 6 5 7 Total 280 FONTE: Dados Fictícios a) Determinar as freqüências relativas percentuais, as freqüências acumuladas e as freqüências relativas acumuladas percentuais. b) Através das freqüências calculadas, responder qual a porcentagem de: b.1) equipamentos que não apresentaram falha em seus componentes; b.2) equipamentos que apresentaram pelo menos uma falha em seus componentes; b.3) equipamentos trocados, sabendo-se que a indústria se compromete a trocar o equipamento que apresente 4 ou mais falhas em seus componentes. 5. Considere os seguintes números. 1 3 5 7 9 2 4 6 8 10 15 20 25 0 1 2 3 4 5 6 7 8 9 9 8 7 8 6 5 4 3 2 1 0 10 15 20 25 12 8 11 6 4 2 1 3 5 7 9 11 a) Construa a distribuição de freqüências simples. b) Representá-la através de um gráfico conveniente. c) Calcular todos os tipos de freqüências conhecidos. 26 1.7 Intervalo de Classe ou Classe Classes são intervalos de variações da variável, ou seja, é cada um dos grupos de valores em que se subdivide a amplitude total do conjunto de valores observados da variável. Uma determinada classe pode ser identificada por seus extremos ou pela ordem em que ela se encontra na tabela (valor do índice i) O número de classes de uma distribuição de freqüências será denotado por k. A notação indica intervalo fechado à esquerda. Assim, na Tabela 2, um funcionário que apresentou salário de R$ 1400,00 pertence à classe 1400 1600, ou terceira classe (i = 3). Existem diversas maneiras de expressar as classes: a) a b compreende todos os valores entre a e b, incluindo a e b b) a b compreende todos os valores entre a e b, excluindo a c) a b compreende todos os valores entre a e b, excluindo b d) a b compreende todos os valores entre a e b, excluindo a e b Em nosso curso usaremos a forma expressa em “c)”. 1.7.1 Limites de Classe São os valores extremos de cada classe. O menor valor denomina-se limite inferior da classe i (li) e o maior, limite superior da classe i (Li). Assim, na quarta classe da Tabela 2 tem-se l4 = 1600 e L4 = 1800. 1.7.2 Amplitude do Intervalo de Classe (h) A amplitude do intervalo de classe é o comprimento da classe, sendo definida como a diferença entre o limite superior e o limite inferior da classe. hi = Li − li Exemplo: Na Tabela 2, temos: h1 = 1200 – 1000 = 200 h2 = 1400 – 1200 = 200 27 Em geral h1 = h2 = h3 = ... = h k = h, e determina-se a amplitude do intervalo fazendo: T A h k = Exemplo: Dados: AT = 64 e k = 7. Temos: h = 64 7 = 9,14 ≈ 10 Nota: Sugere-se sempre aproximar o valor encontrado para o inteiro superior. 1.7.3 Número de Classes (k) Não existe uma regra fixa que forneça o número de classes. No entanto, como o objetivo da distribuição de freqüências é facilitar a compreensão dos dados, é importante que a distribuição contenha um número adequado de classes. Se este número for escasso, os dados originais ficarão tão comprimidos que pouca informação poderá ser extraída da tabela. Se por outro lado forem utilizadas várias classes, haverá algumas com freqüências nulas ou muito pequenas e o resultado será uma distribuição irregular e prejudicial à interpretação do fenômeno como um todo. Na prática esse número não deve ser superior a 20 nem inferior a 5. Se a quantidade de dados for pequena não se justifica a construção de uma tabela, e se for grande, mais de 20 classes dificulta a análise. Em função do total de observações existem vários métodos que orientam a escolha de um número de classes conveniente. Seguem-se os dois mais utilizados: a) Regra da Raiz Quadrada k = 5 para n ≤ 25 k = n para n > 25, onde n é o número de observações. Exemplo: Para n = 30, o número de classes será 48,530 = ≈ 5. b) Regra de Sturges k = 1 + 3,3 log n, onde: n = número de observações. Exemplo: Para n = 30, tem-se: k = 1 + 3,3 log 30 ≈ 6. 30 Notas de 50 alunos Classes Notas Fi fi fi(%) Faci faci faci(%) xi 1 30 |--- 40 4 0,08 8 4 0,08 8 35 2 40 |--- 50 6 0,12 12 10 0,20 20 45 3 50 |--- 60 8 0,16 16 18 0,36 36 55 4 60 |--- 70 13 0,26 26 31 0,62 62 65 5 70 |--- 80 9 0,18 18 40 0,80 80 75 6 80 |--- 90 7 0,14 14 47 0,94 94 85 7 90 |--- 100 3 0,06 6 50 1,00 100 95 Total 50 1,00 100 − − − − FONTE: Dados Hipotéticos Interpretação: F3 = 8 → 8 alunos obtiveram nota igual ou superior a 50 e inferior a 60. f4 = 26% → 26% dos alunos obtiveram notas entre 60 (inclusive) e 70 (exclusive). Fac6 = 47 → 47 alunos obtiveram notas inferiores a 90. fac5 = 80% → 80% dos alunos obtiveram notas inferiores a 80. 1.8 Distribuição de Freqüências com Intervalos de Classes Desiguais Existem casos em que é mais adequado agrupar os dados em classes com larguras desiguais, como, por exemplo, as idades dos atletas de acordo com a categoria a que pertencem. Exemplo: Tabela 5 Categoria de Atletas por Idade Classes Idades Fi 1 2 |--- 13 12 2 13 |--- 15 5 3 15 |--- 18 8 4 18 |--- 30 30 5 30 |--- 40 12 6 40 |--- 60 10 7 60 |--- 90 2 Total 79 31 1.9 Gráficos de uma Distribuição de Freqüências por Classes 1. Histograma É um tipo de gráfico apropriado para representar dados agrupados em classes. Consiste de colunas justapostas cujas bases representam as classes e as alturas correspondem às freqüências das classes. 2. Polígono de Freqüências Trata-se da representação de uma distribuição de freqüências por classes, através de um polígono. O eixo das abcissas constitui a base do polígono. Os vértices são os pontos (xi,Fi) onde xi é o ponto médio e Fi é a freqüência da classe. O fechamento da poligonal com a base é feito unindo o primeiro vértice ao ponto médio de uma classe anterior à primeira, e o último vértice ao ponto médio de uma classe posterior à última. Esse gráfico é adequado também para a representação de freqüências relativas e percentuais. 3. Polígono de Freqüências Acumuladas ou Ogiva de Galton Utilizado para representar as freqüências acumuladas. Os vértices são os pontos (Li, Faci). Pode ser usado também para representar as freqüências acumuladas relativas percentuais. O fechamento é feito unindo o primeiro vértice ao limite inferior da primeira classe. Esse gráfico será útil para a determinação das medidas separatrizes que serão tratadas posteriormente. Exemplo: Dada a distribuição de freqüências: Notas dos alunos da turma PEST Notas Fi Fac Fi xi 30 |--- 40 4 4 0,08 35 40 |--- 50 6 10 0,12 45 50 |--- 60 8 18 0,16 55 60 |--- 70 13 31 0,26 65 70 |--- 80 9 40 0,18 75 80 |--- 90 7 47 0,14 85 90 |--- 100 3 50 0,06 95 Total 50 − 1,00 − 32 Os gráficos representativos dessa distribuição são: HISTOGRAMA E POLÍGONO DE FREQUÊNCIAS POLÍGONO DE FREQUÊNCIAS ACUMULADAS EXERCÍCIOS 1. Os dados a seguir referem-se às notas de 50 alunos: 60 85 33 52 65 77 84 65 74 57 71 35 81 50 35 64 74 47 54 68 80 61 41 91 55 73 59 53 77 45 71 55 78 48 69 85 67 39 60 76 94 98 66 66 73 42 65 94 88 89 3 4 6 7 8 9 13 Fi 30 40 50 60 70 80 90 100 classe Polígono de freqüência 10 4 18 47 31 40 50 Fac 30 40 50 60 70 80 90 100 classe 35 7. Os dados abaixo referem-se ao consumo mensal de energia elétrica em kwh da conta nº 001.161157-1 das Centrais Elétricas de Goiás, no período de 1997 a 1999. 142 – 178 – 164 – 190 – 146 – 131 – 119 – 131 – 187 – 158 – 168 – 111 – 96 – 118 – 182 – 116 – 188 – 207 – 229 – 180 – 181 – 175 – 205 – 179 – 184 – 227 – 210 – 210 – 213 – 190 – 240 – 215 – 226 – 188 – 190 – 205 – a) Sintetizar esses dados através de uma distribuição de freqüências por classes. b) Calcular todos os tipos de freqüências que você conhece. c) Com base nas freqüências calculadas, apresentar os seguintes percentuais: c.1) de meses com consumo inferior a 150 kwh. c.2) de meses com consumo superior a 200 kwh. d) Representar a distribuição elaborada através de um histograma e de um polígono de freqüências. e) Representar a distribuição de freqüências acumuladas através de uma Ogiva. 8. Dada a amostra: 28 33 27 30 31 30 33 30 33 29 27 33 31 27 31 28 27 29 31 24 31 33 30 32 30 33 27 33 31 33 23 29 30 24 28 34 39 30 18 17 18 15 16 17 17 18 19 19 20 29 a) Agrupar os elementos em classes (inicie pelo 15 e use h = 5). b) Calcule as freqüências absolutas, as freqüências acumuladas e os pontos médios das classes. c) Interprete todos os resultados da 4ª linha da tabela. d) Construa o histograma, o polígono de freqüências e o polígono de freqüências acumuladas da distribuição. 9. Abaixo temos a distribuição dos aluguéis de 65 casas. Aluguel (centenas de $) 1,5 |-- 3,5 3,5 |-- 5,5 5,5 |-- 7,5 7,5 |-- 9,5 9,5 |-- 11,5 Nº de casas 12 18 20 10 5 Com referência a essa tabela determine: a) A amplitude total. b) O limite superior da 5ª classe. c) A freqüência acumulada da 4ª classe. d) O número de aluguéis cujo valor atinge, no máximo, R$ 550,00. 36 e) O número de aluguéis cujo valor é superior ou igual a R$ 750,00. f) A classe do 50º aluguel. 10. A distribuição de freqüência abaixo representa o consumo por nota de 54 notas fiscais emitidas durante um dia em uma loja de departamentos. Consumo por nota (R$) nº de notas 0 |------ 50 10 50 |------ 100 28 100 |------ 150 12 150 |------ 200 2 200 |------ 250 1 250 |------ 300 1 a) Interprete todos os resultados da 4ª linha da tabela. b) Construa o histograma e o polígono de freqüências. 37 2. MEDIDAS DE POSIÇÃO As medidas de posição são valores que representam o conjunto de dados observados ou então promovem uma partição sobre este conjunto. Entre as medidas de posição destacam-se as medidas de tendência central e as separatrizes. 2.1 MEDIDAS DE TENDÊNCIA CENTRAL A maneira mais simples de resumirmos as informações contidas em um conjunto de dados observados é estabelecer um ponto central em torno do qual os dados se distribuem. Tais medidas orientam quanto à posição do conjunto no eixo dos números reais e possibilitam comparações de séries de dados entre si pelo confronto destes números. São chamadas Medidas de Tendência Central, pois representam os fenômenos pelos seus valores médios em torno dos quais tendem a se concentrar os dados. 2.1.1 MÉDIA ARITMÉTICA ( x ) a) Média aritmética para dados não agrupados Sejam x1, x2, ..., xn, n valores da variável X. A média aritmética simples, denotada por x , é definida por: n i i 1 x x n ==  , onde n é o número de valores observados da variável X. Exemplo: Determinar a média aritmética simples dos valores: 7,0; 3,0; 5,5; 6,5; 8,0. 5 i i 1 x 7,0 3,0 5,5 6,5 8,0 x 6,0 5 5 = + + + + = = = 
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved