Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Introdução à Estatística, Notas de estudo de Estatística

Estatística Básica Organização de Dados Estatísticos Medidas de Posição Medidas de Dispersão Medidas de Assimetria e Curtose

Tipologia: Notas de estudo

Antes de 2010

Compartilhado em 02/05/2009

alline-stamatto-11
alline-stamatto-11 🇧🇷

3.5

(2)

7 documentos

Pré-visualização parcial do texto

Baixe Introdução à Estatística e outras Notas de estudo em PDF para Estatística, somente na Docsity! RESUMO ESTATÍSTICA BÁSICA Conteúdo 1. Introdução pag. 02 2. Organização de Dados Estatísticos pag. 03 3. Medidas de Posição pag. 14 4. Medidas de Dispersão pag. 27 5. Medidas de Assimetria e Curtose pag. 32 Alexandre José Granzotto Julho a Outubro / 2002 RESUMÃO - ESTATÍSTICA BÁSICA 1. INTRODUÇÃO ESTATÍSTICA: ramo da matemática aplicada. ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos. Faziam "estatísticas". IDADE MÉDIA: as informações eram tabuladas com finalidades tributárias e bélicas. SEC. XVI: surgem as primeiras análises sistemáticas, as primeiras tabelas e os números relativos. PAGE 1 SEC. XVIII: a estatística com feição científica é batizada por GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as primeiras representações gráficas e os cálculos de probabilidades. A estatística deixa de ser uma simples tabulação de dados numéricos para se tornar "O estudo de como se chegar a conclusão sobre uma população, partindo da observação de partes dessa população (amostra)". MÉTODO ESTATÍSTICO MÉTODO: é um meio mais eficaz para atingir determinada meta. MÉTODOS CIENTÍFICOS: destacamos o método experimental e o método estatístico. MÉTODO EXPERIMENTAL: consiste em manter constante todas as causas, menos uma, que sofre variação para se observar seus efeitos, caso existam. Ex: Estudos da Química, Física, etc. MÉTODO ESTATÍSTICO: diante da impossibilidade de manter as causas constantes (nas ciências sociais), admitem todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Ex: Quais as causas que definem o preço de uma mercadoria quando a sua oferta diminui? • Seria impossível, no momento da pesquisa, manter constantes a uniformidade dos salários, o gosto dos consumidores, nível geral de preços de outros produtos, etc. A ESTATÍSTICA F 0 E 8 É uma parte da matemática aplicada que fornece métodos para coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. F 0 E 8 A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade. . 2. ORGANIZAÇÃO DE DADOS ESTATÍSTICOS FASES DO MÉTODO ESTATÍSTICO 1º - DEFINIÇÃO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. PAGE 1 VARIÁVEL DISCRETA OU DESCONTÍNUA: Seus valores são expressos geralmente através de números inteiros não negativos. Resulta normalmente de contagens. Ex: Nº de alunos presentes às aulas de introdução à estatística econômica no 1º semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36. VARIÁVEL CONTÍNUA: Resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer valor entre dois limites. Ex.: Quando você vai medir a temperatura de seu corpo com um termômetro de mercúrio o que ocorre é o seguinte: O filete de mercúrio, ao dilatar-se, passará por todas as temperaturas intermediárias até chegar na temperatura atual do seu corpo. Exemplos - . Cor dos olhos das alunas: qualitativa . Índice de liquidez nas indústrias capixabas: quantitativa contínua . Produção de café no Brasil: quantitativa contínua . Número de defeitos em aparelhos de TV: quantitativa discreta . Comprimento dos pregos produzidos por uma empresa: quantitativa contínua . O ponto obtido em cada jogada de um dado: quantitativa discreta AMOSTRAGEM MÉTODOS PROBABILÍSTICOS F 0 E 8 Exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento ser selecionado será 1/N. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências ou induções sobre a população a partir do conhecimento da amostra. • É uma técnica especial para recolher amostras, que garantem, tanto quanto possível, o acaso na escolha. . AMOSTRAGEM CASUAL ou ALEATÓRIA SIMPLES F 0 E 8 É o processo mais elementar e freqüentemente utilizado. É equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando-se, a seguir, por meio de um dispositivo aleatório qualquer, x números dessa seqüência, os quais corresponderão aos elementos pertencentes à amostra. PAGE 1 Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após mistura retiramos, um a um, nove números que formarão a amostra. OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. . .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: F 0 E 8 Quando a população se divide em estratos (sub-populações), convém que o sorteio dos elementos da amostra leve em consideração tais estratos, daí obtemos os elementos da amostra proporcional ao número de elementos desses estratos. Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULACÃ O 10 % AMOSTRA MASC. 54 5,4 5 FEMIN. 36 3,6 4 Total 90 9,0 9 Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios. . AMOSTRAGEM SISTEMÁTICA: F 0 E 8 Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostra formada por 50 casas para uma pesquisa de opinião. Podemos, neste caso, usar o seguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um número de 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demais elementos seriam periodicamente considerados de 18 em 18. Assim, suponhamos que o número sorteado fosse 4 a amostra seria: 4ª casa, 22ª casa, 40ª casa, 58ª casa, 76ª casa, etc. AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS) F 0 E 8 Algumas populações não permitem, ou tornam extremamente difícil que se identifiquem seus elementos. Não obstante isso, pode ser relativamente fácil identificar PAGE 1 alguns subgrupos da população. Em tais casos, uma amostra aleatória simples desses subgrupos (conglomerados) pode se colhida, e uma contagem completa deve ser feita para o conglomerado sorteado. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios etc. Ex: Num levantamento da população de determinada cidade, podemos dispor do mapa indicando cada quarteirão e não dispor de uma relação atualizada dos seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a contagem completa de todos os que residem naqueles quarteirões sorteados. MÉTODOS NÃO PROBABILÍSITCOS F 0 E 8 São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população. AMOSTRAGEM ACIDENTAL F 0 E 8 Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Ex: Pesquisas de opinião em praças públicas, ruas de grandes cidades; AMOSTRAGEM INTENCIONAL F 0 E 8 De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Ex: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. AMOSTRAGEM POR QUOTAS F 0 E 8 Um dos métodos de amostragem mais comumente usados em levantamentos de mercado e em prévias eleitorais. Ele abrange três fases: 1ª - classificação da população em termos de propriedades que se sabe, ou presume, serem relevantes para a característica a ser estudada; 2ª - determinação da proporção da população para cada característica, com base na constituição conhecida, presumida ou estimada, da população; 3ª - fixação de quotas para cada entrevistador a quem tocará a responsabilidade de selecionar entrevistados, de modo que a amostra total observada ou entrevistada contenha a proporção e cada classe tal como determinada na 2ª fase. PAGE 1 Características: Uso de escalas, sistema de coordenadas, simplicidade, clareza e veracidade. Gráficos de informação: São gráficos destinados principalmente ao público em geral, objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos, dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as informações desejadas estejam presentes. Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico, fornecendo elementos úteis à fase de análise dos dados, sem deixar de ser também informativos. Os gráficos de análise freqüentemente vêm acompanhados de uma tabela estatística. Inclui-se, muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais revelados pelo gráfico. • Uso indevido de Gráficos: Podem trazer uma idéia falsa dos dados que estão sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um problema de construção de escalas. . Classificação dos gráficos: Diagramas, Estereogramas, Pictogramas e Cartogramas. . 1 - Diagramas: F 0 E 8 São gráficos geométricos dispostos em duas dimensões. São os mais usados na representação de séries estatísticas. Eles podem ser : 1.- Gráficos em barras horizontais. 1.2- Gráficos em barras verticais ( colunas ). • Quando as legendas não são breves usa-se de preferência os gráficos em barras horizontais. Nesses gráficos os retângulos têm a mesma base e as alturas são proporcionais aos respectivos dados. • A ordem a ser observada é a cronológica, se a série for histórica, e a • decrescente, se for geográfica ou categórica. 2.- Gráficos em barras compostas. 1.4- Gráficos em colunas superpostas. • Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. 1.5- Gráficos em linhas ou lineares. • São freqüentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as PAGE 1 colunas, quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. • Quando representamos, em um mesmo sistema de coordenadas, a variação de dois fenômenos, a parte interna da figura formada pelos gráficos desses fenômenos é denominada de área de excesso. 1.5- Gráficos em setores. • Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação do dado no total. O total é representado pelo círculo, que fica dividido em tantos setores quantas são as partes. Os setores são tais que suas áreas são respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado quando há, no máximo, sete dados. • Obs: As séries temporais geralmente não são representadas por este tipo de gráfico. . 2 - Estereogramas: F 0 E 8 São gráficos geométricos dispostos em três dimensões, pois representam volume. São usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem. . 3 - Pictogramas: F 0 E 8 São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos. Veja o exemplo abaixo: 4- Cartogramas: F 0 E 8 São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas. DISTRIBUIÇÃO DE FREQÜÊNCIA F 0 E 8 É um tipo de tabela que condensa uma coleção de dados conforme as freqüências (repetições de seus valores). Tabela primitiva ou dados brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma idéia exata do comportamento do grupo como um todo, a partir de dados não ordenados. Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 PAGE 1 ROL: É a tabela obtida após a ordenação dos dados (crescente ou decrescente). Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Distribuição de freqüência sem intervalos de classe: É a simples condensação dos dados conforme as repetições de seu valores. Para um ROL de tamanho razoável esta distribuição de freqüência é inconveniente, já que exige muito espaço. Veja exemplo abaixo: Dados Freqüência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 Total 20 Distribuição de freqüência com intervalos de classe:Quando o tamanho da amostra é elevado, é mais racional efetuar o agrupamento dos valores em vários intervalos de classe. Classes Freqüências 41 |------- 45 7 45 |------- 49 3 49 |------- 53 4 53 |------- 57 1 57 |------- 61 5 Total 20 ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA (com intervalos de classe) F 0E 8 CLASSE: são os intervalos de variação da variável e é simbolizada por i e o número total de classes simbolizada por k. Ex: na tabela anterior k = 5 e 49 |------- 53 é a 3ª classe, onde i = 3. LIMITES DE CLASSE: são os extremos de cada classe. O menor número é o limite inferior de classe ( li ) e o maior número, limite superior de classe ( PAGE 1 Polígono de freqüência: é um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. . Polígono de freqüência acumulada: é traçado marcando-se as freqüências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Freqüência simples acumulada de uma classe: é o total das freqüências de todos os valores inferiores ao limite superior do intervalo de uma determinada classe. Freqüência relativa acumulada de um classe: é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. ...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri..... 50 |-------- 54 4 52 0,100 4 0,100 54 |-------- 58 9 56 0,225 13 0,325 58 |-------- 62 11 60 0,275 24 0,600 62 |-------- 66 8 64 0,200 32 0,800 66 |-------- 70 5 68 0,125 37 0,925 70 |-------- 74 3 72 0,075 40 1,000 Total 40 1,000 fi = freqüência simples; xi = ponto médio de classe; fri = freqüência simples acumulada; Fi = freqüência relativa e Fri = freqüência relativa acumulada. • Obs: uma distribuição de freqüência sem intervalos de classe é representada graficamente por um diagrama onde cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva freqüência. . 3. MEDIDAS DE POSIÇÃO PAGE 1 Introdução F 0 E 8 São as estatísticas que representam uma série de dados orientando-nos quanto à posição da distribuição em relação ao eixo horizontal do gráfico da curva de freqüência. • As medidas de posições mais importantes são as medidas de tendência central ou promédias (verifica-se uma tendência dos dados observados a se agruparem em torno dos valores centrais). • As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana. Outros promédios menos usados são as médias: geométrica, harmônica, quadrática, cúbica e biquadrática. • As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os decis, os quartis e os percentis. . MÉDIA ARITMÉTICA = F 0 E 8 É igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. ...... onde xi são os valores da variável e n o número de valores. . Dados não-agrupados: Quando desejamos conhecer a média dos dados não-agrupados em tabelas de freqüências, determinamos a média aritmética simples. Ex: Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda média diária na semana de: .= (10+14+13+15+16+18+12) / 7 = 14 kilos Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a média aritmética, ou seja:. . di = Xi - No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 , d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. .. d7 = 12 - 14 = - 2. PAGE 1 . Propriedades da média aritmética F 0E 8 1ª propriedade: A soma algébrica dos desvios em relação à média é nula. • No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0 2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ( ou diminuída) dessa constante. • Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos: Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou Y = .+ 2 = 14 +2 = 16 kilos 3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ( ou dividida) por essa constante. • Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos: Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou Y = x 3 = 14 x 3 = 42 kilos . Dados agrupados: Sem intervalos de classe F 0E 8 Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por família: Nº de meninos freqüência = fi 0 2 PAGE 1 3 |--------- 5 4 4 4/4 = 1,00 5 |--------- 7 8 6 8/6 = 1,33 7 |--------- 9 4 8 4/8 = 0,50 9 |--------- 11 2 10 2/10 = 0,20 total 20 4,03 Resp: 20 / 4,03 = 4,96 OBS: A média harmônica não aceita valores iguais a zero como dados de uma série. • A igualdade g = h.= ....só ocorrerá quando todos os valores da série forem iguais. OBS: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a seguinte relação: g = (.+ h ) /.2 • Demonstraremos a relação acima com os seguintes dados: z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 } Média aritmética = 51,3 / 5 = 10,2600 Média geométrica= = 10,2587 Média harmônica = 5 / 0,4874508 = 10,2574 Comprovando a relação: 10,2600 + 10,2574 / 2 = 10,2587 = média geométrica . MODA - Mo F 0 E 8 É o valor que ocorre com maior freqüência em uma série de valores. • Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum, isto é, o salário recebido pelo maior número de empregados dessa fábrica. . A Moda quando os dados não estão agrupados F 0E 8 PAGE 1 • A moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete. Ex: Na série { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda é igual a 10. • Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Ex: { 3 , 5 , 8 , 10 , 12 } não apresenta moda. A série é amodal. • .Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. A série é bimodal. . A Moda quando os dados estão agrupados F 0E 8 a) Sem intervalos de classe: Uma vez agrupados os dados, é possível determinar imediatamente a moda: basta fixar o valor da variável de maior freqüência. Ex: Qual a temperatura mais comum medida no mês abaixo: Temperaturas Freqüência 0º C 3 1º C 9 2º C 12 3º C 6 Resp: 2º C é a temperatura modal, pois é a de maior freqüência. . b) Com intervalos de classe: A classe que apresenta a maior freqüência é denominada classe modal. Pela definição, podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Mo = ( l* + L* ) / 2 onde l* = limite inferior da classe modal e L* = limite superior da classe modal. Ex: Calcule a estatura modal conforme a tabela abaixo. PAGE 1 Classes (em cm) Freqüência 54 |------------ 58 9 58 |------------ 62 11 62 |------------ 66 8 66 |------------ 70 5 Resposta: a classe modal é 58|-------- 62, pois é a de maior freqüência. l* = 58 e L* = 62 Mo = (58+62) / 2 = 60 cm ( este valor é estimado, pois não conhecemos o valor real da moda). . Método mais elaborado pela fórmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h* l* = limite inferior da classe modal..... e..... L* = limite superior da classe modal d1 = freqüência da classe modal - freqüência da classe anterior à da classe modal d2 = freqüência da classe modal - freqüência da classe posterior à da classe modal h* = amplitude da classe modal Mo = 58 + ((11-9) / ((11-9) + (11 – 8)) x 4 F 0E 8 Mo = 59,6 Obs: A moda é utilizada quando desejamos obter uma medida rápida e aproximada de posição ou quando a medida de posição deva ser o valor mais típico da distribuição. Já a média aritmética é a medida de posição que possui a maior estabilidade. MEDIANA - Md F 0 E 8 A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescente ou decrescente), é o valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de elementos. . A mediana em dados não-agrupados F 0E 8 Dada uma série de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 } De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9. . PAGE 1 • Aplicando fórmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4º termo + 5º termo) / 2 = (15 + 16) / 2 = 15,5 b) Com intervalos de classe: Devemos seguir os seguintes passos: 1º) Determinamos as freqüências acumuladas ; 2º) Calculamos ; 3º) Marcamos a classe correspondente à freqüência acumulada imediatamente superior à . Tal classe será a classe mediana ; 4º) Calculamos a Mediana pela seguinte fórmula:. M Md = l* + [(- FAA ) x h*] / f* l* = é o limite inferior da classe mediana. FAA = é a freqüência acumulada da classe anterior à classe mediana. f* = é a freqüência simples da classe mediana. h* = é a amplitude do intervalo da classe mediana. Ex: classes freqüência = fi Freqüência acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 = 40 / 2 =.20........... logo.a classe mediana será 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 OBS: Esta mediana é estimada, pois não temos os 40 valores da distribuição. Emprego da Mediana • Quando desejamos obter o ponto que divide a distribuição em duas partes iguais. • Quando há valores extremos que afetam de maneira acentuada a média aritmética. • Quando a variável em estudo é salário. PAGE 1 SEPARATRIZES F 0 E 8 Além das medidas de posição que estudamos, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua característica de separar a série em duas partes que apresentam o mesmo número de valores. Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes. . QUARTIS - Q F 0 E 8 Denominamos quartis os valores de uma série que a dividem em quatro partes iguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro partes iguais. Obs: O quartil 2 ( Q2 ) sempre será igual a mediana da série. Quartis em dados não agrupados F 0E 8 F 0 E 8 O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na realidade serão calculadas " 3 medianas " em uma mesma série. Ex 1: Calcule os quartis da série: { 5, 2, 6, 9, 10, 13, 15 } - O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 } - O valor que divide a série acima em duas partes iguais é igual a 9, logo a Md = 9 que será = Q2 = 9 - Temos agora {2, 5, 6 } e {10, 13, 15 } como sendo os dois grupos de valores iguais proporcionados pela mediana ( quartil 2 ). Para o cálculo do quartil 1 e 3 basta calcular as medianas das partes iguais provenientes da verdadeira Mediana da série (quartil 2). Logo em { 2, 5, 6 } a mediana é = 5 . Ou seja: será o quartil 1 = Q1 = 5 em {10, 13, 15 } a mediana é =13 . Ou seja: será o quartil 3 = Q = 13 Ex 2: Calcule os quartis da série: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 } • A série já está ordenada, então calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5 • - O quartil 1 será a mediana da série à esquerda de Md : { 1, 1, 2, 3, 5, 5 } Q1 = (2+3)/2 = 2,5 PAGE 1 - O quartil 3 será a mediana da série à direita de Md : {6, 7, 9, 9, 10, 13 } Q3 = (9+9)/2 = 9 Quartis para dados agrupados em classes F 0E 8 F 0 E 8 Usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, E fi / 2 .... por ... k . E fi / 4 ... sendo k o número de ordem do quartil. Assim, temos: Q1 = . l* + [(E fi / 4 - FAA ) x h*] / f* Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* Q3 = . l* + [(3.E fi / 4 - FAA ) x h*] / f* Ex 3 - Calcule os quartis da tabela abaixo: classes freqüência = fi Freqüência acumulada 50 |------------ 54 4 4 54 |------------ 58 9 13 58 |------------ 62 11 24 62 |------------ 66 8 32 66 |------------ 70 5 37 70 |------------ 74 3 40 total 40 - O quartil 2 = Md , logo: = 40 / 2 =.20........... logo.a classe mediana será 58 |---------- 62 l* = 58........... FAA = 13........... f* = 11........... h* = 4 Q2 = . l* + [(2.E fi / 4 - FAA ) x h*] / f* - Substituindo esses valores na fórmula, obtemos: Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2 - O quartil 1 : E fi / 4 = 10 PAGE 1 4. MEDIDAS DE DISPERSÃO ABSOLUTA Amplitude total: É a única medida de dispersão que não tem na média o ponto de referência. • Quando os dados não estão agrupados a amplitude total é a diferença entrE o maior e o menor valor observado: AT = X máximo - X mínimo. Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total será: AT = 70 - 40 = 30 Quando os dados estão agrupados sem intervalos de classe ainda temos : AT = X máximo - X mínimo. Ex: PAGE 1 xi fi 0 2 1 6 3 5 4 3 • AT = 4 - 0 = 4 * Com intervalos de classe a amplitude total é a diferença entre o limite superior da última classe e o limite inferior da primeira classe. Então: AT = L máximo - l mínimo Ex: Classes fi 4 |------------- 6 6 6 |------------- 8 2 8 |------------- 10 3 • AT = 10 - 4 = 6 • A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude total quando se quer determinar a amplitude da temperatura em um dia, no controle de qualidade ou como uma medida de cálculo rápido sem muita exatidão. Desvio quartil: Também chamado de amplitude semi-interquatílica e é baseada nos quartis. Símbolo: Dq e a Fórmula: Dq = (Q3 - Q1) / 2 Observações: 1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fácil de calcular e de interpretar. Além do mais, não é afetado pelos valores extremos, grandes ou pequenos, sendo recomendado, por conseguinte, quando entre os dados figurem valores extremos que não se consideram representativos. 2- O desvio quartil deverá ser usado preferencialmente quando a medida de tendência central for a mediana. 3- Trata-se de uma medida insensível ã distribuição dos itens menores que Q1, entre Q1 e Q3 e maiores que Q3. Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil será: Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75 PAGE 1 Desvio médio absoluto - Dm Para dados brutos: É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das seguintes medidas de tendência central: média ou mediana. • para a Média = Dm = E | Xi - | / n • para a Mediana = Dm = E | Xi - Md | / n • As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal dos desvios. Ex: Calcular o desvio médio do conjunto de números { - 4 , - 3 , - 2 , 3 , 5 } = - 0, 2 e Md = - 2 Tabela auxiliar para cálculo do desvio médio Xi Xi - | Xi - | Xi - Md | Xi - Md | - 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2 - 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1 - 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 0 3 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 5 5 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7 E = 16,8 E = 15 Pela Média : Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3 PAGE 1 • Para contornar essas dificuldades e limitações, podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada de CVP: Coeficiente de Variação de Pearson (é a razão entre o desvio padRão e a média referentes a dados de uma mesma série). CVP = (S / ) x 100 • o resultado neste caso é expresso em percentual, entretanto pode ser expresso também através de um fator decimal, desprezando assim o valor 100 da fórmula. Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo de indivíduos: Discriminação M É D I A DESVIO PADRÃO ESTATURAS 175 cm 5,0 cm PESOS 68 kg 2,0 kg - Qual das medidas (Estatura ou Peso) possui maior homogeneidade ? Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultado menor será o de maior homogeneidade ( menor dispersão ou variabilidade). CVP estatura = ( 5 / 175 ) x 100 = 2,85 % CVP peso = ( 2 / 68 ) x 100 = 2,94 %. Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos. Coeficiente de Variação de Thorndike - CVT • É igual ao quociente entre o desvio padrão e a mediana. CVT = ( S / Md ) x 100 % Coeficiente Quartílico de Variação - CVQ • Esse coeficiente é definido pela seguinte expressão: PAGE 1 CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %. Desvio quartil Reduzido – Dqr Dqr = [(Q3 - Q1) / 2Md ] x 100 %. 5. MEDIDAS DE ASSIMETRIA Introdução: • Uma distribuição com classes é simétrica quando : Média = Mediana = Moda F 0 E 8 Uma distribuição com classes é : Assimétrica à esquerda ou negativa quando : Média < Mediana < Moda Assimétrica à direita ou positiva quando : Média > Mediana > Moda Coeficiente de assimetria: A medida anterior, por ser absoluta, apresenta a mesma deficiência do desvio padrão, isto é, não permite a possibilidade de comparação entre as medidas de duas distribuições. Por esse motivo, daremos preferência ao coeficiente de assimetria de Person: As = 3 ( Média - Mediana ) / Desvio Padrão Escalas de assimetria: | AS | < 0,15 F 0E 8 assimetria pequena 0,15 < | AS | < 1 F 0E 8 assimetria moderada | AS | > 1 F 0E 8 assimetria elevada PAGE 1 Obs: Suponhamos AS = - 0,49 F 0E 8 a assimetria é considerada moderada e negativa Suponhamos AS = 0,75 F 0E 8 a assimetria é considerada moderada e positiva MEDIDAS DE CURTOSE Introdução: • Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal (curva correspondente a uma distribuição teórica de probabilidade). • Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome de leptocúrtica. • Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais achatada em sua parte superior), ela recebe o nome de platicúrtica. F 0 E 8 A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica. Coeficiente de curtose C1 = (Q3 - Q1) / 2(P90 - P10) • Este coeficiente é conhecido como percentílico de curtose. • Relativamente a curva normal, temos: C1 = 0,263 F 0E 8 curva mesocúrtica C1 < 0,263 F 0E 8 curva leptocúrtica C1 > 0,263 F 0E 8 curva platicúrtica • O coeficiente abaixo ( C2 )será utilizado em nossas análises: PAGE 1
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved