Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Bioestatística: uma análise estatística descritiva, Notas de estudo de Enfermagem

BIOESTATÍSTICA

Tipologia: Notas de estudo

2010

Compartilhado em 21/08/2010

gerson-souza-santos-7
gerson-souza-santos-7 🇧🇷

4.8

(351)

772 documentos

1 / 60

Documentos relacionados


Pré-visualização parcial do texto

Baixe Bioestatística: uma análise estatística descritiva e outras Notas de estudo em PDF para Enfermagem, somente na Docsity! BIOESTATÍSTICA • Aula 2 – Análise Estatística Descritiva • Medidas de tendência central: Média, moda e mediana BIOESTATÍSTICA • Dentre as medidas resumo habitualmente apresentadas na análise estatística descritiva, as medidas do centro de uma distribuição ou tendência central são muito importantes. As mais utilizadas são: • Média (aritmética): Soma dos valores dividida pelo número de observações. BIOESTATÍSTICA • Pode-se, no entanto, calcular a média de variáveis numéricas discretas, inclusive com decimal (o conceito de que não se poderia calcular média para variáveis discretas foi muito difundido no passado, mas hoje é considerado ultrapassado). • Assim, pode-se dizer que a média de filhos por mulher no Estado de São Paulo em 1999 era 2,38 (embora nenhuma mulher tenha 0,38 filho). BIOESTATÍSTICA • Qual a vantagem de descrever a média de variáveis numéricas discretas com decimais? Por exemplo, um demógrafo pode constatar que a média de filhos das famílias brasileiras caiu de 2,6 para 2,1. • Se não fossem utilizadas as casas decimais, poder-se-ia concluir que o número médio de filhos da família brasileira manteve-se estável em 2! BIOESTATÍSTICA • Moda: Valor mais freqüentemente observado. • Quando alguém pergunta: Qual a cor da moda neste verão? A resposta pode ser obtida observando-se qual a cor das roupas da maioria das pessoas. Uma distribuição pode apresentar mais de uma moda, quando existem, por exemplo, duas categorias ou valores igualmente mais freqüentes (distribuição bimodal). BIOESTATÍSTICA • Média e mediana são parâmetros aplicáveis apenas para variáveis • numéricas (tanto discretas como contínuas). A moda pode ser identificada tanto para variáveis numéricas quanto para categóricas. BIOESTATÍSTICA • A média não é uma medida resistente do centro da distribuição, sendo muito afetada por valores discrepantes (outliers). A mediana é mais resistente. • Quando a distribuição é simétrica, média, moda e mediana são equivalentes. • Quando existe assimetria, no entanto, média e mediana desviam-se na direção dos valores extremos. BIOESTATÍSTICA - E impossivel calcular média de variaveis categóricas, embora seja possivel determinar a média de variáveis numéricas discretas. - Para decidir se vamos utilizar como medida de tendência central a média ou a mediana, devemos primeiro analisar se a distribuição da variável numérica é simétrica, - Se a distribuição for simétrica, geralmente utiliza-se a média, pois é uma medida mais facil de ser compreendida. - A mediana deve ser descrita para distribuições assimétricas, pois é uma medida de tendência central menos afetada por valores discrepantes (outliers). BIOESTATÍSTICA • Quartis e percentis Quartis são valores que dividem a amostra em quatro partes: - Primeiro quartil: valor abaixo do qual encontram-se 25% das observações. - Segundo quartil (mediana): valor abaixo do qual encontram-se 50% das observações. - Terceiro quartil: valor abaixo do qual encontram-se 75% das observações. BIOESTATÍSTICA • Os percentis dividem a amostra em 100 partes. • O percentil 95, por exemplo, é o valor abaixo do qual encontram-se 95% das observações. BIOESTATÍSTICA • Medidas de variabilidade: amplitude, variância, desvio padrão e coeficiente de variação. BIOESTATÍSTICA • Variância e Desvio Padrão: São medidas de variabilidade individual, ou seja, indicam como os valores variam de um indivíduo para outro, através do afastamento dos valores em relação à média. BIOESTATÍSTICA • A seguir temos as fórmulas da variância e do desvio padrão: BIOESTATÍSTICA • Vamos agora procurar entender estas fórmulas, que podem parecer assustadoras a princípio. Primeiro vamos identificar cada um dos símbolos: • Σ : somatória • X: o valor de cada uma das observações _ • X : a média da amostra • n: o número de observações (tamanho da amostra) BIOESTATÍSTICA • Finalmente, extraímos a raiz quadrada para voltar à escala original (pois havíamos elevado as diferenças ao quadrado). BIOESTATÍSTICA • Coeficiente de Variação: Medida de variabilidade dos valores individuais em torno da média amostral, calculada dividindo-se o desvio padrão pela média. BIOESTATÍSTICA e Erro padrão e erro amostral. Medidas Resumo Ee jo STE Medidas de tendência central Outras medidas Medidas de variabilidade individual Medidas de variabilidade amostral Erro padrão Erro amostral Tabelas Gráficos BIOESTATÍSTICA • Pode-se perceber que quanto maior a amostra, menor o erro padrão. • Erro Amostral: Medida de afastamento da média amostral em relação à média real da população, associada sempre a uma confiança (O conceito de confiança será discutido mais adiante). BIOESTATÍSTICA Desvio Padrão Para 95% de confiança, erro amostral = 1,96 x Vo h BIOESTATÍSTICA • Vamos ver um exemplo: Foram medidos os pesos de 1200 recém- nascidos em uma maternidade. • Os dados foram analisados em um programa de computador (vide a seguir representação impressa), que apresentou os seguintes resultados: BIOESTATÍSTICA • Foi referido o intervalo de confiança de 95 % para a média, que é calculado a partir do erro amostral, representando também uma medida de afastamento da média amostral em relação à média real da população, associada sempre a uma confiança. • A interpretação é que temos confiança de 95% de que a média real da população encontra-se dentro dos limites do intervalo, ou seja, a probabilidade da média real ser menor que 3276,0 gramas ou maior que 3342,6 gramas é de apenas 5%. • O limite inferior do intervalo de confiança para a média é calculado através da média menos o erro amostral e o limite superior pela média somada ao erro amostral. BIOESTATÍSTICA • Intervalo de confiança de 95% para a média = média ± erro amostral BIOESTATÍSTICA • Podemos concluir a partir destas medidas- resumo que: • - a distribuição é simétrica (pois a média e a mediana são praticamente iguais); • - a variabilidade é pequena (pois o desvio padrão é 18% do valor da média); • - 75% dos bebês pesam mais de 2.908,0 g (primeiro quartil). • - 75% dos bebês pesam menos de 3.704,5 g (terceiro quartil). • - a margem de erro da média calculada é pequena (pois a amostra é grande); • - o intervalo de confiança de 95% para a média é pequeno (pois a amostra é grande). BIOESTATÍSTICA - As tabelas são compostas de linha e colunas, incluindo sempre uma barra de título e a descrição dos resultados. - Ao final, podem conter uma barra com o total ou a média. - As bordas das tabelas devem conter apenas traços horizontais acima e abaixo da primeira linha e da última, quando esta contiver total ou média. BIOESTATÍSTICA - Quando a última linha não contiver total ou média, deverá ter apenas uma linha horizontal ao final. - Nunca incluir traços verticais. BIOESTATÍSTICA e Exemplos de Tabelas: Tabela 1: Altura, medida em centimetros, de 10 homens adultos Indivíduo Altura em cm 1 177 163 180 165 177 175 176 168 169 167 Escalas BIOESTATÍSTICA Exemplo de uma tabela de contingência 2 X 2: Tabela 3: Associação entre tabagismo e incidência de cancer de pulmão Doente São Total Fumantes 14 97 lil Não fumantes 2 137 139 Total 16 234 250 BIOESTATÍSTICA e Gráficos Medidas de tendência central Medidas Outras medidas Resumo Medidas de variabilidade individual Medidas de variabilidade amostral Tabelas Histograma Gráficos Boxplot - Do tipo pizza De barras BIOESTATÍSTICA • Os gráficos facilitam muito a compreensão dos resultados. • Os principais gráficos utilizados para variáveis numéricas são os histogramas e gráficos do tipo boxplot (também chamados de box- and-whisker plots). BIOESTATÍSTICA • Analisando o histograma, podemos confirmar que a distribuição é simétrica (a maioria dos valores encontram -se no centro). BIOESTATÍSTICA • Foi construído também um gráfico do tipo boxplot. • Este segundo gráfico também mostra que a distribuição é simétrica, pois a "caixa" do gráfico formada pelo primeiro quartil, mediana e terceiro quartil é simétrica. • O asterisco dentro da caixa identifica a média. Os asteriscos nas extremidades representam os valores que são muito discrepantes (outliers), como podemos ver no modelo a seguir: BIOESTATÍSTICA Gráfico do tipo "boxplot" do peso de 1200 bebês Ê sa a Ê Peso dos bebês (gramas) i E BIOESTATÍSTICA • 1. Calcula a amplitude interquartis (terceiro quartil - primeiro quartil) • 2. Calcula o limite inferior do boxplot através da fórmula: • [primeiro quartil - (1,5 X amplitude interquartis)] • 3. Calcula o limite superior do boxplot através da fórmula: • [terceiro quartil + (1,5 X amplitude interquartis)] • 4. Os valores abaixo do limite inferior ou acima do limite superior são considerados outliers. BIOESTATÍSTICA O que fazer com outliers? • A primeira reação de muitos pesquisadores é desprezar os valores discrepantes. No entanto, isto não é correto. Inicialmente, deve-se verificar se não houve erro de digitação. • Em segundo lugar, analisar se não ocorreu erro na mensuração da variável. • Finalmente, se o valor extremo está correto, deve-se avaliar se aquele indivíduo apresenta alguma condição que o caracterize como os diferentes dos demais. Caso contrário, o valor não deve ser desprezado. BIOESTATÍSTICA • Se quisermos apresentar os resultados da variável sexo dos recém-nascidos (categórica nominal), podemos fazer um gráfico de pizza:
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved