Estatística básica

Estatística básica

(Parte 1 de 7)

Apostila I Estatística Básica

Alexandre Diniz

1.0 INTRODUÇÃO À ESTATÍSTICA

1.1 Conceitos básicos:

• Método Na Grécia antiga, methodos, significava caminho para se chegar a um fim.

Método – é o conjunto de etapas, ordenadamente dispostas, a serem vencidas: . na investigação da verdade; . no estudo de uma ciência; . ou para alcançar um determinado fim.

• Técnica Modo de fazer de forma mais hábil, mais segura e mais perfeita algum tipo de atividade, arte ou ofício.

Conhecer é estabelecer uma relação entre a pessoa que conhece e o objeto que passa a ser conhecido. No processo do conhecimento, o sujeito se apropria do objeto – processando-o mentalmente

Conhecer = transformar o objeto em conceito, reconstituindo-lhe em sua mente (semiótica).

Tipos de conhecimento: . vulgar ou empírico; . filosófico; . teológico/dogmático; . científico.

Dois métodos de raciocínio científico: indução e dedução.

. Vai do particular para o geral; . vai dos fatos para as idéias; . vai das observações para as generalizações.

. O raciocínio dedutivo parte do geral para chegar ao particular; . do universal para chegar ao singular; . das idéias para os fatos; . das generalizações para a observação.

• Estatística

Originalmente – coleção de informações de interesse para o estado sobre a população e economia.

As palavras estatística e estado têm a mesma origem latina: status. Desenvolveu para tornar-se um método de análise muito utilizado nas ciências sociais e naturais.

• População Coleção de todas as observações potenciais sobre um determinado fenômeno.

• Amostra Conjunto de dados efetivamente observados ou extraídos de uma população. Sobre os dados da amostra se desenvolvem os estudos, visando a fazer inferências sobre a população.

• Amostragem

. Processo de escolha da amostra; . parte inicial de qualquer estudo estatístico; . consiste na escolha criteriosa de elementos a serem submetidos ao estudo, para que os resultados sejam representativos, toma-se o cuidado de entrevistar um conjunto de pessoas com características sócio-econômicas, culturais, religiosas etc. tão próximas quanto possível da população.

A escolha da amostra, construção dos instrumentos, entrevistas, codificação dos dados e apuração dos resultados são etapas deste tipo de pesquisa.

1.2 Grandes áreas da estatística:

. Amostragem e planejamento de experimentos = coleta de dados. . Estatística descritiva = organização, apresentação e sintetização de dados. . Estatística inferencial = o conjunto de métodos para tomada de decisões, nas situações onde existem incerteza e variação.

• Inferência . A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferência estatística. . Tais decisões sempre envolvem um grau de incerteza (probabilidade de erro). . A inferência é feita com base em um modelo estatístico.

• Probabilidade . Impossível fazer inferências estatísticas sem utilizar alguns resultados da teoria de probabilidades. . Embora intimamente associada à estatística, tem suas características próprias.

. Busca quantificar a incerteza existente em determinada situação.

1.3 Escalas de mensuração:

• Mensuração Atribuição de um número a qualidades de um objeto ou fenômeno segundo regras definidas. O processo de atribuição de números a qualidades de objetos, forma a escala de mensuração ou escala de medida.

• Variáveis Características das unidades de análise.

• Unidades de análise Base da análise. Elementos nos quais se tem interesse.

• Tipos de variáveis Quatro maneiras básicas, ou níveis básicos, de mensuração (quatro tipos de variáveis): 1. nominal 2. ordinal 3. intervalar 4. razão

Importante definir os níveis de mensuração para as variáveis, porque as técnicas de análise estatística que podem ser utilizadas dependem da escala de mensuração.

• Escala nominal

O nível mais simples das escalas de medida; sistema simples de classificação; utilizada para classificar objetos ou fenômenos em termos de igualdade dos seus atributos e numerá-los; Recurso para se classificar e rotular ou dar nomes a objetos.

O caso mais simples é formado pela divisão em duas classes que são identificadas com os números zero ou um - variável binária (0,1). Cada observação na mensuração nominal pertence a uma só classe muito freqüente na análise geográfica; Indica a presença ou não de determinada característica.

Ex: Municípios dentro e fora da área de atuação da SUDENE.

Características . classes são mutuamente excludentes; . operações aritméticas não podem ser aplicadas (adição e multiplicação); . contagem simples é possível; . pode-se levantar a classe modal (mais freqüente); . a freqüência de cada classe pode ser expressa como porcentagem do número total.

• Escala ordinal

Utilizada quando os fenômenos ou observações podem ser arranjados segundo uma ordenação (grandeza, preferência, importância, distância, etc..).

Ex: expressões qualitativas arranjadas segundo uma ordem: . hierarquia dos níveis educacionais: primeiro, segundo e terceiro graus; . níveis de renda: renda baixa, media e alta; . hierarquia urbana; . padrão de habitação; . preferência locacional; . escala de dureza dos minerais.

Possível quando se desenvolve uma seqüência qualitativa na qual é lógico colocar um fato antes do outro. . Não deve fazer operações aritméticas

Ex: classificação de hotéis em níveis hierárquicos. Não se pode dizer que um hotel quatro estrelas é duas vezes melhor do que um hotel duas estrelas. Sabe-se que os quatro estrelas são melhores, mão não existe meios de se quantificar esta diferença na escala ordinal.

• Características: . É possível calcular a freqüência de cada classe, para indicar a classe modal; . Classes são mutuamente excludente; . Pode-se calcular coeficientes de correlação - Spearman e Kendall (estatística não paramétrica).

• Escala intervalar

Características: . Tem todas as características de uma escala ordinal, porém os intervalos entre os valores são conhecidos exatamente e assim cada observação pode receber um valor numérico preciso.

. A extensão de cada intervalo sucessivo é constante: i.e. numeração dos anos, variações de altitude através de curvas de nível e escalas de temperatura;

. O ponto zero de uma escala de intervalo é arbitrário e não indica ausência da característica medida.

. A falta de zero absoluto é uma desvantagem, pois não é possível afirmar que uma temperatura de 20 ºC é duas vezes mais quente do que uma de 10 ºC.

. Adapta-se a todas as operações aritméticas usuais, desde que seja mantida a ordem dos objetos e as diferenças relativas entre elas.

. A média e o desvio padrão podem ser calculados.

(Parte 1 de 7)

Comentários