Uso do Sisvar na Análise de Experimentos

Uso do Sisvar na Análise de Experimentos

(Parte 1 de 8)

Curso Básico de Estatística Experimental

Uso do SISVAR na Análise de Experimentos

Roberta Bessa Veloso Silva Doutoranda em Estatística e Experimentação Agropecuária

Patos de Minas, MG Agosto de 2007

1. INTRODUÇÃO01
2. CONCEITOS BÁSICOS01
2.1 PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO02
2.1.1 REPETIÇÃO02
2.1.2 CASUALIZAÇÃO03
2.1.3 CONTROLE LOCAL03
3. PRESSUPOSIÇÕES DA ANÁLISE DE VARIÂNCIA03
3.1ADITIVIDADE03
3.2 INDEPENDÊNCIA03
3.3 NORMALIDADE03
3.4 HOMOGENEIDADE DE VARIÂNCIAS03
4. ARQUIVO DE DADOS04
5. DELINEAMENTO INTEIRAMENTE CASUALIZADO04
6. ALGUMAS CONSIDERAÇÕES SOBRE A ESCOLHA DO TESTE ADEQUADO13
6.1 PRINCIPAIS TESTES DE COMPARAÇÃO DE MÉDIAS14
7. DELINEAMENTO EM BLOCOS CASUALIZADOS16
8. DELINEAMENTO EM QUADRADO LATINO24
9. REGRESSÃO NA ANÁLISE DE VARIÂNCIA29
10. EXPERIMENTOS FATORIAIS36
1. EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS45
12. REFERÊNCIAS BIBLIOGRÁFICAS58

1. INTRODUÇÃO Nas últimas décadas, os cálculos estatísticos foram muito facilitados pelo uso de aplicativos computacionais. Isso permitiu que métodos complexos e demorados fossem rotineiramente aplicados. Entretanto, muitos pesquisadores substituíram esses aplicativos por uma consulta a um profissional da área de estatística. O que se observa hoje são análises de experimentos mal realizadas e resultados erroneamente interpretados. Tal fato justifica a participação de um técnico com conhecimento em técnicas experimentais e métodos quantitativos em todas as fases do experimento, desde o planejamento, condução, coleta de dados, até a fase de análise dos dados e interpretação dos resultados.

Diversos pacotes estatísticos para análise de experimentos estão disponíveis, podendo-se citar programas como o SAS – Statistical Analysis System – (Sas Institute Inc., 2000), que é, em geral, um dos programas mais utilizados em todo o mundo para análise de dados da área agronômica, biológica e social, o STATGRAPHICS – Statistical Graphics System – (Statgraphics, 1999), o STATISTICA for Windows (Statistica, 2002), dentre outros. Podem-se encontrar programas nacionais em que o leitor poderá ter acesso com maior facilidade, dentre eles: o SANEST – Sistema de Análise Estatística para Microcomputadores – da Universidade Federal de Pelotas (Zonta & Machado, 1991); o SISVAR – Sistema de Análise de Variância – da Universidade Federal de Lavras (Ferreira, 2000a); o SAEG – Sistema para Análises Estatísticas (Ribeiro Júnior, 2001) e o GENES – Aplicativo computacional em Genética e Estatística (Cruz, 2001), ambos da Universidade Federal de Viçosa.

Este curso tem por objetivo apresentar alguns sistemas computacionais com aplicações diversas na análise estatística de experimentos com destaque ao SISVAR, pela facilidade de acesso e utilização.

2. CONCEITOS BÁSICOS Esse item tem por objetivo apresentar alguns conceitos básicos necessários a uma eficiente utilização dos programas estatísticos a serem vistos no curso. Maiores detalhes poder ser vistos em Banzatto & Kronka (1995), Ferreira (2000b), Pimentel Gomes (2000) e Pimentel Gomes e Garcia (2002).

a) Experimentação: é uma atividade que tem por objetivo estudar os experimentos, ou seja, seu planejamento, condução, coleta e análise dos dados e interpretação dos resultados.

b) Experimentador: é o indivíduo responsável pela condução dos experimentos com a maior precisão possível. c) Estatística: Conjunto de técnicas que se ocupam com a coleta, organização, análise e interpretação de dados, tendo um modelo por referência. d) Estatístico: é o indivíduo especialista em estatística experimental. Contribui com os pesquisadores na tomada de decisão nas diversas fases dos experimentos. e) Experimento: é um trabalho planejado, que segue determinados princípios básicos, com o objetivo de se fazer comparações dos efeitos dos tratamentos. f) Tratamento: é a condição imposta à parcela experimental, cujo efeito deseja-se medir ou comparar em um experimento. g) Parcela experimental: é a menor unidade de um experimento em que se aplica o tratamento ou a combinação deste. Denomina-se de parcela útil a unidade na qual os tratamento são avaliados e onde são coletadas as variáveis respostas. h) Bordadura: é uma área de proteção utilizada para evitar que uma parcela seja afetada pelo tratamento da parcela vizinha. i) Delineamento experimental: é a forma de distribuição dos tratamentos na área experimental. Os principais delineamentos experimentais utilizados são: inteiramente casualizado, blocos casualizados e quadrado latino. j) Esquemas experimentais: são formas de arranjos dos tratamentos nos experimentos em que são estudados, ao mesmo tempo, os efeitos de dois ou mais tipos de tratamentos ou fatores. Os principais esquemas experimentais são fatorial, parcela subdividida e experimentos em faixa. k) Análise de variância: é uma técnica que permite decompor a variação total observada nos dados experimentais em causas conhecidas e não conhecidas. l) Erro experimental: variação devida ao efeito dos fatores não controlados ou que ocorre ao acaso, de forma aleatória. Ramalho et al. (2000) definem o erro experimental como as variações aleatórias entre parcelas que receberam o mesmo tratamento.

2.1 PRINCÍPIOS BÁSICOS DA EXPERIMENTAÇÃO

São princípios que devem ser atendidos para que um experimento forneça dados que possam ser analisados através de procedimentos estatísticos. Os princípios básicos da experimentação são: repetição, casualização e controle local. 2.1.1 Repetição: consiste no número de vezes em que o tratamento aparece no experimento. Tem por finalidade permitir a obtenção da estimativa do erro experimental, aumentar a precisão das estimativas e aumentar o poder dos testes estatísticos. 2.1.2 Casualização: consiste em propiciar aos tratamentos a mesma probabilidade de serem designados a qualquer uma das parcelas experimentais. Têm por finalidade dar validade às estimativas calculadas com os dados observados e aos testes de hipóteses realizados. 2.1.3 Controle local: sua função é diminuir o erro experimental. É usado quando uma área experimental é heterogênea. Tem por finalidade dividir uma área heterogênea em áreas menores e homogêneas, chamadas de blocos.

3. PRESSUPOSIÇÕES DA ANÁLISE DE VARIÂNCIA Para a realização de uma análise de variância devem-se aceitar algumas pressuposições básicas: 3.1 Aditividade: os efeitos de tratamento e erro devem ser aditivos; 3.2 Independência: os erros devem ser independentes, ou seja, a probabilidade de que o erro de uma observação qualquer tenha um determinado valor não deve depender dos valores dos outros erros; 3.3 Normalidade: os erros devem ser normalmente distribuídos; 3.4 Homogeneidade: os erros devem apresentar variâncias comuns (homogeneidade=homocedasticidade de variâncias).

Estas pressuposições visam facilitar a interpretação dos resultados e testar a significância nos testes de hipóteses. Na prática, o que pode ocorrer é a validade aproximada e não exata de alguma (s) dessas pressuposições; nesse caso, o pesquisador não perderia tanto com a aproximação visto que os testes aplicados na análise de variância são robustos quanto a isso. A homogeneidade de variância é que, na maioria das vezes, é necessária pois, caso não seja verificada, o teste F e de comparações múltiplas poderão ser alterados.

Quanto alguma (s) das pressuposições da análise não se verificam (m), existem alternativas que podem ser usadas, entre elas a transformação de dados com a posterior análise de variância destes dados transformados ou a utilização dos recursos da estatística não paramétrica.

Feitas as considerações iniciais necessárias para o entendimento dos próximos assuntos, iniciaremos agora os conceitos e exemplos dos delineamentos mais usuais.

4. ARQUIVO DE DADOS O Microsoft Excel, além de ser uma planilha eletrônica que possui poderosos recursos, apresenta alta compatibilidade com os principais programas estatísticos. Além disso, tem a grande vantagem de facilidade de acesso e de interação com o usuário. Independente de se utilizar o SAS ou o SISVAR, as planilhas com os dados dos experimentos a serem analisados, serão feitas utilizando-se o Excel.

Na Tabela 3 está apresentado um exemplo de planilha criada utilizando-se o Excel.

Observe que nas colunas são especificados os tratamentos, blocos e variáveis a serem analisadas, e nas linhas estão às observações referentes às parcelas experimentais. Devemos utilizar sempre o ponto (.) ao invés da vírgula (,) como separador decimal. Se o tratamento for qualitativo devemos codificá-los por meio das letras (A, B, C,...), caso seja quantitativo, devemos informar as quantidades estudadas.

5. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

No delineamento inteiramente casualizado é necessário a completa homogeneidade das condições ambientais e do material experimental (como por exemplo, quanto à fertilidade do solo, distribuição uniforme de água, etc) sendo os tratamentos distribuídos nas parcelas de forma inteiramente casual (aleatória). O DIC possui apenas os princípios da casualização e da repetição, não possuindo controle local e, portanto, as repetições não são organizadas em blocos.

• Possui grande flexibilidade quanto ao número de tratamentos e repetições, sendo dependente, entretanto, da quantidade de material e área experimental disponíveis;

• Pode-se ter DIC não balanceado, ou seja, com números de repetições diferentes entre tratamentos, o que leva a grandes alterações na análise de variância; mas os testes de comparações múltiplas passam a ser aproximados e não mais exatos. O ideal é que os tratamentos sejam igualmente repetidos;

• Considerando o mesmo número de parcelas e tratamentos avaliados, é o delineamento que possibilita o maior grau de liberdade do erro.

• Exige homogeneidade das condições experimentais. Se as condições não forem uniformes, como se esperava antes da instalação do experimento, toda variação (exceto a devida a tratamentos) irá para o erro, aumentando sua estimativa e reduzindo, portanto, a precisão do experimento. O modelo estatístico para o delineamento inteiramente casualizado é dado por:

ijiijyeµα=++ em que:

ijy é o valor observado na parcela experimental que recebeu o i-ésimo tratamento µ representa uma constante geral associada e esta variável aleatória iα é o efeito do tratamento i ()1,2,...,it=; ijε é o erro experimental associado a observação ijy, suposto ter distribuição normal com média zero e variância comum.

Na Tabela 1 é apresentado o esquema da análise de variância para os experimentos instalados no delineamento inteiramente casualizado.

Tabela 1. Esquema da análise de variância para experimentos instalados no delineamento inteiramente casualizado.

Tratamento 1t− SQ Trat QM Trat QM Trat / QM Erro

Erro ()1tr− SQ Erro QM Erro

Total 1tr− SQ Total

Um exemplo de um experimento em que serão avaliadas 5 tratamentos (T1, T2, T3,

T4 e T5), instalado no delineamento inteiramente casualizado, com 4 repetições (R1, R2, R3 e R4), é apresentado a seguir:

T4 R3 T1 R2 T2 R3 T4 R1 T3 R2

T1 R3 T2 R4 T5 R1 T5 R3 T2 R1

T4 R2 T3 R1 T3 R4 T3 R3 T4 R4 T5 R4 T1 R4 T2 R2 T5 R2 T1 R1

Observa-se que não há qualquer restrição à casualização, podendo um determinado tratamento ocupar qualquer posição na área experimental.

Para exemplificar, será utilizado parte dos dados obtidos por uma empresa que avalia famílias de Eucaliptos camaldulensis. Os dados são referentes ao volume de madeira por árvore, em m3x104 . São apresentados os dados de 5 famílias avaliadas em um delineamento inteiramente casualizado (DIC) com 6 repetições.

Tabela 2. Volume de madeira por árvore, em m3x104 , de 5 famílias de Eucaliptos camaldulensis.

Repetições

Famílias I I II IV V VI

Delineamento Inteiramente Casualizado Balanceado (SISVAR) Sejam os dados apresentados na Tabela 2 referentes a um experimento instalado no delineamento inteiramente casualizado com 5 tratamentos e 6 repetições, em que foi avaliado o efeito das famílias de Eucaliptos camaldulensis sobre o volume de madeira, em m3x104 .

Serão listados abaixo os procedimentos para se efetuar a análise de variância utilizando o programa SISVAR.

Para gerar arquivos do Excel do tipo dbase para ser usado diretamente no Sisvar, sem a necessidade de importar é necessário executar uma série de procedimentos. Esses procedimentos são descritos na seqüência para servir de referência para o usuário do Sisvar. É conveniente salientar que para que o Excel gere adequadamente os arquivos *.dbf é necessário seguir estritamente os passos a seguir. a) ir no painel de controle do computador e escolher configurações regionais. Na opção trocar os formatos de números, datas e horários escolher a aba opções regionais e modificar. Escolher a aba números e marcar somente a caixa símbolo decimal com “.” no lugar de “,”. Confirmar a opção clicando em Ok, duas vezes e pronto. b) Abra o Excel e se o arquivo estiver pronto é só abri-lo. Caso contrário digite o arquivo na seguinte estrutura:

• Primeira linha com o cabeçalho das variáveis;

• Demais linhas com os valores de cada parcela – cada coluna deve ser uma variável;

• Não deixe células vazias.

Formatar cada coluna do seguinte tipo: se por exemplo, a primeira coluna for do tipo qualitativa (texto), então marque a coluna “A” e escolha formatar células e escolher a opção texto; se a segunda for numérica, marcar a segunda coluna e escolher formatar células número. Escolher o número de casas decimais correspondente ao maior número de casas decimais observado para essa coluna e marcar obrigatoriamente a caixa escrita usar separador de 1000 (.). Isso é importantíssimo, pois o Excel possui problemas de eliminar o separador de decimais no arquivo exportado, formando números onde a parte inteira e a decimal não foram separadas uma da outra. Repetir para as demais colunas esse procedimento. É possível marcar várias colunas do mesmo tipo ao mesmo tempo para serem formatadas conjuntamente. No caso numérico deve-se escolher o número de casas decimais do valor observado que apresente um maior número de casas decimais para que o arquivo final não seja truncado em uma precisão não pretendida.

Após é necessário marcar toda a área de dados, inclusive a primeira linha com os nomes das variáveis. É importante não marcar células vazias após o final da digitação dos dados no meio do arquivo, pois o Sisvar não suporta esse tipo de dados. Foi feito pra trabalhar com dados balanceados.

(Parte 1 de 8)

Comentários