Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Experimentação Agrícola, Notas de estudo de Engenharia Agronômica

Experimentação Agrícola

Tipologia: Notas de estudo

2010

Compartilhado em 04/02/2010

avanor-c-jr-8
avanor-c-jr-8 🇧🇷

3 documentos

Pré-visualização parcial do texto

Baixe Experimentação Agrícola e outras Notas de estudo em PDF para Engenharia Agronômica, somente na Docsity! Documentos ISSN 1517-8498 Novembro/2003163Agrobiologia Técnicas Experimentais aplicadas às Ciências Agrárias µ República Federativa do Brasil Luiz Inácio Lula da Silva Presidente Ministério da Agricultura, Pecuária e Abastecimento Roberto Rodrigues Ministro Empresa Brasileira de Pesquisa Agropecuária - Embrapa Conselho de Administração José Amauri Dimárzio Presidente Clayton Campanhola Vice-Presidente Alexandre Kalil Pires Dietrich Gerhard Quast Sérgio Fausto Urbano Campos Ribeiral Membros Diretoria Executiva da Embrapa Clayton Campanhola Diretor Presidente Gustavo Kauark Chianca Herbert Cavalcante de Lima Mariza Marilena T. Luz Barbosa Diretores Executivos Embrapa Agrobiologia José Ivo Baldani Chefe Geral Eduardo Francia Carneiro Campello Chefe Adjunto de Pesquisa e Desenvolvimento Rosângela Straliotto Chefe Adjunto Administrativo 6. Referências Bibliográficas BANZATTO, A. D.; KRONKA, S. do N. Experimentação agrícola. Jaboticabal: FUNEP, 1989. 249 p. BEARZOTI, E.; OLIVEIRA, M. S. Estatística básica. Lavras: UFLA, 1997. 191 p. FISHER, R. A. The design of experiments. Edinburgh: Oliver and Boyd, 1935. HINKELMANN, K.; KEMPTHORNE, O. Design and analysis of experiments. New York: J. Wiley, 1994. 631 p. MEAD, R.; CURNOW, R. N. Statistical methods in agriculture and experimental biology. New York: Chapman and Hall, 1983. 335 p. NOGUEIRA, M. C. S. Estatística experimental aplicada à experimentação agrícola. Piracicaba: USP-ESALQ, 1997. 250 p. PIMENTEL GOMES, F. Curso de estatística experimental. 13. ed. Piracicaba: Nobel/USP-ESALQ, 1990. 468 p. RAMALHO, M. A.; FERREIRA, D. F.; OLIVEIRA, A. C. de. A experimentação em genética e melhoramento de plantas. Lavras: UFLA, 2000. 326 p. STEEL, R. G. D.; TORRIE, J. H.; DICKEY, D. A. Principles and procedures of statistics. 3. ed. New York: McGraw-Hill, 1997. 666 p. Autor Janaína Ribeiro Costa Pesquisadora da Embrapa Agrobiologia. E-mail: janaina@cnpab.embrapa.br 102 Obtenção da produção máxima de milho (ton/ha) Aqui cabe esclarecer que o sinal da estimativa do coeficiente 2â determina se a variável dependente y (no exemplo, produção), terá um valor máximo ou mínimo. Se 2â é negativo, y terá um máximo; caso contrário, se 2â for positivo, y terá um mínimo. No exemplo 5.7.3.1), para obtenção da produção máxima de milho é necessário antes maximizar a função de regressão polinomial quadrática, ou seja, derivar esta equação e igualar a zero: 2 iii 0,00050X0,0950X8,8421ŷ −+= i i i 0,00100X0,09500 dX ŷd −+= 00,00100X0,095000 dX ŷd i i i =−+⇒= 95 0,00100 0,0950 X i == kg/ha (Dose de adubo nitrogenado que levará a uma produção máxima). Substituindo Xi = 95 na equação de iŷ obtém-se a produção máxima de milho: 2 i 5)0,00050.(9)0,0950.(958,8421ŷ −+= 2 i 5)0,00050.(9)0,0950.(958,8421ŷ −+= 3546,13ŷi = ton/ha (produção máxima de milho para dose de adubo nitrogenado de 95 kg/ha). 101 1,0400 3.(10) 31,2 ](2)(1)(0)1)(3.[(-2) (2).37,8(1).42,6(0).37,51).32,0(2).27,5( )(XP3 ).y(XP b̂ 22222 i 5 1i 2 1 ii 5 1i 1 1 ==+++−+ +++−+− = ∑ ∑ = = = ,45230 3.(14) 19,0- ](2)(-1)(-2)1)(3.[(2) (2).37,8(-1).42,6(-2).37,51).32,0((2).27,5 )(XP3 ).y(XP b̂ 22222 i 5 1i 2 2 ii 5 1i 2 2 −==+++−+ +++−+ = ∑ ∑ = = = Lembrando que: P1(Xi) = 2 30 X 30 60X x iii −= − = P2(Xi) = 22 30 X 12 1n x 2 i 2 2 i −      −= − − Portanto: )X(Pb̂)X(Pb̂b̂ŷ 1221110i ++=         −      −−      −+= 22 30 X 4523,02 30 X 0400,18267,11ŷ 2 ii i Resolvendo a equação acima tem-se: 2 i2i1oi 2 iii Xâ̂Xâ̂â̂ŷ 0,00050X0,0950X8,8421ŷ −+= −+= (Equação da Regressão Quadrática) Os valores observados (yi) e estimados )ŷ( i para cada dose de adubo nitrogenado estão apresentados a seguir: Xi yi iŷ 0 27,5 8,8421 30 32,0 11,2421 60 37,5 12,7421 90 42,6 13,3421 120 37,8 13,0421 Apresentação A preocupação crescente da sociedade com a preservação e a conservação ambiental tem resultado na busca pelo setor produtivo de tecnologias para a implantação de sistemas de produção agrícola com enfoque ecológicos, rentáveis e socialmente justos. O enfoque agroecológico do empreendimento agrícola se orienta para o uso responsável dos recursos naturais (solo, água, fauna, flora, energia e minerais). Dentro desse cenário, a Embrapa Agrobiologia orienta sua programação de P&D para o avanço de conhecimento e desenvolvimento de soluções tecnológicas para uma agricultura sustentável. A agricultura sustentável, produtiva e ambientalmente equilibrada apoia-se em práticas conservacionistas de preparo do solo, rotações de culturas e consórcios, no uso de adubação verde e de controle biológico de pragas, bem como no emprego eficiente dos recursos naturais. Infere-se daí que os processos biológicos que ocorrem no sistema solo/planta, efetivados por microrganismos e pequenos invertebrados, constituem a base sobre a qual a agricultura agroecológica se sustenta. O documento 163/2003 atende uma demanda daqueles que atuam na pesquisa agropecuária, principalmente estudantes e profissionais recém ingressados na área, disponibilizando, de forma objetiva e prática, conceitos de estatística aplicados à experimentação em Ciências Agrárias. Na verdade, existem poucas publicações sobre o referido tema e este documento serve de roteiro para orientar aspectos básicos do planejamento da experimentação de campo e análise dos resultados obtidos. 100 hipótese denominada alternativa, simbolizada por H1 que no exemplo seria: os efeitos das estirpes diferem significativamente entre si (ou as estirpes se comportam de modo diferente quanto ao peso da parte aérea). b) Escolha dos fatores e seus respectivos níveis Fatores (ou tratamentos) são aqueles que o pesquisador tem interesse em estudar o seu efeito sobre as variáveis respostas. As subdivisões de um fator são os níveis dos mesmos. Por exemplo, se o interesse for planejar um experimento para se estudar o efeito de 6 tipos diferentes de rotações de cultura, o fator em estudo é rotação e os níveis deste fator são os 6 tipos de rotação. Em alguns casos, como por exemplo nos experimentos fatoriais ou em parcelas subdivididas, dois ou mais fatores são estudados. Suponha que se deseja estudar o efeito de 2 variedades de cana de açúcar e 3 doses de nitrogênio; neste caso se trata de um experimento em fatorial 2x3, em que se tem dois fatores (variedade e dose de nitrogênio); 2 níveis do fator variedade e 3 níveis do fator dose de nitrogênio. Um fator pode ser classificado em: b.1) Qualitativo: quando os níveis do fator são categorias, atributos. Por exemplo: nome de variedades de cana de açúcar (SP701143 e SP813250); métodos de extração de DNA (Cullen, Smalla, Sebach); origem de solos (MG, RJ, BA, SP); etc. b.2) Quantitativo: quando os níveis do fator são mensurações de valores reais. Normalmente os níveis são valores numéricos acompanhados de uma unidade de medida. Por exemplo: dose de nitrogênio (0, 25 e 50 Kg/ha); concentrações de antibiótico (25, 50, 100, 200 µg/ml), etc. c) Escolha da parcela (unidade experimental) Parcela é a unidade experimental que receberá o tratamento. A parcela pode assumir diferentes formas e tamanhos. Por exemplo, uma parcela poderá ser constituída por uma ou várias plantas; um vaso contendo uma ou mais plantas; uma placa de Petri com tem-se que P1(Xi) = xi; em que 30 60X q XX x iii − = − = com i =1, 2, ..., 5. Portanto, 2 30 600 0)(XP 11 −= − == 1 30 6030 30)(XP 21 −= − == 0 30 6060 60)(XP 31 = − == 1 30 6090 90)(XP 41 += − == 2 30 60120 0)12(XP 51 += − == e tem-se que P2(Xi) = 2)](X[P 12 15 _)](X[P 12 1n x 2i1 2 2 i1 2 2 i −= − = − − com i =1, 2, ..., 5. Portanto, 22)2(0)(XP 212 +=−−== 12)1()30(XP 222 −=−−== 22)0()60(XP 232 −=−== 12)1()90(XP 242 −=−+== 22)2()120(XP 252 +=−+== . 9708 A análise de variância para os dados do exemplo 5.7.3.1) é: FV GL SQ QM F Prob>F Doses 4 45,3160 11,3290 13,122 0,0005 Erro 10 8,6333 0,8633 Total 14 Rejeita-se Ho, concluindo-se pela existência do efeito de doses crescentes de adubo nitrogenado sobre a produção do milho (Prob < 0,05). Considerando o modelo de regressão polinomial de 2O grau a seguir, foi realizada a análise de regressão: i 2 i2i1oi åXâXâây +++= reescrevendo este modelo pela expressão alternativa: yi = bo + b1P1(Xi) + b2P2(Xi) + εi ; i =1, 2, ...,5. As hipóteses testadas no modelo de regressão adotado são: i) Ho: b1 = 0 vs H1: b1 ≠ 0. ii) Ho: b2 = 0 vs H1: b2 ≠ 0. Para obtenção das somas de quadrados das regressões linear e quadrática é necessário antes calcular os coeficientes dos polinômios P1(Xi) e P2(Xi). Seja: 60)1209060300( 5 1 X n 1 X n 1i i =++++== ∑ = ; q = 30 (correspondendo a 30-0 ou 60-30 ou 90-60 ou 120-90) determinado meio de cultura; uma área com várias plantas; um animal; etc. d) Escolha do delineamento experimental Delineamento experimental é o plano de distribuição dos tratamentos na área experimental. Como exemplo de delineamentos tem-se o delineamento inteiramente casualizado (DIC), o delineamento em blocos casualizados (DBC), o delineamento em quadrados latinos (DQL), os delineamentos em blocos incompletos (por exemplo, os látices, blocos aumentados, etc.). e) Escolha das variáveis a serem analisadas Variáveis respostas ou variáveis dependentes ou simplesmente variáveis são características obtidas em cada parcela. Os dados (observações) são realizações de uma variável e serão analisados para verificar se há diferença entre os níveis dos fatores (tratamentos). Assim, exemplos de variáveis são: produção de grãos de feijão; altura de plantas de milho; pH, teor de Ca, Mg e P em amostras de solo; número de plantas de cana-de-açúcar atacadas por cercosporiose; etc. Uma variável também pode ser classificada, semelhantemente aos fatores (tratamentos), em: e.1) Qualitativa e.1.1) Nominal: quando são categorias, atributos, sem uma ordenação natural. Por exemplo: cor dos grãos do feijoeiro (marrom, preto, branco); textura do solo (arenoso, argiloso, silte); etc. e.1.2) Ordinal: quando são atributos com uma ordenação natural. Por exemplo: suscetibilidade do cafeeiro à ferrugem (alta, média, baixa); nota para o ataque de cercosporiose em cana-de-açúcar (escala de 1, para ausência da doença, até 9, para o máximo de doença); etc. e.2) Quantitativa e.2.1) Discretas: quando são contagens de números inteiros positivos com uma ordenação natural. Por exemplo: número de 0996 chuvas em 2002 superior a 80 mm/h (ex. 20 chuvas); número de plantas atacadas com a broca do fruto do cafeeiro (ex. 200 plantas); número de minhocas encontradas em determinada amostra de solo (ex. 50 minhocas). e.2.2) Contínuas: quando são mensurações de valores reais; normalmente existe uma unidade de medida acompanhando a variável. Por exemplo: produtividade (100,0 kg/ha); renda (R$2050,73/mês); altura (2,5 m); diâmetro (8,18 cm); peso (98,5 g); pH (5,5); teor de P, Ca, Mg, K, matéria orgânica, etc. f) Análise dos dados obtidos com o experimento. 2) Distribuição de freqüências 2.1) Definição Consiste em uma função que associa os valores que uma variável assume com suas freqüências de ocorrência, podendo ser elas absolutas, relativas ou porcentuais. 2.2) Freqüência É uma medida que quantifica a ocorrência dos valores de uma variável. 2.2.1) Freqüência absoluta (fa) é o número de observações ocorridos em cada classe da variável estudada. 2.2.2) Freqüência relativa (fr) é dada pela divisão da fa pelo número total (n) de dados ou observações: n fa fr = . 2.2.3) Freqüência porcentual (fp) é dada pela multiplicação de fr por 100: fr.100(%) fp = . )(XPr ).y(XP koSQRegressã i n 1i 2 k 2 ii n 1i k ∑     ∑ = = = , associada a 1 grau de liberdade. O coeficiente de determinação (R2) em experimentos com repetição é dado por: 100. toSQTratamen kgressãoReSQ (%)R 2 = , 0 ≤ R2 ≤ 100. 5.7.3.1) Exemplo de análise de regressão em dados com repetição: modelos de regressão polinomial Um experimento foi instalado conforme o delineamento inteiramente casualizado, com três repetições para testar o efeito de 5 doses de adubo nitrogenado (0, 30, 60, 90 e 120 kg/ha). Os resultados obtidos em ton/ha de milho são: Rep\Doses 0 30 60 90 120 1 8,6 10,5 12,5 12,6 13,7 2 9,5 10,0 12,8 15,1 12,8 3 9,4 11,5 12,2 14,9 11,3 Total 27,5 32,0 37,5 42,6 37,8 O modelo do exemplo anterior adotado foi: ijiij dy ε++µ= ; i =1, 2,..., 5 e j = 1, 2, 3. em que yij é o valor observado referente a i-ésima dose de adubo nitrogenado na j-ésima repetição; di é a i-ésima dose de adubo nitrogenado e εij é o erro experimental associado a yij com εi ∩ N (0, σ2) e independentes. As hipóteses testadas na análise de variância são: Ho: d1 = d2 = ... = dn = 0 ; i=1, 2, ..., n H1: pelo menos um di difere de 0. 10 95 i1oi Xb̂b̂ŷ += em que ( ) 10 325 55...1510 10 )577,12).(325( )139,1.(55...)426,1.(15)388,1.(10 b̂ 2 222 1 −+++ −+++ = -0,0073 2062,5000 15,0875- 2062,5000 408,7525393,6650 b̂1 == − = (estimativa de b1), 1,49500,23731,2577 10 325 0,0073).( 10 12,577 b̂o =+=     −−= (estimativa de bo). O modelo de regressão ajustado (estimado) é: ii X0073,04950,1ŷ −= . O R2 foi de: %90100. 1255,0 1104,0 R 2 == indicando que 90% da variação na densidade do solo é explicada pelo modelo de regressão utilizado. No quadro a seguir para cada valor de Xi tem-se o valor observado, o estimado e o desvio correspondente. Xi yi (valores observados) iŷ (valores estimados) yi - iŷ 10 1,388 1,422 -0,034 15 1,426 1,386 0,040 20 1,393 1,349 0,044 25 1,341 1,313 0,029 30 1,26 1,276 -0,016 35 1,16 1,240 -0,080 40 1,177 1,203 -0,026 45 1,153 1,167 -0,014 50 1,14 1,130 0,010 55 1,139 1,094 0,045 Total 12,577 12,577 0 Média 1,2577 1,2577 0 • Gráfico de barras ou colunas: semelhantes aos gráficos de linhas, com a diferença que são usadas barras (colunas) ao invés de linhas. 0 0.1 0.2 0.3 0.4 Mi lho So ja Le ite Tr igo Ol er ic. .. Ca na ... La ra nja Atividade fr Figura 2. Gráfico de barras verticais representando a distribuição de freqüência relativa referente à atividade agrícola predominante em propriedades do município de Vida Alegre. • Setograma (gráfico circular ou gráfico de setores): gráfico circular no qual os setores correspondem as categorias com áreas proporcionais as freqüências de cada classe. Para construção do setograma é necessário obter o ângulo referente ao setor de cada categoria, por meio de uma regra de três. Por exemplo, para a atividade milho do Exemplo 1, tem-se a regra de três para as freqüências porcentuais dada por: 100% ______ 360 o 35% ______ X x = 126 o. E assim por diante são calculados os outros ângulos correspondentes aos setores das outras categorias que serão traçados no gráfico. 1392 Laranja Cana Olericultura Trigo Leite Soja Milho Figura 3. Setograma representando a distribuição de freqüência relativa referente à atividade agrícola predominante em propriedades do município de Vida Alegre. Exemplo 2. O quadro seguinte apresenta o número de lagartas rosca encontradas em cada um dos 16 canteiros de um viveiro de mudas de eucalipto. 1 1 3 5 4 2 4 4 3 1 2 1 5 0 0 4 A variável número de lagartas rosca é classificada como quantitativa discreta. A distribuição de freqüências para variáveis quantitativas discretas são semelhantes à das variáveis qualitativas, como no caso do Exemplo 1, com os valores inteiros que a variável assume podendo ser considerados como “categorias” ou “classes naturais”. a) Representação tabular: Tabela 2. Distribuição de freqüência do número de lagartas rosca em canteiros de um viveiro de eucalipto No de lagartas rosca fa fr fp (%) 0 2 0,1250 12,5 1 4 0,2500 25,0 2 2 0,1250 12,5 3 2 0,1250 12,5 4 4 0,2500 25,0 5 2 0,1250 12,5 Total 16 1,0000 100,0 Fonte: Notas de aula. H1: b1 ≠ 0. As somas de quadrados para o exemplo anterior foram: SQRegressão = ( ) 10 325 55...1510 10 )577,12).(325( )139,1.(55...)426,1.(15)388,1.(10 2 222 2 −+++     −+++ SQRegressão = [ ] 0,1104 2062,5000 -15,0875)( 2062,5000 408,75256650,393 22 == − SQTotal = 10 )577,12( 139,1...426,1388,1 2 222 −+++ SQTotal = 15,9436 – 15,8181 = 0,1255 SQDesvios = 0,1255 – 0,1104 = 0,0151 O Quadro de análise de variância resultante é: FV GL SQ QM F Prob>F Regressão 1 0,1104 0,1104 58,105 0,0001 Desvios 8 0,0151 0,0019 Total 9 0,1255 Da Tabela de F tem-se que F(0,05; 1; 8) é 5,32 e como 58,105 > 5,32, rejeita-se Ho ao nível de 5% de significância. Atualmente, os programas computacionais apresentam uma coluna a mais no quadro de análise de variância correspondente a Prob>F, não havendo a necessidade de procurar o valor de F em Tabela. Quando Prob>F for menor que 0,05, significa que o teste F foi significativo, ou seja, o pesquisador poderá rejeitar Ho e aceitar H1. No exemplo, conclui-se então que as densidades (g/cm3) em diferentes profundidades X (cm) podem ser explicadas por meio do seguinte modelo de regressão linear: 9114 SQDesvios = gessãoReSQSQTotal)ŷy( 2i n 1i i −=−∑ = , associada a (n- 2) graus de liberdade. A decisão de rejeitar Ho ao nível α de significância se dará se QMDesvios gressãoReQM = F ≥ F(α, 1, n-2) em que F(α, 1, n-2) é o valor tabelado obtido através da Tabela de F- Snedecor para o nível α de significância, 1 e (n-2) graus de liberdade. O coeficiente de determinação (R2) é a estatística dada por: 100. SQTotal gressãoReSQ (%)R 2 = , 0 ≤ R2 ≤ 100. O R2 procura quantificar a proporção da variação da variável y que é explicada pelo modelo de regressão. Quanto mais próximo de 100 estiver R2, melhor a qualidade de ajuste do modelo de regressão aos dados. 5.7.2.1) Exemplo de análise de regressão em dados sem repetição Um estudo foi realizado sobre zonas de compactação em perfis de um solo, obtendo-se os seguintes dados de densidade (g/cm3) em diferentes profundidades X (cm) Total X (cm) 10 15 20 25 30 35 40 45 50 55 325 y (g/cm3) 1,388 1,426 1,393 1,341 1,260 1,160 1,177 1,153 1,140 1,139 12,577 O modelo adotado foi: yi = b0 + b1Xi + εi , i=1, 2, ..., 10 e εi ∩ N (0, σ2). E as hipóteses testadas foram: Ho: b1 = 0 A representação gráfica também é semelhante à do Exemplo 1, com os valores inteiros no eixo horizontal, representando as classes da variável (número de lagartas). Exemplo 3. Considere os valores a seguir referentes ao diâmetro à altura do peito (DAP), em cm, de 54 árvores de um talhão 10,7 17,2 21,2 22,9 24,2 25,9 28,8 32,8 36,1 12,4 17,6 21,6 23,3 24,4 26,1 29,5 33,6 37,5 13,8 18,8 21,8 23,5 24,4 26,1 30,2 34,2 38,1 14,6 19,2 22,2 23,8 24,6 26,8 30,9 34,5 39,0 16,1 20,5 22,3 23,9 24,8 27,5 31,3 34,7 39,7 16,8 20,9 22,8 24,2 25,5 28,1 32,0 35,5 41,2 A variável DAP é classificada como quantitativa contínua. A distribuição de freqüências para variáveis quantitativas contínuas são diferentes daquelas discretas e das variáveis qualitativas. Primeiramente, para a realização de uma distribuição de freqüências de uma variável contínua, os dados devem ser ordenados em ordem crescente para uma melhor manipulação dos mesmos. Depois segue-se a um algoritmo para a obtenção da distribuição de freqüências. Neste algoritmo, alguns passos são diferenciados se os dados são referentes a uma população ou a uma amostra. i) Para população: escolher um número de classes (k) entre 5 e 20. Para amostra: Tamanho da amostra (n) Número de classes (k) Até 100 n > 100 5 log10 n ii) Calcular a amplitude total (A) dos dados: A = MVO – mvo 1590 densidade de freqüência (df) = classedaamplitude classedafreqüência Assim, pode-se usar a densidade de freqüência absoluta (dfa) ou a relativa (dfr) ou, ainda, a porcentual (dfp) obtidas, respectivamente, por: c fa dfa = ; c fr dfr = ; c fp dfp = . Na Tabela 3 foram apresentadas as dfr´s (com c=3,1). O uso de df se torna importante nas situações onde as amplitudes de classes (c) são desiguais e, também, permite o cálculo de freqüências a partir de áreas do gráfico. Mas se c é igual para todas as classes pode-se utilizar, no eixo vertical do gráfico, tanto freqüências como densidades de freqüência. Visto o conceito de df, os dois gráficos mais usais para distribuição de freqüências de variáveis contínuas são o histograma e o polígono de freqüência. b.1) Histograma: é semelhante ao gráfico de barras, com barras dispostas lado a lado, e larguras iguais às amplitudes de classes. 0 0.02 0.04 0.06 0.08 0.1 10 .6 5 13 .7 5 16 .8 5 19 .9 5 23 .0 5 26 .1 5 29 .2 5 32 .3 5 35 .4 5 38 .5 5 41 .6 5 DAP dfr Figura 4. Histograma de distribuição de freqüência relativa referente ao diâmetro à altura do peito (DAP), em cm, de 54 árvores de um talhão. Os resultados do teste de Tukey comparando as médias das Variedades para 1 e 2 linhas de irrigação está apresentado a seguir: Variedades\Linhas '1T ' 2T T1 17,80 c 17,40 b T2 19,10 bc 19,10 ab T3 20,50 ab 19,80 a T4 21,18 a 17,40 b Médias seguidas de mesma letra não diferem entre si pelo teste de Tukey (Prob > 0,05). 5.7) Análise de regressão 5.7.1) Características Na pesquisa agropecuária é freqüente o interesse no estudo de relações funcionais entre variáveis quantitativas, como por exemplo: a) Estudar a resposta na produção de grãos (y) em função de doses (X) de nitrogênio aplicadas ao solo, simbolizado por y = f(X); b) Estimar o volume de madeira (y) em árvores de um povoamento florestal sem ter que derrubá-las, através da medida de seus diâmetros (X1) e alturas (X2), simbolizado por y = f(X1, X2); c) Expressar a curva de crescimento (y) de aves em função do tempo (X), simbolizado por y = f(X) d) Determinar como o número de brotos (y1) e seu peso seco (y2) são afetados pelas doses de meio de cultura MS (X1), de sacarose (X2) e pH (X3), simbolizado por y1, y2 = f(X1, X2, X3). As variáveis y’s dos exemplos anteriores que se deseja descrever são chamadas variáveis dependentes ou respostas e as variáveis X’s são denominadas independentes ou regressoras. Na natureza, certamente uma variável y que se deseja descrever, é determinada por um conjunto de outras variáveis, X1, X2, ......, Xk. 8718 Variedade 2/ Linha 1 = _______ ' 12TT = 10,19 4 4,76 = Variedade 3/ Linha 1 = _______ ' 13TT = 50,20 4 0,82 = Variedade 4/ Linha 1 = _______ ' 14TT = 18,21 4 7,84 = - Comparando Médias de T para '2T : Variedade 1/ Linha 2 = _______ ' 21TT = 40,174 6,69 = Variedade 2/ Linha 2 = _______ ' 22TT = 10,194 4,76 = Variedade 3/ Linha 2 = _______ ' 23TT = 80,194 2,79 = Variedade 4/ Linha 2 = _______ ' 24TT = 40,174 6,69 = Teste de Tukey: r MédioQMErro qDMS = sendo q para α=0,05; I = 4 tratamentos principais (Variedades) e GLErro Médio = 'n = 21 ⇒ q = 3,95: 00,2 4 0207,1 95,3DMS == . b.2) Polígono de freqüência: quando as amplitudes de classe (c) são iguais, o polígono é obtido pela união dos pontos médios das classes, nas alturas correspondentes às df’s. O polígono deve ser unido, no eixo horizontal, nos pontos: 2 c LI1 − e 2 c LSk + em que LSk é o limite superior da última classe (k). No Exemplo 3 os pontos de união ao eixo horizontal são: 1,9 2 1,3 65,10 =− e 2,43 2 1,3 65,41 =+ . dfr 0 0.02 0.04 0.06 0.08 0.1 9. 1 12 .2 15 .3 18 .4 21 .5 24 .6 27 .7 30 .8 33 .9 37 40 .1 43 .2 DAP Figura 5. Polígono de freqüência relativa referente ao diâmetro à altura do peito (DAP), em cm, de 54 árvores de um talhão. 2.3) Natureza da distribuição O objetivo da distribuição de freqüência é descrever o comportamento da variável. A natureza desse comportamento pode ser simétrica, assimétrica à direita ou à esquerda, como pode ser visualizado na Figura 6. Adiante será visto como se quantifica a assimetria. 1986 i) Simétrica ii) iii) Assimétrica à direita Assimétrica à esquerda Figura 6. Natureza da distribuição dos dados i) simétrica, ii) assimétrica à direita ou iii) assimétrica à esquerda. 3) Estatísticas descritivas 3.1) Medidas de posição Definição: é um número que descreve um conjunto de dados, pela indicação da posição que o conjunto ocupa na escala de valores possíveis que a variável em questão pode assumir. 3.1.1) Média Me)ouX( Me = N X N 1i i∑ = . ( ) 16 (294,8) 6,6979,276,469,6 4 1 T/TSQ2/LinhaVariedadeSQ 2 2222' 2 −+++== ' 2T/TSQ = 5449,4800 – 5431,6900 = 17,7900. Para certificar se o cálculo das somas de quadrados do desdobramento Variedades dentro de Linhas foi realizado corretamente basta verificar: SQ T + SQ T x 'T = '2 ' 1 T/TSQT/TSQ + 26,9635 + 17,9184 = 27,0919 +17,7900 44,8819 = 44,8819 ok! A análise de variância para o desdobramento T/T’ é: FV GL SQ QM F Prob>F ' 1T/T (I-1) = 4-1 =3 27,0919 9,0306 8,848 0,0005 ' 2T/T (I-1) = 4-1 =3 17,7900 5,9300 5,810 0,0047 Erro Médio 21 - 1,0207 Da análise de variância anterior observa-se que houve diferença significativa entre efeitos de Variedades (T), no comprimento da banana, tanto para 1 linha de irrigação quanto para 2 linhas de irrigação (Prob < 0,05). Podemos então utilizar, por exemplo, o teste de Tukey para comparar as médias de T (Variedades) para '1T (1 linha de irrigação) e também para '2T (2 linhas de irrigação). Médias: - Comparando Médias de T para '1T , do Quadro 3 pode-se obter: Variedade 1/ Linha 1 = ' 1TT = 8,174 2,71 = 0 8520 1 ' /TTSQ = 2478,4000 – 2478,0800 = 0,3200; ( ) 8 (152,8) 76,476,4 4 1 /TTSQ2/VariedadeLinhaSQ 2 22 2 ' −+== 2 '/TTSQ = 2918,4800 – 2918,4800 = 0,0000; ( ) 8 )2,161( 2,790,82 4 1 T/TSQ3Variedade/SQLinha 2 22 3 ' −+== =3 ' T/TSQ 3249,1600 – 3248,18 = 0,9800; ( ) 8 )3,154( 6,697,84 4 1 T/TSQ4Variedade/SQLinha 2 22 4 ' −+== 4 ' T/TSQ = 3004,5625 – 2976,0613 = 28,5012. Para certificar se o cálculo das somas de quadrados do desdobramento Linhas dentro de Variedades foi realizado corretamente basta verificar: SQ 'T + SQ T x 'T = 4 ' 3 ' 2 ' 1 ' /TTSQ/TTSQ/TTSQ/TTSQ +++ 11,8828 + 17,9184 = 0,3200 + 0,0000 + 0,9800 + 28,5012. 29,8012 = 29,8012 ok! A análise de variância para o desdobramento 'T /T é: FV GL SQ QM F Prob>F 1 '/TT (K-1) = 2-1 =1 0,3200 0,3200 0,308 0,6347 2 '/TT (K-1) = 2-1 =1 0,0000 0,0000 0,000 0,9975 3 '/TT (K-1) = 2-1 =1 0,9800 0,9800 0,942 0,4341 4 '/TT (K-1) = 2-1 =1 28,5012 28,5012 27,397 0,0346 Erro (b) 12 12,4838 1,0403 3.1.3) Moda (Mo) É o valor mais freqüente no conjunto de dados. Exemplo 7. Para as N = 5 observações (xi) a seguir, a moda é: x1 x2 x3 x4 x5 8 9 9 12 18 Mo = 9 (valor mais freqüente; apareceu duas vezes no conjunto de dados). Propriedades da moda: i) Mo (x+K) = Mo (x) +K; ii) Mo (x.K) = K.Mo (x). Observações: A Mo também é uma medida de posição para medidas assimétricas. Ela é ainda menos afetada por valores extremos do que a mediana. Para variáveis contínuas, onde é difícil encontrar um mesmo valor repetido duas ou mais vezes, a moda é calculada de outra maneira, através do denominado método de Czuber; porém, tal método não será discutido neste material. 3.2) Medidas de dispersão Definição: grandeza numérica que descreve a variabilidade em um conjunto de dados. 3.2.1) Amplitude (A) A = MVO - mvo Trata-se da diferença entre o maior valor observado (MVO) e o menor valor observado (mvo) como já foi visto anteriormente. 2382 Exemplo 8. Considere dois conjuntos de dados (X e Y) medidos em metro (m): Totais X 6 16 16 16 41 95 Y 6 11 21 31 41 110 A (X) = 41 – 6 = 35; A (Y) = 41 – 6 = 35. X e Y apresentam mesma amplitude (A), portanto o conjunto X apresenta claramente menor variabilidade (maior uniformidade) que o conjunto Y. Observação: A amplitude é muito influenciada por valores extremos, uma vez que é calculada a partir deles. Assim, a medida que aumenta N, aumenta a chance de encontrar valores extremos, aumentando, portanto, a amplitude. 3.2.2) Variância (Var) e Desvio padrão (DP) São medidas baseadas em todos os dados, a partir dos desvios em relação a média. • Variância (Var ou σ2): média dos quadrados dos desvios (também chamada de quadrado médio), cuja expressão é dada por: [ ] N Mex 2N 1i i 2 ∑ − =σ = (população) ou [ ] 1n Mex ˆ 2n 1i i 2 − ∑ − =σ = (amostra). Ou ainda, pelas expressões alternativas: 2 N 1i N 1i i 2 i 2 N N x x∑      ∑ − =σ = = (população) ou 2 n 1i n 1i i 2 i 2 1n n x x ˆ − ∑      ∑ − =σ = = (amostra). -1,5=1,5 < 1,56 portanto 1T = 2T e assim continua as comparações entre as outras médias de variedades duas a duas. b) Comparações entre médias de tratamentos secundários (médias de Linhas - 'T ): Comparando a média de '1T com a de ' 2T pelo teste de Tukey, do Quadro 3 pode-se obter: 64,19 4x4 3,314 rI T T ' 1T' 1 === e 43,184x4 8,294 rI T T ' 2T' 2 === I.r )b(QMErro qDMS = sendo q para α=0,05; K = 2 tratamentos secundários (Linhas) e GLErro (b) = 12 ⇒ q = 3,08: 78,0 4.4 0403,1 08,3DMS == O contraste entre '1T e ' 2T é: 21,143,1864,19TTŷ '2 ' 1 =−=−= . 1,21 > 0,78 portanto '1T ≠ ' 2T . c) Comparações entre médias de tratamentos secundários dentro de cada nível de tratamento principal (médias de Linhas dentro de cada Variedade - 'T /T): Do Quadro 3 obtém-se: ( ) 8 (140,8) 69,671,2 4 1 /TTSQ1/VariedadeLinhaSQ 2 22 1 ' −+== 8124 TiT e 'TiT : total do tratamento principal i e do tratamento secundário 'i , respectivamente. iT e ' iT : média do tratamento principal i e do tratamento secundário 'i , respectivamente. As comparações de médias que o pesquisador pode ter interesse em um experimento em parcelas subdivididas são as seguintes: a) Comparações entre médias de tratamentos principais (médias de Variedades - T): Comparando, por exemplo, a média de T1 com a de T2 pelo teste de Tukey, do Quadro 3 pode-se obter: 6,17 2x4 8,140 rK T T 1 T 1 === e 1,192x4 8,152 rK T T 2 T 2 === K.r )a(QMErro qDMS = sendo q para α=0,05; I = 4 tratamentos principais (Variedades) e GLErro (a) = 9 ⇒ q = 4,41: 56,1 2.4 0011,1 41,4DMS == . O contraste entre 1T e 2T é: 5,11,196,17TTŷ 21 −=−=−= . Lembrando a interpretação do teste Tukey: Se  ŷ ≥ DMS ⇒ as médias dos dois tratamentos em comparação podem ser consideradas estatisticamente diferentes. • Desvio padrão (DP ou σ): é a raiz quadrada da variância, cuja expressão é dada por: 2σ=σ (população) ou 2ˆˆ σ=σ (amostra). Observações: Quanto maior σ2 ou 2σ̂ , maior a variabilidade do conjunto de dados. O DP tem a vantagem, em relação a Var, de possuir a mesma unidade dos dados (por exemplo, se a unidade de medida dos dados é kg, a do DP também será kg enquanto que a da Var será kg2), facilitando, assim, a visualização do quanto, em média, os dados se desviam da média. Para o Exemplo 8 tem-se: Var(X) = 00,136 5 18052485 5 5 )95( 411616166 2 22222 = − = −++++ m2; Var(Y) = 00,164 5 24203240 5 5 )110( 413121116 2 22222 = − = −++++ m2; DP(X) = 66,11136 = m; DP(Y) = 81,12164 = m. Propriedades da variância e do desvio padrão: i) Somado-se uma constante K a todos os dados, a Var e o DP não se alteram: )x(Var)Kx(Var =+ ; )x(DP)Kx(DP =+ ; ii) Multiplicando-se K a todos os dados, a Var fica multiplicada por K2 e o DP por K. Var(x.K) = K2[Var(x)]; DP (x.K) = K [DP (x)]; 2580 4 4 22 4 d m d.d m K == sendo ( ) n xx m n 1i 4 i 4 ∑ − = = e d 2 = σ2 (variância populacional) ou 2σ̂ (variância amostral).      = < > a.mesocúrtic chamada normal a semelhante ãodistribuiç uma indica:3 ca,platicúrti chamada achatada ãodistribuiç uma indica:3 ca,leptocúrti chamada afiada ãodistribuiç uma indica:3 éKSe Figura 7. Gráfico dos diferentes graus de achatamento relativos a uma distribuição de freqüência Exemplo 10. Seja as seguintes N = 4 observações, a média ( x ) e a variância (d2)destas observações dadas por x1 x2 x3 x4 x d2 2 15 16 17 12,5 37,25 Considerando que a unidade de cálculo é a subparcela, do Quadro de dados podemos tirar: C = 32 )1,609( 2 = 11593,8378; SQ Blocos = 8378,11593)0,1556,1421,1554,156( 8 1 2222 −+++ SQ Blocos = 11609,5913 – 11593,8378 = 15,7535; SQ Total = 19,02 + 17,12 + . . . + 16,4 2 + 18,62 – 11593,8378 SQ Total = 11687,8500– 11593,8378 = 94,0122. Para o cálculo da soma de quadrados de parcelas, é necessário fazer um quadro auxiliar com os totais das parcelas. Quadro 2. Quadro auxiliar com os totais das parcelas TratamentosRepetições T1 T2 T3 T4 Totais 1 37,9 (2) 39,0 41,5 38,0 156,4 (8) 2 34,7 37,8 42,2 40,4 155,1 3 32,4 36,8 36,0 37,4 142,6 4 35,8 39,2 41,5 38,5 155,0 Totais 140,8(8) 152,8 161,2 154,3 609,1 Do Quadro 2 calculamos: 11593,8378-)154,3161,2152,8(140,8 8 1 VariedadesSQ 2222 +++= SQ Variedades = 11620,8013 – 11593,8378 = 26,9635; 11593,837-)38,537,4...34,7(37,9 2 1 ParcelasSQ 2222 ++++= 8 7728 fruto central da terceira penca de banana estão dispostos na Tabela 8 a seguir. Tabela 8. Comprimento (cm) do fruto central da terceira penca de banana para um experimento em blocos casualizados (DBC), com 4 repetições, em esquema de parcela subdividida com 4 variedades de banana (T1, T2, T3 e T4) nas parcelas e 2 linhas de irrigação ( ' 1T = 1 linha e '2T = 2 linhas) nas subparcelas Tratamentos T1 T2 T3 T4Repetições ' 1T ' 2T ' 1T ' 2T ' 1T ' 2T ' 1T ' 2T Totais 1 19,0 18,9 19,2 19,8 20,8 20,7 21,1 16,9 156,4 2 17,1 17,6 19,5 18,3 20,9 21,3 22,7 17,7 155,1 3 17,5 14,9 17,5 19,3 18,6 17,4 21,0 16,4 142,6 4 17,6 18,2 20,2 19,0 21,7 19,8 19,9 18,6 155,0 Totais 71,2 69,6 76,4 76,4 82,0 79,2 84,7 69,6 609,1 5.6.6) Croqui de campo T2 T4 T1 T3 BL I '2T ' 1T ' 2T ' 1T ' 1T ' 2T ' 1T ' 2T T3 T1 T2 T4 BL II '1T ' 2T ' 2T ' 1T ' 1T ' 2T ' 2T ' 1T T4 T3 T1 T2 BL III '1T ' 2T ' 1T ' 2T ' 1T ' 2T ' 2T ' 1T T1 T2 T3 T4 BL IV '2T ' 1T ' 1T ' 2T ' 2T ' 1T ' 1T ' 2T 252 4 1008 4 )5,1217()5,1216()5,1215()5,122( m 3333 3 −= − = −+−+−+− = ; 563,3188 4 25,12754 4 )5,1217()5,1216()5,1215()5,122( m 4444 4 == −+−+−+− = ; 1,108 d m 25,3725,37 252 As 3 3 −== − = (As < 0 → Assimetria a esquerda); 2,30 )25,37).(25,37( 563,3188 K == (K < 3 → Distribuição platicúrtica). 4) Testes de comparações múltiplas 4.1) Contrastes ortogonais de médias Definição: São combinações lineares dadas por: Y1 = a1m1 + a2m2 + ...+ anmn Y2 = b1m1 + b2m2 + ...+ bnmn M YI-1 = c1m1 + c2m2 + ...+ cnmn sendo a soma dos coeficientes de cada contraste igual a zero: 0cb,a n 1i n 1i ii n 1i i =∑ ∑∑ = == L , em que: a1, b1, c1, ..., an, bn, cn são os coeficientes dos contrastes; m1, m2, ..., mn são médias dos tratamentos 1, 2, ...,n. Dois contrastes são ditos ortogonais quando há uma independência entre suas comparações, ou melhor, quando a variação de um contraste é independente da variação do outro. A exigência para 2976 que dois contrates sejam ortogonais é que a covariância (Cov) entre eles seja nula: Cov( iY , 'iY ) = 0. Seja 2is a variância do tratamento i e ri o número de repetições do tratamento i, a covariância entre dois contrastes é dada por uma das seguintes expressões: • Se 2 1s ≠ 2 2s ≠...≠ 2 ns e r1 ≠ r2 ≠...≠ rn : Cov(Y1, Y2) = 2 n n nn2 2 2 222 1 1 112 i n 1i i ii s r ba s r ba s r ba s r ba +++=∑ = L . • Se 2 1s = 2 2s =...= 2 ns e r1 ≠ r2 ≠...≠ rn : Cov(Y1, Y2) = n nn 2 22 1 11 n 1i i ii r ba r ba r ba r ba +++=∑ = L . • Se 2 1s = 2 2s =...= 2 ns e r1 = r2 =...= rn : Cov(Y1, Y2) = nn2211 n 1i ii babababa +++=∑ = L . A variância (Var) de um contraste Y é: Var (Y) = ∑ = n 1i i 2 i2 r c s (se 21s = 2 2s =...= 2 ns =s 2) ou Var (Y) = 2i n 1i i 2 i s r c ∑ = (se 21s ≠ 2 2s ≠...≠ 2 ns ). O erro padrão do contraste Y é: s(Y) = )Y(Var . 5.6.3) Desvantagem Há uma redução do número de graus de liberdade do erro, comparativamente ao esquema fatorial, redução esta decorrente da existência de dois erros, o erro (a) referente às parcelas e o erro (b), correspondente às subparcelas dentro das parcelas. 5.6.4) Modelo estatístico do experimento em parcela subdividida O modelo a seguir corresponde a um modelo de um DBC em esquema de parcela subdividida: ijkikkijijijk e)(ìy +αγ+γ+δ+α+β+= em que ijky é o valor observado referente a parcela que recebeu o i- ésimo nível do tratamento principal α e o k-ésimo nível do tratamento secundário γ no j-ésimo bloco; µ representa uma constante geral associada a esta variável aleatória; βj é o efeito do j- ésimo bloco; αi é o efeito do i-ésimo nível do tratamento principal; δij = (αβ)ij é o efeito residual das parcelas, caracterizado como componente do erro (a); γ é o efeito do k-ésimo nível do tratamento secundário; (αγ)ij é o efeito da interação do i-ésimo nível do tratamento principal α com o k-ésimo nível do tratamento secundário γ e eijk representa o efeito residual das subparcelas, caracterizado como componente do erro (b). Sobre as distribuições de δij e eijk pode-se considerar as seguintes pressuposições: i) δij ∩ N(0, 2δσ ); ii) eijk ∩ N(0, 2σ ); iii) δij e eijk são não correlacionados. 5.6.5) Exemplo de parcela subdividida Foi realizado um experimento em blocos casualizados com 4 repetições, no esquema de parcelas subdivididas. Os tratamentos das parcelas foram 4 variedades de banana (T1, T2, T3 e T4) e os tratamentos das subparcelas foram uma e duas linhas de irrigação ( '1T = 1 linha e ' 2T = 2 linhas). Os dados do comprimento (cm) do 7530 - Inoculante dentro da variedade 2: Inoculantes Médias Resultado do teste 1 385,3 a 2 374,8 a 3 379,3 a Também não houve diferenças significativas (Prob>0,05) com relação ao peso do colmo entre os 3 inoculantes utilizados para a variedade 2. b) Estudar o comportamento das variedades para cada inoculante Do Quadro 1 tem-se: SQ Variedade / I1 = 8 )4,2466( )0,15414,925( 4 1 222 −+ = 47370,4200 SQ Variedade / I2 = 8 )8,2334( )0,14998,835( 4 1 222 −+ = 54979,2800 SQ Variedade / I3 = 8 )2,2494( )1,15171,977( 4 1 222 −+ = 36450,0000. FV GL SQ QM F Prob>F Variedade / I1 1 47370,4200 47370,4200 25,700 0,0001 Variedade / I2 1 54979,2800 54979,2800 29,828 0,0001 Variedade / I3 1 36450,0000 36450,0000 19,775 0,0005 Erro 15 27648,1067 1843,2071 Neste segundo desdobramento da interação (variedade dentro de inoculante) conclui-se que as duas variedades apresentaram pesos de colmos diferentes (Prob<0,05) para cada inoculante utilizado (I1 ou I2 ou I3). vii) Conclusões dos contrates: a) = + − + = 2 m̂m̂ 2 m̂m̂ Ŷ 4321'1 -2,25 t/ha O contraste Y1 nos indica que o grupo das cultivares 1 e 2 produz em média 2,25 t/ha a menos que o grupo das cultivares 3 e 4. b) 9,1 1 m̂ 1 m̂ Ŷ 21'2 =−= t/ha O contraste Y2 nos indica que a cultivar 1 superou em média a produção da cultivar 2 em 1,9 t/ha. c) 0,5 1 m̂ 1 m̂ Ŷ 43'3 −=−= t/ha. O contraste Y3 nos indica que a cultivar 3 produziu em média 5,0 t/ha a menos que a cultivar 4. 4.2) Teste t de Student 4.2.1) Teste t para contrastes ortogonais Considerações: - O teste t pode ser usado para contrastes ortogonais, sugeridos pela estrutura dos tratamentos. - De acordo com Banzatto & Kronka (1989), deve-se escolher os contrastes antes de avaliar os dados ou, se possível, na fase de planejamento do experimento para evitar que sejam escolhidos contrastes correspondentes as maiores diferenças observadas entre médias, o que aumentaria, assim, a probabilidade de erro tipo I (α). O α consiste no erro que se comete ao rejeitar Ho, sendo que ela é verdadeira. Dada uma hipótese de nulidade (Ho) e sua hipótese alternativa (H1) dada por: 3372 Ho: Y= 0, ou seja, as médias ou grupos de médias comparadas no contraste não diferem entre si. H1: Y≠ 0, ou seja, pelo menos uma média difere das demais ou um grupo de médias difere de outro grupo. A estatística t é calculada por: )Ŷ(s 0Ŷ )Ŷ(V̂ 0Ŷ t − = − = sendo Ŷ a estimativa do contraste de interesse e )Ŷ(s a estimativa do erro padrão do contraste. A estatística t é comparada (em valor absoluto) com um valor tabelado (tt), procurando-se na Tabela de t (encontrada em livros de estatística) o número de graus de liberdade (GL) associado a variância e o nível de significância α. Se t < tt, aceita-se a hipótese Ho e conclui-se que as médias ou os grupos de médias em comparação são iguais; caso contrário, se t ≥ tt, rejeita-se a hipótese Ho e conclui-se que as médias ou o grupo de médias em comparação são diferentes. Exemplo 12. Aplicar o teste t nos contrates Y1, Y2 e Y3 do Exemplo 11, considerando que o GLErro da análise de variância é 16. Y1 = m1 + m2 – m3 – m4 1Ŷ = -4,5 t/ha )Ŷ(s 1 = 0,3899 t/ha Y2 = m1 – m2 2Ŷ = 1,9 t/ha )Ŷ(s 2 = 0,2757 t/ha Y3 = m3 – m4 3Ŷ = -5 t/ha )Ŷ(s 3 = 0,2757 t/ha - Teste t para Y1: 541,11 3899,0 05,4 t )Y(c 1 −= −− = )Y(t 1 t para α=0,05 e GL Erro=16 ⇒ )Y(t 1t = 2,12 variedades e inoculantes, recomenda-se proceder o desdobramento da interação V x I para certificar tal informação. O desdobramento, no caso deste exemplo com dois fatores, pode ser realizado das seguintes maneiras: a) Estudar o comportamento dos inoculantes para cada variedade Do Quadro 1 tem-se: SQ Inoculante / V1 = 12 )3,2738( )1,9778,8354,925( 4 1 2222 −++ = 2555,5617; SQ Inoculante / V2 = 12 )1,4557( )1,15170,14990,1541( 4 1 2222 −++ = 221,9017. FV GL SQ QM F Prob>F Inoculante / V1 2 2555,5617 1277,7808 0,693 0,5110 Inoculante / V2 2 221,9017 110,9508 0,060 0,9427 Erro 15 27648,1067 1843,2071 Neste primeiro desdobramento da interação (inoculante dentro de variedade) conclui-se que tanto para variedade 1 quanto para a variedade 2, não há diferença significativa (Prob>0,05) no peso do colmo entre os três inoculantes aplicados. Aplicando o teste de Scott-Knott para inoculantes dentro de cada nível de variedade tem-se: - Inoculante dentro da variedade 1: Inoculantes Médias Resultado do teste 1 231,4 a 2 209,0 a 3 244,3 a Realmente, não houve diferenças significativas (Prob>0,05) com relação ao peso do colmo entre os 3 inoculantes utilizados para a variedade 1. 7134 SQ Variedades x Inoculantes = 140612,1900 - 137834,7267– 1812,4900 = 964,9733. E o quadro de análise de variância para os dados do exemplo 5.5.5) conforme o esquema fatorial 3x2 é: FV GL SQ QM F Prob>F Bloco 3 3806,8083 1268,9361 0,688 0,5730 (Tratamentos) (5) (140612,1900) 28122,4380 15,257 0,0000 Variedades (V) 1 137834,7267 137834,7267 74,780 0,0000 Inoculantes (I) 2 1812,4900 906,2450 0,492 0,6211 V x I 2 964,9733 482,4867 0,262 0,7731 Erro 15 27648,1067 1843,2071 Total 23 172067,1050 CV (%) = 14,12 Média geral: 303,98 Número de observações: 24 Aplicando o teste de Scott-Knott para variedades (pois esta fonte de variação foi significativa: Prob<0,05) tem-se: Variedades Médias Resultado do teste 1 228,2 b 2 379,8 a Aplicando o teste de Scott-Knott para inoculantes, apesar de seu efeito ter sido não significativo (Prob>0,05), tem-se: Inoculantes Médias Resultado do teste 1 308,3 a 2 291,8 a 3 311,8 a Embora a interação V x I não seja significativa (Prob > 0,05), indicando não haver uma dependência entre os efeitos dos fatores Como )Y(c 1t > )Y(t 1t ⇒ -11,541 > 2,12 ⇒ rejeita-se Ho: Y1 = 0 e portanto m1+ m2 ≠ m3 + m4 (os dois grupos de médias de cultivares diferem entre si ao nível de 5% de significância) - Teste t para Y2: 892,6 2757,0 09,1 t )Y(c 2 = − = )Y(t 2 t para α=0,05 e GL Erro=16 ⇒ )Y(t 2t = 2,12 Como )Y(c 2t > )Y(t 2t ⇒ 6,892 > 2,12 ⇒ rejeita-se Ho: Y2 = 0 e portanto m1 ≠ m2 (a média da cultivar 1 difere da cultivar 2 ao nível de 5% de significância) - Teste t para Y3: 136,18 2757,0 00,5 t )Y(c 3 = −− = )3Y(tt para α=0,05 e GL Erro=16 ⇒ )Y(t 2t = 2,12 Como =)Y(c 3t > )3Y(tt ⇒ 18,136 > 2,12 ⇒ rejeita-se Ho: Y3 = 0 e portanto m3 ≠ m4 (a média da cultivar 3 difere da cultivar 4 ao nível de 5% de significância). 4.2.2) Teste t para comparação de duas médias Passos para realização do teste: i) Definir a hipótese de nulidade: Ho: 1y = 2y ; ii) Estabelecer o nível de significância (α); iii) Calcular a média de cada grupo ( iy ); iv) Calcular a variância de cada grupo )s( 2i ; 3570 Quando o valor absoluto da diferença entre duas médias for igual ou maior que a DMS, as médias podem ser consideradas estatisticamente diferentes. Exemplo 14. Foi realizada a análise de variância para os dados de porcentagem de absorção de água de 5 linhagens de feijão, com 3 repetições por linhagem. O valor do grau de liberdade do erro (GLE) foi 10 e o quadrado médio do erro (QME) foi 4,08. Compare as médias dos tratamentos a seguir pelo teste t: 1y = 95,5 2y = 87,8 3y = 86,9 4y = 26,3 5y = 108,2 i) tt para α=0,05 e GLE = 10 ⇒ tt = 2,228; ii) 3 )08,4.(2 228,2DMS = = 3,67; iii) Coloque as médias em ordem decrescente e faça a diferença entre elas duas a duas, começando da diferença entre a maior e a menor média e assim por diante: 5y =108,2 1y = 95,5 2y = 87,8 3y = 86,9 4y = 26,3 5.5.3) Desvantagens como os tratamentos correspondem a todas as combinações possíveis entre os níveis dos fatores, o número de tratamentos a ser avaliado pode aumentar muito, não podendo ser distribuídos em blocos completos casualizados devido à exigência de homogeneidade das parcelas dentro de cada bloco. Isto pode levar a complicações na análise, sendo preciso lançar mão de algumas técnicas alternativas (como por exemplo, o uso de blocos incompletos). A análise estatística e a interpretação dos resultados pode tornar-se um pouco mais complicada que nos experimentos simples. 5.5.4) Modelo estatístico do fatorial O modelo a seguir corresponde a um modelo de um delineamento em blocos casualizados (DBC) em esquema fatorial com 2 fatores (α e γ), mas pode ser estendido para os casos em que há mais fatores, incluindo os fatores isolados e as interações duplas, triplas e outras entre os fatores. ijkikkijijk e)(ìy +αγ+γ+α+β+= em que, ijky é o valor observado referente a parcela que recebeu o i-ésimo nível do fator α e o k-ésimo nível do fator γ no j-ésimo bloco; µ representa uma constante geral; βj representa o efeito do j-ésimo bloco; αi representa o efeito do i-ésimo nível do fator α; γ representa o efeito do k-ésimo nível do fator γ; (αγ)ik representa a interação entre o efeito do i-ésimo nível do fator α e o efeito do do k-ésimo nível do fator γ e eijk representa o erro experimental associado à observação yijk, suposto ter distribuição normal com média zero e variância comum. 5.5.5) Exemplo de fatorial Em um experimento em blocos casualizados com 4 repetições, no esquema fatorial 2x3 foi avaliado o efeito de 2 variedades de cana- de-açúcar (V1 e V2) e 3 tipos de inoculantes (I1, I2 e I3) quanto ao 6738 5.5) Experimentos fatoriais 5.5.1) Características Em alguns experimentos, o pesquisador avalia dois ou mais tipos de tratamentos e deseja verificar se há interação entre estes tipos. Tais experimentos são denominados experimentos fatoriais e os tipos de tratamentos são denominados fatores. As categorias (subdivisões) de cada fator são ditas níveis do fator. Como exemplo, considere um experimento em que se comparou o efeito de 3 estirpes de rizóbio (BR 9001, BR 9004 e BR 4812) e o efeito de um determinado fungo (presença e ausência do fungo) na variável número de nódulos produzido pelo feijão. Neste caso, existem dois fatores: estirpe de rizóbio e a ocorrência do fungo. Os níveis do fator estirpe são 3 (BR 9001, BR 9004 e BR 48122) e do fungo são 2 (presença e ausência). Costuma-se representar o fatorial pela multiplicação dos níveis. No exemplo anterior o fatorial é 3x2 (fatorial 3 por 2), assim fica claro que existem dois fatores, o primeiro fator com 3 níveis de estirpe e o segundo com 2 níveis de fungo. O número total de tratamentos avaliados também é dado pela multiplicação dos níveis, ou seja, no exemplo são avaliados 3x2 = 6 tratamentos avaliados (1: BR 9001 na presença do fungo; 2: BR 9004 na presença do fungo; 3: BR 4812 na presença do fungo; 4: BR 9001 na ausência do fungo; 5: BR 9004 na ausência do fungo; 6: BR 4812 na ausência do fungo. Se fossem, por exemplo, 3 fatores com 5, 2 e 3 níveis para cada fator respectivamente, a representação seria: fatorial 5x2x3, sendo avaliado um total de 30 tratamentos e assim por diante. Vale lembrar que os experimentos fatoriais não são delineamentos e sim um esquema de desdobramento de graus de liberdade de tratamentos, e podem ser instalado em qualquer dos delineamentos experimentais, DIC, DBC, etc. (Banzatto & Kronka, 1989). 5.5.2) Vantagens - Permite estudar os efeitos principais dos fatores e os efeitos das interações entre eles. 5y - 4y = 108,2-26,3 = 81,9 ⇒ 81,9 > 3,67 ∴ 5y ≠ 4y ; 5y - 3y = 108,2-86,9 = 21,3 ⇒ 21,3 > 3,67 ∴ 5y ≠ 3y ; 5y - 2y = 108,2-87,8 = 20,4 ⇒ 20,4 > 3,67 ∴ 5y ≠ 2y ; 5y - 1y = 108,2-95,5 =12,7 ⇒ 12,7 > 3,67 ∴ 5y ≠ 1y ; 1y - 4y = 95,5-26,3 = 69,2 ⇒ 69,2 > 3,67 ∴ 1y ≠ 4y ; 1y - 3y = 95,5-86,9 = 8,6 ⇒ 8,6 > 3,67 ∴ 1y ≠ 3y ; 1y - 2y = 95,5-87,8 = 7,7 ⇒ 7,7 > 3,67 ∴ 1y ≠ 2y ; 2y - 4y = 87,8-26,3 = 61,5 ⇒ 61,5 > 3,67 ∴ 2y ≠ 4y ; 2y - 3y = 87,8-86,9 = 0,9 ⇒ 0,9 < 3,67 ∴ 2y = 3y ; 3y - 4y = 86,9-26,3 = 60,6 ⇒ 60,6 > 3,67 ∴ 3y ≠ 4y ; iv) Coloque letras iguais para médias semelhantes e letras distintas para médias que diferem entre si e interprete o teste. 5y =108,2 a 1y = 95,5 b 2y = 87,8 c 3y = 86,9 c 4y = 26,3 d A linhagem 5 foi a que apresentou maior porcentagem de absorção de água diferindo das demais linhagens (Prob < 0,05). 4.3) Teste de Tukey A diferença mínima significante (D.M.S.) entre duas médias pelo teste de Tukey é dada por: 3966 r QME qDMS = em que q é um valor tabelado, o qual corresponde o valor obtido da combinação entre o número de tratamentos (I) e o grau de liberdade do erro (GLE) da análise de variância, para um nível de significância estabelecido (α). O QME e r já foram descritos no teste t. A interpretação é a mesma do teste t, ou seja, quando o valor absoluto da diferença entre duas médias for igual ou maior que a DMS, as médias podem ser consideradas estatisticamente diferentes. Exemplo 15: Compare as médias dos tratamentos do Exemplo14 pelo teste de Tukey. i) q para α=0,05; I = 5 tratamentos e GLE = 10 ⇒ q = 4,65; ii) 3 08,4 65,4DMS = = 5,42; iii) 5y - 4y = 81,9 > 5,42 ∴ 5y ≠ 4y ; 5y - 3y = 21,3 > 5,42 ∴ 5y ≠ 3y ; 5y - 2y = 20,4 > 5,42 ∴ 5y ≠ 2y ; 5y - 1y = 12,7 > 5,42 ∴ 5y ≠ 1y ; 1y - 4y = 69,2 > 5,42 ∴ 1y ≠ 4y ; 1y - 3y = 8,6 > 5,42 ∴ 1y ≠ 3y ; 1y - 2y = 7,7 > 5,42 ∴ 1y ≠ 2y ; 2y - 4y = 61,5 > 5,42 ∴ 2y ≠ 4y ; 2y - 3y = 0,9 < 5,42 ∴ 2y = 3y ; 3y - 4y = 60,6 > 5,42 ∴ 3y ≠ 4y ; SQ Bloco = 3205,70460)0,2158,2180,2497,2506,253( 4 1 22222 −++++ SQ Bloco = 70815,7225 – 70460,3205 = 355,4020. SQ Tratamento = 3205,70460)6,2596,2918,3431,291( 5 1 2222 −+++ SQ Tratamento = 71188,7140 – 70460,3205 = 728,3935. SQ Total = 72,82 + 58,32 + . . . + 27,42 + 39,02 – 70460,3205 SQ Total = 73209,0700 – 70460,3205 = 2748,7495. SQ Erro = 2748,7495 – 355,4020 - 728,3935 = 1664,9540. E o quadro de análise de variância para os dados do Exemplo 5.4.5) é: FV GL SQ QM F Prob>F Bloco 4 355,4020 88,8505 0,640 0,6441 Cobertura morta 3 728,3935 242,7978 1,750 0,2100 Erro 12 1664,9540 138,7462 Total 19 2748,7495 CV (%) = 19,83 Média geral: 59,4 Número de observações: 20 Como Prob > 0,05 para cobertura morta, conclui-se que as quatro coberturas mortas tiveram influência semelhante no peso seco do brócolis. Neste caso, não há necessidade de aplicação de um teste de comparação múltipla. Observação: Se o valor de F para tratamento for significativo a determinado nível α de significância, o pesquisador pode usar um teste de comparação múltipla para comparar as médias dos tratamentos (caso este seja qualitativo), diz-se então que o teste usado é protegido; caso contrário, se F for não significativo, o pesquisador poderá optar ou não pelo uso do teste e, então, diz-se que o teste é não protegido. 6540 5.4.2) Vantagens - Controla diferenças nas condições ambientais de um bloco para outro. - Leva a uma estimativa mais exata da variância residual ( 2σ̂ ), uma vez que a variação ambiental entre blocos é isolada. 5.4.3) Desvantagens - Há uma redução no número de graus de liberdade do erro pois o DBC utiliza o princípio do controle local. - O número de tratamentos a ser utilizado é limitado pela exigência de homogeneidade dentro dos blocos, não podendo ser muito elevado. 5.4.4)Modelo estatístico do DBC ijijij etbìy +++= em que, ij y representa a observação do i-ésimo tratamento no j- ésimo bloco; µ representa uma constante geral associada a esta variável aleatória; bj representa o efeito do j-ésimo bloco; ti representa o efeito do i-ésimo tratamento; e eij representa o erro experimental associado a observação yij, suposto ter distribuição normal com média zero e variância comum. 5.4.5) Exemplo de DBC Estudou-se a influência de 4 tipos de cobertura morta (sorgo, crotalária, milheto e vegetação espontânea) no peso seco de brócolis. O experimento foi instalado em DBC com 5 repetições. Os dados de peso seco estão dispostos na Tabela 6 a seguir. E as diferenças entre elas duas a duas: 5y - 4y = 81,9 ⇒ n = 5 ∴compara-se 81,9 com a DMS5 ⇒ 81,9 > 4,00 ∴ 5y ≠ 4y ; 5y - 3y = 21,3 ⇒ n = 4 ∴compara-se 21,3 com a DMS4 ⇒ 21,3 > 3,94 ∴ 5y ≠ 3y ; 5y - 2y = 20,4 ⇒ n = 3 ∴compara-se 20,4 com a DMS3 ⇒ 20,4 > 3,84 ∴ 5y ≠ 2y ; 5y - 1y = 12,7 ⇒ n = 2 ∴compara-se 12,7 com a DMS2 ⇒ 12,7 > 3,67 ∴ 5y ≠ 1y ; 1y - 4y = 69,2 ⇒ n = 4 ∴compara-se 69,2 com a DMS4 ⇒ 69,2 > 3,94 ∴ 1y ≠ 4y ; 1y - 3y = 8,6 ⇒ n = 3 ∴compara-se 8,6 com a DMS3 ⇒ 8,6 > 3,84 ∴ 1y ≠ 3y ; 1y - 2y = 7,7 ⇒ n = 2 ∴compara-se 7,7 com a DMS2 ⇒ 7,7 > 3,67 ∴ 1y ≠ 2y ; 2y - 4y = 61,5 ⇒ n = 3 ∴compara-se 61,5 com a DMS3 ⇒ 61,5 > 3,84 ∴ 2y ≠ 4y ; 2y - 3y = 0,9 ⇒ n = 2 ∴compara-se 0,9 com a DMS2 ⇒ 0,9 < 3,67 ∴ 2y = 3y ; 3y - 4y = 60,6 ⇒ n = 2 ∴compara-se 60,6 com a DMS2 ⇒ 60,6 > 3,67 ∴ 3y ≠ 4y . iv) Coloque letras iguais para médias semelhantes e letras distintas para médias que diferem entre si e interprete o teste. 5y =108,2 a 1y = 95,5 b 2y = 87,8 c 3y = 86,9 c 4y = 26,3 d 4.5) Teste de SNK (Student Newman Keuls) A diferença mínima significante (DMS) entre duas médias pelo teste de SNK é dada por: 4362 r QME qDMS nn = . O procedimento para a realização deste teste é bastante semelhante ao do teste de Duncan. A diferença é que nas DMS’s do SNK são usados os valores tabelados de qn ao invés de zn, ou seja, deve-se procurar o valor tabelado na Tabela de q ao nível de significância estebelecido (α), correspondente a combinação entre o número de médias abrangidas na comparação (n) e o grau de liberdade do erro (GLE) da análise de variância. Exemplo 17. Compare as médias dos tratamentos do Exemplo 14 pelo teste de SNK. i) Como no exemplo tem-se I=5 médias de tratamentos, é necessário calcular q5, q4, q3, e q2 , ou seja, é necessário o cálculo de qI = q5 até q2: q5 para α=0,05; n = 5 e GLE = 10 ⇒ q5 = 4,65; q4 para α=0,05; n = 4 e GLE = 10 ⇒ q4 = 4,33; q3 para α=0,05; n = 3 e GLE = 10 ⇒ q3 = 3,88; q2 para α=0,05; n = 2 e GLE = 10 ⇒ q2 = 3,15; ii) Calcula-se então as I-1= 4 DMS’s: 42,5 3 08,4 65,4DMS5 == ; 05,5 3 08,4 33,4DMS4 == ; 52,4 3 08,4 88,3DMS3 == ; .67,3 3 08,4 15,3DMS2 == E o quadro de análise de variância para os dados do Exemplo 5.3.5) é: FV GL SQ QM F Prob>F Variedades 3 13019,0330 4339,6776 5,668 0,0056 Erro 20 15314,0178 765,7009 Total 23 28333,0508 CV (%): 18,41 Média: y : 150,31 Número de observações: 24 Como Prob < 0,05 (valor fornecido por alguns programas computacionais de análise de variância), conclui-se que há diferença estatística significativa entre as médias de peso seco da parte aérea das quatro variedades de cana-de açúcar. Deve-se então aplicar algum dos testes de comparação múltipla nestas médias. 5.4) Delineamento em Blocos Casualizados (DBC) 5.4.1) Características Os tratamentos são distribuídos aleatoriamente em blocos (princípio do controle local) de modo que haja maior uniformidade possível dentro de cada bloco. O número de parcelas por bloco é igual ao número de tratamentos, ou seja, cada bloco deverá conter todos os tratamentos. O DBC possui os três princípios básicos da experimentação: casualização, repetição e controle local e, portanto, as repetições são organizadas em blocos. Normalmente, é o delineamento mais utilizado em condições de campo. A eficiência do DBC depende da uniformidade dentro de cada bloco, podendo haver heterogeneidade entre blocos. Os blocos podem ser instalados na forma quadrada, retangular ou irregular, desde que seja respeitada a uniformidade dentro do bloco. 6144 O quadro de análise de variância para os dados da Tabela 5 é: FV GL SQ QM F Tratamento I-1 CT J 1 I 1i 2 i −∑ = SQTrat./GLTrat. QMTrat./QMErro Erro I(J-1) SQTotal –SQTrat. SQErro/GLErro Total IJ-1 Cy J,I 1j,i 2 ij −∑ = CV(%)= y QMErro .100 J.I/yy J,I 1j,i ij∑= = No exemplo 5.3.5) tem-se: - Delineamento: DIC; - Tratamentos: I = 4 variedades de cana-de-açúcar (A, B, C, D); - Repetições: J = 6; - Variável a analisar: peso seco da parte aérea (g/parcela). Assim, os valores das somas de quadrados para o exemplo 5.3.5) são: SQ Tratamento = 25,542207)59,92287,101130,100559,667( 6 1 2222 −+++ 09 SQ Tratamento = 555226,28389 – 542207,2509 = 13019,0330. SQ Total = 113,832 + 133,892 + . . . + 922,592 + 153,772 – 542207,25 SQ Total = 570540,3017 - 542207,2509 = 28333,0508. SQ Erro = 28333,0508 – 13019,0330 = 15314,0178. iii) Lembrando que as médias colocadas em ordem decrescente são: 5y =108,2 1y = 95,5 2y = 87,8 3y = 86,9 4y = 26,3 E as diferenças entre elas duas a duas: 5y - 4y = 81,9 ⇒ n = 5 ∴compara-se 81,9 com a DMS5 ⇒ 81,9 > 4,65 ∴ 5y ≠ 4y ; 5y - 3y = 21,3 ⇒ n = 4 ∴compara-se 21,3 com a DMS4 ⇒ 21,3 > 4,33 ∴ 5y ≠ 3y ; 5y - 2y = 20,4 ⇒ n = 3 ∴compara-se 20,4 com a DMS3 ⇒ 20,4 > 3,88 ∴ 5y ≠ 2y ; 5y - 1y = 12,7 ⇒ n = 2 ∴compara-se 12,7 com a DMS2 ⇒ 12,7> 3,15 ∴ 5y ≠ 1y ; 1y - 4y = 69,2 ⇒ n = 4 ∴compara-se 69,2 com a DMS4 ⇒ 69,2 > 4,33 ∴ 1y ≠ 4y ; 1y - 3y = 8,6 ⇒ n = 3 ∴compara-se 8,6 com a DMS3 ⇒ 8,6 > 3,88 ∴ 1y ≠ 3y ; 1y - 2y = 7,7 ⇒ n = 2 ∴compara-se 7,7 com a DMS2 ⇒ 7,7 > 3,15 ∴ 1y ≠ 2y ; 2y - 4y = 61,5 ⇒ n = 3 ∴ compara-se 61,5 com a DMS3 ⇒ 61,5 > 3,88 ∴ 2y ≠ 4y ; 2y - 3y = 0,9 ⇒ n = 2 ∴compara-se 0,9 com a DMS2 ⇒ 0,9 < 3,15 ∴ 2y = 3y ; 3y - 4y = 60,6 ⇒ n = 2 ∴compara-se 60,6 com a DMS2 ⇒ 60,6 > 3,15 ∴ 3y ≠ 4y . 4560 Qui-quadrado (encontrada em alguns livros de estatística), correspondente a combinação entre o nível de significância estebelecido (α) e o valor dado por g/(π-2) . iv) No caso de rejeitar esta hipótese, os dois subgrupos formados serão independentemente submetidos aos passos i) a iii), fazendo respectivamente g=k1 e g=k2. O processo em cada subgrupo se encerra ao se aceitar Ho no passo iii) ou se cada subgrupo contiver apenas uma média. Exemplo 18. Agora vamos aplicar o algoritmo do teste de Scott e Knott nas médias do Exemplo 14 em que o quadrado médio do erro foi de 4,08 com 10 graus de liberdade, e as médias das 5 linhagens de feijão estimadas a partir de 3 repetições foram: 4y = )1(y = 26,3 3y = )2(y = 86,9 2y = )3(y = 87,8 1y = )4(y = 95,5 5y = )5(y = 108,2 lembrando que )i(y é a média do tratamento da posição ordenada i, com i = 1,..., 5. i) SQ da partição (1) vs (2), (3), (4) e (5) 5 )2,1085,958,879,863,26( 4 )2,1085,958,879,86( 1 3,26 B 222 o ++++ − +++ += Bo = 691,6900 + 35796,6400 - 32756,4180 = 3731,9120; alternância das parcelas evita-se uma possível vantagem de algum tratamento. A instalação do DIC no campo experimental exige uma certa homogeneidade das condições ambientais (como por exemplo quanto a fertilidade do solo, distribuição uniforme de água, etc.). 5.3.2) Vantagens - Possui grande flexibilidade quanto ao número de tratamentos e repetições, sendo dependente, entretanto, da quantidade de material e área experimental disponíveis. - Pode-se ter DIC não balanceado, ou seja, com números de repetições diferentes entre tratamentos, o que não leva a grandes alterações n - a análise de variância; mas os testes de comparações múltiplas passam a ser aproximados e não mais exatos. O ideal é que os tratamentos sejam igualmente repetidos. - Considerando o mesmo número de parcelas e tratamentos avaliados, é o delineamento que possibilita o maior grau de liberdade do erro. 5.3.3) Desvantagens - Exige homogeneidade das condições experimentais. Se as condições não forem uniformes, como se esperava antes da instalação do experimento, toda variação (exceto à devida a tratamentos) irá para o erro, aumentando sua estimativa e reduzindo, portanto, a precisão do experimento. 5.3.4) Modelo estatístico do DIC ijiij etìy ++= em que, ijy representa a observação do i-ésimo tratamento na j- ésima repetição; µ representa uma constante geral associada a esta variável aleatória; ti representa o efeito do i-ésimo tratamento; e eij representa o erro experimental associado a observação yij, suposto ter distribuição normal com média zero e variância comum. 5748 5.2.4) Homogeneidade: os erros devem apresentar variâncias comuns (homogeneidade = homocedasticidade de variâncias). Estas pressuposições visam facilitar a interpretação dos resultados e testar a significância nos testes de hipóteses. Na prática, o que pode ocorrer é a validade aproximada e não exata de alguma (s) destas pressuposições; neste caso, o pesquisador não perderia tanto com a aproximação visto que os testes aplicados na análise de variância são robustos quanto a isto. A homogeneidade de variância é que, na maioria das vezes, é necessária pois, caso não seja verificada, o teste F e de comparações múltiplas poderão ser alterados. Quando alguma (s) das pressuposições da análise não se verifica(m), existem alternativas que podem ser usadas, entre elas a transformação de dados com a posterior análise de variância destes dados transformados; ou a utilização dos recursos da estatística não paramétrica. Feitas as considerações iniciais necessárias para o entendimento dos próximos assuntos, iniciaremos agora os conceitos e exemplos dos delineamentos mais usuais. 5.3) Delineamento Inteiramente Casualizado (DIC) 5.3.1) Características - Os tratamentos são distribuídos nas parcelas de forma inteiramente casual (aleatória). - O DIC possui apenas os princípios da casualização e da repetição, não possuindo controle local e, portanto, as repetições não são organizadas em blocos. - Normalmente é mais utilizado em experimentos de laboratório; experimentos em vasos ou bandejas em casa de vegetação, onde há possibilidade de controle das condições ambientais. Nos experimentos em casa de vegetação recomenda-se constantemente mudar as parcelas de posição para evitar diferenças ambientais devido a posição da parcela na casa de vegetação. Com esta SQ da partição (1) e (2) vs (3), (4) e (5) 5 )2,1085,958,879,863,26( 3 )2,1085,958,87( 2 )9,863,26( B 222 o ++++ − ++ + + = Bo = 6407,1200 + 28324,0833 - 32756,4180 = 1974,7853; SQ da partição (1), (2) e (3) vs (4) e (5) 5 )2,1085,958,879,863,26( 2 )2,1085,95( 3 )8,879,863,26( B 222 o ++++ − + + ++ = Bo = 13467,0000 + 20746,8450 - 32756,4180 = 1457,4270; SQ da partição (1), (2), (3) e (4) vs (5) 5 )2,1085,958,879,863,26( 1 2,108 4 )5,958,879,863,26( B 222 o ++++ −+ +++ = Bo = 21978,0625 + 11707,2400 - 32756,4180 = 928,8845. A partição (1) vs (2), (3), (4) e (5) foi a que maximizou a soma de quadrados entre grupos (Bo = 3731,9120). ii) Considerando g=5, v=10 e 94,80 5 2,1085,958,879,863,26 y = ++++ = tem-se:     +−++− + =σ 3 08,4 .10)94,802,108(...)94,803,26( 105 1 222 o ) 269,120813,6000]4023,2120[ 15 12 o =+=σ ) 1208,269 9120,3731 . )2(2 −π π =λ =19,0806. 4956 O valor de 2 ))2/(5;05,0( −πχ = 2 )380,4;05,0(χ é 10,089. Como λ > 10,089 rejeita-se Ho, ou seja dois grupos são formados ao nível de 5%, o grupo 1 com apenas o tratamento (linhagem) 4=(1) e o grupo 2 com os tratamentos 3=(2), 2=(3), 1=(4) e 5=(5). Deve-se então repetir o algoritmo apenas para os subgrupos que contém mais de um tratamento, no caso apenas para o grupo 2. i) SQ da partição (2) vs (3), (4) e (5) 4 )2,1085,958,879,86( 3 )2,1085,958,87( 1 9,86 B 222 o +++ − ++ += Bo = 7551,6100 + 28324,0833 - 35796,6400 = 79,0533; SQ da partição (2) e (3) vs (4) e (5) 4 )2,1085,958,879,86( 2 )2,1085,95( 2 )8,879,86( B 222 o +++ − + + + = Bo = 15260,0450 + 20746,8450 - 35796,6400 = 210,2500; SQ da partição (2), (3) e (4) vs (5) 4 )2,1085,958,879,86( 1 2,108 3 )5,958,879,86( B 222 o +++ −+ ++ = Bo = 24336,0133 + 11707,2400 - 35796,6400 = 246,6133. A partição (2), (3) e (4) vs (5) foi a que maximizou a soma de quadrados entre grupos (Bo = 246,6133). seria possível realizar testes de hipóteses. O uso de um número adequado de repetições, possibilita uma boa estimativa do erro experimental, melhorando as estimativas de interesse. No entanto, o número de repetições pode ser limitado, por exemplo, pelo número de tratamentos que serão comparados, pela disponibilidade de material e de área experimental, entre outros fatores. 5.1.2) Casualização: refere-se à distribuição aleatória dos tratamentos às parcelas de modo que todas as parcelas tenham a mesma chance de receber qualquer um dos tratamentos. Com isso, a casualização evita que determinado tratamento seja favorecido e garante que os erros sejam independentes (Mead & Curnow, 1983). Alguns programas computacionais elaboram planilhas de campo já com os tratamentos aleatorizados, como por exemplo o MSTAT, SISVAR e outros. 5.1.3) Controle local: a idéia básica do controle local é a partição do conjunto total de parcelas em subconjuntos (blocos) que sejam os mais homogêneos possíveis. Para Hinkelmann & Kempthorne (1994), o princípio do controle local é o reconhecimento de padrões supostamente associados às parcelas. Este princípio é utilizado para atenuar problemas de heterogeneidade ambiental (por exemplo de solo, de distribuição de água no caso de experimentos irrigados, etc). 5.2) Pressuposições básicas da análise de variância Para realização de uma análise de variância deve-se aceitar algumas pressuposições básicas: 5.2.1) Aditividade: os efeitos de tratamentos e erro devem ser aditivos; 5.2.2) Independência: os erros devem ser independentes, ou seja, a probabilidade de que o erro de uma observação qualquer tenha um determinado valor não deve depender dos valores dos outros erros; 5.2.3) Normalidade: os erros devem ser normalmente distribuídos; 5550
Docsity logo



Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved