Delineamentos Experimentais Cada forma de aleatorizar dá em uma análise, ou seja, cada forma de distribuir ao acaso os tratamentos é que define a metodologia de análise. Dessa forma, essas disposições serão representadas por delineamentos a ser implantados conforme as condições do local e do estudo. No planejamento de um experimento é preciso definir a unidade experimental e a variável em análise. Sendo também necessária a definição dos tratamentos a ser comparada, a maneira de designar os tratamentos às unidades e o número de unidades que serão utilizadas. Uma imposição obrigatória está na casualização para distribuição dos tratamentos às unidades experimentais por sorteio. Algumas vezes é necessário impor restrições para proceder o sorteio, isto é, as unidade precisam ser organizadas antes do sorteio, e essa medida define o desenho ou delineamento do experimento. Assim, serão estudados aqui os delineamentos mais utilizados, sendo: Delineamento Inteiramente Casualizados - DIC Um delineamento inteiramente casualizados ou também chamado de ensaio randômico, será utilizado pelo pesquisador toda vez que este dispor de unidades similares ou condições homogêneas para conduzir seu experimento, destinando os tratamentos às unidades experimentais através de sorteio. Existe a obrigatoriedade de homogeneidade entre as unidades experimentais de um experimento inteiramente casualizados. Na verdade não existe condições de igualdade entre animais, plantas, solo, entre outros, mas sim, uma similaridade, que não deve significar igualdade. É recomendável que todos os tratamentos tenha o mesmo numero de repetições, de forma que, para que duas unidades sejam similares, precisam responder aos efeitos dos tratamentos de forma similar. Em um experimento de milho, não é preciso que as plantas sejam iguais, mas precisam ser da mesma variedade genética, e sejam todas expostas às mesmas condições para expressarem ao máximo seu desenvolvimento frente à variação de um fator a ser testado nessa cultura, como o tipo de adubo utilizado no plantio ou cobertura. Experimentos com plantas similares sorteia-se doses de adubo em todas as unidades do experimento. Delineamento em Blocos Casualizados Quando o pesquisador não possui uma área ou número de unidades experimentais similares para condução de um experimento, ou mesmo esse dispõe de pequenos grupos de unidades similares para implantar suas unidades experimentais, esse irá optar por implantar seu experimento dividindo as unidades a serem avaliadas em blocos ou mesmo áreas que ofereçam condições similares. Esse arranjo experimental é chamado de Delineamento em Blocos Casualizados, pois, nessa condição a distribuição dos tratamentos às parcelas experimentais estará condicionada ao bloco, e não em área total, como é feito no experimento inteiramente casualizados. Como exemplo podemos avaliar o efeito de quatro rações (R1, R2, R3 e R4) no ganho de peso de suínos. Como o pesquisador dispunha de 12 animais de pesos diferentes, ele organizou-os em condições similares. Unidade experimentais heterogêneas: Unidades experimentais homogêneas: Bloco 1 Bloco 2 Bloco 3 No desenho de um experimento em blocos casualizados, o pesquisador deverá distribuir por sorteio os tratamentos dentro do bloco, como já visto, de forma que cada bloco possua uma repetição do tratamento. Dessa forma, cada bloco receberá uma repetição do tratamento, e as outras repetições do tratamento ocorrerão com a repetição dos blocos. No exemplo, cada bloco (B1, B2 e B3) receberá uma repetição do tratamento, nesse caso, a cada animal será fornecido uma ração (R1, R2, R3 e R4) distribuída por sorteio de forma a respeitar os princípios da experimentação. Bloco 1 Bloco 2 Bloco 3 Experimentos em blocos surgiram na área agrícola, para designar faixas de terra de mesma fertilidade, ao qual comportavam blocos de unidades homogêneas que recebiam tratamentos diferentes. A análise de experimentos em blocos ao acaso ou blocos casualizados é relativamente fácil, desde de que, o numero de unidades experimentais dentro de cada bloco seja um múltiplo do numero de tratamentos que se pretende comparar. Delineamento em Quadrados Latinos O delineamento de um experimento em quadrados latinos exige a construção em blocos em duas direções: em “linhas” ou “colunas” ou comumente chamado de duble blocking, dupla blocagem. Como exemplo para fazer um experimento com 04 variedades de feijão, um agrônomo pesquisador precisou primeiro organizar área disponível em blocos de mesma condição de cultivo e, posteriormente, assegurar que cada cultivar fosse implantado na área experimental (em linha), onde cada bloco receberá uma variedade de feijão (em coluna). Assim, o experimento pode ser organizado em linhas de fertilidade e colunas da variedade a qual se pretender estudar. Observe o exemplo abaixo onde os blocos são representados pelas cores das parcelas experimentais, e as variedade representadas pelas figuras da semente de feijão: Na área experimental implantada acima, pode-se observar que cada bloco (linha) possui uma repetição de cada variedade de feijão estudada. Da mesma forma, cada variedade (linha) possui uma repetição em cada bloco, assim, caracterizando um experimento em quadrados latinos, não se observa repetições de blocos para variedades e nem de variedades dentro do bloco. Esse delineamento não é comum na prática devido a dificuldade de implantação a campo, conforme o objetivo da pesquisa. Outros Delineamentos Os delineamentos tratam da forma com que as unidades experimentais são organizadas, existindo basicamente três tipos de delineamentos: inteiramente casualizados quando as unidades experimentais são similares; blocos casualizados quando existem conjuntos de unidades similares; e, quadrados latinos quando as unidades são similares nas linhas e nas colunas. Existem ainda delineamentos aninhados e em parcelas subdivididas (Split-plot), porém, convém aqui estudar os mais simples antes dos mais complicados, sendo esses primeiros, de longe os mais utilizados. Pressuposições Básicas Inferência e Hipóteses A média e o desvio padrão descrevem uma amostra, sendo consideradas como estatística descritiva, mas não basta apenas descrever um comportamento. Na busca pelo conhecimento científico o que interessa é saber se um tratamento dá resultado melhor que o outro, independente de qual seja sua condição de forma a melhora-la em relação a um objetivo proposto. A inferência é básica na ciência, onde pesquisadores trabalham com amostras para descrever o que deve acontecer com uma população submetida às mesmas condições. Porém, existe um teste estatístico que o pesquisador utiliza para dizer que o que ele observou na amostra pode ou não, ser verdadeiro para toda população. Dessa forma, a diferença entre as médias resultantes de um experimento qualquer que serão avaliadas deverão ser “suficientemente grandes” para se afirmar que determinada alteração medida na amostra seja verdade. Em experimentos agrícolas deve-se controlar as causas de variação que podem influenciar sobre o que se pretende avaliar, tentando permitir que, apenas os tratamentos dispensados ao objeto da pesquisa sejam responsáveis pelas variações às quais pretende-se estudar. Racionalização dos testes Quando um pesquisador tem em mãos dados obtidos de um experimento, precisa de um teste estatístico para associar a inferência a um nível de significância (p = probabilidade). Quando um pesquisador diz que o resultado é significativo estatisticamente, quer dizer que provavelmente se toda população tivesse sido estudada, seria muito provável que os resultados obtidos fossem semelhantes ao observado no experimento. Porém, muito provável não significa “certo”. Como toda inferência é passível de erro, quando um pesquisador concluir que a variedade de milho A produz em média mais que a variedade B, pode estar cometendo um erro, não porque tenha errado o procedimento, mas, porque pode observar uma amostra que não condiz com atual população. Para esse exemplo utilizando variedades A e B de plantas de milho, plantadas em mesmo solo, adubadas com o mesmo fertilizante, irrigadas com a mesma lâmina de água, disposta sobre a mesma condição de luminosidade, entre outros fatores no delineamento adotado, pode ocorrer do pesquisador ter escolhido qualquer uma das duas variedades A ou B de um lote mais velho, portanto com menor vigor, o que poderá causar uma influencia na média de produção obtida no experimento. Assim, por ocorrer de algum fato “fugir ou escapar” do cuidado do pesquisador. A probabilidade dessa ocorrência é dada pelo nível de significância do teste, apresentado em termos técnicos que representam hipóteses a respeito de uma população. Para o exemplo utilizado com as variedades de milho, pode-se fazer duas hipóteses, sendo: 1ª A de que a média de produção da variedade A seja semelhante a média de produção da variedade B; essa hipótese é denominada de hipótese da nulidade. E indica-se por Ho (Lê-sê agá-zero) e se escreve: Ho = as médias são iguais 2ª A de que a média de produção das variedades A e B sejam diferentes, sendo essa hipótese denominada de hipótese alternativa. E indicase por H1 (lê-sê agá-um) e se escreve: H1 = as médias são diferentes Para decidir por uma das hipóteses o pesquisador pode submeter seus dados a um teste estatístico, se concluir que as médias são diferentes pode estar cometendo um erro. O pesquisador não sabe que está cometendo esse erro ao tomar essa decisão, mas pode estabelecer a probabilidade desse erro acontecer. Essa probabilidade é justamente o que os estatísticos chamam de nível de significância, então nível de significância é, a probabilidade de rejeitar Ho quando Ho é verdadeira. A escolha da significância é arbitrária e tradicionalmente representada pela letra alfa (α=0,05 ou α=0,01). Ao utilizar um teste com 5% de significância é usual afirmar que o resultado é significante e indicar com o uso de um asterisco. Já para 1%, indica-se sua significância com a utilização de dois asteriscos. Teste “F” - Fisher Conhecido como “Distribuição de Fisher” (Ronald Fisher) esse teste mede a razão entre duas variáveis independentes. Essa distribuição de probabilidade contínua surge frequentemente como, a distribuição nula de uma estatística de teste, particularmente, na análise de variância, que permite verificar médias de diferentes populações, para ver se essas possuem médias iguais estatisticamente ou não. Através da análise de variância pode-se comparar vários grupos ao mesmo tempo, quando se quer decidir se as diferenças amostrais observadas são reais (diferença na população) ou casuais (mera variabilidade amostral). “Parte do pressuposto que o acaso produz pequenos desvios, sendo as grandes diferenças amostrais geradas por causas reais, ou seja, pelo efeito dos tratamentos aplicados” Como exemplo inicialmente vamos nos basear na analise de dados de um experimento inteiramente ao acaso, onde o valor de “F” dado em uma tabela está associado a um numero de graus de liberdade de tratamento (numerador) e ao numero de graus de liberdade de resíduo (denominador). O valor de F ao nível de 5% de probabilidade, associando-se 3 (numerador) e 16 (denominador) graus de liberdade corresponde a 3,239 (aproximadamente 3,24) e é dado na tabela abaixo: Tabela de valores de F ao nível de 5% de significância G° liberdade (denominador) Resíduo ... 15 16 17 ... Tratamentos (numerador) 1 ... 2 ... 4,54 4,49 4,45 ... 3 ... 3,68 3,63 3,59 ... 4 ... 3,29 3,24 3,20 ... ... 3,06 3,01 2,96 ... ... Interpretação do Valor de F Um agrônomo queria comparar 3 variedades de milho A, B e C, após observação da área do local, definição da implantação a campo (delineamento), condução do experimento, a colheita da produção das variedades testadas deram origem a um banco de dados a ser avaliado através de uma análise de variâncias. Essa análise gera um quadro de análise de variâncias denominado Quadro ANAVA. Assim, ao sistematizar as informações obtidas com a decomposição do banco de dados, o agrônomo irá preencher esse quadro para obter o “Valor de F” calculado, ao qual, será comparado com o valor de F Tabelado, semelhante ao apresentado na tabela acima. Ao nível de 5% de probabilidade com 3 tratamento (numerador) e 16 graus de liberdade no resíduo (denominador) encontra-se F = 3,24. Esse valor tabelado deve então, ser comparado com o valor gerado pelo banco de dados que estará sendo analisado. Vamos supor que, o agrônomo tenha obtido um F calculado igual a 7,80, esse valor é maior que 3,24 (F tabelado), com base nessa comparação o agrônomo rejeitará a hipótese de que as médias de produção da variedade de milho sejam iguais, rejeitando-se a hipótese Ho e aceitando-se H1. Em prática as variedades A, B e C não apresentam em média a mesma produção, ou ainda, que pelo menos uma das variedades difere significativamente das demais variedades avaliadas. Se o valor do F calculado fosse menor que F tabelado, seria um indicativo que as média das cultivares são iguais, assim aceitando-se Ho, ou melhor, admitindo que a hipótese de nulidade é verdadeira. Como o valor de F calculado é maior que o F tabelado, deve-se rejeitar Ho e aceitar H1, pois isso indica que há diferença entre as médias. EXPERIMENTOS INTEIRAMENTE CASUALIZADOS Para comparar a produtividade de 4 variedades de milho (A, B, C, D), um agrônomo tomou 20 parcelas similares e sorteando plantou a variedade A em cinco parcelas, a variedade B em outras cinco e assim por diante até completar as vinte. Esse é um esquema de experimento inteiramente casualizados, com 4 tratamentos, que são as variedades, e cinco repetições (4 x 5 = 20 parcelas). Seu esquema de implantação a campo está descrito abaixo. 1 2 A 6 3 C 7 B 11 8 D 12 D 16 A A B C 10 B 14 B 18 C 15 D 19 D A C 9 13 17 5 4 D B 20 C A Valores Médios Para atender a análise dos dados de um experimento inteiramente casualizados, imagine que foi feito o experimento descrito anteriormente. A produção de cada parcelas foi anotada ao final do experimento e está apresentada na Tabela abaixo, nessa tabela também apresentam-se as médias d produção das variedades avaliadas. Tabela. Produção de milho em kg/100m2 segundo a variedade. A Variedades B C D MÉDIA Média geral = Abaixo são apresentados os dados da tabela de produção de milho, onde são indicados os valores obtidos para as variedades e identificados as médias por meio de uma linha tracejada. Observando as médias, será que o agrônomo tem condição de concluir que as variedades A, B, C e D tem produção diferente? Distribuição das produções de milho entorno das respectivas médias. A produção de uma mesma variedade varia ao acaso porque é uma função de uma série de fatores não controlados, tais como: qualidade das sementes, posição da semente no solo, exposição das parcelas ao vento, fertilidade, etc..., mas, a produção de variedades diferentes tanto pode ser explicada pelo acaso, como pelo fato de as variedades terem, mesmo, uma produção diferente. Até que ponto as diferenças observadas entre as medias de produção das variedade A, B, C e D, são suficientemente grandes para serem tomadas como evidência de que essas variedades tem, em média, produção estatisticamente diferente? A resposta dessa pergunta é dada pela Análise de Variância! ANÁLISE DE VARIÂNCIA Para fazer uma análise de variância são necessários pressuposições, onde a ideia principal é comparar a “variação devida aos tratamentos” (variedades no exemplo), com a variação devida ao acaso ou “resíduo”, sendo necessários uma série de cálculos. Na tabela abaixo são apresentados um experimento com “k” tratamentos (k= n° de tratamentos no experimento) onde cada tratamento tem “r” repetições. A soma dos resultados das “r” repetições de um mesmo tratamento constitui o “total” desse tratamento. As médias dos tratamentos foram indicadas por ẏ1, ẏ2, ẏ3... ẏk. O total geral é dado pelas somas dos totais de tratamentos. Tabela de um experimento ao inteiramente ao acaso. Tratamento total n° repet. médias 1 2 3 ẏ11 ẏ12 ẏ13 ... ẏ1r T1 r ẏ1 ẏ21 ẏ22 ẏ23 ... ẏ2r T2 r ẏ2 ẏ31 ẏ32 ẏ33 ... ẏ3r T3 r ẏ3 ... ... ... k ẏk1 ẏk2 ẏk3 ... ẏkr Tk r ẏk total Stot = S y n=k . R Para fazer a análise de variância de um experimento inteiramente ao acaso é preciso calcular as seguintes informações: A) Os graus de liberdade: B) O valor de “C”, dado pelo total geral elevado ao quadrado e dividido pelo número de observações. O Valor de C é conhecido como fator de correção C) A soma de quadrados totais D) A soma de quadrados de tratamentos E) A soma de quadrados de resíduos F) O quadrado médio dos tratamentos G) O quadrado médio dos resíduos H) O valor da “F” Note que, os Quadrados Médios (QM) são obtidos dividindo-se as Somas dos Quadrados por seus respectivos Graus de Liberdade. Todas as quantidades calculadas são apresentadas no Quadro de análise de variância QUADRO DE ANÁLISE DE VARIÂNCIA DE EXPERIMENTO INTEIRAMENTE AO ACASO CAUSAS DE VARIAÇÃO GL SQ QM F QMTr Fcalculado TRATAMENTOS K-1 SQTr RESÍDUO n-K SQRes TOTAL n–1 SQT QMRes - - Exercício exemplo de Aplicação Na tabela abaixo são apresentados os dados de um experimento inteiramente casualizados, onde a produção de milho em kg/100m 2 é dada em função das variedades. VARIEDADES A B C D Total 25 31 22 33 26 25 26 29 20 28 28 31 23 27 25 34 21 24 29 28 Total n° Repet Média Cacular: Graus de liberdade; Valor de Correção; Soma de Quadrados totais; Soma de Quadrados de tratamentos; Soma de Quadrados de resíduos. Com base nos resultados obtidos com a decomposição do banco de dados, preencha o Quadro de Análise de Variância QUADRO DE ANÁLISE DE VARIÂNCIA DE EXPERIMENTO INTEIRAMENTE AO ACASO CAUSAS DE VARIAÇÃO GL TRATAMENTOS RESÍDUO TOTAL Calcular: Quadrado médio de tratamentos; Quadrado médio do resíduo; O valor de “F”. SQ QM F Questões Explique como você faria para designar cinco tratamento (variedades A, B, C, D e E) em 25 unidades experimentais, considerando uma área igual ou, áreas diferentes? Os dados baixo foram obtidos de um experimento inteiramente ao acaso: A C 12 D E 11 B 15 C C 09 A 08 E 16 B 11 17 18 17 09 E 12 B 16 12 B C E 08 19 10 10 13 C E D B 14 07 16 A E A C D 13 13 17 13 D B D D A 17 16 A 10 11 A partir dos dados de produção acima, organize-os e construa uma tabela de distribuição de frequência, determinando o número de classes, seu intervalo, a probabilidade das classes, sua representação percentual e estabeleça o gráfico com os respectivos dados da tabela de frequência. Ainda utilizando os dados do experimento inteiramente casualizados, organizando os valores de produção para as variedades, calcule as respectivas médias, em seguida faça a decomposição do banco de dados e construa o quadro de análise de variâncias