Delineamentos Experimentais Cada forma de

Propaganda
Delineamentos Experimentais
Cada forma de aleatorizar dá em uma análise, ou seja, cada forma de
distribuir ao acaso os tratamentos é que define a metodologia de análise.
Dessa forma, essas disposições serão representadas por delineamentos a ser
implantados conforme as condições do local e do estudo.
No planejamento de um experimento é preciso definir a unidade
experimental e a variável em análise. Sendo também necessária a definição
dos tratamentos a ser comparada, a maneira de designar os tratamentos às
unidades e o número de unidades que serão utilizadas. Uma imposição
obrigatória está na casualização para distribuição dos tratamentos às unidades
experimentais por sorteio. Algumas vezes é necessário impor restrições para
proceder o sorteio, isto é, as unidade precisam ser organizadas antes do
sorteio, e essa medida define o desenho ou delineamento do experimento.
Assim, serão estudados aqui os delineamentos mais utilizados, sendo:
Delineamento Inteiramente Casualizados - DIC
Um delineamento inteiramente casualizados ou também chamado de
ensaio randômico, será utilizado pelo pesquisador toda vez que este dispor de
unidades similares ou condições homogêneas para conduzir seu experimento,
destinando os tratamentos às unidades experimentais através de sorteio.
Existe a obrigatoriedade de homogeneidade entre as unidades experimentais
de um experimento inteiramente casualizados. Na verdade não existe
condições de igualdade entre animais, plantas, solo, entre outros, mas sim,
uma similaridade, que não deve significar igualdade. É recomendável que
todos os tratamentos tenha o mesmo numero de repetições, de forma que,
para que duas unidades sejam similares, precisam responder aos efeitos dos
tratamentos de forma similar.
Em um experimento de milho, não é preciso que as plantas sejam iguais,
mas precisam ser da mesma variedade genética, e sejam todas expostas às
mesmas condições para expressarem ao máximo seu desenvolvimento frente à
variação de um fator a ser testado nessa cultura, como o tipo de adubo
utilizado no plantio ou cobertura.
Experimentos com plantas similares sorteia-se doses de adubo em todas as
unidades do experimento.
Delineamento em Blocos Casualizados
Quando o pesquisador não possui uma área ou número de unidades
experimentais similares para condução de um experimento, ou mesmo esse
dispõe de pequenos grupos de unidades similares para implantar suas
unidades experimentais, esse irá optar por implantar seu experimento dividindo
as unidades a serem avaliadas em blocos ou mesmo áreas que ofereçam
condições similares. Esse arranjo experimental é chamado de Delineamento
em Blocos Casualizados, pois, nessa condição a distribuição dos tratamentos
às parcelas experimentais estará condicionada ao bloco, e não em área total,
como é feito no experimento inteiramente casualizados.
Como exemplo podemos avaliar o efeito de quatro rações (R1, R2, R3 e
R4) no ganho de peso de suínos. Como o pesquisador dispunha de 12 animais
de pesos diferentes, ele organizou-os em condições similares.
Unidade experimentais heterogêneas:
Unidades experimentais homogêneas:
Bloco 1
Bloco 2
Bloco 3
No desenho de um experimento em blocos casualizados, o pesquisador
deverá distribuir por sorteio os tratamentos dentro do bloco, como já visto, de
forma que cada bloco possua uma repetição do tratamento. Dessa forma, cada
bloco receberá uma repetição do tratamento, e as outras repetições do
tratamento ocorrerão com a repetição dos blocos.
No exemplo, cada bloco (B1, B2 e B3) receberá uma repetição do
tratamento, nesse caso, a cada animal será fornecido uma ração (R1, R2, R3 e
R4) distribuída por sorteio de forma a respeitar os princípios da
experimentação.
Bloco 1
Bloco 2
Bloco 3
Experimentos em blocos surgiram na área agrícola, para designar faixas
de terra de mesma fertilidade, ao qual comportavam blocos de unidades
homogêneas que recebiam tratamentos diferentes. A análise de experimentos
em blocos ao acaso ou blocos casualizados é relativamente fácil, desde de
que, o numero de unidades experimentais dentro de cada bloco seja um
múltiplo do numero de tratamentos que se pretende comparar.
Delineamento em Quadrados Latinos
O delineamento de um experimento em quadrados latinos exige a
construção em blocos em duas direções: em “linhas” ou “colunas” ou
comumente chamado de duble blocking, dupla blocagem.
Como exemplo para fazer um experimento com 04 variedades de feijão,
um agrônomo pesquisador precisou primeiro organizar área disponível em
blocos de mesma condição de cultivo e, posteriormente, assegurar que cada
cultivar fosse implantado na área experimental (em linha), onde cada bloco
receberá uma variedade de feijão (em coluna). Assim, o experimento pode ser
organizado em linhas de fertilidade e colunas da variedade a qual se pretender
estudar. Observe o exemplo abaixo onde os blocos são representados pelas
cores das parcelas experimentais, e as variedade representadas pelas figuras
da semente de feijão:
Na área experimental implantada acima, pode-se observar que cada
bloco (linha) possui uma repetição de cada variedade de feijão estudada. Da
mesma forma, cada variedade (linha) possui uma repetição em cada bloco,
assim, caracterizando um experimento em quadrados latinos, não se observa
repetições de blocos para variedades e nem de variedades dentro do bloco.
Esse delineamento não é comum na prática devido a dificuldade de
implantação a campo, conforme o objetivo da pesquisa.
Outros Delineamentos
Os delineamentos tratam da forma com que as unidades experimentais
são organizadas, existindo basicamente três tipos de delineamentos:
inteiramente casualizados quando as unidades experimentais são similares;
blocos casualizados quando existem conjuntos de unidades similares; e,
quadrados latinos quando as unidades são similares nas linhas e nas colunas.
Existem ainda delineamentos aninhados e em parcelas subdivididas
(Split-plot), porém, convém aqui estudar os mais simples antes dos mais
complicados, sendo esses primeiros, de longe os mais utilizados.
Pressuposições Básicas
Inferência e Hipóteses
A média e o desvio padrão descrevem uma amostra, sendo
consideradas como estatística descritiva, mas não basta apenas descrever um
comportamento. Na busca pelo conhecimento científico o que interessa é
saber se um tratamento dá resultado melhor que o outro, independente de qual
seja sua condição de forma a melhora-la em relação a um objetivo proposto.
A inferência é básica na ciência, onde pesquisadores trabalham com
amostras para descrever o que deve acontecer com uma população submetida
às mesmas condições. Porém, existe um teste estatístico que o pesquisador
utiliza para dizer que o que ele observou na amostra pode ou não, ser
verdadeiro para toda população.
Dessa forma, a diferença entre as médias resultantes de um
experimento qualquer que serão avaliadas deverão ser “suficientemente
grandes” para se afirmar que determinada alteração medida na amostra seja
verdade. Em experimentos agrícolas deve-se controlar as causas de variação
que podem influenciar sobre o que se pretende avaliar, tentando permitir que,
apenas os tratamentos dispensados ao objeto da pesquisa sejam responsáveis
pelas variações às quais pretende-se estudar.
Racionalização dos testes
Quando um pesquisador tem em mãos dados obtidos de um
experimento, precisa de um teste estatístico para associar a inferência a um
nível de significância (p = probabilidade).
Quando um pesquisador diz que o resultado é significativo
estatisticamente, quer dizer que provavelmente se toda população tivesse sido
estudada, seria muito provável que os resultados obtidos fossem semelhantes
ao observado no experimento. Porém, muito provável não significa “certo”.
Como toda inferência é passível de erro, quando um pesquisador
concluir que a variedade de milho A produz em média mais que a variedade B,
pode estar cometendo um erro, não porque tenha errado o procedimento, mas,
porque pode observar uma amostra que não condiz com atual população.
Para esse exemplo utilizando variedades A e B de plantas de milho,
plantadas em mesmo solo, adubadas com o mesmo fertilizante, irrigadas com a
mesma lâmina de água, disposta sobre a mesma condição de luminosidade,
entre outros fatores no delineamento adotado, pode ocorrer do pesquisador ter
escolhido qualquer uma das duas variedades A ou B de um lote mais velho,
portanto com menor vigor, o que poderá causar uma influencia na média de
produção obtida no experimento. Assim, por ocorrer de algum fato “fugir ou
escapar” do cuidado do pesquisador.
A probabilidade dessa ocorrência é dada pelo nível de significância do
teste, apresentado em termos técnicos que representam hipóteses a respeito
de uma população.
Para o exemplo utilizado com as variedades de milho, pode-se fazer
duas hipóteses, sendo:
1ª A de que a média de produção da variedade A seja semelhante a
média de produção da variedade B; essa hipótese é denominada de hipótese
da nulidade. E indica-se por Ho (Lê-sê agá-zero) e se escreve:
Ho = as médias são iguais
2ª A de que a média de produção das variedades A e B sejam
diferentes, sendo essa hipótese denominada de hipótese alternativa. E indicase por H1 (lê-sê agá-um) e se escreve:
H1 = as médias são diferentes
Para decidir por uma das hipóteses o pesquisador pode submeter seus
dados a um teste estatístico, se concluir que as médias são diferentes pode
estar cometendo um erro.
O pesquisador não sabe que está cometendo esse erro ao tomar essa
decisão, mas pode estabelecer a probabilidade desse erro acontecer. Essa
probabilidade é justamente o que os estatísticos chamam de nível de
significância, então nível de significância é, a probabilidade de rejeitar Ho
quando Ho é verdadeira.
A escolha da significância é arbitrária e tradicionalmente representada
pela letra alfa (α=0,05 ou α=0,01). Ao utilizar um teste com 5% de significância
é usual afirmar que o resultado é significante e indicar com o uso de um
asterisco. Já para 1%, indica-se sua significância com a utilização de dois
asteriscos.
Teste “F” - Fisher
Conhecido como “Distribuição de Fisher” (Ronald Fisher) esse teste
mede a razão entre duas variáveis independentes. Essa distribuição de
probabilidade contínua surge frequentemente como, a distribuição nula de uma
estatística de teste, particularmente, na análise de variância, que permite
verificar médias de diferentes populações, para ver se essas possuem médias
iguais estatisticamente ou não.
Através da análise de variância pode-se comparar vários grupos ao
mesmo tempo, quando se quer decidir se as diferenças amostrais observadas
são reais (diferença na população) ou casuais (mera variabilidade amostral).
“Parte do pressuposto que o acaso produz pequenos desvios,
sendo as grandes diferenças amostrais geradas por causas reais, ou seja,
pelo efeito dos tratamentos aplicados”
Como exemplo inicialmente vamos nos basear na analise de dados de
um experimento inteiramente ao acaso, onde o valor de “F” dado em uma
tabela está associado a um numero de graus de liberdade de tratamento
(numerador) e ao numero de graus de liberdade de resíduo (denominador).
O valor de F ao nível de 5% de probabilidade, associando-se 3
(numerador) e 16 (denominador) graus de liberdade corresponde a 3,239
(aproximadamente 3,24) e é dado na tabela abaixo:
Tabela de valores de F ao nível de 5% de significância
G° liberdade
(denominador)
Resíduo
...
15
16
17
...
Tratamentos (numerador)
1
...
2
...
4,54
4,49
4,45
...
3
...
3,68
3,63
3,59
...
4
...
3,29
3,24
3,20
...
...
3,06
3,01
2,96
...
...
Interpretação do Valor de F
Um agrônomo queria comparar 3 variedades de milho A, B e C, após
observação da área do local, definição da implantação a campo
(delineamento), condução do experimento, a colheita da produção das
variedades testadas deram origem a um banco de dados a ser avaliado através
de uma análise de variâncias.
Essa análise gera um quadro de análise de variâncias denominado
Quadro ANAVA. Assim, ao sistematizar as informações obtidas com a
decomposição do banco de dados, o agrônomo irá preencher esse quadro para
obter o “Valor de F” calculado, ao qual, será comparado com o valor de F
Tabelado, semelhante ao apresentado na tabela acima.
Ao nível de 5% de probabilidade com 3 tratamento (numerador) e 16
graus de liberdade no resíduo (denominador) encontra-se F = 3,24. Esse valor
tabelado deve então, ser comparado com o valor gerado pelo banco de dados
que estará sendo analisado.
Vamos supor que, o agrônomo tenha obtido um F calculado igual a 7,80,
esse valor é maior que 3,24 (F tabelado), com base nessa comparação o
agrônomo rejeitará a hipótese de que as médias de produção da variedade de
milho sejam iguais, rejeitando-se a hipótese Ho e aceitando-se H1. Em prática
as variedades A, B e C não apresentam em média a mesma produção, ou
ainda, que pelo menos uma das variedades difere significativamente das
demais variedades avaliadas.
Se o valor do F calculado fosse menor que F tabelado, seria um
indicativo que as média das cultivares são iguais, assim aceitando-se Ho, ou
melhor, admitindo que a hipótese de nulidade é verdadeira. Como o valor de F
calculado é maior que o F tabelado, deve-se rejeitar Ho e aceitar H1, pois isso
indica que há diferença entre as médias.
EXPERIMENTOS INTEIRAMENTE CASUALIZADOS
Para comparar a produtividade de 4 variedades de milho (A, B, C, D),
um agrônomo tomou 20 parcelas similares e sorteando plantou a variedade A
em cinco parcelas, a variedade B em outras cinco e assim por diante até
completar as vinte.
Esse é um esquema de experimento inteiramente casualizados, com 4
tratamentos, que são as variedades, e cinco repetições (4 x 5 = 20 parcelas).
Seu esquema de implantação a campo está descrito abaixo.
1
2
A
6
3
C
7
B
11
8
D
12
D
16
A
A
B
C
10
B
14
B
18
C
15
D
19
D
A
C
9
13
17
5
4
D
B
20
C
A
Valores Médios
Para atender a análise dos dados de um experimento inteiramente
casualizados, imagine que foi feito o experimento descrito anteriormente. A
produção de cada parcelas foi anotada ao final do experimento e está
apresentada na Tabela abaixo, nessa tabela também apresentam-se as médias
d produção das variedades avaliadas.
Tabela. Produção de milho em kg/100m2 segundo a variedade.
A
Variedades
B
C
D
MÉDIA
Média geral =
Abaixo são apresentados os dados da tabela de produção de milho, onde são
indicados os valores obtidos para as variedades e identificados as médias por
meio de uma linha tracejada. Observando as médias, será que o agrônomo tem
condição de concluir que as variedades A, B, C e D tem produção diferente?
Distribuição das produções de milho entorno das respectivas médias.
A produção de uma mesma variedade varia ao acaso porque é uma
função de uma série de fatores não controlados, tais como: qualidade das
sementes, posição da semente no solo, exposição das parcelas ao vento,
fertilidade, etc..., mas, a produção de variedades diferentes tanto pode ser
explicada pelo acaso, como pelo fato de as variedades terem, mesmo, uma
produção diferente.
Até que ponto as diferenças observadas entre as medias de produção
das variedade A, B, C e D, são suficientemente grandes para serem tomadas
como evidência de que essas variedades tem, em média, produção
estatisticamente diferente?
A resposta dessa pergunta é dada pela Análise de Variância!
ANÁLISE DE VARIÂNCIA
Para fazer uma análise de variância são necessários pressuposições,
onde a ideia principal é comparar a “variação devida aos tratamentos”
(variedades no exemplo), com a variação devida ao acaso ou “resíduo”, sendo
necessários uma série de cálculos.
Na tabela abaixo são apresentados um experimento com “k” tratamentos
(k= n° de tratamentos no experimento) onde cada tratamento tem “r”
repetições.
A soma dos resultados das “r” repetições de um mesmo tratamento
constitui o “total” desse tratamento. As médias dos tratamentos foram indicadas
por ẏ1, ẏ2, ẏ3... ẏk. O total geral é dado pelas somas dos totais de tratamentos.
Tabela de um experimento ao inteiramente ao acaso.
Tratamento
total
n° repet.
médias
1
2
3
ẏ11
ẏ12
ẏ13
...
ẏ1r
T1
r
ẏ1
ẏ21
ẏ22
ẏ23
...
ẏ2r
T2
r
ẏ2
ẏ31
ẏ32
ẏ33
...
ẏ3r
T3
r
ẏ3
...
...
...
k
ẏk1
ẏk2
ẏk3
...
ẏkr
Tk
r
ẏk
total
Stot = S y
n=k . R
Para fazer a análise de variância de um experimento inteiramente ao
acaso é preciso calcular as seguintes informações:
A) Os graus de liberdade:
B) O valor de “C”, dado pelo total geral elevado ao quadrado e dividido pelo
número de observações. O Valor de C é conhecido como fator de
correção
C) A soma de quadrados totais
D) A soma de quadrados de tratamentos
E) A soma de quadrados de resíduos
F) O quadrado médio dos tratamentos
G) O quadrado médio dos resíduos
H) O valor da “F”
Note que, os Quadrados Médios (QM) são obtidos dividindo-se as
Somas dos Quadrados por seus respectivos Graus de Liberdade. Todas as
quantidades calculadas são apresentadas no Quadro de análise de variância
QUADRO DE ANÁLISE DE VARIÂNCIA DE EXPERIMENTO INTEIRAMENTE AO ACASO
CAUSAS DE VARIAÇÃO
GL
SQ
QM
F
QMTr
Fcalculado
TRATAMENTOS
K-1
SQTr
RESÍDUO
n-K
SQRes
TOTAL
n–1
SQT
QMRes
-
-
Exercício exemplo de Aplicação
Na tabela abaixo são apresentados os dados de um experimento
inteiramente casualizados, onde a produção de milho em kg/100m 2 é dada em
função das variedades.
VARIEDADES
A
B
C
D
Total
25
31
22
33
26
25
26
29
20
28
28
31
23
27
25
34
21
24
29
28
Total
n° Repet
Média
Cacular:
Graus de liberdade;
Valor de Correção;
Soma de Quadrados totais;
Soma de Quadrados de tratamentos;
Soma de Quadrados de resíduos.
Com base nos resultados obtidos com a decomposição do banco de dados,
preencha o Quadro de Análise de Variância
QUADRO DE ANÁLISE DE VARIÂNCIA DE EXPERIMENTO INTEIRAMENTE AO ACASO
CAUSAS DE VARIAÇÃO GL
TRATAMENTOS
RESÍDUO
TOTAL
Calcular:
Quadrado médio de tratamentos;
Quadrado médio do resíduo;
O valor de “F”.
SQ
QM
F
Questões
Explique como você faria para designar cinco tratamento (variedades A, B, C,
D e E) em 25 unidades experimentais, considerando uma área igual ou, áreas
diferentes?
Os dados baixo foram obtidos de um experimento inteiramente ao acaso:
A
C
12
D
E
11
B
15
C
C
09
A
08
E
16
B
11
17
18
17
09
E
12
B
16
12
B
C
E
08
19
10
10
13
C
E
D
B
14
07
16
A
E
A
C
D
13
13
17
13
D
B
D
D
A
17
16
A
10
11
A partir dos dados de produção acima, organize-os e construa uma tabela de
distribuição de frequência, determinando o número de classes, seu intervalo, a
probabilidade das classes, sua representação percentual e estabeleça o gráfico
com os respectivos dados da tabela de frequência.
Ainda utilizando os dados do experimento inteiramente casualizados,
organizando os valores de produção para as variedades, calcule as respectivas
médias, em seguida faça a decomposição do banco de dados e construa o
quadro de análise de variâncias
Download