Aula 02 - FCAV Unesp

Propaganda
EXPERIMENTAÇÃO ZOOTÉCNICA
Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari
[email protected]
ALGUNS CONCEITOS BÁSICOS
População e Amostra

População
é
o
conjunto
de
elementos que têm, em comum,
uma determinada característica.

Todo subconjunto não vazio e com
menor número de elementos do
que o conjunto definido como
população constitui uma amostra
desta população.
ALGUNS CONCEITOS BÁSICOS
População e Amostra

Exemplo. O número total de lagartas de Spodoptera
frugiperda em uma cultura de milho constitui uma
população.

Uma vez definida a unidade amostral (1 animal, um conjunto de 5 animais, ou
uma área na qual será contada o número de lagartas)

a população pode ser considerada como um conjunto de unidades amostrais.

um subconjunto tomado aleatoriamente deste conjunto é chamado de amostra
aleatória de tamanho n.

Neste exemplo as observações são obtidas através de contagens do número de
lagartas em cada unidade amostral.

Estas observações são chamadas de variável em estudo.
MEDIDAS DE POSIÇÃO E DE DISPERSÃO
Medidas de Posição e Dispersão
• As
populações
são
descritas
por
certas
características chamadas de parâmetros.
• As amostras são descritas pelas mesmas
características,
porém
denominadas
de
estimativas de parâmetros ou estatísticas.
• Algum desses parâmetros são chamados de medidas de posição e outros
de medidas de dispersão.
Estudo de distribuições de frequências

Quando a variável em estudo é quantitativa, discreta ou
contínua, as principais características as serem observadas
numa distribuição de frequência são:
1. Valor típico ou representativo;
2. Dispersão;
3. Assimetria;
4. Valores discrepantes ou outliers;
5. Formação de subgrupos
Estudo de distribuições de frequências
1. Valor típico ou representativo
Corresponde à escolha de um único valor para
representar todo o conjunto de valores.
2. Dispersão
É uma medida de concentração do dados em torno do valor típico.
•
Geralmente é dado pela
variância, desvio padrão,
coeficiente de variação e
distância interquartílica
Estudo de distribuições de frequências
3. Assimetria
Exemplo. No estudo da renda das famílias
brasileiras, a grande maioria das famílias apresenta
baixo rendimento familiar, enquanto que a minoria
apresenta alto rendimento.
4. Valores discrepantes ou outliers
São valores que se distanciam demais dos outros e pouco prováveis de
ocorrerem novamente.
•
Principais causas da ocorrência desses valores: erro de
transcrição de dados; algum fato importante ocorreu
durante o trabalho e o valor é verdadeiro e deve ser
considerado como tal.
Estudo de distribuições de frequências
5. Formação de grupos
Exemplo. Ao estudar-se a distribuição das alturas dos alunos,
pode-se chegar à conclusão que existem dois grupos, formados
de acordo com o gênero.
Algumas medidas
1. Medidas de tendência central
As duas medidas de tendência central mais utilizadas para
resumir um conjunto de dados quantitativos são: a média
aritmética e a mediana.

Média Aritmética: é a soma dos valores numéricos de uma variável
dividida pelo numero total de variáveis, e é dada por:
onde,
: é o número total de variáveis da amostra
: o valor observado da variável na -ésima unidade
experimental
Algumas medidas
Exemplo 1. Considere os pesos ao nascer, em kg, de 10 bezerros da
raça de gado Crioula e da raça Nelore apresentados na tabela
abaixo:
Raça
Pesos ao nascer em kg
Crioula
47 51 45 50 50 52 46 49 53 51
Nelore
51 40 46 48 54 56 44 43 55 57
•
Média da raça Crioula:
∑
•
kg
Média da raça Nelore:
∑
kg
Algumas medidas
Exemplo 1. Considere os pesos ao nascer, em kg, de 10 bezerros da raça de gado
Crioula e da raça Nelore apresentados na tabela abaixo:
Raça
Pesos ao nascer em kg
Crioula
47 51 45 50 50 52 46 49 53 51
Nelore
51 40 46 48 54 56 44 43 55 57
No R...
# Média da raça Crioula
TR_C <- c(rep("crioula",10)); TR_C
r <- c(1:10); r
Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C
df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C
mean(Y_C);
# média
# Média da raça Nelore
TR_N <- c(rep("nelore",10)); TR_N
rep <- c(1:10); rep
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N
mean(Y_C);
# média
Algumas medidas
•
A principal restrição ao uso da média
aritmética é que ela é muito sensível a
valores excessivamente altos ou baixos
(outliers)
•
É uma medida bastante adequada
quando
os
dados
aproximadamente,
uma
apresentam,
distribuição
normal.
•
Quando a distribuição é assimétrica
deve-se utilizar, preferencialmente,
a mediana.
média
mediana
média
mediana
mediana
média
Algumas medidas
Desvio: O desvio de um dado
em relação a média
é dado por:
•
Assim, existem desvios positivos, negativos e nulos.
•
Para os dados de pesos ao nascer de bezerros da raça Crioula,
apresentado no Exemplo 1, com média
•
kg, temos:
47
51
45
50
50
52
46
49
53
51
-2,4
1,6
-4,4
0,6
0,6
2,6
-3,4
-0,4
3,6
1,6
Para os dados de pesos ao nascer de bezerros da raça Nelore,
apresentado no Exemplo 1, com média
kg, temos:
51
40
46
48
54
56
44
43
55
57
1,6
-9,4
-3,4
-1,4
4,6
6,6
-5,4
-6,4
5,6
7,6
Algumas medidas
Raça Crioula
Raça Nelore
58
58
56
56
54
52
51
52
53
51
50 50
50
44
55
54
54
52
51
50
48
46
57
56
48
49
48
46
47
45
46
46
44
42
peso ao nascer
42
40
peso médio
40
38
desvio
38
44
43
peso ao nascer
peso médio
40
desvio
• Da composição dos dois gráficos, pode-se verificar que na Raça
Crioula houve menor variação do desvio (menor dispersão dos
dados ao redor da média)
Algumas medidas
Propriedades da média aritmética
P1: A soma dos desvios calculados em relação à média aritmética do
conjunto de dados é nula, isto é:
P2: O menor valor da soma dos quadrados desvios é atingido quando estes são
calculados em relação à média, ou seja:
PS: Quando trabalhamos com todos os
elementos de uma população, a média
aritmética é representada por , e calculada por:
Algumas medidas

Mediana: é o valor que divide ao meio um conjunto de dados ordenados,
em que 50% dos valores se posicionam abaixo e 50% acima dele

Na prática, nem sempre existe este valor central e toma-se como
mediana a média dos dois valores centrais.

Para os dados de pesos ao nascer de bezerros da raça Crioula,
apresentado no Exemplo 1, com média
Raça
Crioula
Pesos ao nascer em kg
47
51
45
50
50
52
46
49
kg, temos:
posição da mediana
53
51
valor da mediana (
)
Conjunto de dados ordenados
45
46
47
49
50
=
50
51
51
50 + 50
= 50
2
52
53
43
44
45
46
47
48
49
50
51
52
53
54
55
Pesos ao nascer
Diagrama de pontos para peso ao nascer da
raça Crioula – cálculo da mediana
Algumas medidas
Os cálculos da mediana e dos quartis para um histograma serão feitos por meio de
argumentos geométricos, através da proporcionalidade existente entre área e base
de retângulos.

Geometricamente:

a mediana
Desenho esquemático para uma
distribuição normal
é o valor da abscissa que determina uma linha vertical que
divide o histograma em duas partes de áreas iguais, ou seja, 50% da área está
abaixo do primeiro quartil e 50% da área está acima.

o primeiro quartil
é o valor da abscissa que determina uma linha vertical
que divide o histograma em duas partes distintas, ou seja, 25% da área está
abaixo do primeiro quartil e 75% da área está acima.

o terceiro quartil
é o valor da abscissa que determina uma linha vertical
que divide o histograma em duas partes distintas, ou seja, 75% da área está
abaixo do terceiro quartil e 25% da área está acima.
Algumas medidas
Os cálculos da mediana e dos quartis no R...
# Determinação dos quartis da raça Crioula
TR_C <- c(rep("crioula",10)); TR_C
r <- c(1:10); r
Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C
df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C
sort(Y_C)
# organiza os dados em ordem crescente (Crioula)
quantile(Y_C) # calculo dos quartis (Crioula)
# Determinação dos quartis da raça Nelore
TR_N <- c(rep("nelore",10)); TR_N
rep <- c(1:10); rep
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N
sort(Y_N)
# organiza os dados em ordem crescente (Nelore)
quantile(Y_N) # calculo dos quartis (Nelore)
Desenho esquemático para uma
distribuição normal
Algumas medidas
2. Medidas de dispersão
Quando apresentamos uma medida de tendência central para representar
um conjunto de dados, é necessário que essa medida seja acompanhada
de uma outra que resume a variabilidade (dispersão dos dados).
médias
Nelore
Crioula
38
40
42
44
46
48
50
= 49,4
52
54
56
58
Pesos ao nascer
Diagrama de pontos para peso ao nascer das raças Crioula e Nelore
•
Apesar das duas distribuições terem a mesma média nas amostras, os
valores da raça Nelore estão mais espalhados (dispersos) do que os valores
da raça Crioula.
•
A variabilidade na raça Nelore é maior que na raça Crioula.
Algumas medidas
2. Medidas de dispersão
Uma
medida
de
dispersão
quantifica
a
magnitude
da
variabilidade dos dados. Ela é de fundamental importância, pois a
estatística só existe porque o fenômenos tem variabilidade.
•
Vamos estudar as seguintes medidas de dispersão:
•
variância
•
desvio padrão
•
erro padrão
•
coeficiente de variação
•
distância interquartílica
Algumas medidas

Variância e desvio padrão
Para o cálculo da variância e do desvio padrão, o princípio básico é
analisar os desvios das observações em relação à média aritmética.
•
O valor zero para a variância ou desvio padrão indica ausência de
variação; o valor da medida vai aumentando à medida que aumenta
a variação.
Variância Populacional
Variância da Amostra
sendo:
tamanho da população
tamanho da amostra
média populacional
média da amostra
Algumas medidas

Variância e desvio padrão
A variância apresenta um inconveniente de ordem prática, ela é
expressa em unidades ao quadrado, isto causa problemas de
interpretação.
•
Uma medida de variabilidade, calculada com base na variância é o
desvio padrão, o qual é expresso na mesma unidade dos dados
originais.
Desvio Padrão Populacional
Desvio Padrão da Amostra
Algumas medidas
Vamos calcular a variância e o desvio padrão dos pesos ao nascer de
bezerros, em kg, da raça Crioula.
Raça Crioula
•
47
51
45
50
50
52
46
49
53
51
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
−
-2,4
1,6
-4,4
0,6
0,6
2,6
-3,4
-0,4
3,6
1,6
−
5,76
2,56
19,4
0,36
0,36
6,76
11,6
0,16
13
2,56
Variância da Amostra:
5,76+2,56+19,4+0,36+0,36+6,76+11,6+0,16+13+2,56
kg2
•
Desvio Padrão da Amostra:
kg
Algumas medidas
Vamos calcular a variância e o desvio padrão dos pesos ao nascer de
bezerros, em kg, da raça Crioula.
Raça Crioula
47
51
45
50
50
52
46
49
53
51
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
−
-2,4
1,6
-4,4
0,6
0,6
2,6
-3,4
-0,4
3,6
1,6
−
5,76
2,56
19,4
0,36
0,36
6,76
11,6
0,16
13
2,56
No R...
Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C
var(Y_C)
# variância da raça Crioula
sd(Y_C)
# desvio padrão da raça Crioula
Algumas medidas
Vamos calcular a variância e o desvio padrão dos pesos ao nascer
de bezerros, em kg, da raça Nelore.
Raça Nelore
•
51
40
46
48
54
56
44
43
55
57
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
−
1,6
-9,4
-3,4
-1,4
4,6
6,6
-5,4
-6,4
5,6
7,6
−
2,56 88,36 11,56 1,96 21,16 43,56 29,16 40,96 31,36 57,76
Variância da Amostra:
2,56+88,36+11,56+1,96+21,16+43,56+29,16+40,96+31,36+57,76
kg2
•
Desvio Padrão da Amostra:
kg
Algumas medidas
Vamos calcular a variância e o desvio padrão dos pesos ao nascer
de bezerros, em kg, da raça Nelore.
Raça Nelore
•
51
40
46
48
54
56
44
43
55
57
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
49,4
−
1,6
-9,4
-3,4
-1,4
4,6
6,6
-5,4
-6,4
5,6
7,6
−
2,56 88,36 11,56 1,96 21,16 43,56 29,16 40,96 31,36 57,76
No R...
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
var(Y_N)
# variância da raça Nelore
sd(Y_N)
# desvio padrão da raça Nelore
Algumas medidas
Resumindo...
Raça
•
Variância
Desvio Padrão
Crioula
6,93
2,63
Nelore
36,49
6,04
Portanto, a raça Nelore apresentou uma variabilidade muito
maior do que a raça Crioula, para o peso no nascimento,
conforme já havíamos concluído a partir da análise do
diagrama de pontos.
MEDIDAS DE POSIÇÃO E DE DISPERSÃO
Medidas de Dispersão
Erro Padrão da Média
Se retirarmos várias amostras de uma mesma população, teremos diversas
estimativas da média, obtidas em cada uma das amostras.
•
Com essas estimativas da média, pode-se estimar uma variância, considerando-se
os desvios de cada média em relação à média de todas elas.
•
Assim, a estimativa da variância da média pode ser calculada por
sendo
•
,
a estimativa da variância dos n dados da amostra.
A raiz quadrada dessa estimativa de variância é denominada erro padrão da
média, que pode ser calculado por:
•
Quanto menor for o valor de
, maior será a precisão da estimativa da média.
Algumas medidas
Vamos calcular a variância da média e o erro padrão da média dos
pesos ao nascer de bezerros, em kg, da raça Nelore.
Repetições
Raça Nelore
•
51
40
46
Variância da Média:
,
•
Erro Padrão da Média:
,
48
54
56
44
43
55
No R...
57
49,4
36,49
6,04
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
var_media_N=var(Y_N)/length(Y_N); var_media_N
erro_padrao_N=sd(Y_N)/sqrt(length(Y_N));
erro_padrao_N # erro padrão
Algumas medidas
O uso da média e do desvio padrão na interpretação de um
conjunto de Dados: Como o desvio padrão é uma medida que
indica quanto, em média, os elementos de um conjunto de dados se
afastam da média deles, utilizamos:
•
Vamos considerar os pesos ao nascer de bezerros, em kg, da raça
Crioula, o intervalo:
Raça
Crioula
:
:
Pesos ao nascer em kg
47
51
45
50
50
52
46
49
53
51
49,4
2,63
Algumas medidas
Através da análise de amplitude desses intervalos, o
pesquisador pode avaliar se eles são:
•
amplos (pouco precisos) ou não (precisos)
para o fenômeno real em estudo.
•
Em uma distribuição normal, valores maiores que
e menores que
valores discrepantes ou outliers.
são considerados
Algumas medidas

Coeficiente de Variação
O coeficiente de variação (
) é utilizado quando temos
interesse em comparar variabilidades em situações nas quais as
médias são muito diferentes ou as unidades de medida são
diferentes.
•
Ele é uma medida de dispersão relativa (porque estabelece uma
relação entre desvio padrão e média) dada em percentual da
variabilidade dos dados em torno da média e expresso por:
sendo,
desvio padrão da amostra
média da amostra
Algumas medidas
Vamos calcular o coeficiente de variação dos pesos ao nascer de
bezerros, em kg, das raças Crioula e Nelore.
•
No R...
Raça Crioiula:
#Raça Crioula
Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C
# Coeficiente de Variação:
cv_C <- (sd(Y_C)/mean(Y_C))*100; cv_C
,
,
•
Raça Nelore:
,
,
#Raça Nelore
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
# Coeficiente de Variação
cv_N <- (sd(Y_N)/mean(Y_N))*100; cv_N
Portanto, a variabilidade de peso ao nascer na amostra da raça
Crioula é menor do que da raça Nelore.
Algumas medidas
O coeficiente de variação é bastante utilizado em estudos de
dinâmica de populações vegetais e animais.
•
Na estatística experimental, ele indica a precisão do experimento,
ou seja, a capacidade de o realizarmos novamente, sob as
mesmas condições, e produzir resultados semelhantes.
•
Os valores de CV dependem do tipo de pesquisa e da variável em
estudo para ser considerado aceitável.
•
Tem-se a seguinte orientação:
Algumas medidas

Distância interquartílica
Da mesma forma que a média aritmética, a variância é uma
medida bastante apropriada para representar a dispersão de dados
com distribuição normal.
•
Uma medida de variabilidade, útil para diferentes tipos de
distribuição, é dada pela distância interquartílica (
), calculada
por:
que representa a amplitude do intervalo que contém os 50% dos
dados centrais, ou seja, como eles estão espalhados.
Algumas medidas
Para os valores dos pesos ao nascer de bezerros, em kg, das raças
Crioula e Nelore temos as seguintes distâncias interquartílicas:
•Raça
Crioiula:
•Raça
Nelore:
No R...
TR_C <- c(rep("crioula",10)); TR_C
r <- c(1:10); r
Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C
df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C
sort(Y_C);
# ordem crescente
mean(Y_C);
# média
var(Y_C);
# variância
quantile(Y_C) # quartis
TR_N <- c(rep("nelore",10)); TR_N
rep <- c(1:10); rep
Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N
df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N
sort(Y_N);
# ordem crescente
mean(Y_N);
# média
var(Y_N);
# variância
quantile(Y_N) # quartis
Algumas medidas
O uso da mediana e dos quartis na interpretação de um conjunto de
dados: O objetivo da mediana de dos quartis é obter informações sobre
a forma, o valor representativo, a dispersão e os valores discrepantes da
distribuição dos dados observados e, assim, responder importantes
questões da pesquisa
•
Somente com a média e o desvio padrão não temos ideia da forma
como os dados se distribuem, a sugestão é fazer o uso das seguintes
medidas:
i.
Mediana
;
ii.
Valores máximo
iii.
O primeiro
iv.
Distância Interquartílica
e mínimo
e o terceiro quartil
.
;
quartis;
Algumas medidas
Exemplo de uso da mediana e dos quartis na interpretação de um
conjunto de dados. Foram tomadas duas amostras de tamanhos iguais a
25 observações, de crescimento do pseudobulbo, em cm, da espécie de
orquídea Laelia purpurata, sob duas condições de luminosidade (com luz
direta e com luz indireta). Os dados estão apresentados na tabela abaixo.
mínimo
Luz Direta
Luz Indireta
1,6
1,6
1,9
1,9
2,1
2,1
2,1
2,1
2,1
2,4
2,5
2,5
2,7
3,4
3,4
3,7
3,9
4,2
4,8
6,3
6,5
7,2
8,8
9,4
9,5
1,4
1,9
2,8
3,1
3,5
3,5
3,6
3,9
4,3
4,5
4,6
4,8
6,3
6,5
6,7
6,7
6,8
6,9
8,1
8,6
10,4
12,7
16,3
16,8
16,9
máximo
Algumas medidas
Condições
Luz Direta (LD)
2,7
2,1
4,8
1,6
9,5
2,7
Luz Indireta (LI)
6,3
3,6
8,1
1,4
16,9
4,5
Cálculo dos quartis e extremos para os dados de crescimento do
pseldobulbo da Laelia purpurata
No R...
LD <- c(1.6, 1.6, 1.9, 1.9, 2.1, 2.1, 2.1, 2.1, 2.1, 2.4, 2.5, 2.5, 2.7, 3.4, 3.4, 3.7, 3.9, 4.2, 4.8,
6.3, 6.5, 7.2, 8.8, 9.4, 9.5); LD
LI <- c(1.4, 1.9, 2.8, 3.1, 3.5, 3.5, 3.6, 3.9, 4.3, 4.5, 4.6, 4.8, 6.3, 6.5, 6.7, 6.7, 6.8, 6.9, 8.1,
8.6, 10.4, 12.7, 16.3, 16.8, 16.9); LI
summary(LD)
summary(LI)
Algumas medidas
Condições
Luz Direta (LD)
2,7
2,1
4,8
1,6
9,5
2,7
Luz Indireta (LI)
6,3
3,6
8,1
1,4
16,9
4,5
Cálculo dos quartis e extremos para os dados de crescimento do
pseldobulbo da Laelia purpurata
Podemos concluir que:
•
O crescimento maior ocorreu com luz indireta, pois
e
•
cm
cm
A maior variabilidade dos dados centrais também ocorreu na luz
indireta, pois a distância interquartílica foi de
luz direta
cm contra
cm da
Algumas medidas
Com o uso dos quartis:
•
É possível verificar (detectar) se um ou mais valores da distribuição são
considerados discrepantes.
•
Considere
a -ésima observação do conjunto de dados e
a
distância interquartílica
•
Se
ou
então
é
considerado um valor discrepante (outlier)
•
O valor 1,5 é utilizado no cálculo dos valores discrepantes,
pois
a
área
da
99,3%
normal
no
intervalo
igual a 99,3%
•
− ,
curva
+ ,
logo estamos considerando 0,7% dos valores da
distribuição normal como sendo valores discrepantes
ou outliers.
Algumas medidas
Em um conjunto de dados pode existir mais de um valor discrepante.
•
No exemplo dos dados de crescimento do
pseldobulbo da Laelia
purpurata:
Condições
− ,
+ ,
Luz Direta (LD)
2,1
4,8
2,7
-1,95
8,85
Luz Indireta (LI)
3,6
8,1
4,5
-3,15
14,85
assim:
Luz Direta
Luz Indireta
outlier de LD
1,6
1,6
1,9
1,9
2,1
2,1
2,1
2,1
2,1
2,4
2,5
2,5
2,7
3,4
3,4
3,7
3,9
4,2
4,8
6,3
6,5
7,2
8,8
9,4
9,5
1,4
1,9
2,8
3,1
3,5
3,5
3,6
3,9
4,3
4,5
4,6
4,8
6,3
6,5
6,7
6,7
6,8
6,9
8,1
8,6
10,4
12,7
16,3
16,8
16,9
Outlier de LI
Algumas medidas
Desenho Esquemático
•
As informações da mediana e quartis podem ser representadas
graficamente em um box-plot, bastante apropriado para se efetuar
comparações entre distribuições de dados de diferentes tratamentos.
outliers para LI
Valores não
outliers
para LI
Algumas medidas
Desenho Esquemático
•
As informações da mediana e quartis podem ser representadas
graficamente em um box-plot, bastante apropriado para se efetuar
comparações entre distribuições de dados de diferentes tratamentos.
No R...
TR <- c(rep("Luz direta",25), rep("Luz indireta",25)); TR
rep <- c(1:25,1:25); rep
Y
<- c(1.6, 1.6, 1.9, 1.9, 2.1, 2.1, 2.1, 2.1, 2.1, 2.4, 2.5, 2.5, 2.7, 3.4, 3.4, 3.7, 3.9, 4.2, 4.8, 6.3,
6.5, 7.2, 8.8, 9.4, 9.5, 1.4, 1.9, 2.8, 3.1, 3.5, 3.5, 3.6, 3.9, 4.3, 4.5, 4.6, 4.8, 6.3, 6.5, 6.7, 6.7, 6.8, 6.9,
8.1, 8.6, 10.4, 12.7, 16.3, 16.8, 16.9); Y
df1 <- data.frame(cbind(TR,rep,Y)); df1
FTR <- as.factor(TR)
# TODA FONTE DE VARIAÇÃO DEVE SER UM FATOR
m <- tapply(Y,FTR,mean); m # Médias dos Tratamentos
lmin <- 0
# limite mínimo
lmax <- 10
# limite máximo
barplot(m,ylim=c(lmin,lmax))
# gráfico das médias dos tratamentos
plot(Y~FTR)
# gráfico box-plot por tratamentos
Correlação
Utilizado para analisar o comportamento conjunto de duas ou mais
variáveis quantitativas.
•
Estamos interessados em obter uma medida estatística que indique se existe ou
não uma associação linear entre duas variáveis e, se existir, qual a sua
magnitude e sinal.
•
O primeiro passo para verificar se existe correlação entre duas variáveis
quantitativas, é construir um gráfico de dispersão. No eixo das abscissas
colocamos a variável X e no das ordenadas a variável Y
Correlação
Exemplo. Considere os dados referentes à produção de matéria seca de
uma cultura (Y) e a quantidade de radiação fotossintética ativa (X). Os
dados obtidos do experimento são apresentados na tabela abaixo:
Produção (Y)
Radiação (X)
1
2
3
4
5
6
7
8
9
10
10
60
110
160
220
280
340
400
460
520
190
300
410
460
570
770
815
965
18
55
Produção (g/m2)
Através do diagrama de pontos, concluímos que
existe
uma
correlação
entre
positiva
variáveis Produção e Radiação (
•
pois
a
medida
que
aumenta
as
),
a
radiação
fotossintética, também aumenta a produção de
matéria seca.
Assim, pode-se concluir que o conhecimento da
Radiação fotossintética (W/m2)
quantidade de radiação pode ajudar a prever a
produção de matéria seca.
Correlação
Exemplo. Considere os dados referentes à produção de matéria seca de
uma cultura (Y) e a quantidade de radiação fotossintética ativa (X). Os
dados obtidos do experimento são apresentados na tabela abaixo:
Produção (Y)
Radiação (X)
1
2
3
4
5
6
7
8
9
10
10
60
110
160
220
280
340
400
460
520
190
300
410
460
570
770
815
965
18
55
No R...
Y <- c(10, 60, 110, 160, 220, 280, 340, 400, 460, 520); Y
X <- c(18, 55, 190, 300, 410, 460, 570, 770, 815, 965); X
= 0,5312 + 14,1537
= 0,9953
z=plot(X,Y)
# gráfico de dispersão
cor(X,Y)
# coeficiente de correlação
regressao=lm(Y~X); regressao # estimativa dos parâmetros
abline(regressao) # adiciona ao gráfico a reta de ajustada
grid(z)
# quadricula o gráfico
Exercícios
Exercícios
Exercício 1. Foi observado a espessura, em micra
(10
=
), do epitélio da mucosa vaginal em 10
porcas diestro, conforme tabela seguinte.
43
58
50
39
62
38
23
31
45
49
Com base nestes dados, pede-se:
a) Estimar a espessura média, em micra, do epitélio da mucosa vaginal para
essas porcas.
b) Calcular a amplitude
=
−
c) Calcular a variância
d) Calcular o desvio padrão
e) Calcular o erro padrão da média.
f) Calcular o coeficiente de variação.
.
Exercício 1 – solução
Exercício 1. Foi observado a espessura, em micra
(10
=
), do epitélio da mucosa vaginal em 10
porcas diestro, conforme tabela seguinte.
43
58
50
39
62
38
23
31
45
49
Com base nestes dados, pede-se:
a) Estimar a espessura média, em micra, do epitélio da mucosa vaginal para
essas porcas.
=
43 + 58 + 50 + 39 + 62 + 38 + 23 + 31 + 45 + 49 438
=
= 43,8
10
10
b) Calcular a amplitude.
= 62,0 − 23,0 = 39
Exercício 1 – solução
Exercício 1. Foi observado a espessura, em micra
(10
), do epitélio da mucosa vaginal em 10
=
porcas diestro, conforme tabela seguinte.
43
58
50
39
62
38
23
31
45
49
43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8
−
-0,8 14,2
6,2
-4,8 18,2 -5,8 -20,8 -12,8 1,2
5,2
−
0,64 201,6 38,4
23 331,2 33,6 432,6 163,8 1,44
27
Com base nestes dados, pede-se:
c) Calcular a variância
Solução.
=
=
∑
− 43,8
1254 = 139,2889
=
0,64+202+38,4+23+331+33,6+433+164+1,44+27
Exercício 1 – solução
Exercício 1. Foi observado a espessura, em micra (10
), do epitélio da
=
mucosa vaginal em 10 porcas diestro, conforme tabela seguinte.
43
58
50
39
62
38
23
Com base nestes dados, pede-se:
d) Calcular o desvio padrão.
=
=
139,2889 = 11,8021
e) Calcular o erro padrão da média.
43,8 =
=
11,8021
10
= 3,7321
f) Calcular o coeficiente de variação
=
100 × 11,8021
= 26,95%
43,8
31
45
49
Exercícios
Exercício 2. O intervalo entre partos de vacas leiteiras
em uma fazenda apresentou um valor médio de 840
dias e um desvio padrão de 275 dias. Sendo uma
variável que depende de fator hormonal, entre muitos
outros, seu coeficiente de variação deve ser elevado.
Calcule-o.
Solução. Note que
= 840dias e s = 275 dias. Lembrando que o coeficiente de variação
, que avalia a instabilidade relativa, é dado por
=
•
×
=
×
, então:
= 32,70%
Dessa maneira, o coeficiente de variação é de 32,7 %, o que pode não parecer muito elevado.
 Mas devemos considerar que no processo seletivo usualmente feito nos rebanhos de
leite, muitas vacas são descartadas por não retornarem ao cio em tempo préestabelecido pelo manejo da fazenda.
Download