EXPERIMENTAÇÃO ZOOTÉCNICA Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari [email protected] ALGUNS CONCEITOS BÁSICOS População e Amostra População é o conjunto de elementos que têm, em comum, uma determinada característica. Todo subconjunto não vazio e com menor número de elementos do que o conjunto definido como população constitui uma amostra desta população. ALGUNS CONCEITOS BÁSICOS População e Amostra Exemplo. O número total de lagartas de Spodoptera frugiperda em uma cultura de milho constitui uma população. Uma vez definida a unidade amostral (1 animal, um conjunto de 5 animais, ou uma área na qual será contada o número de lagartas) a população pode ser considerada como um conjunto de unidades amostrais. um subconjunto tomado aleatoriamente deste conjunto é chamado de amostra aleatória de tamanho n. Neste exemplo as observações são obtidas através de contagens do número de lagartas em cada unidade amostral. Estas observações são chamadas de variável em estudo. MEDIDAS DE POSIÇÃO E DE DISPERSÃO Medidas de Posição e Dispersão • As populações são descritas por certas características chamadas de parâmetros. • As amostras são descritas pelas mesmas características, porém denominadas de estimativas de parâmetros ou estatísticas. • Algum desses parâmetros são chamados de medidas de posição e outros de medidas de dispersão. Estudo de distribuições de frequências Quando a variável em estudo é quantitativa, discreta ou contínua, as principais características as serem observadas numa distribuição de frequência são: 1. Valor típico ou representativo; 2. Dispersão; 3. Assimetria; 4. Valores discrepantes ou outliers; 5. Formação de subgrupos Estudo de distribuições de frequências 1. Valor típico ou representativo Corresponde à escolha de um único valor para representar todo o conjunto de valores. 2. Dispersão É uma medida de concentração do dados em torno do valor típico. • Geralmente é dado pela variância, desvio padrão, coeficiente de variação e distância interquartílica Estudo de distribuições de frequências 3. Assimetria Exemplo. No estudo da renda das famílias brasileiras, a grande maioria das famílias apresenta baixo rendimento familiar, enquanto que a minoria apresenta alto rendimento. 4. Valores discrepantes ou outliers São valores que se distanciam demais dos outros e pouco prováveis de ocorrerem novamente. • Principais causas da ocorrência desses valores: erro de transcrição de dados; algum fato importante ocorreu durante o trabalho e o valor é verdadeiro e deve ser considerado como tal. Estudo de distribuições de frequências 5. Formação de grupos Exemplo. Ao estudar-se a distribuição das alturas dos alunos, pode-se chegar à conclusão que existem dois grupos, formados de acordo com o gênero. Algumas medidas 1. Medidas de tendência central As duas medidas de tendência central mais utilizadas para resumir um conjunto de dados quantitativos são: a média aritmética e a mediana. Média Aritmética: é a soma dos valores numéricos de uma variável dividida pelo numero total de variáveis, e é dada por: onde, : é o número total de variáveis da amostra : o valor observado da variável na -ésima unidade experimental Algumas medidas Exemplo 1. Considere os pesos ao nascer, em kg, de 10 bezerros da raça de gado Crioula e da raça Nelore apresentados na tabela abaixo: Raça Pesos ao nascer em kg Crioula 47 51 45 50 50 52 46 49 53 51 Nelore 51 40 46 48 54 56 44 43 55 57 • Média da raça Crioula: ∑ • kg Média da raça Nelore: ∑ kg Algumas medidas Exemplo 1. Considere os pesos ao nascer, em kg, de 10 bezerros da raça de gado Crioula e da raça Nelore apresentados na tabela abaixo: Raça Pesos ao nascer em kg Crioula 47 51 45 50 50 52 46 49 53 51 Nelore 51 40 46 48 54 56 44 43 55 57 No R... # Média da raça Crioula TR_C <- c(rep("crioula",10)); TR_C r <- c(1:10); r Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C mean(Y_C); # média # Média da raça Nelore TR_N <- c(rep("nelore",10)); TR_N rep <- c(1:10); rep Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N mean(Y_C); # média Algumas medidas • A principal restrição ao uso da média aritmética é que ela é muito sensível a valores excessivamente altos ou baixos (outliers) • É uma medida bastante adequada quando os dados aproximadamente, uma apresentam, distribuição normal. • Quando a distribuição é assimétrica deve-se utilizar, preferencialmente, a mediana. média mediana média mediana mediana média Algumas medidas Desvio: O desvio de um dado em relação a média é dado por: • Assim, existem desvios positivos, negativos e nulos. • Para os dados de pesos ao nascer de bezerros da raça Crioula, apresentado no Exemplo 1, com média • kg, temos: 47 51 45 50 50 52 46 49 53 51 -2,4 1,6 -4,4 0,6 0,6 2,6 -3,4 -0,4 3,6 1,6 Para os dados de pesos ao nascer de bezerros da raça Nelore, apresentado no Exemplo 1, com média kg, temos: 51 40 46 48 54 56 44 43 55 57 1,6 -9,4 -3,4 -1,4 4,6 6,6 -5,4 -6,4 5,6 7,6 Algumas medidas Raça Crioula Raça Nelore 58 58 56 56 54 52 51 52 53 51 50 50 50 44 55 54 54 52 51 50 48 46 57 56 48 49 48 46 47 45 46 46 44 42 peso ao nascer 42 40 peso médio 40 38 desvio 38 44 43 peso ao nascer peso médio 40 desvio • Da composição dos dois gráficos, pode-se verificar que na Raça Crioula houve menor variação do desvio (menor dispersão dos dados ao redor da média) Algumas medidas Propriedades da média aritmética P1: A soma dos desvios calculados em relação à média aritmética do conjunto de dados é nula, isto é: P2: O menor valor da soma dos quadrados desvios é atingido quando estes são calculados em relação à média, ou seja: PS: Quando trabalhamos com todos os elementos de uma população, a média aritmética é representada por , e calculada por: Algumas medidas Mediana: é o valor que divide ao meio um conjunto de dados ordenados, em que 50% dos valores se posicionam abaixo e 50% acima dele Na prática, nem sempre existe este valor central e toma-se como mediana a média dos dois valores centrais. Para os dados de pesos ao nascer de bezerros da raça Crioula, apresentado no Exemplo 1, com média Raça Crioula Pesos ao nascer em kg 47 51 45 50 50 52 46 49 kg, temos: posição da mediana 53 51 valor da mediana ( ) Conjunto de dados ordenados 45 46 47 49 50 = 50 51 51 50 + 50 = 50 2 52 53 43 44 45 46 47 48 49 50 51 52 53 54 55 Pesos ao nascer Diagrama de pontos para peso ao nascer da raça Crioula – cálculo da mediana Algumas medidas Os cálculos da mediana e dos quartis para um histograma serão feitos por meio de argumentos geométricos, através da proporcionalidade existente entre área e base de retângulos. Geometricamente: a mediana Desenho esquemático para uma distribuição normal é o valor da abscissa que determina uma linha vertical que divide o histograma em duas partes de áreas iguais, ou seja, 50% da área está abaixo do primeiro quartil e 50% da área está acima. o primeiro quartil é o valor da abscissa que determina uma linha vertical que divide o histograma em duas partes distintas, ou seja, 25% da área está abaixo do primeiro quartil e 75% da área está acima. o terceiro quartil é o valor da abscissa que determina uma linha vertical que divide o histograma em duas partes distintas, ou seja, 75% da área está abaixo do terceiro quartil e 25% da área está acima. Algumas medidas Os cálculos da mediana e dos quartis no R... # Determinação dos quartis da raça Crioula TR_C <- c(rep("crioula",10)); TR_C r <- c(1:10); r Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C sort(Y_C) # organiza os dados em ordem crescente (Crioula) quantile(Y_C) # calculo dos quartis (Crioula) # Determinação dos quartis da raça Nelore TR_N <- c(rep("nelore",10)); TR_N rep <- c(1:10); rep Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N sort(Y_N) # organiza os dados em ordem crescente (Nelore) quantile(Y_N) # calculo dos quartis (Nelore) Desenho esquemático para uma distribuição normal Algumas medidas 2. Medidas de dispersão Quando apresentamos uma medida de tendência central para representar um conjunto de dados, é necessário que essa medida seja acompanhada de uma outra que resume a variabilidade (dispersão dos dados). médias Nelore Crioula 38 40 42 44 46 48 50 = 49,4 52 54 56 58 Pesos ao nascer Diagrama de pontos para peso ao nascer das raças Crioula e Nelore • Apesar das duas distribuições terem a mesma média nas amostras, os valores da raça Nelore estão mais espalhados (dispersos) do que os valores da raça Crioula. • A variabilidade na raça Nelore é maior que na raça Crioula. Algumas medidas 2. Medidas de dispersão Uma medida de dispersão quantifica a magnitude da variabilidade dos dados. Ela é de fundamental importância, pois a estatística só existe porque o fenômenos tem variabilidade. • Vamos estudar as seguintes medidas de dispersão: • variância • desvio padrão • erro padrão • coeficiente de variação • distância interquartílica Algumas medidas Variância e desvio padrão Para o cálculo da variância e do desvio padrão, o princípio básico é analisar os desvios das observações em relação à média aritmética. • O valor zero para a variância ou desvio padrão indica ausência de variação; o valor da medida vai aumentando à medida que aumenta a variação. Variância Populacional Variância da Amostra sendo: tamanho da população tamanho da amostra média populacional média da amostra Algumas medidas Variância e desvio padrão A variância apresenta um inconveniente de ordem prática, ela é expressa em unidades ao quadrado, isto causa problemas de interpretação. • Uma medida de variabilidade, calculada com base na variância é o desvio padrão, o qual é expresso na mesma unidade dos dados originais. Desvio Padrão Populacional Desvio Padrão da Amostra Algumas medidas Vamos calcular a variância e o desvio padrão dos pesos ao nascer de bezerros, em kg, da raça Crioula. Raça Crioula • 47 51 45 50 50 52 46 49 53 51 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 − -2,4 1,6 -4,4 0,6 0,6 2,6 -3,4 -0,4 3,6 1,6 − 5,76 2,56 19,4 0,36 0,36 6,76 11,6 0,16 13 2,56 Variância da Amostra: 5,76+2,56+19,4+0,36+0,36+6,76+11,6+0,16+13+2,56 kg2 • Desvio Padrão da Amostra: kg Algumas medidas Vamos calcular a variância e o desvio padrão dos pesos ao nascer de bezerros, em kg, da raça Crioula. Raça Crioula 47 51 45 50 50 52 46 49 53 51 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 − -2,4 1,6 -4,4 0,6 0,6 2,6 -3,4 -0,4 3,6 1,6 − 5,76 2,56 19,4 0,36 0,36 6,76 11,6 0,16 13 2,56 No R... Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C var(Y_C) # variância da raça Crioula sd(Y_C) # desvio padrão da raça Crioula Algumas medidas Vamos calcular a variância e o desvio padrão dos pesos ao nascer de bezerros, em kg, da raça Nelore. Raça Nelore • 51 40 46 48 54 56 44 43 55 57 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 − 1,6 -9,4 -3,4 -1,4 4,6 6,6 -5,4 -6,4 5,6 7,6 − 2,56 88,36 11,56 1,96 21,16 43,56 29,16 40,96 31,36 57,76 Variância da Amostra: 2,56+88,36+11,56+1,96+21,16+43,56+29,16+40,96+31,36+57,76 kg2 • Desvio Padrão da Amostra: kg Algumas medidas Vamos calcular a variância e o desvio padrão dos pesos ao nascer de bezerros, em kg, da raça Nelore. Raça Nelore • 51 40 46 48 54 56 44 43 55 57 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 49,4 − 1,6 -9,4 -3,4 -1,4 4,6 6,6 -5,4 -6,4 5,6 7,6 − 2,56 88,36 11,56 1,96 21,16 43,56 29,16 40,96 31,36 57,76 No R... Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N var(Y_N) # variância da raça Nelore sd(Y_N) # desvio padrão da raça Nelore Algumas medidas Resumindo... Raça • Variância Desvio Padrão Crioula 6,93 2,63 Nelore 36,49 6,04 Portanto, a raça Nelore apresentou uma variabilidade muito maior do que a raça Crioula, para o peso no nascimento, conforme já havíamos concluído a partir da análise do diagrama de pontos. MEDIDAS DE POSIÇÃO E DE DISPERSÃO Medidas de Dispersão Erro Padrão da Média Se retirarmos várias amostras de uma mesma população, teremos diversas estimativas da média, obtidas em cada uma das amostras. • Com essas estimativas da média, pode-se estimar uma variância, considerando-se os desvios de cada média em relação à média de todas elas. • Assim, a estimativa da variância da média pode ser calculada por sendo • , a estimativa da variância dos n dados da amostra. A raiz quadrada dessa estimativa de variância é denominada erro padrão da média, que pode ser calculado por: • Quanto menor for o valor de , maior será a precisão da estimativa da média. Algumas medidas Vamos calcular a variância da média e o erro padrão da média dos pesos ao nascer de bezerros, em kg, da raça Nelore. Repetições Raça Nelore • 51 40 46 Variância da Média: , • Erro Padrão da Média: , 48 54 56 44 43 55 No R... 57 49,4 36,49 6,04 Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N var_media_N=var(Y_N)/length(Y_N); var_media_N erro_padrao_N=sd(Y_N)/sqrt(length(Y_N)); erro_padrao_N # erro padrão Algumas medidas O uso da média e do desvio padrão na interpretação de um conjunto de Dados: Como o desvio padrão é uma medida que indica quanto, em média, os elementos de um conjunto de dados se afastam da média deles, utilizamos: • Vamos considerar os pesos ao nascer de bezerros, em kg, da raça Crioula, o intervalo: Raça Crioula : : Pesos ao nascer em kg 47 51 45 50 50 52 46 49 53 51 49,4 2,63 Algumas medidas Através da análise de amplitude desses intervalos, o pesquisador pode avaliar se eles são: • amplos (pouco precisos) ou não (precisos) para o fenômeno real em estudo. • Em uma distribuição normal, valores maiores que e menores que valores discrepantes ou outliers. são considerados Algumas medidas Coeficiente de Variação O coeficiente de variação ( ) é utilizado quando temos interesse em comparar variabilidades em situações nas quais as médias são muito diferentes ou as unidades de medida são diferentes. • Ele é uma medida de dispersão relativa (porque estabelece uma relação entre desvio padrão e média) dada em percentual da variabilidade dos dados em torno da média e expresso por: sendo, desvio padrão da amostra média da amostra Algumas medidas Vamos calcular o coeficiente de variação dos pesos ao nascer de bezerros, em kg, das raças Crioula e Nelore. • No R... Raça Crioiula: #Raça Crioula Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C # Coeficiente de Variação: cv_C <- (sd(Y_C)/mean(Y_C))*100; cv_C , , • Raça Nelore: , , #Raça Nelore Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N # Coeficiente de Variação cv_N <- (sd(Y_N)/mean(Y_N))*100; cv_N Portanto, a variabilidade de peso ao nascer na amostra da raça Crioula é menor do que da raça Nelore. Algumas medidas O coeficiente de variação é bastante utilizado em estudos de dinâmica de populações vegetais e animais. • Na estatística experimental, ele indica a precisão do experimento, ou seja, a capacidade de o realizarmos novamente, sob as mesmas condições, e produzir resultados semelhantes. • Os valores de CV dependem do tipo de pesquisa e da variável em estudo para ser considerado aceitável. • Tem-se a seguinte orientação: Algumas medidas Distância interquartílica Da mesma forma que a média aritmética, a variância é uma medida bastante apropriada para representar a dispersão de dados com distribuição normal. • Uma medida de variabilidade, útil para diferentes tipos de distribuição, é dada pela distância interquartílica ( ), calculada por: que representa a amplitude do intervalo que contém os 50% dos dados centrais, ou seja, como eles estão espalhados. Algumas medidas Para os valores dos pesos ao nascer de bezerros, em kg, das raças Crioula e Nelore temos as seguintes distâncias interquartílicas: •Raça Crioiula: •Raça Nelore: No R... TR_C <- c(rep("crioula",10)); TR_C r <- c(1:10); r Y_C <- c(47,51,45,50,50,52,46,49,53,51); Y_C df_C <- data.frame(cbind(TR_C,r,Y_C)); df_C sort(Y_C); # ordem crescente mean(Y_C); # média var(Y_C); # variância quantile(Y_C) # quartis TR_N <- c(rep("nelore",10)); TR_N rep <- c(1:10); rep Y_N <- c(51,40,46,48,54,56,44,43,55,57); Y_N df_N <- data.frame(cbind(TR_N,rep,Y_N)); df_N sort(Y_N); # ordem crescente mean(Y_N); # média var(Y_N); # variância quantile(Y_N) # quartis Algumas medidas O uso da mediana e dos quartis na interpretação de um conjunto de dados: O objetivo da mediana de dos quartis é obter informações sobre a forma, o valor representativo, a dispersão e os valores discrepantes da distribuição dos dados observados e, assim, responder importantes questões da pesquisa • Somente com a média e o desvio padrão não temos ideia da forma como os dados se distribuem, a sugestão é fazer o uso das seguintes medidas: i. Mediana ; ii. Valores máximo iii. O primeiro iv. Distância Interquartílica e mínimo e o terceiro quartil . ; quartis; Algumas medidas Exemplo de uso da mediana e dos quartis na interpretação de um conjunto de dados. Foram tomadas duas amostras de tamanhos iguais a 25 observações, de crescimento do pseudobulbo, em cm, da espécie de orquídea Laelia purpurata, sob duas condições de luminosidade (com luz direta e com luz indireta). Os dados estão apresentados na tabela abaixo. mínimo Luz Direta Luz Indireta 1,6 1,6 1,9 1,9 2,1 2,1 2,1 2,1 2,1 2,4 2,5 2,5 2,7 3,4 3,4 3,7 3,9 4,2 4,8 6,3 6,5 7,2 8,8 9,4 9,5 1,4 1,9 2,8 3,1 3,5 3,5 3,6 3,9 4,3 4,5 4,6 4,8 6,3 6,5 6,7 6,7 6,8 6,9 8,1 8,6 10,4 12,7 16,3 16,8 16,9 máximo Algumas medidas Condições Luz Direta (LD) 2,7 2,1 4,8 1,6 9,5 2,7 Luz Indireta (LI) 6,3 3,6 8,1 1,4 16,9 4,5 Cálculo dos quartis e extremos para os dados de crescimento do pseldobulbo da Laelia purpurata No R... LD <- c(1.6, 1.6, 1.9, 1.9, 2.1, 2.1, 2.1, 2.1, 2.1, 2.4, 2.5, 2.5, 2.7, 3.4, 3.4, 3.7, 3.9, 4.2, 4.8, 6.3, 6.5, 7.2, 8.8, 9.4, 9.5); LD LI <- c(1.4, 1.9, 2.8, 3.1, 3.5, 3.5, 3.6, 3.9, 4.3, 4.5, 4.6, 4.8, 6.3, 6.5, 6.7, 6.7, 6.8, 6.9, 8.1, 8.6, 10.4, 12.7, 16.3, 16.8, 16.9); LI summary(LD) summary(LI) Algumas medidas Condições Luz Direta (LD) 2,7 2,1 4,8 1,6 9,5 2,7 Luz Indireta (LI) 6,3 3,6 8,1 1,4 16,9 4,5 Cálculo dos quartis e extremos para os dados de crescimento do pseldobulbo da Laelia purpurata Podemos concluir que: • O crescimento maior ocorreu com luz indireta, pois e • cm cm A maior variabilidade dos dados centrais também ocorreu na luz indireta, pois a distância interquartílica foi de luz direta cm contra cm da Algumas medidas Com o uso dos quartis: • É possível verificar (detectar) se um ou mais valores da distribuição são considerados discrepantes. • Considere a -ésima observação do conjunto de dados e a distância interquartílica • Se ou então é considerado um valor discrepante (outlier) • O valor 1,5 é utilizado no cálculo dos valores discrepantes, pois a área da 99,3% normal no intervalo igual a 99,3% • − , curva + , logo estamos considerando 0,7% dos valores da distribuição normal como sendo valores discrepantes ou outliers. Algumas medidas Em um conjunto de dados pode existir mais de um valor discrepante. • No exemplo dos dados de crescimento do pseldobulbo da Laelia purpurata: Condições − , + , Luz Direta (LD) 2,1 4,8 2,7 -1,95 8,85 Luz Indireta (LI) 3,6 8,1 4,5 -3,15 14,85 assim: Luz Direta Luz Indireta outlier de LD 1,6 1,6 1,9 1,9 2,1 2,1 2,1 2,1 2,1 2,4 2,5 2,5 2,7 3,4 3,4 3,7 3,9 4,2 4,8 6,3 6,5 7,2 8,8 9,4 9,5 1,4 1,9 2,8 3,1 3,5 3,5 3,6 3,9 4,3 4,5 4,6 4,8 6,3 6,5 6,7 6,7 6,8 6,9 8,1 8,6 10,4 12,7 16,3 16,8 16,9 Outlier de LI Algumas medidas Desenho Esquemático • As informações da mediana e quartis podem ser representadas graficamente em um box-plot, bastante apropriado para se efetuar comparações entre distribuições de dados de diferentes tratamentos. outliers para LI Valores não outliers para LI Algumas medidas Desenho Esquemático • As informações da mediana e quartis podem ser representadas graficamente em um box-plot, bastante apropriado para se efetuar comparações entre distribuições de dados de diferentes tratamentos. No R... TR <- c(rep("Luz direta",25), rep("Luz indireta",25)); TR rep <- c(1:25,1:25); rep Y <- c(1.6, 1.6, 1.9, 1.9, 2.1, 2.1, 2.1, 2.1, 2.1, 2.4, 2.5, 2.5, 2.7, 3.4, 3.4, 3.7, 3.9, 4.2, 4.8, 6.3, 6.5, 7.2, 8.8, 9.4, 9.5, 1.4, 1.9, 2.8, 3.1, 3.5, 3.5, 3.6, 3.9, 4.3, 4.5, 4.6, 4.8, 6.3, 6.5, 6.7, 6.7, 6.8, 6.9, 8.1, 8.6, 10.4, 12.7, 16.3, 16.8, 16.9); Y df1 <- data.frame(cbind(TR,rep,Y)); df1 FTR <- as.factor(TR) # TODA FONTE DE VARIAÇÃO DEVE SER UM FATOR m <- tapply(Y,FTR,mean); m # Médias dos Tratamentos lmin <- 0 # limite mínimo lmax <- 10 # limite máximo barplot(m,ylim=c(lmin,lmax)) # gráfico das médias dos tratamentos plot(Y~FTR) # gráfico box-plot por tratamentos Correlação Utilizado para analisar o comportamento conjunto de duas ou mais variáveis quantitativas. • Estamos interessados em obter uma medida estatística que indique se existe ou não uma associação linear entre duas variáveis e, se existir, qual a sua magnitude e sinal. • O primeiro passo para verificar se existe correlação entre duas variáveis quantitativas, é construir um gráfico de dispersão. No eixo das abscissas colocamos a variável X e no das ordenadas a variável Y Correlação Exemplo. Considere os dados referentes à produção de matéria seca de uma cultura (Y) e a quantidade de radiação fotossintética ativa (X). Os dados obtidos do experimento são apresentados na tabela abaixo: Produção (Y) Radiação (X) 1 2 3 4 5 6 7 8 9 10 10 60 110 160 220 280 340 400 460 520 190 300 410 460 570 770 815 965 18 55 Produção (g/m2) Através do diagrama de pontos, concluímos que existe uma correlação entre positiva variáveis Produção e Radiação ( • pois a medida que aumenta as ), a radiação fotossintética, também aumenta a produção de matéria seca. Assim, pode-se concluir que o conhecimento da Radiação fotossintética (W/m2) quantidade de radiação pode ajudar a prever a produção de matéria seca. Correlação Exemplo. Considere os dados referentes à produção de matéria seca de uma cultura (Y) e a quantidade de radiação fotossintética ativa (X). Os dados obtidos do experimento são apresentados na tabela abaixo: Produção (Y) Radiação (X) 1 2 3 4 5 6 7 8 9 10 10 60 110 160 220 280 340 400 460 520 190 300 410 460 570 770 815 965 18 55 No R... Y <- c(10, 60, 110, 160, 220, 280, 340, 400, 460, 520); Y X <- c(18, 55, 190, 300, 410, 460, 570, 770, 815, 965); X = 0,5312 + 14,1537 = 0,9953 z=plot(X,Y) # gráfico de dispersão cor(X,Y) # coeficiente de correlação regressao=lm(Y~X); regressao # estimativa dos parâmetros abline(regressao) # adiciona ao gráfico a reta de ajustada grid(z) # quadricula o gráfico Exercícios Exercícios Exercício 1. Foi observado a espessura, em micra (10 = ), do epitélio da mucosa vaginal em 10 porcas diestro, conforme tabela seguinte. 43 58 50 39 62 38 23 31 45 49 Com base nestes dados, pede-se: a) Estimar a espessura média, em micra, do epitélio da mucosa vaginal para essas porcas. b) Calcular a amplitude = − c) Calcular a variância d) Calcular o desvio padrão e) Calcular o erro padrão da média. f) Calcular o coeficiente de variação. . Exercício 1 – solução Exercício 1. Foi observado a espessura, em micra (10 = ), do epitélio da mucosa vaginal em 10 porcas diestro, conforme tabela seguinte. 43 58 50 39 62 38 23 31 45 49 Com base nestes dados, pede-se: a) Estimar a espessura média, em micra, do epitélio da mucosa vaginal para essas porcas. = 43 + 58 + 50 + 39 + 62 + 38 + 23 + 31 + 45 + 49 438 = = 43,8 10 10 b) Calcular a amplitude. = 62,0 − 23,0 = 39 Exercício 1 – solução Exercício 1. Foi observado a espessura, em micra (10 ), do epitélio da mucosa vaginal em 10 = porcas diestro, conforme tabela seguinte. 43 58 50 39 62 38 23 31 45 49 43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8 43,8 − -0,8 14,2 6,2 -4,8 18,2 -5,8 -20,8 -12,8 1,2 5,2 − 0,64 201,6 38,4 23 331,2 33,6 432,6 163,8 1,44 27 Com base nestes dados, pede-se: c) Calcular a variância Solução. = = ∑ − 43,8 1254 = 139,2889 = 0,64+202+38,4+23+331+33,6+433+164+1,44+27 Exercício 1 – solução Exercício 1. Foi observado a espessura, em micra (10 ), do epitélio da = mucosa vaginal em 10 porcas diestro, conforme tabela seguinte. 43 58 50 39 62 38 23 Com base nestes dados, pede-se: d) Calcular o desvio padrão. = = 139,2889 = 11,8021 e) Calcular o erro padrão da média. 43,8 = = 11,8021 10 = 3,7321 f) Calcular o coeficiente de variação = 100 × 11,8021 = 26,95% 43,8 31 45 49 Exercícios Exercício 2. O intervalo entre partos de vacas leiteiras em uma fazenda apresentou um valor médio de 840 dias e um desvio padrão de 275 dias. Sendo uma variável que depende de fator hormonal, entre muitos outros, seu coeficiente de variação deve ser elevado. Calcule-o. Solução. Note que = 840dias e s = 275 dias. Lembrando que o coeficiente de variação , que avalia a instabilidade relativa, é dado por = • × = × , então: = 32,70% Dessa maneira, o coeficiente de variação é de 32,7 %, o que pode não parecer muito elevado. Mas devemos considerar que no processo seletivo usualmente feito nos rebanhos de leite, muitas vacas são descartadas por não retornarem ao cio em tempo préestabelecido pelo manejo da fazenda.