P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: ⇒ Uma distribuição de frequências é uma tabela que reúne o conjunto de dados conforme as frequências ou as repetições de seus valores. ⇒ Esta tabela pode representar os dados em classes ou não, de acordo com a classificação dos dados em discretos ou contínuos. Conceitos Básicos: Dados Brutos: São os dados originais, conforme foram coletados, os quais ainda não estão prontos para análise, pois não estão numericamente organizados ou tabelados. Rol: É uma lista onde as observações são dispostas em uma determinada ordem (crescente ou decrescente). Amplitude Total (H, At ou R): É a diferença entre o maior e menor valor observado da variável em estudo: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Conceitos Básicos: Classe: É cada um dos grupos ou intervalos de valores em que se subdivide a amplitude total do conjunto de tamanho n. Para a determinação do número de classes, existem diversos métodos, dentre os quais se destaca a regra de Sturges, onde o número de classes (k) é calculado por: k = 1 + 3,3 log n. Recomenda-se considerar 4 ≤ k ≤ 12. Limites de Classe: São os valores extremos de cada classe. Limite inferior (Li): é o menor valor da classe considerada; Limite superior (Ls): é o maior valor da classe considerada. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Conceitos Básicos: Amplitude de Classe (h): é a diferença entre o limite superior e o limite inferior da classe, ou seja: h = Ls – Li, quando a distribuição de frequências já existe; ou h = H/k, para a determinação da amplitude de classes para uma distribuição de frequências a ser construída. Ponto Médio de Classe (Xi): é a média aritmética dos limites de classe, sendo o valor representativo da classe: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Conceitos Básicos: Tipos de frequência: Frequência simples absoluta (fi): é o número de observações que aparece em uma classe ou valor individual. Frequência simples relativa (fri): é o quociente entre a frequência simples absoluta e o número total de observações. de: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Conceitos Básicos: Frequência acumulada crescente (faci ou Fci): É a soma de todas as frequências anteriores com a frequência do intervalo considerado. Pode ser absoluta ou relativa. Exemplos de Distribuições de Frequência: Por Intervalo: Por Pontos: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Gráficos Representativos: Histograma: é um gráfico de colunas justapostas, cujas alturas são proporcionais às frequências absolutas e cujas bases correspondem ao intervalo de classe da distribuição ou o centro das mesmas. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Gráficos Representativos: Polígono de frequências: É um gráfico de linha, cujos vértices são proporcionais as frequências absolutas e correspondem aos pontos médios da distribuição. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Distribuição de frequências: Gráficos Representativos: Ogiva: é um gráfico de linha, cujos vértices são proporcionais às frequências acumuladas e correspondem aos limites inferiores das classes da distribuição. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas Descritivas: Classificação das medidas descritivas: A estatística descritiva visa a descrever os dados disponíveis da forma mais completa possível sem, no entanto, preocupar-se em tirar conclusões sobre um conjunto maior de dados (população). P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Quando se trabalha com dados numéricos, observa-se uma tendência destes de se agruparem em torno de um valor central. Isso indica que algum valor central é característica dos dados, e que pode ser usado para descrevê-los e representá-los. Média Aritmética: Média aritmética para dados não-tabelados: consiste na soma de todas as observações Xi dividida pelo número “n” de observações do grupo. Propriedades da média aritmética: ⇒ A soma dos desvios em relação à média é nula; P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Propriedades da média aritmética: ⇒ A média de uma constante é igual a constante; ⇒ A média do produto de uma constante por uma variável é igual ao produto da constante pela média da variável; ⇒ A soma dos quadrados dos desvios em relação a média é um mínimo. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Média aritmética para dados tabelados: se os dados estiverem agrupados em uma tabela de frequências, pode-se obter a média aritmética da distribuição, calculando-se. Mediana (Md): A mediana divide em duas partes o conjunto das observações ordenadas. Colocando-se os valores em ordem crescente ou decrescente, a mediana é o elemento que ocupa o valor central. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Mediana para dados não-tabelados: 1) Colocam-se os dados em ordem (rol); 2.1) Se o número de elementos “n” for ímpar, a mediana será o elemento central que ocupa a posição (n+1)/2 do rol; 2.2) Se “n” for par, a mediana será a média aritmética entre os dois elementos centrais que ocupam as posições n/2 e n/2+1 do rol. Mediana para dados tabelados: Procedimento no caso de distribuição por ponto: 1) Calcula-se a posição da mediana: (n par) ou (n ímpar). onde: n. total de observações e posição da mediana. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: 2) Se “n” é ímpar, a mediana será o valor de Xi correspondente à primeira Faci ≥ PMd. 3) Se “n” é par, a mediana será o valor de Xi correspondente à primeira Faci > PMd. Caso Faci = PMd, será a média entre o valor de Xi correspondente a esta Faci e o próximo valor de Xi. Mediana para dados tabelados: Procedimento no caso de distribuição por classe: 1) Calcula-se a posição da mediana: 2) A mediana estará localizada na classe onde, pela primeira vez, Faci ≥ PMd. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: 3) Para encontrar o valor da mediana, aplica-se a seguinte fórmula: onde: Li = limite inferior da classe que contém a mediana; Fac ant = frequência acumulada da classe anterior à classe que contém a mediana; h = amplitude de classe que contém a mediana; fMd = frequência da classe que contém a mediana. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Moda (Mo): A moda de um grupo de observações é definida como a medida de frequência máxima ou é (são) o(s) valor(es) que se repete(m) mais vezes. Pode ser utilizada para dados qualitativos. Moda para dados não-tabelados: A moda será o valor mais frequente no conjunto de dados, podendo, este mesmo conjunto, possuir mais de uma moda (bimodal ou plurimodal), ou ainda, não apresentar moda (amodal). Moda para dados tabelados: Quando a distribuição é por ponto, a determinação da moda é imediata pela simples inspeção da tabela, já que a Mo é o valor de frequência máxima. Quando a distribuição de frequências é por intervalo, pode-se calcular a moda bruta que é o ponto médio da classe com maior frequência (método rudimentar). P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Tendência Central: Observações ⇒ Não há regra fixa para se escolher entre a média, a mediana e a moda. ⇒ A média aritmética é a medida de tendência central mais utilizada, principalmente quando não há valores muito extremos no conjunto de dados. ⇒ A mediana deve ser usada, sempre que possível, como medida representativa de distribuições fortemente assimétricas, ou seja, quando os valores extremos do conjunto são muito distantes dos outros, pois seu valor não é afetado por estes valores. ⇒ A moda é usada quando há interesse em saber o ponto de concentração do conjunto ou o tipo de distribuição que se está analisando, sendo que o seu valor, em se tratando de dados agrupados, é fortemente afetado pela maneira como as classes são constituídas. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Separatrizes: São valores de posição, que dividem o rol. As principais medidas separatrizes são: mediana, quartis, decis e centis ou percentis. Quartis (Qi): Os Quartis dividem um conjunto de dados em quatro partes iguais. onde: Q1 = primeiro quartil e separa os primeiros 25% dos 75% restantes; Q2 = segundo quartil ou mediana e separa o conjunto de dados em 2 partes iguais; Q3 = terceiro quartil e separa os primeiros 75% dos 25% restantes. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Separatrizes: Quartis para dados não-tabelados: 1) Colocam-se os dados em ordem (rol); 2) Calcula-se a posição do quartil através da fórmula: 3) O quartil será o valor que ocupa, no rol, a posição calculada anteriormente. Quartis para dados tabelados: Procedimento no caso de distribuição por ponto 1) Calcula-se a posição do quartil: 2) O quartil será o valor de Xi correspondente à primeira Faci ≥ PQi. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Separatrizes: Quartis para dados tabelados: Procedimento no caso de distribuição por classe 1) Calcula-se a posição do quartil: 2) O quartil será o valor de Xi correspondente à primeira Faci ≥ PQi. 3) Para encontrar o valor do quartil aplica-se a seguinte equação: onde: Li = limite inferior da classe que contém o respectivo quartil; Fac ant = frequência acumulada da classe anterior à classe que contém o quartil; h = amplitude de classe que contém o quartil; fQi= frequência da classe que contém o quartil. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Separatrizes: Decis (Di): São valores que dividem o conjunto das observações em 10 (dez) partes iguais. Para encontrar o valor do decil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do decil, a fórmula será: Para encontrar o valor do decil quando os dados estão agrupados em classe, a equação será: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Separatrizes: Percentis (Pi): São valores que dividem o conjunto das observações em 100 (cem) partes iguais. Para encontrar o valor do percentil desejado, procede-se como no caso dos quartis, sendo que para o cálculo da posição do percentil, a fórmula será: Para encontrar o valor do percentil quando os dados estão agrupados em classe, a equação será: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: As medidas de dispersão visam a descrever os dados no sentido de informar o grau de dispersão ou afastamento dos valores observados em torno de um valor central. Elas indicam se um conjunto é homogêneo (pouca ou nenhuma variabilidade) ou heterogêneo (muita variabilidade). É comum encontra-se séries que, apesar de apresentarem a mesma média, são compostos de maneiras diferentes, o que mostra que as medidas de tendência central são insuficientes para descrever adequadamente uma série estatística. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Amplitude de Variação (H): É a diferença entre o maior e o menor valor do conjunto. Possui grande instabilidade, porque considera somente os valores extremos do conjunto. Também e chamada de desvio extremo. Soma de Quadrados (SQ): A soma dos quadrados refere-se à soma dos quadrados dos desvios em relação à média. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Variância (σ² → população; s² → amostra): A variância populacional (σ²) é a soma de quadrados dividida pelo número de observações N. Quando a variância é calculada a partir de uma amostra para fins de estimação, o denominador passa a ser (n-1), o que nos fornece uma estimativa imparcial da variância populacional. Variância para dados não-tabelados: O denominador (n-1) é denominado de “graus de liberdade” dessa estimativa. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Propriedades da Variância: A variância de uma constante é zero; A variância da soma ou diferença de uma constante k com uma variável é igual a variância da variável; A variância da soma de variáveis independentes é igual à soma das variâncias das variáveis; A variância do produto de uma constante por uma variável é igual ao produto do quadrado da constante pela variância da variável. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Variância para dados tabelados ou Usualmente utiliza-se n-1 para conjuntos de dados com menos de 30 pontos amostrais. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Desvio Padrão (σ → população; s → amostra): A vantagem do desvio padrão sobre a variância é que este permite uma interpretação direta da variação do grupo, por ser expresso na mesma unidade das medidas observadas. O desvio padrão é a raiz quadrada da variância: Para os dados de medição, especialmente em grandes amostras (n≥30), verifica-se que: 68% das observações estarão entre 95% das observações estarão entre praticamente 100% entre P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Medidas de Dispersão: Coeficiente de Variação (CV ou CV%): É uma medida de dispersão relativa. Utilizada quando se deseja comparar a variação de conjuntos de dados que apresentem diferentes unidades de medição e/ou tamanhos diferentes. O CV independe da unidade de medida dos dados. O CV também pode ser expresso como porcentagem da média. ou P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Assimetria e Curtose: Estudo da forma que as distribuições apresentam. Assimetria. É o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de frequências. Se a curva de frequências de uma distribuição tem uma “cauda” mais longa à direita da ordenada máxima do que à esquerda, diz-se que a distribuição é desviada para direita ou que ela tem assimetria positiva. Se ocorrer o inverso, diz-se que ela é desviada para esquerda ou que ela tem assimetria negativa. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Assimetria e Curtose: Coeficiente de Assimetria de Pearson (C.A.) Interpretação: Coeficiente negativo: esquerda), sendo: distribuição assimétrica negativa (à Coeficiente nulo: distribuição simétrica, sendo: Coeficiente positivo: distribuição assimétrica positiva (à direita), sendo: P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Assimetria e Curtose: Curtose É o grau de achatamento (afilamento) de uma curva em relação à curva normal (gaussiana), tomada como padrão. Uma distribuição pode ser classificada quanto à curtose, como: Platicúrtica: a curva é mais achatada do que a normal (σ ou s grandes). Mesocúrtica: a curva é normal (σ ou s intermediários). Leptocúrtica: a curva é mais alta do que a normal (σ ou s pequenos). Para medir o grau de curtose de uma distribuição, pode-se usar os seguinte coeficiente. P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem) Assimetria e Curtose: Coeficiente centrílico de curtose (K) onde: Interpretação: K < 0,263 ⇒ curva leptocúrtica; K = 0,263 ⇒ curva mesocúrtica; K > 0,263 ⇒ curva platicúrtica. Q1 Q3 D1 D9 = = = = primeiro quartil; terceiro quartil; primeiro decil; nono decil.