2ª Parte

Propaganda
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
⇒ Uma distribuição de frequências é uma tabela que reúne o
conjunto de dados conforme as frequências ou as repetições de seus
valores.
⇒ Esta tabela pode representar os dados em classes ou não, de
acordo com a classificação dos dados em discretos ou contínuos.
Conceitos Básicos:
Dados Brutos: São os dados originais, conforme foram coletados,
os quais ainda não estão prontos para análise, pois não estão
numericamente organizados ou tabelados.
Rol: É uma lista onde as observações são dispostas em uma
determinada ordem (crescente ou decrescente).
Amplitude Total (H, At ou R): É a diferença entre o maior e
menor valor observado da variável em estudo:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Conceitos Básicos:
Classe: É cada um dos grupos ou intervalos de valores em que se
subdivide a amplitude total do conjunto de tamanho n.
Para a determinação do número de classes, existem diversos
métodos, dentre os quais se destaca a regra de Sturges, onde o
número de classes (k) é calculado por: k = 1 + 3,3 log n.
Recomenda-se considerar 4 ≤ k ≤ 12.
Limites de Classe: São os valores extremos de cada classe.
Limite inferior (Li): é o menor valor da classe considerada;
Limite superior (Ls): é o maior valor da classe considerada.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Conceitos Básicos:
Amplitude de Classe (h): é a diferença entre o limite superior e
o limite inferior da classe, ou seja:
h = Ls – Li, quando a distribuição de frequências já existe; ou
h = H/k, para a determinação da amplitude de classes para uma
distribuição de frequências a ser construída.
Ponto Médio de Classe (Xi): é a média aritmética dos limites de
classe, sendo o valor representativo da classe:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Conceitos Básicos:
Tipos de frequência:
Frequência simples absoluta (fi): é o número de observações que
aparece em uma classe ou valor individual.
Frequência simples relativa (fri): é o quociente entre a frequência
simples absoluta e o número total de observações.
de:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Conceitos Básicos:
Frequência acumulada crescente (faci
ou Fci): É a soma de todas as frequências
anteriores com a frequência do intervalo
considerado. Pode ser absoluta ou relativa.
Exemplos de Distribuições de Frequência:
Por Intervalo:
Por Pontos:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Gráficos Representativos:
Histograma: é um gráfico de colunas justapostas, cujas alturas
são proporcionais às frequências absolutas e cujas bases
correspondem ao intervalo de classe da distribuição ou o centro das
mesmas.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Gráficos Representativos:
Polígono de frequências: É um gráfico de linha, cujos vértices
são proporcionais as frequências absolutas e correspondem aos
pontos médios da distribuição.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Distribuição de frequências:
Gráficos Representativos:
Ogiva: é um gráfico de linha, cujos vértices são proporcionais às
frequências acumuladas e correspondem aos limites inferiores das
classes da distribuição.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas Descritivas:
Classificação das medidas descritivas:
A estatística descritiva visa a descrever os dados disponíveis da
forma mais completa possível sem, no entanto, preocupar-se em tirar
conclusões sobre um conjunto maior de dados (população).
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Quando se trabalha com dados numéricos, observa-se uma
tendência destes de se agruparem em torno de um valor central.
Isso indica que algum valor central é característica dos dados, e
que pode ser usado para descrevê-los e representá-los.
Média Aritmética:
Média aritmética para dados não-tabelados: consiste na soma
de todas as observações Xi dividida pelo número “n” de observações
do grupo.
Propriedades da média aritmética:
⇒ A soma dos desvios em relação à média é nula;
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Propriedades da média aritmética:
⇒ A média de uma constante é igual a constante;
⇒ A média do produto de uma constante por uma variável é igual
ao produto da constante pela média da variável;
⇒ A soma dos quadrados dos desvios em relação a média é um
mínimo.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Média aritmética para dados tabelados: se os dados estiverem
agrupados em uma tabela de frequências, pode-se obter a média
aritmética da distribuição, calculando-se.
Mediana (Md):
A mediana divide em duas partes o conjunto das observações
ordenadas.
Colocando-se os valores em ordem crescente ou decrescente, a
mediana é o elemento que ocupa o valor central.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Mediana para dados não-tabelados:
1) Colocam-se os dados em ordem (rol);
2.1) Se o número de elementos “n” for ímpar, a mediana será o
elemento central que ocupa a posição (n+1)/2 do rol;
2.2) Se “n” for par, a mediana será a média aritmética entre os dois
elementos centrais que ocupam as posições n/2 e n/2+1 do rol.
Mediana para dados tabelados:
Procedimento no caso de distribuição por ponto:
1) Calcula-se a posição da mediana:
(n par) ou
(n ímpar).
onde:
n. total de observações e
posição da mediana.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
2) Se “n” é ímpar, a mediana será o valor de Xi correspondente à
primeira Faci ≥ PMd.
3) Se “n” é par, a mediana será o valor de Xi correspondente à
primeira Faci > PMd.
Caso Faci = PMd, será a média entre o valor de Xi correspondente a
esta Faci e o próximo valor de Xi.
Mediana para dados tabelados:
Procedimento no caso de distribuição por classe:
1) Calcula-se a posição da mediana:
2) A mediana estará localizada na classe onde, pela primeira vez,
Faci ≥ PMd.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
3) Para encontrar o valor da mediana, aplica-se a seguinte fórmula:
onde: Li = limite inferior da classe que contém a mediana;
Fac ant = frequência acumulada da classe anterior à classe que
contém a mediana;
h = amplitude de classe que contém a mediana;
fMd = frequência da classe que contém a mediana.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Moda (Mo):
A moda de um grupo de observações é definida como a medida de
frequência máxima ou é (são) o(s) valor(es) que se repete(m) mais
vezes. Pode ser utilizada para dados qualitativos.
Moda para dados não-tabelados:
A moda será o valor mais frequente no conjunto de dados,
podendo, este mesmo conjunto, possuir mais de uma moda (bimodal
ou plurimodal), ou ainda, não apresentar moda (amodal).
Moda para dados tabelados:
Quando a distribuição é por ponto, a determinação da moda é
imediata pela simples inspeção da tabela, já que a Mo é o valor de
frequência máxima.
Quando a distribuição de frequências é por intervalo, pode-se
calcular a moda bruta que é o ponto médio da classe com maior
frequência (método rudimentar).
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Tendência Central:
Observações
⇒ Não há regra fixa para se escolher entre a média, a mediana e a
moda.
⇒ A média aritmética é a medida de tendência central mais
utilizada, principalmente quando não há valores muito extremos no
conjunto de dados.
⇒ A mediana deve ser usada, sempre que possível, como medida
representativa de distribuições fortemente assimétricas, ou seja,
quando os valores extremos do conjunto são muito distantes dos
outros, pois seu valor não é afetado por estes valores.
⇒ A moda é usada quando há interesse em saber o ponto de
concentração do conjunto ou o tipo de distribuição que se está
analisando, sendo que o seu valor, em se tratando de dados
agrupados, é fortemente afetado pela maneira como as classes são
constituídas.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Separatrizes:
São valores de posição, que dividem o rol.
As principais medidas separatrizes são: mediana, quartis, decis e
centis ou percentis.
Quartis (Qi):
Os Quartis dividem um conjunto de dados em quatro partes iguais.
onde: Q1 = primeiro quartil e separa os primeiros 25% dos 75%
restantes;
Q2 = segundo quartil ou mediana e separa o conjunto de
dados em 2 partes iguais;
Q3 = terceiro quartil e separa os primeiros 75% dos 25%
restantes.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Separatrizes:
Quartis para dados não-tabelados:
1) Colocam-se os dados em ordem (rol);
2) Calcula-se a posição do quartil através da fórmula:
3) O quartil será o valor que ocupa, no rol, a posição calculada
anteriormente.
Quartis para dados tabelados:
Procedimento no caso de distribuição por ponto
1) Calcula-se a posição do quartil:
2) O quartil será o valor de Xi correspondente à primeira Faci ≥ PQi.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Separatrizes:
Quartis para dados tabelados:
Procedimento no caso de distribuição por classe
1) Calcula-se a posição do quartil:
2) O quartil será o valor de Xi correspondente à primeira Faci ≥ PQi.
3) Para encontrar o valor do quartil aplica-se a seguinte equação:
onde: Li = limite inferior da classe que contém o respectivo quartil;
Fac
ant
= frequência acumulada da classe anterior à classe
que contém o quartil;
h = amplitude de classe que contém o quartil;
fQi= frequência da classe que contém o quartil.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Separatrizes:
Decis (Di):
São valores que dividem o conjunto das observações em 10 (dez)
partes iguais.
Para encontrar o valor do decil desejado, procede-se como no caso
dos quartis, sendo que para o cálculo da posição do decil, a fórmula
será:
Para encontrar o valor do decil quando os dados estão agrupados
em classe, a equação será:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Separatrizes:
Percentis (Pi):
São valores que dividem o conjunto das observações em 100
(cem) partes iguais.
Para encontrar o valor do percentil desejado, procede-se como no
caso dos quartis, sendo que para o cálculo da posição do percentil, a
fórmula será:
Para encontrar o valor do percentil quando os dados estão
agrupados em classe, a equação será:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
As medidas de dispersão visam a descrever os dados no sentido de
informar o grau de dispersão ou afastamento dos valores observados
em torno de um valor central.
Elas indicam se um conjunto é homogêneo (pouca ou nenhuma
variabilidade) ou heterogêneo (muita variabilidade).
É comum encontra-se séries que, apesar de apresentarem a
mesma média, são compostos de maneiras diferentes, o que mostra
que as medidas de tendência central são insuficientes para descrever
adequadamente uma série estatística.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Amplitude de Variação (H):
É a diferença entre o maior e o menor valor do conjunto.
Possui grande instabilidade, porque considera somente os valores
extremos do conjunto. Também e chamada de desvio extremo.
Soma de Quadrados (SQ):
A soma dos quadrados refere-se à soma dos quadrados dos
desvios em relação à média.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Variância (σ² → população; s² → amostra):
A variância populacional (σ²) é a soma de quadrados dividida pelo
número de observações N.
Quando a variância é calculada a partir de uma amostra para fins
de estimação, o denominador passa a ser (n-1), o que nos fornece
uma estimativa imparcial da variância populacional.
Variância para dados não-tabelados:
O denominador (n-1) é denominado de “graus de liberdade” dessa
estimativa.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Propriedades da Variância:
A variância de uma constante é zero;
A variância da soma ou diferença de uma constante k com uma
variável é igual a variância da variável;
A variância da soma de variáveis independentes é igual à soma das
variâncias das variáveis;
A variância do produto de uma constante por uma variável é igual
ao produto do quadrado da constante pela variância da variável.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Variância para dados tabelados
ou
Usualmente utiliza-se n-1 para conjuntos de dados com menos de
30 pontos amostrais.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Desvio Padrão (σ → população; s → amostra):
A vantagem do desvio padrão sobre a variância é que este permite
uma interpretação direta da variação do grupo, por ser expresso na
mesma unidade das medidas observadas.
O desvio padrão é a raiz quadrada da variância:
Para os dados de medição, especialmente em grandes amostras
(n≥30), verifica-se que:
68% das observações estarão entre
95% das observações estarão entre
praticamente 100% entre
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Medidas de Dispersão:
Coeficiente de Variação (CV ou CV%):
É uma medida de dispersão relativa.
Utilizada quando se deseja comparar a variação de conjuntos de
dados que apresentem diferentes unidades de medição e/ou
tamanhos diferentes.
O CV independe da unidade de medida dos dados.
O CV também pode ser expresso como porcentagem da média.
ou
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Assimetria e Curtose:
Estudo da forma que as distribuições apresentam.
Assimetria.
É o grau de desvio, afastamento da simetria ou grau de
deformação de uma distribuição de frequências.
Se a curva de frequências de uma distribuição tem uma “cauda”
mais longa à direita da ordenada máxima do que à esquerda, diz-se
que a distribuição é desviada para direita ou que ela tem assimetria
positiva.
Se ocorrer o inverso, diz-se que ela é desviada para esquerda ou
que ela tem assimetria negativa.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Assimetria e Curtose:
Coeficiente de Assimetria de Pearson (C.A.)
Interpretação:
Coeficiente negativo:
esquerda), sendo:
distribuição
assimétrica
negativa
(à
Coeficiente nulo: distribuição simétrica, sendo:
Coeficiente positivo: distribuição assimétrica positiva (à direita),
sendo:
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Assimetria e Curtose:
Curtose
É o grau de achatamento (afilamento) de uma curva em relação à
curva normal (gaussiana), tomada como padrão.
Uma distribuição pode ser classificada quanto à curtose, como:
Platicúrtica: a curva é mais achatada do que a normal (σ ou s
grandes).
Mesocúrtica: a curva é normal (σ ou s intermediários).
Leptocúrtica: a curva é mais alta do que a normal (σ ou s
pequenos).
Para medir o grau de curtose de uma distribuição, pode-se usar os
seguinte coeficiente.
P. P. G. em Agricultura de Precisão – DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)
Assimetria e Curtose:
Coeficiente centrílico de curtose (K)
onde:
Interpretação:
K < 0,263 ⇒ curva leptocúrtica;
K = 0,263 ⇒ curva mesocúrtica;
K > 0,263 ⇒ curva platicúrtica.
Q1
Q3
D1
D9
=
=
=
=
primeiro quartil;
terceiro quartil;
primeiro decil;
nono decil.
Download