4. Distribuição de frequências

Propaganda
Estatística e Probabilidade
• Conceitos introdutórios.
Distribuição de frequências em tabelas. Medidas de
normalidade. Gráficos para avaliação da normalidade.
• Exercícios.
•
•
1. Introdução.

A estatística é a parte da Matemática aplicada que
fornece métodos para a coleta, organização, descrição,
análise e interpretação de dados e para a utilização dos
mesmos na tomada de decisões. Tem como objetivos:

A análise de dados dos (gráficos, resumos numéricos,
tabelas, etc).

A produção de dados (conceitos básicos de planejamento e
amostragem).

A inferência
consistentes)

estatísticas
(formulação
de
conclusões
•





Introdução
Estatística Descritiva.
Descreve os dados observados e na sua função dos
dados, tem as seguintes atribuições.
- A obtenção ou coleta de dados – por questionários ou
observações diretas de uma população ou amostra.
- A organização dos dados – consiste na ordenação e
crítica quanto à correção dos valores observados.
- A representação dos dados – os dados estatísticos
podem ser mais facilmente compreendidos quando
apresentados através de tabelas e gráficos, que permite
uma visualização instantânea de todos os dados.
•
Introdução

Estatística Indutiva

Obtém e generaliza conclusões para a população a partir
de uma amostra, através do cálculo de probabilidade.

A tais conclusões estão sempre associados a um grau de
incerteza e consequentemente, a uma probabilidade de
erro.
•
1. Introdução.

1.1 População e amostra.

Referem-se ao conjunto de entes cujas propriedades
desejamos averiguar.

População estatística ou universo estatístico: coleção
de todos os elementos cujas características (comuns)
desejamos conhecer conhecer.

Amostra é um subconjunto finito da população cujas
características serão medidas. A amostra será usada
para descobrir características da população. Como todo
a análise estatística será inferida a partir das
características obtidas da amostra, é importante que a
amostra seja representativa da população, isto é, que as
características de uma parte (amostra) sejam em geral
as mesmas que do todo (população).
•
1. Introdução.
•

1. Introdução.
Parâmetro - é uma característica numérica estabelecida
para toda uma população.

Estimador
é uma característica
estabelecida para uma amostra.
numérica

Dados estatísticos – parâmetros ou estimadores,
expressos em números reais,
a partir de análise
estatística.
•
1.2 Tipo de amostragem.
•
1.2 VARIÁVEIS

São quaisquer características atribuídas
observado (pessoa, objeto ou animal).

Enquadram ou categorizam os indivíduos, como na
utilização das variáveis sexo, emprego, etc.

Distribuem-se em valores numéricos como como altura e
renda, que terão derivações matemáticas.

Dividem-se em:
ao
objeto
•
1.2 VARIÁVEIS
•
1.2 VARIÁVEIS

Variável qualitativa: quando seus valores são expressos
por atributos.

Qualitativa ordinal: ocorre quando é possível atribuir
alguma ordem aos indivíduos depois de atribuída a
característica. Exemplos: escolaridade ou grau de Instrução,
classe social, etc.

Qualitativa nominal: quando não é possível fazer nenhuma
classificação depois
de atribuída a característica.
Exemplos: profissão, procedência, sexo, cor da pele, etnia,
padrão de bandas ou cores, etc.
•
1.2 VARIÁVEIS

Variável quantitativa: quando seus valores são expressos
em números (salários dos operários, idade dos alunos de
uma escola, número de filhos, etc.).

Quantitativa contínua: pode assumir teoricamente qualquer
valor entre dois limites de números reais. Exemplo: altura,
peso, etc.

Quantitativa discreta: só pode assumir valores inteiros,
enumeráveis. Exemplo: número de filhos, número de
vitórias.
•
1.3 Distribuição de frequências.

É necessária para a verificação da distribuição da variável
na amostra e sua importância na população.

Para variáveis qualitativas, serão observadas números de
ocorrências (a frequência simples) ou proporções dos
eventos (a frequência relativa).

Para variáveis quantitativa discretas serão também usadas
as frequências simples ou relativa, podendo ser usados
intervalos de classe em alguns casos.

Para variáveis quantitativas contínuas serão observados
os eventos em intervalos de classe destinados a simplificar
a amostra. Deriva-se as frequências simples e relativas a
partir dos intervalos de classe.
•
1.4 Gráficos.
•
Gráficos são diagramas
de expressão
dos dados
estatísticos tabulados. Geralmente são expressos em duas
dimensões e num quadrante, onde a abcissa (linha
horizontal) é o eixo X e a ordenada (linha vertical) é o eixo
Y.
•
Seu uso deve ser de acordo com as variáveis propostas
para a amostra.
•
1.4 Gráficos.
•
Para variáveis qualitativas ou contínuas discretas, as
opções mais adequadas são gráficos de barra para a
apresentação das frequências simples. A variável
qualtitativa está representada na abcissa, ou no eixo X.
•
Um tipo especial de gráfico de barra é o histograma. Neste
caso as barras correspondem à ordenação dos dados. Pode
ser usado para qualtitativas ordinais ou quantitativas
discretas intervaladas. É a principal ferramenta para a
apresentação de variáveis quantitativas contínuas
intervaladas.
•
Também são usados gráficos de área, ou em pizza, onde
as proporções dos eventos são demonstradas.
•
1.4 Gráficos.
•
Gráficos em linha são utilizados frequentemente como
diagramas de acompanhamento. O tipo de tabulação neste
caso é dito série temporal. No gráfico, a abcissa
corresponde à evolução temporal e a ordenada à
distribuição da variável. As variáveis são do tipo quantitativa
discreta.
•
•
1.4 Gráficos.
•
Para variáveis quantitativas
principalmente o histograma.
•
contínuas,
é
utilizado
Este vai refletir o padrão de normalidade da amostra.
Frequência
relativa
(%)
Variável em Intervalos de classe
•
1.4 Gráficos: barras e pizzas.
•
1.4 Gráficos: histogramas; padrão de normalidade.
•
2. APRESENTAÇÃO DE DADOS ESTATÍSTICOS

APRESENTAÇÃO TABULAR

A apresentação tabular dos dados estatísticos consiste na
reunião ou grupamento dos dados em tabelas com a
finalidade de apresentá-los de modo ordenado e simples, de
de fácil percepção.

Componentes Básicos

Em termos genéricos, uma tabela se compõe dos
seguintes elementos básicos:
•

3. APRESENTAÇÃO DE DADOS ESTATÍSTICOS
Principais Elementos de uma Tabela


Título:
Conjunto de informações, as mais completas possíveis, localizado
no topo da tabela, respondendo às perguntas: O quê? Onde?
Quando?


Cabeçalho:
Parte superior da tabela que especifica o conteúdo das colunas.

Coluna Indicadora: Parte da tabela que especifica o conteúdo das
linhas.

Linhas: Retas imaginárias que facilitam a leitura, no sentido
horizontal, de dados que se inscrevem nos seus cruzamentos com
as colunas.


Casa ou Célula: Espaço destinado a um só número.
Rodapé: são mencionadas a fonte se a série é extraída de alguma
publicação e também as notas ou chamadas que são
esclarecimentos gerais ou particulares relativos aos dados.
•
3.1 SÉRIES ESTATÍSTICAS

São apresentações tabulares de dados estatísticos em
função de características específicas, geralmente:
–
–
–
Época ou tempo;
Locais;
Padrões da espécie.

Esses elementos determinam o surgimento de quatro
tipos fundamentais de séries estatísticas:

Séries Temporais ou Cronológicas: são aquelas nas
quais os dados são reunidos segundo o tempo que
varia, permanecendo fixos o local e espécie.
•
3.1. SÉRIES ESTATÍSTICAS

Séries Geográficas: são aquelas nas quais os dados
são reunidos segundo o local que varia permanecendo
fixos o tempo e a espécie.

Séries Específicas: são aquelas nas quais os dados
são reunidos segundo o espécie que varia
permanecendo fixos o tempo e o local.

Séries Composta ou Mista: é a combinação de dois ou
mais fundamentais de séries estatísticas.

Exemplo: Geográfica – Temporal.
•
3.1 SÉRIES ESTATÍSTICAS
•
4. Distribuição de frequências

São apresentações tabulares em que a distribuição da
variável na amostra é apresentada em padrões de
ocorrência, ou o número de dados que pertence a cada
valor da variável. O valor da variável é codificado como x.

A distribuição da variável é demonstrada como frequência
simples e relativa. Nos dois casos é também a apresentada
a frequência acumulada.

Variáveis contínuas devem ser apresentadas em intervalos
de classe, o que é chamado de freqüência intervalar.

Variáveis quantitativas discretas podem ser apresentadas
na forma simples, por valor ou podem também ser
apresentadas em intervalos de classe. Exemplos básicos a
seguir.
•
4. Distribuição de frequências

Com base na tab. 1.1 do livro texto, elabore uma tabela de
distribuição de frequências simples com os dados obtidos
das conchas.

Escolha uma variável, CAC, LAC ou PC. Neste exercício
considere como uma amostra, não dividida em séries
verticais e horizontais.

Entregar no final da aula.
•
4. Distribuição de frequências com intervalos de
classe(exemplo).
•
4. Distribuição de frequências com intervalos de classe.

4.1 Elementos Principais:

a) Classe – é cada um dos intervalos em que os dados são
agrupados.

b) Limites de classes são os valores extremos de cada
classe.
li = limite inferior de uma classe;
Li = limite superior de uma classe.




c) Amplitude – é a diferença entre o maior valor e o menor
valor de certo conjunto de dados. Pode ser referida ao total
de dados ou a uma das classes em particular. A amplitude
total (At) é calculada pela seguinte expressão:
At = Max. (rol) – Min.(rol).
•
4. Distribuição de frequências.

4.1 Elementos Principais:

A amplitude do intervalo de classes (h) – é a relação entre
a amplitude total e o número de classes, conforme mostra a
expressão a seguir:

Mais adiante veremos como calcular o número de classes
(n).
•
4.1 Elementos principais.

d) Ponto médio de classe (xi) – importante para as medidas de
tendência central e dispersão, é calculado pela seguinte expressão:

e) Freqüência absoluta ou simples (fi) - freqüência absoluta de uma
classe de ordem i, é o número de dados que pertencem a essa
classe.

f) Freqüência relativa (fri) - freqüência relativa de uma classe de
ordem i, é o quociente da freqüência absoluta dessa classe (fi),
pelo total, ou seja,

Obs: a soma de todas as freqüências absolutas é igual ao total e a
soma das frequências relativas é igual a 100.
•
4.1 Elementos principais.

g) Freqüência acumulada (Fi) - freqüência acumulada de
uma classe de ordem i, é a soma das freqüências até a
classe de ordem i.

h) Freqüência acumulada relativa (Fri) - freqüência relativa
acumulada de uma classe de ordem i, é a soma das
freqüências relativas até a classe de ordem i.
•
4.2. A organização de uma distribuição de fequências
em intervalos de classe.
•
1. Organização do rol: é colocar os dados em ordem
crescente ou decrescente.
•
2. Cálculo do número conveniente de classes (n): o número
de classe deve ser escolhido pelo pesquisador e geralmente
situa-se entre 5 a 15 classes. Usa-se a fórmula
•
3. Cálculo da amplitude dos intervalos de classe
convenientes (h). Deve ser o mesmo para todas as classes:
fi
•
4.2. A organização de uma distribuição de fequências
em intervalos de classe.
•
4. Obtenção dos limites das classes. Geralmente as classes
são intervalos fechados à esquerda e abertos á direita. O
limite inferior da 1a classe é igual ao mínimo do rol, isto é:
l1 = Min.(rol)
•
•
Encontram-se os limites das classes, adicionando-se
sucessivamente a amplitude do intervalo de classes aos
limites da 1a classe.
•
5. Na tabela, colocar as fi (frequências absolutas) e calcular
as fri (freqüências relativas).
•
7. Apresentar a distribuição em histograma.
•
8. Exercício: tabular desta forma os dados obtidos da
conchas usados anteriormente e construir o histograma.
Entregar no final.
Download