ESTATÍSTICA APLICADA

Propaganda
Unidade I
ESTATÍSTICA APLICADA
Prof. Luiz Felix
O termo estatística
 Provém da palavra Estado e foi utilizado
originalmente para denominar
levantamentos de dados, cuja finalidade
era orientar o Estado em suas decisões.
 Foi utilizado em épocas remotas para
determinar o valor dos impostos
cobrados dos cidadãos e até mesmo
para determinar a estratégia de uma
nova batalha.
Definição
 Estatística é um conjunto de técnicas e
métodos que nos auxiliam no processo
de tomada de decisão na presença de
incerteza.
Exemplos de aplicações:
 caracterização de perfil sócio-econômico;
 análise de intenção de votos;
 levantamento de pessoas com nível
universitário.
População e amostra
 População  conjunto de todos os itens
(pessoas, coisas, objetos) que
interessam ao estudo de um fenômeno
coletivo segundo alguma característica.
 Amostra  qualquer subconjunto não
vazio de uma população.
Estatística descritiva
 Estatística descritiva  é a parte da
Estatística que tem por objetivo
descrever os dados observados.
 Exemplo: Índice Nacional de Preço ao
Consumidor (INPC), que envolve a
sintetização dos aumentos dos
produtos da cesta básica.
Estatística indutiva
 Estatística indutiva  é a parte da
Estatística que tem por objetivo obter e
generalizar conclusões para a população
a partir de uma amostra, através do
cálculo de probabilidade.
O cálculo de probabilidade é que
viabiliza a inferência estatística.
 Exemplo: análise do mercado
financeiro visando explicar tendências
das taxas de juros.
Principais fases do
método estatístico
 Definição do problema
 Planejamento
 Coleta de dados
 Apuração dos dados
 Apresentação dos dados
 Análise e interpretação dos dados
Dados estatísticos
 Quando se trabalha com a observação, a
mensuração, a análise e a interpretação
de números, esses números nos
conduzem a índices inflacionários,
índices de desemprego, probabilidade de
determinado candidato ganhar as
eleições etc.
 Tais números serão chamados de dados
estatísticos.
Dados brutos e rol
 Dados brutos  uma sequência de
valores numéricos não organizados,
obtidos diretamente da observação de
um fenômeno coletivo.
Exemplo: idade dos meus professores:
49 63
49,
63, 34
34, 27
27.
 Rol  uma sequência ordenada de
dados brutos
Exemplo: idade dos meus professores:
27, 34, 49, 63 ou 63, 49, 34, 27.
Variáveis
Quantitativas
 Contínuas – assumem qualquer valor em
um intervalo. Ex.: idade.
 Discretas – originam-se da contagem de
itens. Ex.: quantidade de produtos
produzidos por dia.
Qualitativas
 Nominais – definem categorias. Ex.:
separação por sexo.
 Por posto – dispõem os elementos em
uma ordem de preferência. Ex.: primeiro,
segundo...
Interatividade
Qual das seguintes séries abaixo
representa um rol?
a) X: 1, 2, 3, 5, 4, 6
b) Y: 6, 5, 4, 7, 8, 9
c) Z: 1,
1 1,
1 3
3, 3
3, 5
d) K: 5, 1, 1, 3, 3
e) L: 2, 2, 7, 8, 9, 1
Notação por índices
 O símbolo xi (lê-se “x índice i”) irá
representar qualquer um dos n valores
assumidos pela variável x. (x1, x2, ..., xn).
“n” é denominado índice e poderá
assumir qualquer dos números entre 1,
2 3,
2,
3 4
4..., n.
n
 NOTAÇÃO SIGMA (∑):
A maioria dos processos estatísticos irá
exigir o cálculo da soma de um conjunto
de números. A letra maiúscula grega
sigma (∑) é utilizada para representar
essas somas.
Medidas de tendência central
 Quando estamos diante de um conjunto
de dados, seja ele pequeno ou grande,
em geral, buscamos medidas que
possam ser usadas para indicar um valor
que tende a representar melhor aquele
determinado conjunto de números.
números
As medidas mais usadas nesse sentido são
as chamadas medidas de tendência central:
 média;
 mediana;
 moda.
Média aritmética

É um valor calculado para um grupo de
dados, usado para descrevê-los. É o
ponto de equilíbrio dos dados.
x = ∑ xi
n

xi : cada variável da amostra.

n: é o número total de observações.
Média aritmética – exemplo
 Calcule a média aritmética do conjunto
de dados:
xi = 3, 5, 8, 12, 7, 25
x = ∑ x = 3 + 5 + 8 + 12 + 7 + 25 = 60 = 10
n
6
6
 Interpretação: O valor médio dos dados
é 10,, ou seja,
j , os valores deste conjunto
j
de dados concentram-se em torno do 10.
Média aritmética – exemplo
 Calcule a média aritmética do conjunto de
dados:
xi = 1, 1, 3, 5
x = ∑ x = 1 + 1 + 3 + 5 = 10 = 2,5
n
4
4
 Interpretação: O valor médio dos dados é
2,5,
, , ou seja,
j , os valores deste conjunto
j
de
dados concentram-se em torno do 2,5.
Média aritmética ponderada
 A cada valor xi deverá ser atribuído um
peso wi .
xp = ∑ xi . wi
∑ wi
 xi : cada variável da amostra.
 wi : cada peso da amostra.
Média aritmética ponderada –
exemplo

Um aluno tirou as notas 7, 3, 6 e 5 em
quatro avaliações que, respectivamente,
tinham os pesos 2, 5, 1, 2. Calcule a
média do aluno levando-se em conta os
pesos das avaliações.
xp = ∑ xi . wi = 7.2 + 3.5 + 6.1 + 5.2 = 45 = 4,5
∑ wi
2+5+1+2
10
Mediana

É um valor que separa o rol em duas
partes deixando à sua esquerda o
mesmo número de elementos que
estão à sua direita. É o ponto que
ocupa a posição central em uma série.

Se o número de elementos do rol for
ímpar, a mediana será o valor do meio.

Se o número de elementos do rol for
par, a mediana será a média dos 2
valores do meio.

Podemos calcular a posição da mediana
com a fórmula:
posmed = (n + 1)
2
Mediana – exemplo
 Determinar a mediana
xi = 2, 20, 12, 23, 20, 8, 12
Solução:
Rol xi: 2, 8, 12, 12, 20, 20, 23
n = 7, logo:
posmed = (7 + 1) = 8 = 4ª posição
2
2
A mediana é o elemento que ocupa a 4ª
posição: mediana = 12
Mediana – exemplo
 Determinar a mediana
xi = 7, 21, 13, 15, 10, 8, 9, 13
Solução:
Rol xi: 7, 8, 9, 10, 13, 13, 15, 21
n = 8, logo:
posmed = (8 + 1) = 9 = 4,5ª posição
2
2
Neste caso, deve-se tirar a média entre os 2
valores do meio para se obter a mediana
mediana.
md = 10 + 13 = 23 = 11,5
2
2
Moda

É o valor de maior frequência em um
conjunto de dados.
Se o conjunto de dados possui:
 Uma moda  unimodal
 Duas modas  bimodal
 Três modas  trimodal
 4 ou mais modas polimodal
 Nenhuma moda  amodal
Moda – exemplos
 Determinar a moda
xi = 2, 8, 3, 5, 4, 5, 3, 5, 5, 1
Solução: Rol xi: 1, 2, 3, 3, 4, 5, 5, 5, 5, 8
moda = 5  unimodal
 Determinar a moda
xi = 5, 4, 3, 3, 5, 4
Solução: Rol xi: 3, 3, 4, 4, 5, 5
não existe moda  amodal
Interatividade
Para o seguinte conjunto de dados
xi = 5, 9, 7, 31, 21, 13, 13, 21,
determinar a média aritmética simples, a
mediana e a moda.
a) Média = 15; mediana = 13; moda = 13 e 21
b) Média = 15; mediana = 26; moda = 13 e 21
c) Média = 14; mediana = 26; moda = 13
d) Média = 15; mediana = 13; moda = 21
e) Média = 14; mediana = 26; moda = 13 e 21
Medidas de dispersão
 Indicam o quanto os dados estão
dispersos em torno da região central.
 Quanto maiores as medidas de
dispersão, mais heterogêneos são os
dados e,
dados,
e ao contrário,
contrário quanto menores
essas medidas, mais homogêneo o
conjunto.
Analisaremos as seguintes medidas de
dispersão:
 amplitude
lit d total;
t t l
 desvio padrão;
 variância.
Medidas de dispersão
 Considere os seguintes conjuntos de
valores das variáveis X, Y e Z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5
5, 15
15, 50
50, 120
120, 160
Os 3 conjuntos apresentam a mesma média
aritmética: 70.
Notamos que o conjunto X é mais
homogêneo que os conjuntos Y e Z.
Medidas de dispersão
 Quando se deseja entender, analisar e
descrever de forma adequada um
determinado conjunto de dados, faz-se
necessário dispor não apenas de
informações relativas à média, mediana e
moda.
moda
 É preciso que se disponha de
informações relativas à variabilidade
(dispersão) dos números que compõem
o referido conjunto de dados.
 Essas medidas de variabilidade ou
dispersão indicam se os dados
observados estão próximos ou
separados uns dos outros.
Amplitude total
 A amplitude total, ou intervalo, de um
determinado conjunto de dados é obtido
pela diferença entre o maior e o menor
valor nesse conjunto de números.
 Amplitude Total = Valor Máximo – Valor Mínimo
 Sendo xi: 7, 8, 9, 10, 13, 20
Amplitude Total = 20 – 7 = 13
Desvio médio
 A dispersão dos dados em relação à
média de uma sequência pode ser
avaliada através dos desvios de cada
elemento da sequência em relação à
média da sequência.
DMédio = ∑ | xi  x |
n
Em que n é o número de observações.
Exemplo de | x |
|3| = 3
| 3| = 3
Desvio médio – exemplo
Para o conjunto de dados xi = 2, 8, 4, 6,
calcule o desvio médio.
Solução:
DMédio = ∑ | xi  x |
n
x = 2 + 8 + 4 + 6 = 20 = 5
4
4
DM = | 2  5 | + | 8  5 | + | 4  5 | + | 6  5 |
4
DM = |
| 3| + | 3 | + |
| 1| + | 1 | = 3 + 3 + 1 + 1
4
DM = 2
4
Variância e desvio padrão
(população e amostra)
POPULAÇÃO
Variância: σ2 = ∑ (xi – x)2
n
Desvio Padrão: σ = σ2
AMOSTRA
Variância: S2 = ∑ (xi – x)2
n–1

Desvio Padrão: S = S2
Variância e desvio padrão
(população) – exemplo
 Para a população xi = 4, 5, 8, 5, calcule a
variância e o desvio padrão.

Solução:
σ2 = ∑ (xi  x)2
e
σ = σ2
n
x = 4 + 5 + 8 + 5 = 22 = 5,5
55
4
4
σ2 = (4 5,5)2 + (5 5,5)2 + (8  5,5)2 + (55,5)2
4
σ2 = (1,5)
( 1 5)2 + ((0,5)
0 5)2 + (2
(2,5)
5)2 + ((0,5)
0 5)2 = 2
2,25
25
4


Desvio padrão: σ = σ2 = 2,25 = 1,5
Variância e desvio padrão
(amostra) – exemplo

Para a amostra xi= 4, 5, 8, 5, calcule a
variância e o desvio padrão.

Solução:
S2 = ∑ (xi  x)2
e
S = S2
n–1
x = 4 + 5 + 8 + 5 = 22 = 5,5
55
4
4
S2 = (4 5,5)2 + (5 5,5)2 + (8  5,5)2 + (55,5)2
4–1
S2 = (1,5)
( 1 5)2 + (0,5)
( 0 5)2 + (2,5)
(2 5)2 + (0,5)
( 0 5)2 = 9 = 3
3


Desvio padrão: S = S2 = 3 = 1,73
3
Interatividade
Para a população xi = 1, 9, 3, 7, 5,
calcule a variância e o desvio padrão.
a) Variância = 7 e desvio padrão = 2,64
b) Variância = 8 e desvio padrão = 2,82
c) Variância = 9 e desvio padrão = 3
d) Variância = 10 e desvio padrão = 3,16
e) Variância = 11 e desvio padrão = 3,31
Distribuição de frequências
 A distribuição de frequências é o modo
de tratamento de dados utilizado quando
é grande a quantidade de dados brutos,
e passamos a agrupar os dados
estatísticos em subconjuntos com
características semelhantes
semelhantes.
 A distribuição de frequências é a
organização de dados em classes ou
intervalos, para determinar o número de
observações ou a percentagem de
observações de cada classe
classe, chamada
de frequência de classes.
Distribuição de frequências
Classe: são intervalos que subdividem a
amplitude total.
Limites de classe: são os limites extremos
de cada classe.
Li  é o menor valor das classes
consideradas.
Ls  é o maior valor das classes
consideradas.
Amplitude de classe: é a diferença entre o
limite Li e o Ls da classe e determina a
amplitude das classes de uma distribuição
de frequências.
h = Ls – Li
Distribuição de frequências
Nº de classes = 4
Li = 140
Amplitude da classe  h = 10
Ls = 150
Alguns conceitos de uma
distribuição de frequência
Frequência relativa %: é o quociente entre a
frequência absoluta da i-ésima classe com o
somatório das frequências, multiplicando
esse resultado por 100:
fri% = fi
. 100
n
Frequência acumulada: é o somatório da
frequência absoluta da i-ésima classe com a
frequência absoluta das classes anteriores.
Distribuição de frequências –
exemplo
A observação das notas de 30 alunos em
uma prova mostrou os valores:
3; 4; 2,5; 4; 4,5; 6; 5; 5,5; 6,5; 7;
7,4; 2; 3,5; 5; 5,5; 8; 8,5; 7,5; 9; 9,5;
5; 5
5,5;
5; 4
4,5;
5; 4; 7
7,5;
5; 6
6,5;
5; 5; 6; 6
6,5;
5; 6
6.
Distribuição de frequências –
variável contínua
Rol
2; 2,5; 3; 3,5; 4; 4; 4; 4,5; 4,5; 5;
5; 5; 5; 5,5; 5,5; 5,5; 6; 6; 6; 6,5;
6,5; 6,5; 7; 7,4; 7,5; 7,5; 8; 8,5; 9; 9,5
xi
fi
fri%
Fi
Fri%
2 |-- 4
4
13,33
4
13,33
4 |-- 6
12
40
16
53,33
6 |-| 8
10
33 34
33,34
26
86 67
86,67
8 |-- 10
4
13,33
30
100
∑
30
100
---
---
Distribuição de frequências –
exemplo
xi
fi
fri%
Fi
Fri%
2 |-- 4
4
13,33
4
13,33
4 |-- 6
12
40
16
53,33
6 ||-- 8
10
33,34
26
86,67
8 |-- 10
4
13,33
30
100
∑
30
100
---
---
Alunos com nota > = 4 e menor 6: 12
Alunos com nota menor que 6: 16
%Alunos com nota > = 4 e menor que 6: 40%
%Alunos com nota < que 6: 53,33%
Interatividade
A observação das notas de 30 alunos em
uma prova mostrou os seguintes valores
conforme mostrado na distribuição de
frequências abaixo. Indique qual o
percentual de alunos com nota menor que 8.
a) 10%
Notas
fi
b) 33,34%
2 |-- 4
4
c) 26%
4 |-- 6
12
6 |-- 8
10
8 |-- 10
4
d) 86,67%
e) 13,33%
ATÉ A PRÓXIMA!
Download