ppt - FAU

Propaganda
Módulo 1
Estatística
Básica
Pesquisa Científica
Busca entender o objeto.
Desenvolve ideias e
percepções.
Ajuda a formular hipóteses.
Descreve em que circunstância
ou com que frequência algo
ocorre.
Avalia a relação entre 2 fatos
Busca esclarecer relações do
tipo causa- efeito entre duas
variáveis
Conceito de Estatística
• Estatística
Conjunto de técnicas destinadas ao estudo quantitativo de
fenômenos coletivos e empiricamente observáveis.
• Dado Estatístico
Número que mede a intensidade ou a característica do
fenômeno coletivo que está sendo estudado.
• Finalidade da Estatística
▪ Desenvolver métodos e técnicas p/ coleta, organização,
análise e interpretação de dados;
▪ Fornecer métodos para inferir conclusões sobre um
universo maior a partir das observações de um
fenômeno particular.
Conceito de Estatística: tipos
• Estatística Descritiva
Busca descrever a realidade. Usa técnicas para
organizar e sintetizar os dados observáveis dessa
realidade.
• Estatística Inferencial ou Indutiva
Busca inferir, induzir ou estimar sobre a característica
do
todo (a população) com base nos dados da parte
(amostra). Usa técnicas para generalizar um fato
particular tendo como referência uma amostra
Conceito de Estatística
 Inferência
Método para tirar conclusão sobre um fenômeno
através de repetidas observações, mantendo sempre as
mesmas condições. Processo mental para chegar a uma
conclusão a partir de premissas(suposições).
 Incerteza
Como não é possível controlar todos os fatores que
influem na observação de um fenômeno estatístico há
sempre um grau de incerteza sobre a veracidade dos
resultados coletados.
 Probabilidade
Por isso as inferências estatísticas são sempre incertas,
com uma margem de erro, portanto probabilísticas
Probabilidade
Conceito
• Probabilidade é a nossa incerteza sobre
ocorrência de um evento quando não se tem
conhecimento completo das circunstâncias que o
causam.
• Probabilidade é a possibilidade que existe
entre várias de um fato ou fenômeno acorrer.
• A Probabilidade tem a função mostrar a
chance de ocorrência de um evento.
• A Probabilidade é o ato de atribuirmos pesos
aos eventos.
Probabilidade
Baralho
52
Cartas
Qual a
probabilidade
de tirar
1 Az?
Conceito de Probabilidade
 Teoria da Probabilidade
A estatística é uma ciência sobre a incerteza. Se
baseia inteiramente na Teoria da Probabilidade (da
ocorrência de um fenômeno).
 Probabilidade Estatística
É a afirmação sobre a possibilidade ou probabilidade
de um fenômeno ocorrer, desde que satisfeitas um
conjunto de condições teóricas.
 Fenômenos aleatórios
São o objeto de estudo da estatística, e se referem a
todos fenômenos observáveis na natureza .
Fenômenos Aleatórios
Fenômenos Aleatórios
Fenômenos Aleatórios
 Características dos Fenômenos Aleatórios
▪ Repetição.
▪ Variabilidade.
▪ Não há previsibilidade sobre a variação futura.
 Frequência de um Fenômeno Aleatório
Quando um determinado fenômeno ocorre repetidas
vezes, diz-se que existe uma regularidade de ocorrências
ou frequência.
População e Amostra
População e Amostra Estatística
População de uma Variável
É o universo de todas as ocorrências
possíveis de um fenômeno aleatório. A
população é o conjunto total de dados de
uma realidade.
Amostra
É um subconjunto da população.
Representa uma parte dos dados da
população.
População e Amostra Estatística
População e Amostra Estatística
População e Amostra Estatística
Levantamento de dados
É o procedimentos de fazer observações de algum fenômeno
da população. Como é impossível levantar todos os dados de
uma população, coletamos parte desta informação: amostra.
Objetivo da Estatística
Levantar dados amostrais para concluir (inferir ou generalizar)
sobre as características da realidade mais ampla: população.
Indução Estatística
Processo pelo qual assumimos que os dados da amostra são
iguais ao de toda população. Essa generalização é feita
através do cálculo das probabilidades.
Amostra
Amostragem
Amostragem
Seleção da Amostra
As amostras devem se escolhidas de modo a permitir
calcular a probabilidade de ocorrência de um evento.
Amostra Representativa
É aquela que tem as mesmas características da população
de onde foi retirada
Amostra Probabilística
É aquela cujo processo de amostragem permite atribuir a
cada elemento da amostra uma probabilidade semelhante
à da população.
Amostragem Aleatória
É aquela em que cada elemento da população tem chance
igual de ser selecionado no levantamento dos dados.
Amostragem: Tipos
 Amostragem casual simples com reposição
Os elementos da população entram mais de uma vez na amostra.
 Amostragem casual simples sem reposição
Os elementos da população só podem entrar uma vez na amostra
 Amostragem sistemática:
Seleção da amostra com base num critério: Um em cada dez.
 Amostragem por conglomerados:
A amostra é selecionada por sorteio da área a ser pesquisada
 Amostra estratificada ou em estágios múltiplos:
A amostra é dividida em grupos e selecionada por etapas dentro
de cada grupo: cidade/bairro/quadra
Amostragem
Amostragem
Experimentação
Experimento e Variável
• Experimento – É a observação sistemática de um
fenômeno (evento aleatório) qualquer da população.
• Variável – É o valor que o fenômeno assume, em
um experimento qualquer.
• Domínio da Variável – São todos os valores
possíveis que um fenômeno pode assumir em um
experimento.
Experimento e Variável
Experimento
Variável
Lançar 1 dado
1,2,3,4,5,6
Lançar 1 moeda
Cara
Coroa
Domínio da Variável
Experimento e Variável
Variável: Tipologia
• Variável Qualitativa (Atributo)
– a qualidade assumida pelo evento (fenômeno).
• Ex: O que Vc acha do transporte público em SP
bom, ruim, regular
• Variável Quantitativa
– a medida da variação de um evento (fenômeno)
•Ex: Qual é a idade média dos alunos da FAU
23, 24, 25
Variável: Tipologia
• Variável Quantitativa Contínua – aquela que pode
assumir qualquer valor numa escala de valores
(teoricamente infinitos valores): Altura da pessoas.
• Variável Quantitativa Discreta – aquela cujos valores
possíveis são números inteiros (contagem): No. de
alunos numa sala.
• Variável Dependente – aquela cujos valores depende
dos valores de outra variável: em matemática se
expressa por uma relação funcional (função)
y = f (x)
y = variável dependente
x = variável independente
Variáveis contínuas e discretas
Escalas de medidas de uma Variável
 Escala nominal quando as observações de uma variável
são apenas etiquetas para identificar, dar um nome, um
atributo de cada observação. Exemplos de variáveis de
escalas nominais: sexo/religião/estado civil. Aqui os
valores não possuem ordem intrínseca.
 Escala ordinal quando os dados têm propriedades
nominais e podem ser usados para ordenar as
observações nessa variável. Um exemplo de uma escala
ordinal é a utilizada em questionários de satisfação ou de
avaliação da qualidade. Exemplo: Transporte – (Bom)
(Razoável) (Ruim). Aqui os valores possuem uma ordem
intrínseca
Escalas de medida de uma variável
Escala de razão – quando os dados têm propriedades
intervalares e faz sentido dividir duas observações.
Exemplo: As variáveis distância, peso, comprimento e
tempo medem-se através de escalas de razão, exigindo
sempre um ‘zero’ que representa a não existência de valor.
Aqui os valores numéricos possuem ordem e diferenças
têm significado
Escala de intervalos - quando os dados têm
propriedades ordinais e o intervalo entre as observações
pode ser expresso em termos de uma unidade fixa de
medida. Exemplo: A temperatura é um exemplo de variável
que usa uma escala intervalar de medição. Aqui os valores
numéricos possuem ordem e diferenças têm significado.
ESTATÍSTICA DESCRITIVA
Amostra : Classificação e Caracterização
• Distribuição das Freqüências
• Medidas de Tendência Central
• Medidas de Variabilidade
• Medidas de Proporcionalidade ou Relativas
Distribuição de Frequência
Variável discreta
• Frequência – é a quantidade de vezes que a variável
(evento) ocorre . Em outras palavras, é a quantidade de
vezes em que o atributo de qualidade aparece. Exemplo:
Experimento avaliação do Transporte: (bom) (regular) (ruim).
• Intervalo de Classe de uma variável discreta: São os
atributos variáveis de qualidade atribuídos à variável. Os
intervalos são os próprios atributos. Exemplo: o atributo
(bom) é em si mesmo uma classe da variação qualitativa.
• Limites de Classe – Não existem há limites de classe.
Distribuição de Frequência
Variável Contínua
 Frequência – é a quantidade de vezes que a variável
(evento) ocorre . Em outras palavras: a frequência é nº de
vezes em que a variável assume um certo valor.
 Intervalo de Classe : É obtido dividindo o conjunto
de valores assumidos pela variável em intervalos de classe
e indicando a frequência dos valores observados para
cada intervalo.
 Limites de Classe – É o intervalo entre o valor
máximo e mínimo de uma variável dentro de uma classe.
A cada intervalo de classe estão associados os limites de
classe (valores extremos) e o ponto médio.
Frequência de uma Variável
Pesquisa realizada com os 200 alunos de uma universidade buscava
identificar as preferências por esportes. Foram fornecidas as seguintes de
opções esportivas: futebol, vôlei, basquete, natação, tênis e ciclismo. Observe
os resultados:
Distribuição de Frequência
• Amplitude Total de uma série – É a extensão de variação
total da variável: A diferença entre valor maior da última classe
e o menor valor da primeira classe.
• Amplitude de Classe – É a diferença entre o valor máximo e
mínimo da variável dentro da classe.
• Ponto Médio de Intervalo de Classe = valor médio
limite inferior + limite superior
2
Distribuição de Frequência
Variável
Frequência
10
2
Variável: Quantidade de $ no bolso
Intervalo
A
20
4
30
7
50
8
9
C
60
Variáveis
Inferior
10
Superior
20
Inferior
30
Superior
40
Inferior
50
Freqüência
6
Intervalos de Classe
B
40
Limites
16
Superior
15
30
25
25
25
16
20
60
15
70
16
D
80
10
Inferior
70
Superior
80
26
15
26
10
7
6
90
9
E
Inferior
90
100
7
Superior
100
200
4
Inferior
200
Superior
500
16
5
0
D
500
3
1
7
A
B
C
D
E
D
Distribuição de Frequência
• Frequência Absoluta –
Valor total das observações
• Frequência Relativa –
Valor porcentual das observações
• Frequência Acumulada –
Somatória das frequências de todos intervalos
Modalidade
Esportiva
Futebol
Vôlei
Basquete
Natação
Tênis
Ciclismo
Frequencia Frequência Frequência Frequência
Relativa
Absoluta
Acumulada Acumulada
35%
70
70
35%
25%
50
120
60%
20%
40
160
80%
10%
20
180
90%
8%
15
195
98%
2%
5
200
100%
100%
200
200
100%
Histograma
• Histograma: Gráfico das distribuições das frequências
de uma variável.
• Gráfico de Barras (Histograma) – Gráfico de
retângulos, diagrama de colunas; gráfico de áreas.
• Histograma – As frequências dos fenômenos são
proporcionais à superfície de cada retângulo que as
representam. Para intervalos de mesma amplitude as
frequências serão proporcionais às alturas
Distribuição de Frequência
Histograma
Processo de Elaboração do Histograma
• Organizar os dados em ordem crescente;
• Determinar a amplitude total;
• Dividir a amplitude total em um nº adequado de intervalos
de preferência com a mesma amplitude;
• O número mínimo de intervalos é 5, número máximo 20;
• Quando possível os pontos médios dos intervalos devem
coincidir com os valores realmente observados
Distribuição de Frequência
Histograma
• Distribuições Simétricas e Assimétricas - Os
histogramas podem apresentar distribuição simétricas ou
assimétricas. Indicadas nos slides a seguir,
• Polígono de Frequências – Unindo-se os valores
médios dos intervalos de classe, o histograma se
transforma num polígono de frequências. Pode-se então
comparar este polígono com uma curva teórica (Normal).
GRÁFICO DE FREQUÊNCIAS: Histograma
18
16
Frequências
14
Variaveis Frequência
12
1
2
3
4
5
6
10
8
6
4
2
0
1
2
3
4
Categorias
5
6
4
6
16
8
7
2
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
45
Pesos
( x 1)
Nº alunos
(f1)
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
89-85
85-90
Total
10
15
18
22
35
42
32
18
10
6
208
42
40
35
35
32
30
25
22
18
20
18
15
15
10
10
10
6
5
0
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
simétrico
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à esquerda
Pesos
( x 1)
Nº alunos
(f1)
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
89-85
85-90
Total
35
42
32
24
20
17
15
10
10
6
208
45
40
35
30
25
20
15
10
5
0
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico
HISTOGRAMA E POLÍGONO DE FREQUÊNCIA
Assimétrico à direita
45
Pesos
( x 1)
Nº alunos
( f1)
40-45
45-50
50-55
55-60
60-65
65-70
70-75
75-80
89-85
85-90
Total
5
8
12
15
17
21
24
29
42
35
173
40
35
30
25
20
15
10
5
0
40-45 45-50 50-55 55-60 60-65 65-70 70-75 75-80 89-85 85-90
assimétrico
Medidas de Ordenamento ou Posição
Medidas de Tendência Central
• Valores Centrais ou Médias de uma Amostra – Valores
que indicam posição de centralidade, ou o ponto central da
distribuição.
• Média Aritmética Simples – Quociente da soma dos valores
observados, pelo número total de valores.
α = Σ xi
n
i = 1.....n
Medida de Tendência Central
Observações
48
55
51
58
55
48
51
55
58
51
55
58
60
55
58
Evento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Observações Frequência
48
51
55
58
60
2
3
5
4
1
Média
54,4
Levantamento
do peso
dos alunos
da classe
Medidas de Tendência Central
• Média Aritmética Ponderada - Quando há valores que
se repetem ou ocorrem com mais frequência que outros.
• α = Σ xi . fi
Σ fi
• Ex: α = 48.2 + 51.3 + 55.5 + 58.4 + 60.1 = 54,4
15
• Utilização: média de cálculo mais fácil. Valor médio
significativo por incluir todos os valores observados. Usada em
estatística para o cálculo do desvio padrão. Em probabilidade
esta média é chamada Esperança Matemática.
Medidas de Tendência Central
• Mediana – Medida de posição. A mediana é o valor que
ocupa a posição central (meio) da distribuição.
• Série de valores com nº impar de termos
– Mediana = n + 1 /2
– Nº de termos 7
–
Md = 7+1 = 8 / 2 = 4
(mediana é o 4º termo)
– Ex: 5, 7, 8, 11, 12, 13, 14 (7 termos) → Md = 11
• Série de valores com nº par de termos
– Mediana = n /2 + 1 e
– Mediana = n /2
– Nº de termos 8
–
–
Md = 8/2
= 4
Md = 8/2+1 = 5
(mediana entre o 4º e 5 º termo)
– Ex: 5, 7, 8, 11, 12; 13, 14, 15; (8 termos) → Md = 11+12 / 2 = 11,5
• Utilização: |A mediana é usada quando a distribuição apresenta resultados
extremos muito discrepantes. A mediana não sofre a influência de valores
extremos
Medidas de Tendência Central
Moda – Valor dominante de uma distribuição.
• Numa série são os valores que ocorrem com a maior
freqüência.
• Um conjunto de valores pode apresentar mais de uma
moda: plurimodal.
Ex: 48, 49, 50, 50 50, 55, 58, 59, 60 → M = 50
Ex: 4, 5, 6, 4, 5, 7, 4, 8, 5, 10 → M = 4 e 5 (plurimodal)
Medidas de Dispersão
Mediadas de Variabilidade
• Índices que indicam o grau de concentração ou dispersão de
uma distribuição em torno da média.
• Principais índices de variabilidade:
–
–
–
–
Amplitude total
Desvio médio
Variância
Desvio padrão
• Amplitude Total (Intervalo Total) - É a diferença entre o
maior e o menor valor de uma série.
• Ex: 48, 48 49,49,49,55,55,55,55,55,58,58,58,58,59,60
• → A = 60 - 48 = 12
Medidas de Variabilidade
• Desvio Médio – Média aritmética dos afastamentos (ou
desvios), tomados em valor absoluto, entre cada valor e a
média aritmética.
•
sendo di = │xi - α │
sendo α = média aritmética
DM = Σ │di . fi │
Σ fi
Ex: dm = (48 – 54,4).2 + (51-54,4).3 + (55-54,4).5 + (58-54,4).4 + (60-54,4).1
15
dm = 12,8 + 10,2 + 3,0 + 14,4 + 5,6
15
dm = 3,07
Utilização: Indica o quanto, em média, os valores se afastam do ponto central (média)
numa distribuição do tipo Curva de Gaus
Medidas de Variabilidade
• Variância – Considerando-se uma amostra de dados, cada
dado isolado pode ter um desvio (dispersão) em relação à
média da amostra. Essa dispersão é a diferença entre o valor
individual e a média da amostra de dados. Para se avaliar o
grau de dispersão de toda a amostra de dados utiliza-se a
variância que é a somatória dos desvios elevada ao quadrado
dividida pelo tamanho da amostra, menos 1.
• s2 = Σ (xi – α)2 • fi
Σ fi – 1
• Exemplo: s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36
14
S2 = 14,4
Medidas de Variabilidade
• Desvio padrão – afastamento quadrático médio ou
afastamento padrão. É a raiz quadrada da variância.
• Desvio padrão dos dados isolados ponderados com freqüências distintas:
• s2 = √ Σ (xi – α)2 • fi
Σ fi – 1
• Exemplo: s2 = 81,92 + 34,68 + 1,80 + 51,84 + 31,36
14
s = √ 14,4 = 3,79
• Utilização: é a medida mais usada para mensurar a variabilidade de um
conjunto de dados. Usado principalmente na distribuição normal de dados.
Ohistograma de Densidades
0 .04
0 .03
0 .02
0 .01
0 .00
30
40
50
60
70
80
90
1 00
P es o
Peso, emkg, de 1000 pessoas adultas selecionadas ao acaso emuma população
Distribuição dos valores da variável aleatória X.
Distribuição de probabilidades de X
A curva contínua da figura denomina-se Curva Normal
0 .03 0
0.01 5
0.00 0
30
40
50
60
70
80
90
P es o
X: peso, em kg, de uma pessoa adulta escolhida ao acaso da população.
10 0
Curva de Gauss
Distribuição Normal
•
Curva de Gauss
Distribuição Normal
-1s → 1s
68, 27 %
dos casos estão incluídos entre M–1s e M+1s
-2s → 2s
95,45 %
dos casos estão incluídos entre M–2s e M+2s
-3s → 3s
99,73 %
dos casos estão incluídos entre M–3s e M+3s
Curva de Gauss
Distribuição Normal
Download