CONCEITOS BÁSICOS EM ESTATÍSTICA

Propaganda
Tópico 6
Distribuição Normal
Distribuição Normal
 Existe uma importante diferença entre dados
que são “normalmente” distribuídos e a curva
normal em si
Distribuição Normal
 Muitas variáveis apresentam distribuição onde
os valores centrais são mais frequentes e os
valores extremos são mais raros
 Exemplo: Tempo de 600 corredores brasileiros
nos 400 m livre do atletismo
 WR = 43.18s
Distribuição Normal
 Frequência relativa
Tempo (s)
fr
46--47,99
48--49,99
50--51,99
52--53,99
54--55,99
56--57,99
58--59,99
0,01
0,06
0,24
0,38
0,23
0,07
0,01
Distribuição Normal
 Frequência relativa
Distribuição Normal
 Distribuições nem sempre tão certinhas
Distribuição Normal
 Distribuições nem sempre tão certinhas
Curva Normal
 Curva normal é uma abstração matemática
com uma equação específica que a define
fr
Curva Normal
 Características da curva normal
S
U
M
A
 A proporção da área abaixo da curva relativa a uma
particular amplitude de valores sobre o eixo
horizontal é sempre a mesma**
Curva Normal
 ** Considere uma curva normal caracterizada
por:
 μ = 100
 σ = 20
 O que se pode afirmar?


Curva Normal
 Mesma média, desvio padrão diferente
Curva Normal
 Mesmo desvio padrão, médias diferentes
Curva Normal
 Curva normal é, de fato, uma família de curvas
 As médias podem variar
 Os desvios padrão podem variar
 A forma da curva depende do seu desvio padrão
 Mais achatada
 Mais esticada
 MAS, a área abaixo de todas as curvas normais é
sempre distribuída da mesma maneira
Curva Normal
 O que
significa “a
área abaixo
de todas as
curvas
normais é
sempre
distribuída
da mesma
maneira”?
Curva Normal
 O que
significa “a
área abaixo
de todas as
curvas
normais é
sempre
distribuída
da mesma
maneira”?
Curva Normal
 O que
significa “a
área abaixo
de todas as
curvas
normais é
sempre
distribuída
da mesma
maneira”?
Curva Normal
 O que
significa “a
área abaixo
de todas as
curvas
normais é
sempre
distribuída
da mesma
maneira”?
Curva Normal
 Qual a vantagem de conhecer a área abaixo da
curva normal?
 Conhecer chances, probabilidade de um evento
ocorrer
 Você pode responder perguntas do tipo: Qual a
probabilidade de encontrar sujeitos que estão acima
ou abaixo determinado escore?
 Para tanto, você precisa converter seus dados brutos
em dados padronizados
Curva Normal
 O que significa “converter seus dados brutos em
dados padronizados”?
Curva Normal Padronizada
 A curva normal padronizada tem:
 Média = 0
 Desvio padrão =1
 As áreas situadas abaixo desta curva são
padronizadas e tabeladas
 Entre a média (zero) e um valor qualquer de z
(positivo ou negativo)
Usando a Curva Normal
 Exemplo 1 (adaptado de Callegari-Jacques, 2003)
 Um treinador deseja selecionar dentre os 240 jovens
que estão prestando o serviço militar em um quartel,
aqueles mais altos para montar um time de basquete.
 Sabe-se que a estatura dos recrutas tem uma
distribuição normal, com média de 175 cm e desvio
padrão de 6cm.
 Assim, o treinador decide selecionar apenas aqueles
que tenham uma estatura mínima de 180 cm.
 Quantos jovens este treinador vai encontrar no
quartel com este perfil?
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que está
acima de um valor conhecido
 Passo 1 – Desenhe a curva normal
fr
175
0
180
?
Est (cm)
z
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que estão
acima de um valor conhecido
 Passo 2 – Calcule o valor padronizado (z) para o valor
de interesse da sua variável (x)
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que estão
acima de um valor conhecido
O que significa
este 0,83?
fr
175
0
180
0,83
Est (cm)
z
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que está
acima de um valor conhecido
 Passo 3 – Consulte a tabela de Distribuição Normal (z)
para saber a área entre μ e z
fr
0
0,83
Est (cm)
z
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que está
acima de um valor conhecido
 Passo 3 – Consulte a tabela de Distribuição Normal (z)
para saber a área entre μ e z
Área entre 0 e 0,83 = 0,2967
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que está
acima de um valor conhecido
 Passo 4 – Calcule a área que está além de z
fr
Est
z (cm)
Área além de z (0,83) = 0,5 - 0,2967 = 0,2033
 20,33% dos recrutas tem
Usando a Curva Normal
 Exemplo 1 – Encontrando a área abaixo da curva normal que está
acima de um valor conhecido
 Passo 5 – Responda à pergunta inicial – Quantos
recrutas têm estatura igual ou superior a 180 cm?
20,33% de 240 ⟹ 0,2033 × 240 = 48,79
 Entre
Usando a Curva Normal
 E se o treinador resolvesse aumentar a estatura mínima
para 190cm. Quantos recrutas ele conseguiria?
fr
z = 2,5
0,62% da área
1,488
175
0
190
Est (cm)
z
?
Usando a Curva Normal
 Exemplo 2 – Encontrando a área abaixo da curva
normal que está abaixo de um valor conhecido
 Você é um técnico de atletismo de uma pequena cidade do
interior, que está procurando por velocistas.
 Você fez um teste com 1500 estudantes do ensino
fundamental. Pediu para que eles corressem 40m e marcou
seus tempos.
 A distribuição dos tempos obtidos se aproxima de uma
distribuição normal.
 Agora você quer selecionar para sua equipe apenas aqueles
que estão 2 desvios padrão abaixo da média. Quantas vagas
precisa ter?
Usando a Curva Normal
 Exemplo 2 – Encontrando a área abaixo da curva normal que está
abaixo de um valor conhecido
fr
t (s)
-2
0
z
Usando a Curva Normal
 Exemplo 2 – Encontrando a área abaixo da curva normal que
está abaixo de um valor conhecido
 Como a curva normal é simétrica, o procedimento é o
mesmo do exemplo 1. Basta repetir os passos!
 Algumas tabelas de distribuição normal já trazem o valor de z
além de determinado desvio padrão
 No caso de z = 2, esta área é de 0,0228
 Resposta ao nosso técnico:
Estratégia Z – O milagre de descobrir campeões
 Celafiscs – São Caetano, décadas de 80/90
 Testes motores para predizer talentos para
determinados esportes (maioria, coletivos)
 Trunfo: tinham dados populacionais (apesar de ser de
uma única cidade)
Referências
 ANDERSON, D.; SWEENEY, D.; WILLIAMS, T. (2003).
Estatística Aplicada à Administração e Economia. 2nd ed.
São Paiulo: Pioneira Thomson Learning.
 KING, B. M.; MINIUM, E. M. (2003). Statistical Reasoning in
Psychology and Education . 4th ed. New Jersey: John Wiley
& Sons, Inc.
 CALLEGARI-JACQUES, S. M. (2003). Bioestatística:
princípios e aplicações. Porto Alegre: Artmed.
 KAZMIER, L. J. (2004). Estatística aplicada à economia e
administração. São Paulo: Pearson Makron.
Sugestão de Leitura
 Capítulos 4 de:
 CALLEGARI-JACQUES, S. M. (2003). Bioestatística: princípios
e aplicações. Porto Alegre: Artmed.
Distribuição Normal – Tabela z
Download