Conceitos básicos, probabilidade, distribuição normal e uso de

Propaganda
Conceitos básicos, probabilidade,
distribuição normal e uso de tabelas
padronizadas
Prof. Marcos Vinicius Pó
Métodos Quantitativos para Ciências Sociais
Alguns conceitos
• População: é o conjunto de todos os elementos ou resultados sob
•
•
•
•
•
•
investigação.
Amostra: qualquer subconjunto da população.
Subpopulação: estrato da população que partilha alguma
característica comum.
Parâmetro: é uma medida numérica que descreve uma população.
Estatística: é uma medida numérica que descreve uma amostra.
Estimador: é uma estatística da amostra usada para se aproximar
de um parâmetro da população.
Variáveis: característica de interesse para os elementos analisados,
informações numéricas estatisticamente tratáveis.
►
►
►
►
Nominais ou categóricas: profissão, gênero, preferência política...
Ordinais: primeiro-segundo..., grau de escolaridade...
Intervalares: salário entre 1 e 3 SM, distância entre 0 e 5km...
Contínuas: altura, rendimento, peso...
Amostra
População
Amostra
(n=5)
Parâmetros
Estatísticas
Inferência estatística: conhecer os parâmetros, fazer
afirmações sobre a população com base em suas amostras.
O que é probabilidade?
• Número de 0 até 1 que expressa a tendência de um
determinado evento acontecer.
• Número positivo entre 0 e 1, associado a um evento aleatório,
que se mede pela frequência relativa da sua ocorrência numa
longa sucessão de eventos.
• Grau de segurança com que se pode esperar a realização de
um evento, determinado pela frequência relativa dos eventos
do mesmo tipo numa série de tentativas.
• Perspectiva de que algo venha a ocorrer.
4
Determinação de probabilidade
• Conceito genérico:
número de vezes que o resultado
Probabilidade de um
resultado ou evento

ou evento pode ocorrer
número total de vezes que qualquer
resultado ou evento pode ocorrer
• Tipos de determinação:
►
►
►
Exata: análise da estrutura do problema, conhecimento da
população...
Aproximativa: estimativas a partir de amostras.
Subjetiva: expressão de crenças.
5
Probabilidade em variáveis discretas
• Qual a probabilidade de se tirar uma carta de copas de um
baralho? E de se tirar um ás?
• Qual a probabilidade de se tirar cara jogando uma moeda
para o alto?
Fonte: Wikipédia
• Qual a probabilidade
de obter 5 lançando
dois dados?
6
Probabilidade em variáveis contínuas?
Qual é a probabilidade de que, ao acordar de repente, sejam
exatamente 4h59min16seg147milésimos?
7
Função Densidade de Probabilidade
• Probabilidade de um valor específico para variáveis contínuas
não faz sentido, pois a probabilidade de um ponto é zero.
• Devemos, portanto, definir intervalos:
►
Ex.: Probabilidade de que sejam entre 15h e 16h  P(15h<x<16h)
• Os intervalos são calculados com base na função que
determina a distribuição das variáveis aleatórias contínuas,
chamada de Função Densidade de Probabilidade (f.d.p.).
15 16
horas
8
Formalização matemática
• Função Densidade de Probabilidade (f.d.p.):
prob (a  x  b)  a  ( x)dx
b
• Em palavras: a área debaixo da função de densidade entre
dois limites fornece a probabilidade de ocorrer um evento
dentro de um determinado intervalo de valores.
34
f.d.p.
P(29  x  34)    ( x)dx
29
29
34
9
Distribuição normal
• Também chamada de distribuição gaussiana, é utilizada para
descrever muitos fenômenos e possui grande utilidade na
inferência estatística.
• Indicamos que uma população é normal usando a seguinte
notação: X~N(μ;σ2).
►
Ex.: Uma população normal com peso médio de 70kg e desviopadrão de 16kg será notada como: X~N(70;162)
10
Formato de uma distribuição normal
Fonte: Wikipédia
11
Parâmetros de uma distribuição normal
• A curva normal é definida por uma equação que possui os
seguintes parâmetros: Média (μ) e desvio-padrão (σ).
f ( x,  ,  ) 
1
2

2
e
( x )2
2 2
Fonte: Wikipédia
12
Outras distribuições
• Outras distribuições serão utilizadas ao longo do curso:
►
►
►
t de Student (parâmetros: graus de liberdade ν)
Qui-quadrado (parâmetros: graus de liberdade ν)
F de Fisher-Snedecor (parâmetros: graus de liberdade do numerador e
denominador ν1 e ν2)
• Elas serão detalhas e explicadas no momento adequado.
13
Cuidado!
A distribuição paranormal
assombra os conceitos de
muitos alunos, aparecendo
com freqüência em provas e
exercícios. Exorcize-a!
14
Valor padronizado (z)
• O valor z mede o quanto x se afasta da média (), em unidade
de desvio padrão (). O desvio-padrão é a nossa régua.
• É usado nas tabelas de referência, onde μ=0 e σ=1.
x-μ
z=
σ


x
x
15
Preste atenção
nessa imagem!
Exercícios básicos: uso da curva normal
1. Uma v.a. X tem distribuição normal, com média 100 e
desvio-padrão 10.
Qual a probabilidade de que um indivíduo dessa população tenha
um valor entre P(90<X<110)?
b. P(x>120)?
c. P(x<120)?
d. Probabilidade de um indivíduo ter um valor menor que 85 e maior
que 124  P(x<85 ⋃ x>124)?
e. Se sortearmos aleatoriamente 1000 indivíduos dessa população,
quantos devem valores entre 90 e 110?
a.
Dica: desenhe a curva
normal e marque a área
a ser determinada
18
Exercícios básicos: uso da curva normal
2. Um levantamento realizado pela ANAC* verificou que a
altura dos usuários de aviação segue uma distribuição normal
com média de 171,3cm e desvio-padrão de 7,3cm. Com base
nesses dados determine:
a. Probabilidade de um usuário ter mais de 1,90m de altura 
P(X>190)
b. P(X<140)
c. Um intervalo simétrico em relação à média que exclua apenas 5% dos
indivíduos.
* SILVA, S. C; MONTEIRO, D.. Levantamento do perfil antropométrico da população brasileira usuária do
transporte aéreo nacional: Projeto Conhecer. Relatório Técnico Final. Agência Nacional de Aviação Civil. 2009.
Disponível em http://www2.anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf
19
Download