Distribuição Qui

Propaganda
Capítulo 3
Modelos Estatísticos
Resenha
Variáveis Aleatórias
Distribuição Binomial
Distribuição de Poisson
Distribuição Normal
Distribuição t de Student
Distribuição Qui-quadrado
Ana M. Abreu - 2006/07
Slide 1
Resenha
Slide 2
Este capítulo aborda as
distribuições de probabilidade
tendo em conta os conhecimentos de
estatistica descritiva apresentados no
Capítulo 1 e os de probabilidade
apresentados no Capítulo 2 .
As Distribuições de Probabilidade descrevem
o que provavelmente acontecerá em vez de o
que realmente aconteceu.
Ana M. Abreu - 2006/07
Definições
Slide 3
Uma variável aleatória é uma variável
(usualmente representada por X) que toma
um certo valor numérico, determinado pelo
acaso, de cada vez que a experiência é
realizada.
Uma distribução de probabilidade é
um gráfico, tabela, ou fórmula que indica
a probabilidade correspondente a cada
valor da variável aleatória.
Ana M. Abreu - 2006/07
Definições
Slide 4
Uma variável aleatória discreta toma um nº
finito ou infinito numerável de valores.
Uma variável aleatória contínua toma um nº
infinito não numerável de valores, os quais
podem ser associados com medidas numa
escala contínua.
Ana M. Abreu - 2006/07
Propriedades das
Slide 5
Distribuições de Probabilidade
Σ P(x) = 1
onde x toma todos os valores possíveis.
0 ≤ P(x) ≤ 1
para qualquer valor de x.
Ana M. Abreu - 2006/07
Média, Variância e
Slide 6
Desvio Padrão de uma Variável Aleatória
µ = Σ [x • P(x)]
Média
σ = Σ [(x – µ) • P(x)]
Variância
σ = [Σ x • P(x)] – µ
Variância (forma reduzida)
2
2
2
2
2
σ = Σ [x 2 • P(x)] – µ 2
Desvio Padrão
Ana M. Abreu - 2006/07
Definição
Slide 7
O Valor Esperado de uma variável aleatória
discreta é denotado por E, e representa a
média dos resultados. Determina-se através
do valor de Σ [x • P(x)].
E = Σ [x • P(x)]
Ana M. Abreu - 2006/07
Em resumo
Slide 8
Até agora aprendemos sobre:
Combinar os métodos da estatística descritiva
com os da probabilidade.
Variáveis aleatórias e distribuições de
probabilidade.
Propriedades da distribuição de probabilidade.
Média, variância e desvio padrão de uma variável
aleatória.
Valor esperado.
Ana M. Abreu - 2006/07
A Distribuição Binomial
Ana M. Abreu - 2006/07
Slide 9
Definições
Slide 10
A distribuição binomial verifica as seguintes condições:
1. A experiência tem um nº fixo de provas, n.
2. As provas são independentes. (O resultado de uma
prova não afecta a probabilidade de ocorrência das
restantes.)
3. Cada prova origina um de dois resultados possíveis:
sucesso ou insucesso.
4. A probabilidade de sucesso, denotada por p, é
constante em cada prova.
Ana M. Abreu - 2006/07
Notação para a Distribuição
Binomial
n
Slide 11
denota o nº de provas (valor fixo à partida).
x
denota um nº específico de sucessos em n
provas, logo x pode ser qualquer nº entre 0 e
n, inclusive.
p
denota a probabilidade de sucesso em cada
uma das n provas.
q
denota a probabilidade de insucesso em cada
uma das n provas.
P(x) denota a probabilidade de obter exactamente x
sucessos em n provas (P(x)=P(X=x)).
Ana M. Abreu - 2006/07
Métodos para Determinar
as Probabilidades com a
Distribuição Binomial
Slide 12
Vejamos três métodos possíveis para
determinar as probabilidades correspondentes
à variável aleatória X com distribuição binomial.
Ana M. Abreu - 2006/07
Método 1: Usando a
Fórmula da Probabilidade na
Distribuição Binomial
P(X=x) =
n!
(n – x)!x!
•
px
•
Slide 13
qn-x
para x = 0, 1, 2, . . ., n
onde
n = nº de provas
x = nº de sucessos nas n provas
p = probabilidade de sucesso em cada prova
q = probabilidade de insucesso em cada prova (q = 1 – p)
Ana M. Abreu - 2006/07
Método 2: Usando uma Tabela
de Probabilidades
Slide 14
Reproduz-se em baixo parte da tabela da binomial que
vamos usar. Com n = 5 e p = 0.2 na distribuição binomial,
as probabilidades de obter 0, 1, 2, 3, 4 e 5 sucessos são
0.3277, 0.4096 (=0.7373-0.3277), 0.2048 (=0.9421- 0.7373),
0.0512, 0.0064 e 0.0003, respectivamente.
n=5
x .01
0
1
2
3
4
p
.05
.10
.20
.3277
.7373
.9421
.9933
.9997
Ana M. Abreu - 2006/07
Método 3:
Usando a Tecnologia
Slide 15
Software Estatístico, Excel e algumas calculadoras
fornecem-nos as probabilidades da distribuição binomial.
Ana M. Abreu - 2006/07
Distribuição Binomial:
Fórmulas
Média
Slide 16
µ =n•p
Variância σ 2 = n • p • q
Desvio Padrão
σ =
n•p•q
onde
n = nº de provas
p = probabilidade de sucesso em cada uma das n
provas
q = probabilidade de insucesso em cada uma das n
provas
Ana M. Abreu - 2006/07
Exemplo
Slide 17
Determine a média e o desvio padrão para o nº de
raparigas em 14 nascimentos.
Esta situação pode ser resolvida através da
distribuição binomial onde:
n = 14
p = 0.5
q = 0.5
Usando as fórmulas da distribuição binomial, temos :
µ = (14)(0.5) = 7 raparigas
σ = (14)(0.5)(0.5) = 1.871 raparigas
Ana M. Abreu - 2006/07
Interpretação dos Resultados
Slide 18
É especialmente importante interpretar os
resultados. Os valores dizem-se pouco usuais
se se encontrarem para além dos seguintes
limites:
Valores Máximos Usuais = µ + 2 σ
Valores Mínimos Usuais = µ – 2 σ
Ana M. Abreu - 2006/07
Exemplo
Slide 19
Determine se é usual em 100 nascimentos, 68
serem raparigas.
Para esta distribuição binomial,
µ = 50 raparigas
σ = 5 raparigas
µ + 2 σ = 50 + 2(5) = 60
µ - 2 σ = 50 - 2(5) = 40
Em 100 nascimentos, é usual nascerem entre 40 e 60
raparigas. Assim, não é usual nascerem 68 raparigas.
Ana M. Abreu - 2006/07
Slide 20
A Distribuição de Poisson
Ana M. Abreu - 2006/07
Definição
Slide 21
A distribuição de Poisson é uma distribuição discreta que
se aplica quando ocorre um acontecimento num intervalo
especificado. A variável aleatória X representa o nº de
ocorrências num determinado intervalo. O intervalo pode
se referir a tempo, distância, área, volume, ou algum tipo
de medida similar.
Fórmula
P(X=x)=
µ x • e -µ onde e ≈ 2.71828
x!
Ana M. Abreu - 2006/07
Condições da
Distribuição de Poisson
Slide 22
A variável aleatória X designa o nº de acontecimentos
nalgum intervalo. Assim, pode tomar quaisquer dos
valores 0, 1, 2, …)
Os acontecimentos têm que ser aleatórios.
Os acontecimentos são independentes.
• Parâmetros
A média é µ.
O desvio padrão é
σ=
µ.
Ana M. Abreu - 2006/07
Diferenças em relação à
Distribuição Binomial
Slide 23
A distribuição de Poisson difere da distribuição
binomial nos seguintes aspectos fundamentais:
A distribuição binomial é caracterizada pela
dimensão da amostra n e pela probabilidade de
sucesso p, enquanto que a distribuição de Poisson
é caracterizada apenas pela média µ.
Numa distribuição binomial, os valores que a
variável aleatória X pode tomar são 0, 1, . . . n,
enquanto que na distribuição de Poisson a variável
X toma os valores 0, 1, . . . , sem limite superior.
Ana M. Abreu - 2006/07
Exemplo
Slide 24
Bombas da 2ª Guerra Mundial Em 1945 os alemães
bombardearam Londres com as bombas V2. A região
londrina está dividida em 576 distritos de superfícies
semelhantes, pelo que admitimos que cada distrito tem
igual probabilidade de ser bombardeado. Calcula-se que
o nº de bombas recebidas por Londres foi de 535.
Se um distrito for seleccionado ao acaso, determine
a probabilidade de ter sido bombardeado com
exactamente 2 bombas.
A distribuição de Poisson é adequada porque
estamos a lidar com uma situação de ocorrência de
acontecimentos (nº de bombas recebidas) num certo
intervalo (distrito).
Ana M. Abreu - 2006/07
Exemplo
Slide 25
O nº médio de bombas por distrito é
µ = 535 = 0.929
576
Então, P(X=2) = 0.9292 e-0.929 = 0.170.
2!
Assim, a probabilidade de um qualquer distrito ser
atingido por exactamente 2 bombas é P(X=2) = 0.170.
Ana M. Abreu - 2006/07
Cálculo da probabilidade na Distribuição
Slide 26
de Poisson usando uma Tabela
Reproduz-se em baixo parte da tabela da distribuição de
Poisson que vamos usar. Com µ = 0.20, as probabilidades
de ocorrerem 0, 1, 2, 3 e 4 acontecimentos são
0.8187, 0.1638 (=0.9825-0.8187), 0.0164 (=0.9989- 0.9825),
0.001, e 0.0001, respectivamente.
µ
x
0
1
2
3
4
.05
.10
.15
.20
.8187
.9825
.9989
.9999
1.0000
Ana M. Abreu - 2006/07
Distribuição Normal
Ana M. Abreu - 2006/07
Slide 27
Caracterização
Slide 28
Variável aleatória contínua
Distribuição Normal
x-µ
µ2
(
σ)
2
-1
f(x) =
e
σ
2π
Fórmula 3-1
Figura 3-1
Ana M. Abreu - 2006/07
Definições
Slide 29
Curva da Densidade (ou da função
densidade de probabilidade é o gráfico da
distribuição de probabilidade de uma
variável aleatória contínua).
1. A área total sob a curva é igual a 1.
2. Todo o ponto sob a curva deve ter uma
ordenada de valor igual ou superior a
zero.
Ana M. Abreu - 2006/07
Uso da Área para
determinar a Probabilidade
Slide 30
Como a área total sob a curva é igual a 1, existe
uma correspondência entre a área e a
probabilidade.
Figura 3-2
Ana M. Abreu - 2006/07
Alturas de Homens e Mulheres
Figura 3-3
Ana M. Abreu - 2006/07
Slide 31
Definição
Slide 32
Distribuição Normal Standard :
a distribuição Normal que tem
média 0 e desvio padrão 1.
Figura 3-4
Ana M. Abreu - 2006/07
Notação
Slide 33
P(a < z < b)
denota a probabilidade de z tomar valores entre
aeb
P(z > a)
denota a probabilidade de z tomar valores maiores do
que a
P(z < a)
denota a probabilidade de z tomar valores menores do
que a
Ana M. Abreu - 2006/07
Cálculo do valor de z correspondenteSlide 34
a uma certa probabilidade
5% ou 0.05
(o valor de z será positivo)
1.645
Figura 3-5
Cálculo do Percentil 95
Ana M. Abreu - 2006/07
Cálculo do valor de z correspondenteSlide 35
a uma certa probabilidade
(Um dos valores de z será negativo e o outro positivo)
Figura 3-6
Cálculo dos Percentis 2.5% e 97.5%
Ana M. Abreu - 2006/07
Distribuições Normais
não Standard
µ≠0
σ ≠1
Slide 36
Se
ou
(ou ambos), teremos que
converter os valores usando a Fórmula 3-2;
então, os procedimentos passam a ser os
mesmos do que os usados com a distribuição
Normal Standard.
Fórmula 3-2
z=
x–µ
σ
Ana M. Abreu - 2006/07
Conversão para a Distribuição
Normal Standard
x–µ
z=
σ
Figura 3-7
Ana M. Abreu - 2006/07
Slide 37
Precauções a ter em conta
Slide 38
1. Não confunda valores de z com as correspondentes
áreas. Os valores de z são distâncias ao longo do eixo
horizontal enquanto que as áreas são regiões sob a
curva da distribuição Normal. A tabela usada apresenta
os valores de z na coluna à esquerda e na linha superior,
enquanto que as áreas se encontram no “meio” da
tabela.
2. Escolha o lado certo (direito/esquerdo) do gráfico.
3. Um valor de z deve ser negativo sempre que se
encontre na metade esquerda da distribuição Normal.
4. As áreas (ou probabilidades) têm valores positivos ou
nulos, mas nunca têm valores negativos.
Ana M. Abreu - 2006/07
Cálculos usando a Tabela da
distribuição Normal Standard
Slide 39
Seja Z a variável aleatória com distribuição Normal
standard, ou seja, com valor médio zero e desvio padrão 1.
Para calcular P(Z<0.32), é necessário consultar a tabela, na
página referente aos valores positivos de z, como a seguir
se indica:
z
0.0
0.1
0.2
0.3
.00
.01
.02
.5080
.5478
.5871
.6255
Assim, P(Z<0.32)=0.6255.
Ana M. Abreu - 2006/07
Cálculos usando a Tabela da
distribuição Normal Standard
Slide 40
De modo análogo, P(Z<-1.51)=0.0655, mas onde agora se
consultou a mesma tabela, embora na parte referente aos
valores negativos de z.
Por outro lado, para encontrar o valor de z correspondente
a uma certa probabilidade, por exemplo, 0.975, o valor da
probabilidade tem que ser procurado no interior da tabela
para, só depois, determinar o valor de z que lhe
corresponde.
z
…
.05
.06
…
…
1.8
.9686
1.9
.9750
Assim, o valor de z correspondente à probabilidade 0.975 é
1.96, ou seja, se P(Z<t)=0.975, então t=1.96.
Ana M. Abreu - 2006/07
Aproximação da Distribuição Binomial
Slide 41
pela Distribuição Normal se:
np ≥ 5 e
nq ≥ 5
então µ = np e σ =
npq
e a variável aleatória tem uma
distribuição
Normal
Ana M. Abreu - 2006/07
Procedimento para usar a Distribuição
Normal para Aproximar a Distribuição
Binomial
Slide 42
1. Verifique que a distribuição Normal é uma aproximação
adequada à distribuição Binomial confirmando que np ≥ 5 e
nq ≥ 5.
2. Determine os valores dos parâmetros µ e σ calculando µ = np e
σ = npq.
3.
Identifique o valor discreto de x (o nº de sucessos). Altere o
valor discreto x substituindo-o pelo intervalo x – 0.5 a x +0.5.
Represente a curva da Normal e assinale os correspondentes
valores de µ , σ, e de x – 0.5 ou x + 0.5, conforme a situação.
4.
Determine a área correspondente à probabilidade desejada.
Ana M. Abreu - 2006/07
Definição
Slide 43
Quando usamos a distribuição Normal
(que é uma distribuição contínua) para
aproximar a distribuição Binomial (que é
uma distribuição discreta), fazemos uma
correção de continuidade ao valor
discreto x na distribuição binomial
representando o valor x pelo intervalo de
x – 0.5 a x + 0.5.
Ana M. Abreu - 2006/07
x = pelo menos 120
= 120, 121, 122, . . .
x = mais do que 120
= 121, 122, 123, . . .
x = no máximo 120
= 0, 1, . . . 118, 119, 120
x = menos do que 120
= 0, 1, . . . 118, 119
Figura 3-8
Ana M. Abreu - 2006/07
Slide 44
Slide 45
x = exactamente 120
Intervalo que representa o valor discreto 120
Ana M. Abreu - 2006/07
Distribuição t de Student
Slide 46
A distribuição t de Student é a designação
de uma família de distribuições indexada
pelo parâmetro ν, que representa o
número de graus de liberdade (g.l.).
Reproduz-se em seguida parte da tabela
desta distribuição.
Ana M. Abreu - 2006/07
Slide 47
Distribuição t de Student
ν
…
9
10
α
…
.025
.01
…
2.8214
2.7638
Os valores indicados escrevem-se na forma
t(0.01; 10) = 2.7638
e lê-se: o percentil 0.01 da distribuição t de
Student com 10 graus de liberdade é 2.7638.
Ana M. Abreu - 2006/07
Distribuições t de Student
com n = 3 e n = 12
Ana M. Abreu - 2006/07
Slide 48
Características importantes da
distribuição t de Student
Slide 49
1. A distribuição t de Student varia de acordo com a
dimensão da amostra (de acordo com a figura anterior,
para os casos n = 3 e n = 12).
2. A curva da distribuição t de Student tem a mesma forma
em sino da distribuição Normal, mas reflecte a maior
variabilidade (com curvas mais alargadas) que é de
esperar em amostras pequenas.
3. A distribuição t de Student tem valor médio zero (tal como
a distribuição Normal standard).
4. O desvio padrão da distribuição t de Student varia de
acordo com o tamanho da amostra e é maior do que 1 (o
que não acontece com a distribuição Normal standard,
onde σ = 1).
5. Quanto maior a dimensão da amostra, mais a distribuição t
de Student se aproximaAna
daM.distribuição
Normal.
Abreu - 2006/07
Distribuição Qui-quadrado
Slide 50
A distribuição Qui-quadrado é a designação
de uma família de distribuições indexada
pelo parâmetro ν, que representa o número
de graus de liberdade (g.l.).
Reproduz-se em seguida parte da tabela
desta distribuição.
Ana M. Abreu - 2006/07
Distribuição Qui-quadrado
α(
gl (df)
…
9
10
…
Slide 51
dade)
.10
.05
…
16.919
18.307
Os valores indicados escrevem-se na forma
ℵ2(0.05; 10) = 18.307
e lê-se: o percentil 0.05 da distribuição Quiquadrado com 10 graus de liberdade é 18.307.
Ana M. Abreu - 2006/07
Características da distribuição
Qui-Quadrado
Slide 52
1. A distribuição Qui-quadrado não é simétrica, ao
contrário do que sucede com as distribuições Normal
e t de Student.
À medida que o nº de graus de liberdade aumenta,,
a distribuição torna-se mais simétrica.
Distribuição Qui-quadrado
Distribuição Qui-quadrado para
g.l.= 10 e g.l.= 20
Ana M. Abreu - 2006/07
Características da distribuição
Qui-Quadrado
Slide 53
2. Os valores da distribuição Qui-quadrado podem ser
positivos ou nulos, mas não podem ser negativos.
3. A distribuição Qui-quadrado é diferente consoante o nº
de graus de liberdade, os quais se escrevem g.l.= n – 1.
À medida que o nº de g.l. aumenta, a distribuição
aproxima-se da distribuição Normal.
Ana M. Abreu - 2006/07
Download