xP - N09

Propaganda
Unidade de Ensino Descentralizada de Colatina
Coordenadoria de Informática
Disciplina: Probabilidade e Estatística
Prof. Leandro Melo de Sá
2006/2
Unidade 3 – DISTRIBUIÇÕES DE PROBABILIDADE
→ Conceitos básicos
* Variável aleatória: É uma variável (geralmente representada por x) que tem um valor numérico único
(determinado aleatoriamente) para cada resultado de um experimento.
Ex. Estatura dos alunos; número de alunos que compareceram à aula; número de mulheres entre 10 empregados
recém-admitidos; número de acidentes com aviões de uma determinada empresa entre sete acidentes aéreos
selecionados aleatoriamente.
* Variável aleatória discreta: admite um número finito de valores ou tem uma quantidade enumerável de
valores. Ex. número de expectadores que vêem um filme, número de passageiros num ônibus.
* Variável aleatória contínua: pode tomar um número infinito de valores, e esses valores podem ser associados a
mensurações em um escala contínua, de tal forma que não haja lacunas ou interrupções. Ex. Voltagem na bateria
de um nobreak, que pode ser qualquer valor entre 0 e 12 Volt.
Além de identificar valores de uma variável aleatória, podemos freqüentemente atribuir uma probabilidade a
cada um desses valores. Quando conhecemos todos os valores de uma variável aleatória juntamente com as suas
respectivas probabilidades, temos uma distribuição de probabilidades.
→ Distribuição de probabilidades
Fornece a probabilidade de cada valor de uma variável aleatória.
Ex. 1. Lançamento de um dado não viciado:
P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 1/6 = 0,167
0,15
Freqüência relativa
x
1
2
3
4
5
6
Distribuição de probabilidade
P(x)
1/6
1/6
1/6
1/6
1/6
1/6
0,10
0,05
0,00
1
2
3
4
5
6
Ex. 2. Lançamento de um dado viciado:
P(1) = P(2) = P(4) = P(5) = P(6) = 1/10; P(3) = 5/10
x
1
2
3
4
5
6
Freqüência relativa
0,5
Distribuição de probabilidade
P(x)
1/10
1/10
5/10
1/10
1/10
1/10
0,4
0,3
0,2
0,1
0,0
1
2
3
4
5
6
* Condições para uma distribuição de probabilidades:
Qualquer distribuição de probabilidades deve satisfazer as duas condições seguintes:
1. ∑ P( x ) = 1 , onde x assume todos os valores possíveis.
2. 0 ≤ P( x ) ≤ 1 , para todos os valores de x.
1
Ex 3. a) P(x) = x/5 (onde x assume os valores 0, 1, 2 e 3) define uma distribuição de probabilidades?
1 2 3 6
∑ P(x ) = P(0) + P(1) + P(2) + P(3) = 0 + 5 + 5 + 5 = 5 ≠ 1 .
Ex 3. b) P(x) = x/3 (onde x assume os valores 0, 1 e 2) define uma distribuição de probabilidades?
1
2
3
∑ P(x ) = P(0) + P(1) + P(2) = 0 + 3 + 3 = 3 = 1.
* Média, variância e desvio-padrão numa distribuição de probabilidades.
Existem três características extremamente importantes num conjunto de dados (amostra): (1) média, (2) desviopadrão e (3) forma da distribuição (sino). O histograma permite-nos visualizar a forma da distribuição.
1. Média
µ = ∑ [xP(x )]
2. Variância
σ 2 = ∑ ( x − µ )2 P ( x ) =
[
] {∑ [x P(x )]}− µ
2
2
3. Desvio-padrão
σ =
{∑ [x P(x )]}− µ
2
2
Ex. 4. Obtenha as probabilidades da distribuição P(x) = x/3 (onde x assume os valores 0, 1 e 2) e determine a
média, a variância e o desvio-padrão.
x
0
1
2
P(x)
0
1/3
2/3
x.P(x)
0
1/3
4/3
Total
∑ P( x ) = 3 = 1
3
x2
0
1
4
∑ [xP(x )] = 5/3
x2.P(x)
0
1/3
8/3
∑ [x P(x )] = 9/3 = 3
2
Média:
µ = ∑ [xP( x )] = 5 / 3 ≅ 1,67
Variância:
σ 2 = ∑ [x 2 P(x )] − µ 2 = 9 / 3 − (5 / 3)2 = 9 / 3 − 25 / 9 = (27 − 25) / 9 = 2 / 9
Desvio-padrão:
σ=
{∑ [x P(x )]}− µ
2
2
= 2 / 9 = 2 / 3 = 0,47
Ex. 5. A tabela abaixo representa a distribuição de probabilidades do número de acidentes com a USAir, dentre
sete acidentes selecionados aleatoriamente (supondo que os acidentes são eventos independentes e aleatórios).
Determine o número médio de acidentes com a USAir (dentre sete), a variância e o desvio-padrão.
x
0
1
2
3
4
5
6
7
Total
P(x)
0,210
0,367
0,275
0,115
0,029
0,004
0+
0+
∑ P(x ) = 1,000
x.P(x)
0,000
0,367
0,550
0,345
0,116
0,020
0,000
0,000
∑ [xP(x )] = 1,398
x2
0
1
4
9
16
25
36
49
x2.P(x)
0,000
0,367
1,100
1,035
0,464
0,100
0,000
0,000
2
x P( x ) = 3,066
∑[
]
Média:
µ = ∑ [xP( x )] = 1,398 ≅1,4 acidentes.
Variância:
2
σ 2 = ∑ [x 2 P( x )] − µ 2 = 3,066 − 1,398 2 = 1,111596 ≅ 1,1 acidentes2
Desvio-padrão:
σ =
{∑ [x P(x )]}− µ
2
2
= 1,111596 = 1,054323 ≅ 1,1 acidentes
* Valor esperado ou esperança.
A média de uma variável aleatória discreta é o resultado médio teórico de um número infinito de repetições do
experimento. Podemos encarar essa média como o valor esperado no sentido que é o valor médio que
esperaríamos obter se o número de repetições do experimento se prolongasse indefinidamente. O valor esperado
de uma variável discreta é denotado por E e representa o valor médio dos resultados.
E = ∑ [xP( x )] = µ
A média de uma variável aleatória discreta coincide com o seu valor esperado!
→ Distribuições teóricas de probabilidades de variáveis aleatórias.
Exemplos de distribuições de probabilidade.
Existem
diversas
distribuições
teóricas
de
probabilidades, tanto para variáveis discretas como
Distribuições de probabilidade
para variáveis contínuas. Exemplos de distribuições de
Discretas
Contínuas
probabilidades são dados no quadro ao lado. A
Bernoulli
Uniforme
aplicação das distribuições de probabilidades depende
Binomial
Exponencial
da natureza da variável e do fenômeno que ela
Poisson
Erlang
representa. O número de chamadas numa central
Geométrica
Gamma
telefônica é dado pela distribuição de Poisson; o tempo
Pascal
Beta
de vida de um equipamento é dado pela distribuição
Série-log
Weibull
Exponencial. Em transmissão de sinais usa-se a
Multinomial
Normal
distribuição de Erlang.
Hipergeométrica
Lognormal
→ Distribuição binomial (possuem aplicação em controle de qualidade, análise de eleitores, pesquisa médica,
serviço de inteligência militar e propaganda, etc.)
São indicadas para experimentos que têm a característica de apresentarem exatamente dois resultados
complementares: em processos industriais, as peças falham ou não falham; na zootecnia, o filhote é macho ou
fêmea; na medicina, o paciente vive ou morre; na propaganda, um consumidor reconhece o produto, ou não.
* Condições para um experimento binomial:
1- Deve comportar um número fixo de provas (repetições, tentativas, ensaios, testes, provas, trials).
2- Os testes devem ser independentes.
3- Cada teste deve ter todos os resultados classificados em duas categorias: sucesso (s) ou falha (f) (insucesso).
4- As probabilidades devem permanecer constantes para cada teste.
P(s) = p; P(f) = 1 – p = q
n denota o número fixo de testes
x denota o número específico de sucessos em n testes, podendo ser qualquer inteiro entre 0 e n.
p denota a probabilidade de sucesso em um dos n testes
q denota a probabilidade de falha em um dos n testes
P(x) denota a probabilidade de obter exatamente x sucessos em n testes.
→ Revisão de fatorial.
* Notação:
O símbolo fatorial (!) denota o produto dos inteiros positivos em ordem decrescente. Por exemplo: 4! = 4.3.2.1
= 24. Por definição, 0! = 1. (muitas calculadoras têm a tecla !)
* Regra do fatorial:
Seja n um número inteiro positivo. Então: n! = n × (n – 1) × (n – 2) × (n – 3) × ... × [n – (n - 1)].
Ex. 6. Dado que 10% das pessoas são canhotas, suponha que queiramos achar (a) a probabilidade de obter
exatamente 3 estudantes canhotos em uma turma de 15 estudantes; (b) a probabilidade de obter ao menos 3
estudantes canhotos.
n = 15; x = 3; p = 0,10; q = 1 – 0,10 = 0,90
(a) Podemos resolver esse item por três métodos diferentes:
1. Através da fórmula da probabilidade binomial
3
n!
. p x .q (n − x ) ; para x = 0, 1, 2, 3, ... , n.
(n − x )! x!
n!
*
representa o número de maneiras como podemos dispor x sucessos e (n – x) falhas;
onde: o termo
(n − x )! x!
e o termo p x .q (n − x ) representa a probabilidade de x sucessos em n provas para determinada ordem.
15!
15!
P(3) =
.0,13.0,9 (15−3 ) =
.0,13.0,9 (12 ) = (455)(0,001)(0,282429536) = 0,129
(15 − 3)!3!
12!3!
P( x ) =
2. Através da Tabela A-1
P(x = 3) = 0,129
3. Através do MINITAB
Probability Density Function
Binomial with n = 15 and p = 0,100000
x
3,00
P( X = x)
0,1285
(b) Para resolver esse item usando a fórmula da distribuição binomial, devemos aplicar a fórmula pelo menos
três vezes, o que muitas vezes pode ser tedioso. Portanto, objetivando facilitar a resolução, devemos lançar mão
da Tabela A-1 ou usar o MINITAB. Usando a Tabela A-1, temos:
P(x ≥ 3) = P(3) + P(4) + P(5) + ... + P(15) = 0,129 + 0,0343 + 0,010 + ... + 0 = 0,184. Ou então:
P(x ≥ 3) = 1 – P(x < 3) = 1 - [P(0) + P(1) + P(2)] = 1 – (0,206 + 0,343 + 0,267) = 1 - 0,816 = 0,184.
→ Média, variância e desvio-padrão da distribuição binomial
* média:
µ = n.p
* variância
σ2 = n.p.q
* desvio-padrão
σ = n. p.q
Ex. 7. Determinar a média, a variância e o desvio-padrão para os acidentes da USAir do exemplo 5.
n = 7; p = 0,20 e q = 0,80
µ = n.p = 7 × 0,20 = 1,4
σ2 = n.p.q = 7 × 0,20 × 0,80 = 1,1
σ = n. p.q = 1,12 = 1,1
Ex. 8. Alguns casais preferem ter filhos do sexo feminino, porque as mães são portadoras de um distúrbio
recessivo que é herdado por 50% de seus filhos, mas por nenhuma de suas filhas. O método Ericsson de seleção
de sexo tem uma taxa admitida de 75% de sucesso. Suponha que 100 casais utilizem o método Ericsson, com o
resultado de que, dentre 100 recém-nascidos, há 75 meninas. (a) Suponha que o método Ericsson não produza
efeito, e admitindo que menino e menina sejam igualmente prováveis, determine a média e o desvio-padrão do
número de meninas em um grupo de 100 crianças. (b) Interprete os valores da parte (a) para determinar se o
resultado de 75 meninas em 100 bebês confirma a alegação da eficiência do método Ericsson.
(a) x = número de meninas em 100 nascimentos; n = 100; p = 0,5 e q = 0,5
µ = n.p = 100 × 0,5 = 50
σ = n. p.q = 100 × 0,5 × 0,5 = 5
(b) x = µ ± 2σ = 50 ± 2 × 5 = 50 ± 10; (40 ≤ x ≤ 60)
*
O termo
n!
= C pode ser determinado em calculadoras científicas (e.g., CASIO fx-82SUPER FRACTION) usando
(n − x )! x! n r
os seguintes passos: (1) digitar o valor de n; (2) acionar a tecla nCr; (3) digitar o valor de x; (4) digitar a tecla =
4
x−µ
75 − 50 25
=
=5
σ
5
5
Esses dois últimos resultados indicam que o nascimento de 75 meninas não parece ocorrer por puro acaso.
z=
=
→ Usando o programa MINITAB
Os valores de probabilidades de uma distribuição binomial podem ser obtidos para determinados valores de n e
p através do programa MINITAB. A distribuição de probabilidades da variável binomial do exemplo 6 pode ser
obtida no programa MINITAB usando-se os seguintes comandos:
Digite o(s) valor(es) da variável x na coluna C1. Em seguida acesse o menu:
Calc
Probability Distributions
Binomial
Forneça os valores de n (trials) e p (ver janela abaixo), e obtenha a distribuição conforme indicado a seguir.
→ Distribuição normal
Uma variável aleatória contínua tem distribuição normal de essa distribuição é simétrica e apresentar a forma de
sino. É também conhecida como distribuição de Gauss ou Gaussiana. Seja x uma variável aleatória contínua; x
terá distribuição normal se:
f ( x) =
1
σ 2π
e
1  x−µ 
− 

2 σ 
2
, onde -∞ < x < ∞
e:
µ denota a média da distribuição;
σ denota o desvio-padrão da distribuição;
π vale 3,14159...;
e vale 2,7182....
A expressão mostra que qualquer distribuição normal é determinada por dois parâmetros: a média µ e o desviopadrão σ.
Uma distribuição de probabilidade de uma variável discreta deve satisfazer as seguintes condições:
(1) ∑ P( x ) = 1 , onde x assume todos os valores possíveis.
(2) 0 ≤ P( x ) ≤ 1 , para todos os valores de x.
O gráfico de uma distribuição discreta de probabilidade é dito histograma de probabilidade. O gráfico de uma
distribuição contínua de probabilidade é chamado curva de densidade e deve satisfazer as seguintes
propriedades:
(1) A área total sob a curva deve ser igual a 1.
(2) Todo ponto da curva deve ter uma altura vertical não inferior a 0.
Ex. 9. As temperaturas em um processo de fabricação são controladas de modo a variarem entre 0o C e 5º C com
todos os valores igualmente prováveis e iguais a 0,2. (a) Construa a curva de densidade; (b) determine a
probabilidade de escolher aleatoriamente uma temperatura entre 1º C e 4º C.
5
(b) P(1º C ≤ x ≤ 4º C) = área = 3 × 0,2 = 0,6.
(a)
P(x)
0,2
Essa distribuição em que todos os valores da variável
aleatória são igualmente prováveis é chamada
distribuição uniforme.
0,1
0,0
0
1
2
3
4
5
Temperatura (oC)
Uma curva de densidade é o gráfico de uma variável aleatória contínua, de forma que a área sob a curva é 1,
estabelecendo-se uma correspondência entre área e probabilidade.
A curva de densidade de uma distribuição normal tem a forma mais complicada de um sino o que torna mais
difícil achar as áreas. Entretanto, há uma correspondência entre área e probabilidade.
→ Distribuição normal padronizada
É uma distribuição de probabilidade que tem média igual a 0 e desvio-padrão igual a 1.
Seja z uma variável aleatória contínua; z terá distribuição normal padronizada se:
f ( z) =
1
2π
e
−
1 2
(z )
2
, onde -∞ < z < ∞
e:
A área total sob a curva é 1!
* Determinação da probabilidade conhecendo o escore z:
É dada através da Tabela A-2 que inclui áreas (ou probabilidades) para muitas regiões diferentes.
Escore z: distância ao longo da escala horizontal no gráfico; recorrer à coluna mais a esquerda (e à linha
superior) da Tabela A-2.
Área (ou probabilidade): região sob a curva; recorrer aos números no corpo da Tabela A-2.
Ex. 10. A temperatura de congelamento da água (0o C) foi medida em vários termômetros. O valor médio das
medidas foi µ = 0,0o C e o desvio-padrão foi σ = 1,00o C. Admita que a distribuição de freqüência dos erros se
assemelhe a uma distribuição normal. Escolhido aleatoriamente um termômetro, determine a probabilidade de
que no ponto de congelamento da água o termômetro marque (a) entre 0o C e 1,58º C; (b) entre -2,43º C e 0o C;
(c) uma leitura superior a 1,27º C; (d) entre 1,20º C e 2,30º C.
(a)
(b)
P(0º C ≤ z ≤ 1,58º C) = 0,4429.
(c)
P(-2,43º C ≤ z ≤ 0º C) = P(0º C ≤ z ≤ 2,43º C) = 0,4925.
(d)
P(z > 1,27º C) = P(z > 0º C) – P(0o C ≤ z ≤ 1,27º C) =
0,5 - 0,3980 = 0,1020.
P(1,20º C ≤ z ≤ 2,30º C) = P(0º C ≤ z ≤ 2,30º C) –
P(0o C ≤ z ≤ 1,20º C) = 0,4893 - 0,3849 = 0,1044.
6
* Determinação do escore z conhecendo a probabilidade:
1- Identificar a probabilidade que representa uma área delimitada pela linha do centro.
2- Localizar essa probabilidade na Tabela A-2.
3- Identificar o valor z correspondente.
Ex. 11. Considere os termômetros com leituras distribuídas normalmente com média 0o C e desvio-padrão 1º C
do exemplo 10. (a) Determine a temperatura correspondente ao 95º percentil; (b) determine o 10º percentil.
(a)
(b)
z
1,645º C = P95.
-1,28º C = P10.
→ Distribuições normais não-padronizadas
São aplicadas a variáveis aleatórias contínuas, distribuídas normalmente, com média diferente de zero, desviopadrão diferente de 1, ou ambos.
Para padronizar usamos a fórmula (:
x−µ
z=
σ
* Determinação da probabilidade conhecendo o escore z:
1- Desenhar o gráfico com a área de interesse
2- Usar a fórmula de padronização
3- Usar a Tabela A-2 para obter a probabilidade P.
z=
x−µ
σ
Ex. 12. As alturas das mulheres têm distribuição normal com média igual a 63,6 in. (161,5 cm) e desvio-padrão
de 2,5 in. (6,35 cm). Selecionada aleatoriamente uma mulher (a) determine a probabilidade de a sua altura estar
entre 63,6 in. (161,5 cm) e 68,6 in. (174,2 cm); (b) para se adaptar a uma espaçonave russa Soyuz, uma
astronauta deve ter altura entre 64,5 in. (163,8 cm) e 72 in. (183,9 cm). Determine a porcentagem das mulheres
americanas que satisfazem essa condição; (c) Entre 500 mulheres americanas selecionadas aleatoriamente,
quantas satisfazem aquela condição? (d) O exército americano exige que a altura das mulheres esteja entre 58 in.
(147,3 cm) e 80 in. (203,2 cm). Determine a porcentagem das mulheres que satisfazem esta exigência.
(a)
68,6 − 63,6
63,6 − 63,6
= 2,00
=0; z =
2,5
2,5
z = 2,00; P = 0,4772
z=
P(63,6 < x < 68,6) = P(0 < z < 2,00) = 0,4772
(b)
64,5 − 63,6
72 − 63,6
= 0,36 ; z =
= 3,36
2,5
2,5
z = 0,36; P = 0,1406;
z = 3,36; P = 0,4999
z=
Área B = Área (A + B) – Área (A)
Área B = 0,4999 – 0,1406 = 0,3593
P(64,5 < x < 72) = P(0,36 < z < 3,36) = 0,3593 = 35,93%
7
(c) 500 × 0,3593 = 179,65 ≅ 179 mulheres
(d)
58 − 63,6
80 − 63,6
= −2,24 ; z =
= 6,56
2,5
2,5
z = -2,24; P = 0, 4875; z = 6,56; P = 0,4999
z=
Área = Área (A + B) = 0,4875 + 0,4999 = 0,9874
P(58,0 < x < 80,0) = P(-2,24 < z < 6,56) = 0,9874 = 98,74%
* Cálculo de valores (escore z) conhecendo a probabilidade:
1- Desenhar o gráfico com a área de interesse e o valor de x procurado
2- Usar a Tabela A-2 e identificar o valor de z
3- Usar a fórmula a seguir para obter o valor de x procurado.
x = µ + σ ×z
Ex. 13. As alturas das mulheres têm distribuição normal com média igual a 63,6 in. (161,5 cm) e desvio-padrão
2,5 in. (6,35 cm). (a) Determine o P90, i.e., o 90º percentil que é a altura que separa os 90% superiores dos 10%
inferiores; (b) determine o 20º percentil.
(a)
x = µ + σ ×z
x = 63,6 + 2,5 × 1,28
x = 66,8 in. (169,7 cm)
P90 = 66,8 in.
(b)
x = µ + σ ×z
x = 63,6 + 2,5 × (-0,84)
x = 61,5 in. (156,2 cm)
P20 = 61,5 in.
→ Usando o programa MINITAB
Os valores de probabilidades de uma distribuição normal podem ser obtidos através do programa MINITAB
usando-se os seguintes comandos:
Digite os valores da variável x na coluna C1. Em seguida acesse o menu:
Calc
Probability Distributions
Normal
Forneça os valores de µ e σ (ver janela abaixo), e obtenha a distribuição conforme indicado na figura a seguir.
Cumulative Distribution Function
Normal with mean = 0 and
standard deviation = 1,00000
x
-2,4300
0,0000
1,2000
1,2700
2,3000
P( X <= x)
0,0075
0,5000
0,8849
0,8980
0,9893
8
Ex. 14. Resolver os itens (a) e (b) do exemplo 12 usando o MINITAB.
Digitar os valores da variável x na coluna C1 e introduzir os valores de µ e σ no programa MINITAB.
(a) P(63,6 < x < 68,6) = P(x < 68,6) - P(x < 63,6) = (b) P(64,5 < x < 72,0) = P(x < 72,0) - P(x < 64,5) =
0,9772 – 0,5000 = 0,4772
0,9996 – 0,6406 = 0,3590
Cumulative Distribution Function (saída do MINITAB)
Cumulative Distribution Function (saída do MINITAB)
Normal with mean = 63,6000 and standard
deviation = 2,50000
Normal with mean = 63,6000 and standard
deviation = 2,50000
x
63,6000
68,6000
P( X <= x)
0,5000
0,9772
x
64,5000
72,0000
P( X <= x)
0,6406
0,9996
→ Teorema do Limite Central (TLC)
O TLC é um dos conceitos mais importantes e mais úteis na estatística, pois constitui o fundamento para a
estimativa de parâmetros populacionais e para o teste de hipóteses.
Dado:
1. A variável aleatória x tem distribuição (que pode ser normal, ou não), com média µ e desvio-padrão σ.
2. Amostras de tamanho n são extraídas aleatoriamente dessa população.
Conclusões:
1. Na medida em que o tamanho da amostra aumenta, a distribuição das médias amostrais x tende para uma
distribuição normal.
2. A média das médias amostrais será o média populacional µ ( µ x = µ)
3. O desvio padrão das médias amostrais será σ
n (σ x = σ
n)
Esquema ilustrativo do TLC.
* Regras práticas de uso comum:
1. Para amostras de tamanho n > 30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente
por uma distribuição normal. A aproximação melhora na medida em que aumenta o tamanho da amostra n.
9
2. Se a própria distribuição original tem distribuição normal, então as médias amostrais terão distribuição
normal para qualquer tamanho amostral n.
Esquema ilustrativo da distribuição amostral das médias amostrais.
Ex. 15. Na engenharia humana e no projeto de produtos, freqüentemente é importante considerarmos os pesos
das pessoas, de modo que não haja sobrecarga em aviões ou elevadores, as cadeiras não se quebrem, e não
ocorram outros acontecimentos perigosos ou embaraçosos. Dado que a população de homens tem pesos
distribuídos normalmente com média de 173 lb e desvio-padrão de 30 lb, determine a probabilidade de que (a)
um homem escolhido aleatoriamente pese mais que 180 lb; (b) em 36 homens escolhidos aleatoriamente, o peso
médio seja superior a 180 lb.
(a)
z=
x−µ
σ
=
180 − 173
= 0,23
30
P(x > 180) = P(z > 0) - P(0 < z ≤ 0,23) = 0,5 - 0,0910
P(x > 180) = 0,4090 = 40,90%
(b)
z=
µ x = µ = 173
30
30
σ
σx =
=
=
=5
n
36
x − µx
σx
=
180 − 173 7
= = 1,40
30
5
36
P( x > 180) = P(z > 0) - P(0 < z < 1,40) =
P( x > 180) = 0,5 - 0,4192 = 0,0808 = 8,08%
6
Ex. 16. Suponha que a população de temperaturas do corpo humano tenha média de 37º C, como se aceita em
geral. Suponha também que o desvio-padrão da população seja de 0,344º C. Selecionada aleatoriamente uma
amostra de tamanho n = 106 determine a probabilidade de se obter uma média de 36,78º C ou menos.
z=
x − µx
σx
=
36,78 − 37,0 − 0,22
=
= −6,58
0,344
0,0334
106
P( x < 36,78) = P(z < -6,58) = P(z > 0) - P(0 < z < 6,58) =
P( x < 36,78) = 0,5 - 0,4999 = 0,0001 = 0,01%
10
→ A distribuição normal como uma aproximação da distribuição binomial.
Nos casos em que o número de sucessos (x) e o número de testes (n) assumem valores elevados, inviabiliza o
uso da Tabela A-1 e da fórmula da probabilidade binomial. Dessa forma, a distribuição binomial pode ser
aproximada por uma distribuição normal.
Se n.p ≥ 5 e n.q ≥ 5, então a variável aleatória binomial tem distribuição aproximadamente normal com média µ
e desvio-padrão σ dados por: µ = n.p e σ =
n. p.q .
* Processo de aproximação pela normal:
Passo 1: Verificar se a distribuição binomial é aplicável.
Passo 2: Utilizar (se possível) programas estatísticos.
Passo 3: Utilizar a Tabela A-1 (se possível).
Passo 4: Utilizar a fórmula da probabilidade binomial (se viável, i. e., se o problema for facilmente resolvível).
Passo 5: Verificar se n.p ≥ 5 e n.q ≥ 5, ou seja, se a variável aleatória binomial é convenientemente aproximada
pela distribuição normal.
Passo 6: Determinar os valores dos parâmetros µ e σ, usando µ = n.p e σ = n. p.q .
Passo 7: Identificar o valor discreto x que representa o número de sucessos no experimento binomial. Corrigir o
valor discreto x substituindo-o por x - 0,5 ou x + 0,5, conforme adequado†, traçar a curva normal com a
x−µ
.
área de interesse e determinar o escore z usando a fórmula z =
σ
Passo 8: Consultar a Tabela A-2 para obter a área correspondente à probabilidade desejada.
Ex. 17. Suponha que o quadro administrativo de sua faculdade tenha igual número de candidatos e candidatas ao
emprego, e que 64 dos 100 funcionários recém-admitidos são homens. Estime a probabilidade de obter pelo
menos 64 homens, se cada contratação é feita independentemente e sem qualquer discriminação de sexo. Com
base no resultado, parece que a faculdade está fazendo discriminação quanto ao sexo?
Passo 1: Distribuição binomial (com n = 100 testes independentes), com duas categorias (homem, mulher), com
probabilidade constante (0,5).
Passo 2: Não se dispõe de computador.
Passo 3: A Tabela A-1 não se aplica, pois n = 100 > 15.
Passo 4: Para usar a fórmula da probabilidade binomial teríamos que aplicá-la 37 vezes, de 64 a 100.
Passo 5: A distribuição binomial pode ser aproximada pela distribuição normal, pois n.p = 100 × 0,5 = 50 > 5 e
n.q = 100 × 0,5 = 50 > 5.
Passo 6: µ = n.p = 100 × 0,5 = 50 e σ = n. p.q = 100 × 0,5 × 0,5 = 25 = 5 .
Passo 7: Pelo menos 64, i.e., um valor ≥ 64. Portanto o valor discreto deve ser igual a x = 64 – 0,5 = 63,5.
x − µ 63,5 − 50
=
= 2,70
z=
σ
5
Passo 8: Da Tabela A-2, para z = 2,70, a área é 0,4965. Portanto, a área de interesse é: área = 0,5 – 0,4965 =
0,0035 = 0,35% (No MINITAB, área = 0,0035!).
†
Para realizar a correção deve-se observar a afirmação feita e localizar a área de interesse como descrito a seguir:
Afirmação:
Área:
Pelo menos x (inclui x ou mais)
À direita de x – 0,5
Mais de x (não inclui x)
À direita de x + 0,5
No máximo x (inclui x ou menos) À esquerda de x + 0,5
Menos de x (não inclui x)
À esquerda de x – 0,5
Exatamente x
Entre x – 0,5 e x + 0,5
11
→ Exercícios
1. Para resolver uma questão de paternidade, fazem-se testes de sangue em duas pessoas diferentes. Se x é o
número dos que têm sangue do grupo A, então x pode ser 0, 1 ou 2, e as probabilidades correspondentes são
0,36, 0,48 e 0,16, respectivamente. Determine para a variável aleatória discreta x: (a) o valor esperado; (b) a
média; (c) a variância; (d) o desvio-padrão. (a) 0,80, (b) 0,80, (c) 0,48, (d) 0,69
2. Se sua faculdade contrata os 4 próximos funcionários sem distinção de sexo e o conjunto de candidatos é
grande, com números iguais de homens e mulheres, a tabela a seguir dá a distribuição de probabilidade do
número x de mulheres contratadas. Complete a tabela e determine: (a) o valor esperado; (b) a média; (c) a
variância; (d) o desvio-padrão. (2); (2); (1); (1)
x
0
1
2
3
4
Total
P(x)
0,0625
0,2500
0,3750
0,2500
0,0625
x.P(x)
x2
∑ [x P(x )] =
∑ [xP(x )] =
∑ P( x ) =
x2.P(x)
2
3. Considere que um produto pode estar perfeito (B), com defeito leve (DL) ou com defeito grave (DG). Seja a
seguinte distribuição do lucro (em R$), por unidade vendida desse produto:
Produto
B
DL
DG
x
6
0
-2
P(x)
0,7
0,2
0,1
Calcule: (a) o valor esperado, (b) a variância e (c) o desvio-padrão do lucro.
4. A Mars, Inc. afirma que 20% de suas pastilhas de chocolate M&M são vermelhas. Determine a probabilidade
de que em 15 pastilhas M&M escolhidas aleatoriamente: (a) exatamente 20% (ou seja, 3 pastilhas) sejam
vermelhas usando a fórmula da probabilidade binomial; (b) exatamente 3 pastilhas sejam vermelhas usando a
Tabela A-1; (c) exatamente 3 pastilhas sejam vermelhas usando o MINITAB; (d) pelos menos 3 pastilhas sejam
vermelhas usando a fórmula da probabilidade binomial; (e) pelos menos 3 pastilhas sejam vermelhas usando a
Tabela A-1; (f) pelos menos 3 pastilhas sejam vermelhas usando o MINITAB; (g) determine o número médio de
pastilhas vermelhas; (h) determine a variância do número de pastilhas vermelhas; (i) determine o desvio-padrão
do número de pastilhas vermelhas. (a) 0,25, (b) 0,25, (c) 0,25, (d) 0,602, (e) 0,602, (f) 0,602, (g) 3, (h) 2,4, (i)
1,55
5. De acordo com um instituto de pesquisa, 30% dos aparelhos de TV são sintonizados num determinado
programa quando ele vai ao ar. Supondo que esse programa esteja sendo transmitido e que 15 TVs sejam
escolhidas aleatoriamente: (a) determine a probabilidade de exatamente 5 TVs estarem sintonizadas naquele
programa, usando a fórmula da probabilidade binomial; (b) usando a Tabela A-1; (c) usando o MINITAB.
Determine a probabilidade de pelo menos 5 TVs estarem sintonizadas naquele programa, usando: (d) usando a
Tabela A-1; (e) usando o MINITAB. Determine: (f) o número médio de TVs sintonizadas naquele programa; (g)
a variância e (h) o desvio-padrão do número de TVs sintonizadas naquele programa. (0,2061); (0,206); (0,2061);
(0,517); (0,5155); (4,5); (3,15); (1,77)
6. Dados históricos mostram que 5% dos itens provindos de um fornecedor apresentam algum tipo de defeito.
Considerando um lote com 20 itens, calcular a probabilidade de: (a) haver algum item com defeito, usando a
Tabela A-1; (b) haver exatamente dois itens defeituosos, usando a fórmula da probabilidade binomial; (c) haver
mais de dois itens defeituosos, usando o MINITAB; (d) qual é o número esperado de itens defeituosos no lote?
(e) e de itens bons? Determine: (f) a variância e (g) o desvio-padrão do número de itens defeituosos.
7. Os prazos da gravidez humana têm distribuição normal com média de 268 dias e desvio-padrão de 15 dias.
Selecionada aleatoriamente uma mulher determine: (a) a probabilidade de sua gravidez durar 308 dias ou mais;
(b) a probabilidade de sua gravidez ser inferior a 260 dias; (c) qual a porcentagem de crianças nascidas com ao
menos três semanas de antecipação; (d) definindo como prematura uma criança cujo período de gestação esteja
nos 4% inferiores, determine o prazo de gestação que separa as crianças prematuras das não-prematuras; (e)
determine o 95o percentil dos prazos de gravidez; (f) se 25 mulheres escolhidas aleatoriamente são submetidas a
uma dieta especial a partir do dia que engravidam, determine a probabilidade de os prazos de duração de sua
12
gravidez terem média inferior a 260 dias (admita que a dieta não produza efeito sobre o tempo de gravidez); (g)
se as 25 mulheres têm realmente média inferior a 260 dias, há razão de preocupação para os
médicos/nutricionistas? (a) 0,0038, (b) 0,2981, (c) 0,0808, (d) 242 dias, (e) 293 dias, (f) 0,0038
8. Um subfornecedor da IBM foi contratado para fabricar substratos de cerâmica, utilizados para transmitir
sinais entre chips de silício para computador. As especificações exigem uma resistência entre 1,500 ohm e 2,500
ohms, mas a população tem resistências distribuídas normalmente com média de 1,978 ohm e desvio-padrão de
0,172 ohm. (a) Que percentagem dos substratos de cerâmica foge às especificações do fabricante? (b) Resolva
novamente o item anterior usando o MINITAB. (c) Se as especificações exigidas forem modificadas de modo
que 3% dos dispositivos sejam rejeitados por terem resistência muito baixa e 3% sejam rejeitados por terem
resistência muito alta, determine os valores de separação para os dispositivos aceitáveis. (0,39%); (0,39%);
(1,65 ohm e 2,30 ohm)
9. O padrão de qualidade recomenda que os pontos impressos por uma impressora estejam entre 3,7 e 4,3 mm.
Uma impressora imprime pontos cujo diâmetro médio é igual a 4,00 mm e o desvio-padrão é 0,19 mm. Suponha
que o diâmetro dos pontos tenha distribuição normal. (a) Qual é a probabilidade do diâmetro de um ponto dessa
impressora estar dentro do padrão? (b) Resolva novamente o item anterior usando o MINITAB. (c) Qual deveria
ser o desvio-padrão para que a probabilidade do item (a) atingisse 95%?
10. Uma análise dos números de horas por semana que os calouros universitários (nos EUA) dedicam ao estudo
acusa média de 7,06 horas e desvio-padrão de 5,32 horas. Selecionados aleatoriamente 55 calouros, determine a
probabilidade de seu tempo semanal médio de estudo exceder 7,00 horas. (0,5319)
11. As quantidades de precipitação anual do estado de Iowa aparentam ter distribuição normal com média
32,473 polegadas e desvio-padrão de 5,601 polegadas, (a) Escolhido um ano aleatoriamente, determine a
probabilidade de a precipitação anual correspondente ser inferior a 29,000 polegadas. (b) Resolva novamente o
item anterior usando o MINITAB. (c) Para uma década selecionada aleatoriamente, determine a probabilidade
de a média das precipitações anuais ser inferior a 29,000 polegadas. (d) Como a parte (c) envolve uma amostra
não superior a 30, por que podemos aplicar o teorema do limite central? (0,2676); (0,2676); (0,025)
12. O tempo para que um sistema computacional execute determinada tarefa é uma variável aleatória com
distribuição normal, com média 320 segundos e desvio-padrão de 7 segundos. (a) Qual a probabilidade de a
tarefa ser executada entre 310 e 330 segundos? (b) Resolva novamente o item anterior usando o MINITAB. (c)
A tarefa é colocada para execução 200 vezes. Selecionadas aleatoriamente 50 execuções, qual a probabilidade
de o tempo médio dessas execuções demorar mais do que 325 segundos?
13. Um hospital americano está fazendo uma campanha de doações, porque seu estoque de sangue do grupo O
está baixo; o hospital necessita de 177 doadores de sangue do grupo O. Se 400 voluntários doam sangue, estime
a probabilidade de que haja pelo menos 177 doadores com sangue do grupo O. Quarenta e cinco por cento dos
americanos têm sangue do grupo O. (0,6368)
14. Atualmente, cerca de dois terços das companhias americanas fazem teste de uso de drogas em empregados
recém-admitidos, e o resultado do teste em 3,8% dos empregados dá positivo. Uma determinada empresa testa
150 candidatos a emprego e constata que, em 10 deles, o teste foi positivo. Estime a probabilidade de 10 ou
mais resultados positivos em 150 candidatos. Com base nesse valor, os 10 resultados positivos parecem uma
cifra excepcionalmente alta? (0,0526)
15. Um exame de múltipla escolha consiste em 100 questões, cada uma com quatro possibilidades de escolha. A
aprovação exige, no mínimo, 30% de acertos. Qual é a probabilidade de aprovação se o candidato comparece ao
exame sem saber absolutamente nada, apelando apenas para o “palpite”?
Curiosidades
13
Download