Estatística Descritiva

Propaganda
Escola Superior de Gestão de Santarém
Disciplina de Probabilidade e Estatística
_____________________________
Soluções das fichas
de exercícios
_____________________________
2011-12
Estatística Descritiva
Estatística Descritiva
1 - Indicar quais das seguintes variáveis são discretas e quais são contínuas
1.1 - Valor do PIB nacional.
1.2 - Produtividade média do girassol de regadio no Alentejo.
1.3 - Número de sapatos de um dado tamanho nas sapatarias de Santarém.
1.4 - Efectivo militar em Trás-os-Montes.
1.5 - Número médio de pontos por jogador numa dupla de voleibol de praia num
determinado torneio.
1.6 - Toneladas de tomate que chegam por dia a uma fábrica.
1.7 - Número médio de sobreiros nas explorações de montado do Alentejo.
Resolução:
1 - Indicar o tipo de variável:
Variáveis contínuas: 1.1; 1.2; 1.6; 1.7;
Variáveis discretas: 1.3; 1.4; 1.5.
2 - No quadro seguinte apresenta-se o absentismo dos 50 colaboradores de uma
empresa de serviços, registado durante o período de um ano (foram excluídas as faltas
por motivos justificáveis).
6
4
4
6
0
6
5
13
11
6
4
3
3
11
4
4
8
4
7
7
8
6
6
5
6
6
8
3
3
6
6
1
0
10
6
3
3
2
3
2
2
3
1
8
6
2
2
3
2
0
2.1 - Sendo X a variável em causa, como pode defini-la? E como a classifica?
2.2 - Organize os dados num quadro de distribuição de frequências, com as
frequências observadas, relativas e acumuladas.
2.3 - Determine a proporção de empregados que faltaram mais de 3 dias por ano.
2.4 - Calcule e diga o respectivo significado de
=
,
=
,
=
2.5 - Construa o diagrama de barras e o gráfico de frequências relativas
acumuladas
2.6 - Calcule a média, o desvio padrão e o coeficiente de variação.
Miguel Soares Lopes
Ficha 1
1
Estatística Descritiva
2.7 - Determine a mediana algébrica e graficamente.
2.8 - Determine a moda, o 20º percentil, o 9º decil e o 3º quartil.
Resolução:
22.1 - Definição: X — nº de dias de absentismo dos colaboradores da empresa de
serviços;
Classificação: é uma variável discreta.
2.2 - i — é o índice do grupo de valores;
x — é cada um dos valores que a variável pode tomar;
i = 1 significa “o primeiro valor da variável” e esse valor é “x = 0”
De i = 1 até i = 4
{
i
x
1
2
0
1
2
3
3
4
5
6
7
8
9
10
11
12
13
14
4
5
6
7
8
9
10
11
12
13
Fi
3
2
6
9
6
2
12
2
4
0
1
2
0
1
fi
0,06
0,04
0,12
0,18
0,12
0,04
0,24
0,04
0,08
0,00
0,02
0,04
0,00
0,02
CumFi Cumfi
3
0,06
5
0,10
0,22
11
20
0,40
26
0,52
28
0,56
40
0,80
42
0,84
46
0,92
46
0,92
47
0,94
49
0,98
49
0,98
50
1,00
Do x21 até ao x26
todos valem 4
2.3 - Prop. de colab. que faltaram mais de 3 dias/ano = 1- Cumf4 = 1 – 0,4 = 0,6.
Cumf4 — é a proporção de indivíduos que faltaram desde i = 1 até i = 4 , isto é,
desde x = 0 até x = 3 que significa de 0 a 3 dias de faltas. Se à totalidade (100% ou
“1”) for retirado Cumf4 ficamos com a proporção dos que faltaram mais de 3 dias.
2.4 -
=
= F1 + F2 + F3 + F4 = CumF4 = 20 (número de colab. que faltaram até
3 vezes, inclusive. Repare-se que i = 4 corresponde a x = 3);
=
= F6 + F7 + … +F13 + F14 = CumF14 – CumF5 = 50 – 26 = 24 (número
de colab. com 5 ou mais faltas. Repare-se que i = 6 corresponde a x = 5);
=
= f1 + f2 + f3 + f4 + f5 = Cumf5 = 0,52 (proporção de colab. que
faltaram até 4 vezes, inclusive);
Miguel Soares Lopes
Ficha 1
2
Estatística Descritiva
2.5 -
Diagrama de Barras
Gráfico de Frequências Relativas Acumuladas
x fi = 0 x 0,06 + 1 x 0,04 + 2 x 0,12 + … + 11 x 0,04 + 12 x 0 + 13 x
x 0,02 = 4,76 faltas;
Fi . x2 – n. 2 3 x 02 + 2 x 12 +… + 0 x 122 + 1 x 132 – 50 x 4,762
σ2 =
=
=
n
50
= 8,34 faltas2
2.6 - µ =
σ=
2
σ
cv =
2.7 - Me =
8,34 = 2,89 faltas.
2,89
x 100% =
x 100% = 60,7%
4,76
=
x(25) + x(26)
2
=
4+4
= 4 (ver gráficos)
2
2.8 - Mo = 6 ;
P20 =
x(10) + x(11) 2 + 2
=
=2;
D9 =
x(45) + x(46) = 8 + 8 = 8 ;
2
2
2
Np = 50 x 0,20 = 10
Np = é inteiro
2
Q3 = x(37 + 1) = x(38) = 6.
Np = 50 x 0,90 = 45
Ver diapositivos
47 e 48 da
apresentação 1
Np = 50 x 0,75 = 37,5
Np = não é inteiro
3 - Os rendimentos médios mensais (€) de 48 famílias do sector do calçado estão
registados no quadro seguinte.
999
1210
870
1360
1330
1340
1485
830
986
1265
1267
1227
1267
826
865
1278
1250
848
1170
1459
1190
956
1345
1436
823
1393
1350
1243
868
1267
800
1339
1235
1336
935
950
1132
905
1376
923
896
1267
847
921
1465
800
871
1235
3.1 - Construa o quadro de distribuição de frequências.
Miguel Soares Lopes
Ficha 1
3
Estatística Descritiva
3.2 - Represente graficamente os dados através de um histograma, do polígono
de frequências e do gráfico das frequências relativas acumuladas.
3.3 - Determine a média e a variância dos dados simples.
3.4 - Determine a média, a mediana, a moda e a variância dos dados agrupados.
3.5 - Classifique a distribuição em termos de assimetria.
Resolução:
3-
3.1 - O primeiro passo para construção do quadro de distribuição de frequências
é definir o número de classes. Para isso vamos usar a expressão da regra de Sturges.
número de classes — m
1 + logN / log2 = 1 + 3,32 x log48 = 6,58
Assim, o número de classes será, em princípio, 6 ou 7.
Analisando os dados verificamos que a amplitude dos mesmos é:
Ampl. dos dados =Max(x) – Min(x) = 1485 – 800 = 685
Ao estabelecer o número de classes e ao atribuir a cada classe uma dada
amplitude definimos um intervalo onde todos os nossos valores deverão estar dentro. Se
a nossa amplitude de dados é de 685 então o intervalo resultante da definição das classes
terá que ter uma amplitude sempre maior que a anterior. Devemos, tanto quanto
possível, criar classes que tenham uma amplitude “simpática”, facilmente manipulável,
cujo centro seja também um valor “amigável” (ver diapositivos 27 a 29 da apresentação
1). Assim, e analisando os nossos dados, podemos verificar que, se usarmos 7 classes
com amplitude de 100 unidades cada, criamos um intervalo com amplitude de 700
(maior que 685). Se a primeira classe começar em 790 [valor inferior ao menor valor dos
dados (800)] a última classe acaba em 1490 [valor superior ao maior valor dos dados
(1485)]. As classes terão assim valores com os quais é “simpático” trabalhar.
Classe i
Fi
fi
CumFi
Cumfi
[790 , 890[
11
0,229
11
0,229
[890 , 990[
8
0,167
19
0,396
[990 , 1090[
1
0,021
20
0,417
[1090 , 1190[
2
0,042
22
0,458
[1190 , 1290[
13
0,271
35
0,729
[1290 , 1390[
8
0,167
43
0,896
[1390 , 1490[
5
0,104
48
1,000
Miguel Soares Lopes
Ficha 1
4
Estatística Descritiva
3.2 -
3.3 - Para dados simples vamos trabalhar com os 48 dados tal qual:
x=
s2 =
xi / 48 = 1129,92 €
x2 – n. x2 = 8002 + 8002 + 8232 +…+ 14592 + 14652 + 14852 – 48 x 1129,922 =
n
48
= 48565,2 €2.
3.4 - Para trabalhar com dados agrupados temos que partir do pressuposto de
que, dentro de cada classe, os valores se encontram distribuídos uniformemente.
Partindo desse pressuposto resulta que, a média dos valores de cada classe, é o valor
médio dessa classe. Assim, temos:
x=
Classe i
Fi
fi
Ci
[790 , 890[
[890 , 990[
[990 , 1090[
[1090 , 1190[
[1190 , 1290[
[1290 , 1390[
[1390 , 1490[
11
8
1
2
13
8
5
0,229
0,167
0,021
0,042
0,271
0,167
0,104
840
940
1040
1140
1240
1340
1440
Fi x Ci / 48 = 11 x 840 + 8 x 940 +… + 8 x 1340 + 5 x 1440 = 1127,50 €;
48
Me = l.infi +
0,5 – Cunf(i-1)
0,5 – 0,458
x h = 1190 +
fi
0,271
Mo = l.infi +
(13 – 2)
d1
x h = 1190 +
x 100 = 1258,75 €;
d1 + d2
(13 – 2) + (13 – 8)
s2 =
x 100 = 1205,50 €;
2
2
2
2
2
Fi.Ci2 – n.x2 11 x 840 + 8 x 940 +… + 8 x 1340 + 5 x 1440 – 48 x 1127,54,76
=
=
n
48
= 46093,75 €2.
3 x (1127,5 – 1205,5)
3.5 - GAS = 3 (xs – Me) =
= -1,09 .
46093,75
Esta distribuição é assimétrica negativa.
Miguel Soares Lopes
Ficha 1
5
Estatística Descritiva
4 - Obteve-se uma amostra de 200 indivíduos e registou-se a sua altura, tendo-se
procedido à sua distribuição em classes, como consta no seguinte quadro:
Altura (cm)
[148,5 , 155,5[
[155,5 , 162,5[
[162,5 , 169,5[
[169,5 , 176,5[
[176,5 , 183,5[
[183,5 , 190,5[
[190,5 , 197,5[
N.º Indivíduos
4
12
44
64
56
16
4
4.1 - Classifique a variável e defina-a.
4.2 - Determine as frequências relativas e as frequências relativas acumuladas.
4.3 - Qual a proporção de indivíduos com altura inferior a 176,5 cm? Qual a
altura máxima correspondente aos 30 % de indivíduos mais baixos?
4.4 - Construa o histograma e o polígono de frequências.
4.5 - Calcule a média e o desvio padrão dos dados agrupados.
4.6 - Construa o diagrama de extremos e quartis.
4.7 - A distribuição é simétrica?
Resolução:
4-
4.1 - X — altura dos indivíduos; variável contínua.
4.2 Classe i
Altura (cm)
N.º Indivíduos (Fi)
fi
CumFi
Cumfi
Ci
1
[148,5 ; 155,5[
4
0,02
4
0,02
152
2
[155,5 ; 162,5[
12
0,06
16
0,08
159
3
[162,5 ;169,5[
44
0,22
60
0,3
166
4
[169,5 ; 176,5[
64
0,32
124
0,62
173
5
[176,5 ; 183,5[
56
0,28
180
0,9
180
6
[183,5 ; 190,5[
16
0,08
196
0,98
187
7
[190,5 ; 197,5[
4
0,02
200
1
194
4.3 - Prop. ind. c/ altura inferior a 176,5 = Cumf4 = 62%
P30 (percentil 30) = 169,5 cm.
Repare-se que, como neste
caso 176,5 é extremo da
classe, não é preciso
interpolação
Miguel Soares Lopes
Ficha 1
6
Estatística Descritiva
4.4 Polígono de
frequências
Histograma
4.5 - X =
Fi.Ci2 – n.
n
2
s =
s=
Fi x Ci / n =
2
4 x 152 + 16 x 159 +… + 16 x 187 + 4 x 194
=
200
= 173,7 cm;
4 x 1522 + 16 x 1592 +…+ 16 x 1872 + 4 x 1942 – 200 x 173,72
=
=
200
= 69,097 cm2;
69,09 = 8,3 cm.
4.6 - Para fazer o diagrama de extremos e quartis há que calcular Q1, Q2 (ou
mediana) e Q3.
Q1 = linfi +
0,25 – Cunf(i-1)
x h = 162,5 + 0,25 – 0,08 x 7 =
0,22
fi
= 162,5 + 5,40 = 167,90
Q2 = linfi +
0,5 – Cunf(i-1)
x h = 169,5 + 0,5 – 0,3 x 7 =
0,32
fi
= 169,5 + 4,38 = 173,38
Q3 = linfi +
0,75 – Cunf(i-1)
0,75 – 0,62
x h = 176,5 +
x7=
0,28
fi
= 176,5 + 3,25 = 179,75
Os valores máximo e mínimo (como não temos os dados originais) são os extremos do
intervalo das classes.
A distribuição é
3 (x – Me) 3 x (173,7 – 173,9)
4.7 - GAS =
=
= -0,07
assimétrica negativa
s
8,3
Me = linfi +
0,5 – Cunf(i-1)
0,5 – 0,3
x h = 169,5 +
x 7 = 173,9cm .
fi
0,32
Miguel Soares Lopes
Ficha 1
7
Estatística Descritiva
5 - O conjunto de dados {69, 85, 75, 89, 73, 61, 62, 75, 98, 63} é uma amostra que
representa as classificações percentuais de 10 estudantes num teste de estatística.
Determine:
5.1 - A média, a mediana e a moda desta amostra;
5.2 - O desvio absoluto médio, a variância e o desvio padrão;
5.3 - O coeficiente de variação;
5.4 - O coeficiente de assimetria;
5.5 - O coeficiente de curtose.
Resolução
5-
61
62
63
5.1 - x =
Me =
xi / n =
69
73
75
75
85
89
98
61 + 62 + 63 + 69 + 73 + 75 + 75 + 85 + 89 + 98
= 75%;
10
73 + 75
= 74%;
2
Mo = 75%;
5.2 - DM =
s2 =
| xi – x| |61 - 75| + |62 - 75| + … + |89 - 75| + |98 - 75|
n
=
xi2 – n.x2 =
10
2
2
61 + 62 + … + 892 + 982 – 10 x 752
n
10
= 9,4%;
= 137,4;
s = 137,4 = 11,72%
11,72
5.3 - cv = s x 100% =
x 100% = 15,63%
75
x
5.4 - GAS = 3 (xs – Me) =
ou
3 x (75 – 74)
= 0,256 ;
11,72
(x – Mo) (75 – 75)
=
=0
s
11,72
(Q3 – Q1)
(85 – 63)
5.5 - C1 =
=
= 0,344
2 x (P90 – P10) 2 x (93,5 – 61,5)
G1 =
k = [10 x 0,75] = 7
parte inteira deste produto
Q3 = P75 = x(7+1) = x(8) = 85
Q1 = P25 = x(2+1) = x(3) = 63
P90 =
P10 =
x(9) + x(10)
2
x(1) + x(2)
Miguel Soares Lopes
2
Distribuição muito
ligeiramente
assimétrica positiva
(89 + 98)
= 93,5
2
(61 + 62)
=
= 61,5
2
=
Ficha 1
k = [10 x 0,25] = 2 Ver diapositivos 48
parte inteira deste produto
e 65 da
Apresentação
1
k = 10 x 0,90 = 9
k é inteiro
k = 10 x 0,10 = 1
k é inteiro
8
Estatística Descritiva
6 - Numa série de 31 medições de temperaturas diárias no mês de Março obteve-se
uma média de 20º C e um desvio padrão de 6º C. Depois destes resultados obtidos
chegou-se à conclusão que uma das temperaturas diárias estava enganada, a qual foi
registada com o valor de 32º C. Determine a média e o desvio-padrão, admitindo que se
omite a temperatura incorrecta.
Resolução:
6x(31 dias) =
(31)
xi / n(31) =
x(30 dias) =
(31)
xi / n(30) = (620 – 32) / 30 = 588ºC /30 = 19,6ºC
2
s31
=
xi2 – n.x2=
(31)
xi / 31 = 20ºC ⇔ xi = 31 x 20ºC = 620ºC .
(31)
xi2 – 31 x 202 = 62 ⇔
(31)
n(31)
31
2
2
2
(30) xi =
(31) xi – 32 = 13516 – 1024 = 12492ºC
2
s30
=
(30)
xi2 = 36 x 31 + 12400 = 13516ºC2
xi2 – n.x2= 12492 – 30 x 19,62= 967,2 = 32,24
n(30)
30
30
s = 32,24 = 5,68ºC
7 - A produção por talhão de 10 variedades de ervilhas para congelar foi a seguinte:
21, 18, 30, 12, 14, 17, 28, 10, 16, 25 kg
Cada talhão tinha a mesma área e a mesma densidade de plantas. Determinar:
7.1 - Média, mediana e a moda.
7.2 - Variância, desvio padrão e coeficiente de variação.
Resolução:
7 - Dados ordenados: 10, 12, 14, 16, 17, 18, 21, 25, 28, 30
7.1 - x =
xi / n = 10 + 12 + 14 + 16 + 17 + 18 + 21 + 25 + 28 + 30 = 19,1 kg;
10
17 + 18
Me =
= 17,5 kg;
2
Mo = não tem.
7.2 - s2 =
xi2 – n.x2 102 + 122 + 142 + … + 252 + 282 + 302 – 10 x 19,12
n
=
=
410,9
= 41,09 kg2
10
10
=
s = 6,41 kg
cv =
6,41
x 100% = 33,56%
19,1
Miguel Soares Lopes
Ficha 1
9
Álgebra de Acontecimentos e Probabilidades
Álgebra de Acontecimentos e Probabilidades
1 - Uma caixa contém 5 lâmpadas das quais 2 são defeituosas. As lâmpadas
defeituosas estão numeradas de 1 a 2 e as boas estão numeradas de 3 a 5. Extraem-se 2
lâmpadas ao acaso, sucessivamente sem reposição (experiência I) e com reposição
(experiência II).
1.1 - Enumere os acontecimentos elementares do espaço de resultados
associado a cada uma das experiências.
1.2 - Defina no espaço de resultados de cada experiência, os acontecimentos
adiante indicados:
A1 - “saída de uma lâmpada defeituosa na 1ª tiragem”;
A2 - “saída de uma lâmpada defeituosa na 2ª tiragem”;
A3 - “saída de duas lâmpadas defeituosas”;
A4 - “saída de pelo menos uma lâmpada defeituosa”;
A5 - “saída de exactamente uma lâmpada defeituosa”;
A6 - “saída de uma soma de números inscritos nas lâmpadas inferior a
sete”.
Resolução apenas do problema com reposição:
1 - Experiência realizada com reposição (a resolução do problema sem reposição não
1.1 L2
L1
1
2
3
4
5
1
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
2
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
3
(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
4
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
5
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
1.2 - A1 = {(1,1), (1,2), … , (1,5), (2,1), …, (2,5)}
A2 = {(1,1), (2,1), … , (5,1), (1,2), …, (5,2)}
A3 = A1 A2={(1,1), (1,2), (2,1), (2,2)}
A4 = A1UA2={(1,1), (1,2),…,(1,5),(2,1),…,(2,5),(3,1),…,(5,1), (3,2),…, (5,2)}
A5 = (A1UA2)\(A1 A2)={(1,3),…,(1,5),(2,3),…,(2,5),(3,1),…,(5,1),(3,2),…,(5,2)}
A6 = A4\{(2,5),(5,2)}={(1,1),(1,2),…,(1,5),(2,1),…,(2,4),(3,1), … , (3,3),
(4,1), (4,2), (5,1)}
Miguel Soares Lopes
Ficha 2
10
Álgebra de Acontecimentos e Probabilidades
2 - As peças que saem de uma linha de produção são marcadas defeituosas (D) ou não
defeituosas (N). As peças vão sendo inspeccionadas e registadas, procedendo-se a uma
paragem quando se obtenham duas peças defeituosas consecutivas ou quando se tenham
registado quatro peças.
Descreva o espaço de resultados desta experiência.
Resolução:
2 - Podemos facilitar esta tarefa construindo um esquema em árvore:
DD
DNDD
DNDN
DNND
DNNN
NDD
NDND
NDNN
NNDD
NNDN
NNND
NNNN
3 - Considere a experiência aleatória que consiste no lançamento de dois dados
perfeitos, um vermelho e outro verde.
3.1 - Defina o espaço de resultados desta experiência enumerando os
acontecimentos elementares que o compõem;
3.2 - Defina no espaço de resultados os seguintes acontecimentos:
A - “a soma dos resultados é sete”;
B - “os resultados observados são ímpares”;
C - “o produto dos resultados é 12”.
3-
Resolução
3.1 -
Verm
Verd
Miguel Soares Lopes
1
2
3
4
5
6
1
(1,1)
(2,1)
(3,1)
(4,1)
(5,1)
(6,1)
2
(1,2)
(2,2)
(3,2)
(4,2)
(5,2)
(6,2)
3
(1,3)
(2,3)
(3,3)
(4,3)
(5,3)
(6,3)
4
(1,4)
(2,4)
(3,4)
(4,4)
(5,4)
(6,4)
5
(1,5)
(2,5)
(3,5)
(4,5)
(5,5)
(6,5)
6
(1,6)
(2,6)
(3,6)
(4,6)
(5,6)
(6,6)
Ficha 2
11
Álgebra de Acontecimentos e Probabilidades
3.2 - A = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)}
B = {(1,1), (3,1), (5,1), (1,3), (3,3), (5,3), (1,5), (3,5), (5,5)}
C = {(2,6), (6,2), (3,4), (4,3)}
4 - Quantos são os códigos de 4 algarismos diferentes que se podem formar com os
algarismos “1”, “2”, “3” e “4” e em que:
4.1 - apareça o grupo “42” (isto é, o “4” apareça sempre imediatamente antes do
“2”)?
4.2 - o “1” apareça junto do 3 em qualquer ordem, (isto é, imediatamente antes
ou depois do “3”)?
Resolução:
4-
A posição do “4” só pode
4.1 - ser nas 3 primeiras casas
para que o “2” possa estar
após o “4”
4
2
4
Podemos ter 6 códigos;
4.2 A posição do “3”
relativamente ao”1” pode
ser antes ou depois dele.
1
3
3
1
1
3
Podemos ter 12 códigos
2
4
3
1
1
3
2
3
1
Para cada “42” podem ter-se duas combinações:
1,3 e 3,1.
Logo 3 x 2 = 6
Para cada “13” ou “31”
podem ter-se duas
combinações:
2,4 e 4,2.
Logo 6 x 2 = 12
5 - Sejam A1 e A2 dois acontecimentos, tais que:
A1 - “realiza-se quando um automobilista, escolhido ao acaso numa bomba de
gasolina, verifica o ar dos pneus”;
A2 - “realiza-se quando um automobilista, escolhido ao acaso numa bomba de
gasolina, verifica o óleo do motor”.
5.1 - Exprima em função deles os seguintes acontecimentos:
A - “realiza-se quando um automobilista não verifica o ar dos pneus”;
B - “realiza-se quando um automobilista verifica o ar dos pneus ou o óleo do
motor”;
C - “realiza-se quando um automobilista não verifica o ar dos pneus nem o
óleo do motor”;
D - “realiza-se quando um automobilista não verifica o ar dos pneus ou
verifica o óleo do motor”;
E - “realiza-se quando um automobilista verifica o ar dos pneus e não verifica
o óleo do motor”;
Miguel Soares Lopes
Ficha 2
12
Álgebra de Acontecimentos e Probabilidades
F - “realiza-se quando um automobilista verifica o óleo do motor e não verifica
o ar dos pneus”;
G - “realiza-se quando um automobilista verifica uma e uma só das duas”.
5.2 - Os acontecimentos E e F são incompatíveis?
5.3 - Exprima o acontecimento G em função de E e F.
Resolução:
55.1 -
5.2 - S
A = A1
E = A1-A2
B = A1UA2
F = A2-A1
C = (A1UA2)
G = (A1UA2)-(A1 A2)
D = (A1-A2)
im, E e F são incompatíveis pois não se interceptam.
5.3 - G = EUF
6 - Considere o seguinte espaço amostral:
S={1,2,3,4,5,6,7}
e os acontecimentos: A = { 1 , 2 , 7 }
B={2,3,4}
C={6}
Determine:
6.1 6.2 6.3 6.4 6.5 6.6 -
A;
(AUC)
(A B) UC
B C
A B C
(AUB) (A C)
Resolução:
6-
6.1 6.2 6.3 6.4 6.5 6.6 -
A = {3, 4, 5, 6};
(AUC) = {1, 2, 6, 7};
(A B) U C = {1, 2, 3, 4, 5, 7};
B C = {1, 5, 7};
A B C = { };
(AUB) (A C) = {6};
7 - Considere um dado desequilibrado em que o “5” e o “6” ocorrem o dobro das vezes
do “4” que, por sua vez, ocorre o triplo das vezes do “1”, do “2” ou do “3”. Se se lançar
o dado uma vez, qual a probabilidade do resultado obtido ser:
Miguel Soares Lopes
Ficha 2
13
Álgebra de Acontecimentos e Probabilidades
7.1 - um número par;
7.2 - um número maior que 3;
7.3 - um quadrado perfeito.
Resolução:
7-
P(5) = P(6) = 2 x P(4)
P(4) = 3 x P(1) = 3 x P(2) = 3 x P(3)
P(1) = P(2) = P(3)
Como P(1) + P(2) + P(3) + P(4) + P(5) + P(6) = 1 podemos escrever que
P(1) + P(1) + P(1) + 3 x P(1) + 2 x 3 x P(1) + 2 x 3 x P(1) = 1 ⇔ 18 x P(1) = 1 ⇔
⇔P(1) = 1/18
P(1)
1/18
P(2)
1/18
P(3)
1/18
P(4)
3/18
P(5)
6/18
P(6)
6/18
7.1 - P(sair par) = P(2) + P(4) + P(6) = 10/18 = 5/9;
7.2 - P(sair maior que 3) = P(4) + P(5) + P(6) = 15/18 = 5/6;
7.3 - P(sair um quadrado perfeito) = P(1) + P(4) = 4/18 =2/9
8 - Num lago existem 10 caracóis aquáticos da espécie X, 15 da espécie Y e 50 da
espécie Z. Os caracóis foram capturados um de cada vez para inspecção.
8.1 - Se depois da inspecção cada caracol for devolvido ao lago, calcular a
probabilidade de, em 2 capturas sucessivas:
8.1.1 - os 2 caracóis serem da espécie X.
8.1.2 - um caracol ser da espécie X e outro da espécie Z.
8.2 - Se o caracol não for devolvido ao lago depois da captura, calcular a
probabilidade de, em 2 capturas sucessivas:
8.2.1 - os 2 caracóis serem da espécie X.
8.2.2 - um caracol ser da espécie X e outro da espécie Z.
8.3 - Qual a probabilidade de, numa captura, obter um caracol da espécie X ou Y?
Resolução:
8-
P(X) = 10/75;
P(Y) = 15/75;
P(Z) = 50/75.
8.1 - Com devolução:
8.1.1 - P(X, X) = 10/75 x 10/75 = 100/5625
8.1.2 - P(1 da espécie X e outro da espécie Z) = P(X, Z) + P(Z, X) =
= 10/75 x 50/75 + 50/75 x 10/75 = 1000/5625
8.2 - Sem devolução
Miguel Soares Lopes
Ficha 2
14
Álgebra de Acontecimentos e Probabilidades
8.2.1 - P(X, X) = 10/75 x 9/74 = 90/5550
8.2.2 - P(1 da espécie X e outro da espécie Z) = P(X, Z) + P(Z, X) =
= 10/75 x 50/74 + 50/75 x 10/74 = 1000/5550
8.3 - P(XUY) = P(X) + P(Y) = 10/75 + 15/75 = 1/3
9 - Um gerente de um restaurante admite que todos os clientes terão, no fim da
refeição, ou fruta, ou queijo, ou ainda café, ou qualquer combinação e que a
probabilidade de terem fruta é de 0,7 , fruta e queijo 0,25 , queijo e café 0,35 e fruta e
café 0,5. Sabe também que a probabilidade de terem fruta ou queijo é 0,9 e de terem
fruta ou café é de 0,95. Calcular a proporção de clientes que terão:
9.1 - queijo ou café;
9.2 - fruta, queijo e café;
9.3 - apenas café.
9P(F)
0,7
P(F Q) P(Q C) P(F C) P(FUQ) P(FUC)
0,25
0,35
0,5
0,9
0,95
Sabe-se também que:
P(FUCUQ) = P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C) + P(F Q C) = 1
9.1 - P(FUQ) = P(F) + P(Q) – P(F Q) = 0,9 ⇔
⇔ P(Q) = 0,9 – P(F) + P(F Q) ⇔ P(Q) = 0,9 – 0,7 + 0,25 = 0,45
P(FUC) = P(F) + P(C) – P(F C) = 0,95 ⇔
⇔ P(C) = 0,95 – P(F) + P(F C) ⇔ P(Q) = 0,95 – 0,7 + 0,5 = 0,75
P(QUC) = P(Q) + P(C) – P(Q C) = 0,45 + 0,75 – 0,35 = 0,85;
9.2 - P(FUCUQ) = P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C) + P(F Q C) = 1 ⇔
⇔ P(F Q C) = 1 – [P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C)] ⇔
⇔ P(F Q C) = 1 – [0,7 + 0,45 + 0,75 – 0,25 – 0,35 – 0,5] = 0,20
9.3 - P(apenas café) = P(C) – P(Q C) – P(F C) + F Q C) =
= 0,75 – 0,35 – 0,5 + 0,20 = 0,1
10 -Sejam A e B dois acontecimentos independentes tais que P(A)=0,4 e P(B-A)=0,18.
10.1 - Represente os acontecimentos através de um diagrama de Venn.
10.2 - Determine P(B).
Resolução:
10 -
10.1 -
Miguel Soares Lopes
Ficha 2
15
Álgebra de Acontecimentos e Probabilidades
10.2 - P(AUB) = P(A) + P(B-A) = 0,4 + 0,18 = 058
P(AUB) = P(A) + P(B) – P(A B) = 058 ⇔
⇔ 0,4 + P(B) – 0,4 x P(B) = 058 ⇔
⇔ P(B) x (1 – 0,4) = 0,58 – 0,4 ⇔
⇔ P(B) = 0,18 / 0,6 = 0,3
11 -Sejam A, B e C três subconjuntos de Ω, tal que A e B são independentes e A e C são
incompatíveis. Seja P(A) = 0,2 , P(B) = 0,4 e P(C) = 0,45.
11.1 - Represente através de um diagrama de Venn o espaço de resultados Ω
Sabendo que P(B C) = 0,1, calcule a probabilidade de um elemento de Ω escolhido ao
acaso:
11.2 - pertencer a pelo menos um dos subconjuntos;
11.3 - pertencer exclusivamente a B;
11.4 - pertencer a A sabendo que pertence a B;
11.5 - pertencer a C sabendo que pertence a B.
11 -
Resolução:
11.1 -
Não esquecer que A e B são
independentes e portanto
P(AB)=P(A) x P(B)
11.2 - P(AUBUC) = P(A) + P(B) + P(C) – P(AB) – P(BC) =
= 0,2 + 0 4 + 0,45 – 0,2 x 0,4 – 0,1 = 0,87
11.3 - P(pert. exclusi. a B) = P(B) – P(AB) – P(BC) = 0,4 – 0,08 – 0,1 = 0,22
Como se pode ver P(A|B) = P(A).
11.4 - P(A|B) = P(AB)/P(B) = 0,08/0,4 = 0,2 = P(A)
Como se sabia A e B são
11.5 - P(C|B) = P(CB)/P(B) = 0,1/0,4 = 0,25
independentes.
12 -Num colégio com 100 alunos, 42 estudam Matemática, 68 Psicologia, 54 História,
22 simultaneamente Matemática e História, 25 simultaneamente Matemática e
Psicologia, 7 História mas nem Matemática nem Psicologia, 10 estudam as três
disciplinas. Escolheu-se um aluno ao acaso:
12.1 - qual é a probabilidade desse aluno estudar Matemática ou História?
12.2 - se esse aluno estudar Psicologia, qual é a probabilidade de estudar as
outras duas disciplinas?
Miguel Soares Lopes
Ficha 2
16
Álgebra de Acontecimentos e Probabilidades
12.3 - se esse aluno não estudar Psicologia, qual é a probabilidade de estudar as
outras duas disciplinas?
12.4 - se esse aluno estudar Matemática, qual é a probabilidade de também
estudar as outras duas disciplinas?
12.5 - qual é a probabilidade desse aluno estudar Matemática e também as outras
duas disciplinas?
12.6 - se esse aluno estudar História, qual é a probabilidade de estudar
Matemática mas não estudar Psicologia?
Resolução:
12 -A construção do diagrama de Venn é, nestes casos, muito útil. Para isso devem ser
representados os conjuntos definidos no enunciado com as respectivas intercepções
(caso seja dito que há incompatibilidade entre dois deles, essa intercepção não é
representada). Cada uma das regiões definidas corresponde a um grupo muito concreto.
Por exemplo, a região correspondente à intercepção das três disciplinas quer dizer que
os alunos em questão têm as três disciplinas e no enunciado é dito que são “10”. É
também referido que 22 alunos estudam simultaneamente Matemática e História: ora já
é sabido que 10 alunos estudam Matemática e História (mas estudam também
Psicologia) mas há, pelos vistos, mais 12 que só estudam aquelas duas disciplinas. Há
25 alunos que estudam simultaneamente Matemática e Psicologia. De novo, é sabido
que 10 alunos estudam Matemática e Psicologia (mas estudam também História) mas
há, pelos vistos, mais 15 que só estudam aquelas duas disciplinas.
É este o tipo de raciocínio que tem que ser feito para se chegar a construção do
diagrama de Venn que vem a seguir.
12.1 - P(MUH) = (5 + 15 + 12+ 10 + 7 + 25)/100 = 74/100;
12.2 - P(MH|P) = P(MHP)/P(P) = (10/100)/(54/100) = 10/54;
12.3 - P(MH|P) = P(MHP)/P(P) = (12/100)/(32/100) 12/32
12.4 - P(PH|M) = P(PHM)/P(M) = (10/100)/(42/100) = 10/42;
12.5 - P(MHP) = 10/100
12.6 - P(MP|H) = P(MPH)/P(H) = (12/100)/(54/100) = 12/54
13 -Considere a experiência que consiste em lançar, dois dados e registar o número
saído em cada um deles.
13.1 - Se um dos dados mostrar "6",
13.1.1 - Qual é a probabilidade do outro mostrar "5"?
Miguel Soares Lopes
Ficha 2
17
Álgebra de Acontecimentos e Probabilidades
13.1.2 - Qual é a probabilidade da soma dos números saídos em ambos
ser menor do que 9?
13.2 - Se a soma dos números saídos for 9, qual a probabilidade de um dos dados
mostrar “4”?
13 -
Resolução:
13.1 - Subconjunto dos pares em que num dos dados há um “6”:
= {(1,6), (2,6), (3,6), (4,6), (5,6), (6,6), (6,1), (6,2), (6,3), (6,4), (6,5)}
13.1.1 - P(um dado ter 5 | outro dado tem 6) = 2/11
13.1.2 - P(soma < 9 | um dado tem 6) = 4/11
13.2 - P(um dado ter 4 | soma dos dados é 9) = 2/4 = 1/2
6
Miguel Soares Lopes
Ficha 2
18
Álgebra de Acontecimentos e Probabilidades
Probabilidades Condicionadas.
Teoremas de Bayes e da Probabilidade Total
14 -Uma loja de brinquedos emprega 3 senhoras para fazerem embrulhos durante a
época de Natal. Raquel embrulha 30% dos presentes e esquece-se de tirar o preço 3%
das vezes; Helena embrulha 20% dos presentes e esquece-se de tirar o preço 8% das
vezes; Joana, que embrulha os restantes presentes, esquece-se 5% das vezes de tirar o
preço. Suponha que tinha ido a essa loja verificando, em casa, que o seu presente tinha
preço.
14.1 - Calcule a probabilidade de ter sido embrulhado pela Joana.
14.2 - Qual a empregada que mais provavelmente o terá embrulhado?
Resolução:
14 -
P(R) = 0,30;
P(P|R) = 0,03;
P(H) = 0,20;
P(J) = 1 – (0,30 + 0,20) = 0,50;
P(P|H) = 0,08; P(P|J) = 0,05.
14.1 - P(J|P) = [P(P|J) x P(J)] / P(P) = [0,05 x 0,50] / 0,05 = 0,50
P(P) = P(R) x P(P|R) + P(H) x P(P|H) + P(J) x P(P|J) =
= 0,30 x 0,03 + 0,20 x 0,08 +0,50 x 0,05 = 0,05
14.2 - Faz-se o mesmo tipo de cálculo para a Raquel e para a Helena e obtém-se:
P(R|P) = 0,32; P(H|P) = 0,18. Como para a Joana tínhamos P(J|P) = 0,50,
logo é a Joana.
15 - Um agricultor produz sementes de uma leguminosa em 3 campos distintos A, B
e C; em A produz 12% das sementes, em B 30% e as restantes em C. Para que possam
ser homologadas para comercialização não podem apresentar mais que uma
determinada percentagem de impurezas e de sementes de infestantes. Sabe-se por
amostragem que 2% dos sacos de sementes provenientes de A, 3% dos provenientes de
B e 5% dos provenientes de C são rejeitados.
15.1 - Qual a probabilidade de um saco escolhido ao acaso ser recusado.
15.2 - Se posteriormente se retirar um saco e se verificar que é para recusar
determine a probabilidade de ser proveniente do campo B.
Resolução:
15 P(A) = 0,12;
P(R|A) = 0,02;
P(B) = 0,30;
P(C) = 1– (0,12 + 0,30) = 0,58
P(R|B) = 0,03;
P(R|C) = 0,05
15.1 - P(R) = P(A) x P(R|A) + P(B) x P(R|B) + P(C) x P(R|C) =
= 0,12 x 0,02 + 0,30 x 0,03 + 0,58 x 0,05 = 0,0404;
15.2 - P(B|R) = [P(R|B) x P(B)] / P(R) = [0,03 x 0,30] / 0,0404 = 0,223
Miguel Soares Lopes
Ficha 2
19
Álgebra de Acontecimentos e Probabilidades
16 -Um comerciante recebe ovos de 3 proveniências: A, B e C, segundo as seguintes
percentagens:
A – 10%,
B – x %,
C – y %.
16.1 - A percentagem de ovos estragados varia segundo as proveniências e sabe-
-se que, dos ovos provenientes de A, 5% são estragados; dos ovos provenientes de
B, 10% são estragados; dos ovos provenientes de C, 15% são estragados.
16.2 - Por outro lado sabe-se que 12% do total dos ovos recebidos pelo
comerciante são estragados. Calcular x e y.
Resolução:
16 P(A) = 0,10;
P(E|A) = 0,05;
P(B) = x;
P(C) = y ;
P(E|B) = 0,10;
P(E|C) = 0,15 ;
P(E) = 0,12 .
Como temos 2 incógnitas vamos resolver por um sistema. Quais são as equações
do sistema? Uma, é a expressão de cálculo da probabilidade total de
“estragados”, a outra é a soma das percentagens de ovos por proveniência que
terá de somar 100%.
P(E) = P(A) x P(E|A) + P(B) x P(E|B) + P(C) x P(E|C) = 0,12
⇔
P(A) + P(B) + P(C) = 1
{
0,10 x 0,05 + x x 0,10 + y x 0,15 = 0,12 0,005 + 0,10 x (0,90 – y) + 0,15y = 0,12
⇔
⇔{
⇔
⇔{
0,10 + x + y = 1
x = 0,90 – y
{
{
{
⇔ -0,10y + 0,15y = 0,025⇔ 0,05y = 0,025⇔ y = 0,5
—
—
x = 0,90 – 0,5 = 0,4
P(B) = 0,4 e P(C) = 0,5.
17 -A e B são fornecedores de um artigo a uma empresa transformadora que o
armazena num contentor. Sabe-se que 5% dos artigos de A e 9% dos artigos de B são
defeituosos, razão pela qual A fornece à referida empresa transformadora o quádruplo
de B.
Foi escolhido ao acaso um dos artigos do contentor e verificou-se que não é defeituoso.
Qual é a probabilidade de ter sido fornecido por A?
Resolução:
17 -
P(D|A) = 0,05
e P(D|B) = 0,09; logo P(D|A) = 0,95 e P(D|B) = 0,91 .
P(A) = 4 x P(B);
P(A) + P(B) = 1 ⇔ 4 x P(B) + P(B) = 1 ⇔ 5 P(B) = 1 ⇔ P(B) = 1/5 e P(A) = 4/5
P(A|D) = [P(D|A) x P(A)] / P(D) ⇔ 0,95 x 0,8 / 0,942 = 0,807
P(D) = P(A) x P(D|A) + P(B) x P(D|B) = 4/5 x 0,05 + 1/5 x 0,09 = 0,058 logo
P(D) = 1 – 0,058 = 0,942
Miguel Soares Lopes
Ficha 2
20
Álgebra de Acontecimentos e Probabilidades
18 -Há um saco preto que contém 9 bolas coloridas, sendo 1 bola branca, 1 amarela, 1
azul, 2 verdes, 2 vermelhas e 2 castanhas. Retiraram-se 3 bolas sucessivamente do saco
e registou-se a cor de cada uma. Determine:
18.1 - a probabilidade de, pelo menos, uma das 3 bolas ser vermelha, sabendo
que a experiência foi realizada com reposição.
18.2 - a probabilidade de, exactamente, uma das 3 bolas ser vermelha sabendo
que a experiência foi realizada sem reposição.
Resolução:
18 -
18.1 - P(pelo menos uma V) = 1 – P(nenhuma V) = 1 – P(NNN) = 1 – (7/9)3 =
= 1 – 0,471 = 0,529
18.2 - P(exactamente uma ser V) = P(VNN) + P(NVN) + P(NNV) = 3 x P(VNN) =
= 3 x 2/9 x 7/8 x 6/7 = 0,5 estas 3 probabilidades têm o mesmo valor
19 -Uma empresa recebe diariamente leite de 3 distritos diferentes. Ao chegar cada
entrega o produto é classificado de acordo com a qualidade em regular (R), bom (B) e
extra (E). Determinar a origem mais provável de um lote recentemente entregue
sabendo que é de qualidade extra e que as classificações até à data são:
Distritos
1
2
3
Total
entregue (l)
1 000 000
3 000 000
2 500 000
Quantidade (l)
R
B
E
200 000
500 000
300 000
500 000 2 000 000 500 000
600 000 1 500 000 400 000
Resolução:
19 -P(1|E) = 300 000 / 1 200 000 = 3/12;
P(2|E) = 500 000 / 1 200 000 = 5/12;
P(3|E) = 400 000 / 1 200 000 = 4/12.
A origem mais provável do lote é o distrito 2.
20 -Numa sala estão três caixas iguais, numeradas de 1 a 3 e contendo bolas coloridas
conforme se mostra na tabela:
Caixa
1
2
3
Nº bolas Nº bolas
vermelhas brancas
2
3
4
1
3
4
Nº bolas
azuis
5
3
3
De uma caixa seleccionada aleatoriamente extraiu-se uma bola e verificou-se que era
vermelha. Qual a probabilidade de ter sido retirada da caixa 3?
Resolução:
20 -P(3|V) = P(V|3) x P(3) = 3/10 x 1/3 = 3/10
P(V)
1/3
Miguel Soares Lopes
Ficha 2
21
Álgebra de Acontecimentos e Probabilidades
P(V|3) = 3/10
P(3) = 1/3
P(V) = P(V|1) x P(1) + P(V|2) x P(2) + P(V|3) x P(3) =
= 2/10 x 1/3 + 4/8 x 1/3 +3/10 x 1/3 = 1/3
Aqui, P(V) deve ser calculado através do teorema das probabilidades totais
porque existem três “probabilidades de ser vermelha”, uma em cada subconjunto. Assim
a P(V) total terá que ser calculada assim.
Miguel Soares Lopes
Ficha 2
22
Variáveis Aleatórias Unidimensionais
Variáveis Aleatórias Unidimensionais
1 - Considere as variáveis aleatórias seguintes. Indique quais são as variáveis
aleatórias discretas e contínuas justificando a resposta.
1.1 1.2 1.3 1.4 1.5 -
M = idade de uma estrela escolhida ao acaso.
N = número de estrelas que se podem observar, à noite, a olho nu.
O = número de avarias de uma máquina num intervalo de tempo.
P = tempo entre avarias consecutivas de uma máquina.
Q = classificação média obtida pelos alunos do 12º ano, no exame
nacional de Matemática de um determinado ano lectivo.
1.6 - R = número de alunos do 12º ano com classificação negativa, no exame
nacional de Matemática de um determinado ano lectivo.
1.7 - S = número de cabelos de uma mulher.
1.8 - T = duração de uma partida de futebol.
1.9 - U = número de interrupções numa partida de futebol.
1.10 - V = quantidade de comida (em kg) ingerida, por dia, por um adulto.
1.11 - W = número de espectadores numa partida de futebol disputada num
estádio com lotação de 50 000 pessoas.
1.12 - X = produção diária de leite numa fábrica de lacticínios.
1.13 - Y = produção diária de uma fábrica de parafusos.
1.14 - Z = produção diária de calças de uma fábrica de confecções.
Resolução:
1 - Indicar o tipo de variável:
Variáveis discretas: 1.2; 1.3; 1.6; 1.7; 1.9; 1.11; 1.13; e 1.14;
Variáveis contínuas: 1.1, 1.4; 1.5; 1.8; 1.10 e 1.12.
2 - Uma célula por multiplicação origina, no máximo, 4 células filhas. A probabilidade
de formação de x células filhas é dada por:
X
1
2
3
4
f (x)
1/4
3/8
1/8
1/4
2.1 - Verificar que f(x) é uma função de probabilidade. Traçar o gráfico de f(x).
2.2 - Determinar a função de distribuição F(x) e traçar o respectivo gráfico.
2.3 - Calcular a probabilidade de formação de pelo menos 2 células filhas.
2-
Resolução:
2.1 - f(x) ≥ 0, ∀x ∈{1, 2, 3, 4}
e 1/4 + 3/8 + 1/8 + 1/4 =1
Miguel Soares Lopes
Ficha 3
23
Variáveis Aleatórias Unidimensionais
0 , x <1
1/ 4 , 1 ≤ x < 2
2.2 - F ( x) = 5 / 8 , 2 ≤ x < 3
6/8, 3≤ x < 4
1, x ≥ 4
2.3 - P(X≥2) = 1/4 + 3/8 + 1/8 =3/4 ou
P(X≥2) = 1 – F(1)=1 – 1/4=3/4
3 - O número de lançamentos num ramo é uma variável aleatória X, que toma os
valores x, com probabilidade p(x) = k x , x = 1, 2,..., 10.
3.1 - Calcular k de modo que p(x) seja uma função de probabilidade.
3.2 - Calcular a probabilidade de um ramo ter 2 lançamentos.
3.3 - Calcular o número médio de lançamentos por ramo.
3-
Resolução:
x
p(x)
1
k
2
2k
3
3k
4
4k
5
5k
6
6k
7
7k
8
8k
9
9k
10
10k
3.1 - k + 2k + 3k + … + 9k + 10k = 1 ⇔ 55k = 1 ⇔ k = 1/55
3.2 - P(X=2) = p(2) = 2/55
3.3 - µ = 1 x 1/55 + 2 x 2/55 + … + 9 x 9/55 + 10 x 10/55 = 385/55 = 7 lançamentos por ramo.
4 - Sendo X uma variável aleatória com função de probabilidade:
x
0
1
2
3
4
5
6
7
f(x)
0,1
0,1
0,1
0,1
0,2
0,2
0,1
0,1
4.1 - Determinar a função de distribuição de X.
4.2 - Calcular P(X > 2), P(X < 4), P(X ≥ 1X ≤ 4).
4.3 - Calcular µ e σ.
4-
Resolução:
0, x<0
0,1 , 0 ≤ x < 1
0,2 , 1 ≤ x < 2
4.1 -
0,3 , 2 ≤ x < 3
F ( x) = 0,4 , 3 ≤ x < 4
0,6 , 4 ≤ x < 5
0,8 , 5 ≤ x < 6
0,9 , 6 ≤ x < 7
1,0 , x ≥ 7
Miguel Soares Lopes
Ficha 3
24
Variáveis Aleatórias Unidimensionais
4.2 - P(X > 2) = 0,7
P(X < 4) = 0,4
P(X ≥ 1X ≤ 4) =
P(1≤X ≤ 4) 0,5 5
=
=
0,6 6
P(X ≤ 4)
4.3 - µ = Σ x x f(x) = 0 x 0,1 + 1 x 0,1 + … + 6 x 0,1 + 7 x 0,1 = 3,7
σ2 = Σ x2 x f(x) – µ2 = 02 x 0,1 + 12 x 0,1 + … + 62 x 0,1 + 72 x 0,1 – 3,72 =
= 18,1 – 13,69 = 4,41
σ = 4,41 = 2,1
5 - Numa experiência com um inibidor de apetite, o número de refeições, N, que um
rato toma por dia é anotado. Em cada dia são fornecidas 2 refeições.
4 1
7 2
e a variância do número de refeições comidas por dia.
n
Tendo N uma função de probabilidade P ( N = n) =
, n = 0, 1, 2 , calcular a média
Resolução:
5 - Temos que calcular primeiro a função de probabilidade:
N
P(N=n)
0
4/7
1
2/7
2
1/7
µ = Σ x x P(N) = 0 x 4/7 + 1 x 2/7 + 2 x 1/7 = 4/7
σ2 = Σ x2 x P(N) – µ2 = 02 x 4/7 + 12 x 2/7 + 22 x 1/7 – (4/7)2 = 0,53
6 - Sendo X uma variável aleatória discreta com função de distribuição:
0
1
8
3
8
F (x)=
5
8
6
8
1
, x < -4
, - 4 ≤ x < -2
, -2≤ x <0
,
0≤ x <2
,
2≤ x <4
Determinar a função de probabilidade f(x), µ e σ2 .
, x≥4
Resolução:
6 - Para resolver este problema precisamos de definir a função de probabilidade f(x).
O raciocínio que deve ser feito será um raciocínio contrário àquele que se faz
quando, a partir da função de probabilidade, se pede a função de distribuição, F(x). Se
analisarmos a função F(x) percebemos que, até ao ponto “-4” (exclusive), isto é, para
“x<-4”, a probabilidade acumulada é “0”. Já a partir deste ponto, isto é, de “x=-4” e
até ao ponto “x=-2” (exclusive), isto é, no intervalo “x≤-4”, a probabilidade acumulada
é “1/8”. Ora isto só é possível se no ponto “x=-4” a probabilidade for “1/8” e daí até
Miguel Soares Lopes
Ficha 3
25
Variáveis Aleatórias Unidimensionais
“x=-2” (exclusive) não houver nenhum ponto de probabilidade diferente de “0”.
No ponto “x=-2” a probabilidade acumulada passa para “3/8”; ora isso só é
possível se, nesse ponto, houver um acréscimo de probabilidade de “2/8”. Repare-se que
essa probabilidade acumulada se mantém até “x=0” (exclusive), o que significa que,
desde o ponto “x=-2” até “x=0” (exclusive), não houve nenhum ponto com
probabilidade diferente de “0”.
Este raciocínio terá que ser feito para todos os outros pontos apresentados na F(x).
A função de probabilidade f(x) vem então:
x
-4
-2
0
2
4
f(x)
1/8
2/8
2/8
1/8
2/8
Podemos agora calcular µ e σ2.
µ = Σ x x f(x) = -4 x 1/8 – 2 x 2/8 + 0 x 2/8 + 2 x 1/8 + 4 x 2/8 = 1/4
σ2 = Σ x2 x f(x) – µ2 = -42 x 1/8 + (-2)2 x 2/8 + 02 x 2/8 + 22 x 1/8 + 42 x 2/8 – (1/4)2 =
= 7,44
7 - Um dado produto pode ser classificado, consoante a sua qualidade, em 5 classes
distintas: 1, 2, 3, 4 e 5. Sendo X a classe atribuída ao produto, com função de
probabilidade
x
1
2
3
4
5
f(x)
k
2k
4k
2k
k
7.1 - Determinar k.
7.2 - Qual a probabilidade de que um produto tomado ao acaso, tenha uma
classificação menor do que 4 e superior a 1?
7.3 - Calcular “1 – F(2)” e indicar o seu significado.
7-
Resolução:
7.1 - K + 2k + 4k + 2k + k = 1 ⇔ 10k = 1 ⇔ k = 0,1
7.2 - P(1<X<4) = P(X=2) + P(X=3) = 0,2 + 0,4 = 0,6
7.3 - 1 – F(2) = 1 – [P(X=1) + P(X=2)] = 1 – 0,3 = 0,7 e significa a probabilidade de, escolhendo ao acaso, obter um produto com qualidade superior a 2.
8 - Sendo X uma variável aleatória discreta cuja distribuição de probabilidade é a
seguinte:
x
0
1
2
3
4
5
P(X= x)
0,100
0,300
0,400
0,100
0,050
0,050
8.1 - Representar graficamente a respectiva função de distribuição.
8.2 - Calcular P(X < 4,5), P(X ≥ 2), P(X ≥ 2X ≤ 4) e P(2<X<4,5).
Miguel Soares Lopes
Ficha 3
26
Variáveis Aleatórias Unidimensionais
8-
Resolução:
0,x <0
0,1 , 0 ≤ x < 1
0,4 , 1 ≤ x < 2
8.1 - F( x ) = 0,8 , 2 ≤ x < 3
0,9 , 3 ≤ x < 4
0,95 , 4 ≤ x < 5
1,0 , x ≥ 5
8.2 - P(X < 4,5) = F(4,5) = 0,95;
P(X ≥ 2) = 0,6;
P(X ≥ 2X ≤ 4) =
P(2≤X ≤ 4) F(4) – F(1) 0,95 – 0,4
=
=
= 0,579;
P(X ≤ 4)
F(4)
0,95
P(2<X<4,5) = F(4,5) – F(3) = 0,95 – 0,8 = 0,15.
9 - Considere a selecção aleatória de 4 cartas de um baralho de 10 cartas, com 3 copas,
2 ouros e 5 paus. Seja X a variável aleatória que representa o número de copas
seleccionadas consecutivamente. Determine:
9.1 - A função de probabilidade de X.
9.2 - A função de distribuição acumulada de X.
9.3 - A média e a variância de X.
Resolução:
9 - Se se retirarem sucessivamente 4 cartas dum baralho de 10 cartas, onde existem
apenas “3 cartas de copas (C)” é óbvio que só se podem obter, no máximo 3 cartas de
copas sendo as outras não-copas (N). Percebemos assim que a nossa variável X só pode
assumir os valores 0, 1, 2, 3 e 4.
9.1 - Para se determinar a função de probabilidade tem que se calcular a
probabilidade da variável em estudo, X, assumir os valores possíveis (0, 1, 2, 3 e 4).
Assim:
P(X=0) = P(NNNN) = 7/10 x 6/9 x 5/8 x 4/7 = 1/6;
P(X=1) = P(CNNN) + P(NCNN) + P(NNCN) + P(NNNC) = 4 x P(NNNC) =
= 4 x 7/10 x 6/9 x 5/8 x 3/7 = 1/2;
P(X=2) = P(CCNN) + P(CNCN) + P(CNNC) + P(NCCN) + P(NCNC) + P(NNCC) =
= 6 x P(CCNN) = 6 x 3/10 x 2/9 x 7/8 x 6/7 = 3/10;
P(X=3) = P(CCCN) + P(CCNC) + P(CNCC) + P(NCCC) = 4 x P(CCCN) =
= 4 x 3/10 x 2/9 x 1/8 x 7/7 = 1/30.
x
f(x)
Miguel Soares Lopes
0
1/6
1
1/2
Ficha 3
2
3/10
3
1/30
27
Variáveis Aleatórias Unidimensionais
9.2 -
0, x<0
1/ 6 , 0 ≤ x < 1
F ( x) = 4 / 6 , 1 ≤ x < 2
29 / 30 , 2 ≤ x < 3
1, x ≥ 3
9.3 - Σ x x f(x) = 0 x 1/6 + 1 x 1/2 + 2 x 3/10 + 3 x 1/30 = 6/5
σ2 = Σ x2 x f(x) – µ2 = 02 x 1/6 + 12 x 1/2 + 22 x 3/10 + 32 x 1/30 – (6/5)2 = 0,56
4 2
x
10 -Dada a função f x = 3
0
0 ≤ x ≤1
outros valores de x
10.1 - Mostre f(x) se trata de uma função densidade de probabilidade (fdp).
10.2 - Determine a função de distribuição F(x) e calcule P(X ≤ 0,5).
10 -
Resolução:
10.1 - Para mostrar que é uma fdp temos que provar que
+∞
f ( x)dx = 1 . Fazer o gráfico para ver que f.(x)
f.(x)≥0 e que
−∞
está sempre “acima” do eixo do x:
O integral
+∞
−∞
f ( x)dx corresponde à área delimitada pelo
eixo do x e a função f.(x) (linha vermelha). Vamos verificar se
dá 1.
+∞
−∞
4
f ( x)dx = 0dx + ( − x 2 )dx +
−∞
0 3
0
1
+∞
1
4
x3
0dx = x −
3
3
1
=
0
4
1
4
0
×1 − − × 0 − = 1
3
3
3
3
10.2 - Recordemos que a função F(x) nos permite saber qual a probabilidade
acumulada até um qualquer valor de x. Como sabemos, as probabilidades acumuladas
associadas a este tipo de funções são dadas pelas áreas por elas definidas: a
probabilidade acumulada até um dado valor x corresponde à área à esquerda desse valor
delimitada superiormente pela fdp e inferiormente pelo eixo do x . O cálculo das
expressões capazes de nos darem essas áreas são obtidas pelos integrais da fdp até ao
valor x. Este tipo de integrais em que um dos valores de integração é um valor não
definido x chama-se “integral indefinido”. Por questões de melhor compreensão, nas
expressões a integrar, a variável “x” será substituída por “t ”. Deste modo podemos ver
nitidamente a variável “t” a ser substituída pela variável “x” aquando do integral.
Nos intervalos onde a fdp for diferente de “0” as expressões que se vão obter vão
ter presente a variável “x” que será depois substituída pelo valor que se quiser. Como a
fdp pode estar definida por vários ramos (expressões por intervalos) também o cálculo
da função de distribuição terá que ser definida para esses mesmos ramos.
Miguel Soares Lopes
Ficha 3
28
Variáveis Aleatórias Unidimensionais
A fdp apresenta 3 ramos: de “intervalos de cálculo da F(x).
a 0”, de “0 a 1” e de “1 a + ”. Estes não ser os
[- ≤ x <0] ou [x < 0] (ver a definição da fdp porque os sinais destes intervalos terão
que respeitar os sinais da fdp)
Quando x é menor que “0” (ver a fdp) a função é “0”.
x
−∞
f (t )dt =
[0≤ x ≤1]
x
−∞
x
0dt = 0
−∞
4
4 t3
f (t )dt = 0dt + ( − t 2 )dt = t −
−∞
0 3
3
3
0
x
[1< x ≤+ ] ou [x > 1]
x
−∞
0
1 4
f (t )dt = 0dt + ( − t 2 )dt +
0 3
−∞
x
1
0dt =
x
=
0
4
x3
4
03
4
x3
x−
− ×0 −
= x−
3
3
3
3
3
3
3
4 t
t−
3
3
Sinal “–”
1
=
0
4
13
4
03
4 1
×1 −
− ×0 −
= − =1
3
3
3
3
3 3
0, x<0
Podemos então, escrever: F ( x) =
4
x3
x − , 0 ≤ x ≤1
3
3
1, x >1
P(X ≤ 0,5) = F(0,5) = 4/3 x 0,5 – (0,53/3) = 4/6 – 1/24 = 15/24.
0,5 está no intervalo
de 0≤ x ≤1
11 -Sendo X o peso (g) das proteínas existentes em cada embalagem de um dado
alimento, com função de densidade de probabilidade
0 < x ≤1
x2,
1
(7 − 3 x ) , 1 < x ≤ 7
f ( x) =
4
3
0,
outros valores de x
11.1 - Traçar o gráfico de f(x).
11.2 - Determinar a função de distribuição de X.
11.3 - Calcular a probabilidade de, numa embalagem escolhida ao acaso, o peso
das proteínas ser:
11.3.1 - pelo menos 0,5 g.
11.3.2 - não superior a 2 g.
11.4 - Calcular F(2) – F(0,5), indicar o seu significado e representar este valor
graficamente aproveitando o gráfico traçado na alínea a).
11 -
Resolução:
11.1 -
Miguel Soares Lopes
Ficha 3
29
Variáveis Aleatórias Unidimensionais
x
−∞
x
−∞
11.2 - Nesta fdp temos 4 ramos.
[x < 0]
f (t )dt =
x
0dt = 0
−∞
[0< x <1]
t3
f (t )dt = 0dt + t dt =
−∞
0
3
0
x
[1< x ≤7/3]
x
−∞
=
x
=
2
0
x3
03
x3
−
=
3
3
3
1
t3
1
f (t )dt = 0dt + t dt +
(7 − 3t )dt =
0
1 4
−∞
3
0
3
1
3
1
0
−
3
3
+
1
3t 2
+ 7t −
4
2
0
x
2
1
3x
7x −
4
2
2
−
1
3 ×1
7 ×1 −
4
2
3
−∞
=
f (t )dt =
3
3
1
0
−
3
3
0
1
0dt + t dt +
−∞
+
7/3
2
0
1
7
7× −
4
3
1
3×
7
3
2
1
(7 − 3t )dt +
4
=
1
1 7
3x 2
7 3
3x 2 7
25
= + x−
− − = −
+ x−
3 4
8
4 8
8
4
24
[x >7/3]
x
x
t3
0dt =
7/3
3
x
1
1
3t 2
+ 7t −
4
2
0
7/3
=
1
2
−
1
3 × 13
7 ×1 −
4
2
=
1
49 147
7 3
24 294 147 99
+
−
− +
=
+
−
−
=1
3 12 72
4 8
72 72
72 72
0, x≤0
x3
, 0 < x ≤1
3
Podemos escrever: F ( x) = 3x 2 7 x 25
7
−
+
−
,1< x ≤
8
4 24
3
7
1, x >
3
11.3 11.3.1 - P(X≥0,5) = 1 – F(0,5) = 1 – 0,53/3 = 1 – 1/24 = 23/24;
11.3.2 - P(X≤2) = F(2) = -3 x 22/8 + 7 x 2/4 – 25/24 = 23/24;
11.4 - F(2) – F(0,5) = 23/24 – 1/24 = 22/24 = 11/12 .
Nota: a área correspondente à
alínea 11.4 á aquela que está
entre 1/2 e 2.
A verde está P(X≥0,5) e a
laranja F(0,5).
12 -A eficiência, X, de uma enzima digestiva pode ser descrita pela função de
(
)
1
5 − 3x 2 , 0 ≤ x ≤ 1 .
4
12.1 - Calcular a probabilidade de a enzima ter uma eficiência maior do que 50%.
densidade de probabilidade f ( x) =
Miguel Soares Lopes
Ficha 3
30
Variáveis Aleatórias Unidimensionais
12.2 - Calcular a média e a variância da eficiência.
12.3 - Calcular F(0,5).
12 -
Resolução:
12.1 - Numa situação destas, em que não se pede a função de distribuição,
podemos calcular directamente aquilo que nos é pedido. Sendo X a eficiência,
aquilo que é pedido é a probabilidade acumulada entre X=0,5 (eficiência igual a
50%) e X=1 (eficiência total ou 100%).
1
1
1
x3
(5 − 3x 2 )dx = 5 x − 3 ×
P(X>0,5) =
0,5 4
4
3
1
=
1
[5 − 1] − 20 − 1
4
8 8
=
1
13
0,53
5 ×1 − 3 ×
− 5 × 0,5 − 3 ×
4
3
3
=
0 ,5
1
19
19 13
4−
= 1−
=
;
4
8
32 32
12.2 -
(
)
1
1
µ=
x × f ( x)dx = x × 5 − 3 x 2 dx =
0
−∞
4
4
+∞
1
=
σ2 =
+∞
−∞
1 5 ×1 3 ×1
−
4 2
4
2
x 2 × f ( x)dx −
4
2
1 5 x 3 3x 5
=
−
4 3
5
−
1
0
1
0
1
0
(
2
(
3
4
=
)
1
5 − 3 x 2 dx −
4
7
−
16
2
1
=
4
)
1 5 x 2 3x 4
5 x − 3x d x =
−
4 2
4
5 × 0 3× 0
−
2
4
= x2 ×
=
1
=
0
1 5 3
7
−
=
4 2 4
16
2
=
1
4
1
0
(5 x
2
)
− 3x 4 d x −
2
5 × 13 3 × 15
5 × 03 3 × 05
−
−
−
3
5
3
5
=
7
−
16
2
=
1 5 3
49
− −
= 0,075 ;
4 3 5
256
12.3 - F(0,5) = 1–P(X>0,5) = 1–13/32 = 19/32 .
=
13 -Sendo X uma variável aleatória que representa a quantidade (kg) procurada por
cliente de determinado produto em certa loja, com fdp.
1
,
a≤x<2
3x 2
2 x
f ( x) =
−
, 2≤ x<b
9 36
0 ,
outros valores de x
13.1 - Calcular a e b, sabendo que 50% dos clientes procura pelo menos 2 kg.
13.2 - Calcular a probabilidade de um cliente procurar mais de 7 kg.
13 -
Resolução:
13.1 - A informação que é dada diz que 50% dos clientes consome menos de
2 kg. Sendo b o valor mais alto, quer dizer que 50% dos clientes consome entre
2 kg e b. Assim:
Miguel Soares Lopes
Ficha 3
31
Variáveis Aleatórias Unidimensionais
P(2≤X<b) = 0,5 ⇔
⇔−
b
2
2
x2
2 x
x−
−
dx = 0,5 ⇔
9
72
9 36
2
b
2× b b2
2 × 2 22
−
−
−
= 0,5 ⇔
9
72
9
72
= 0,5 ⇔
2
2
b 16b 28 1
b 16b 64
+
−
= ⇔− +
−
= 0 ⇔ − b 2 + 16b − 64 = 0 ⇔
72 72 72 2
72 72 72
− 16 ± 16 2 − 4(−1× (−64))
− 16
⇔ b=
= 8 kg;
2 × (−1)
− 2)
Do mesmo modo a é o valor mais baixo, quer dizer que 50% dos clientes consome entre
a e 2 kg. Assim:
⇔b =
2
1
1
P(a≤X<2) = 0,5 ⇔
dx = 0,5 ⇔ −
= 0,5 ⇔
a 3x 2
3x a
1
1
1 2
⇔
= 0,5 + ⇔
= ⇔ 6a = 3 ⇔ a = 0,5 kg
3a
6 3a 3
2
−
1
1
− −
3× 2
3a
= 0,5 ⇔
13.2 - P(X>7) = 1 – F(7) [que não podemos calcular através da F(x) porque não a
temos]. Então temos que resolver pelo integral:
8
8
2
x2
16 64
14 49
2 x
−
dx = x −
=
P(X>7) =
−
−
−
= 1/72 .
9
72
9
72
9
36
9
72
7
7
14 -Uma variável aleatória X tem a seguinte função densidade de probabilidade:
2( x + 1)
, x ∈ [0, a ], c / a > 0
f ( x) =
15
0 , outros valoresde x
14.1 - Determine o valor de a para o qual f(x) é uma função densidade de
probabilidade.
14.2 - Determine a função de distribuição acumulada F(x).
14.3 - Calcule P(-3 <X 1).
14.4 - Calcule P(1 X 3 | X 2).
14.5 - Calcule P(2 X 4).
Resolução:
14 -Se esta variável tem esta fdp quer dizer que o integral daquela função entre “0” e
“a” tem que valer “1”.
14.1 ⇔
+∞
−∞
f ( x)dx =1 ⇔
a
0
2( x + 1)
2x2 2x
dx = 1 ⇔
+
15
30 15
a
=1⇔
0
2a 2 2 a
2 × 02 2 × 0
a 2 2a 15
+
−
+
=1⇔
+
−
= 0 ⇔ a 2 + 2a − 15 = 0 ⇔
15 15 15
30 15
30
15
− 2 ± 2 2 − 4 × (1× (−15))
−2±8
⇔a=
⇔ a = 3 ∨ a = −5
2 ×1
2
Como a>0 logo a terá que ser 3 .
14.2 - A fdp tem 3 ramos: “x < 0”, “0 ≤ x ≤ 3” e “x > 3”.
[x < 0]
⇔a=
Miguel Soares Lopes
Ficha 3
32
Variáveis Aleatórias Unidimensionais
x
−∞
f (t )dt =0 ⇔
[0 ≤ x ≤ 3]
x
−∞
f (t )dt =
x
0
x
0dt = 0
−∞
2(t + 1)
2t 2 2t
dt =
+
15
30 15
[x > 3]
2(t + 1)
f (t )dt =
dt +
−∞
0
15
Podemos então escrever:
0, x<0
x
F ( x) =
3
x
=
0
2x 2 2x
2 × 02 2 × 0
x2 2x
−
+
+
=
+
30 15
30
15
15 15
2t 2 2t
0dt =
+
3
30 15
x
3
=
0
2 × 32 2 × 3
2 × 02 2 × 0
18 6
+
−
+
=
+ =1
30
15
30
15
30 15
x 2 2x
+
,0≤ x≤3
15 15
1, x > 3
14.3 - P(-3 <X 1) = F(1) – F(-3) = F(1) – 0 =
14.4 - P(1 X 3 | X 2) =
12 2 × 1
+
= 1/5
15 15
P(1 ≤ X ≤ 2) F(2) − F(1)
=
=
P ( X ≤ 2)
F(2)
8
15
− 15
8
5/8
15
22 2 × 2 8
+
=
15 15 15
X 4) = F(4) – F(2) = 1– 8/15 = 7/15
F(2) =
14.5 - P(2
Miguel Soares Lopes
Ficha 3
33
Variáveis Aleatórias Unidimensionais
Variáveis Aleatórias Bidimensionais
15 -Uma caixa contém 10 bolas: 5 amarelas; 3 brancas e 2 castanhas. Fazem-se 3
tiragens com reposição. Sendo X a variável aleatória que conta o número de bolas
castanhas extraídas:
15.1 - Construa a função de probabilidade de X.
15.2 - Considere a variável aleatória Y que conta o número de bolas amarelas
extraídas naquela experiência aleatória e que tem a seguinte função de
probabilidade:
Y
0
f(y)
1
2
3
0,125 0,375 0,375 0,125
Construa a função de probabilidade conjunta de X e Y.
15.3 - Construa a função de distribuição conjunta de X e Y.
15.4 - Verifique se X e Y são variáveis independentes.
15 -
Resolução:
15.1 - Construir a função de probabilidade é responder à pergunta”qual é a
probabilidade que a variável X tem de assumir cada um dos valores possíveis?”
Sendo X o número de bolas castanhas que se podem ter em três tiragens com
reposição é óbvio que esta variável pode assumir os valores 0, 1, 2 e 3.
Por outro lado, sempre que não sai uma bola castanha terá que sair uma bola
“não-castanha” e, quando se estuda apenas o número de bolas castanhas, isso
significa que não interessa a cor dessa bola: podemos assim dizer que temos bolas
castanhas — “C” e “não-castanhas” —“N”. Assim:
P(ter 0 bolas castanhas) = P(X=0) = P(NNN) =
P(X=1) = P(CNN) + P(NCN) + P(NNC) = 3 ×
P(X=2) = P(CCN) + P(CNC) + P(NCC) = 3 ×
P(X=3) = P(CCC) =
3
= 0,512;
2 8 8
× × = 0,384;
10 10 10
2 2 8
× × = 0,096;
10 10 10
2 2 2
× × = 0,008;
10 10 10
X
f(x)
Miguel Soares Lopes
8 8 8
8
× × =
10 10 10
10
0
1
2
3
0,5125 0,384 0,096 0,008
Ficha 3
34
Variáveis Aleatórias Unidimensionais
15.2 - Construir a função de probabilidade conjunta de X e Y é construir uma
tabela que responda a perguntas do tipo: “qual é a probabilidade de X ser 0 e, ao
mesmo tempo, Y ser 1?” Para isso vamos chamar às bolas castanhas — “C”, às
bolas amarelas — “A” e às brancas — “B”. Vejamos as situações.
P(X=0,Y=0)
C
0
A
0
B
3
Acontecimentos
P(BBB)
P(X=0,Y=1)
0
1
2
P(ABB) + P(BAB) + P(BBA) 3 × 105 × 103 × 103 = 0,135
P(X=0,Y=2)
0
2
1
P(AAB) + P(ABA) + P(BAA) 3 × 105 × 105 × 103 = 0,225
P(X=0,Y=3)
0
3
0
P(AAA)
P(X=1,Y=0)
1
0
2
P(CBB) + P(BCB)+ P(BBC)
P(X=1,Y=1)
1
1
1
P(ABC) + P(ACB) + P(BAC)+
6 × 105 × 103 × 102 = 0,180
+ P(BCA) + P(CAB) + P(CBA)
P(X=1,Y=2)
1
2
0
P(CAA) + P(ACA) + P(AAC) 3 × 102 × 105 × 105 = 0,150
P(X=1,Y=3)
1
3
0
3
10
5
10
Probabilidade
× 103 × 103 = 0,027
× 105 × 105 = 0,125
3 × 102 × 103 × 103 = 0,054
(4 bolas) IMPOSSÍVEL
0
3 × 102
× 102
× 103 = 0,036
P(X=2,Y=0)
2
0
1
P(CCB) + P(CBC) + P(BCC)
P(X=2,Y=1)
2
1
0
P(CCA) + P(CAC) + P(ACC) 3 × 102 × 102 × 105 = 0,060
P(X=2,Y=2)
P(X=2,Y=3)
2
2
2
3
0
0
(4 bolas) IMPOSSÍVEL
(5 bolas) IMPOSSÍVEL
P(X=3,Y=0)
3
0
0
P(CCC)
P(X=3,Y=1)
P(X=3,Y=2)
P(X=3,Y=3)
3
3
3
1
2
3
0
0
0
(4 bolas) IMPOSSÍVEL
(5 bolas) IMPOSSÍVEL
(6 bolas) IMPOSSÍVEL
0
0
2
10
× 102 × 102 = 0,008
0
0
0
Agora já podemos construir a seguinte tabela de probabilidade conjunta:
X
Y
0
1
2
3
f(x, . )
0
1
2
3
f( . ,y)
0,027
0,135
0,225
0,125
0,512
0,054
0,180
0,150
0
0,384
0,036
0,060
0
0
0,096
0,008
0
0
0
0,008
0,125
0,375
0,375
0,125
1
15.3 - Para construir a função de distribuição conjunta de X e Y devemos ter em
conta que cada valor da mesma representa uma probabilidade acumulada para a
intercepção de dois intervalos, um para cada uma das duas variáveis. Assim, e por
exemplo, quando se escreve F(2 , 1) quer saber-se a probabilidade acumulada para
a ocorrência em simultâneo de valores de X menores ou iguais a 2 e de valores de
Y menores ou iguais a 1, isto é, P(X≤2; Y≤1). Ora a função de distribuição
conjunta tem que estar definida para qualquer par de valores de (x ,y).
Como se sabe, estamos perante duas variáveis discretas. Neste caso entre dois
valores referenciados consecutivos de cada uma variáveis não há incremento de
probabilidade acumulada. Assim, cada uma das variáveis pode ser tratada em
intervalos, tal como se faz com as variáveis aleatórias unidimensionais, embora se
tenham depois que combinar as duas variáveis.
Miguel Soares Lopes
Ficha 3
35
Variáveis Aleatórias Unidimensionais
Tomemos o quadro anterior e vejamos a que é que corresponde F(2 , 1). Tal como
havia sido referido, esta probabilidade corresponde a P(X≤2; Y≤1). No quadro
estão delimitadas a verde as células correspondentes aos pares de valores (x ,y)
que cumprem as condições requeridas.
X
Y
0
1
2
3
f(x, . )
0
1
2
3
f( . ,y)
0,027
0,135
0,225
0,125
0,512
0,054
0,180
0,150
0
0,384
0,036
0,060
0
0
0,096
0,008
0
0
0
0,008
0,125
0,375
0,375
0,125
1
Assim:
P(X≤2;Y≤1) = P(X=0,Y=0) + P(X=0,Y=1) + P(X=1,Y=0) + P(X=1,Y=1) + P(X=2,Y=0) +
+ P(X=2,Y=1) = 0,027 + 0,135 + 0,054 + 0,180 + 0,036 + 0,060 = 0,492 (confirmar
este valor no quadro seguinte).
Vejamos outro exemplo (células limitadas pelas linhas a azul):
P(X≤1;Y≤2) = P(X=0,Y=0) + P(X=0,Y=1) + P(X=0,Y=2) + P(X=1,Y=0) + P(X=1,Y=1) +
+ P(X=1,Y=2) = 0,027 + 0,135 + 0,225 + 0,054 + 0,180 + 0,150 = 0,771(confirmar
este valor no quadro seguinte).
Y
X
y<0
0≤y<1
1≤y<2
2≤y<3
y≥3
x<0
0≤x<1 1≤x<2 2≤x<3
0
0
0
0
0
0
0,027
0,162
0,387
0,512
0
0,081
0,396
0,771
0,896
0
0,117
0,492
0,867
0,992
x≥3
0
0,125
0,500
0,875
1,000
15.4 - X e Y não são independentes porque existe pelo menos um par (x,y) tal
que, f(x,y) ≠ f(x) x f(y). Como se pode ver, por exemplo, para o par (1,1) temos
P(X=1,Y=1) ≠ P(X=1) x P(Y=1), isto é, 0,180 ≠ 0,384 x 0,375.
16 -Num dado distrito, com três concelhos, A, B e C, a superfície agrícola útil é
constituída por solos de textura arenosa (1), média (2) e argilosa (3). A função de
probabilidade conjunta, f(x,y), é dada por:
X
Y
A
1
2
3
0,18
0,09
0,16
B
0,09
0,12
0,20
C
0,03
0,09
0,04
16.1 - Indicar o valor de f(3,A) e explicar o seu significado.
16.2 - Calcular as funções de probabilidade marginal de X e de Y.
16.3 - Qual o valor de f2(B) (ou fy (B)) ? O que representa?
Miguel Soares Lopes
Ficha 3
36
Variáveis Aleatórias Unidimensionais
16.4 - Calcular F(3, A) e indicar o seu significado.
16.5 - Calcular P(X < 3 ,Y A).
16.6 - Qual a probabilidade de um solo ter textura média, sabendo que é do
concelho A?
16.7 - Verifique se X e Y são variáveis independentes.
16 -
Resolução:
16.1 - f(3,A) = 0,16 e traduz a probabilidade de um solo ter textura argilosa e ser
do concelho A;
16.2 - As funções de probabilidade marginal de X e Y correspondem aos
somatórios das colunas e das linhas, respectivamente. Traduzem a probabilidade
de cada uma das variáveis assumir um dado valor independentemente dos valores
que a outra variável assuma.
X
1
2
3
Y
A
B
C
f(x)
0,30
0,30
0,40
f(y)
0,43
0,41
0,16
16.3 - f2(B) = fy(B) = 0,41 e traduz a percentagem de superfície agrícola do
concelho B dentro da totalidade do distrito:
16.4 - F(3, A) = 0,18 + 0,09 + 0,16 = 0,43 ;
16.5 - P(X<3,Y A) = P(X=1,Y=A) + P(X=2,Y=A) = 0,27 ;
P(X = 2, Y = A ) 0,09
=
= 0,21 ;
P(Y = A)
0,43
16.7 - X e Y não são independentes porque existem pares (x,y) em que a
igualdade f(x,y)=f(x) x f(y) não se verifica, como se prova, por exemplo, com
P(X=1,Y=A) ≠ P(X=1) x P(Y=A), isto é, 0,18 ≠ 0,30 x 0,43.
16.6 - P(X=2|Y=A) =
17 - Considere o exercício nº 15 e execute-o agora com tiragens sem reposição. Para a
alínea 17.2 considere para a variável Y a seguinte função de probabilidade:
Y
f(y)
0
1/12
1
5/12
2
5/12
3
1/12
Resolução:
17 -Seja A – Amarela, B – Branca e C – Castanha. (A – não Amarela, etc.)
17.1 - Em 3 tiragens sem reposição e com 2 bolas Castanhas presentes na caixa o
número de bolas Castanhas presentes nos conjuntos das 3 tiragens só pode ser 0, 1
ou 2.
A probabilidade de “não C” é a soma da probabilidade de A com a de B e, portanto:
P(C) = P(A) + P(B) = 5/10 + 3/10 = 8/10
P(X=0) = P(CCC) = 8/10 x 7/9 x 6/8 = 42/90 = 7/15
P(X=1) = P(CCC) + P(CCC) + P(CCC) = 3 x 2/10 x 8/9 x 7/8 = 42/90 = 7/15
P(X=2) = P(CCC) + P(CCC) + P(CCC) = 3 x 2/10 x 1/9 x 8/8 = 6/90 = 1/15
X
f(x)
Miguel Soares Lopes
0
7/15
1
7/15
Ficha 3
2
1/15
37
Variáveis Aleatórias Unidimensionais
17.2 - Façamos agora um raciocínio semelhante àquele que foi feito
anteriormente mas agora numa situação de “não reposição”.
Y
f(y)
0
1/12
1
5/12
2
5/12
3
1/12
P(X=0,Y=0)
C
0
A
0
B
3
Acontecimentos
P(BBB)
P(X=0,Y=1)
0
1
2
P(ABB) + P(BAB) + P(BBA)
3 × 105 × 93 × 82 =
1
8
P(X=0,Y=2)
0
2
1
P(AAB) + P(ABA) + P(BAA)
3 × 105 × 94 × 83 =
1
4
P(X=0,Y=3)
0
3
0
P(AAA)
P(X=1,Y=0)
1
0
2
3 × 102 × 93 × 82 =
1
20
P(X=1,Y=1)
1
1
1
6 × 105 × 93 × 82 =
1
4
P(X=1,Y=2)
P(X=1,Y=3)
P(X=2,Y=0)
1
1
2
2
3
0
0
0
1
P(CBB) + P(BCB)+ P(BBC)
P(ABC) + P(ACB) + P(BAC)+
+ P(BCA) + P(CAB) + P(CBA)
P(CAA) + P(ACA) + P(AAC)
(4 bolas) IMPOSSÍVEL
P(CCB) + P(CBC) + P(BCC)
3 × 102 × 59 × 48 =
1
6
0
3 × 102 × 19 × 83 =
1
40
P(X=2,Y=1)
P(X=2,Y=2)
P(X=2,Y=3)
2
2
2
1
2
3
0
0
0
P(CCA) + P(CAC) + P(ACC)
(4 bolas) IMPOSSÍVEL
(5 bolas) IMPOSSÍVEL
3 × 102 × 19 × 85 =
1
24
Probabilidade
3 ×2×1 = 1
10 9 8
120
5
10
× 94 × 83 =
1
12
0
0
A função de probabilidade conjunta de X e Y vem assim:
Y
X
0
1
2
3
f(x, . )
0
1
2
f( . ,y)
1/120
1/8
1/4
1/12
7/15
1/20
1/4
1/6
0
7/15
1/40
1/24
0
0
1/15
1/12
5/12
5/12
1/12
1
Como se pode ver as funções de probabilidade marginal de X e Y confirmam as funções
inicialmente apresentadas e calculadas nas alíneas anteriores.
17.3 - Esta função de distribuição conjunta é calculada como foi calculada a da
alínea 15.3.
Y
X
y<0
0≤y<1
1≤y<2
2≤y<3
y≥3
x<0
0
0
0
0
0
0≤x<1 1≤x<2
0
1/120
16/120
46/120
56/120
0
7/120
52/120
102/120
112/120
x≥2
0
10/120
60/120
110/120
1
17.4 - X e Y não são independentes porque existe pelo menos um par (x,y) tal
que, f(x,y) ≠ f(x) x f(y). Como se pode ver, por exemplo, para o par (0,3) temos
P(X=0,Y=3) ≠ P(X=0) x P(Y=3), isto é, 1/12 ≠ 7/15 x 1/12.
Miguel Soares Lopes
Ficha 3
38
Variáveis Aleatórias Unidimensionais
18 -Considere X e Y como duas variáveis aleatórias discretas. Alguns dos valores para
a função de probabilidade conjunta e para as funções marginais encontram-se na tabela
seguinte.
1
2
3
f X ( x)
1
3
1
4
1
12
1
12
1
12
1
2
1
12
1
3
3
fY ( y)
1
6
1
6
18.1 - Complete a tabela de modo a ter a função de probabilidade conjunta para o
par aleatório (X, Y) e as funções de probabilidade marginais de cada uma das
variáveis aleatórias.
18.2 - Determine a função de Distribuição Conjunta de X-Y.
18.3 - Calcular P(1≤X<2 , 2≤Y≤3).
18 -
Resolução:
18.1 -
3
f X ( x)
1
3
1
4
1
12
1
12
1/12
0
1
6
3/6
1
6
1
1
2
1
1
12
2/12
2
2/12
1
12
1
3
3
fY ( y)
3/6
A resolução desta alínea baseia-se no cálculo das parcelas por diferença para
valores conhecidos: sabemos que a probabilidade total é 1 e que esse valor é a soma das
probabilidades marginais (3/6 nas últimas coluna e linha); por sua vez estas
probabilidades marginais são a soma das respectivas linhas ou colunas.
18.2 -
y<1
1≤y<2
2≤y<3
x<1
0
0
0
0
1≤x<2
0
1/12
3/12
4/12
2≤x<3
0
3/12
8/12
10/12
0
4/12
10/12
12/12
x
4
18.3 - P(1≤X<2 , 2≤Y≤3) =
Miguel Soares Lopes
2
12
y
4
1 = 3/12 (o X só pode ser 1 e o Y pode ser 2 ou 3)
+ 12
Ficha 3
39
Distribuições Teóricas Discretas
Distribuições Teóricas Discretas
1-
Dada uma moeda equilibrada e sendo X o número de coroas obtidas em 6
lançamentos, determinar:
1.1 1.2 1.3 1.4 1.5 1.6 1.7 -
a probabilidade de obter 2 coroas.
P (X = 3).
P (X < 2).
P (X > 2).
P (1 < X < 3).
a probabilidade de obter 2 ou mais faces.
a probabilidade de obter menos que 4 faces.
Resolução:
1 - Analisemos a situação exposta para vermos que tipo de distribuição temos:
— 6 provas com 2 resultados possíveis: face ou coroa (provas de Bernoulli);
— provas independentes pois as probabilidades de sair face [ P(F) ] e de sair
coroa [ P(C) ] mantêm-se constantes ao longo das 6 tiragens;
Logo, estamos perante uma Distribuição Binomial.
X ∩ (n, p )
P( X = x)=nCx × p x × q n − x =
X — nº de coroas em 6 lançamentos.
X∩Bin (6 ; 0,5)
1.1 - P(X=2) = 6C2 × 0,52 × 0,54 = 0,234375;
1.2 - P(X=3) = 6C3 × 0,53 × 0,53 = 0,3125;
1.3 - P(X < 2) = P(X=0) + P(X=1) = 6C0 × 0,50 × 0,56 + 6C1 × 0,51 × 0,55 =
1.4 1.5 1.6 -
Coroa
0
1
2
3
4
5
6
= 0,015625 + 0,09375 = 0,10938;
P(X > 2) = 1 – P(X≤2) = 1 – [P(X=0) + P(X=1) + P(X=2)] = 1 – 0,34375 =
= 0,65625;
P(1 < X < 3) = P(X=2) = 0,234375;
Nesta alínea a pergunta é feita em função das “faces”. Para o resolver
podemos assumir duas alternativas: a) transformar a pergunta que está feita
em função de “faces” numa pergunta em função de “coroas” ou b) fazer uma
mudança de variável de modo a defini-la directamente em função das “faces”.
a) P(obter 2 ou mais faces) = P(obter 4 ou menos coroas) =
= P(X≤4) = P(X=0) + P(X=1) + P(X=2) + P(X=3) +
Face
P(X=4) = = 0,34375 + 0,3125 + 0,23438 = 0,89062 ;
6
5
4
3
2
1
0
b) Mudança de variável:
Y — nº de faces em 6 lançamentos
Y∩Bin (6 ; 0,5)
P(obter 2 ou mais faces) = P(Y≥2) = 1 – P(Y<2) = 1 – [P(Y=0) + P(Y=1)]
= 1 – ( 6C0 × 0,50 × 0,56 + 6C1 × 0,51 × 0,55 ) = 1 – 0,1094 = 0,8906
Miguel Soares Lopes
Ficha 4
40
Distribuições Teóricas Discretas
1.7 - P(obter menos que 4 faces) = P(Y<4) = P(Y=0) +…+ P(Y=3) = 0,65625.
2 - As características genéticas de dois ratos adultos são tais que a probabilidade de um
filho ser albino é de 0,2. Se o casal tiver seis filhos calcular a probabilidade de:
2.1 - não haver albinos;
2.2 - nascerem dois ou mais albinos;
2.3 - no máximo 2 não serem albinos;
2.4 - só haver um albino;
2.5 - nascerem no máximo 3 albinos.
Resolução:
2 - Analisemos a situação exposta para vermos que tipo de distribuição temos:
— 6 provas com 2 resultados possíveis: albinos ou não albinos (provas de
Bernoulli);
— provas independentes pois as probabilidades de albinos [ P(A) ] e de não
albinos [ P(N) ] mantêm-se ao longo dos 6 nascimentos; logo estamos perante
uma Distribuição Binomial.
X — nº de ratinhos albinos em 6 nascimentos.
X∩Bin (6 ; 0,2)
2.1 - P(X=0) = 6C0 × 0,20 × 0,26 = 0,262144;
2.2 - P(X≥2) = 1 – P(X<2) = 1 – [P(X=0) + P(X=1)] = 1 – [0,262144 +
+ 6C1 × 0,21 × 0,85 ] = 1 – 065536 = 0,34464;
2.3 - Repare-se que o problema agora é posto salientando exactamente os
ratinhos não albinos. Uma das maneiras de resolver este problema é converter as
perguntas de “não albinos” em “albinos”; outra maneira é fazer uma mudança de
variável. Vejamos esta última: mudança de variável:
Y — nº de ratinhos não albinos em 6 nascimentos.
Y∩Bin (6 ; 0,8)
P (Y ≤2) = P(Y=0) + P(Y=1) + P(Y=2) = 6C0 × 0,80 × 0,86 + 6C1 × 0,81 × 0,85 +
+ 6C2 × 0,82 × 0,2 4 = 0,01696.
2.4 - P(X=1) = 0,393216
2.5 - P(X≤3) = 0,98304
3 - O sistema de previsão para uma dada doença que depende das condições de
humidade, numa determinada cultura é tal que, um dia húmido é aquele em que ocorre
precipitação superior ou igual a 4 mm. A precipitação é independente de dia para dia e o
quadro seguinte dá a probabilidade de precipitação de x mm na época de
desenvolvimento da doença:
f(x)
0≤x<1
0,05
1≤x<2
0,2
2≤x<3
0,2
3≤x<4
0,2
4≤x<5
0,15
5≤x<6
0,15
x≥6
0,05
Calcular a probabilidade de, nesse período:
3.1 - ocorrer um dia húmido (H)?
3.2 - ocorrerem sucessivamente 3 dias húmidos?
3.3 - haver pelo menos 2 dias húmidos numa semana?
Miguel Soares Lopes
Ficha 4
41
Distribuições Teóricas Discretas
Resolução:
3 - Ocorrer um dia húmido é ocorrer um dia com precipitação superior ou igual a
4mm.
X — milímetro de precipitação por dia.
3.1 - P(H) = P(X≥4) = 0,15 + 0,15 + 0,05 = 0,35;
3.2 - Y — nº dias húmidos em 3 dias;
Y∩Bin (3 ; 0,35)
P(Y=3) = 3C3 × 0,353 × 0,650 = 0,042875.
3.3 - Z — nº dias húmidos em 7 dias;
Z∩Bin (7 ; 0,35)
P(Z≥2) = 1 – [P(Z=0) + P(Z=1)] = 1 – ( 7C0 × 0,350 × 0,657 +
+ 7C1 × 0,351 × 0,656 ) = 1 – 0,234 = 0,766
4 - Uma máquina de empacotar fatias de presunto produz em média, 5 embalagens
defeituosas em 100.
4.1 - Em cinco embalagens extraídas ao acaso qual a probabilidade de:
4.1.1 - pelo menos uma ser não defeituosa?
4.1.2 - duas serem defeituosas?
4.1.3 - uma quando muito, ser não defeituosa?
4.2 - Quantas embalagens deverão ser analisadas para que a probabilidade de
ocorrer pelo menos uma embalagem defeituosa seja superior a 0,5?
4.3 - Em 50 embalagens extraídas ao acaso qual o valor esperado de
embalagens defeituosas e qual o seu desvio padrão?
Resolução:
4 - Ter atenção que, embora sejam tiragens sem reposição, e teoricamente fosse uma
Distribuição Hipergeométrica, o valor de N (dimensão da população) não é conhecido
sendo fácil de supor que [N>(10 x n)], sendo “n” a dimensão da amostra (5) (apresentação 5, diap. 33). Assim, vamos usar a Distribuição Binomial por aproximação:
4.1 - X — nº de embalagens não defeituosas em 5.
°
X∩Bin
(5 ; 0,95)
4.1.1 - P (X≥1) = 1 – P(X=0) = 1 – 5C0 × 0,950 × 0,055 = 0,0000003 =
= 0,9999997;
4.1.2 - Y — nº de embalagens defeituosas em 5.
Y∩Bin (5 ; 0,05)
P(Y=2) = 5C2 × 0,052 × 0,953 = 0,021;
4.1.3 - P (X≤1) = P(X=0) + P(X=1) = 5C 0 × 0,950 × 0,055 +
+ 5C1 × 0,951 × 0,054 = 0,00003
4.2 - P(Y≥1) > 0,5 ⇔ 1 – P(Y=0) > 1 – n C0 × 0,050 × 0,95n = 1 – 0,95n > 0,5 ⇔
⇔ 0,95n < 0,5 ⇔ n > log0,95 (0,5) ⇔ n > 13,5
n = 14
4.3 - µ = n x p = 50 x 0,05 = 2,5;
σ = √ n . p . q = √ 50 . 0,05 . 0,95 = √ 2,375 = 1,541
Miguel Soares Lopes
Ficha 4
42
Distribuições Teóricas Discretas
5 - Um estudo encomendado por uma empresa permitiu apurar que aproximadamente
60% dos seus trabalhadores mantinham uma atitude cooperativa face à empresa, 30%
uma atitude hostil e 10% uma atitude não definida.
5.1 - Qual a probabilidade de num grupo de 12 trabalhadores:
5.1.1 - pelo menos 6 adoptarem uma atitude hostil face à empresa?
5.1.2 - no mínimo 2 terem uma atitude bem definida?
5.1.3 - qual o número esperado de trabalhadores com atitude hostil?
5.1.4 - 6 terem uma atitude hostil, 4 cooperativa e 2 não definida.
5.1.5 - 3 terem uma atitude hostil e 4 cooperativa.
5-
Resolução:
5.1 - Este exercício é resolvido com a Distribuição Binomial ou com a
Distribuição Multinomial, dependendo das alíneas.
5.1.1 - Binomial — as provas têm 2 resultados possíveis: “hostis” e “não
hostis”;
X — nº de colaboradores hostis numa amostra de 12 ;
X∩Bin (12 ; 0,3)
P(X≥6) = 0,118
5.1.2 - Binomial — as provas têm 2 resultados possíveis: “com atitude
bem definida” (hostis e cooperativos) e “com atitude não definida”;
Y — nº de colaboradores com atitude bem definida numa amostra de 12;
Y∩Bin (12 ; 0,9)
P(Y≥2) = 1 – [P(Y=0) + P(Y=1)] = 1 – ( 12C0 × 0,950 × 0,0512 +
+12C1 × 0,91 × 0,111 ) = 0,9999999998 ≈ 1.
5.1.3 - µ = n x p = 12 x 0,30 = 3,6 ;
5.1.4 - Multinomial — as provas têm 3 resultados possíveis: atitude hostil,
cooperativa e não definida;
X1 — nº de trabalhadores com atitude cooperativa numa amostra de 12;
X2 — nº de trabalhadores com atitude hostil numa amostra de 12;
X3 — nº de trabalhadores com atitude não definida numa amostra de 12;
p1 = 0,6; p2 = 0,3; p3 = 0,1;
P(X1 = 4; X2 = 6; X3 = 2) =
12!
× 0,6 4 × 0,36 × 0,12 = 13860 x 0,130 x
4! 6! 2!
x 0,00073 x 0,01 = 0,013 .
5.1.5 - Multinomial — as provas têm 3 resultados possíveis: “atitude
hostil”, “cooperativa” e “não definida”;
X1 — nº de trabalhadores com atitude cooperativa numa amostra de 12;
X2 — nº de trabalhadores com atitude hostil numa amostra de 12;
X3 — nº de trabalhadores com atitude não definida numa amostra de 12;
p1 = 0,6; p2 = 0,3; p3 = 0,1;
Miguel Soares Lopes
Ficha 4
43
Distribuições Teóricas Discretas
12!
× 0,6 4 × 0,33 × 0,15 = 27720 x 0,130 x
4! 3! 5!
P(X1 = 4; X2 = 3; X3 = 5) =
x 0,027 x 0,00001 = 0,00097.
5.2 - Multinomial — as provas têm 3 resultados possíveis: atitude hostil,
cooperativa e não definida;
Y1 — nº de trabalhadores com atitude cooperativa numa amostra de 20;
Y2 — nº de trabalhadores com atitude hostil numa amostra de 20;
Y3 — nº de trabalhadores com atitude não definida numa amostra de 20;
p1 = 0,6; p2 = 0,3; p3 = 0,1;
P(Y1=10; Y2=6; Y3=4) =
20!
× 0,610 × 0,36 × 0,14 = 38798760 x 0,006 x
10! 6! 4!
x 0,00073 x 0,0001 = 0,017.
6 - Uma urna contém 14 bolas e em cada uma delas está registado um número. Seis
dessas bolas apresentam um número positivo e oito um número negativo. Retirou-se
uma amostra de quatro bolas dessa urna e multiplicaram-se os respectivos números.
Qual a probabilidade de, o produto assim obtido, ser positivo?
Resolução:
6 - O produto de “4 bolas” só será negativo se houver número ímpar de bolas
negativas.
X — nº de bolas com valor negativo inscrito
X∩H(14;8;4)
X pode tomar valores entre 0 e 4 (inclusive). Destes são ímpares o “1” e o “3”.
Assim, a probabilidade do produto ser positivo é:
P(produto ser positivo) = 1 – P(produto negativo) = 1 – [P(X=1) +
+ P(X=3)] = 1 – [
8
C1 × 6C3
14
C4
+
8
C3 × 6C1
14
C4
] = 1 – 0,4955 = 0,5045
7 - Estima-se que do total das declarações de Imposto Sobre Rendimento de Pessoas
Colectivas, 40% estão correctamente preenchidas, 30% contêm erros favorecendo
apenas os contribuintes, 10% erros favorecendo apenas o Estado e as restantes os dois
tipos de erro.
7.1 - Se forem seleccionada 10 declarações para auditoria, qual a probabilidade
de se encontrarem:
7.1.1 - 6 correctamente preenchidas?
7.1.2 - 2 com erros?
7.1.3 - 4 correctamente preenchidas, 2 com erros a apenas favor do
contribuinte e 1 com erros apenas a favor do Estado?
7.2 - Em 10 declarações qual o número esperado de declarações com erros
apenas a favor do contribuinte?
Miguel Soares Lopes
Ficha 4
44
Distribuições Teóricas Discretas
7-
Resolução:
7.1 - Este exercício é resolvido com a Distribuição Binomial ou com a
Distribuição Multinomial, dependendo das alíneas.
7.1.1 - Binomial — as provas têm 2 resultados possíveis: “correctamente
preenchidas” e “com erros”;
X — nº de declarações correctamente preenchidas numa amostra de 10 ;
X∩Bin (10 ; 0,4)
P(X=6) = 10C6 × 0,46 × 0,6 4 = 0,1115 ;
7.1.2 - Binomial — as provas têm 2 resultados possíveis: “com erros” e
“correctamente preenchidas”;
Y — nº de declarações com erros numa amostra de 10 ;
Y∩Bin (10 ; 0,6)
P(Y=2) = 10C2 × 0,6 2 × 0,48 = 0,011 ;
7.1.3 - Multinomial — as provas têm 4 resultados possíveis: declarações
“correctamente preenchidas”, “com erros exclusivamente a favor do
contribuinte”, “com erros favorecendo apenas o Estado” e “com os 2 tipos de
erros”;
X1 — nº de declarações correctamente preenchidas numa amostra de 10;
X2 — nº de declarações com erros exclusivamente a favor do
contribuinte numa amostra de 10;
X3 — nº de declarações com erros favorecendo apenas o Estado numa
amostra de 10;
X4 — nº de declarações com os 2 tipos de erros numa amostra de 10;
p1 = 0,4; p2 = 0,3; p3 = 0,1; p4 = 0,2;
P(X1 = 4; X2 = 2; X3 = 1; X4 = 3) =
10!
× 0,4 4 × 0,32 × 0,11 × 0,23 =
4! 2! 1!3!
= 12600 x 0,0256 x 0,09 x 0,1 x 0,008 = 0,023.
7.2 - O número esperado é a média. Tal como a pergunta está feita temos
“declarações com erros a favor do contribuinte” versus as outras situações pelo
que estamos perante uma distribuição Binomial. Assim:
µ = n x p = 10 x 0,30 = 3,0 .
8 - Dum lote de 100 peças, das quais 20 são defeituosas, escolheu-se ao acaso uma
amostra de 10. Qual a probabilidade de nessa amostra:
8.1 - Haver 3 defeituosas?
8.2 - Haver 5 defeituosas?
Resolução:
8 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; e são
retiradas sem reposição (amostra) o que faz com que sejam provas não independentes.
Como o valor da população donde é retirada a amostra é conhecido pode calcular-se
através da Distribuição Hipergeométrica.
Miguel Soares Lopes
Ficha 4
45
Distribuições Teóricas Discretas
X — nº de artigos defeituosos numa amostra de 10 ;
X∩H (100 ; 20 ; 10)
8.1 - P(X=3) =
8.2 - P(X=5) =
20
C3 × 80C7
100
20
C10
C5 × 80C5
100
C10
= 0,209 ;
= 0,021 .
9 - Um vendedor tem 20 artigos dos quais apenas 16 estão de acordo com as
especificações do comprador. Esse comprador examina sempre 20% dos artigos de cada
lote apresentado pelo vendedor.
O vendedor tem duas opções:
— vender os artigos num único lote.
— vender os artigos em 2 lotes de 10 artigos cada um, distribuindo os artigos bons
igualmente pelos 2 lotes.
O comprador rejeita o lote se na amostra examinada encontrar um ou mais artigos sem
as especificações.
9.1 - Qual a probabilidade de o vendedor conseguir vender os 20 artigos na
primeira opção?
9.2 - Qual a melhor opção para o comprador?
Resolução:
9 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; cada
prova é retirada sem reposição o que faz com que sejam provas não independentes.
Como o valor da população donde é retirada a amostra é conhecido pode calcular-se
através da Distribuição Hipergeométrica.
9.1 - X — nº de artigos defeituosos numa amostra de 4 ;
X∩H (20 ; 4 ; 4)
P(vender o lote de 20 peças) = P(X=0) =
4
C0 × 16C 4
20
C4
= 0,376 ;
9.2 - Nesta opção, para se venderem os dois lotes é necessário vender um e
vender o outro, ou seja, em ambos os lotes é necessário que não se encontrem
nenhumas peças defeituosas. Neste caso cada lote passou a ter 10 peças das quais
agora 2 são defeituosas.
Y — nº de artigos defeituosos numa amostra de 2 ;
Y∩H (10 ; 2 ; 2)
P(vender as 20 peças) = P(vender um lote de 10 peças e vender o outro lote
de 10 peças) = P(Y=0) x P(Y=0) =
2
C0 × 8C 2
10
C2
x
2
C0 × 8C 2
10
C2
= 0,6222 = 0,387 .
Do ponto de vista do vendedor é melhor a segunda opção (maior
probabilidade de conseguir vender) e, por oposição, a melhor opção para o
comprador é a 1ª [do seu ponto de vista ele quererá rejeitar o(s) lote(s)].
Miguel Soares Lopes
Ficha 4
46
Distribuições Teóricas Discretas
10 -A variável X tem distribuição binomial, com parâmetros n e p. Sabendo que µ=5 e
σ2 = 4, determinar n e p.
Resolução:
10 -Temos neste caso duas incógnitas, n e p, que se relacionam através de outras duas
expressões: a da média e a da variância cujos valores são fornecidos. Assim podemos
escrever:
n× p = 5
n× p×q = 4
⇔
n=
5
p
n × p × (1 − p) = 4
⇔
−
5 × (1 − p) = 4
⇔
−
5−5p = 4
⇔
−
5p =1
⇔
n=
5
0, 2
= 25
p = 0,2
n = 25 e p = 0,2 .
11 -A distribuição de falhas em contraplacado de madeira apresenta em média uma
falha em 50 dm2. Qual a probabilidade de que numa porção de contraplacado de
dimensão 4 x 8 dm2:
11.1 - Não haja nenhuma falha
11.2 - Haja, quando muito, uma falha.
Resolução:
11 -É-nos dado o valor médio de falhas para 50 dm2: λ1 = 1 falha/50 dm2.
Temos que obter o novo λ2 para 4 x 8=32 dm2.
λ2 = 0,64 falhas/32 dm2 (regra de 3 simples)
1 falha — 50 dm3
X — nº de falhas por 32 dm2
x falhas — 32 dm3
X∩Po(0,64)
x = 32/50 = 0,64 falhas
e −0,64 × 0,64 0
= 0,527 ;
0!
e −0,64 × 0,64 0
e −0,64 × 0,641
P(X≤1) = P(X=0) + P(X=1) =
+
= 0,864 .
0!
1!
11.1 - P(X=0) =
11.2 -
12 - A máquina 1 produz por dia o dobro das peças que são produzidas pela máquina
2. No entanto, 6% das peças fabricados pela máquina 1 tendem a ser defeituosas,
enquanto somente 3% o tendem a ser na máquina 2.
12.1 - Qual a probabilidade, de num lote de 10 peças extraídas ao acaso da
produção total:
12.1.1 - haver 2 peças defeituosas?
12.1.2 - haver entre 2 e 5 (inclusive) peças defeituosas?
12.2 - Qual o número esperado de peças defeituosas num lote de 100?
12.3 - Atendendo à capacidade das máquinas colhe-se diariamente uma amostra
de 4 peças da máquina 1 e uma amostra de 8 da máquina 2. Calcular a
probabilidade de haver 2 peças com defeito no conjunto das duas amostras.
12.4 - As peças são vendidas em embalagens de 20, garantindo o fabricante que
90% são de boa qualidade. Calcular a probabilidade dessa garantia ser violada.
12 -
Resolução:
12.1 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; e
são retiradas sem reposição (amostra) o que faz com que as provas não sejam
Miguel Soares Lopes
Ficha 4
47
Distribuições Teóricas Discretas
independentes. Como o valor da população donde é retirada a amostra não é
conhecido (não se pode calcular através da Distribuição Hipergeométrica) e se
supõe que a dimensão da população seja muito maior que 10 vezes a dimensão da
amostra vamos calcular através da Distribuição Binomial (por aproximação).
P(1) = 2/3 e P(2) = 1/3 (resolução por sistema)
P(D|1) = 0,06 e P(D|2) = 0,03 então, pelo teorema da probabilidade total:
P(D) = 2/3 x 0,06 + 1/3 x 0,03 = 0,05 ;
X — nº de de peças defeituosas numa amostra de 10 ;
°
X∩Bin
(10 ; 0,05)
12.1.1 - P(X=2) = 10C2 × 0,052 × 0,957 = 0,075 ;
12.1.2 - P(2≤X≤5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) =
= 10C2 × 0,052 × 0,957 + … + 10C5 × 0,055 × 0,955 = 0,086 .
12.2 - µ = 100 x 0,05 = 5
12.3 - As 2 peças defeituosas no conjunto das 12 peças [4 da máquina 1 (M1) e 8
da máquina 2 (M2)] podem ser obtidas de três modos diferentes:
M1 M2 Total
2
0
2
1
1
2
0
2
2
Para calcular a probabilidade de ter 2 peças defeituosas há que calcular a probabilidade
de cada uma das situações apresentadas anteriormente. Cada uma delas é calculada
como sendo o produto das duas situações que lhe dão origem, isto é, por exemplo e
para o primeiro caso, a probabilidade de, na amostra proveniente de M1, termos 2 peças
defeituosas e na amostra M2 ter 0 peças defeituosa.
Vamos definir as variáveis necessárias e calculemos as 3 situações:
X1 : nº de peças def. na amostra de 4 peças proveniente de M1;
°
; 0,06)
X1∩Bi(4
X2 : nº de peças def. na amostra de 8 peças proveniente de M2;
°
X2∩Bi(8
; 0,03)
M1
M2
4
2
2
8
P(X1 = 2) = C2 × 0,06 × 0,94 = 0,019
P(X2 = 0) = C0 × 0,030 × 0,978 = 0,784
P(X1 = 1) = 4C1 × 0,061 × 0,943 = 0,199
P(X2 = 1) = 8C1 × 0,031 × 0,975 = 0,194
P(X1 = 0) = 4C0 × 0,060 × 0,944 = 0,781
P(X2 = 2) = 8C2 × 0,032 × 0,972 = 0,02
P(ter 2 peças defeituosas nas 12 peças) = 0,019 x 0,784 + 0,199 x 0,194 + 0,781 x 0,02 =
= 0,07
12.4 - Garantir que 90% de 20 são de qualidade é dizer que 18 são de certeza
boas e que, no máximo, 2 poderão ser defeituosas. Violar a garantia será ter mais
de 2 defeituosas nas embalagens de 20.
Z — nº de peças defeituosas numa embalagem de 20 ;
Z∩Bin (20 ; 0,05)
P(Z>2) = 1 – [P(Z=0) + P(Z=1) + P(Z=2)] = 1 – [ 20C0 × 0,050 × 0,9520 +
+ 20C1 × 0,051 × 0,9519 + 20C2 × 0,052 × 0,9518 ] = 1 – 0,9245 = 0,0755 .
Miguel Soares Lopes
Ficha 4
48
Distribuições Teóricas Discretas
13 -Um PBX recebe em média 60 chamadas telefónicas por hora. Calcular:
13.1 - A probabilidade de ser recebida apenas uma chamada durante um período
de 1 minuto.
13.2 - A probabilidade de serem recebidas pelo menos 3 chamadas num intervalo
de 5 minutos.
13.3 - Qual o número esperado de chamadas em 10 minutos? E numa hora?
Resolução:
13 - X — nº de chamadas telefónicas por hora num PBX
λ1 = 60 chamadas/hora ou 60 chamadas/60 minutos
13.1 - Converter o λ:
λ2 = 1 chamada/1 minuto
X∩Po(1)
P(X=1) =
e −1 × 11
= 0,368;
1!
13.2 - Converter o λ:
λ3 = 5 chamada/5 minutos
Y∩Po(5)
P(Y≥3) = 1 – P(Y<3) = 1 – [P(Y=0) + P(Y=1) + P(Y=2)] = 1 – (
+
e −5 × 5 0
+
0!
e −5 × 51 e −5 × 5 2
+
) = 1 – 0,1247 = 0,8753
1!
2!
13.3 - µ10 = 10 chamadas; µh = 60 chamadas.
14 -Suponha que um livro de 585 páginas contém 43 erros tipográficos. Se esses erros
estiverem aleatoriamente distribuídos pelo livro, qual a probabilidade de:
14.1 - uma página qualquer não ter erros?
14.2 - onze páginas escolhidas ao acaso não terem erros?
14 -
Resolução:
14.1 - X — nº de erros numa página.
λ1 = 43 erros/585 pág. = 0,074 erros/pág.
X∩Po(0,074)
P(X=0) =
e −0,074 × 0,074 0
= 0,929;
0!
14.2 - Esta pergunta será resolvida no capítulo seguinte quando se tratar da
matéria “Aproximação da Poisson à Normal”.
Miguel Soares Lopes
Ficha 4
49
Distribuições Teóricas Discretas
15 -Admite-se que 5% da produção de certa fábrica apresenta defeitos. Numa
encomenda de 100 unidades, qual a probabilidade de se encontrarem:
15.1 - duas peças defeituosas?
15.2 - no máximo 2 peças defeituosas?
Resolução:
15 -X — nº de peças defeituosas numa encomenda de 100 unidades;
X∩Bin (100 ; 0,05)
15.1 - P(X = 2) = 100C2 × 0,052 × 0,9598 = 0,081 ;
15.2 - P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) =
= 100C0 × 0,050 × 0,95100 + 100C1 × 0,051 × 0,9599 + 0,081 = 0,118 .
16 -Numa fábrica o número de acidentes por semana segue uma lei de Poisson com
parâmetro igual a 2. Calcular a probabilidade de:
16.1 - numa semana haver pelo menos um acidente
16.2 - numa semana haver pelo menos um acidente, sabendo-se que na semana
anterior não se tinha registado nenhum.
16.3 - em 2 semanas se verificarem 4 acidentes.
16.4 - numa semana haver 2 acidentes e na semana seguinte outros 2.
16 -
Resolução:
16.1 - X — nº de acidentes por semana
λ1 = 2 acidentes/semana
X∩Po(2)
P(X≥1) = 1 – P(X=0) = 1 –
e −2 × 2 0
= 1 – 0,135 = 0,865 ;
0!
16.2 - O mesmo da alínea anterior uma vez que na Distribuição de Poisson os
acontecimentos são independentes e, portanto, acontecimentos passados não
influenciam acontecimentos futuros.
16.3 - Y — nº de acidentes em 2 semanas
λ2 = 2 x 2 acidentes/semana = 4
Y∩Po(4)
P(Y=4) =
e −4 × 4 4
= 0,195 ;
4!
16.4 - λ1 = 2 acidentes/semana
P(2 acidentes numa semana e 2 acidentes na semana seguinte) =
= P(X=2) x P(X=2) = 0,2712 = 0,073 .
Miguel Soares Lopes
Ficha 4
50
Distribuições Teóricas Discretas
17 -O número de rebuçados de chocolate contidos numa embalagem de 250 g de certa
marca segue distribuição de Poisson. Sabendo que a probabilidade de uma embalagem
desse tipo conter pelo menos 1 rebuçados de chocolate é superior a 0,8 calcular:
17.1 - o valor mínimo que a média da distribuição pode tomar.
17.2 - Tomando esse valor médio, calcular a probabilidade de, numa embalagem
de 500 g, existirem exactamente 8 rebuçados de chocolate.
17 -
Resolução:
17.1 - X — nº de rebuçados em 250g
X∩Po(λ)
P(X 1) > 0,8 ⇔ 1 – P(X=0) > 0,8 ⇔ P(X=0) < 0,2 ⇔
⇔ e- < 0,2 ⇔ λ > -ln(0,2) ⇔ λ > 1,609 rebuçados/250g
e− ×
0!
0
< 0,2 ⇔
17.2 - λ2 = 2 x 1,609 = 3,218 rebuçados/500g
X — nº de rebuçados em 500;
X∩Po(3,218)
P(X=8) =
e −3,218 × 3,2188
= 0,011 .
8!
18 -Sabe-se que a probabilidade de determinada máquina automática necessitar de ser
afinada em cada período de trabalho de 30 minutos é 0,05. Determinar:
18.1 - a média do número de afinações numa semana em que a máquina trabalha
20 horas.
18.2 - a probabilidade de, em 8 horas de trabalho, se verificar pelo menos 1
afinação e a de se verificarem 2 a 5 afinações.
Resolução:
18 -X — nº de afinações da máquina em cada 30 min.
P(máquina ser afinada em cada 30 min) = 0,05 ⇔ P(máquina NÃO ser
afinada em cada 30 min) = 1 – 0,05 = 0,95 ⇔ P(X=0) = 0,95 ⇔
⇔
e− ×
0!
0
= e-λ = 0,95 ⇔ λ30min = -ln (0,95) = 0,0513 ;
X∩Po(0,051)
18.1 - Regra de “3 simples”: se em 30 min são 0,051 em 20 h são 40 vezes mais;
λ20h = 40 x 0,051 = 2,052 ;
18.2 - Y — nº de afinações da máquina em cada 8 horas;
λ8h = 0,0513 x 16 = 0,821 ;
P(Y≥1) = 1 – P(Y=0) = 1 –
e −0,821 × 0,8210
= 1 – 0,44 = 0,56 ;
0!
P(2≥Y≥5) = (Y=2) + … + P(Y=5) = 0,199 .
Miguel Soares Lopes
Ficha 4
51
Distribuições Teóricas Discretas
19 -Uma remessa de 20 barras de aço é aceite pelo comprador se numa amostra de 5
escolhidas simultaneamente e ao acaso não houver mais que uma defeituosa. Qual a
probabilidade de ser aceite um lote que contém 4 barras defeituosas?
Resolução:
19 -X — nº de peças defeituosas numa remessa de 20 barras;
X∩H (20 ; 4 ; 5 )
P(X≤1) = P(X=0) + P(X=1) =
4
C0 × 16C5 4C1 × 16C 4
+ 20
= 0,751 ;
20
C5
C5
20 -Um exame é constituído por 15 questões, cada uma com cinco alternativas de
resposta, em que apenas uma é correcta. Supondo que um estudante responde às
questões aleatoriamente, qual a probabilidade de acertar 10 questões.
Resolução:
20 -Se cada pergunta tem cinco alternativas e se a resposta é aleatória, a probabilidade
de acertar na resposta correcta a cada pergunta é 1/5, ou seja, 0,2.
X — nº de respostas correctas em 15 perguntas de escolha múltipla;
X∩Bin (15 ; 0,2)
P(X=10) = 15C10 × 0,210 × 0,85 = 0,0001008
[ comentário: concluiu-se que não vale a pena apostar neste método ]
Miguel Soares Lopes
Ficha 4
52
Distribuições Teóricas Contínuas
Distribuições Teóricas Contínuas
A distribuição Normal tem 2 parâmetros: um deles é a média (µ) e o outro é, segundo os
autores, a variância (σ2) ou o desvio padrão (σ). No contexto destes exercícios assumiu-se a variância como segundo parâmetro da distribuição normal.
1 - O montante de depósitos à ordem efectuados diariamente numa agência bancária é
uma variável aleatória com distribuição normal de média 120 u.m. e variância 64 u.m2.
Determine a percentagem de dias em que o montante de depósitos à ordem efectuados
diariamente:
1.1 1.2 1.3 1.4 -
é inferior a 135 u.m.;
é inferior a 105 u.m.;
se situa entre 105 e 135 u.m.
Determine o montante de depósitos à ordem efectuados diariamente, acima
do qual se situam 90% dos dias.
Resolução:
1 - A maior parte deste tipo de problemas obedece a um esquema mental que é o
seguinte: a partir de x determinar z, fazer as transformações necessárias para
contornar as limitações da tabela (apresentação 6, diap. 16 a 19) e consultar a
tabela.
x
z
tabela
X — montante de depósitos à ordem efectuados diariamente numa agência
bancária;
Tabela
X∩N (120 ; 64 )
1.1 - P(X<135) = P(Z<1,88) = 0,97 ;
z=
x−
= 135 −8120 = 1,88
Tabela
1.2 - P(X<105) = P(Z<-1,88) = P(Z>1,88) = 1 – P(Z<1,88) = 1 – 0,97 = 0,03 ;
z=
x−
= 105 −8120 = −1,88
1.3 - P(105<X<135) = P(X<135) – P(X≤105) = 0,97 – 0,03 = 0,94 ;
1.4 - Aqui a pergunta é: “qual o montante?”, isto é “qual o valor do x?”. Ora
esta pergunta inverte o esquema mental apresentado em 1.1. Neste caso temos
que partir da tabela (através do valor da percentagem dada), determinar o z e
depois, a partir dele, o x. Saliente-se que a partir da expressão que converte o x em
z, e conhecendo 3 das suas 4 componentes, podemos sempre determinar aquela
que estiver em falta.
se z < 0 então
-z > 0
-z > 0
− 1,28 =
x1 −120
8
P(X>x1) = 0,90 ⇔ P(Z>z) = 0,90 ⇔ P(Z<-z) = 0,90 ⇔ -z = 1,28 ⇔ z = -1,28 ⇔
⇔ x1 = 109,77 .
Tabela: procuramos o valor mais próximo da proba-
Miguel Soares Lopes
Ficha 5
bilidade 0,90 e tiramos o respectivo z
53
Distribuições Teóricas Contínuas
2 - Determinado produto é comercializado em embalagens cujo rótulo indica 1 kg. O
peso das embalagens segue distribuição normal, com média igual a 1 kg e variância
igual a 0,01 kg2. Calcular a probabilidade de uma embalagem ter peso:
2.1 - superior a 1,121 kg.
2.2 - entre 0,879 kg e 1,121 kg. Represente graficamente a probabilidade obtida.
2.3 - Alguém comprou uma pack de 10 embalagens. Qual a probabilidade de
nesse pack ter 3 embalagens com peso superior a 1 kg?
2.4 - O vendedor é multado quando uma inspecção detecta, numa amostra de 5
embalagens escolhidas ao acaso, 2 ou mais com peso inferior a 0,975 kg. Qual a
probabilidade de o vendedor ser multado quando o seu stock for inspeccionado?
Resolução:
2 - X — peso das embalagens de um determinado produto;
X∩N (1 ; 0,01 )
2.1 - P(X>1,121) = P(Z>1,21) = 1 – P(Z 1,21) = 1 – 0,887 = 0,113;
2.2 - P(0,879<X<1,121) = P(X<1,121) – P(X≤0,879) = P(Z<1,21) – P(Z≤-1,21)
=
= 0,887 – ( 1 – 0,887) = 0,774 ;
2.3 - Y — nº de embalagens com peso superior a 1kg num pack de 10;
Y∩Bin( 10 ; 0,5 ) (o 2º parâmetro da Binomial é a probabilidade do
sucesso, neste caso, “ter peso superior a 1kg. Sendo X
a respectiva variável e 1kg a sua média, ter peso
superior a 1kg é, obviamente, 0,5)
10
3
P(Y=3) = C3 × 0,5 × 0,57 = 0,1172 ;
2.4 - W — nº de embalagens com peso inferior a 0,975kg numa amostra de 5;
W∩Bin( 5 ; 0,401 )
Tal como na alínea anterior estamos perante uma Binomial. Neste caso a
probabilidade do sucesso (p) é ter embalagens com peso inferior a 0,975kg.
Para determinar “p” temos que recorrer à distribuição Normal e calcular:
P(X<0,975) = P(Z<-0,25) = P(Z>0,25) = 1 – P(Z≤0,25) = 1 – 0,599 = 0,401
Agora sim, podemos regressar à nossa Binomial:
P(W≥2) = 1 – [P(W=0) + P(W=1)] = 1 – [ 5C0 × 0,4010 × 0,5995 + 5C1 × 0,4011 × 0,5994 ] =
= 1 – 0,3352 = 0,6648 .
3 - Uma população de gastrópodes marinhos apresenta um comprimento de concha
que segue distribuição normal, com média de 7 mm e variância igual a 2 mm2. Que
proporção da população terá conchas com comprimento:
3.1 - menor que 9 mm?
3.2 - entre 5 e 9 mm?
Miguel Soares Lopes
Ficha 5
54
Distribuições Teóricas Contínuas
3.3 - menor que 5 mm?
3.4 - entre 6 e 9 mm?
Resolução:
3 - X — comprimento da concha de uma população de gastrópodes marinhos;
X∩N (7 ; 2 )
3.1 - P(X<9) = P(Z<1,41) = 0,921 ;
3.2 - P(5<X<9) = P(X<9) – P(X≤5) = 0,921 – P(Z≤-1,41) = 0,921 – (1 – 0,921) =
= 0,842 ;
3.3 - P(X<5) = P(Z<-1,41) = P(Z>1,41) = 1 – 0,921 = 0,079 ;
3.4 - P(6<X<9) = P(X<9) – P(X≤6) = 0,921 – P(Z≤-0,71) = 0,921 – (1 – 0,761) =
= 0,682 ;
4 - O tempo de desenvolvimento do fungo A, em laranjas mantidas a uma temperatura
de 20º C, é normalmente distribuído com média de 7 dias e variância de 4 dias2. À
mesma temperatura, o tempo de desenvolvimento do fungo B segue distribuição normal
com uma média de 10 dias e uma variância de 2 dias2. Se uma laranja contaminada com
esporos dos dois fungos se mantiver durante 9 dias a 20º C qual a probabilidade de:
4.1 - o fungo A se desenvolver?
4.2 - o fungo B se desenvolver?
4.3 - ambos os fungos se desenvolverem, assumindo que não existe interacção
entre eles?
Resolução:
4 - X — tempo de desenvolvimento do fungo A com X∩N (7 ; 4 );
Y — tempo de desenvolvimento do fungo B com Y∩N (10 ; 2 );
4.1 - P(X<9) = P(Z<1) = 0,841 ;
4.2 - P(Y<9) = P(Z<-0,71) = P(Z>0,71) = 1 – P(Z≤0,71) = 1 – 0,761 = 0,239 ;
4.3 - P(ambos se desenvolverem) = P(X<9) x P(Y<9) = 0,841 x 0,239 = 0,201 .
5 - O peso médio de 500 estudantes do sexo masculino, numa determinada
universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Admitindo que os pesos são
normalmente distribuídos, determinar quantos estudantes pesam:
5.1 - entre 60 e 77,5 kg;
5.2 - mais de 92,5 kg.
Resolução:
5 - X — peso de um estudante do sexo masculino, numa determinada universidade;
X∩N (75,5 ; 7,5 );
5.1 - P(60<X<77,5) = P(X<77,5) – P(X≤60) = P(Z<0,27) – P(Z≤-2,07) =
60 − 75,5
= 0,606 – (1 – 0,981) = 0,587 ; z = 77,5 − 75,5 = 0,27
z=
= −2,07
7,5
Miguel Soares Lopes
Ficha 5
7,5
55
Distribuições Teóricas Contínuas
5.2 - P(X>92,5) = P(Z>2,27) = 1 – P(Z≤2,27) = 0,012 .
6 - O peso das embalagens de presunto produzidas por uma empresa é uma variável
aleatória normal X. Sabendo que P(X≤88,55g)=0,011 e P(X>105,80g)=0,123,
determinar:
6.1 - os parâmetros µ e σ2 da distribuição.
6.2 - qual a probabilidade de uma embalagem escolhida ao acaso ter um peso
inferior a 90 g?
Resolução:
6 - X — peso das embalagens de presunto;
6.1 - Temos 2 incógnitas (µ e σ) que vão ser obtidas por sistema a partir de 2
equações que são as expressão de cálculo de “z1” (obtido a partir de “x1=88,55g”)
e de “z2” (obtido a partir de “x2=105,80g”). Nestas equações, figuram z, x, µ e σ.
Sabendo 2 delas (os “z’s” e os “x’s”) posso obter as outras 2 por sistema. A cada
valor de “x” corresponde um valor de “z”. Assim, a 88,55 corresponde z1 e a
105,8 corresponde z2.
À direita do valor x2=105,80
temos uma pequena área de
0,123. Se a área fosse maior que
0,5, este valor teria de estar do
lado esquerdo da média.
z2 será positivo
À esquerda do valor x1=88,55
temos uma pequena área de
0,011. Se a área fosse maior que
0,5, este valor teria de estar do
lado direito da média.
z1 será negativo
P(X≤88,55g) = 0,011 ⇔ P(Z≤z1) = 0,011 ⇔ P(Z≥-z1) = 0,011 ⇔
z1<0
-z1>0
⇔ 1 – P(Z<-z1) = 0,011 ⇔ P(Z<-z1) = 1 – 0,011 = 0,989 ⇔ -z1 = 2,29 ⇔ z1 = -2,29
P(X>105,80g) = 0,123 ⇔ P(Z>z2) = 0,123 ⇔ 1 – P(Z≤z2) = 0,123 ⇔
⇔ P(Z≤z2) = 1 – 0,123 = P(Z≤z2) = 0,877 ⇔ z2 = 1,16
Substituindo os valores de “z” e “x” em cada uma das equações e resolvendo o
sistema:
{
− 2,29 =
1,16 =
88,55 −
obtemos: µ = 100g e σ = 5g
105,80 −
6.2 - X∩N ( 100 ; 25 );
P(X<90) = P(Z<-2,00) = P(Z>2,00) = 1 – P(Z≤2,00) = 1 – 0,977 = 0,023 .
z=
90 − 100
= −2
5
7 - Numa seara de milho, a altura dos pés das plantas de uma dada cultivar na fase de
maturação segue distribuição normal, com média igual a 1,65 m. Sabendo que a
probabilidade de encontrar pés de milho com altura inferior a 1,90 m é de 97%,
calcular:
Miguel Soares Lopes
Ficha 5
56
Distribuições Teóricas Contínuas
7.1 - a variância da população;
7.2 - a probabilidade de a altura dos pés de milho se situar entre 1,55 e 1,75 m;
7.3 - um intervalo centrado na média com uma probabilidade de 95%.
Resolução:
7 - X — altura dos pés de milho de uma dada cultivar na fase de maturação;
X∩N ( 1,65 ; σ2 );
7.1 - P(X<1,90) = 0,97 ⇔ P(Z<z) = 0,97 ⇔ z = 1,88
1,88 = (1,901,65)/ σ ⇔ σ = 0,133 ⇔ σ2 = 0,0177 ;
7.2 - X∩N ( 1,65 ; 0,0177 );
P(1,55<X<1,75) = P(X<1,75) – P(X≤1,55) =
= P(Z<0,75) – P(Z≤-0,75) = 0,773 – (1 – 0,773) = 0,546
7.3 - Como se pode ver pela figura ao lado, aquilo que se
pede são os valores de x1 e x2; a esses valores correspondem
2 valores de z (simétricos entre si) que balizam iguais áreas:
a x1 corresponde z1 (negativo) e a x2 corresponde z2
(positivo). Sabendo um, sabemos o outro. Qual é a área à
esquerda de z2 (a mesma área de x2)? A área à esquerda de z2
é 0,975. Consultando a tabela vem que z2 = 1,96 . Daqui tira-se o x2; x2 = z2 x σ + µ ⇔ x2 = 1,96 × 0,133 + 1,65 = 1,91 m . O valor de x1 dista
de 1,65 m o mesmo que x2, pelo que x1 = 1,39 m .
8 - A média dos diâmetros internos das porcas, produzidas por uma certa máquina, é
0,502 centímetros e o desvio padrão é igual a 0,005 centímetros. O controlo de
qualidade na produção não rejeita peças cujo diâmetro esteja compreendido entre 0,496
e 0,508 centímetros; caso contrário, as porcas serão consideradas defeituosas.
Determinar a percentagem de porcas produzidas pela máquina que passam no controlo
de qualidade, admitindo que os diâmetros são distribuídos normalmente.
Resolução:
8 - X — diâmetros internos das porcas;
X∩N ( 0,502 ; 0,0052 );
P(uma porca passar no controlo de qualidade) = P(0,496 < X < 0,508) =
= P(X < 0,508) – P(X ≤ 0,496) = P(Z < 1,20) – P(X≤-1,20) = 0,885 – (1–0,885) =
= 0,760
9 - Numa cooperativa fruteira, as maçãs recebidas são classificadas e embaladas
consoante o seu calibre. São rejeitadas as que apresentam calibre inferior a 50 mm, as
quais representam 12,3% do total recebido.
Sendo o calibre uma variável aleatória que segue distribuição normal, com média de
70 mm, calcular:
9.1 - o desvio padrão;
Miguel Soares Lopes
Ficha 5
57
Distribuições Teóricas Contínuas
9.2 - a probabilidade de uma maçã, escolhida ao acaso, ter um calibre superior a
90 mm.
9.3 - Numa embalagem com uma dúzia de maçãs qual a probabilidade de ter 3
com calibre até 50 mm e 7 com calibre entre 50 e 90 mm?
Resolução:
9 - X — calibre (diâmetros) das maçãs;
X∩N ( 70 ; σ2 );
9.1 - P(X<50)=0,123⇔P(Z<z)=0,123 ⇔ P(Z>-z) = 0,123 ⇔1–P(Z≤-z)= 0,123 ⇔
⇔ P(Z≤-z) = 0,877⇔ -z = 1,16 ⇔ z = -1,16 ⇔ z = (x – µ) / σ ⇔ σ = (x – µ) / z ⇔
⇔ σ = (50 – 70) / -1,16 = σ = 17,2 cm .
9.2 - P(X > 90) = P(Z > 1,16) = 1 – P(Z ≤ 1,16) = 1 – 0,877 = 0,123 ;
9.3 - Cada maçã pode ter 1 de 3 resultados possíveis: calibre até 50 mm, calibre
entre 50 e 90 mm e calibre acima de 90 mm. Por outro lado as provas podem ser
consideradas independentes uma vez que a mostra é pequena dentro da população
de maçãs da cooperativa. Estamos perante uma Distribuição Multinomial.
X1 — nº de maçãs com calibre até 50 mm;
X2 — nº de maçãs com calibre entre 50 e 90 mm;
X3 — nº de maçãs com calibre superior a 90 mm;
p1 = P(uma maçã ter calibre até 50 mm) = 0,123;
p2 = P(uma maçã ter calibre entre 50 e 90 mm) = 0,754;
p3 = P(uma maçã ter calibre superior a 90 mm) = 0,123;
P(X1=3;X2=7;X3=2) =
12!
× 0,1233 × 0,7547 × 0,1232 = 0,031
3! 7! 2!
10 - Cada esporo libertado de uma cápsula de um feto tem uma probabilidade de 0,2 de
se tornar planta. Se a cápsula tiver 100 esporos, qual a probabilidade de pelo menos 25
se tornarem plantas?
Resolução:
10 - X — nº de esporos que se tornam planta;
X∩Bin ( 100 ; 0,2 )
Como o “n” é “grande” podemos verificar se estamos em condições de resolver
por aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” (diap.21, apresent. 6).
Assim, 100 × 0,2 = 20 > 5 e 100 × 0,8 = 80 > 5 — cumpre as 2 condições.
°
°
Então Y∩N
( 100 × 0,2 ; 100 × 0,2 × 0,8 ) = Y∩N
( 20 ; 16 ) ; (diap.23, apresent. 6).
P(Y≥25)Bin ≈ P(Y>24,5)N = P(Z>1,13) = 1 – P(Z≤1,13) = 1 – 0,871 = 0,129 .
(diap.22, apresent. 6).
11 - O peso dos melões de uma dada variedade, X, é uma variável aleatória
normalmente distribuída. A probabilidade de um melão, escolhido ao acaso, ter peso
superior a 1,350 kg é igual a 2/3 da probabilidade de encontrar um melão com peso
inferior à média. Calcular:
Miguel Soares Lopes
Ficha 5
58
Distribuições Teóricas Contínuas
11.1 - a média do peso dos melões sabendo que a variância é igual a 0,0625 kg2;
11.2 - a probabilidade de um qualquer melão ter peso menor que 1,51 kg;
11.3 - a probabilidade de um qualquer melão ter peso entre 1,18 e 1,51 kg;
11.4 - Numa remessa de 50 melões, qual a probabilidade de encontrar mais de 6
com peso superior a 1,51 kg?
Resolução:
11 - X — peso dos melões de uma dada variedade;
P(X>1,350) = 2/3 P(X<µ) = 2/3 × 0,5 = 1/3 ≈ 0,33 ⇔ 1 – P(X≤1,350) = 0,33 ⇔
⇔ 1 – P(X≤1,350) = 0,33 ⇔ P(X≤1,350) = 1 – 0,33 = 0,67 ;
11.1 - Se P(X≤1,350) = 0,67 ⇔ P(Z≤z) = 0,67 ⇔ z = 0,44 ;
De z = (x – µ)/σ ⇔ µ = x – z × σ ⇔ µ = 1,350 – 0,44 × 0,25 = 1,24 ;
11.2 - P(X<1,51) = P(Z<1,08) = 0,860 ;
11.3 - P(1,18<X<1,51) = P(X<1,51) – P(X≤1,18) = 0,860 – P(Z<-0,24) =
= 0,860 – [1 – P(Z<0,24)] = 0,860 – 1 + 0,595 = 0,455 ;
11.4 - Y — nº de melões com peso superior a 1,51 kg;
Y∩Bin ( 50 ; 0,14 )
[p = 1 – 0,86 = 0,14];
Como o “n” é “grande” podemos verificar se estamos em condições de
resolver por aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” .
Assim, 50 × 0,14 = 7 ≥ 5 e 50 × 0,86 = 43 ≥ 5 — cumpre as 2 condições.
°
°
Então Y∩N
( 50 × 0,14 ; 50 × 0,14 × 0,86 ) = Y∩N
( 7 ; 6,02 ) ;
P(Y>6)Bin ≈ P(Y>6,5)N = P(Z>-0,20) = P(Z<0,20) = 0,579 .
(diap.22, apresent. 6).
12 - Uma máquina produz parafusos cujo comprimento, em cm, é uma variável
aleatória com distribuição Normal de parâmetros µ = 2 cm e σ = 0,0125 cm. Considera-se que um parafuso é defeituoso quando o seu comprimento difere de 2 cm por mais ou
menos 0,04 cm. Calcule a probabilidade de numa produção de 10 000 parafusos se
encontrarem mais de 10 defeituosos.
Resolução:
12 - Y — nº de parafusos defeituosos em 10000 parafusos.
Y∩Bin (10000 ;P[ser def.)] ⇔Y∩Bin (10000;1–0,998) ⇔ Y∩Bin (10000; 0,002)
X — comprimento dos parafusos.
X∩N (2 ; 0,01252 )
P(não ser defeituoso) = P(1,96≤X≤2,04) = P(X≤2,04) – P(X<1,96) =
= P(Z≤3,2) – P(Z<-3,2) =0,999 – (1 0,999) = 0,998.
Como o “n” é “grande” podemos verificar se estamos em condições de resolver por
aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” .
Assim, 10000 × 0,002 = 20 ≥ 5 e 10000 × 0,998 = 9980 ≥ 5 — cumpre as 2 condições.
°
Então, se Y∩Bin (10000 ; 0,002) ⇔ Y∩N
( 20 ; 19,96 );
P(Y>10)Bin ≈ P(Y>10,5)N = P(Z>-2,24) = P(Z<2,24) = 0,987 .
Miguel Soares Lopes
Ficha 5
59
Distribuições Teóricas Contínuas
13 - O peso das tangerinas de uma variedade é uma variável aleatória X normalmente
distribuída com média igual a 75 g e variância igual a 256 g2. Sabendo que os frutos são
classificados de acordo com o seu peso em 3 classes distintas, A, B e C, e que à classe
A pertencem os frutos com menos de 50 g, à classe C os frutos com mais de 100 g e à
classe B os restantes. Calcular:
13.1 - a proporção de frutos pertencentes a cada classe;
13.2 - P(X > 60 g).
13.3 - Sabe-se que a probabilidade das tangerinas estarem estragadas é de 5%
quando a sua classe é A, de 4% quando a sua classe é B e de 2% quando a sua
classe é C.
13.4 - Calcular a probabilidade de uma tangerina escolhida ao acaso estar
estragada
13.5 - Em 1200 tangerinas da classe B, quantas poderão estar estragadas?
Resolução:
13 - X — peso das tangerinas de uma variedade;
X∩N (75 ; 256 )
13.1 - Como se pode ver pela imagem os valores 50 e 100
são equidistantes do valor médio 75. Por isso, pode dizer-se que as áreas parciais “b1” e “b2” (que no conjunto
correspondem à classe “B”) são iguais e que as áreas “a”
(que corresponde à classe “A”) e “c” (que corresponde à
classe “C”) são também iguais. Assim, se se determinar a área “b2” podemos
obter indirectamente todas as proporções.
b2 = P(75<X<100) = P(X<100) – P(X≤75) = P(Z<1,56) – 0,5 = 0,94 – 0,5 = 0,44
P(B) = 2 x b2 = 2 x 0,44 = 0,88
P(A) = P(C) e P(A) + P(C) = 1 – P(B) = 1 – 0,88 = 0,12 pelo que P(A) = P(C) = 0,06.
13.2 - P(X>60) = P(Z>-0,94) = P(Z<0,94) = 0,83 ;
13.3 - P(E|A) = 5% ; P(E|B) = 4% ; P(E|C) = 2% ;
(teorema da
13.3.1 - P(E) = 0,06 × 0,05 + 0 88 × 0,04 + 0,06 × 0,02 = 0,39 ; probabilidade
total)
13.3.2 - Nº de tangerinas estragadas em B = 1200 × 0,04 = 48
14 - Numa dada indústria de tecido XYZ sabe-se que sua produção costuma apresentar
um número de defeitos que segue a distribuição de Poisson com uma taxa média de 2
defeitos a cada 50 metros de tecido. Determine:
14.1 - a probabilidade de um rolo com 200 metros de tecido apresentar 12 ou
mais defeitos;
14.2 - a quantidade esperada de rolos que teriam menos de 5 defeitos numa
amostra de 80 rolos de 200 metros.
Miguel Soares Lopes
Ficha 5
60
Distribuições Teóricas Contínuas
Resolução:
14 - X — quantidade de defeitos em 200 m de tecido;
X∩Po ( 200) ⇔ X∩Po (8)
50 = 2 def. — 50 m
200 — 200 m
200 = (2 × 200)/50 = 8 def.
Como o
é elevado, maior que 5, podemos fazer uma aproximação pela
distribuição Normal. Assim,
°
X∩Po ( 200) ⇔ X∩N
(8 , 8)
14.1 - P(X 12) = P(X>11,5) = P(Z>1,24) = 1 – P(Z≤1,24) = 1 – 0,89251 = 0,10749
14.2 - O número esperado é a média. Cada um dos 80 m rolos, ou tem menos de 5
defeitos ou não tem menos de 5 defeitos; a probabilidade de ter menos de 5
defeitos é independente de rolo para rolo. Estamos assim perante uma distribuição
Binomial:
Y — quantidade de rolos com menos de 5 defeitos em 80 rolos
Y∩Bin(80 , prob. de ter menos de 5 def.) ⇔ Y∩Bin(80 , 0,14457) ⇔
P(ter menos de 5 def.) = P(X≤5) = P(Z≤-1,06) = P(Z 1,06) =
=1 – P(Z≤1,06) = 1 – 0,85543 = 0,14457
µ = n × p = 80 × 0,14457 = 11,57 rolos
Miguel Soares Lopes
Ficha 5
61
Inferência Estatística
Inferência Estatística
Intervalos de confiança
1 - A característica X em certo artigo produzido em série segue distribuição normal
com desvio padrão σ = 3. Com base numa amostra aleatória de 25 unidades, que
forneceu um valor médio de 48, construa um intervalo de confiança a 95% para o valor
médio do universo.
Resolução:
1 - Intervalo de confiança para a média da população, com
desvio padrão conhecido:
TAB
X = 48 ; σ = 3 ; n = 25 ; P(Z<z) = 0,975 ⇔ z = 1,96
X –z
≤µ≤ X +z
n
n
⇔ 48 – 1,96 × 3 / 25 ≤ µ ≤ 48 + 1,96 × 3 / 25 ⇔
⇔ 46,824 ≤ µ ≤ 49,176 .
2 - Uma máquina de bebidas está regulada de modo a servir uma quantidade de líquido
que é uma variável aleatória com distribuição normal. Sabendo que numa amostra de 25
bebidas se obtiveram os seguintes resultados:
25
xi = 6250 ml
i =1
25
( xi − x ) 2 = 384 ml2
i=1
2.1 - Construir um intervalo de confiança a 90% para a verdadeira quantidade
média de líquido das bebidas servidas, sabendo que o desvio padrão da população
é 4 ml.(enunciado alterado)
2.2 - Determinar quantas bebidas deveriam ser incluídas na amostra se
pretendesse aumentar a precisão do intervalo para menos de 1 ml.
2.3 - Supondo desconhecer o desvio padrão da população construir um intervalo
de confiança a 95% para a verdadeira quantidade média de líquido das bebidas
servidas.
Resolução:
25
2 - X=
i =1
xi
n
25
s’2 =
= 6250 / 25 = 250 ml
( xi − x ) 2
i=1
n −1
= 384 / 24 = 16 ml2 ⇔ s’ = 4 ml
P(Z<z) = 0,95 ⇔ z = 1,64
2.1 - σ=4 (desvio padrão da população conhecido) usar:
X –z
n
≤µ≤ X +z
n
⇔ 250 – 1,64 × 4 / 25 ≤ µ ≤ 250 + 1,64 × 4 / 25 ⇔
⇔ 248,688 ≤ µ ≤ 251,312 .
Miguel Soares Lopes
Ficha 5
62
Inferência Estatística
2.2 - Precisão do intervalo = amplitude do intervalo / 2 ;
A amplitude do intervalo é dada por 2 × (z ×
“menos de 1 ml”, então z ×
n
n
). Como se quer uma precisão de
< 1 ml ; substituindo vem: 1,64 ×
4
n
< 1 , então
n > 43,03 ; como n é inteiro vem n = 44 .
2.3 - (desvio pad. da popul. desconhec. e n<30) usar a distribuição t-Student.
TAB
P(T>tα/2) = 0,025 (n-1=24) ⇔ t = 2,064
X – tα/2
s'
n
s'
≤ µ ≤ X + tα/2
n
⇔ 250 – 2,064 × 4 / 25 ≤ µ ≤ 250 + 2,064 × 4 / 25 ⇔
⇔ 250 – 1,65 ≤ µ ≤ 250 + 1,65 ⇔ 248,35 ≤ µ ≤ 251,65 .
3 - Seja uma população X ∩ N (µ, σ) com σ = 4. Qual a dimensão mínima da amostra
para a qual se tem um intervalo de confiança a 90% para a média inferior a ] x − 1 ; x + 1 [ ?
Resolução:
3 - σ=4 (desvio padrão da população conhecido) usar X – z
Como z ×
n
n
≤µ≤ X +z
n
< 1 ml e P(Z<z) = 0,95 ⇔ z = 1,64 , substituindo vem: 1,64 × 4/ n < 1 ,
logo n > 43,3 , como n é inteiro vem n = 44 .
4 - Um fabricante produz peças de peso especificado em 200 gramas. Querendo
estimar o verdadeiro peso médio num grande lote a fornecer ao seu maior cliente,
seleccionou 35 peças ao acaso, que depois de pesadas forneceram os seguintes valores:
( xi − x ) 2 = 560 g 2
xi = 7140 g
4.1 - Apresentar uma estimativa para o peso médio das peças do lote.
4.2 - Construir um intervalo com um grau de confiança de 95% para o peso
médio das peças do lote.
4-
Resolução:
xi
4.1 - X é estimativa de µ ; X = n = 7140/35 = 204 g ;
4.2 - Intervalo de confiança para a média da população, com desvio padrão da
população desconhecido e n>30: usar X – z ×
s'
n
≤µ≤ X +z×
s'
n
(porque
n>30, “t” tende para “z” ; mas como não temos “σ” usamos “s'
”)
X = 204 g ; s´=
X –z×
s'
n
( xi − x ) 2
n −1
≤ µ ≤X + z ×
=
s'
n
560
34
TAB
= 4,06 ; n = 35 ; P(Z<z) = 0,975 ⇔ z = 1,96
⇔ 204 – 1,96 × 4,06/ 35 ≤ µ ≤ 204 + 1,96 × 4,06/ 35 ⇔
⇔ 202,65 g ≤ µ ≤ 205,35 g
Miguel Soares Lopes
Ficha 6
63
Inferência Estatística
5 - Numa unidade de empacotamento de açúcar observou-se o peso de 9 embalagens,
escolhidas aleatoriamente à saída da linha de empacotamento. O peso das embalagens é
uma variável aleatória normal (X). Registaram-se os seguintes pesos (em gramas):
8,7
8,5
6,9
9,4
7,3
9,0
8,6
9,2
8,9
5.1 - Calcular a média amostral, o desvio padrão não corrigido (s) e o desvio
padrão corrigido (s’).
5.2 - Estimar um intervalo de confiança a 99% para o peso médio das
embalagens.
5.3 - Estimar um intervalo de confiança a 99% para o peso médio das
embalagens, sabendo que σ = 0,6 g.
5-
Resolução:
5.1 - X = 8,5 g ; s = 0,8 g ; s´ = 0,85 g (máq. de calcular);
5.2 - (desv. pad. da popul. desconhecido e n<30) usar X – tα/2
TAB
P(T>tα/2) = 0,005 ⇔ t = 3,355
s'
X – tα/2 ×
n
≤ µ ≤ X + tα/2 ×
s'
n
s'
n
≤ µ ≤ X + tα/2
s'
n
;
⇔ 8,5 – 3,355 × 0,85/ 9 ≤ µ ≤ 8,5 + 3,355 × 0,85/ 9 ⇔
⇔7,55 ≤ µ ≤ 9,45 .
5.3 - (desvio pad. da popul. conhecido) usar X – z
X –z×
n
≤µ≤ X +z×
n
n
≤ µ ≤X + z
n
⇔ 8,5 – 2,575 × 0,6/ 9 ≤ µ ≤ 8,5 +2,575 × 0,6/ 9 ⇔
⇔7,985 ≤ µ ≤ 9,015 .
6 - Numa empresa de engarrafamento de águas existem 2 máquinas em
funcionamento, A e B, que deverão descarregar 1 litro em cada garrafa. Com o objectivo
de testar a sua afinação foram recolhidas aleatoriamente 9 garrafas de A e 10 garrafas de
B, sendo medido o seu conteúdo. O intervalo de confiança a 95% para a média do
conteúdo das garrafas da máquina A, é de [0,9 ; 1,1] . As garrafas cheias pela máquina B
forneceram os seguintes valores:
x = 11
e
( x − x ) 2 = 0,0049 .
6.1 - Calcular o desvio padrão amostral corrigido (s’) referente à amostra B.
6.2 - Calcular o intervalo de confiança a 95% para a média dos conteúdos em B.
6.3 - Atendendo aos valores dos respectivos intervalos de confiança, qual das
máquinas estará mais bem afinada? Justificar.
Miguel Soares Lopes
Ficha 6
64
Inferência Estatística
6-
Resolução:
6.1 - s 'B = 0,023 ;
6.2 - (σ desconhecido e n<30) usar X – tα/2 ×
XB =
x
n
s'
n
≤ µ ≤ X + tα/2 ×
s'
n
11
= 10
= 1,1 ; s 'B =0,023 ; tα/2 = 2,262 ; n = 10 .
1,1 – 2,262 × 0,023/ 10 ≤ µ ≤ 1,1 + 2,262 × 0,023/ 10 ⇔1,083 ≤ µ ≤ 1,117
6.3 - A máquina A é mais exacta mas a máquina B é mais precisa.
7 - Para testar 2 variedades de milho foram escolhidos aleatoriamente 16 talhões, 8
cultivados com a variedade A e outros 8 com a variedade B. Os resultados da colheita
foram 81625 kg e 75875 kg, para o total dos talhões A e B respectivamente, e de
232,41 kg2 e 102,12 kg2 para as variâncias. Sabendo que as produções de ambas as
variedades são normalmente distribuídas e que
2
A
=
2
B
, estimar:
7.1 - Um intervalo de confiança a 99% para a produção média de cada
variedade.
7.2 - Um intervalo de confiança a 95% para a diferença das médias.
7-
Resolução:
7.1 - Variedade A: nA = 8; X A = 81625/8 = 10203,15 kg ; s 'A2 = 232,41 kg2 ;
(σA desconhecido e n<30). Assim, e com tα/2 = 3,499 (α/2= 0,005 e número de
graus de liberdade = 7) vem:
10203,15 – 3,499 × 15,24 / 8 ≤ µ ≤ 10203,15 + 3,499 × 15,24 / 8 ⇔ 10184,29 ≤ µ ≤ 10222,01
Variedade B: nB = 8; X B = 75875/8 = 9484,38 kg ; s 'B2 = 102,12 kg2 ;
(σB desconhecido e n<30). Assim, e com tα/2 = 3,499 (α/2= 0,005 e número de
graus de liberdade = 7) vem:
9484,38 – 3,499 × 10,11 / 8 ≤ µ ≤ 9484,38 + 3,499 × 10,11 / 8 ⇔ 9471,88 ≤ µ ≤ 9496,88
7.2 - Pede-se um intervalo de confiança para a diferença de médias. São
populações normais com variâncias desconhecidas mas iguais; nA e nB <30 Usar
a expressão:
( X A – X B ) – tα/2 × Sc × n1a + n1b
µA–µB ( X A – X B ) + tα/2 × Sc × n1a + n1b
com Sc=
(10203,15–9484,38)–2,145×
×12,93
1
8
2
´2
[( n A −1) s '
A + ( n B −1) s B ]
( n A + n B − 2)
= 12,93
+ 18 µA – µB (10203,15–9484,38)+ 2,145 × 12,93
1
8
⇔718,77 – 13,87 ≤ µ ≤ 718,77 + 13,87 ⇔ 704,90 ≤ µ ≤ 732,64
8 - O número de horas de vida de lâmpadas eléctricas produzidas segundo determinado
processo de fabrico tem distribuição normal. Numa amostra de 20 lâmpadas, escolhida
ao acaso da produção de determinado dia, verificou-se a duração das mesmas e calculou-
Miguel Soares Lopes
Ficha 6
65
+ 18
Inferência Estatística
-se a média e o desvio padrão amostrais: x = 1832 h e s’2 = 484 h.
8.1 - Calcular os intervalos de confiança a 95% e a 99% da média de duração
das lâmpadas.
8.2 - Calcular um intervalo de confiança a 90% para o desvio padrão amostra do
tempo de vida da população.
Resolução:
8 - X = 1832 h e s’2 = 484 h2 ; n = 20 (graus de liberdade 19)
s'
8.1 - (σ desconhecido e n<30) usar X – tα/2 x
n
Com n = 20 e (1-α) = 0,95 t = 2,093
1832 – 2,093 × 22 / 20 ≤ µ ≤ 1832 + 2,093 × 22 /
Com n = 20 e (1-α) = 0,99 t = 2,861
1832 – 2,861 × 22 / 20 ≤ µ ≤ 1832 + 2,861 × 22 /
( n − 1) s'2
8.2 - Usar a expressão:
2
(
2 ; n −1 )
≤
2
≤
≤ µ ≤ X + tα/2 x
s'
n
20 ⇔ 1821,7 ≤ µ ≤ 1842,3 ;
20 ⇔1817,9 ≤ µ ≤ 1846,1 .
( n − 1) s'2
2
(1 −
2 ; n −1 )
Com n = 20 e (1-α) = 0,90
χ2(α/2 , n-1)= 30,144 e χ2(1-α/2 , n-1)= 10,117
19 × 484
19 × 484
2
≤ 2≤
⇔ 305,1 ≤ ≤ 909,0 ⇔ 17,5h ≤ ≤ 30,1h
30,144
10,117
Pedia-se IC para o desvio padrão
9 - A administração do Metropolitano verificou irregularidade na hora de passagem do
comboio pelas diversas estações. Essa irregularidade é uma variável aleatória normal
cuja média se considera ser 5 segundos mas cuja variância se desconhece. Com n = 22 e
s '2 = 9 segundos2 pretende-se saber entre que valores se situa a variância com um nível
de confiança de 99%.
Resolução:
9 - n = 22 e s'2 = 9 segundos2.
Usar a expressão: (n − 1) s' ≤
2
2
(
2
2
≤
2
(n − 1) s'
2
; n −1 )
Com n = 22 e (1-α) = 0,99
χ
21× 9
≤
41,401
2
(1−
2
; n −1)
= 41,401 e χ2(1-α/2,n-1) = 8,034
21× 9
2
2
≤
≤ 23,53s 2
⇔ 4,57s ≤
8,034
(α/2 , n-1)
2
10 - De uma população normal, com média e variância desconhecidas foi retirada uma
2
amostra de 9 observações cujos resultados foram x = 4 ; s '
= 2.
10.1 - Obter um IC a 90% para o desvio padrão da população.
10.2 - Supondo que a variância da população passa a ser conhecida (σ2 = 4)
Miguel Soares Lopes
Ficha 6
66
Inferência Estatística
construir um intervalo de confiança a 95% para a média da população.
10.3 - Como procederia para reduzir para metade a amplitude do intervalo?
Resolução:
10 - X = 4 ; s'2 = 2 ;
2
(n − 1) s'
10.1 - Usar a expressão:
2
(
2
≤
2
≤
2
(n − 1) s'
2
; n −1 )
(1−
2
; n −1)
2
Com n = 9 e (1-α) = 0,95
χ (α/2 , n-1)= 15,507 e χ2(1-α/2 , n-1) = 2,733
8× 2
8× 2
2
≤ 2≤
⇔ 1,03 ≤ ≤ 5,85 ⇔ 1,01 ≤ ≤ 2,42
15,507
2,733
10.2 - σ2 = 4. Usar X – z ×
n
≤ µ ≤X + z ×
n
4 – 1,96 × 2/3 ≤ µ ≤ 4 + 1,96 × 2/3 ⇔ 2,69 ≤ µ ≤ 5,31 :
10.3 - Para que a parcela z ×
n
passasse para metade à custa de “n” era preciso
que o denominador passasse para o dobro. Como “n” está debaixo d raiz quadrada
precisava de aumentava 4 vezes a dimensão da amostra (22).
11 - Na estimação da média de uma população normal por meio de um intervalo de
confiança a 90%, qual deve ser a dimensão mínima da amostra para que a amplitude
daquele intervalo seja inferior a σ/9, sendo σ conhecido?
Resolução:
11 -P(Z<z) = 0,95 ⇔ z = 1,645 ;
Amplitude do IC = 2 × z ×
n
; logo 2 × z ×
n
< σ/9 ⇔2 × 1,645/n < 1/9 ⇔ n > 29,61 ⇔
⇔ n = 30
12 - O patrocinador de um programa de televisão quer ter uma ideia da proporção de
residências que segue um dado programa numa dada área metropolitana. Num inquérito
a 90 residências com as televisões ligadas, verificou que 35 delas estavam sintonizadas
no programa. Construa um intervalo de confiança com um nível de significância de 3%
para a verdadeira proporção de televisões que estavam sintonizadas no dito programa.
Resolução:
12 - A expressão de cálculo deste intervalo é:
pˆ - z 2
pˆ (1 − pˆ )
pˆ (1 − pˆ )
≤ p ≤ pˆ + z 2
n
n
n = 90
35
pˆ =
= 0,389
90
α = 0,3 ⇔ zα/2 = z0,015 = 2,17 (porque, se α/2 é 0,015, então a área à esquerda à 0,985)
Miguel Soares Lopes
Ficha 6
67
Inferência Estatística
Assim:
0,389 × 0,611
0,389 × 0,611
p 0,389 + 2,17 ×
90
90
0,389 – 2,17 × 0,051 p 0,389 + 2,17 × 0,051
0,389 – 0,112 p 0,389 + 0,112
0,277 p 0,500
0,389 – 2,17 ×
Miguel Soares Lopes
Ficha 6
68
Inferência Estatística
Inferência Estatística
Testes de Hipótese
Num teste de hipótese queremos saber se uma suspeita, motivadora da execução
deste teste, poderá ter sustentação através de uma ou mais amostras.
Acompanhemos um exemplo:
13 - Uma pizzaria está dimensionada para que a procura média diária não ultrapasse as
200 pizzas, admitindo um desvio padrão de 15.
Uma promoção, nos últimos 9 dias, levou a uma procura média de 210 pizzas. Pretendese avaliar se é necessário reforçar a capacidade de produção, verificando se houve de
facto uma alteração significativa da procura.
O dono da pizaria suspeita que houve alteração do valor médio da procura diária de
pizzas. Por esse motivo quis fazer um teste de hipótese para averiguar se a sua suspeita
tinha ou não razão de ser. No entanto, qual a alteração que lhe interessa averiguar?
Certamente aquela que o obriga a reforçar a capacidade de produção, ou seja, uma
alteração no sentido do aumento da média.
Ao lançar um teste de hipótese, são avançadas duas hipóteses, H0 (hipótese nula) e
H1 (hipótese alternativa), de tal modo que, se não se realizar a primeira, se realize a
segunda. Quais são as hipóteses do nosso exemplo:
H0: µ
200 pizas
H1: µ > 200 pizas
Mais à frente se explica a razão da
escolha destas hipóteses
A cada teste de hipótese, e em função das condições do mesmo, está associada uma
distribuição. Cada distribuição tem, por sua vez, associada uma estatística. Se
calcularmos o valor dessa estatística a partir do valor atribuído ao parâmetro em teste e
dum estimador proveniente da amostra vamos obter um valor que traduz a relação entre
estas duas entidades.
!
% &
! ( !
+#
,
! ( !
µ
' σ
) *
σ *
.
µ=µ0
µ/µ0
µ0µ0
µ µ0
µ1µ0
µ2µ0
" #$
!
32 4α56 * 314α56
314α
32 4α
No nosso exemplo vemos que, sendo o desvio padrão conhecido (logo a variância
conhecida) a estatística de teste é Z (distribuição normal reduzida) cuja expressão é
Z=
x−
0
, em que x é a média amostral (estimador proveniente da amostra) e µ0 o
n
Miguel Soares Lopes
Ficha 6
69
Inferência Estatística
valor atribuído ao parâmetro em estudo (neste caso 200 pizzas). Se calcularmos o valor
de Z para o nosso exemplo vem:
Z=
210 – 200
15/ 9
=2
Se a relação entre x e µ0 for próxima, isto é, se a “distância” entre eles for
pequena, tendo em atenção o desvio padrão da distribuição e a dimensão da amostra,
então o valor de Z virá próximo de “0” (podendo ser negativo ou positivo). Se pelo
contrário essa “distância” for grande o valor de Z virá muito negativo ou muito positivo.
Como sabemos estes valores de Z localizam-se nas caudas da curva da distribuição
normal padrão, zonas onde a densidade de probabilidade é menor, o que significa que
podemos dizer que estes valores se encontram dentro de uma zona de valores “raros”de
Z. O que aqui foi dito para o nosso exemplo (distribuição de Z) pode ser generalizado
para as distribuições.
Cada teste de hipótese é feito com um determinado grau de probabilidade (1–α) ou,
o que se traduz no mesmo, com uma determinada significância (α
α). Na prática o valor de
α traduz a probabilidade associada à hipótese H1, isto é, de não se aceitar a hipótese H0
ou seja, de se obterem valor da estatística raros (localizados nos extremos da distribuição
em causa).
Ao enunciar H0, um teste de hipótese pode ser de três tipos no que diz respeito à
relação entre o parâmetro e o valor em estudo. Podemos ter:
H0
H1
— o parâmetro é igual a “um valor”;
µ=200
µ 200
— o parâmetro é menor ou igual que “um valor”;
µ 200
µ>200
— o parâmetro é maior ou igual que “um valor”.
µ 200
µ<200
Reparemos que no primeiro caso H0 pode não se realizar em duas situações:
quando o parâmetro for maior que “o valor” ou quando o parâmetro for menor que “o
valor”. Isto indica que a área correspondente a H1 (não realização de H0) se pode
encontrar à direita e à esquerda. Neste caso (caso de “igualdade”) estamos perante um
teste dito “bilateral” pelo que a área α se encontra dividida em duas partes iguais, α/2,
Miguel Soares Lopes
Ficha 6
70
Inferência Estatística
situadas nas duas caudas da curva. Nos segundo e terceiro casos H0 só se pode não
realizar quando o parâmetro for maior que “o valor” no primeiro caso ou quando o
parâmetro for menor que “o valor” no segundo caso. Isto indica que a área
correspondente a H1 (não realização de H0) se encontra toda de um dos lados, estando do
lado direito no primeiro caso e do lado esquerdo no segundo. Neste caso (caso de
“desigualdade”) estamos perante um teste dito “unilateral” pelo que a área α se vai
localizar toda numa ou noutra cauda consoante o teste em causa.
O grau de probabilidade (1–α) usado neste tipo de teste é normalmente de 90%,
95%, 99% (ou outra desta ordem de grandeza). Estes valores de (1–α) estão associados à
hipótese H0 e à hipótese H1 a probabilidade remanescente (α
α).
Ao valor de (1–α), ou ao valor de (α
α), estão associadas áreas de igual valor
delimitadas por valores da variável. No nosso exemplo, e em todos os exercícios em que
não é feita referência ao grau de probabilidade, usa-se o valor de 0,95. Os valores que
delimitam estas áreas terão de ser obtidos nas tabelas das distribuições respectivas. No
nosso exemplo:
!
µ
% &
! ( !
+#
,
! ( !
' σ
) *
σ *
.
µ=µ0
µ/µ0
µ0µ0
µ µ0
µ1µ0
µ2µ0
z0 =
3
X − µ0
σ
n
" #$
!
32 4α56 * 314α56
314α
32 4α
O valor que delimita a área de 0,95 da área de 0,05, o valor zα, pode ser obtido na
tabela da distribuição Normal reduzida. O valor que delimita a região crítica (ver o
quadro acima) é zα (valor que deixa à sua direita uma área α=0,05
=0,05)
Como zα = 1,96 e o Zcalculado = 2, podemos dizer Z>1,96 , o que quer dizer que o Z
está na região crítica. Por isso “rejeitamos H0”.
Como se compreenderá pela desproporção entre as duas probabilidades em jogo
(0,95 versus 0,05), só em casos de elevada “força” do teste se vai verificar H1. É por este
motivo que se deve associar a H1 àquilo que se quer provar pois, se se poder afirmar que
se rejeita H0, é porque o teste teve “força” suficiente para o fazer.
Miguel Soares Lopes
Ficha 6
71
Inferência Estatística
14 - O tempo requerido pelos trabalhadores de uma exploração agrícola para
executarem uma dada tarefa tem uma média de 50 minutos e um desvio padrão de 8
minutos. Para testar o progresso no rendimento dos trabalhadores num dado dia, o
empresário decidiu registar os tempos que 60 trabalhadores levaram para executar tal
tarefa.
14.1 - Qual a probabilidade de que a média da amostra seja superior a 52
minutos?
14.2 - Se a média da amostra for 53 minutos, admitindo que o desvio padrão se
mantém, deverá o empresário considerar que o rendimento dos trabalhadores na
execução da dita tarefa diminuiu?
14 -
Resolução:
14.1 14.2 - Quando se diz que o rendimento diminuiu está-se implicitamente a querer
dizer que o tempo médio de execução da tarefa aumentou.
H0: µ 50 min
H1: µ > 50 min
(associar a suspeita a H1)
Como o desvio padrão é conhecido, usa-se a distribuição normal reduzida (ver o
quadro).
53 – 50
Z= 8/ 60 = 2,90
Como não é dado o valor de (1–α) tomamos esse valor por 0,95 (logo α=0,05).
Consultando o quadro verificamos que a região crítica é dada por Z>z0,05. Pela
tabela da distribuição normal reduzida verificamos que o valor da variável z que
deixa à sua direita 0,05 (à sua esquerda 0,95) é z=1,96.
Verificamos assim, que o valor calculado Z é superior ao valor da tabela.
Assim, como Zcalculado>1,96 rejeitamos H0.
15 - O peso das latas de conserva de uma dada marca, X, segue distribuição normal,
devendo ter, de acordo com as normas, um peso médio de 100 gramas. O controle de
qualidade escolheu uma amostra aleatória de 9 latas, que foram pesadas. Registaram-se
os seguintes resultados:
xi = 870 g
( xi − x ) 2 = 87,12 g 2
Terá sido esta amostra proveniente de uma população com peso médio de 100 g?
(α=0,05).
Resolução:
15 - Este teste para a média não apresenta o valor da variância nem a dimensão da amos-
!
µ
σ
!
Miguel Soares Lopes
( !
7* $
'
)
µ=µ0
µ/µ0
µ0µ0
µ µ0
µ1µ0
µ2µ0
Ficha 6
8t0 =
X − µ0
s
n
" #$
!
82 tα56 * 81tα56
81tα
82 tα
72
Inferência Estatística
tra é maior ou igual a 30. Assim, este teste será feito com o apoio da distribuição
t-Student. As hipóteses são:
H0: µ = 100 g
H1: µ 100 g
xi
n
x=
=
870
9
= 96,7g
s’=
( xi − x ) 2
n −1
=
87 ,12
8
= 3,3
96,7 − 100
=3
3,3
n
9
A região crítica (consultar o quadro) é T<-tα/2 ou T>tα/2 . Usando α=0,05, α/2 vale 0,025
T=
x−
s'
0
=
e o valor de t0,025 pode ser lido na respectiva tabela (que dá áreas à direita), na coluna de
0,025 e na linha n=8. Ter atenção que o “n” da tabela corresponde ao “n” da dimensão
da amostra menos 1. Assim, t0,025 = 2,306, -t0,025 = -2,306 e, portanto, Tcalculado>2,306;
devemos rejeitar H0.
16 - Para testar 2 variedades de milho foram escolhidos aleatoriamente 16 talhões, 8
cultivados com a variedade A e outros 8 com a variedade B.
Os resultados da colheita foram os seguintes:
2
2
2
2
x A = 81,625 kg xB = 75,875 kg s'
s'
A = 232,41073 kg
B = 102,12502 kg
Sabendo que as produções de ambas as variedades são normalmente distribuídas e que
σA2 = σB2 :
16.1 - Estimar um intervalo de confiança a 99% para a produção média de cada
variedade.
16.2 - Verificar se a variedade A é significativamente mais produtiva (α = 1%)
que a variedade B.
16 -
Resolução:
16.1 16.2 - Aqui, “verificar” é testar essa hipótese. Como se trata de uma comparação
de média o teste de hipótese em causa é o da diferença de médias. Como foi
referido anteriormente, aquilo que queremos provar deve ser associado a H1. Assim
as hipóteses são:
H0: µA µB
H1: µA > µB
Dadas as condições do problemas em que as variâncias são desconhecidas e em que
as dimensões das amostras (nA e nB) são menores que 30 (ver quadro) a estatística
Miguel Soares Lopes
Ficha 6
73
Inferência Estatística
!
=
µ1−µ2
" #$
!
8=
µ1=µ2 µ1 µ2
82 tα56 * 81tα56
µ1/µ2 µ11µ2
81tα
n −1 s: + n −1 s:
µ10µ2 µ12µ2 Sc =
n + n −2
82 tα
X1− X 2
Sc 1 n + 1 n
1
2
>
> >*'
σ σ6
!
( !
#*
2
1
1
1
2
2
2
2
do teste será a t-Student:
x A − xB
81,625 − 75,875 5,75
= 0,89
T=
=
=
1
1
6,465
Sc n A + n B
12,93 18 + 18
Sc =
n1 −1 s:12 + n2 −1 s:22
n1 + n2 − 2
=
(8 −1)× 232 , 41+ (8 −1)102 ,12
8+8−2
= 167,27 = 12,93 kg
O limite da região crítica é T>tα. Partindo do valor de α=0,01 e dos valores de nA e
nB iguais a 8 podemos tirar da tabela de t-Student os valores de t.
t(0,01;14)= 2,62449 . Assim, como Tcalculado >2,62449 rejeita-se H0.
17 - Uma máquina de ensacar açúcar está regulada para encher sacos com 16 kg. Para
controlar o seu funcionamento escolheram-se ao acaso 15 sacos da produção de
determinado período, tendo-se obtido os seguintes pesos:
16,0
16,1
15,8
15,9
16,1
15,8
16,2
15,9
16,0
15,7
15,8
15,7
16,0
15,8
16,0
17.1 - Que conclusões tirar quanto ao funcionamento da máquina?
17.2 - Os dados da amostra são compatíveis com a hipótese de que os pesos dos
sacos cheios pela referida máquina apresentam uma variabilidade de 0,01 kg2 ou
seja com H0: σ2=0,01 kg2 ?
17 -
Resolução:
17.1 17.2 - Estamos perante um teste de hipótese para a variância.
H0: σ2 = 0,01 kg2
H1: σ2 0,01 kg2
Consultando o quadro dos testes de hipótese podemos ver que a estatística deste
!
σ
2
%
7* $
'
σ6;σ96
σ6<σ96
σ6/σ96
σ61σ96
σ60σ6
σ62σ6
9
9
χ2 =
n − 1 s:2
σ02
" #$
χ62χ1−α/2
!
6
*
χ61χα/2
6
χ61χα
χ62χ61−α
teste segue a distribuição de χ2 :
χ2 =
n − 1 s:2 (15 − 1) × 0,023
=
=32,2
σ02
0,01
Miguel Soares Lopes
Ficha 6
74
Inferência Estatística
s’=0,023 kg (máq. calcular)
A região crítica deste teste é bilateral (ver o quadro). Como esta distribuição não é
simétrica como a da Normal ou a de t-Student há necessidade de recorrer à tabela
duas vezes (nas outras recorria-se uma vez e depois usava-se também o seu
simétrico). Os limites da região crítica são χ6<χ6(1−α/2) e χ6>χ6α/2 . Partindo do valor de
α=0,05 (quando o valor não é dado usa-se 1-α=095) e do valor de “n” igual a 15
podemos tirar da tabela de χ6 os respectivos valores.
χ2(0,025;14)= 26,119
χ2(0,975;14)= 5,629
Como o valor de χ2calculado >26,119, rejeita-se H0.
18 - Está em estudo a validade de uma bebida gaseificada. Foram seleccionadas ao
acaso 10 garrafas e testada a sua validade. Obtiveram-se os seguintes resultados (em
dias):
108
124
124
106
115
138
163
159
134
139
18.1 - Construir um intervalo de confiança a 95% para µ.
18.2 - Pode a hipótese nula H0: µ = 125 ser rejeitada? (α = 0,05)
18.3 - Qual a decisão a tomar sobre as hipóteses H0: µ ≤ 125 versus H1: µ > 125,
considerando α = 0,05 ?
18.4 - Serão os dados da amostra compatíveis, para α = 0,05, com:
18.4.1 - H0: σ2 = 400 versus H1: σ2 ≠ 400 ?
18.4.2 - H0: σ2 ≥ 400 versus H1: σ2 < 400 ?
18 -
Resolução:
18.1 18.2 - H0: µ = 125
H1: µ ≠ 125
A estatística de teste é t-Student pois a variância é desconhecida e n<30.
x − 0 131 − 125
T=
=
= 0,97
s'
19,54
n
10
x
x = n i = 1310
= 131 dias
s’=19,54 dias (máq. calcular)
10
A região crítica é T<-tα/2 ou T>tα/2 . Usando α=0,05, α/2 vale 0,025 e o
valor de t0,025 pode ser lido na respectiva tabela, na coluna de 0,025 e na linha n=9.
Assim, t0,025 = 2,26216, -t0,025 = 2,26216 e portanto -2,26216≤Tcalculado≤2,26216; assim
não devemos rejeitar H0.
18.3 - H0: µ ≤ 125
H1: µ > 125
A estatística de teste mantém-se, é t-Student, pois a variância é
desconhecida e n<30.
Miguel Soares Lopes
Ficha 6
75
Inferência Estatística
T=
x−
s'
0
=
n
131 − 125
= 0,97
19,54
10
x
x = n i = 1310
= 131 dias
s’=19,54 dias
10
A região crítica é agora T>tα . Usando α=0,05 o valor de t0,05 pode ser lido
na respectiva tabela, na coluna de 0,05 e na linha n=9. Assim, t0,05 = 1,83311, e portanto Tcalculado≤1,83311; assim não devemos rejeitar H0.
18.4 - Nestes dois testes de hipótese para a variância a estatística de teste é o χ2.
18.4.1 - H0: σ2 = 400
H1: σ2 ≠ 400
n − 1 s:2 (10 − 1) × 382
=
= 8,595
σ02
400
s’2= 19,542 kg2 = 382 kg2
A região crítica deste teste é bilateral (ver o quadro). Há
necessidade de recorrer à tabela duas vezes. Os limites da região crítica são
χ6<χ(61−α/2) e χ6>χ6α/2 . Partindo do valor de α=0,05 e do valor de “n” igual a 10
6
podemos tirar da tabela de χ6 os respectivos valores.
2
χ (0,025;9)= 19,023
χ2(0,975;9)= 2,700
Como o valor de 2,700 ≤ χ2calculado ≤ 19,023, não se rejeita H0.
18.4.2 - H0: σ2 ≥ 400
H1: σ2 < 400
χ2 =
n − 1 s:2 (10 − 1) × 382
χ =
=
= 8,595
σ02
400
s’2= 19,542 kg2 = 382 kg2
A região crítica deste teste é unilateral (ver o quadro). Há
necessidade de recorrer à tabela uma vez. O limite da região crítica é χ6<χ(61−α).
Partindo do valor de α=0,05 e do valor de “n” igual a 10 podemos tirar da tabela de
χ6 o respectivo valor.
χ2(0,95;9)= 3,325
Como o valor de χ2calculado 3,325, não se rejeita H0.
2
19 - Uma empresa produz baterias para as quais as normas de fabrico indicam uma
duração média mínima de um ano e meio. Recolhida uma amostra de 9 baterias, estas
foram ensaiadas tendo fornecido a seguinte duração (em anos):
2
1,4
1,6
1,4
1,8
1,5
1,9
1,6
1,2
19.1 - Apresentar uma estimativa para a variância da duração das baterias.
19.2 - Testar a hipótese H0: σ2 = 0,11 , para um nível de significância de 1%.
19.3 - Pressupondo σ2 = 0,11 , verificar se é de admitir uma duração média
conforme as normas de fabrico (α = 0,05).
Miguel Soares Lopes
Ficha 6
76
Inferência Estatística
Resolução:
19 -
19.1 - A estimativa para a variação da duração das baterias é o s’2.
s’2 = 0,07 anos2 (máq. calcular)
19.2 - H0: σ2 = 0,11
H1: σ2 0,11
n − 1 s:2 (9 − 1) × 0,07
χ2 =
=
= 4,91
σ02
0,11
A região crítica deste teste é bilateral (ver o quadro). Há necessidade de
recorrer à tabela duas vezes. Os limites da região crítica são χ6<χ(1−α/2) e χ6>χα/2 .
Partindo do valor de α=0,01 e do valor de “n” igual a 9 podemos tirar da tabela de
χ6 os respectivos valores.
χ2(0,005;8)= 21,955
χ2(0,995;8)= 1,344
Como o valor de 1,344 ≤ χ2calculado ≤ 21,955, não se rejeita H0.
19.3 - Pede-se, neste caso, um teste de hipótese para a média da população com a
variância conhecida. As normas de fabrico apontam para uma duração média
mínima de 1,5 anos.
H0: µ ≤ 125
H1: µ > 125
A estatística de teste é Z:
x − 0 1,6 − 1,5
Z=
=
= 0,90
0,33
n
9
Consultando o quadro verificamos que a região crítica é dada por Z>z0,05. Pela
tabela da distribuição normal reduzida verificamos que o valor da variável z que
deixa à sua direita 0,05 (à sua esquerda 0,95) é z=1,96.
Verificamos assim, que o valor calculado Z é inferior ao valor da tabela.
Assim, como Zcalculado>1,96 rejeitamos H0.
20 - Um fabricante comprou um lote de 3000 componentes electrónicos a uma grande
empresa. Depois de detectar algumas avarias nesses componentes, suspeitou que a
proporção de componentes avariados era superior a 7%. Para se certificar da sua
suspeição recolheu uma amostra aleatória de 80 desses componentes onde detectou 8
com defeito. Construa um teste de hipótese a 95% de confiança tendo em vista a
confirmação da suspeita.
Resolução:
20 - Neste problema é-nos pedido um teste de hipótese para uma proporção.
As hipóteses são:
H0: p 0,07
H1: p > 0,07 (aquilo que se quer provar)
n = 80
8 componentes dos 80 apresentam defeito.
Miguel Soares Lopes
Ficha 6
77
Inferência Estatística
1 – α = 0,95 ⇔ α = 0,05
p̂ =
Z=
8
= 0,1
80
Pˆ − p0
p0 (1− p0 )
n
=
0,10 − 0,07
0,07(1− 0,07)
80
=
0,03
= 1,05
0,029
Região crítica: Z>zα ⇔ Z>1,65 ;
Mas 1,05 < 1,65 pelo que não se rejeita H0 .
Miguel Soares Lopes
Ficha 6
78
Download