Escola Superior de Gestão de Santarém Disciplina de Probabilidade e Estatística _____________________________ Soluções das fichas de exercícios _____________________________ 2011-12 Estatística Descritiva Estatística Descritiva 1 - Indicar quais das seguintes variáveis são discretas e quais são contínuas 1.1 - Valor do PIB nacional. 1.2 - Produtividade média do girassol de regadio no Alentejo. 1.3 - Número de sapatos de um dado tamanho nas sapatarias de Santarém. 1.4 - Efectivo militar em Trás-os-Montes. 1.5 - Número médio de pontos por jogador numa dupla de voleibol de praia num determinado torneio. 1.6 - Toneladas de tomate que chegam por dia a uma fábrica. 1.7 - Número médio de sobreiros nas explorações de montado do Alentejo. Resolução: 1 - Indicar o tipo de variável: Variáveis contínuas: 1.1; 1.2; 1.6; 1.7; Variáveis discretas: 1.3; 1.4; 1.5. 2 - No quadro seguinte apresenta-se o absentismo dos 50 colaboradores de uma empresa de serviços, registado durante o período de um ano (foram excluídas as faltas por motivos justificáveis). 6 4 4 6 0 6 5 13 11 6 4 3 3 11 4 4 8 4 7 7 8 6 6 5 6 6 8 3 3 6 6 1 0 10 6 3 3 2 3 2 2 3 1 8 6 2 2 3 2 0 2.1 - Sendo X a variável em causa, como pode defini-la? E como a classifica? 2.2 - Organize os dados num quadro de distribuição de frequências, com as frequências observadas, relativas e acumuladas. 2.3 - Determine a proporção de empregados que faltaram mais de 3 dias por ano. 2.4 - Calcule e diga o respectivo significado de = , = , = 2.5 - Construa o diagrama de barras e o gráfico de frequências relativas acumuladas 2.6 - Calcule a média, o desvio padrão e o coeficiente de variação. Miguel Soares Lopes Ficha 1 1 Estatística Descritiva 2.7 - Determine a mediana algébrica e graficamente. 2.8 - Determine a moda, o 20º percentil, o 9º decil e o 3º quartil. Resolução: 22.1 - Definição: X — nº de dias de absentismo dos colaboradores da empresa de serviços; Classificação: é uma variável discreta. 2.2 - i — é o índice do grupo de valores; x — é cada um dos valores que a variável pode tomar; i = 1 significa “o primeiro valor da variável” e esse valor é “x = 0” De i = 1 até i = 4 { i x 1 2 0 1 2 3 3 4 5 6 7 8 9 10 11 12 13 14 4 5 6 7 8 9 10 11 12 13 Fi 3 2 6 9 6 2 12 2 4 0 1 2 0 1 fi 0,06 0,04 0,12 0,18 0,12 0,04 0,24 0,04 0,08 0,00 0,02 0,04 0,00 0,02 CumFi Cumfi 3 0,06 5 0,10 0,22 11 20 0,40 26 0,52 28 0,56 40 0,80 42 0,84 46 0,92 46 0,92 47 0,94 49 0,98 49 0,98 50 1,00 Do x21 até ao x26 todos valem 4 2.3 - Prop. de colab. que faltaram mais de 3 dias/ano = 1- Cumf4 = 1 – 0,4 = 0,6. Cumf4 — é a proporção de indivíduos que faltaram desde i = 1 até i = 4 , isto é, desde x = 0 até x = 3 que significa de 0 a 3 dias de faltas. Se à totalidade (100% ou “1”) for retirado Cumf4 ficamos com a proporção dos que faltaram mais de 3 dias. 2.4 - = = F1 + F2 + F3 + F4 = CumF4 = 20 (número de colab. que faltaram até 3 vezes, inclusive. Repare-se que i = 4 corresponde a x = 3); = = F6 + F7 + … +F13 + F14 = CumF14 – CumF5 = 50 – 26 = 24 (número de colab. com 5 ou mais faltas. Repare-se que i = 6 corresponde a x = 5); = = f1 + f2 + f3 + f4 + f5 = Cumf5 = 0,52 (proporção de colab. que faltaram até 4 vezes, inclusive); Miguel Soares Lopes Ficha 1 2 Estatística Descritiva 2.5 - Diagrama de Barras Gráfico de Frequências Relativas Acumuladas x fi = 0 x 0,06 + 1 x 0,04 + 2 x 0,12 + … + 11 x 0,04 + 12 x 0 + 13 x x 0,02 = 4,76 faltas; Fi . x2 – n. 2 3 x 02 + 2 x 12 +… + 0 x 122 + 1 x 132 – 50 x 4,762 σ2 = = = n 50 = 8,34 faltas2 2.6 - µ = σ= 2 σ cv = 2.7 - Me = 8,34 = 2,89 faltas. 2,89 x 100% = x 100% = 60,7% 4,76 = x(25) + x(26) 2 = 4+4 = 4 (ver gráficos) 2 2.8 - Mo = 6 ; P20 = x(10) + x(11) 2 + 2 = =2; D9 = x(45) + x(46) = 8 + 8 = 8 ; 2 2 2 Np = 50 x 0,20 = 10 Np = é inteiro 2 Q3 = x(37 + 1) = x(38) = 6. Np = 50 x 0,90 = 45 Ver diapositivos 47 e 48 da apresentação 1 Np = 50 x 0,75 = 37,5 Np = não é inteiro 3 - Os rendimentos médios mensais (€) de 48 famílias do sector do calçado estão registados no quadro seguinte. 999 1210 870 1360 1330 1340 1485 830 986 1265 1267 1227 1267 826 865 1278 1250 848 1170 1459 1190 956 1345 1436 823 1393 1350 1243 868 1267 800 1339 1235 1336 935 950 1132 905 1376 923 896 1267 847 921 1465 800 871 1235 3.1 - Construa o quadro de distribuição de frequências. Miguel Soares Lopes Ficha 1 3 Estatística Descritiva 3.2 - Represente graficamente os dados através de um histograma, do polígono de frequências e do gráfico das frequências relativas acumuladas. 3.3 - Determine a média e a variância dos dados simples. 3.4 - Determine a média, a mediana, a moda e a variância dos dados agrupados. 3.5 - Classifique a distribuição em termos de assimetria. Resolução: 3- 3.1 - O primeiro passo para construção do quadro de distribuição de frequências é definir o número de classes. Para isso vamos usar a expressão da regra de Sturges. número de classes — m 1 + logN / log2 = 1 + 3,32 x log48 = 6,58 Assim, o número de classes será, em princípio, 6 ou 7. Analisando os dados verificamos que a amplitude dos mesmos é: Ampl. dos dados =Max(x) – Min(x) = 1485 – 800 = 685 Ao estabelecer o número de classes e ao atribuir a cada classe uma dada amplitude definimos um intervalo onde todos os nossos valores deverão estar dentro. Se a nossa amplitude de dados é de 685 então o intervalo resultante da definição das classes terá que ter uma amplitude sempre maior que a anterior. Devemos, tanto quanto possível, criar classes que tenham uma amplitude “simpática”, facilmente manipulável, cujo centro seja também um valor “amigável” (ver diapositivos 27 a 29 da apresentação 1). Assim, e analisando os nossos dados, podemos verificar que, se usarmos 7 classes com amplitude de 100 unidades cada, criamos um intervalo com amplitude de 700 (maior que 685). Se a primeira classe começar em 790 [valor inferior ao menor valor dos dados (800)] a última classe acaba em 1490 [valor superior ao maior valor dos dados (1485)]. As classes terão assim valores com os quais é “simpático” trabalhar. Classe i Fi fi CumFi Cumfi [790 , 890[ 11 0,229 11 0,229 [890 , 990[ 8 0,167 19 0,396 [990 , 1090[ 1 0,021 20 0,417 [1090 , 1190[ 2 0,042 22 0,458 [1190 , 1290[ 13 0,271 35 0,729 [1290 , 1390[ 8 0,167 43 0,896 [1390 , 1490[ 5 0,104 48 1,000 Miguel Soares Lopes Ficha 1 4 Estatística Descritiva 3.2 - 3.3 - Para dados simples vamos trabalhar com os 48 dados tal qual: x= s2 = xi / 48 = 1129,92 € x2 – n. x2 = 8002 + 8002 + 8232 +…+ 14592 + 14652 + 14852 – 48 x 1129,922 = n 48 = 48565,2 €2. 3.4 - Para trabalhar com dados agrupados temos que partir do pressuposto de que, dentro de cada classe, os valores se encontram distribuídos uniformemente. Partindo desse pressuposto resulta que, a média dos valores de cada classe, é o valor médio dessa classe. Assim, temos: x= Classe i Fi fi Ci [790 , 890[ [890 , 990[ [990 , 1090[ [1090 , 1190[ [1190 , 1290[ [1290 , 1390[ [1390 , 1490[ 11 8 1 2 13 8 5 0,229 0,167 0,021 0,042 0,271 0,167 0,104 840 940 1040 1140 1240 1340 1440 Fi x Ci / 48 = 11 x 840 + 8 x 940 +… + 8 x 1340 + 5 x 1440 = 1127,50 €; 48 Me = l.infi + 0,5 – Cunf(i-1) 0,5 – 0,458 x h = 1190 + fi 0,271 Mo = l.infi + (13 – 2) d1 x h = 1190 + x 100 = 1258,75 €; d1 + d2 (13 – 2) + (13 – 8) s2 = x 100 = 1205,50 €; 2 2 2 2 2 Fi.Ci2 – n.x2 11 x 840 + 8 x 940 +… + 8 x 1340 + 5 x 1440 – 48 x 1127,54,76 = = n 48 = 46093,75 €2. 3 x (1127,5 – 1205,5) 3.5 - GAS = 3 (xs – Me) = = -1,09 . 46093,75 Esta distribuição é assimétrica negativa. Miguel Soares Lopes Ficha 1 5 Estatística Descritiva 4 - Obteve-se uma amostra de 200 indivíduos e registou-se a sua altura, tendo-se procedido à sua distribuição em classes, como consta no seguinte quadro: Altura (cm) [148,5 , 155,5[ [155,5 , 162,5[ [162,5 , 169,5[ [169,5 , 176,5[ [176,5 , 183,5[ [183,5 , 190,5[ [190,5 , 197,5[ N.º Indivíduos 4 12 44 64 56 16 4 4.1 - Classifique a variável e defina-a. 4.2 - Determine as frequências relativas e as frequências relativas acumuladas. 4.3 - Qual a proporção de indivíduos com altura inferior a 176,5 cm? Qual a altura máxima correspondente aos 30 % de indivíduos mais baixos? 4.4 - Construa o histograma e o polígono de frequências. 4.5 - Calcule a média e o desvio padrão dos dados agrupados. 4.6 - Construa o diagrama de extremos e quartis. 4.7 - A distribuição é simétrica? Resolução: 4- 4.1 - X — altura dos indivíduos; variável contínua. 4.2 Classe i Altura (cm) N.º Indivíduos (Fi) fi CumFi Cumfi Ci 1 [148,5 ; 155,5[ 4 0,02 4 0,02 152 2 [155,5 ; 162,5[ 12 0,06 16 0,08 159 3 [162,5 ;169,5[ 44 0,22 60 0,3 166 4 [169,5 ; 176,5[ 64 0,32 124 0,62 173 5 [176,5 ; 183,5[ 56 0,28 180 0,9 180 6 [183,5 ; 190,5[ 16 0,08 196 0,98 187 7 [190,5 ; 197,5[ 4 0,02 200 1 194 4.3 - Prop. ind. c/ altura inferior a 176,5 = Cumf4 = 62% P30 (percentil 30) = 169,5 cm. Repare-se que, como neste caso 176,5 é extremo da classe, não é preciso interpolação Miguel Soares Lopes Ficha 1 6 Estatística Descritiva 4.4 Polígono de frequências Histograma 4.5 - X = Fi.Ci2 – n. n 2 s = s= Fi x Ci / n = 2 4 x 152 + 16 x 159 +… + 16 x 187 + 4 x 194 = 200 = 173,7 cm; 4 x 1522 + 16 x 1592 +…+ 16 x 1872 + 4 x 1942 – 200 x 173,72 = = 200 = 69,097 cm2; 69,09 = 8,3 cm. 4.6 - Para fazer o diagrama de extremos e quartis há que calcular Q1, Q2 (ou mediana) e Q3. Q1 = linfi + 0,25 – Cunf(i-1) x h = 162,5 + 0,25 – 0,08 x 7 = 0,22 fi = 162,5 + 5,40 = 167,90 Q2 = linfi + 0,5 – Cunf(i-1) x h = 169,5 + 0,5 – 0,3 x 7 = 0,32 fi = 169,5 + 4,38 = 173,38 Q3 = linfi + 0,75 – Cunf(i-1) 0,75 – 0,62 x h = 176,5 + x7= 0,28 fi = 176,5 + 3,25 = 179,75 Os valores máximo e mínimo (como não temos os dados originais) são os extremos do intervalo das classes. A distribuição é 3 (x – Me) 3 x (173,7 – 173,9) 4.7 - GAS = = = -0,07 assimétrica negativa s 8,3 Me = linfi + 0,5 – Cunf(i-1) 0,5 – 0,3 x h = 169,5 + x 7 = 173,9cm . fi 0,32 Miguel Soares Lopes Ficha 1 7 Estatística Descritiva 5 - O conjunto de dados {69, 85, 75, 89, 73, 61, 62, 75, 98, 63} é uma amostra que representa as classificações percentuais de 10 estudantes num teste de estatística. Determine: 5.1 - A média, a mediana e a moda desta amostra; 5.2 - O desvio absoluto médio, a variância e o desvio padrão; 5.3 - O coeficiente de variação; 5.4 - O coeficiente de assimetria; 5.5 - O coeficiente de curtose. Resolução 5- 61 62 63 5.1 - x = Me = xi / n = 69 73 75 75 85 89 98 61 + 62 + 63 + 69 + 73 + 75 + 75 + 85 + 89 + 98 = 75%; 10 73 + 75 = 74%; 2 Mo = 75%; 5.2 - DM = s2 = | xi – x| |61 - 75| + |62 - 75| + … + |89 - 75| + |98 - 75| n = xi2 – n.x2 = 10 2 2 61 + 62 + … + 892 + 982 – 10 x 752 n 10 = 9,4%; = 137,4; s = 137,4 = 11,72% 11,72 5.3 - cv = s x 100% = x 100% = 15,63% 75 x 5.4 - GAS = 3 (xs – Me) = ou 3 x (75 – 74) = 0,256 ; 11,72 (x – Mo) (75 – 75) = =0 s 11,72 (Q3 – Q1) (85 – 63) 5.5 - C1 = = = 0,344 2 x (P90 – P10) 2 x (93,5 – 61,5) G1 = k = [10 x 0,75] = 7 parte inteira deste produto Q3 = P75 = x(7+1) = x(8) = 85 Q1 = P25 = x(2+1) = x(3) = 63 P90 = P10 = x(9) + x(10) 2 x(1) + x(2) Miguel Soares Lopes 2 Distribuição muito ligeiramente assimétrica positiva (89 + 98) = 93,5 2 (61 + 62) = = 61,5 2 = Ficha 1 k = [10 x 0,25] = 2 Ver diapositivos 48 parte inteira deste produto e 65 da Apresentação 1 k = 10 x 0,90 = 9 k é inteiro k = 10 x 0,10 = 1 k é inteiro 8 Estatística Descritiva 6 - Numa série de 31 medições de temperaturas diárias no mês de Março obteve-se uma média de 20º C e um desvio padrão de 6º C. Depois destes resultados obtidos chegou-se à conclusão que uma das temperaturas diárias estava enganada, a qual foi registada com o valor de 32º C. Determine a média e o desvio-padrão, admitindo que se omite a temperatura incorrecta. Resolução: 6x(31 dias) = (31) xi / n(31) = x(30 dias) = (31) xi / n(30) = (620 – 32) / 30 = 588ºC /30 = 19,6ºC 2 s31 = xi2 – n.x2= (31) xi / 31 = 20ºC ⇔ xi = 31 x 20ºC = 620ºC . (31) xi2 – 31 x 202 = 62 ⇔ (31) n(31) 31 2 2 2 (30) xi = (31) xi – 32 = 13516 – 1024 = 12492ºC 2 s30 = (30) xi2 = 36 x 31 + 12400 = 13516ºC2 xi2 – n.x2= 12492 – 30 x 19,62= 967,2 = 32,24 n(30) 30 30 s = 32,24 = 5,68ºC 7 - A produção por talhão de 10 variedades de ervilhas para congelar foi a seguinte: 21, 18, 30, 12, 14, 17, 28, 10, 16, 25 kg Cada talhão tinha a mesma área e a mesma densidade de plantas. Determinar: 7.1 - Média, mediana e a moda. 7.2 - Variância, desvio padrão e coeficiente de variação. Resolução: 7 - Dados ordenados: 10, 12, 14, 16, 17, 18, 21, 25, 28, 30 7.1 - x = xi / n = 10 + 12 + 14 + 16 + 17 + 18 + 21 + 25 + 28 + 30 = 19,1 kg; 10 17 + 18 Me = = 17,5 kg; 2 Mo = não tem. 7.2 - s2 = xi2 – n.x2 102 + 122 + 142 + … + 252 + 282 + 302 – 10 x 19,12 n = = 410,9 = 41,09 kg2 10 10 = s = 6,41 kg cv = 6,41 x 100% = 33,56% 19,1 Miguel Soares Lopes Ficha 1 9 Álgebra de Acontecimentos e Probabilidades Álgebra de Acontecimentos e Probabilidades 1 - Uma caixa contém 5 lâmpadas das quais 2 são defeituosas. As lâmpadas defeituosas estão numeradas de 1 a 2 e as boas estão numeradas de 3 a 5. Extraem-se 2 lâmpadas ao acaso, sucessivamente sem reposição (experiência I) e com reposição (experiência II). 1.1 - Enumere os acontecimentos elementares do espaço de resultados associado a cada uma das experiências. 1.2 - Defina no espaço de resultados de cada experiência, os acontecimentos adiante indicados: A1 - “saída de uma lâmpada defeituosa na 1ª tiragem”; A2 - “saída de uma lâmpada defeituosa na 2ª tiragem”; A3 - “saída de duas lâmpadas defeituosas”; A4 - “saída de pelo menos uma lâmpada defeituosa”; A5 - “saída de exactamente uma lâmpada defeituosa”; A6 - “saída de uma soma de números inscritos nas lâmpadas inferior a sete”. Resolução apenas do problema com reposição: 1 - Experiência realizada com reposição (a resolução do problema sem reposição não 1.1 L2 L1 1 2 3 4 5 1 (1,1) (2,1) (3,1) (4,1) (5,1) 2 (1,2) (2,2) (3,2) (4,2) (5,2) 3 (1,3) (2,3) (3,3) (4,3) (5,3) 4 (1,4) (2,4) (3,4) (4,4) (5,4) 5 (1,5) (2,5) (3,5) (4,5) (5,5) 1.2 - A1 = {(1,1), (1,2), … , (1,5), (2,1), …, (2,5)} A2 = {(1,1), (2,1), … , (5,1), (1,2), …, (5,2)} A3 = A1 A2={(1,1), (1,2), (2,1), (2,2)} A4 = A1UA2={(1,1), (1,2),…,(1,5),(2,1),…,(2,5),(3,1),…,(5,1), (3,2),…, (5,2)} A5 = (A1UA2)\(A1 A2)={(1,3),…,(1,5),(2,3),…,(2,5),(3,1),…,(5,1),(3,2),…,(5,2)} A6 = A4\{(2,5),(5,2)}={(1,1),(1,2),…,(1,5),(2,1),…,(2,4),(3,1), … , (3,3), (4,1), (4,2), (5,1)} Miguel Soares Lopes Ficha 2 10 Álgebra de Acontecimentos e Probabilidades 2 - As peças que saem de uma linha de produção são marcadas defeituosas (D) ou não defeituosas (N). As peças vão sendo inspeccionadas e registadas, procedendo-se a uma paragem quando se obtenham duas peças defeituosas consecutivas ou quando se tenham registado quatro peças. Descreva o espaço de resultados desta experiência. Resolução: 2 - Podemos facilitar esta tarefa construindo um esquema em árvore: DD DNDD DNDN DNND DNNN NDD NDND NDNN NNDD NNDN NNND NNNN 3 - Considere a experiência aleatória que consiste no lançamento de dois dados perfeitos, um vermelho e outro verde. 3.1 - Defina o espaço de resultados desta experiência enumerando os acontecimentos elementares que o compõem; 3.2 - Defina no espaço de resultados os seguintes acontecimentos: A - “a soma dos resultados é sete”; B - “os resultados observados são ímpares”; C - “o produto dos resultados é 12”. 3- Resolução 3.1 - Verm Verd Miguel Soares Lopes 1 2 3 4 5 6 1 (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) 2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) 3 (1,3) (2,3) (3,3) (4,3) (5,3) (6,3) 4 (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) 5 (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) 6 (1,6) (2,6) (3,6) (4,6) (5,6) (6,6) Ficha 2 11 Álgebra de Acontecimentos e Probabilidades 3.2 - A = {(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)} B = {(1,1), (3,1), (5,1), (1,3), (3,3), (5,3), (1,5), (3,5), (5,5)} C = {(2,6), (6,2), (3,4), (4,3)} 4 - Quantos são os códigos de 4 algarismos diferentes que se podem formar com os algarismos “1”, “2”, “3” e “4” e em que: 4.1 - apareça o grupo “42” (isto é, o “4” apareça sempre imediatamente antes do “2”)? 4.2 - o “1” apareça junto do 3 em qualquer ordem, (isto é, imediatamente antes ou depois do “3”)? Resolução: 4- A posição do “4” só pode 4.1 - ser nas 3 primeiras casas para que o “2” possa estar após o “4” 4 2 4 Podemos ter 6 códigos; 4.2 A posição do “3” relativamente ao”1” pode ser antes ou depois dele. 1 3 3 1 1 3 Podemos ter 12 códigos 2 4 3 1 1 3 2 3 1 Para cada “42” podem ter-se duas combinações: 1,3 e 3,1. Logo 3 x 2 = 6 Para cada “13” ou “31” podem ter-se duas combinações: 2,4 e 4,2. Logo 6 x 2 = 12 5 - Sejam A1 e A2 dois acontecimentos, tais que: A1 - “realiza-se quando um automobilista, escolhido ao acaso numa bomba de gasolina, verifica o ar dos pneus”; A2 - “realiza-se quando um automobilista, escolhido ao acaso numa bomba de gasolina, verifica o óleo do motor”. 5.1 - Exprima em função deles os seguintes acontecimentos: A - “realiza-se quando um automobilista não verifica o ar dos pneus”; B - “realiza-se quando um automobilista verifica o ar dos pneus ou o óleo do motor”; C - “realiza-se quando um automobilista não verifica o ar dos pneus nem o óleo do motor”; D - “realiza-se quando um automobilista não verifica o ar dos pneus ou verifica o óleo do motor”; E - “realiza-se quando um automobilista verifica o ar dos pneus e não verifica o óleo do motor”; Miguel Soares Lopes Ficha 2 12 Álgebra de Acontecimentos e Probabilidades F - “realiza-se quando um automobilista verifica o óleo do motor e não verifica o ar dos pneus”; G - “realiza-se quando um automobilista verifica uma e uma só das duas”. 5.2 - Os acontecimentos E e F são incompatíveis? 5.3 - Exprima o acontecimento G em função de E e F. Resolução: 55.1 - 5.2 - S A = A1 E = A1-A2 B = A1UA2 F = A2-A1 C = (A1UA2) G = (A1UA2)-(A1 A2) D = (A1-A2) im, E e F são incompatíveis pois não se interceptam. 5.3 - G = EUF 6 - Considere o seguinte espaço amostral: S={1,2,3,4,5,6,7} e os acontecimentos: A = { 1 , 2 , 7 } B={2,3,4} C={6} Determine: 6.1 6.2 6.3 6.4 6.5 6.6 - A; (AUC) (A B) UC B C A B C (AUB) (A C) Resolução: 6- 6.1 6.2 6.3 6.4 6.5 6.6 - A = {3, 4, 5, 6}; (AUC) = {1, 2, 6, 7}; (A B) U C = {1, 2, 3, 4, 5, 7}; B C = {1, 5, 7}; A B C = { }; (AUB) (A C) = {6}; 7 - Considere um dado desequilibrado em que o “5” e o “6” ocorrem o dobro das vezes do “4” que, por sua vez, ocorre o triplo das vezes do “1”, do “2” ou do “3”. Se se lançar o dado uma vez, qual a probabilidade do resultado obtido ser: Miguel Soares Lopes Ficha 2 13 Álgebra de Acontecimentos e Probabilidades 7.1 - um número par; 7.2 - um número maior que 3; 7.3 - um quadrado perfeito. Resolução: 7- P(5) = P(6) = 2 x P(4) P(4) = 3 x P(1) = 3 x P(2) = 3 x P(3) P(1) = P(2) = P(3) Como P(1) + P(2) + P(3) + P(4) + P(5) + P(6) = 1 podemos escrever que P(1) + P(1) + P(1) + 3 x P(1) + 2 x 3 x P(1) + 2 x 3 x P(1) = 1 ⇔ 18 x P(1) = 1 ⇔ ⇔P(1) = 1/18 P(1) 1/18 P(2) 1/18 P(3) 1/18 P(4) 3/18 P(5) 6/18 P(6) 6/18 7.1 - P(sair par) = P(2) + P(4) + P(6) = 10/18 = 5/9; 7.2 - P(sair maior que 3) = P(4) + P(5) + P(6) = 15/18 = 5/6; 7.3 - P(sair um quadrado perfeito) = P(1) + P(4) = 4/18 =2/9 8 - Num lago existem 10 caracóis aquáticos da espécie X, 15 da espécie Y e 50 da espécie Z. Os caracóis foram capturados um de cada vez para inspecção. 8.1 - Se depois da inspecção cada caracol for devolvido ao lago, calcular a probabilidade de, em 2 capturas sucessivas: 8.1.1 - os 2 caracóis serem da espécie X. 8.1.2 - um caracol ser da espécie X e outro da espécie Z. 8.2 - Se o caracol não for devolvido ao lago depois da captura, calcular a probabilidade de, em 2 capturas sucessivas: 8.2.1 - os 2 caracóis serem da espécie X. 8.2.2 - um caracol ser da espécie X e outro da espécie Z. 8.3 - Qual a probabilidade de, numa captura, obter um caracol da espécie X ou Y? Resolução: 8- P(X) = 10/75; P(Y) = 15/75; P(Z) = 50/75. 8.1 - Com devolução: 8.1.1 - P(X, X) = 10/75 x 10/75 = 100/5625 8.1.2 - P(1 da espécie X e outro da espécie Z) = P(X, Z) + P(Z, X) = = 10/75 x 50/75 + 50/75 x 10/75 = 1000/5625 8.2 - Sem devolução Miguel Soares Lopes Ficha 2 14 Álgebra de Acontecimentos e Probabilidades 8.2.1 - P(X, X) = 10/75 x 9/74 = 90/5550 8.2.2 - P(1 da espécie X e outro da espécie Z) = P(X, Z) + P(Z, X) = = 10/75 x 50/74 + 50/75 x 10/74 = 1000/5550 8.3 - P(XUY) = P(X) + P(Y) = 10/75 + 15/75 = 1/3 9 - Um gerente de um restaurante admite que todos os clientes terão, no fim da refeição, ou fruta, ou queijo, ou ainda café, ou qualquer combinação e que a probabilidade de terem fruta é de 0,7 , fruta e queijo 0,25 , queijo e café 0,35 e fruta e café 0,5. Sabe também que a probabilidade de terem fruta ou queijo é 0,9 e de terem fruta ou café é de 0,95. Calcular a proporção de clientes que terão: 9.1 - queijo ou café; 9.2 - fruta, queijo e café; 9.3 - apenas café. 9P(F) 0,7 P(F Q) P(Q C) P(F C) P(FUQ) P(FUC) 0,25 0,35 0,5 0,9 0,95 Sabe-se também que: P(FUCUQ) = P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C) + P(F Q C) = 1 9.1 - P(FUQ) = P(F) + P(Q) – P(F Q) = 0,9 ⇔ ⇔ P(Q) = 0,9 – P(F) + P(F Q) ⇔ P(Q) = 0,9 – 0,7 + 0,25 = 0,45 P(FUC) = P(F) + P(C) – P(F C) = 0,95 ⇔ ⇔ P(C) = 0,95 – P(F) + P(F C) ⇔ P(Q) = 0,95 – 0,7 + 0,5 = 0,75 P(QUC) = P(Q) + P(C) – P(Q C) = 0,45 + 0,75 – 0,35 = 0,85; 9.2 - P(FUCUQ) = P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C) + P(F Q C) = 1 ⇔ ⇔ P(F Q C) = 1 – [P(F) + P(Q) + P(C) – P(F Q) – P(Q C) – P(F C)] ⇔ ⇔ P(F Q C) = 1 – [0,7 + 0,45 + 0,75 – 0,25 – 0,35 – 0,5] = 0,20 9.3 - P(apenas café) = P(C) – P(Q C) – P(F C) + F Q C) = = 0,75 – 0,35 – 0,5 + 0,20 = 0,1 10 -Sejam A e B dois acontecimentos independentes tais que P(A)=0,4 e P(B-A)=0,18. 10.1 - Represente os acontecimentos através de um diagrama de Venn. 10.2 - Determine P(B). Resolução: 10 - 10.1 - Miguel Soares Lopes Ficha 2 15 Álgebra de Acontecimentos e Probabilidades 10.2 - P(AUB) = P(A) + P(B-A) = 0,4 + 0,18 = 058 P(AUB) = P(A) + P(B) – P(A B) = 058 ⇔ ⇔ 0,4 + P(B) – 0,4 x P(B) = 058 ⇔ ⇔ P(B) x (1 – 0,4) = 0,58 – 0,4 ⇔ ⇔ P(B) = 0,18 / 0,6 = 0,3 11 -Sejam A, B e C três subconjuntos de Ω, tal que A e B são independentes e A e C são incompatíveis. Seja P(A) = 0,2 , P(B) = 0,4 e P(C) = 0,45. 11.1 - Represente através de um diagrama de Venn o espaço de resultados Ω Sabendo que P(B C) = 0,1, calcule a probabilidade de um elemento de Ω escolhido ao acaso: 11.2 - pertencer a pelo menos um dos subconjuntos; 11.3 - pertencer exclusivamente a B; 11.4 - pertencer a A sabendo que pertence a B; 11.5 - pertencer a C sabendo que pertence a B. 11 - Resolução: 11.1 - Não esquecer que A e B são independentes e portanto P(AB)=P(A) x P(B) 11.2 - P(AUBUC) = P(A) + P(B) + P(C) – P(AB) – P(BC) = = 0,2 + 0 4 + 0,45 – 0,2 x 0,4 – 0,1 = 0,87 11.3 - P(pert. exclusi. a B) = P(B) – P(AB) – P(BC) = 0,4 – 0,08 – 0,1 = 0,22 Como se pode ver P(A|B) = P(A). 11.4 - P(A|B) = P(AB)/P(B) = 0,08/0,4 = 0,2 = P(A) Como se sabia A e B são 11.5 - P(C|B) = P(CB)/P(B) = 0,1/0,4 = 0,25 independentes. 12 -Num colégio com 100 alunos, 42 estudam Matemática, 68 Psicologia, 54 História, 22 simultaneamente Matemática e História, 25 simultaneamente Matemática e Psicologia, 7 História mas nem Matemática nem Psicologia, 10 estudam as três disciplinas. Escolheu-se um aluno ao acaso: 12.1 - qual é a probabilidade desse aluno estudar Matemática ou História? 12.2 - se esse aluno estudar Psicologia, qual é a probabilidade de estudar as outras duas disciplinas? Miguel Soares Lopes Ficha 2 16 Álgebra de Acontecimentos e Probabilidades 12.3 - se esse aluno não estudar Psicologia, qual é a probabilidade de estudar as outras duas disciplinas? 12.4 - se esse aluno estudar Matemática, qual é a probabilidade de também estudar as outras duas disciplinas? 12.5 - qual é a probabilidade desse aluno estudar Matemática e também as outras duas disciplinas? 12.6 - se esse aluno estudar História, qual é a probabilidade de estudar Matemática mas não estudar Psicologia? Resolução: 12 -A construção do diagrama de Venn é, nestes casos, muito útil. Para isso devem ser representados os conjuntos definidos no enunciado com as respectivas intercepções (caso seja dito que há incompatibilidade entre dois deles, essa intercepção não é representada). Cada uma das regiões definidas corresponde a um grupo muito concreto. Por exemplo, a região correspondente à intercepção das três disciplinas quer dizer que os alunos em questão têm as três disciplinas e no enunciado é dito que são “10”. É também referido que 22 alunos estudam simultaneamente Matemática e História: ora já é sabido que 10 alunos estudam Matemática e História (mas estudam também Psicologia) mas há, pelos vistos, mais 12 que só estudam aquelas duas disciplinas. Há 25 alunos que estudam simultaneamente Matemática e Psicologia. De novo, é sabido que 10 alunos estudam Matemática e Psicologia (mas estudam também História) mas há, pelos vistos, mais 15 que só estudam aquelas duas disciplinas. É este o tipo de raciocínio que tem que ser feito para se chegar a construção do diagrama de Venn que vem a seguir. 12.1 - P(MUH) = (5 + 15 + 12+ 10 + 7 + 25)/100 = 74/100; 12.2 - P(MH|P) = P(MHP)/P(P) = (10/100)/(54/100) = 10/54; 12.3 - P(MH|P) = P(MHP)/P(P) = (12/100)/(32/100) 12/32 12.4 - P(PH|M) = P(PHM)/P(M) = (10/100)/(42/100) = 10/42; 12.5 - P(MHP) = 10/100 12.6 - P(MP|H) = P(MPH)/P(H) = (12/100)/(54/100) = 12/54 13 -Considere a experiência que consiste em lançar, dois dados e registar o número saído em cada um deles. 13.1 - Se um dos dados mostrar "6", 13.1.1 - Qual é a probabilidade do outro mostrar "5"? Miguel Soares Lopes Ficha 2 17 Álgebra de Acontecimentos e Probabilidades 13.1.2 - Qual é a probabilidade da soma dos números saídos em ambos ser menor do que 9? 13.2 - Se a soma dos números saídos for 9, qual a probabilidade de um dos dados mostrar “4”? 13 - Resolução: 13.1 - Subconjunto dos pares em que num dos dados há um “6”: = {(1,6), (2,6), (3,6), (4,6), (5,6), (6,6), (6,1), (6,2), (6,3), (6,4), (6,5)} 13.1.1 - P(um dado ter 5 | outro dado tem 6) = 2/11 13.1.2 - P(soma < 9 | um dado tem 6) = 4/11 13.2 - P(um dado ter 4 | soma dos dados é 9) = 2/4 = 1/2 6 Miguel Soares Lopes Ficha 2 18 Álgebra de Acontecimentos e Probabilidades Probabilidades Condicionadas. Teoremas de Bayes e da Probabilidade Total 14 -Uma loja de brinquedos emprega 3 senhoras para fazerem embrulhos durante a época de Natal. Raquel embrulha 30% dos presentes e esquece-se de tirar o preço 3% das vezes; Helena embrulha 20% dos presentes e esquece-se de tirar o preço 8% das vezes; Joana, que embrulha os restantes presentes, esquece-se 5% das vezes de tirar o preço. Suponha que tinha ido a essa loja verificando, em casa, que o seu presente tinha preço. 14.1 - Calcule a probabilidade de ter sido embrulhado pela Joana. 14.2 - Qual a empregada que mais provavelmente o terá embrulhado? Resolução: 14 - P(R) = 0,30; P(P|R) = 0,03; P(H) = 0,20; P(J) = 1 – (0,30 + 0,20) = 0,50; P(P|H) = 0,08; P(P|J) = 0,05. 14.1 - P(J|P) = [P(P|J) x P(J)] / P(P) = [0,05 x 0,50] / 0,05 = 0,50 P(P) = P(R) x P(P|R) + P(H) x P(P|H) + P(J) x P(P|J) = = 0,30 x 0,03 + 0,20 x 0,08 +0,50 x 0,05 = 0,05 14.2 - Faz-se o mesmo tipo de cálculo para a Raquel e para a Helena e obtém-se: P(R|P) = 0,32; P(H|P) = 0,18. Como para a Joana tínhamos P(J|P) = 0,50, logo é a Joana. 15 - Um agricultor produz sementes de uma leguminosa em 3 campos distintos A, B e C; em A produz 12% das sementes, em B 30% e as restantes em C. Para que possam ser homologadas para comercialização não podem apresentar mais que uma determinada percentagem de impurezas e de sementes de infestantes. Sabe-se por amostragem que 2% dos sacos de sementes provenientes de A, 3% dos provenientes de B e 5% dos provenientes de C são rejeitados. 15.1 - Qual a probabilidade de um saco escolhido ao acaso ser recusado. 15.2 - Se posteriormente se retirar um saco e se verificar que é para recusar determine a probabilidade de ser proveniente do campo B. Resolução: 15 P(A) = 0,12; P(R|A) = 0,02; P(B) = 0,30; P(C) = 1– (0,12 + 0,30) = 0,58 P(R|B) = 0,03; P(R|C) = 0,05 15.1 - P(R) = P(A) x P(R|A) + P(B) x P(R|B) + P(C) x P(R|C) = = 0,12 x 0,02 + 0,30 x 0,03 + 0,58 x 0,05 = 0,0404; 15.2 - P(B|R) = [P(R|B) x P(B)] / P(R) = [0,03 x 0,30] / 0,0404 = 0,223 Miguel Soares Lopes Ficha 2 19 Álgebra de Acontecimentos e Probabilidades 16 -Um comerciante recebe ovos de 3 proveniências: A, B e C, segundo as seguintes percentagens: A – 10%, B – x %, C – y %. 16.1 - A percentagem de ovos estragados varia segundo as proveniências e sabe- -se que, dos ovos provenientes de A, 5% são estragados; dos ovos provenientes de B, 10% são estragados; dos ovos provenientes de C, 15% são estragados. 16.2 - Por outro lado sabe-se que 12% do total dos ovos recebidos pelo comerciante são estragados. Calcular x e y. Resolução: 16 P(A) = 0,10; P(E|A) = 0,05; P(B) = x; P(C) = y ; P(E|B) = 0,10; P(E|C) = 0,15 ; P(E) = 0,12 . Como temos 2 incógnitas vamos resolver por um sistema. Quais são as equações do sistema? Uma, é a expressão de cálculo da probabilidade total de “estragados”, a outra é a soma das percentagens de ovos por proveniência que terá de somar 100%. P(E) = P(A) x P(E|A) + P(B) x P(E|B) + P(C) x P(E|C) = 0,12 ⇔ P(A) + P(B) + P(C) = 1 { 0,10 x 0,05 + x x 0,10 + y x 0,15 = 0,12 0,005 + 0,10 x (0,90 – y) + 0,15y = 0,12 ⇔ ⇔{ ⇔ ⇔{ 0,10 + x + y = 1 x = 0,90 – y { { { ⇔ -0,10y + 0,15y = 0,025⇔ 0,05y = 0,025⇔ y = 0,5 — — x = 0,90 – 0,5 = 0,4 P(B) = 0,4 e P(C) = 0,5. 17 -A e B são fornecedores de um artigo a uma empresa transformadora que o armazena num contentor. Sabe-se que 5% dos artigos de A e 9% dos artigos de B são defeituosos, razão pela qual A fornece à referida empresa transformadora o quádruplo de B. Foi escolhido ao acaso um dos artigos do contentor e verificou-se que não é defeituoso. Qual é a probabilidade de ter sido fornecido por A? Resolução: 17 - P(D|A) = 0,05 e P(D|B) = 0,09; logo P(D|A) = 0,95 e P(D|B) = 0,91 . P(A) = 4 x P(B); P(A) + P(B) = 1 ⇔ 4 x P(B) + P(B) = 1 ⇔ 5 P(B) = 1 ⇔ P(B) = 1/5 e P(A) = 4/5 P(A|D) = [P(D|A) x P(A)] / P(D) ⇔ 0,95 x 0,8 / 0,942 = 0,807 P(D) = P(A) x P(D|A) + P(B) x P(D|B) = 4/5 x 0,05 + 1/5 x 0,09 = 0,058 logo P(D) = 1 – 0,058 = 0,942 Miguel Soares Lopes Ficha 2 20 Álgebra de Acontecimentos e Probabilidades 18 -Há um saco preto que contém 9 bolas coloridas, sendo 1 bola branca, 1 amarela, 1 azul, 2 verdes, 2 vermelhas e 2 castanhas. Retiraram-se 3 bolas sucessivamente do saco e registou-se a cor de cada uma. Determine: 18.1 - a probabilidade de, pelo menos, uma das 3 bolas ser vermelha, sabendo que a experiência foi realizada com reposição. 18.2 - a probabilidade de, exactamente, uma das 3 bolas ser vermelha sabendo que a experiência foi realizada sem reposição. Resolução: 18 - 18.1 - P(pelo menos uma V) = 1 – P(nenhuma V) = 1 – P(NNN) = 1 – (7/9)3 = = 1 – 0,471 = 0,529 18.2 - P(exactamente uma ser V) = P(VNN) + P(NVN) + P(NNV) = 3 x P(VNN) = = 3 x 2/9 x 7/8 x 6/7 = 0,5 estas 3 probabilidades têm o mesmo valor 19 -Uma empresa recebe diariamente leite de 3 distritos diferentes. Ao chegar cada entrega o produto é classificado de acordo com a qualidade em regular (R), bom (B) e extra (E). Determinar a origem mais provável de um lote recentemente entregue sabendo que é de qualidade extra e que as classificações até à data são: Distritos 1 2 3 Total entregue (l) 1 000 000 3 000 000 2 500 000 Quantidade (l) R B E 200 000 500 000 300 000 500 000 2 000 000 500 000 600 000 1 500 000 400 000 Resolução: 19 -P(1|E) = 300 000 / 1 200 000 = 3/12; P(2|E) = 500 000 / 1 200 000 = 5/12; P(3|E) = 400 000 / 1 200 000 = 4/12. A origem mais provável do lote é o distrito 2. 20 -Numa sala estão três caixas iguais, numeradas de 1 a 3 e contendo bolas coloridas conforme se mostra na tabela: Caixa 1 2 3 Nº bolas Nº bolas vermelhas brancas 2 3 4 1 3 4 Nº bolas azuis 5 3 3 De uma caixa seleccionada aleatoriamente extraiu-se uma bola e verificou-se que era vermelha. Qual a probabilidade de ter sido retirada da caixa 3? Resolução: 20 -P(3|V) = P(V|3) x P(3) = 3/10 x 1/3 = 3/10 P(V) 1/3 Miguel Soares Lopes Ficha 2 21 Álgebra de Acontecimentos e Probabilidades P(V|3) = 3/10 P(3) = 1/3 P(V) = P(V|1) x P(1) + P(V|2) x P(2) + P(V|3) x P(3) = = 2/10 x 1/3 + 4/8 x 1/3 +3/10 x 1/3 = 1/3 Aqui, P(V) deve ser calculado através do teorema das probabilidades totais porque existem três “probabilidades de ser vermelha”, uma em cada subconjunto. Assim a P(V) total terá que ser calculada assim. Miguel Soares Lopes Ficha 2 22 Variáveis Aleatórias Unidimensionais Variáveis Aleatórias Unidimensionais 1 - Considere as variáveis aleatórias seguintes. Indique quais são as variáveis aleatórias discretas e contínuas justificando a resposta. 1.1 1.2 1.3 1.4 1.5 - M = idade de uma estrela escolhida ao acaso. N = número de estrelas que se podem observar, à noite, a olho nu. O = número de avarias de uma máquina num intervalo de tempo. P = tempo entre avarias consecutivas de uma máquina. Q = classificação média obtida pelos alunos do 12º ano, no exame nacional de Matemática de um determinado ano lectivo. 1.6 - R = número de alunos do 12º ano com classificação negativa, no exame nacional de Matemática de um determinado ano lectivo. 1.7 - S = número de cabelos de uma mulher. 1.8 - T = duração de uma partida de futebol. 1.9 - U = número de interrupções numa partida de futebol. 1.10 - V = quantidade de comida (em kg) ingerida, por dia, por um adulto. 1.11 - W = número de espectadores numa partida de futebol disputada num estádio com lotação de 50 000 pessoas. 1.12 - X = produção diária de leite numa fábrica de lacticínios. 1.13 - Y = produção diária de uma fábrica de parafusos. 1.14 - Z = produção diária de calças de uma fábrica de confecções. Resolução: 1 - Indicar o tipo de variável: Variáveis discretas: 1.2; 1.3; 1.6; 1.7; 1.9; 1.11; 1.13; e 1.14; Variáveis contínuas: 1.1, 1.4; 1.5; 1.8; 1.10 e 1.12. 2 - Uma célula por multiplicação origina, no máximo, 4 células filhas. A probabilidade de formação de x células filhas é dada por: X 1 2 3 4 f (x) 1/4 3/8 1/8 1/4 2.1 - Verificar que f(x) é uma função de probabilidade. Traçar o gráfico de f(x). 2.2 - Determinar a função de distribuição F(x) e traçar o respectivo gráfico. 2.3 - Calcular a probabilidade de formação de pelo menos 2 células filhas. 2- Resolução: 2.1 - f(x) ≥ 0, ∀x ∈{1, 2, 3, 4} e 1/4 + 3/8 + 1/8 + 1/4 =1 Miguel Soares Lopes Ficha 3 23 Variáveis Aleatórias Unidimensionais 0 , x <1 1/ 4 , 1 ≤ x < 2 2.2 - F ( x) = 5 / 8 , 2 ≤ x < 3 6/8, 3≤ x < 4 1, x ≥ 4 2.3 - P(X≥2) = 1/4 + 3/8 + 1/8 =3/4 ou P(X≥2) = 1 – F(1)=1 – 1/4=3/4 3 - O número de lançamentos num ramo é uma variável aleatória X, que toma os valores x, com probabilidade p(x) = k x , x = 1, 2,..., 10. 3.1 - Calcular k de modo que p(x) seja uma função de probabilidade. 3.2 - Calcular a probabilidade de um ramo ter 2 lançamentos. 3.3 - Calcular o número médio de lançamentos por ramo. 3- Resolução: x p(x) 1 k 2 2k 3 3k 4 4k 5 5k 6 6k 7 7k 8 8k 9 9k 10 10k 3.1 - k + 2k + 3k + … + 9k + 10k = 1 ⇔ 55k = 1 ⇔ k = 1/55 3.2 - P(X=2) = p(2) = 2/55 3.3 - µ = 1 x 1/55 + 2 x 2/55 + … + 9 x 9/55 + 10 x 10/55 = 385/55 = 7 lançamentos por ramo. 4 - Sendo X uma variável aleatória com função de probabilidade: x 0 1 2 3 4 5 6 7 f(x) 0,1 0,1 0,1 0,1 0,2 0,2 0,1 0,1 4.1 - Determinar a função de distribuição de X. 4.2 - Calcular P(X > 2), P(X < 4), P(X ≥ 1X ≤ 4). 4.3 - Calcular µ e σ. 4- Resolução: 0, x<0 0,1 , 0 ≤ x < 1 0,2 , 1 ≤ x < 2 4.1 - 0,3 , 2 ≤ x < 3 F ( x) = 0,4 , 3 ≤ x < 4 0,6 , 4 ≤ x < 5 0,8 , 5 ≤ x < 6 0,9 , 6 ≤ x < 7 1,0 , x ≥ 7 Miguel Soares Lopes Ficha 3 24 Variáveis Aleatórias Unidimensionais 4.2 - P(X > 2) = 0,7 P(X < 4) = 0,4 P(X ≥ 1X ≤ 4) = P(1≤X ≤ 4) 0,5 5 = = 0,6 6 P(X ≤ 4) 4.3 - µ = Σ x x f(x) = 0 x 0,1 + 1 x 0,1 + … + 6 x 0,1 + 7 x 0,1 = 3,7 σ2 = Σ x2 x f(x) – µ2 = 02 x 0,1 + 12 x 0,1 + … + 62 x 0,1 + 72 x 0,1 – 3,72 = = 18,1 – 13,69 = 4,41 σ = 4,41 = 2,1 5 - Numa experiência com um inibidor de apetite, o número de refeições, N, que um rato toma por dia é anotado. Em cada dia são fornecidas 2 refeições. 4 1 7 2 e a variância do número de refeições comidas por dia. n Tendo N uma função de probabilidade P ( N = n) = , n = 0, 1, 2 , calcular a média Resolução: 5 - Temos que calcular primeiro a função de probabilidade: N P(N=n) 0 4/7 1 2/7 2 1/7 µ = Σ x x P(N) = 0 x 4/7 + 1 x 2/7 + 2 x 1/7 = 4/7 σ2 = Σ x2 x P(N) – µ2 = 02 x 4/7 + 12 x 2/7 + 22 x 1/7 – (4/7)2 = 0,53 6 - Sendo X uma variável aleatória discreta com função de distribuição: 0 1 8 3 8 F (x)= 5 8 6 8 1 , x < -4 , - 4 ≤ x < -2 , -2≤ x <0 , 0≤ x <2 , 2≤ x <4 Determinar a função de probabilidade f(x), µ e σ2 . , x≥4 Resolução: 6 - Para resolver este problema precisamos de definir a função de probabilidade f(x). O raciocínio que deve ser feito será um raciocínio contrário àquele que se faz quando, a partir da função de probabilidade, se pede a função de distribuição, F(x). Se analisarmos a função F(x) percebemos que, até ao ponto “-4” (exclusive), isto é, para “x<-4”, a probabilidade acumulada é “0”. Já a partir deste ponto, isto é, de “x=-4” e até ao ponto “x=-2” (exclusive), isto é, no intervalo “x≤-4”, a probabilidade acumulada é “1/8”. Ora isto só é possível se no ponto “x=-4” a probabilidade for “1/8” e daí até Miguel Soares Lopes Ficha 3 25 Variáveis Aleatórias Unidimensionais “x=-2” (exclusive) não houver nenhum ponto de probabilidade diferente de “0”. No ponto “x=-2” a probabilidade acumulada passa para “3/8”; ora isso só é possível se, nesse ponto, houver um acréscimo de probabilidade de “2/8”. Repare-se que essa probabilidade acumulada se mantém até “x=0” (exclusive), o que significa que, desde o ponto “x=-2” até “x=0” (exclusive), não houve nenhum ponto com probabilidade diferente de “0”. Este raciocínio terá que ser feito para todos os outros pontos apresentados na F(x). A função de probabilidade f(x) vem então: x -4 -2 0 2 4 f(x) 1/8 2/8 2/8 1/8 2/8 Podemos agora calcular µ e σ2. µ = Σ x x f(x) = -4 x 1/8 – 2 x 2/8 + 0 x 2/8 + 2 x 1/8 + 4 x 2/8 = 1/4 σ2 = Σ x2 x f(x) – µ2 = -42 x 1/8 + (-2)2 x 2/8 + 02 x 2/8 + 22 x 1/8 + 42 x 2/8 – (1/4)2 = = 7,44 7 - Um dado produto pode ser classificado, consoante a sua qualidade, em 5 classes distintas: 1, 2, 3, 4 e 5. Sendo X a classe atribuída ao produto, com função de probabilidade x 1 2 3 4 5 f(x) k 2k 4k 2k k 7.1 - Determinar k. 7.2 - Qual a probabilidade de que um produto tomado ao acaso, tenha uma classificação menor do que 4 e superior a 1? 7.3 - Calcular “1 – F(2)” e indicar o seu significado. 7- Resolução: 7.1 - K + 2k + 4k + 2k + k = 1 ⇔ 10k = 1 ⇔ k = 0,1 7.2 - P(1<X<4) = P(X=2) + P(X=3) = 0,2 + 0,4 = 0,6 7.3 - 1 – F(2) = 1 – [P(X=1) + P(X=2)] = 1 – 0,3 = 0,7 e significa a probabilidade de, escolhendo ao acaso, obter um produto com qualidade superior a 2. 8 - Sendo X uma variável aleatória discreta cuja distribuição de probabilidade é a seguinte: x 0 1 2 3 4 5 P(X= x) 0,100 0,300 0,400 0,100 0,050 0,050 8.1 - Representar graficamente a respectiva função de distribuição. 8.2 - Calcular P(X < 4,5), P(X ≥ 2), P(X ≥ 2X ≤ 4) e P(2<X<4,5). Miguel Soares Lopes Ficha 3 26 Variáveis Aleatórias Unidimensionais 8- Resolução: 0,x <0 0,1 , 0 ≤ x < 1 0,4 , 1 ≤ x < 2 8.1 - F( x ) = 0,8 , 2 ≤ x < 3 0,9 , 3 ≤ x < 4 0,95 , 4 ≤ x < 5 1,0 , x ≥ 5 8.2 - P(X < 4,5) = F(4,5) = 0,95; P(X ≥ 2) = 0,6; P(X ≥ 2X ≤ 4) = P(2≤X ≤ 4) F(4) – F(1) 0,95 – 0,4 = = = 0,579; P(X ≤ 4) F(4) 0,95 P(2<X<4,5) = F(4,5) – F(3) = 0,95 – 0,8 = 0,15. 9 - Considere a selecção aleatória de 4 cartas de um baralho de 10 cartas, com 3 copas, 2 ouros e 5 paus. Seja X a variável aleatória que representa o número de copas seleccionadas consecutivamente. Determine: 9.1 - A função de probabilidade de X. 9.2 - A função de distribuição acumulada de X. 9.3 - A média e a variância de X. Resolução: 9 - Se se retirarem sucessivamente 4 cartas dum baralho de 10 cartas, onde existem apenas “3 cartas de copas (C)” é óbvio que só se podem obter, no máximo 3 cartas de copas sendo as outras não-copas (N). Percebemos assim que a nossa variável X só pode assumir os valores 0, 1, 2, 3 e 4. 9.1 - Para se determinar a função de probabilidade tem que se calcular a probabilidade da variável em estudo, X, assumir os valores possíveis (0, 1, 2, 3 e 4). Assim: P(X=0) = P(NNNN) = 7/10 x 6/9 x 5/8 x 4/7 = 1/6; P(X=1) = P(CNNN) + P(NCNN) + P(NNCN) + P(NNNC) = 4 x P(NNNC) = = 4 x 7/10 x 6/9 x 5/8 x 3/7 = 1/2; P(X=2) = P(CCNN) + P(CNCN) + P(CNNC) + P(NCCN) + P(NCNC) + P(NNCC) = = 6 x P(CCNN) = 6 x 3/10 x 2/9 x 7/8 x 6/7 = 3/10; P(X=3) = P(CCCN) + P(CCNC) + P(CNCC) + P(NCCC) = 4 x P(CCCN) = = 4 x 3/10 x 2/9 x 1/8 x 7/7 = 1/30. x f(x) Miguel Soares Lopes 0 1/6 1 1/2 Ficha 3 2 3/10 3 1/30 27 Variáveis Aleatórias Unidimensionais 9.2 - 0, x<0 1/ 6 , 0 ≤ x < 1 F ( x) = 4 / 6 , 1 ≤ x < 2 29 / 30 , 2 ≤ x < 3 1, x ≥ 3 9.3 - Σ x x f(x) = 0 x 1/6 + 1 x 1/2 + 2 x 3/10 + 3 x 1/30 = 6/5 σ2 = Σ x2 x f(x) – µ2 = 02 x 1/6 + 12 x 1/2 + 22 x 3/10 + 32 x 1/30 – (6/5)2 = 0,56 4 2 x 10 -Dada a função f x = 3 0 0 ≤ x ≤1 outros valores de x 10.1 - Mostre f(x) se trata de uma função densidade de probabilidade (fdp). 10.2 - Determine a função de distribuição F(x) e calcule P(X ≤ 0,5). 10 - Resolução: 10.1 - Para mostrar que é uma fdp temos que provar que +∞ f ( x)dx = 1 . Fazer o gráfico para ver que f.(x) f.(x)≥0 e que −∞ está sempre “acima” do eixo do x: O integral +∞ −∞ f ( x)dx corresponde à área delimitada pelo eixo do x e a função f.(x) (linha vermelha). Vamos verificar se dá 1. +∞ −∞ 4 f ( x)dx = 0dx + ( − x 2 )dx + −∞ 0 3 0 1 +∞ 1 4 x3 0dx = x − 3 3 1 = 0 4 1 4 0 ×1 − − × 0 − = 1 3 3 3 3 10.2 - Recordemos que a função F(x) nos permite saber qual a probabilidade acumulada até um qualquer valor de x. Como sabemos, as probabilidades acumuladas associadas a este tipo de funções são dadas pelas áreas por elas definidas: a probabilidade acumulada até um dado valor x corresponde à área à esquerda desse valor delimitada superiormente pela fdp e inferiormente pelo eixo do x . O cálculo das expressões capazes de nos darem essas áreas são obtidas pelos integrais da fdp até ao valor x. Este tipo de integrais em que um dos valores de integração é um valor não definido x chama-se “integral indefinido”. Por questões de melhor compreensão, nas expressões a integrar, a variável “x” será substituída por “t ”. Deste modo podemos ver nitidamente a variável “t” a ser substituída pela variável “x” aquando do integral. Nos intervalos onde a fdp for diferente de “0” as expressões que se vão obter vão ter presente a variável “x” que será depois substituída pelo valor que se quiser. Como a fdp pode estar definida por vários ramos (expressões por intervalos) também o cálculo da função de distribuição terá que ser definida para esses mesmos ramos. Miguel Soares Lopes Ficha 3 28 Variáveis Aleatórias Unidimensionais A fdp apresenta 3 ramos: de “intervalos de cálculo da F(x). a 0”, de “0 a 1” e de “1 a + ”. Estes não ser os [- ≤ x <0] ou [x < 0] (ver a definição da fdp porque os sinais destes intervalos terão que respeitar os sinais da fdp) Quando x é menor que “0” (ver a fdp) a função é “0”. x −∞ f (t )dt = [0≤ x ≤1] x −∞ x 0dt = 0 −∞ 4 4 t3 f (t )dt = 0dt + ( − t 2 )dt = t − −∞ 0 3 3 3 0 x [1< x ≤+ ] ou [x > 1] x −∞ 0 1 4 f (t )dt = 0dt + ( − t 2 )dt + 0 3 −∞ x 1 0dt = x = 0 4 x3 4 03 4 x3 x− − ×0 − = x− 3 3 3 3 3 3 3 4 t t− 3 3 Sinal “–” 1 = 0 4 13 4 03 4 1 ×1 − − ×0 − = − =1 3 3 3 3 3 3 0, x<0 Podemos então, escrever: F ( x) = 4 x3 x − , 0 ≤ x ≤1 3 3 1, x >1 P(X ≤ 0,5) = F(0,5) = 4/3 x 0,5 – (0,53/3) = 4/6 – 1/24 = 15/24. 0,5 está no intervalo de 0≤ x ≤1 11 -Sendo X o peso (g) das proteínas existentes em cada embalagem de um dado alimento, com função de densidade de probabilidade 0 < x ≤1 x2, 1 (7 − 3 x ) , 1 < x ≤ 7 f ( x) = 4 3 0, outros valores de x 11.1 - Traçar o gráfico de f(x). 11.2 - Determinar a função de distribuição de X. 11.3 - Calcular a probabilidade de, numa embalagem escolhida ao acaso, o peso das proteínas ser: 11.3.1 - pelo menos 0,5 g. 11.3.2 - não superior a 2 g. 11.4 - Calcular F(2) – F(0,5), indicar o seu significado e representar este valor graficamente aproveitando o gráfico traçado na alínea a). 11 - Resolução: 11.1 - Miguel Soares Lopes Ficha 3 29 Variáveis Aleatórias Unidimensionais x −∞ x −∞ 11.2 - Nesta fdp temos 4 ramos. [x < 0] f (t )dt = x 0dt = 0 −∞ [0< x <1] t3 f (t )dt = 0dt + t dt = −∞ 0 3 0 x [1< x ≤7/3] x −∞ = x = 2 0 x3 03 x3 − = 3 3 3 1 t3 1 f (t )dt = 0dt + t dt + (7 − 3t )dt = 0 1 4 −∞ 3 0 3 1 3 1 0 − 3 3 + 1 3t 2 + 7t − 4 2 0 x 2 1 3x 7x − 4 2 2 − 1 3 ×1 7 ×1 − 4 2 3 −∞ = f (t )dt = 3 3 1 0 − 3 3 0 1 0dt + t dt + −∞ + 7/3 2 0 1 7 7× − 4 3 1 3× 7 3 2 1 (7 − 3t )dt + 4 = 1 1 7 3x 2 7 3 3x 2 7 25 = + x− − − = − + x− 3 4 8 4 8 8 4 24 [x >7/3] x x t3 0dt = 7/3 3 x 1 1 3t 2 + 7t − 4 2 0 7/3 = 1 2 − 1 3 × 13 7 ×1 − 4 2 = 1 49 147 7 3 24 294 147 99 + − − + = + − − =1 3 12 72 4 8 72 72 72 72 0, x≤0 x3 , 0 < x ≤1 3 Podemos escrever: F ( x) = 3x 2 7 x 25 7 − + − ,1< x ≤ 8 4 24 3 7 1, x > 3 11.3 11.3.1 - P(X≥0,5) = 1 – F(0,5) = 1 – 0,53/3 = 1 – 1/24 = 23/24; 11.3.2 - P(X≤2) = F(2) = -3 x 22/8 + 7 x 2/4 – 25/24 = 23/24; 11.4 - F(2) – F(0,5) = 23/24 – 1/24 = 22/24 = 11/12 . Nota: a área correspondente à alínea 11.4 á aquela que está entre 1/2 e 2. A verde está P(X≥0,5) e a laranja F(0,5). 12 -A eficiência, X, de uma enzima digestiva pode ser descrita pela função de ( ) 1 5 − 3x 2 , 0 ≤ x ≤ 1 . 4 12.1 - Calcular a probabilidade de a enzima ter uma eficiência maior do que 50%. densidade de probabilidade f ( x) = Miguel Soares Lopes Ficha 3 30 Variáveis Aleatórias Unidimensionais 12.2 - Calcular a média e a variância da eficiência. 12.3 - Calcular F(0,5). 12 - Resolução: 12.1 - Numa situação destas, em que não se pede a função de distribuição, podemos calcular directamente aquilo que nos é pedido. Sendo X a eficiência, aquilo que é pedido é a probabilidade acumulada entre X=0,5 (eficiência igual a 50%) e X=1 (eficiência total ou 100%). 1 1 1 x3 (5 − 3x 2 )dx = 5 x − 3 × P(X>0,5) = 0,5 4 4 3 1 = 1 [5 − 1] − 20 − 1 4 8 8 = 1 13 0,53 5 ×1 − 3 × − 5 × 0,5 − 3 × 4 3 3 = 0 ,5 1 19 19 13 4− = 1− = ; 4 8 32 32 12.2 - ( ) 1 1 µ= x × f ( x)dx = x × 5 − 3 x 2 dx = 0 −∞ 4 4 +∞ 1 = σ2 = +∞ −∞ 1 5 ×1 3 ×1 − 4 2 4 2 x 2 × f ( x)dx − 4 2 1 5 x 3 3x 5 = − 4 3 5 − 1 0 1 0 1 0 ( 2 ( 3 4 = ) 1 5 − 3 x 2 dx − 4 7 − 16 2 1 = 4 ) 1 5 x 2 3x 4 5 x − 3x d x = − 4 2 4 5 × 0 3× 0 − 2 4 = x2 × = 1 = 0 1 5 3 7 − = 4 2 4 16 2 = 1 4 1 0 (5 x 2 ) − 3x 4 d x − 2 5 × 13 3 × 15 5 × 03 3 × 05 − − − 3 5 3 5 = 7 − 16 2 = 1 5 3 49 − − = 0,075 ; 4 3 5 256 12.3 - F(0,5) = 1–P(X>0,5) = 1–13/32 = 19/32 . = 13 -Sendo X uma variável aleatória que representa a quantidade (kg) procurada por cliente de determinado produto em certa loja, com fdp. 1 , a≤x<2 3x 2 2 x f ( x) = − , 2≤ x<b 9 36 0 , outros valores de x 13.1 - Calcular a e b, sabendo que 50% dos clientes procura pelo menos 2 kg. 13.2 - Calcular a probabilidade de um cliente procurar mais de 7 kg. 13 - Resolução: 13.1 - A informação que é dada diz que 50% dos clientes consome menos de 2 kg. Sendo b o valor mais alto, quer dizer que 50% dos clientes consome entre 2 kg e b. Assim: Miguel Soares Lopes Ficha 3 31 Variáveis Aleatórias Unidimensionais P(2≤X<b) = 0,5 ⇔ ⇔− b 2 2 x2 2 x x− − dx = 0,5 ⇔ 9 72 9 36 2 b 2× b b2 2 × 2 22 − − − = 0,5 ⇔ 9 72 9 72 = 0,5 ⇔ 2 2 b 16b 28 1 b 16b 64 + − = ⇔− + − = 0 ⇔ − b 2 + 16b − 64 = 0 ⇔ 72 72 72 2 72 72 72 − 16 ± 16 2 − 4(−1× (−64)) − 16 ⇔ b= = 8 kg; 2 × (−1) − 2) Do mesmo modo a é o valor mais baixo, quer dizer que 50% dos clientes consome entre a e 2 kg. Assim: ⇔b = 2 1 1 P(a≤X<2) = 0,5 ⇔ dx = 0,5 ⇔ − = 0,5 ⇔ a 3x 2 3x a 1 1 1 2 ⇔ = 0,5 + ⇔ = ⇔ 6a = 3 ⇔ a = 0,5 kg 3a 6 3a 3 2 − 1 1 − − 3× 2 3a = 0,5 ⇔ 13.2 - P(X>7) = 1 – F(7) [que não podemos calcular através da F(x) porque não a temos]. Então temos que resolver pelo integral: 8 8 2 x2 16 64 14 49 2 x − dx = x − = P(X>7) = − − − = 1/72 . 9 72 9 72 9 36 9 72 7 7 14 -Uma variável aleatória X tem a seguinte função densidade de probabilidade: 2( x + 1) , x ∈ [0, a ], c / a > 0 f ( x) = 15 0 , outros valoresde x 14.1 - Determine o valor de a para o qual f(x) é uma função densidade de probabilidade. 14.2 - Determine a função de distribuição acumulada F(x). 14.3 - Calcule P(-3 <X 1). 14.4 - Calcule P(1 X 3 | X 2). 14.5 - Calcule P(2 X 4). Resolução: 14 -Se esta variável tem esta fdp quer dizer que o integral daquela função entre “0” e “a” tem que valer “1”. 14.1 ⇔ +∞ −∞ f ( x)dx =1 ⇔ a 0 2( x + 1) 2x2 2x dx = 1 ⇔ + 15 30 15 a =1⇔ 0 2a 2 2 a 2 × 02 2 × 0 a 2 2a 15 + − + =1⇔ + − = 0 ⇔ a 2 + 2a − 15 = 0 ⇔ 15 15 15 30 15 30 15 − 2 ± 2 2 − 4 × (1× (−15)) −2±8 ⇔a= ⇔ a = 3 ∨ a = −5 2 ×1 2 Como a>0 logo a terá que ser 3 . 14.2 - A fdp tem 3 ramos: “x < 0”, “0 ≤ x ≤ 3” e “x > 3”. [x < 0] ⇔a= Miguel Soares Lopes Ficha 3 32 Variáveis Aleatórias Unidimensionais x −∞ f (t )dt =0 ⇔ [0 ≤ x ≤ 3] x −∞ f (t )dt = x 0 x 0dt = 0 −∞ 2(t + 1) 2t 2 2t dt = + 15 30 15 [x > 3] 2(t + 1) f (t )dt = dt + −∞ 0 15 Podemos então escrever: 0, x<0 x F ( x) = 3 x = 0 2x 2 2x 2 × 02 2 × 0 x2 2x − + + = + 30 15 30 15 15 15 2t 2 2t 0dt = + 3 30 15 x 3 = 0 2 × 32 2 × 3 2 × 02 2 × 0 18 6 + − + = + =1 30 15 30 15 30 15 x 2 2x + ,0≤ x≤3 15 15 1, x > 3 14.3 - P(-3 <X 1) = F(1) – F(-3) = F(1) – 0 = 14.4 - P(1 X 3 | X 2) = 12 2 × 1 + = 1/5 15 15 P(1 ≤ X ≤ 2) F(2) − F(1) = = P ( X ≤ 2) F(2) 8 15 − 15 8 5/8 15 22 2 × 2 8 + = 15 15 15 X 4) = F(4) – F(2) = 1– 8/15 = 7/15 F(2) = 14.5 - P(2 Miguel Soares Lopes Ficha 3 33 Variáveis Aleatórias Unidimensionais Variáveis Aleatórias Bidimensionais 15 -Uma caixa contém 10 bolas: 5 amarelas; 3 brancas e 2 castanhas. Fazem-se 3 tiragens com reposição. Sendo X a variável aleatória que conta o número de bolas castanhas extraídas: 15.1 - Construa a função de probabilidade de X. 15.2 - Considere a variável aleatória Y que conta o número de bolas amarelas extraídas naquela experiência aleatória e que tem a seguinte função de probabilidade: Y 0 f(y) 1 2 3 0,125 0,375 0,375 0,125 Construa a função de probabilidade conjunta de X e Y. 15.3 - Construa a função de distribuição conjunta de X e Y. 15.4 - Verifique se X e Y são variáveis independentes. 15 - Resolução: 15.1 - Construir a função de probabilidade é responder à pergunta”qual é a probabilidade que a variável X tem de assumir cada um dos valores possíveis?” Sendo X o número de bolas castanhas que se podem ter em três tiragens com reposição é óbvio que esta variável pode assumir os valores 0, 1, 2 e 3. Por outro lado, sempre que não sai uma bola castanha terá que sair uma bola “não-castanha” e, quando se estuda apenas o número de bolas castanhas, isso significa que não interessa a cor dessa bola: podemos assim dizer que temos bolas castanhas — “C” e “não-castanhas” —“N”. Assim: P(ter 0 bolas castanhas) = P(X=0) = P(NNN) = P(X=1) = P(CNN) + P(NCN) + P(NNC) = 3 × P(X=2) = P(CCN) + P(CNC) + P(NCC) = 3 × P(X=3) = P(CCC) = 3 = 0,512; 2 8 8 × × = 0,384; 10 10 10 2 2 8 × × = 0,096; 10 10 10 2 2 2 × × = 0,008; 10 10 10 X f(x) Miguel Soares Lopes 8 8 8 8 × × = 10 10 10 10 0 1 2 3 0,5125 0,384 0,096 0,008 Ficha 3 34 Variáveis Aleatórias Unidimensionais 15.2 - Construir a função de probabilidade conjunta de X e Y é construir uma tabela que responda a perguntas do tipo: “qual é a probabilidade de X ser 0 e, ao mesmo tempo, Y ser 1?” Para isso vamos chamar às bolas castanhas — “C”, às bolas amarelas — “A” e às brancas — “B”. Vejamos as situações. P(X=0,Y=0) C 0 A 0 B 3 Acontecimentos P(BBB) P(X=0,Y=1) 0 1 2 P(ABB) + P(BAB) + P(BBA) 3 × 105 × 103 × 103 = 0,135 P(X=0,Y=2) 0 2 1 P(AAB) + P(ABA) + P(BAA) 3 × 105 × 105 × 103 = 0,225 P(X=0,Y=3) 0 3 0 P(AAA) P(X=1,Y=0) 1 0 2 P(CBB) + P(BCB)+ P(BBC) P(X=1,Y=1) 1 1 1 P(ABC) + P(ACB) + P(BAC)+ 6 × 105 × 103 × 102 = 0,180 + P(BCA) + P(CAB) + P(CBA) P(X=1,Y=2) 1 2 0 P(CAA) + P(ACA) + P(AAC) 3 × 102 × 105 × 105 = 0,150 P(X=1,Y=3) 1 3 0 3 10 5 10 Probabilidade × 103 × 103 = 0,027 × 105 × 105 = 0,125 3 × 102 × 103 × 103 = 0,054 (4 bolas) IMPOSSÍVEL 0 3 × 102 × 102 × 103 = 0,036 P(X=2,Y=0) 2 0 1 P(CCB) + P(CBC) + P(BCC) P(X=2,Y=1) 2 1 0 P(CCA) + P(CAC) + P(ACC) 3 × 102 × 102 × 105 = 0,060 P(X=2,Y=2) P(X=2,Y=3) 2 2 2 3 0 0 (4 bolas) IMPOSSÍVEL (5 bolas) IMPOSSÍVEL P(X=3,Y=0) 3 0 0 P(CCC) P(X=3,Y=1) P(X=3,Y=2) P(X=3,Y=3) 3 3 3 1 2 3 0 0 0 (4 bolas) IMPOSSÍVEL (5 bolas) IMPOSSÍVEL (6 bolas) IMPOSSÍVEL 0 0 2 10 × 102 × 102 = 0,008 0 0 0 Agora já podemos construir a seguinte tabela de probabilidade conjunta: X Y 0 1 2 3 f(x, . ) 0 1 2 3 f( . ,y) 0,027 0,135 0,225 0,125 0,512 0,054 0,180 0,150 0 0,384 0,036 0,060 0 0 0,096 0,008 0 0 0 0,008 0,125 0,375 0,375 0,125 1 15.3 - Para construir a função de distribuição conjunta de X e Y devemos ter em conta que cada valor da mesma representa uma probabilidade acumulada para a intercepção de dois intervalos, um para cada uma das duas variáveis. Assim, e por exemplo, quando se escreve F(2 , 1) quer saber-se a probabilidade acumulada para a ocorrência em simultâneo de valores de X menores ou iguais a 2 e de valores de Y menores ou iguais a 1, isto é, P(X≤2; Y≤1). Ora a função de distribuição conjunta tem que estar definida para qualquer par de valores de (x ,y). Como se sabe, estamos perante duas variáveis discretas. Neste caso entre dois valores referenciados consecutivos de cada uma variáveis não há incremento de probabilidade acumulada. Assim, cada uma das variáveis pode ser tratada em intervalos, tal como se faz com as variáveis aleatórias unidimensionais, embora se tenham depois que combinar as duas variáveis. Miguel Soares Lopes Ficha 3 35 Variáveis Aleatórias Unidimensionais Tomemos o quadro anterior e vejamos a que é que corresponde F(2 , 1). Tal como havia sido referido, esta probabilidade corresponde a P(X≤2; Y≤1). No quadro estão delimitadas a verde as células correspondentes aos pares de valores (x ,y) que cumprem as condições requeridas. X Y 0 1 2 3 f(x, . ) 0 1 2 3 f( . ,y) 0,027 0,135 0,225 0,125 0,512 0,054 0,180 0,150 0 0,384 0,036 0,060 0 0 0,096 0,008 0 0 0 0,008 0,125 0,375 0,375 0,125 1 Assim: P(X≤2;Y≤1) = P(X=0,Y=0) + P(X=0,Y=1) + P(X=1,Y=0) + P(X=1,Y=1) + P(X=2,Y=0) + + P(X=2,Y=1) = 0,027 + 0,135 + 0,054 + 0,180 + 0,036 + 0,060 = 0,492 (confirmar este valor no quadro seguinte). Vejamos outro exemplo (células limitadas pelas linhas a azul): P(X≤1;Y≤2) = P(X=0,Y=0) + P(X=0,Y=1) + P(X=0,Y=2) + P(X=1,Y=0) + P(X=1,Y=1) + + P(X=1,Y=2) = 0,027 + 0,135 + 0,225 + 0,054 + 0,180 + 0,150 = 0,771(confirmar este valor no quadro seguinte). Y X y<0 0≤y<1 1≤y<2 2≤y<3 y≥3 x<0 0≤x<1 1≤x<2 2≤x<3 0 0 0 0 0 0 0,027 0,162 0,387 0,512 0 0,081 0,396 0,771 0,896 0 0,117 0,492 0,867 0,992 x≥3 0 0,125 0,500 0,875 1,000 15.4 - X e Y não são independentes porque existe pelo menos um par (x,y) tal que, f(x,y) ≠ f(x) x f(y). Como se pode ver, por exemplo, para o par (1,1) temos P(X=1,Y=1) ≠ P(X=1) x P(Y=1), isto é, 0,180 ≠ 0,384 x 0,375. 16 -Num dado distrito, com três concelhos, A, B e C, a superfície agrícola útil é constituída por solos de textura arenosa (1), média (2) e argilosa (3). A função de probabilidade conjunta, f(x,y), é dada por: X Y A 1 2 3 0,18 0,09 0,16 B 0,09 0,12 0,20 C 0,03 0,09 0,04 16.1 - Indicar o valor de f(3,A) e explicar o seu significado. 16.2 - Calcular as funções de probabilidade marginal de X e de Y. 16.3 - Qual o valor de f2(B) (ou fy (B)) ? O que representa? Miguel Soares Lopes Ficha 3 36 Variáveis Aleatórias Unidimensionais 16.4 - Calcular F(3, A) e indicar o seu significado. 16.5 - Calcular P(X < 3 ,Y A). 16.6 - Qual a probabilidade de um solo ter textura média, sabendo que é do concelho A? 16.7 - Verifique se X e Y são variáveis independentes. 16 - Resolução: 16.1 - f(3,A) = 0,16 e traduz a probabilidade de um solo ter textura argilosa e ser do concelho A; 16.2 - As funções de probabilidade marginal de X e Y correspondem aos somatórios das colunas e das linhas, respectivamente. Traduzem a probabilidade de cada uma das variáveis assumir um dado valor independentemente dos valores que a outra variável assuma. X 1 2 3 Y A B C f(x) 0,30 0,30 0,40 f(y) 0,43 0,41 0,16 16.3 - f2(B) = fy(B) = 0,41 e traduz a percentagem de superfície agrícola do concelho B dentro da totalidade do distrito: 16.4 - F(3, A) = 0,18 + 0,09 + 0,16 = 0,43 ; 16.5 - P(X<3,Y A) = P(X=1,Y=A) + P(X=2,Y=A) = 0,27 ; P(X = 2, Y = A ) 0,09 = = 0,21 ; P(Y = A) 0,43 16.7 - X e Y não são independentes porque existem pares (x,y) em que a igualdade f(x,y)=f(x) x f(y) não se verifica, como se prova, por exemplo, com P(X=1,Y=A) ≠ P(X=1) x P(Y=A), isto é, 0,18 ≠ 0,30 x 0,43. 16.6 - P(X=2|Y=A) = 17 - Considere o exercício nº 15 e execute-o agora com tiragens sem reposição. Para a alínea 17.2 considere para a variável Y a seguinte função de probabilidade: Y f(y) 0 1/12 1 5/12 2 5/12 3 1/12 Resolução: 17 -Seja A – Amarela, B – Branca e C – Castanha. (A – não Amarela, etc.) 17.1 - Em 3 tiragens sem reposição e com 2 bolas Castanhas presentes na caixa o número de bolas Castanhas presentes nos conjuntos das 3 tiragens só pode ser 0, 1 ou 2. A probabilidade de “não C” é a soma da probabilidade de A com a de B e, portanto: P(C) = P(A) + P(B) = 5/10 + 3/10 = 8/10 P(X=0) = P(CCC) = 8/10 x 7/9 x 6/8 = 42/90 = 7/15 P(X=1) = P(CCC) + P(CCC) + P(CCC) = 3 x 2/10 x 8/9 x 7/8 = 42/90 = 7/15 P(X=2) = P(CCC) + P(CCC) + P(CCC) = 3 x 2/10 x 1/9 x 8/8 = 6/90 = 1/15 X f(x) Miguel Soares Lopes 0 7/15 1 7/15 Ficha 3 2 1/15 37 Variáveis Aleatórias Unidimensionais 17.2 - Façamos agora um raciocínio semelhante àquele que foi feito anteriormente mas agora numa situação de “não reposição”. Y f(y) 0 1/12 1 5/12 2 5/12 3 1/12 P(X=0,Y=0) C 0 A 0 B 3 Acontecimentos P(BBB) P(X=0,Y=1) 0 1 2 P(ABB) + P(BAB) + P(BBA) 3 × 105 × 93 × 82 = 1 8 P(X=0,Y=2) 0 2 1 P(AAB) + P(ABA) + P(BAA) 3 × 105 × 94 × 83 = 1 4 P(X=0,Y=3) 0 3 0 P(AAA) P(X=1,Y=0) 1 0 2 3 × 102 × 93 × 82 = 1 20 P(X=1,Y=1) 1 1 1 6 × 105 × 93 × 82 = 1 4 P(X=1,Y=2) P(X=1,Y=3) P(X=2,Y=0) 1 1 2 2 3 0 0 0 1 P(CBB) + P(BCB)+ P(BBC) P(ABC) + P(ACB) + P(BAC)+ + P(BCA) + P(CAB) + P(CBA) P(CAA) + P(ACA) + P(AAC) (4 bolas) IMPOSSÍVEL P(CCB) + P(CBC) + P(BCC) 3 × 102 × 59 × 48 = 1 6 0 3 × 102 × 19 × 83 = 1 40 P(X=2,Y=1) P(X=2,Y=2) P(X=2,Y=3) 2 2 2 1 2 3 0 0 0 P(CCA) + P(CAC) + P(ACC) (4 bolas) IMPOSSÍVEL (5 bolas) IMPOSSÍVEL 3 × 102 × 19 × 85 = 1 24 Probabilidade 3 ×2×1 = 1 10 9 8 120 5 10 × 94 × 83 = 1 12 0 0 A função de probabilidade conjunta de X e Y vem assim: Y X 0 1 2 3 f(x, . ) 0 1 2 f( . ,y) 1/120 1/8 1/4 1/12 7/15 1/20 1/4 1/6 0 7/15 1/40 1/24 0 0 1/15 1/12 5/12 5/12 1/12 1 Como se pode ver as funções de probabilidade marginal de X e Y confirmam as funções inicialmente apresentadas e calculadas nas alíneas anteriores. 17.3 - Esta função de distribuição conjunta é calculada como foi calculada a da alínea 15.3. Y X y<0 0≤y<1 1≤y<2 2≤y<3 y≥3 x<0 0 0 0 0 0 0≤x<1 1≤x<2 0 1/120 16/120 46/120 56/120 0 7/120 52/120 102/120 112/120 x≥2 0 10/120 60/120 110/120 1 17.4 - X e Y não são independentes porque existe pelo menos um par (x,y) tal que, f(x,y) ≠ f(x) x f(y). Como se pode ver, por exemplo, para o par (0,3) temos P(X=0,Y=3) ≠ P(X=0) x P(Y=3), isto é, 1/12 ≠ 7/15 x 1/12. Miguel Soares Lopes Ficha 3 38 Variáveis Aleatórias Unidimensionais 18 -Considere X e Y como duas variáveis aleatórias discretas. Alguns dos valores para a função de probabilidade conjunta e para as funções marginais encontram-se na tabela seguinte. 1 2 3 f X ( x) 1 3 1 4 1 12 1 12 1 12 1 2 1 12 1 3 3 fY ( y) 1 6 1 6 18.1 - Complete a tabela de modo a ter a função de probabilidade conjunta para o par aleatório (X, Y) e as funções de probabilidade marginais de cada uma das variáveis aleatórias. 18.2 - Determine a função de Distribuição Conjunta de X-Y. 18.3 - Calcular P(1≤X<2 , 2≤Y≤3). 18 - Resolução: 18.1 - 3 f X ( x) 1 3 1 4 1 12 1 12 1/12 0 1 6 3/6 1 6 1 1 2 1 1 12 2/12 2 2/12 1 12 1 3 3 fY ( y) 3/6 A resolução desta alínea baseia-se no cálculo das parcelas por diferença para valores conhecidos: sabemos que a probabilidade total é 1 e que esse valor é a soma das probabilidades marginais (3/6 nas últimas coluna e linha); por sua vez estas probabilidades marginais são a soma das respectivas linhas ou colunas. 18.2 - y<1 1≤y<2 2≤y<3 x<1 0 0 0 0 1≤x<2 0 1/12 3/12 4/12 2≤x<3 0 3/12 8/12 10/12 0 4/12 10/12 12/12 x 4 18.3 - P(1≤X<2 , 2≤Y≤3) = Miguel Soares Lopes 2 12 y 4 1 = 3/12 (o X só pode ser 1 e o Y pode ser 2 ou 3) + 12 Ficha 3 39 Distribuições Teóricas Discretas Distribuições Teóricas Discretas 1- Dada uma moeda equilibrada e sendo X o número de coroas obtidas em 6 lançamentos, determinar: 1.1 1.2 1.3 1.4 1.5 1.6 1.7 - a probabilidade de obter 2 coroas. P (X = 3). P (X < 2). P (X > 2). P (1 < X < 3). a probabilidade de obter 2 ou mais faces. a probabilidade de obter menos que 4 faces. Resolução: 1 - Analisemos a situação exposta para vermos que tipo de distribuição temos: — 6 provas com 2 resultados possíveis: face ou coroa (provas de Bernoulli); — provas independentes pois as probabilidades de sair face [ P(F) ] e de sair coroa [ P(C) ] mantêm-se constantes ao longo das 6 tiragens; Logo, estamos perante uma Distribuição Binomial. X ∩ (n, p ) P( X = x)=nCx × p x × q n − x = X — nº de coroas em 6 lançamentos. X∩Bin (6 ; 0,5) 1.1 - P(X=2) = 6C2 × 0,52 × 0,54 = 0,234375; 1.2 - P(X=3) = 6C3 × 0,53 × 0,53 = 0,3125; 1.3 - P(X < 2) = P(X=0) + P(X=1) = 6C0 × 0,50 × 0,56 + 6C1 × 0,51 × 0,55 = 1.4 1.5 1.6 - Coroa 0 1 2 3 4 5 6 = 0,015625 + 0,09375 = 0,10938; P(X > 2) = 1 – P(X≤2) = 1 – [P(X=0) + P(X=1) + P(X=2)] = 1 – 0,34375 = = 0,65625; P(1 < X < 3) = P(X=2) = 0,234375; Nesta alínea a pergunta é feita em função das “faces”. Para o resolver podemos assumir duas alternativas: a) transformar a pergunta que está feita em função de “faces” numa pergunta em função de “coroas” ou b) fazer uma mudança de variável de modo a defini-la directamente em função das “faces”. a) P(obter 2 ou mais faces) = P(obter 4 ou menos coroas) = = P(X≤4) = P(X=0) + P(X=1) + P(X=2) + P(X=3) + Face P(X=4) = = 0,34375 + 0,3125 + 0,23438 = 0,89062 ; 6 5 4 3 2 1 0 b) Mudança de variável: Y — nº de faces em 6 lançamentos Y∩Bin (6 ; 0,5) P(obter 2 ou mais faces) = P(Y≥2) = 1 – P(Y<2) = 1 – [P(Y=0) + P(Y=1)] = 1 – ( 6C0 × 0,50 × 0,56 + 6C1 × 0,51 × 0,55 ) = 1 – 0,1094 = 0,8906 Miguel Soares Lopes Ficha 4 40 Distribuições Teóricas Discretas 1.7 - P(obter menos que 4 faces) = P(Y<4) = P(Y=0) +…+ P(Y=3) = 0,65625. 2 - As características genéticas de dois ratos adultos são tais que a probabilidade de um filho ser albino é de 0,2. Se o casal tiver seis filhos calcular a probabilidade de: 2.1 - não haver albinos; 2.2 - nascerem dois ou mais albinos; 2.3 - no máximo 2 não serem albinos; 2.4 - só haver um albino; 2.5 - nascerem no máximo 3 albinos. Resolução: 2 - Analisemos a situação exposta para vermos que tipo de distribuição temos: — 6 provas com 2 resultados possíveis: albinos ou não albinos (provas de Bernoulli); — provas independentes pois as probabilidades de albinos [ P(A) ] e de não albinos [ P(N) ] mantêm-se ao longo dos 6 nascimentos; logo estamos perante uma Distribuição Binomial. X — nº de ratinhos albinos em 6 nascimentos. X∩Bin (6 ; 0,2) 2.1 - P(X=0) = 6C0 × 0,20 × 0,26 = 0,262144; 2.2 - P(X≥2) = 1 – P(X<2) = 1 – [P(X=0) + P(X=1)] = 1 – [0,262144 + + 6C1 × 0,21 × 0,85 ] = 1 – 065536 = 0,34464; 2.3 - Repare-se que o problema agora é posto salientando exactamente os ratinhos não albinos. Uma das maneiras de resolver este problema é converter as perguntas de “não albinos” em “albinos”; outra maneira é fazer uma mudança de variável. Vejamos esta última: mudança de variável: Y — nº de ratinhos não albinos em 6 nascimentos. Y∩Bin (6 ; 0,8) P (Y ≤2) = P(Y=0) + P(Y=1) + P(Y=2) = 6C0 × 0,80 × 0,86 + 6C1 × 0,81 × 0,85 + + 6C2 × 0,82 × 0,2 4 = 0,01696. 2.4 - P(X=1) = 0,393216 2.5 - P(X≤3) = 0,98304 3 - O sistema de previsão para uma dada doença que depende das condições de humidade, numa determinada cultura é tal que, um dia húmido é aquele em que ocorre precipitação superior ou igual a 4 mm. A precipitação é independente de dia para dia e o quadro seguinte dá a probabilidade de precipitação de x mm na época de desenvolvimento da doença: f(x) 0≤x<1 0,05 1≤x<2 0,2 2≤x<3 0,2 3≤x<4 0,2 4≤x<5 0,15 5≤x<6 0,15 x≥6 0,05 Calcular a probabilidade de, nesse período: 3.1 - ocorrer um dia húmido (H)? 3.2 - ocorrerem sucessivamente 3 dias húmidos? 3.3 - haver pelo menos 2 dias húmidos numa semana? Miguel Soares Lopes Ficha 4 41 Distribuições Teóricas Discretas Resolução: 3 - Ocorrer um dia húmido é ocorrer um dia com precipitação superior ou igual a 4mm. X — milímetro de precipitação por dia. 3.1 - P(H) = P(X≥4) = 0,15 + 0,15 + 0,05 = 0,35; 3.2 - Y — nº dias húmidos em 3 dias; Y∩Bin (3 ; 0,35) P(Y=3) = 3C3 × 0,353 × 0,650 = 0,042875. 3.3 - Z — nº dias húmidos em 7 dias; Z∩Bin (7 ; 0,35) P(Z≥2) = 1 – [P(Z=0) + P(Z=1)] = 1 – ( 7C0 × 0,350 × 0,657 + + 7C1 × 0,351 × 0,656 ) = 1 – 0,234 = 0,766 4 - Uma máquina de empacotar fatias de presunto produz em média, 5 embalagens defeituosas em 100. 4.1 - Em cinco embalagens extraídas ao acaso qual a probabilidade de: 4.1.1 - pelo menos uma ser não defeituosa? 4.1.2 - duas serem defeituosas? 4.1.3 - uma quando muito, ser não defeituosa? 4.2 - Quantas embalagens deverão ser analisadas para que a probabilidade de ocorrer pelo menos uma embalagem defeituosa seja superior a 0,5? 4.3 - Em 50 embalagens extraídas ao acaso qual o valor esperado de embalagens defeituosas e qual o seu desvio padrão? Resolução: 4 - Ter atenção que, embora sejam tiragens sem reposição, e teoricamente fosse uma Distribuição Hipergeométrica, o valor de N (dimensão da população) não é conhecido sendo fácil de supor que [N>(10 x n)], sendo “n” a dimensão da amostra (5) (apresentação 5, diap. 33). Assim, vamos usar a Distribuição Binomial por aproximação: 4.1 - X — nº de embalagens não defeituosas em 5. ° X∩Bin (5 ; 0,95) 4.1.1 - P (X≥1) = 1 – P(X=0) = 1 – 5C0 × 0,950 × 0,055 = 0,0000003 = = 0,9999997; 4.1.2 - Y — nº de embalagens defeituosas em 5. Y∩Bin (5 ; 0,05) P(Y=2) = 5C2 × 0,052 × 0,953 = 0,021; 4.1.3 - P (X≤1) = P(X=0) + P(X=1) = 5C 0 × 0,950 × 0,055 + + 5C1 × 0,951 × 0,054 = 0,00003 4.2 - P(Y≥1) > 0,5 ⇔ 1 – P(Y=0) > 1 – n C0 × 0,050 × 0,95n = 1 – 0,95n > 0,5 ⇔ ⇔ 0,95n < 0,5 ⇔ n > log0,95 (0,5) ⇔ n > 13,5 n = 14 4.3 - µ = n x p = 50 x 0,05 = 2,5; σ = √ n . p . q = √ 50 . 0,05 . 0,95 = √ 2,375 = 1,541 Miguel Soares Lopes Ficha 4 42 Distribuições Teóricas Discretas 5 - Um estudo encomendado por uma empresa permitiu apurar que aproximadamente 60% dos seus trabalhadores mantinham uma atitude cooperativa face à empresa, 30% uma atitude hostil e 10% uma atitude não definida. 5.1 - Qual a probabilidade de num grupo de 12 trabalhadores: 5.1.1 - pelo menos 6 adoptarem uma atitude hostil face à empresa? 5.1.2 - no mínimo 2 terem uma atitude bem definida? 5.1.3 - qual o número esperado de trabalhadores com atitude hostil? 5.1.4 - 6 terem uma atitude hostil, 4 cooperativa e 2 não definida. 5.1.5 - 3 terem uma atitude hostil e 4 cooperativa. 5- Resolução: 5.1 - Este exercício é resolvido com a Distribuição Binomial ou com a Distribuição Multinomial, dependendo das alíneas. 5.1.1 - Binomial — as provas têm 2 resultados possíveis: “hostis” e “não hostis”; X — nº de colaboradores hostis numa amostra de 12 ; X∩Bin (12 ; 0,3) P(X≥6) = 0,118 5.1.2 - Binomial — as provas têm 2 resultados possíveis: “com atitude bem definida” (hostis e cooperativos) e “com atitude não definida”; Y — nº de colaboradores com atitude bem definida numa amostra de 12; Y∩Bin (12 ; 0,9) P(Y≥2) = 1 – [P(Y=0) + P(Y=1)] = 1 – ( 12C0 × 0,950 × 0,0512 + +12C1 × 0,91 × 0,111 ) = 0,9999999998 ≈ 1. 5.1.3 - µ = n x p = 12 x 0,30 = 3,6 ; 5.1.4 - Multinomial — as provas têm 3 resultados possíveis: atitude hostil, cooperativa e não definida; X1 — nº de trabalhadores com atitude cooperativa numa amostra de 12; X2 — nº de trabalhadores com atitude hostil numa amostra de 12; X3 — nº de trabalhadores com atitude não definida numa amostra de 12; p1 = 0,6; p2 = 0,3; p3 = 0,1; P(X1 = 4; X2 = 6; X3 = 2) = 12! × 0,6 4 × 0,36 × 0,12 = 13860 x 0,130 x 4! 6! 2! x 0,00073 x 0,01 = 0,013 . 5.1.5 - Multinomial — as provas têm 3 resultados possíveis: “atitude hostil”, “cooperativa” e “não definida”; X1 — nº de trabalhadores com atitude cooperativa numa amostra de 12; X2 — nº de trabalhadores com atitude hostil numa amostra de 12; X3 — nº de trabalhadores com atitude não definida numa amostra de 12; p1 = 0,6; p2 = 0,3; p3 = 0,1; Miguel Soares Lopes Ficha 4 43 Distribuições Teóricas Discretas 12! × 0,6 4 × 0,33 × 0,15 = 27720 x 0,130 x 4! 3! 5! P(X1 = 4; X2 = 3; X3 = 5) = x 0,027 x 0,00001 = 0,00097. 5.2 - Multinomial — as provas têm 3 resultados possíveis: atitude hostil, cooperativa e não definida; Y1 — nº de trabalhadores com atitude cooperativa numa amostra de 20; Y2 — nº de trabalhadores com atitude hostil numa amostra de 20; Y3 — nº de trabalhadores com atitude não definida numa amostra de 20; p1 = 0,6; p2 = 0,3; p3 = 0,1; P(Y1=10; Y2=6; Y3=4) = 20! × 0,610 × 0,36 × 0,14 = 38798760 x 0,006 x 10! 6! 4! x 0,00073 x 0,0001 = 0,017. 6 - Uma urna contém 14 bolas e em cada uma delas está registado um número. Seis dessas bolas apresentam um número positivo e oito um número negativo. Retirou-se uma amostra de quatro bolas dessa urna e multiplicaram-se os respectivos números. Qual a probabilidade de, o produto assim obtido, ser positivo? Resolução: 6 - O produto de “4 bolas” só será negativo se houver número ímpar de bolas negativas. X — nº de bolas com valor negativo inscrito X∩H(14;8;4) X pode tomar valores entre 0 e 4 (inclusive). Destes são ímpares o “1” e o “3”. Assim, a probabilidade do produto ser positivo é: P(produto ser positivo) = 1 – P(produto negativo) = 1 – [P(X=1) + + P(X=3)] = 1 – [ 8 C1 × 6C3 14 C4 + 8 C3 × 6C1 14 C4 ] = 1 – 0,4955 = 0,5045 7 - Estima-se que do total das declarações de Imposto Sobre Rendimento de Pessoas Colectivas, 40% estão correctamente preenchidas, 30% contêm erros favorecendo apenas os contribuintes, 10% erros favorecendo apenas o Estado e as restantes os dois tipos de erro. 7.1 - Se forem seleccionada 10 declarações para auditoria, qual a probabilidade de se encontrarem: 7.1.1 - 6 correctamente preenchidas? 7.1.2 - 2 com erros? 7.1.3 - 4 correctamente preenchidas, 2 com erros a apenas favor do contribuinte e 1 com erros apenas a favor do Estado? 7.2 - Em 10 declarações qual o número esperado de declarações com erros apenas a favor do contribuinte? Miguel Soares Lopes Ficha 4 44 Distribuições Teóricas Discretas 7- Resolução: 7.1 - Este exercício é resolvido com a Distribuição Binomial ou com a Distribuição Multinomial, dependendo das alíneas. 7.1.1 - Binomial — as provas têm 2 resultados possíveis: “correctamente preenchidas” e “com erros”; X — nº de declarações correctamente preenchidas numa amostra de 10 ; X∩Bin (10 ; 0,4) P(X=6) = 10C6 × 0,46 × 0,6 4 = 0,1115 ; 7.1.2 - Binomial — as provas têm 2 resultados possíveis: “com erros” e “correctamente preenchidas”; Y — nº de declarações com erros numa amostra de 10 ; Y∩Bin (10 ; 0,6) P(Y=2) = 10C2 × 0,6 2 × 0,48 = 0,011 ; 7.1.3 - Multinomial — as provas têm 4 resultados possíveis: declarações “correctamente preenchidas”, “com erros exclusivamente a favor do contribuinte”, “com erros favorecendo apenas o Estado” e “com os 2 tipos de erros”; X1 — nº de declarações correctamente preenchidas numa amostra de 10; X2 — nº de declarações com erros exclusivamente a favor do contribuinte numa amostra de 10; X3 — nº de declarações com erros favorecendo apenas o Estado numa amostra de 10; X4 — nº de declarações com os 2 tipos de erros numa amostra de 10; p1 = 0,4; p2 = 0,3; p3 = 0,1; p4 = 0,2; P(X1 = 4; X2 = 2; X3 = 1; X4 = 3) = 10! × 0,4 4 × 0,32 × 0,11 × 0,23 = 4! 2! 1!3! = 12600 x 0,0256 x 0,09 x 0,1 x 0,008 = 0,023. 7.2 - O número esperado é a média. Tal como a pergunta está feita temos “declarações com erros a favor do contribuinte” versus as outras situações pelo que estamos perante uma distribuição Binomial. Assim: µ = n x p = 10 x 0,30 = 3,0 . 8 - Dum lote de 100 peças, das quais 20 são defeituosas, escolheu-se ao acaso uma amostra de 10. Qual a probabilidade de nessa amostra: 8.1 - Haver 3 defeituosas? 8.2 - Haver 5 defeituosas? Resolução: 8 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; e são retiradas sem reposição (amostra) o que faz com que sejam provas não independentes. Como o valor da população donde é retirada a amostra é conhecido pode calcular-se através da Distribuição Hipergeométrica. Miguel Soares Lopes Ficha 4 45 Distribuições Teóricas Discretas X — nº de artigos defeituosos numa amostra de 10 ; X∩H (100 ; 20 ; 10) 8.1 - P(X=3) = 8.2 - P(X=5) = 20 C3 × 80C7 100 20 C10 C5 × 80C5 100 C10 = 0,209 ; = 0,021 . 9 - Um vendedor tem 20 artigos dos quais apenas 16 estão de acordo com as especificações do comprador. Esse comprador examina sempre 20% dos artigos de cada lote apresentado pelo vendedor. O vendedor tem duas opções: — vender os artigos num único lote. — vender os artigos em 2 lotes de 10 artigos cada um, distribuindo os artigos bons igualmente pelos 2 lotes. O comprador rejeita o lote se na amostra examinada encontrar um ou mais artigos sem as especificações. 9.1 - Qual a probabilidade de o vendedor conseguir vender os 20 artigos na primeira opção? 9.2 - Qual a melhor opção para o comprador? Resolução: 9 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; cada prova é retirada sem reposição o que faz com que sejam provas não independentes. Como o valor da população donde é retirada a amostra é conhecido pode calcular-se através da Distribuição Hipergeométrica. 9.1 - X — nº de artigos defeituosos numa amostra de 4 ; X∩H (20 ; 4 ; 4) P(vender o lote de 20 peças) = P(X=0) = 4 C0 × 16C 4 20 C4 = 0,376 ; 9.2 - Nesta opção, para se venderem os dois lotes é necessário vender um e vender o outro, ou seja, em ambos os lotes é necessário que não se encontrem nenhumas peças defeituosas. Neste caso cada lote passou a ter 10 peças das quais agora 2 são defeituosas. Y — nº de artigos defeituosos numa amostra de 2 ; Y∩H (10 ; 2 ; 2) P(vender as 20 peças) = P(vender um lote de 10 peças e vender o outro lote de 10 peças) = P(Y=0) x P(Y=0) = 2 C0 × 8C 2 10 C2 x 2 C0 × 8C 2 10 C2 = 0,6222 = 0,387 . Do ponto de vista do vendedor é melhor a segunda opção (maior probabilidade de conseguir vender) e, por oposição, a melhor opção para o comprador é a 1ª [do seu ponto de vista ele quererá rejeitar o(s) lote(s)]. Miguel Soares Lopes Ficha 4 46 Distribuições Teóricas Discretas 10 -A variável X tem distribuição binomial, com parâmetros n e p. Sabendo que µ=5 e σ2 = 4, determinar n e p. Resolução: 10 -Temos neste caso duas incógnitas, n e p, que se relacionam através de outras duas expressões: a da média e a da variância cujos valores são fornecidos. Assim podemos escrever: n× p = 5 n× p×q = 4 ⇔ n= 5 p n × p × (1 − p) = 4 ⇔ − 5 × (1 − p) = 4 ⇔ − 5−5p = 4 ⇔ − 5p =1 ⇔ n= 5 0, 2 = 25 p = 0,2 n = 25 e p = 0,2 . 11 -A distribuição de falhas em contraplacado de madeira apresenta em média uma falha em 50 dm2. Qual a probabilidade de que numa porção de contraplacado de dimensão 4 x 8 dm2: 11.1 - Não haja nenhuma falha 11.2 - Haja, quando muito, uma falha. Resolução: 11 -É-nos dado o valor médio de falhas para 50 dm2: λ1 = 1 falha/50 dm2. Temos que obter o novo λ2 para 4 x 8=32 dm2. λ2 = 0,64 falhas/32 dm2 (regra de 3 simples) 1 falha — 50 dm3 X — nº de falhas por 32 dm2 x falhas — 32 dm3 X∩Po(0,64) x = 32/50 = 0,64 falhas e −0,64 × 0,64 0 = 0,527 ; 0! e −0,64 × 0,64 0 e −0,64 × 0,641 P(X≤1) = P(X=0) + P(X=1) = + = 0,864 . 0! 1! 11.1 - P(X=0) = 11.2 - 12 - A máquina 1 produz por dia o dobro das peças que são produzidas pela máquina 2. No entanto, 6% das peças fabricados pela máquina 1 tendem a ser defeituosas, enquanto somente 3% o tendem a ser na máquina 2. 12.1 - Qual a probabilidade, de num lote de 10 peças extraídas ao acaso da produção total: 12.1.1 - haver 2 peças defeituosas? 12.1.2 - haver entre 2 e 5 (inclusive) peças defeituosas? 12.2 - Qual o número esperado de peças defeituosas num lote de 100? 12.3 - Atendendo à capacidade das máquinas colhe-se diariamente uma amostra de 4 peças da máquina 1 e uma amostra de 8 da máquina 2. Calcular a probabilidade de haver 2 peças com defeito no conjunto das duas amostras. 12.4 - As peças são vendidas em embalagens de 20, garantindo o fabricante que 90% são de boa qualidade. Calcular a probabilidade dessa garantia ser violada. 12 - Resolução: 12.1 - As provas têm 2 resultados possíveis: “defeituosas” e “não defeituosas”; e são retiradas sem reposição (amostra) o que faz com que as provas não sejam Miguel Soares Lopes Ficha 4 47 Distribuições Teóricas Discretas independentes. Como o valor da população donde é retirada a amostra não é conhecido (não se pode calcular através da Distribuição Hipergeométrica) e se supõe que a dimensão da população seja muito maior que 10 vezes a dimensão da amostra vamos calcular através da Distribuição Binomial (por aproximação). P(1) = 2/3 e P(2) = 1/3 (resolução por sistema) P(D|1) = 0,06 e P(D|2) = 0,03 então, pelo teorema da probabilidade total: P(D) = 2/3 x 0,06 + 1/3 x 0,03 = 0,05 ; X — nº de de peças defeituosas numa amostra de 10 ; ° X∩Bin (10 ; 0,05) 12.1.1 - P(X=2) = 10C2 × 0,052 × 0,957 = 0,075 ; 12.1.2 - P(2≤X≤5) = P(X=2) + P(X=3) + P(X=4) + P(X=5) = = 10C2 × 0,052 × 0,957 + … + 10C5 × 0,055 × 0,955 = 0,086 . 12.2 - µ = 100 x 0,05 = 5 12.3 - As 2 peças defeituosas no conjunto das 12 peças [4 da máquina 1 (M1) e 8 da máquina 2 (M2)] podem ser obtidas de três modos diferentes: M1 M2 Total 2 0 2 1 1 2 0 2 2 Para calcular a probabilidade de ter 2 peças defeituosas há que calcular a probabilidade de cada uma das situações apresentadas anteriormente. Cada uma delas é calculada como sendo o produto das duas situações que lhe dão origem, isto é, por exemplo e para o primeiro caso, a probabilidade de, na amostra proveniente de M1, termos 2 peças defeituosas e na amostra M2 ter 0 peças defeituosa. Vamos definir as variáveis necessárias e calculemos as 3 situações: X1 : nº de peças def. na amostra de 4 peças proveniente de M1; ° ; 0,06) X1∩Bi(4 X2 : nº de peças def. na amostra de 8 peças proveniente de M2; ° X2∩Bi(8 ; 0,03) M1 M2 4 2 2 8 P(X1 = 2) = C2 × 0,06 × 0,94 = 0,019 P(X2 = 0) = C0 × 0,030 × 0,978 = 0,784 P(X1 = 1) = 4C1 × 0,061 × 0,943 = 0,199 P(X2 = 1) = 8C1 × 0,031 × 0,975 = 0,194 P(X1 = 0) = 4C0 × 0,060 × 0,944 = 0,781 P(X2 = 2) = 8C2 × 0,032 × 0,972 = 0,02 P(ter 2 peças defeituosas nas 12 peças) = 0,019 x 0,784 + 0,199 x 0,194 + 0,781 x 0,02 = = 0,07 12.4 - Garantir que 90% de 20 são de qualidade é dizer que 18 são de certeza boas e que, no máximo, 2 poderão ser defeituosas. Violar a garantia será ter mais de 2 defeituosas nas embalagens de 20. Z — nº de peças defeituosas numa embalagem de 20 ; Z∩Bin (20 ; 0,05) P(Z>2) = 1 – [P(Z=0) + P(Z=1) + P(Z=2)] = 1 – [ 20C0 × 0,050 × 0,9520 + + 20C1 × 0,051 × 0,9519 + 20C2 × 0,052 × 0,9518 ] = 1 – 0,9245 = 0,0755 . Miguel Soares Lopes Ficha 4 48 Distribuições Teóricas Discretas 13 -Um PBX recebe em média 60 chamadas telefónicas por hora. Calcular: 13.1 - A probabilidade de ser recebida apenas uma chamada durante um período de 1 minuto. 13.2 - A probabilidade de serem recebidas pelo menos 3 chamadas num intervalo de 5 minutos. 13.3 - Qual o número esperado de chamadas em 10 minutos? E numa hora? Resolução: 13 - X — nº de chamadas telefónicas por hora num PBX λ1 = 60 chamadas/hora ou 60 chamadas/60 minutos 13.1 - Converter o λ: λ2 = 1 chamada/1 minuto X∩Po(1) P(X=1) = e −1 × 11 = 0,368; 1! 13.2 - Converter o λ: λ3 = 5 chamada/5 minutos Y∩Po(5) P(Y≥3) = 1 – P(Y<3) = 1 – [P(Y=0) + P(Y=1) + P(Y=2)] = 1 – ( + e −5 × 5 0 + 0! e −5 × 51 e −5 × 5 2 + ) = 1 – 0,1247 = 0,8753 1! 2! 13.3 - µ10 = 10 chamadas; µh = 60 chamadas. 14 -Suponha que um livro de 585 páginas contém 43 erros tipográficos. Se esses erros estiverem aleatoriamente distribuídos pelo livro, qual a probabilidade de: 14.1 - uma página qualquer não ter erros? 14.2 - onze páginas escolhidas ao acaso não terem erros? 14 - Resolução: 14.1 - X — nº de erros numa página. λ1 = 43 erros/585 pág. = 0,074 erros/pág. X∩Po(0,074) P(X=0) = e −0,074 × 0,074 0 = 0,929; 0! 14.2 - Esta pergunta será resolvida no capítulo seguinte quando se tratar da matéria “Aproximação da Poisson à Normal”. Miguel Soares Lopes Ficha 4 49 Distribuições Teóricas Discretas 15 -Admite-se que 5% da produção de certa fábrica apresenta defeitos. Numa encomenda de 100 unidades, qual a probabilidade de se encontrarem: 15.1 - duas peças defeituosas? 15.2 - no máximo 2 peças defeituosas? Resolução: 15 -X — nº de peças defeituosas numa encomenda de 100 unidades; X∩Bin (100 ; 0,05) 15.1 - P(X = 2) = 100C2 × 0,052 × 0,9598 = 0,081 ; 15.2 - P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = = 100C0 × 0,050 × 0,95100 + 100C1 × 0,051 × 0,9599 + 0,081 = 0,118 . 16 -Numa fábrica o número de acidentes por semana segue uma lei de Poisson com parâmetro igual a 2. Calcular a probabilidade de: 16.1 - numa semana haver pelo menos um acidente 16.2 - numa semana haver pelo menos um acidente, sabendo-se que na semana anterior não se tinha registado nenhum. 16.3 - em 2 semanas se verificarem 4 acidentes. 16.4 - numa semana haver 2 acidentes e na semana seguinte outros 2. 16 - Resolução: 16.1 - X — nº de acidentes por semana λ1 = 2 acidentes/semana X∩Po(2) P(X≥1) = 1 – P(X=0) = 1 – e −2 × 2 0 = 1 – 0,135 = 0,865 ; 0! 16.2 - O mesmo da alínea anterior uma vez que na Distribuição de Poisson os acontecimentos são independentes e, portanto, acontecimentos passados não influenciam acontecimentos futuros. 16.3 - Y — nº de acidentes em 2 semanas λ2 = 2 x 2 acidentes/semana = 4 Y∩Po(4) P(Y=4) = e −4 × 4 4 = 0,195 ; 4! 16.4 - λ1 = 2 acidentes/semana P(2 acidentes numa semana e 2 acidentes na semana seguinte) = = P(X=2) x P(X=2) = 0,2712 = 0,073 . Miguel Soares Lopes Ficha 4 50 Distribuições Teóricas Discretas 17 -O número de rebuçados de chocolate contidos numa embalagem de 250 g de certa marca segue distribuição de Poisson. Sabendo que a probabilidade de uma embalagem desse tipo conter pelo menos 1 rebuçados de chocolate é superior a 0,8 calcular: 17.1 - o valor mínimo que a média da distribuição pode tomar. 17.2 - Tomando esse valor médio, calcular a probabilidade de, numa embalagem de 500 g, existirem exactamente 8 rebuçados de chocolate. 17 - Resolução: 17.1 - X — nº de rebuçados em 250g X∩Po(λ) P(X 1) > 0,8 ⇔ 1 – P(X=0) > 0,8 ⇔ P(X=0) < 0,2 ⇔ ⇔ e- < 0,2 ⇔ λ > -ln(0,2) ⇔ λ > 1,609 rebuçados/250g e− × 0! 0 < 0,2 ⇔ 17.2 - λ2 = 2 x 1,609 = 3,218 rebuçados/500g X — nº de rebuçados em 500; X∩Po(3,218) P(X=8) = e −3,218 × 3,2188 = 0,011 . 8! 18 -Sabe-se que a probabilidade de determinada máquina automática necessitar de ser afinada em cada período de trabalho de 30 minutos é 0,05. Determinar: 18.1 - a média do número de afinações numa semana em que a máquina trabalha 20 horas. 18.2 - a probabilidade de, em 8 horas de trabalho, se verificar pelo menos 1 afinação e a de se verificarem 2 a 5 afinações. Resolução: 18 -X — nº de afinações da máquina em cada 30 min. P(máquina ser afinada em cada 30 min) = 0,05 ⇔ P(máquina NÃO ser afinada em cada 30 min) = 1 – 0,05 = 0,95 ⇔ P(X=0) = 0,95 ⇔ ⇔ e− × 0! 0 = e-λ = 0,95 ⇔ λ30min = -ln (0,95) = 0,0513 ; X∩Po(0,051) 18.1 - Regra de “3 simples”: se em 30 min são 0,051 em 20 h são 40 vezes mais; λ20h = 40 x 0,051 = 2,052 ; 18.2 - Y — nº de afinações da máquina em cada 8 horas; λ8h = 0,0513 x 16 = 0,821 ; P(Y≥1) = 1 – P(Y=0) = 1 – e −0,821 × 0,8210 = 1 – 0,44 = 0,56 ; 0! P(2≥Y≥5) = (Y=2) + … + P(Y=5) = 0,199 . Miguel Soares Lopes Ficha 4 51 Distribuições Teóricas Discretas 19 -Uma remessa de 20 barras de aço é aceite pelo comprador se numa amostra de 5 escolhidas simultaneamente e ao acaso não houver mais que uma defeituosa. Qual a probabilidade de ser aceite um lote que contém 4 barras defeituosas? Resolução: 19 -X — nº de peças defeituosas numa remessa de 20 barras; X∩H (20 ; 4 ; 5 ) P(X≤1) = P(X=0) + P(X=1) = 4 C0 × 16C5 4C1 × 16C 4 + 20 = 0,751 ; 20 C5 C5 20 -Um exame é constituído por 15 questões, cada uma com cinco alternativas de resposta, em que apenas uma é correcta. Supondo que um estudante responde às questões aleatoriamente, qual a probabilidade de acertar 10 questões. Resolução: 20 -Se cada pergunta tem cinco alternativas e se a resposta é aleatória, a probabilidade de acertar na resposta correcta a cada pergunta é 1/5, ou seja, 0,2. X — nº de respostas correctas em 15 perguntas de escolha múltipla; X∩Bin (15 ; 0,2) P(X=10) = 15C10 × 0,210 × 0,85 = 0,0001008 [ comentário: concluiu-se que não vale a pena apostar neste método ] Miguel Soares Lopes Ficha 4 52 Distribuições Teóricas Contínuas Distribuições Teóricas Contínuas A distribuição Normal tem 2 parâmetros: um deles é a média (µ) e o outro é, segundo os autores, a variância (σ2) ou o desvio padrão (σ). No contexto destes exercícios assumiu-se a variância como segundo parâmetro da distribuição normal. 1 - O montante de depósitos à ordem efectuados diariamente numa agência bancária é uma variável aleatória com distribuição normal de média 120 u.m. e variância 64 u.m2. Determine a percentagem de dias em que o montante de depósitos à ordem efectuados diariamente: 1.1 1.2 1.3 1.4 - é inferior a 135 u.m.; é inferior a 105 u.m.; se situa entre 105 e 135 u.m. Determine o montante de depósitos à ordem efectuados diariamente, acima do qual se situam 90% dos dias. Resolução: 1 - A maior parte deste tipo de problemas obedece a um esquema mental que é o seguinte: a partir de x determinar z, fazer as transformações necessárias para contornar as limitações da tabela (apresentação 6, diap. 16 a 19) e consultar a tabela. x z tabela X — montante de depósitos à ordem efectuados diariamente numa agência bancária; Tabela X∩N (120 ; 64 ) 1.1 - P(X<135) = P(Z<1,88) = 0,97 ; z= x− = 135 −8120 = 1,88 Tabela 1.2 - P(X<105) = P(Z<-1,88) = P(Z>1,88) = 1 – P(Z<1,88) = 1 – 0,97 = 0,03 ; z= x− = 105 −8120 = −1,88 1.3 - P(105<X<135) = P(X<135) – P(X≤105) = 0,97 – 0,03 = 0,94 ; 1.4 - Aqui a pergunta é: “qual o montante?”, isto é “qual o valor do x?”. Ora esta pergunta inverte o esquema mental apresentado em 1.1. Neste caso temos que partir da tabela (através do valor da percentagem dada), determinar o z e depois, a partir dele, o x. Saliente-se que a partir da expressão que converte o x em z, e conhecendo 3 das suas 4 componentes, podemos sempre determinar aquela que estiver em falta. se z < 0 então -z > 0 -z > 0 − 1,28 = x1 −120 8 P(X>x1) = 0,90 ⇔ P(Z>z) = 0,90 ⇔ P(Z<-z) = 0,90 ⇔ -z = 1,28 ⇔ z = -1,28 ⇔ ⇔ x1 = 109,77 . Tabela: procuramos o valor mais próximo da proba- Miguel Soares Lopes Ficha 5 bilidade 0,90 e tiramos o respectivo z 53 Distribuições Teóricas Contínuas 2 - Determinado produto é comercializado em embalagens cujo rótulo indica 1 kg. O peso das embalagens segue distribuição normal, com média igual a 1 kg e variância igual a 0,01 kg2. Calcular a probabilidade de uma embalagem ter peso: 2.1 - superior a 1,121 kg. 2.2 - entre 0,879 kg e 1,121 kg. Represente graficamente a probabilidade obtida. 2.3 - Alguém comprou uma pack de 10 embalagens. Qual a probabilidade de nesse pack ter 3 embalagens com peso superior a 1 kg? 2.4 - O vendedor é multado quando uma inspecção detecta, numa amostra de 5 embalagens escolhidas ao acaso, 2 ou mais com peso inferior a 0,975 kg. Qual a probabilidade de o vendedor ser multado quando o seu stock for inspeccionado? Resolução: 2 - X — peso das embalagens de um determinado produto; X∩N (1 ; 0,01 ) 2.1 - P(X>1,121) = P(Z>1,21) = 1 – P(Z 1,21) = 1 – 0,887 = 0,113; 2.2 - P(0,879<X<1,121) = P(X<1,121) – P(X≤0,879) = P(Z<1,21) – P(Z≤-1,21) = = 0,887 – ( 1 – 0,887) = 0,774 ; 2.3 - Y — nº de embalagens com peso superior a 1kg num pack de 10; Y∩Bin( 10 ; 0,5 ) (o 2º parâmetro da Binomial é a probabilidade do sucesso, neste caso, “ter peso superior a 1kg. Sendo X a respectiva variável e 1kg a sua média, ter peso superior a 1kg é, obviamente, 0,5) 10 3 P(Y=3) = C3 × 0,5 × 0,57 = 0,1172 ; 2.4 - W — nº de embalagens com peso inferior a 0,975kg numa amostra de 5; W∩Bin( 5 ; 0,401 ) Tal como na alínea anterior estamos perante uma Binomial. Neste caso a probabilidade do sucesso (p) é ter embalagens com peso inferior a 0,975kg. Para determinar “p” temos que recorrer à distribuição Normal e calcular: P(X<0,975) = P(Z<-0,25) = P(Z>0,25) = 1 – P(Z≤0,25) = 1 – 0,599 = 0,401 Agora sim, podemos regressar à nossa Binomial: P(W≥2) = 1 – [P(W=0) + P(W=1)] = 1 – [ 5C0 × 0,4010 × 0,5995 + 5C1 × 0,4011 × 0,5994 ] = = 1 – 0,3352 = 0,6648 . 3 - Uma população de gastrópodes marinhos apresenta um comprimento de concha que segue distribuição normal, com média de 7 mm e variância igual a 2 mm2. Que proporção da população terá conchas com comprimento: 3.1 - menor que 9 mm? 3.2 - entre 5 e 9 mm? Miguel Soares Lopes Ficha 5 54 Distribuições Teóricas Contínuas 3.3 - menor que 5 mm? 3.4 - entre 6 e 9 mm? Resolução: 3 - X — comprimento da concha de uma população de gastrópodes marinhos; X∩N (7 ; 2 ) 3.1 - P(X<9) = P(Z<1,41) = 0,921 ; 3.2 - P(5<X<9) = P(X<9) – P(X≤5) = 0,921 – P(Z≤-1,41) = 0,921 – (1 – 0,921) = = 0,842 ; 3.3 - P(X<5) = P(Z<-1,41) = P(Z>1,41) = 1 – 0,921 = 0,079 ; 3.4 - P(6<X<9) = P(X<9) – P(X≤6) = 0,921 – P(Z≤-0,71) = 0,921 – (1 – 0,761) = = 0,682 ; 4 - O tempo de desenvolvimento do fungo A, em laranjas mantidas a uma temperatura de 20º C, é normalmente distribuído com média de 7 dias e variância de 4 dias2. À mesma temperatura, o tempo de desenvolvimento do fungo B segue distribuição normal com uma média de 10 dias e uma variância de 2 dias2. Se uma laranja contaminada com esporos dos dois fungos se mantiver durante 9 dias a 20º C qual a probabilidade de: 4.1 - o fungo A se desenvolver? 4.2 - o fungo B se desenvolver? 4.3 - ambos os fungos se desenvolverem, assumindo que não existe interacção entre eles? Resolução: 4 - X — tempo de desenvolvimento do fungo A com X∩N (7 ; 4 ); Y — tempo de desenvolvimento do fungo B com Y∩N (10 ; 2 ); 4.1 - P(X<9) = P(Z<1) = 0,841 ; 4.2 - P(Y<9) = P(Z<-0,71) = P(Z>0,71) = 1 – P(Z≤0,71) = 1 – 0,761 = 0,239 ; 4.3 - P(ambos se desenvolverem) = P(X<9) x P(Y<9) = 0,841 x 0,239 = 0,201 . 5 - O peso médio de 500 estudantes do sexo masculino, numa determinada universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Admitindo que os pesos são normalmente distribuídos, determinar quantos estudantes pesam: 5.1 - entre 60 e 77,5 kg; 5.2 - mais de 92,5 kg. Resolução: 5 - X — peso de um estudante do sexo masculino, numa determinada universidade; X∩N (75,5 ; 7,5 ); 5.1 - P(60<X<77,5) = P(X<77,5) – P(X≤60) = P(Z<0,27) – P(Z≤-2,07) = 60 − 75,5 = 0,606 – (1 – 0,981) = 0,587 ; z = 77,5 − 75,5 = 0,27 z= = −2,07 7,5 Miguel Soares Lopes Ficha 5 7,5 55 Distribuições Teóricas Contínuas 5.2 - P(X>92,5) = P(Z>2,27) = 1 – P(Z≤2,27) = 0,012 . 6 - O peso das embalagens de presunto produzidas por uma empresa é uma variável aleatória normal X. Sabendo que P(X≤88,55g)=0,011 e P(X>105,80g)=0,123, determinar: 6.1 - os parâmetros µ e σ2 da distribuição. 6.2 - qual a probabilidade de uma embalagem escolhida ao acaso ter um peso inferior a 90 g? Resolução: 6 - X — peso das embalagens de presunto; 6.1 - Temos 2 incógnitas (µ e σ) que vão ser obtidas por sistema a partir de 2 equações que são as expressão de cálculo de “z1” (obtido a partir de “x1=88,55g”) e de “z2” (obtido a partir de “x2=105,80g”). Nestas equações, figuram z, x, µ e σ. Sabendo 2 delas (os “z’s” e os “x’s”) posso obter as outras 2 por sistema. A cada valor de “x” corresponde um valor de “z”. Assim, a 88,55 corresponde z1 e a 105,8 corresponde z2. À direita do valor x2=105,80 temos uma pequena área de 0,123. Se a área fosse maior que 0,5, este valor teria de estar do lado esquerdo da média. z2 será positivo À esquerda do valor x1=88,55 temos uma pequena área de 0,011. Se a área fosse maior que 0,5, este valor teria de estar do lado direito da média. z1 será negativo P(X≤88,55g) = 0,011 ⇔ P(Z≤z1) = 0,011 ⇔ P(Z≥-z1) = 0,011 ⇔ z1<0 -z1>0 ⇔ 1 – P(Z<-z1) = 0,011 ⇔ P(Z<-z1) = 1 – 0,011 = 0,989 ⇔ -z1 = 2,29 ⇔ z1 = -2,29 P(X>105,80g) = 0,123 ⇔ P(Z>z2) = 0,123 ⇔ 1 – P(Z≤z2) = 0,123 ⇔ ⇔ P(Z≤z2) = 1 – 0,123 = P(Z≤z2) = 0,877 ⇔ z2 = 1,16 Substituindo os valores de “z” e “x” em cada uma das equações e resolvendo o sistema: { − 2,29 = 1,16 = 88,55 − obtemos: µ = 100g e σ = 5g 105,80 − 6.2 - X∩N ( 100 ; 25 ); P(X<90) = P(Z<-2,00) = P(Z>2,00) = 1 – P(Z≤2,00) = 1 – 0,977 = 0,023 . z= 90 − 100 = −2 5 7 - Numa seara de milho, a altura dos pés das plantas de uma dada cultivar na fase de maturação segue distribuição normal, com média igual a 1,65 m. Sabendo que a probabilidade de encontrar pés de milho com altura inferior a 1,90 m é de 97%, calcular: Miguel Soares Lopes Ficha 5 56 Distribuições Teóricas Contínuas 7.1 - a variância da população; 7.2 - a probabilidade de a altura dos pés de milho se situar entre 1,55 e 1,75 m; 7.3 - um intervalo centrado na média com uma probabilidade de 95%. Resolução: 7 - X — altura dos pés de milho de uma dada cultivar na fase de maturação; X∩N ( 1,65 ; σ2 ); 7.1 - P(X<1,90) = 0,97 ⇔ P(Z<z) = 0,97 ⇔ z = 1,88 1,88 = (1,901,65)/ σ ⇔ σ = 0,133 ⇔ σ2 = 0,0177 ; 7.2 - X∩N ( 1,65 ; 0,0177 ); P(1,55<X<1,75) = P(X<1,75) – P(X≤1,55) = = P(Z<0,75) – P(Z≤-0,75) = 0,773 – (1 – 0,773) = 0,546 7.3 - Como se pode ver pela figura ao lado, aquilo que se pede são os valores de x1 e x2; a esses valores correspondem 2 valores de z (simétricos entre si) que balizam iguais áreas: a x1 corresponde z1 (negativo) e a x2 corresponde z2 (positivo). Sabendo um, sabemos o outro. Qual é a área à esquerda de z2 (a mesma área de x2)? A área à esquerda de z2 é 0,975. Consultando a tabela vem que z2 = 1,96 . Daqui tira-se o x2; x2 = z2 x σ + µ ⇔ x2 = 1,96 × 0,133 + 1,65 = 1,91 m . O valor de x1 dista de 1,65 m o mesmo que x2, pelo que x1 = 1,39 m . 8 - A média dos diâmetros internos das porcas, produzidas por uma certa máquina, é 0,502 centímetros e o desvio padrão é igual a 0,005 centímetros. O controlo de qualidade na produção não rejeita peças cujo diâmetro esteja compreendido entre 0,496 e 0,508 centímetros; caso contrário, as porcas serão consideradas defeituosas. Determinar a percentagem de porcas produzidas pela máquina que passam no controlo de qualidade, admitindo que os diâmetros são distribuídos normalmente. Resolução: 8 - X — diâmetros internos das porcas; X∩N ( 0,502 ; 0,0052 ); P(uma porca passar no controlo de qualidade) = P(0,496 < X < 0,508) = = P(X < 0,508) – P(X ≤ 0,496) = P(Z < 1,20) – P(X≤-1,20) = 0,885 – (1–0,885) = = 0,760 9 - Numa cooperativa fruteira, as maçãs recebidas são classificadas e embaladas consoante o seu calibre. São rejeitadas as que apresentam calibre inferior a 50 mm, as quais representam 12,3% do total recebido. Sendo o calibre uma variável aleatória que segue distribuição normal, com média de 70 mm, calcular: 9.1 - o desvio padrão; Miguel Soares Lopes Ficha 5 57 Distribuições Teóricas Contínuas 9.2 - a probabilidade de uma maçã, escolhida ao acaso, ter um calibre superior a 90 mm. 9.3 - Numa embalagem com uma dúzia de maçãs qual a probabilidade de ter 3 com calibre até 50 mm e 7 com calibre entre 50 e 90 mm? Resolução: 9 - X — calibre (diâmetros) das maçãs; X∩N ( 70 ; σ2 ); 9.1 - P(X<50)=0,123⇔P(Z<z)=0,123 ⇔ P(Z>-z) = 0,123 ⇔1–P(Z≤-z)= 0,123 ⇔ ⇔ P(Z≤-z) = 0,877⇔ -z = 1,16 ⇔ z = -1,16 ⇔ z = (x – µ) / σ ⇔ σ = (x – µ) / z ⇔ ⇔ σ = (50 – 70) / -1,16 = σ = 17,2 cm . 9.2 - P(X > 90) = P(Z > 1,16) = 1 – P(Z ≤ 1,16) = 1 – 0,877 = 0,123 ; 9.3 - Cada maçã pode ter 1 de 3 resultados possíveis: calibre até 50 mm, calibre entre 50 e 90 mm e calibre acima de 90 mm. Por outro lado as provas podem ser consideradas independentes uma vez que a mostra é pequena dentro da população de maçãs da cooperativa. Estamos perante uma Distribuição Multinomial. X1 — nº de maçãs com calibre até 50 mm; X2 — nº de maçãs com calibre entre 50 e 90 mm; X3 — nº de maçãs com calibre superior a 90 mm; p1 = P(uma maçã ter calibre até 50 mm) = 0,123; p2 = P(uma maçã ter calibre entre 50 e 90 mm) = 0,754; p3 = P(uma maçã ter calibre superior a 90 mm) = 0,123; P(X1=3;X2=7;X3=2) = 12! × 0,1233 × 0,7547 × 0,1232 = 0,031 3! 7! 2! 10 - Cada esporo libertado de uma cápsula de um feto tem uma probabilidade de 0,2 de se tornar planta. Se a cápsula tiver 100 esporos, qual a probabilidade de pelo menos 25 se tornarem plantas? Resolução: 10 - X — nº de esporos que se tornam planta; X∩Bin ( 100 ; 0,2 ) Como o “n” é “grande” podemos verificar se estamos em condições de resolver por aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” (diap.21, apresent. 6). Assim, 100 × 0,2 = 20 > 5 e 100 × 0,8 = 80 > 5 — cumpre as 2 condições. ° ° Então Y∩N ( 100 × 0,2 ; 100 × 0,2 × 0,8 ) = Y∩N ( 20 ; 16 ) ; (diap.23, apresent. 6). P(Y≥25)Bin ≈ P(Y>24,5)N = P(Z>1,13) = 1 – P(Z≤1,13) = 1 – 0,871 = 0,129 . (diap.22, apresent. 6). 11 - O peso dos melões de uma dada variedade, X, é uma variável aleatória normalmente distribuída. A probabilidade de um melão, escolhido ao acaso, ter peso superior a 1,350 kg é igual a 2/3 da probabilidade de encontrar um melão com peso inferior à média. Calcular: Miguel Soares Lopes Ficha 5 58 Distribuições Teóricas Contínuas 11.1 - a média do peso dos melões sabendo que a variância é igual a 0,0625 kg2; 11.2 - a probabilidade de um qualquer melão ter peso menor que 1,51 kg; 11.3 - a probabilidade de um qualquer melão ter peso entre 1,18 e 1,51 kg; 11.4 - Numa remessa de 50 melões, qual a probabilidade de encontrar mais de 6 com peso superior a 1,51 kg? Resolução: 11 - X — peso dos melões de uma dada variedade; P(X>1,350) = 2/3 P(X<µ) = 2/3 × 0,5 = 1/3 ≈ 0,33 ⇔ 1 – P(X≤1,350) = 0,33 ⇔ ⇔ 1 – P(X≤1,350) = 0,33 ⇔ P(X≤1,350) = 1 – 0,33 = 0,67 ; 11.1 - Se P(X≤1,350) = 0,67 ⇔ P(Z≤z) = 0,67 ⇔ z = 0,44 ; De z = (x – µ)/σ ⇔ µ = x – z × σ ⇔ µ = 1,350 – 0,44 × 0,25 = 1,24 ; 11.2 - P(X<1,51) = P(Z<1,08) = 0,860 ; 11.3 - P(1,18<X<1,51) = P(X<1,51) – P(X≤1,18) = 0,860 – P(Z<-0,24) = = 0,860 – [1 – P(Z<0,24)] = 0,860 – 1 + 0,595 = 0,455 ; 11.4 - Y — nº de melões com peso superior a 1,51 kg; Y∩Bin ( 50 ; 0,14 ) [p = 1 – 0,86 = 0,14]; Como o “n” é “grande” podemos verificar se estamos em condições de resolver por aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” . Assim, 50 × 0,14 = 7 ≥ 5 e 50 × 0,86 = 43 ≥ 5 — cumpre as 2 condições. ° ° Então Y∩N ( 50 × 0,14 ; 50 × 0,14 × 0,86 ) = Y∩N ( 7 ; 6,02 ) ; P(Y>6)Bin ≈ P(Y>6,5)N = P(Z>-0,20) = P(Z<0,20) = 0,579 . (diap.22, apresent. 6). 12 - Uma máquina produz parafusos cujo comprimento, em cm, é uma variável aleatória com distribuição Normal de parâmetros µ = 2 cm e σ = 0,0125 cm. Considera-se que um parafuso é defeituoso quando o seu comprimento difere de 2 cm por mais ou menos 0,04 cm. Calcule a probabilidade de numa produção de 10 000 parafusos se encontrarem mais de 10 defeituosos. Resolução: 12 - Y — nº de parafusos defeituosos em 10000 parafusos. Y∩Bin (10000 ;P[ser def.)] ⇔Y∩Bin (10000;1–0,998) ⇔ Y∩Bin (10000; 0,002) X — comprimento dos parafusos. X∩N (2 ; 0,01252 ) P(não ser defeituoso) = P(1,96≤X≤2,04) = P(X≤2,04) – P(X<1,96) = = P(Z≤3,2) – P(Z<-3,2) =0,999 – (1 0,999) = 0,998. Como o “n” é “grande” podemos verificar se estamos em condições de resolver por aproximação pela Normal: “n × p ≥ 5” e “n × q ≥ 5” . Assim, 10000 × 0,002 = 20 ≥ 5 e 10000 × 0,998 = 9980 ≥ 5 — cumpre as 2 condições. ° Então, se Y∩Bin (10000 ; 0,002) ⇔ Y∩N ( 20 ; 19,96 ); P(Y>10)Bin ≈ P(Y>10,5)N = P(Z>-2,24) = P(Z<2,24) = 0,987 . Miguel Soares Lopes Ficha 5 59 Distribuições Teóricas Contínuas 13 - O peso das tangerinas de uma variedade é uma variável aleatória X normalmente distribuída com média igual a 75 g e variância igual a 256 g2. Sabendo que os frutos são classificados de acordo com o seu peso em 3 classes distintas, A, B e C, e que à classe A pertencem os frutos com menos de 50 g, à classe C os frutos com mais de 100 g e à classe B os restantes. Calcular: 13.1 - a proporção de frutos pertencentes a cada classe; 13.2 - P(X > 60 g). 13.3 - Sabe-se que a probabilidade das tangerinas estarem estragadas é de 5% quando a sua classe é A, de 4% quando a sua classe é B e de 2% quando a sua classe é C. 13.4 - Calcular a probabilidade de uma tangerina escolhida ao acaso estar estragada 13.5 - Em 1200 tangerinas da classe B, quantas poderão estar estragadas? Resolução: 13 - X — peso das tangerinas de uma variedade; X∩N (75 ; 256 ) 13.1 - Como se pode ver pela imagem os valores 50 e 100 são equidistantes do valor médio 75. Por isso, pode dizer-se que as áreas parciais “b1” e “b2” (que no conjunto correspondem à classe “B”) são iguais e que as áreas “a” (que corresponde à classe “A”) e “c” (que corresponde à classe “C”) são também iguais. Assim, se se determinar a área “b2” podemos obter indirectamente todas as proporções. b2 = P(75<X<100) = P(X<100) – P(X≤75) = P(Z<1,56) – 0,5 = 0,94 – 0,5 = 0,44 P(B) = 2 x b2 = 2 x 0,44 = 0,88 P(A) = P(C) e P(A) + P(C) = 1 – P(B) = 1 – 0,88 = 0,12 pelo que P(A) = P(C) = 0,06. 13.2 - P(X>60) = P(Z>-0,94) = P(Z<0,94) = 0,83 ; 13.3 - P(E|A) = 5% ; P(E|B) = 4% ; P(E|C) = 2% ; (teorema da 13.3.1 - P(E) = 0,06 × 0,05 + 0 88 × 0,04 + 0,06 × 0,02 = 0,39 ; probabilidade total) 13.3.2 - Nº de tangerinas estragadas em B = 1200 × 0,04 = 48 14 - Numa dada indústria de tecido XYZ sabe-se que sua produção costuma apresentar um número de defeitos que segue a distribuição de Poisson com uma taxa média de 2 defeitos a cada 50 metros de tecido. Determine: 14.1 - a probabilidade de um rolo com 200 metros de tecido apresentar 12 ou mais defeitos; 14.2 - a quantidade esperada de rolos que teriam menos de 5 defeitos numa amostra de 80 rolos de 200 metros. Miguel Soares Lopes Ficha 5 60 Distribuições Teóricas Contínuas Resolução: 14 - X — quantidade de defeitos em 200 m de tecido; X∩Po ( 200) ⇔ X∩Po (8) 50 = 2 def. — 50 m 200 — 200 m 200 = (2 × 200)/50 = 8 def. Como o é elevado, maior que 5, podemos fazer uma aproximação pela distribuição Normal. Assim, ° X∩Po ( 200) ⇔ X∩N (8 , 8) 14.1 - P(X 12) = P(X>11,5) = P(Z>1,24) = 1 – P(Z≤1,24) = 1 – 0,89251 = 0,10749 14.2 - O número esperado é a média. Cada um dos 80 m rolos, ou tem menos de 5 defeitos ou não tem menos de 5 defeitos; a probabilidade de ter menos de 5 defeitos é independente de rolo para rolo. Estamos assim perante uma distribuição Binomial: Y — quantidade de rolos com menos de 5 defeitos em 80 rolos Y∩Bin(80 , prob. de ter menos de 5 def.) ⇔ Y∩Bin(80 , 0,14457) ⇔ P(ter menos de 5 def.) = P(X≤5) = P(Z≤-1,06) = P(Z 1,06) = =1 – P(Z≤1,06) = 1 – 0,85543 = 0,14457 µ = n × p = 80 × 0,14457 = 11,57 rolos Miguel Soares Lopes Ficha 5 61 Inferência Estatística Inferência Estatística Intervalos de confiança 1 - A característica X em certo artigo produzido em série segue distribuição normal com desvio padrão σ = 3. Com base numa amostra aleatória de 25 unidades, que forneceu um valor médio de 48, construa um intervalo de confiança a 95% para o valor médio do universo. Resolução: 1 - Intervalo de confiança para a média da população, com desvio padrão conhecido: TAB X = 48 ; σ = 3 ; n = 25 ; P(Z<z) = 0,975 ⇔ z = 1,96 X –z ≤µ≤ X +z n n ⇔ 48 – 1,96 × 3 / 25 ≤ µ ≤ 48 + 1,96 × 3 / 25 ⇔ ⇔ 46,824 ≤ µ ≤ 49,176 . 2 - Uma máquina de bebidas está regulada de modo a servir uma quantidade de líquido que é uma variável aleatória com distribuição normal. Sabendo que numa amostra de 25 bebidas se obtiveram os seguintes resultados: 25 xi = 6250 ml i =1 25 ( xi − x ) 2 = 384 ml2 i=1 2.1 - Construir um intervalo de confiança a 90% para a verdadeira quantidade média de líquido das bebidas servidas, sabendo que o desvio padrão da população é 4 ml.(enunciado alterado) 2.2 - Determinar quantas bebidas deveriam ser incluídas na amostra se pretendesse aumentar a precisão do intervalo para menos de 1 ml. 2.3 - Supondo desconhecer o desvio padrão da população construir um intervalo de confiança a 95% para a verdadeira quantidade média de líquido das bebidas servidas. Resolução: 25 2 - X= i =1 xi n 25 s’2 = = 6250 / 25 = 250 ml ( xi − x ) 2 i=1 n −1 = 384 / 24 = 16 ml2 ⇔ s’ = 4 ml P(Z<z) = 0,95 ⇔ z = 1,64 2.1 - σ=4 (desvio padrão da população conhecido) usar: X –z n ≤µ≤ X +z n ⇔ 250 – 1,64 × 4 / 25 ≤ µ ≤ 250 + 1,64 × 4 / 25 ⇔ ⇔ 248,688 ≤ µ ≤ 251,312 . Miguel Soares Lopes Ficha 5 62 Inferência Estatística 2.2 - Precisão do intervalo = amplitude do intervalo / 2 ; A amplitude do intervalo é dada por 2 × (z × “menos de 1 ml”, então z × n n ). Como se quer uma precisão de < 1 ml ; substituindo vem: 1,64 × 4 n < 1 , então n > 43,03 ; como n é inteiro vem n = 44 . 2.3 - (desvio pad. da popul. desconhec. e n<30) usar a distribuição t-Student. TAB P(T>tα/2) = 0,025 (n-1=24) ⇔ t = 2,064 X – tα/2 s' n s' ≤ µ ≤ X + tα/2 n ⇔ 250 – 2,064 × 4 / 25 ≤ µ ≤ 250 + 2,064 × 4 / 25 ⇔ ⇔ 250 – 1,65 ≤ µ ≤ 250 + 1,65 ⇔ 248,35 ≤ µ ≤ 251,65 . 3 - Seja uma população X ∩ N (µ, σ) com σ = 4. Qual a dimensão mínima da amostra para a qual se tem um intervalo de confiança a 90% para a média inferior a ] x − 1 ; x + 1 [ ? Resolução: 3 - σ=4 (desvio padrão da população conhecido) usar X – z Como z × n n ≤µ≤ X +z n < 1 ml e P(Z<z) = 0,95 ⇔ z = 1,64 , substituindo vem: 1,64 × 4/ n < 1 , logo n > 43,3 , como n é inteiro vem n = 44 . 4 - Um fabricante produz peças de peso especificado em 200 gramas. Querendo estimar o verdadeiro peso médio num grande lote a fornecer ao seu maior cliente, seleccionou 35 peças ao acaso, que depois de pesadas forneceram os seguintes valores: ( xi − x ) 2 = 560 g 2 xi = 7140 g 4.1 - Apresentar uma estimativa para o peso médio das peças do lote. 4.2 - Construir um intervalo com um grau de confiança de 95% para o peso médio das peças do lote. 4- Resolução: xi 4.1 - X é estimativa de µ ; X = n = 7140/35 = 204 g ; 4.2 - Intervalo de confiança para a média da população, com desvio padrão da população desconhecido e n>30: usar X – z × s' n ≤µ≤ X +z× s' n (porque n>30, “t” tende para “z” ; mas como não temos “σ” usamos “s' ”) X = 204 g ; s´= X –z× s' n ( xi − x ) 2 n −1 ≤ µ ≤X + z × = s' n 560 34 TAB = 4,06 ; n = 35 ; P(Z<z) = 0,975 ⇔ z = 1,96 ⇔ 204 – 1,96 × 4,06/ 35 ≤ µ ≤ 204 + 1,96 × 4,06/ 35 ⇔ ⇔ 202,65 g ≤ µ ≤ 205,35 g Miguel Soares Lopes Ficha 6 63 Inferência Estatística 5 - Numa unidade de empacotamento de açúcar observou-se o peso de 9 embalagens, escolhidas aleatoriamente à saída da linha de empacotamento. O peso das embalagens é uma variável aleatória normal (X). Registaram-se os seguintes pesos (em gramas): 8,7 8,5 6,9 9,4 7,3 9,0 8,6 9,2 8,9 5.1 - Calcular a média amostral, o desvio padrão não corrigido (s) e o desvio padrão corrigido (s’). 5.2 - Estimar um intervalo de confiança a 99% para o peso médio das embalagens. 5.3 - Estimar um intervalo de confiança a 99% para o peso médio das embalagens, sabendo que σ = 0,6 g. 5- Resolução: 5.1 - X = 8,5 g ; s = 0,8 g ; s´ = 0,85 g (máq. de calcular); 5.2 - (desv. pad. da popul. desconhecido e n<30) usar X – tα/2 TAB P(T>tα/2) = 0,005 ⇔ t = 3,355 s' X – tα/2 × n ≤ µ ≤ X + tα/2 × s' n s' n ≤ µ ≤ X + tα/2 s' n ; ⇔ 8,5 – 3,355 × 0,85/ 9 ≤ µ ≤ 8,5 + 3,355 × 0,85/ 9 ⇔ ⇔7,55 ≤ µ ≤ 9,45 . 5.3 - (desvio pad. da popul. conhecido) usar X – z X –z× n ≤µ≤ X +z× n n ≤ µ ≤X + z n ⇔ 8,5 – 2,575 × 0,6/ 9 ≤ µ ≤ 8,5 +2,575 × 0,6/ 9 ⇔ ⇔7,985 ≤ µ ≤ 9,015 . 6 - Numa empresa de engarrafamento de águas existem 2 máquinas em funcionamento, A e B, que deverão descarregar 1 litro em cada garrafa. Com o objectivo de testar a sua afinação foram recolhidas aleatoriamente 9 garrafas de A e 10 garrafas de B, sendo medido o seu conteúdo. O intervalo de confiança a 95% para a média do conteúdo das garrafas da máquina A, é de [0,9 ; 1,1] . As garrafas cheias pela máquina B forneceram os seguintes valores: x = 11 e ( x − x ) 2 = 0,0049 . 6.1 - Calcular o desvio padrão amostral corrigido (s’) referente à amostra B. 6.2 - Calcular o intervalo de confiança a 95% para a média dos conteúdos em B. 6.3 - Atendendo aos valores dos respectivos intervalos de confiança, qual das máquinas estará mais bem afinada? Justificar. Miguel Soares Lopes Ficha 6 64 Inferência Estatística 6- Resolução: 6.1 - s 'B = 0,023 ; 6.2 - (σ desconhecido e n<30) usar X – tα/2 × XB = x n s' n ≤ µ ≤ X + tα/2 × s' n 11 = 10 = 1,1 ; s 'B =0,023 ; tα/2 = 2,262 ; n = 10 . 1,1 – 2,262 × 0,023/ 10 ≤ µ ≤ 1,1 + 2,262 × 0,023/ 10 ⇔1,083 ≤ µ ≤ 1,117 6.3 - A máquina A é mais exacta mas a máquina B é mais precisa. 7 - Para testar 2 variedades de milho foram escolhidos aleatoriamente 16 talhões, 8 cultivados com a variedade A e outros 8 com a variedade B. Os resultados da colheita foram 81625 kg e 75875 kg, para o total dos talhões A e B respectivamente, e de 232,41 kg2 e 102,12 kg2 para as variâncias. Sabendo que as produções de ambas as variedades são normalmente distribuídas e que 2 A = 2 B , estimar: 7.1 - Um intervalo de confiança a 99% para a produção média de cada variedade. 7.2 - Um intervalo de confiança a 95% para a diferença das médias. 7- Resolução: 7.1 - Variedade A: nA = 8; X A = 81625/8 = 10203,15 kg ; s 'A2 = 232,41 kg2 ; (σA desconhecido e n<30). Assim, e com tα/2 = 3,499 (α/2= 0,005 e número de graus de liberdade = 7) vem: 10203,15 – 3,499 × 15,24 / 8 ≤ µ ≤ 10203,15 + 3,499 × 15,24 / 8 ⇔ 10184,29 ≤ µ ≤ 10222,01 Variedade B: nB = 8; X B = 75875/8 = 9484,38 kg ; s 'B2 = 102,12 kg2 ; (σB desconhecido e n<30). Assim, e com tα/2 = 3,499 (α/2= 0,005 e número de graus de liberdade = 7) vem: 9484,38 – 3,499 × 10,11 / 8 ≤ µ ≤ 9484,38 + 3,499 × 10,11 / 8 ⇔ 9471,88 ≤ µ ≤ 9496,88 7.2 - Pede-se um intervalo de confiança para a diferença de médias. São populações normais com variâncias desconhecidas mas iguais; nA e nB <30 Usar a expressão: ( X A – X B ) – tα/2 × Sc × n1a + n1b µA–µB ( X A – X B ) + tα/2 × Sc × n1a + n1b com Sc= (10203,15–9484,38)–2,145× ×12,93 1 8 2 ´2 [( n A −1) s ' A + ( n B −1) s B ] ( n A + n B − 2) = 12,93 + 18 µA – µB (10203,15–9484,38)+ 2,145 × 12,93 1 8 ⇔718,77 – 13,87 ≤ µ ≤ 718,77 + 13,87 ⇔ 704,90 ≤ µ ≤ 732,64 8 - O número de horas de vida de lâmpadas eléctricas produzidas segundo determinado processo de fabrico tem distribuição normal. Numa amostra de 20 lâmpadas, escolhida ao acaso da produção de determinado dia, verificou-se a duração das mesmas e calculou- Miguel Soares Lopes Ficha 6 65 + 18 Inferência Estatística -se a média e o desvio padrão amostrais: x = 1832 h e s’2 = 484 h. 8.1 - Calcular os intervalos de confiança a 95% e a 99% da média de duração das lâmpadas. 8.2 - Calcular um intervalo de confiança a 90% para o desvio padrão amostra do tempo de vida da população. Resolução: 8 - X = 1832 h e s’2 = 484 h2 ; n = 20 (graus de liberdade 19) s' 8.1 - (σ desconhecido e n<30) usar X – tα/2 x n Com n = 20 e (1-α) = 0,95 t = 2,093 1832 – 2,093 × 22 / 20 ≤ µ ≤ 1832 + 2,093 × 22 / Com n = 20 e (1-α) = 0,99 t = 2,861 1832 – 2,861 × 22 / 20 ≤ µ ≤ 1832 + 2,861 × 22 / ( n − 1) s'2 8.2 - Usar a expressão: 2 ( 2 ; n −1 ) ≤ 2 ≤ ≤ µ ≤ X + tα/2 x s' n 20 ⇔ 1821,7 ≤ µ ≤ 1842,3 ; 20 ⇔1817,9 ≤ µ ≤ 1846,1 . ( n − 1) s'2 2 (1 − 2 ; n −1 ) Com n = 20 e (1-α) = 0,90 χ2(α/2 , n-1)= 30,144 e χ2(1-α/2 , n-1)= 10,117 19 × 484 19 × 484 2 ≤ 2≤ ⇔ 305,1 ≤ ≤ 909,0 ⇔ 17,5h ≤ ≤ 30,1h 30,144 10,117 Pedia-se IC para o desvio padrão 9 - A administração do Metropolitano verificou irregularidade na hora de passagem do comboio pelas diversas estações. Essa irregularidade é uma variável aleatória normal cuja média se considera ser 5 segundos mas cuja variância se desconhece. Com n = 22 e s '2 = 9 segundos2 pretende-se saber entre que valores se situa a variância com um nível de confiança de 99%. Resolução: 9 - n = 22 e s'2 = 9 segundos2. Usar a expressão: (n − 1) s' ≤ 2 2 ( 2 2 ≤ 2 (n − 1) s' 2 ; n −1 ) Com n = 22 e (1-α) = 0,99 χ 21× 9 ≤ 41,401 2 (1− 2 ; n −1) = 41,401 e χ2(1-α/2,n-1) = 8,034 21× 9 2 2 ≤ ≤ 23,53s 2 ⇔ 4,57s ≤ 8,034 (α/2 , n-1) 2 10 - De uma população normal, com média e variância desconhecidas foi retirada uma 2 amostra de 9 observações cujos resultados foram x = 4 ; s ' = 2. 10.1 - Obter um IC a 90% para o desvio padrão da população. 10.2 - Supondo que a variância da população passa a ser conhecida (σ2 = 4) Miguel Soares Lopes Ficha 6 66 Inferência Estatística construir um intervalo de confiança a 95% para a média da população. 10.3 - Como procederia para reduzir para metade a amplitude do intervalo? Resolução: 10 - X = 4 ; s'2 = 2 ; 2 (n − 1) s' 10.1 - Usar a expressão: 2 ( 2 ≤ 2 ≤ 2 (n − 1) s' 2 ; n −1 ) (1− 2 ; n −1) 2 Com n = 9 e (1-α) = 0,95 χ (α/2 , n-1)= 15,507 e χ2(1-α/2 , n-1) = 2,733 8× 2 8× 2 2 ≤ 2≤ ⇔ 1,03 ≤ ≤ 5,85 ⇔ 1,01 ≤ ≤ 2,42 15,507 2,733 10.2 - σ2 = 4. Usar X – z × n ≤ µ ≤X + z × n 4 – 1,96 × 2/3 ≤ µ ≤ 4 + 1,96 × 2/3 ⇔ 2,69 ≤ µ ≤ 5,31 : 10.3 - Para que a parcela z × n passasse para metade à custa de “n” era preciso que o denominador passasse para o dobro. Como “n” está debaixo d raiz quadrada precisava de aumentava 4 vezes a dimensão da amostra (22). 11 - Na estimação da média de uma população normal por meio de um intervalo de confiança a 90%, qual deve ser a dimensão mínima da amostra para que a amplitude daquele intervalo seja inferior a σ/9, sendo σ conhecido? Resolução: 11 -P(Z<z) = 0,95 ⇔ z = 1,645 ; Amplitude do IC = 2 × z × n ; logo 2 × z × n < σ/9 ⇔2 × 1,645/n < 1/9 ⇔ n > 29,61 ⇔ ⇔ n = 30 12 - O patrocinador de um programa de televisão quer ter uma ideia da proporção de residências que segue um dado programa numa dada área metropolitana. Num inquérito a 90 residências com as televisões ligadas, verificou que 35 delas estavam sintonizadas no programa. Construa um intervalo de confiança com um nível de significância de 3% para a verdadeira proporção de televisões que estavam sintonizadas no dito programa. Resolução: 12 - A expressão de cálculo deste intervalo é: pˆ - z 2 pˆ (1 − pˆ ) pˆ (1 − pˆ ) ≤ p ≤ pˆ + z 2 n n n = 90 35 pˆ = = 0,389 90 α = 0,3 ⇔ zα/2 = z0,015 = 2,17 (porque, se α/2 é 0,015, então a área à esquerda à 0,985) Miguel Soares Lopes Ficha 6 67 Inferência Estatística Assim: 0,389 × 0,611 0,389 × 0,611 p 0,389 + 2,17 × 90 90 0,389 – 2,17 × 0,051 p 0,389 + 2,17 × 0,051 0,389 – 0,112 p 0,389 + 0,112 0,277 p 0,500 0,389 – 2,17 × Miguel Soares Lopes Ficha 6 68 Inferência Estatística Inferência Estatística Testes de Hipótese Num teste de hipótese queremos saber se uma suspeita, motivadora da execução deste teste, poderá ter sustentação através de uma ou mais amostras. Acompanhemos um exemplo: 13 - Uma pizzaria está dimensionada para que a procura média diária não ultrapasse as 200 pizzas, admitindo um desvio padrão de 15. Uma promoção, nos últimos 9 dias, levou a uma procura média de 210 pizzas. Pretendese avaliar se é necessário reforçar a capacidade de produção, verificando se houve de facto uma alteração significativa da procura. O dono da pizaria suspeita que houve alteração do valor médio da procura diária de pizzas. Por esse motivo quis fazer um teste de hipótese para averiguar se a sua suspeita tinha ou não razão de ser. No entanto, qual a alteração que lhe interessa averiguar? Certamente aquela que o obriga a reforçar a capacidade de produção, ou seja, uma alteração no sentido do aumento da média. Ao lançar um teste de hipótese, são avançadas duas hipóteses, H0 (hipótese nula) e H1 (hipótese alternativa), de tal modo que, se não se realizar a primeira, se realize a segunda. Quais são as hipóteses do nosso exemplo: H0: µ 200 pizas H1: µ > 200 pizas Mais à frente se explica a razão da escolha destas hipóteses A cada teste de hipótese, e em função das condições do mesmo, está associada uma distribuição. Cada distribuição tem, por sua vez, associada uma estatística. Se calcularmos o valor dessa estatística a partir do valor atribuído ao parâmetro em teste e dum estimador proveniente da amostra vamos obter um valor que traduz a relação entre estas duas entidades. ! % & ! ( ! +# , ! ( ! µ ' σ ) * σ * . µ=µ0 µ/µ0 µ0µ0 µ µ0 µ1µ0 µ2µ0 " #$ ! 32 4α56 * 314α56 314α 32 4α No nosso exemplo vemos que, sendo o desvio padrão conhecido (logo a variância conhecida) a estatística de teste é Z (distribuição normal reduzida) cuja expressão é Z= x− 0 , em que x é a média amostral (estimador proveniente da amostra) e µ0 o n Miguel Soares Lopes Ficha 6 69 Inferência Estatística valor atribuído ao parâmetro em estudo (neste caso 200 pizzas). Se calcularmos o valor de Z para o nosso exemplo vem: Z= 210 – 200 15/ 9 =2 Se a relação entre x e µ0 for próxima, isto é, se a “distância” entre eles for pequena, tendo em atenção o desvio padrão da distribuição e a dimensão da amostra, então o valor de Z virá próximo de “0” (podendo ser negativo ou positivo). Se pelo contrário essa “distância” for grande o valor de Z virá muito negativo ou muito positivo. Como sabemos estes valores de Z localizam-se nas caudas da curva da distribuição normal padrão, zonas onde a densidade de probabilidade é menor, o que significa que podemos dizer que estes valores se encontram dentro de uma zona de valores “raros”de Z. O que aqui foi dito para o nosso exemplo (distribuição de Z) pode ser generalizado para as distribuições. Cada teste de hipótese é feito com um determinado grau de probabilidade (1–α) ou, o que se traduz no mesmo, com uma determinada significância (α α). Na prática o valor de α traduz a probabilidade associada à hipótese H1, isto é, de não se aceitar a hipótese H0 ou seja, de se obterem valor da estatística raros (localizados nos extremos da distribuição em causa). Ao enunciar H0, um teste de hipótese pode ser de três tipos no que diz respeito à relação entre o parâmetro e o valor em estudo. Podemos ter: H0 H1 — o parâmetro é igual a “um valor”; µ=200 µ 200 — o parâmetro é menor ou igual que “um valor”; µ 200 µ>200 — o parâmetro é maior ou igual que “um valor”. µ 200 µ<200 Reparemos que no primeiro caso H0 pode não se realizar em duas situações: quando o parâmetro for maior que “o valor” ou quando o parâmetro for menor que “o valor”. Isto indica que a área correspondente a H1 (não realização de H0) se pode encontrar à direita e à esquerda. Neste caso (caso de “igualdade”) estamos perante um teste dito “bilateral” pelo que a área α se encontra dividida em duas partes iguais, α/2, Miguel Soares Lopes Ficha 6 70 Inferência Estatística situadas nas duas caudas da curva. Nos segundo e terceiro casos H0 só se pode não realizar quando o parâmetro for maior que “o valor” no primeiro caso ou quando o parâmetro for menor que “o valor” no segundo caso. Isto indica que a área correspondente a H1 (não realização de H0) se encontra toda de um dos lados, estando do lado direito no primeiro caso e do lado esquerdo no segundo. Neste caso (caso de “desigualdade”) estamos perante um teste dito “unilateral” pelo que a área α se vai localizar toda numa ou noutra cauda consoante o teste em causa. O grau de probabilidade (1–α) usado neste tipo de teste é normalmente de 90%, 95%, 99% (ou outra desta ordem de grandeza). Estes valores de (1–α) estão associados à hipótese H0 e à hipótese H1 a probabilidade remanescente (α α). Ao valor de (1–α), ou ao valor de (α α), estão associadas áreas de igual valor delimitadas por valores da variável. No nosso exemplo, e em todos os exercícios em que não é feita referência ao grau de probabilidade, usa-se o valor de 0,95. Os valores que delimitam estas áreas terão de ser obtidos nas tabelas das distribuições respectivas. No nosso exemplo: ! µ % & ! ( ! +# , ! ( ! ' σ ) * σ * . µ=µ0 µ/µ0 µ0µ0 µ µ0 µ1µ0 µ2µ0 z0 = 3 X − µ0 σ n " #$ ! 32 4α56 * 314α56 314α 32 4α O valor que delimita a área de 0,95 da área de 0,05, o valor zα, pode ser obtido na tabela da distribuição Normal reduzida. O valor que delimita a região crítica (ver o quadro acima) é zα (valor que deixa à sua direita uma área α=0,05 =0,05) Como zα = 1,96 e o Zcalculado = 2, podemos dizer Z>1,96 , o que quer dizer que o Z está na região crítica. Por isso “rejeitamos H0”. Como se compreenderá pela desproporção entre as duas probabilidades em jogo (0,95 versus 0,05), só em casos de elevada “força” do teste se vai verificar H1. É por este motivo que se deve associar a H1 àquilo que se quer provar pois, se se poder afirmar que se rejeita H0, é porque o teste teve “força” suficiente para o fazer. Miguel Soares Lopes Ficha 6 71 Inferência Estatística 14 - O tempo requerido pelos trabalhadores de uma exploração agrícola para executarem uma dada tarefa tem uma média de 50 minutos e um desvio padrão de 8 minutos. Para testar o progresso no rendimento dos trabalhadores num dado dia, o empresário decidiu registar os tempos que 60 trabalhadores levaram para executar tal tarefa. 14.1 - Qual a probabilidade de que a média da amostra seja superior a 52 minutos? 14.2 - Se a média da amostra for 53 minutos, admitindo que o desvio padrão se mantém, deverá o empresário considerar que o rendimento dos trabalhadores na execução da dita tarefa diminuiu? 14 - Resolução: 14.1 14.2 - Quando se diz que o rendimento diminuiu está-se implicitamente a querer dizer que o tempo médio de execução da tarefa aumentou. H0: µ 50 min H1: µ > 50 min (associar a suspeita a H1) Como o desvio padrão é conhecido, usa-se a distribuição normal reduzida (ver o quadro). 53 – 50 Z= 8/ 60 = 2,90 Como não é dado o valor de (1–α) tomamos esse valor por 0,95 (logo α=0,05). Consultando o quadro verificamos que a região crítica é dada por Z>z0,05. Pela tabela da distribuição normal reduzida verificamos que o valor da variável z que deixa à sua direita 0,05 (à sua esquerda 0,95) é z=1,96. Verificamos assim, que o valor calculado Z é superior ao valor da tabela. Assim, como Zcalculado>1,96 rejeitamos H0. 15 - O peso das latas de conserva de uma dada marca, X, segue distribuição normal, devendo ter, de acordo com as normas, um peso médio de 100 gramas. O controle de qualidade escolheu uma amostra aleatória de 9 latas, que foram pesadas. Registaram-se os seguintes resultados: xi = 870 g ( xi − x ) 2 = 87,12 g 2 Terá sido esta amostra proveniente de uma população com peso médio de 100 g? (α=0,05). Resolução: 15 - Este teste para a média não apresenta o valor da variância nem a dimensão da amos- ! µ σ ! Miguel Soares Lopes ( ! 7* $ ' ) µ=µ0 µ/µ0 µ0µ0 µ µ0 µ1µ0 µ2µ0 Ficha 6 8t0 = X − µ0 s n " #$ ! 82 tα56 * 81tα56 81tα 82 tα 72 Inferência Estatística tra é maior ou igual a 30. Assim, este teste será feito com o apoio da distribuição t-Student. As hipóteses são: H0: µ = 100 g H1: µ 100 g xi n x= = 870 9 = 96,7g s’= ( xi − x ) 2 n −1 = 87 ,12 8 = 3,3 96,7 − 100 =3 3,3 n 9 A região crítica (consultar o quadro) é T<-tα/2 ou T>tα/2 . Usando α=0,05, α/2 vale 0,025 T= x− s' 0 = e o valor de t0,025 pode ser lido na respectiva tabela (que dá áreas à direita), na coluna de 0,025 e na linha n=8. Ter atenção que o “n” da tabela corresponde ao “n” da dimensão da amostra menos 1. Assim, t0,025 = 2,306, -t0,025 = -2,306 e, portanto, Tcalculado>2,306; devemos rejeitar H0. 16 - Para testar 2 variedades de milho foram escolhidos aleatoriamente 16 talhões, 8 cultivados com a variedade A e outros 8 com a variedade B. Os resultados da colheita foram os seguintes: 2 2 2 2 x A = 81,625 kg xB = 75,875 kg s' s' A = 232,41073 kg B = 102,12502 kg Sabendo que as produções de ambas as variedades são normalmente distribuídas e que σA2 = σB2 : 16.1 - Estimar um intervalo de confiança a 99% para a produção média de cada variedade. 16.2 - Verificar se a variedade A é significativamente mais produtiva (α = 1%) que a variedade B. 16 - Resolução: 16.1 16.2 - Aqui, “verificar” é testar essa hipótese. Como se trata de uma comparação de média o teste de hipótese em causa é o da diferença de médias. Como foi referido anteriormente, aquilo que queremos provar deve ser associado a H1. Assim as hipóteses são: H0: µA µB H1: µA > µB Dadas as condições do problemas em que as variâncias são desconhecidas e em que as dimensões das amostras (nA e nB) são menores que 30 (ver quadro) a estatística Miguel Soares Lopes Ficha 6 73 Inferência Estatística ! = µ1−µ2 " #$ ! 8= µ1=µ2 µ1 µ2 82 tα56 * 81tα56 µ1/µ2 µ11µ2 81tα n −1 s: + n −1 s: µ10µ2 µ12µ2 Sc = n + n −2 82 tα X1− X 2 Sc 1 n + 1 n 1 2 > > >*' σ σ6 ! ( ! #* 2 1 1 1 2 2 2 2 do teste será a t-Student: x A − xB 81,625 − 75,875 5,75 = 0,89 T= = = 1 1 6,465 Sc n A + n B 12,93 18 + 18 Sc = n1 −1 s:12 + n2 −1 s:22 n1 + n2 − 2 = (8 −1)× 232 , 41+ (8 −1)102 ,12 8+8−2 = 167,27 = 12,93 kg O limite da região crítica é T>tα. Partindo do valor de α=0,01 e dos valores de nA e nB iguais a 8 podemos tirar da tabela de t-Student os valores de t. t(0,01;14)= 2,62449 . Assim, como Tcalculado >2,62449 rejeita-se H0. 17 - Uma máquina de ensacar açúcar está regulada para encher sacos com 16 kg. Para controlar o seu funcionamento escolheram-se ao acaso 15 sacos da produção de determinado período, tendo-se obtido os seguintes pesos: 16,0 16,1 15,8 15,9 16,1 15,8 16,2 15,9 16,0 15,7 15,8 15,7 16,0 15,8 16,0 17.1 - Que conclusões tirar quanto ao funcionamento da máquina? 17.2 - Os dados da amostra são compatíveis com a hipótese de que os pesos dos sacos cheios pela referida máquina apresentam uma variabilidade de 0,01 kg2 ou seja com H0: σ2=0,01 kg2 ? 17 - Resolução: 17.1 17.2 - Estamos perante um teste de hipótese para a variância. H0: σ2 = 0,01 kg2 H1: σ2 0,01 kg2 Consultando o quadro dos testes de hipótese podemos ver que a estatística deste ! σ 2 % 7* $ ' σ6;σ96 σ6<σ96 σ6/σ96 σ61σ96 σ60σ6 σ62σ6 9 9 χ2 = n − 1 s:2 σ02 " #$ χ62χ1−α/2 ! 6 * χ61χα/2 6 χ61χα χ62χ61−α teste segue a distribuição de χ2 : χ2 = n − 1 s:2 (15 − 1) × 0,023 = =32,2 σ02 0,01 Miguel Soares Lopes Ficha 6 74 Inferência Estatística s’=0,023 kg (máq. calcular) A região crítica deste teste é bilateral (ver o quadro). Como esta distribuição não é simétrica como a da Normal ou a de t-Student há necessidade de recorrer à tabela duas vezes (nas outras recorria-se uma vez e depois usava-se também o seu simétrico). Os limites da região crítica são χ6<χ6(1−α/2) e χ6>χ6α/2 . Partindo do valor de α=0,05 (quando o valor não é dado usa-se 1-α=095) e do valor de “n” igual a 15 podemos tirar da tabela de χ6 os respectivos valores. χ2(0,025;14)= 26,119 χ2(0,975;14)= 5,629 Como o valor de χ2calculado >26,119, rejeita-se H0. 18 - Está em estudo a validade de uma bebida gaseificada. Foram seleccionadas ao acaso 10 garrafas e testada a sua validade. Obtiveram-se os seguintes resultados (em dias): 108 124 124 106 115 138 163 159 134 139 18.1 - Construir um intervalo de confiança a 95% para µ. 18.2 - Pode a hipótese nula H0: µ = 125 ser rejeitada? (α = 0,05) 18.3 - Qual a decisão a tomar sobre as hipóteses H0: µ ≤ 125 versus H1: µ > 125, considerando α = 0,05 ? 18.4 - Serão os dados da amostra compatíveis, para α = 0,05, com: 18.4.1 - H0: σ2 = 400 versus H1: σ2 ≠ 400 ? 18.4.2 - H0: σ2 ≥ 400 versus H1: σ2 < 400 ? 18 - Resolução: 18.1 18.2 - H0: µ = 125 H1: µ ≠ 125 A estatística de teste é t-Student pois a variância é desconhecida e n<30. x − 0 131 − 125 T= = = 0,97 s' 19,54 n 10 x x = n i = 1310 = 131 dias s’=19,54 dias (máq. calcular) 10 A região crítica é T<-tα/2 ou T>tα/2 . Usando α=0,05, α/2 vale 0,025 e o valor de t0,025 pode ser lido na respectiva tabela, na coluna de 0,025 e na linha n=9. Assim, t0,025 = 2,26216, -t0,025 = 2,26216 e portanto -2,26216≤Tcalculado≤2,26216; assim não devemos rejeitar H0. 18.3 - H0: µ ≤ 125 H1: µ > 125 A estatística de teste mantém-se, é t-Student, pois a variância é desconhecida e n<30. Miguel Soares Lopes Ficha 6 75 Inferência Estatística T= x− s' 0 = n 131 − 125 = 0,97 19,54 10 x x = n i = 1310 = 131 dias s’=19,54 dias 10 A região crítica é agora T>tα . Usando α=0,05 o valor de t0,05 pode ser lido na respectiva tabela, na coluna de 0,05 e na linha n=9. Assim, t0,05 = 1,83311, e portanto Tcalculado≤1,83311; assim não devemos rejeitar H0. 18.4 - Nestes dois testes de hipótese para a variância a estatística de teste é o χ2. 18.4.1 - H0: σ2 = 400 H1: σ2 ≠ 400 n − 1 s:2 (10 − 1) × 382 = = 8,595 σ02 400 s’2= 19,542 kg2 = 382 kg2 A região crítica deste teste é bilateral (ver o quadro). Há necessidade de recorrer à tabela duas vezes. Os limites da região crítica são χ6<χ(61−α/2) e χ6>χ6α/2 . Partindo do valor de α=0,05 e do valor de “n” igual a 10 6 podemos tirar da tabela de χ6 os respectivos valores. 2 χ (0,025;9)= 19,023 χ2(0,975;9)= 2,700 Como o valor de 2,700 ≤ χ2calculado ≤ 19,023, não se rejeita H0. 18.4.2 - H0: σ2 ≥ 400 H1: σ2 < 400 χ2 = n − 1 s:2 (10 − 1) × 382 χ = = = 8,595 σ02 400 s’2= 19,542 kg2 = 382 kg2 A região crítica deste teste é unilateral (ver o quadro). Há necessidade de recorrer à tabela uma vez. O limite da região crítica é χ6<χ(61−α). Partindo do valor de α=0,05 e do valor de “n” igual a 10 podemos tirar da tabela de χ6 o respectivo valor. χ2(0,95;9)= 3,325 Como o valor de χ2calculado 3,325, não se rejeita H0. 2 19 - Uma empresa produz baterias para as quais as normas de fabrico indicam uma duração média mínima de um ano e meio. Recolhida uma amostra de 9 baterias, estas foram ensaiadas tendo fornecido a seguinte duração (em anos): 2 1,4 1,6 1,4 1,8 1,5 1,9 1,6 1,2 19.1 - Apresentar uma estimativa para a variância da duração das baterias. 19.2 - Testar a hipótese H0: σ2 = 0,11 , para um nível de significância de 1%. 19.3 - Pressupondo σ2 = 0,11 , verificar se é de admitir uma duração média conforme as normas de fabrico (α = 0,05). Miguel Soares Lopes Ficha 6 76 Inferência Estatística Resolução: 19 - 19.1 - A estimativa para a variação da duração das baterias é o s’2. s’2 = 0,07 anos2 (máq. calcular) 19.2 - H0: σ2 = 0,11 H1: σ2 0,11 n − 1 s:2 (9 − 1) × 0,07 χ2 = = = 4,91 σ02 0,11 A região crítica deste teste é bilateral (ver o quadro). Há necessidade de recorrer à tabela duas vezes. Os limites da região crítica são χ6<χ(1−α/2) e χ6>χα/2 . Partindo do valor de α=0,01 e do valor de “n” igual a 9 podemos tirar da tabela de χ6 os respectivos valores. χ2(0,005;8)= 21,955 χ2(0,995;8)= 1,344 Como o valor de 1,344 ≤ χ2calculado ≤ 21,955, não se rejeita H0. 19.3 - Pede-se, neste caso, um teste de hipótese para a média da população com a variância conhecida. As normas de fabrico apontam para uma duração média mínima de 1,5 anos. H0: µ ≤ 125 H1: µ > 125 A estatística de teste é Z: x − 0 1,6 − 1,5 Z= = = 0,90 0,33 n 9 Consultando o quadro verificamos que a região crítica é dada por Z>z0,05. Pela tabela da distribuição normal reduzida verificamos que o valor da variável z que deixa à sua direita 0,05 (à sua esquerda 0,95) é z=1,96. Verificamos assim, que o valor calculado Z é inferior ao valor da tabela. Assim, como Zcalculado>1,96 rejeitamos H0. 20 - Um fabricante comprou um lote de 3000 componentes electrónicos a uma grande empresa. Depois de detectar algumas avarias nesses componentes, suspeitou que a proporção de componentes avariados era superior a 7%. Para se certificar da sua suspeição recolheu uma amostra aleatória de 80 desses componentes onde detectou 8 com defeito. Construa um teste de hipótese a 95% de confiança tendo em vista a confirmação da suspeita. Resolução: 20 - Neste problema é-nos pedido um teste de hipótese para uma proporção. As hipóteses são: H0: p 0,07 H1: p > 0,07 (aquilo que se quer provar) n = 80 8 componentes dos 80 apresentam defeito. Miguel Soares Lopes Ficha 6 77 Inferência Estatística 1 – α = 0,95 ⇔ α = 0,05 p̂ = Z= 8 = 0,1 80 Pˆ − p0 p0 (1− p0 ) n = 0,10 − 0,07 0,07(1− 0,07) 80 = 0,03 = 1,05 0,029 Região crítica: Z>zα ⇔ Z>1,65 ; Mas 1,05 < 1,65 pelo que não se rejeita H0 . Miguel Soares Lopes Ficha 6 78