PROBABILIDADE E ESTATÍSTICA (1000 ton) 2500 Gráfico 4.1. Produção de Arroz do Município X - 1984-1994 2000 1500 1000 500 0 84 85 86 87 88 89 90 91 Luiz Roberto M. Bastos 2005 92 93 94 Probabilidade e Estatística Luiz Roberto SUMÁRIO 1 TEORIA DOS CONJUNTOS NUMÉRICOS ..................... 5 1.1 Introdução ....................................... 5 1.2 Símbolos ......................................... 5 1.3 Noções sobre Conjuntos ........................... 6 1.4 Conjunto dos Números Naturais (N) ................ 7 1.5 Conjunto dos Números Inteiros (Z) ................ 8 1.6 Representação decimal das frações ................ 11 1.7 Conjunto dos Números Irracionais ................. 12 1.8 Conjunto dos Números Reais (R) ................... 12 1.9 Intervalos ....................................... 13 1.10 Problemas com número finito de elementos ......... 14 ANÁLISE COMBINATÓRIA ............................... 17 2.1 Introdução ....................................... 17 2.2 Fatorial de um número natural .................... 18 2.3 Princípio fundamental da contagem - PFC .......... 19 2.4 Arranjos simples ................................. 23 2.5 Cálculo do número de arranjos .................... 23 2.6 Permutações simples .............................. 25 2.7 Permutações com elementos repetidos .............. 27 2.8 Combinações simples .............................. 28 2.9 Exercícios ....................................... 33 PROBABILIDADE ....................................... 34 3.1 Experimento aleatório ............................ 34 3.2 Espaço amostral .................................. 35 2 3 2 Probabilidade e Estatística Luiz Roberto 3.3 Evento ........................................... 36 3.4 Probabilidade de um Evento ....................... 36 3.5 Evento complementar .............................. 38 3.6 Probabilidades em espaços amostrais equiprováveis 38 3.7 Probabilidade da união de dois eventos ........... 43 3.8 Experiência Composta ............................. 45 3.9 Probabilidade condicional ........................ 46 ESTATÍSTICA BÁSICA .................................. 48 4.1 Conceitos fundamentais ........................... 48 4.2 Divisão da estatística ........................... 49 4.3 População ........................................ 50 4.4 Amostragem ....................................... 52 4.5 Amostra .......................................... 52 4.6 Censo ............................................ 52 4.7 Tipos de variáveis ............................... 53 4.8 Definição do problema ............................ 54 4.9 Definição dos objetivos (geral e específico) ..... 55 4.10 Planejamento ...................................... 56 4.11 Coleta dos dados .................................. 56 4.12 Crítica dos dados ................................. 57 4.13 Apuração (armazenamento) dos dados ................ 58 4.14 Exposição ou apresentação dos dados ............... 58 4.15 Análise e interpretação dos dados ................. 59 4.16 Regras de arredondamento .......................... 59 4.17 Série temporal, histórica ou cronológica .......... 60 4.18 Gráficos estatísticos ............................. 61 4 3 Probabilidade e Estatística Luiz Roberto Principais tipos de gráficos ...................... 62 4.19.1 Gráficos em curvas ou em linhas ................... 62 4.19.2 Gráficos em colunas ............................... 63 4.19.3 Gráficos em barras ............................... 65 4.19.4 Gráfico em colunas múltiplas (agrupadas) ......... 66 4.19.5 Gráfico em barras múltiplas (agrupadas) .......... 67 4.19.6 Gráfico em setores ............................... 68 4.20 Distribuição de freqüências ...................... 69 4.21 Distribuições cumulativas ........................ 74 4.22 Medidas de posição (ou de tendência central) ..... 75 4.22.1 Média aritmética ................................. 76 4.22.2 Esperança matemática ............................ 79 4.22.3 Moda (mo) ....................................... 79 4.22.4 Mediana (md) .................................... 81 4.22.5 Medidas de dispersão (medidas de variabilidade) . 82 4.22.6 Variância ....................................... 83 4.22.7 Desvio-padrão ................................... 84 4.23 88 4.19 Distribuições discretas de probabilidade ........ 4.23.1 Distribuição de “bernoulli” ..................... 88 4.23.2 Distribuição binomial ........................... 88 BIBLIOGRAFIA ........................................... 4 91 Probabilidade e Estatística 1 Luiz Roberto TEORIA DOS CONJUNTOS NUMÉRICOS 1.1 Introdução Conjuntos numéricos são certos conjuntos cujos elementos são números que guardam entre si alguma característica comum. Tais conjuntos possuem elementos perfeitamente caracterizados e, dentre eles, o conjunto dos números naturais, dos inteiros, dos racionais, dos irracionais e, por fim, o dos números reais. O conjunto dos números naturais surgiu da necessidade de se contarem os objetos; os outros foram surgindo com ampliações do conjunto dos números naturais. Para se trabalhar com conjuntos, são adotados símbolos que representam os relacionamentos entre eles. 1.2 Símbolos I : pertence : existe : não pertence : não existe : está contido : para todo (ou qualquer que seja) : não está contido : conjunto vazio N : contém N: conjunto dos números naturais : não contém Z : conjunto dos números inteiros : tal que Q: conjunto dos números racionais : implica que Q'= I: conjunto dos números irracionais : se, e somente se R: conjunto dos números reais : pertence ∨ : existe ∧ : ou :e Símbolos sobre Operações : A intersecção B a > b: a maior que b : A união B : a maior ou igual a b a - b: diferença de a com b : a e b a < b: a menor que b : a ou b : a menor ou igual a b ≠ 5 : Diferente Probabilidade e Estatística 1.3 Luiz Roberto Noções sobre Conjuntos Conjunto vazio: é um conjunto que não possui elementos. O conjunto vazio é representado por ou { }. Subconjuntos: todos quando os elementos de um conjunto A qualquer pertencem a um outro conjunto B, diz-se, então, que A é um subconjunto de B, ou seja A Obs.: B. Todo o conjunto A é subconjunto dele próprio, ou seja ; - O conjunto vazio, por convenção, é subconjunto de qualquer conjunto, ou seja União de Conjuntos: dados os conjuntos A e B, define-se como união dos , formado por todos os conjuntos A e B ao conjunto representado por . elementos pertencentes a A ou B, ou seja: Intersecção de Conjuntos: dados os conjuntos A e B, define-se como intersecção dos conjuntos A e B ao conjunto representado por por todos os elementos pertencentes a A e Diferença de Conjuntos: dados os , formado B, simultaneamente, ou seja: conjuntos A e B, define-se como diferença entre A e B (nesta ordem) ao conjunto representado por A-B, formado por todos os elementos pertencentes a A, mas que não pertencem a B, ou seja 6 Probabilidade e Estatística 1.4 Luiz Roberto Conjunto dos Números Naturais (N) N é o conjunto dos números naturais: N = {0, 1, 2, 3, 4, 5, ..., n, ...} Onde n representa o elemento genérico do conjunto. Sempre que possível, procuraremos destacar o elemento genérico do conjunto em questão. Quando houver “...” ao final dos elementos de um conjunto, trata-se de um conjunto de infinitos elementos, como acontece com N. O conjunto N pode ser representado geometricamente por meio de uma reta numerada; escolhemos sobre essa reta um ponto de origem (correspondente ao número zero), uma medida unitária e uma orientação (geralmente para a direita). unidade O conjunto dos números naturais possui alguns subconjuntos importantes: 1° O conjunto dos números naturais não nulos N* ={1, 2, 3, 4, 5, ..., n, ...} N* = N - {0} Utilizamos o * (asterisco) à direita do nome do conjunto do qual se quer suprimir o elemento zero. 2° O conjunto dos números naturais pares: Np={0, 2, 4, 6, ..., 2n, ...} 3° n ∈ N O conjunto dos números naturais ímpares: Ni={1, 3, 5, 7, ..., 2n+1, ...} 7 n ∈N Probabilidade e Estatística 4° Luiz Roberto O conjunto dos números primos: Pi={2, 3, 5, 7, 11, 13 ...} No conjunto dos números naturais estão definidas duas operações: adição e multiplicação. Note que adicionando ou multiplicando dois elementos quaisquer de N, a soma ou o produto pertence igualmente a N. Em símbolos, temos: m,n N, m + n N e m*n N Essa característica pode ser sintetizada na frase: “N é fechado em relação à adição e à multiplicação”. 1.5 Conjunto dos Números Inteiros (Z) Z={..., -3, -2, -1, 0, 1, 2, 3,...} Todos os elementos de N pertencem também a Z, o que vale dizer que N é subconjunto de Z: N Z ou Z N Temos também outros subconjuntos de Z: Z* = Z - {0} Z* = {..., -4, -3, -2, -1, 1, 2, 3, 4, ...} Z+ = {0,1,2,3,4,5,...} conjunto dos inteiros não negativos Z *+ = {1,2,3,4,5,...} conjunto dos inteiros positivos Z_ = {..., -4, -3, -2, -1, 0} conjunto dos inteiros não positivos Z *__ = {..., -4, -3, -2, -1} conjunto dos inteiros negativos Observe que Z+ = N. 8 Probabilidade e Estatística Luiz Roberto Números Opostos Dois números inteiros são ditos opostos um do outro quando apresentam soma zero; assim, os pontos que os representam distam igualmente da origem (zero). Considerando os números inteiros ordenados sobre uma reta, podemos tomar como exemplo o número 2. O oposto de 2 é –2, e o oposto de –2 é 2, pois: 2 + (-2) = -2 + 2 = 0 2 unidades 2 unidades No geral, dizemos que o oposto (ou simétrico) de a é -a., e vice-versa; particularmente, o oposto de zero é o próprio zero. Módulo de um número inteiro Damos o nome de módulo, ou valor absoluto de a, à distância da origem ao ponto que representa o número a. Conjunto dos Números Racionais (Q) O conjunto Z é fechado em relação às operações adição, multiplicação e subtração, mas o mesmo não acontece à divisão: embora (-12):(+4) = -3 Z, não existe número inteiro x para o qual se tenha x = (+4) : (-12). Por esse motivo, fez-se uma ampliação do conjunto Z, da qual surgiu o conjunto dos números racionais. O conjunto dos números racionais é inicialmente descrito como o conjunto dos quocientes entre dois números inteiros. Os números racionais são todos aqueles que podem ser colocados na forma de fração (com o numerador e denominador Z), ou seja, o conjunto dos números racionais é a união do conjunto dos números inteiros com as frações positivas e negativas. 9 Probabilidade e Estatística Q = Luiz Roberto 2 2 1 1 p 0, ± 1,± , ± ,.... ± 2,± ,± ,...,± ,... 3 5 2 3 q I p e q inteiros e q ≠ 0 Utilizando o elemento genérico, podemos dizer que: Q = p q I p Z* Z e q Desta forma, podemos definir Q como o conjunto das frações um número é racional quando pode ser escrito como uma fração p ; q assim, p , com p e q q inteiros e q ≠ 0. Quando q = 1, temos p = p 1 p = q Z, de onde se conclui que Z é subconjunto de Q. Assim, podemos construir o diagrama: N Z Q No conjunto Q destacamos os seguintes sub-conjuntos: * Q : conjunto dos racionais não nulos Q+ : conjunto dos racionais não negativos * Q + : conjunto dos racionais positivos Q _ : conjunto dos racionais não positivos * Q _ : conjunto dos racionais negativos O conjunto Q é fechado para multiplicação e divisão. 10 as operações adição, subtração, Probabilidade e Estatística Luiz Roberto Exemplos: −3 −6 −9 = = 1 2 3 1 2 3 b) 1 = = = 1 2 3 a) − 3 = Assim, podemos escrever: Q = {x | x = 1.6 p , com p ∈ Z , q ∈ Z e q ≠ 0} q Representação decimal das frações Tome um número racional p , tal que p não é múltiplo de q. q Para escrevê-lo na forma decimal, basta efetuar a divisão do numerador pelo denominador. Nessa divisão podem ocorrer dois casos: 1°) O número decimal obtido possui, após a vírgula, um número finito de algarismos (não nulos): 1 = 0,5 2 − 5 = −1,25 4 75 = 3,75 20 Tais números racionais são chamados decimais exatos. 2°) O número decimal obtido possui, após a vírgula, infinitos algarismos (nem todos nulos), que se repetem periodicamente: 9 = 0,777... = 0,7 7 1 = 0,333... = 0,3 3 1 = 0,0454545... = 0,045 22 167 = 2,5303030... = 0,530 66 11 Probabilidade e Estatística Luiz Roberto Toda decimal exata ou periódica pode ser representada na forma de número racional. 1.7 Conjunto dos Números Irracionais (I) Os números irracionais são decimais infinitas não periódicas, ou seja, os números que não podem ser escritos na forma de fração (divisão de dois inteiros). Vejamos alguns exemplos: 1. O número 0,212112111... não é dízima periódica, pois os algarismos após a vírgula não se repetem periodicamente. 2. O número 0,203040... também não comporta representação fracionária, pois não é dízima periódica. 3. Os números π=3,1415926535... , 2 = 1,4142136… e 3 = 1,7320508… por não apresentarem representação infinita periódica, também não são números racionais. 1.8 Conjunto dos Números Reais (R) Dados os conjuntos dos números racionais (Q) e dos irracionais (I), definimos o conjunto dos números reais como: R = Q ∪ I = {x | x é racional ou x é irracional} O diagrama abaixo mostra a relação entre os conjuntos numéricos: I R 12 Probabilidade e Estatística Luiz Roberto Além desses (N, Z, Q, I), o conjunto dos números reais apresenta noutros subconjuntos importantes: R* = {x R I x ≠ 0} R+ = {x R I x ≥ 0} conjunto dos números reais não negativos R *+ = {x R I x > 0} conjunto dos números reais positivos R- = {x R I x ≤ 0} conjunto dos números reais não positivos R *− = {x conjunto dos números reais não nulos R I x < 0} conjunto dos números reais negativos Portanto, os números naturais, inteiros, racionais e irracionais são todos números reais. Como subconjuntos importantes de “I” temos: I* = I - {0} I+ = conjunto dos números reais não negativos I_ = conjunto dos números reais não positivos Entre dois números inteiros existem infinitos números reais. Ex: Entre os números 1 e 2 existem infinitos números reais: 1,01 ; 1,001 ; 1,0001 ; 1,1 ; 1,2 ; 1,5 ; 1,99 ; 1,999 ; 1,9999 ... Entre os números 5 e 6 existem infinitos números reais: 5,01 ; 5,02 ; 5,05 ; 1.9 5,1 ; 5,2 ; 5,5 ; 5,99 ; 5,999 ; 5,9999 ... Intervalos a) Intervalo Aberto: ]a,b[ = {x R I a < x < b} 3 5 3 5 3 5 3 5 b) Intervalo Fechado: [a,b] = {x R I a ≤ x ≤ b} c) Intervalo aberto à direita: [a,b[ = {x R I a ≤ x < b} d) Intervalo aberto à esquerda: ]a,b] = {x R I a < x ≤ b} 13 Probabilidade e Estatística Luiz Roberto Existem ainda os intervalos infinitos: e) ]-∞,a] = {x R f) ]-∞,a[ = {x R I x ≤ a} I x < a} 3 3 g) [a, +∞[ = {x R I x ≥ a} 3 h) ]a, +∞[ = {x R I x > a} 3 1.10 Problemas com número finito de elementos Exemplo 1 O Instituto de Meteorologia de Curitiba quis fazer um estudo de variação da temperatura à sombra e mediu-a de hora em hora, conforme a tabela abaixo: Hora 0 1 2 3 4 5 6 7 8 9 10 11 Temperatura 7° 6° 5° 4° 3° 2° 2° 3° 5° 7° 12° 15° Hora 12 13 14 15 16 17 18 19 20 21 22 23 Temperatura 18° 18° 20° 20° 20° 18° 15° 13° 11° 9° 8° 7° Nesse exemplo, são medidas duas grandezas: a hora do dia e a correspondente temperatura. A cada hora corresponde uma única temperatura. Dizemos, por isso, que a temperatura é função da hora. Como à mesma temperatura podem corresponder várias horas, a hora não é função da temperatura. Exemplo 2 Uma barraca na praia da Barra da Tijuca vende cocos e exibe a seguinte tabela: Números de cocos Preço (R$) 1 2 3 4 5 6 7 8 1,20 2,40 3,60 4,80 6,00 7,20 8,40 9,60 14 9 10 10,80 12,00 Probabilidade e Estatística Luiz Roberto Nesse exemplo estão sendo medidas duas grandezas: o número de cocos e o respectivo preço. A cada quantidade de cocos corresponde um único preço. Dizemos, por isso, que o preço é função do número de cocos comprados. Aqui é possível até achar a fórmula que estabelece a relação de interdependência entre o preço (y) e o número de cocos (x): y = 1,20 x. Exemplo 3 Um pedreiro vai ladrilhar uma sala de 3 x 3 metros. Com ladrilhos quadrados, todos iguais entre si. Se ele pode escolher ladrilhos com lados 10 cm, 12 cm, 15 cm, 20 cm, 25 cm e 30 cm, qual é o número de ladrilhos que usará em cada caso? Para achar o número de ladrilhos (y), basta dividir a área da sala (9m2) pela área do ladrilho (em m2). Se o lado mede x m2, então a fórmula que relaciona y com x é: y = 9/x2. Medida do lado do ladrilho (x) 0,10 0,12 0,15 0,20 0,25 0,30 Número de ladrilhos (y) 900 625 400 225 144 100 Exercícios 1. A tabela abaixo indica o deslocamento de um móvel num dado intervalo de tempo: Intervalo de tempo (s) 0 1 2 3 4 5 6 7 8 9 10 Deslocamento (cm) 0 3 6 9 12 15 18 21 24 27 30 a) Qual é o deslocamento do móvel num intervalo de 4 segundos? b) Qual é o intervalo de tempo correspondente a um deslocamento de 21 cm? c) O deslocamento é função do intervalo de tempo? d) Qual é o deslocamento d num intervalo de tempo t? (supor velocidade do móvel constante). 2. A tabela abaixo indica o custo de produção de certo número de peças de automóvel: Número de peças 1 2 3 4 5 6 Custo (R$) 1 4 9 16 25 36 15 Probabilidade e Estatística Luiz Roberto a) Qual é o custo da produção de três peças? b) Qual é o número de peças produzidas com R$25,00? c) Qual é o custo c da produção de n peças? d) Com relação ao item anterior, qual é o numero máximo de peças produzidas com R$1.000,00? 3. O preço do serviço executado por um pintor consiste em uma taxa fixa, que é de R$250,00, e mais uma quantia que depende da área pintada. A tabela seguinte mostra alguns orçamentos apresentados pelo pintor: Área pintada (m2) Total a pagar (R$) 5 10 15 20 30 40 80 350 550 700 850 1.150 1.450 2.050 a) Como se exprime, matematicamente, o total a pagar (y) pela pintura de x m2? b) Qual é o preço cobrado pela pintura de uma área de 150 m2? c) Qual é a área máxima que pode ser pintada dispondo-se de R$6.250,00? 4. O num erro de y pessoas (em milhares) que tomam conhecimento do resultado de um jogo de futebol, após x horas de sua realização é dado por y = 10 x . Responda: a) Quantas pessoas sabem o resultado do jogo após 4 horas? b) Quantas pessoas sabem o resultado do jogo após um dia? c) Após quantas horas de sua realização, 30 mil pessoas tomam conhecimento do resultado do jogo? 5. A velocidade média de um automóvel em uma estrada é de 90 Km/h. Responda: a) Qual é a distância percorrida pelo automóvel em uma hora? b) Em quanto tempo o automóvel percorre a distância de 360 Km? c) Qual é a expressão matemática que relaciona a distância percorrida (d) em função do tempo (t)? 6. Um professor propõe a sua turma um exercício-desafio, comprometendo-se a dividir um prêmio de R$120,00 entre os acertadores. Seja x o número de acertadores (x = 1, 2, ..., 40) e y a quantia recebida por cada acertador (R$). Responda: a) y é função de x? Por quê? b) Quais os valores de y para x=2, x=8, x=20 e x=25? c) Qual é o valor máximo que y assume? d) Qual é a lei de correspondência entre x e y? 16 Probabilidade e Estatística 2 Luiz Roberto ANÁLISE COMBINATÓRIA 2.1 Introdução: A necessidade de calcular o número de possibilidades existentes nos chamados jogos de azar levou ao desenvolvimento da Análise Combinatória. Trata-se de uma parte da Matemática que estuda os métodos de contagem. Esses estudos foram iniciados já no século XVI, pelo matemático italiano Niccollo Fontana (1500-1557), conhecido como Tartaglia. Depois dele vieram os franceses Pierre de Fermat (1601-1665) e Blaise Pascal (1623-1662). Pascal Fermat Tartaglia A Análise Combinatória visa desenvolver métodos que permitam contar - de uma forma indireta - o número de elementos de um conjunto, estando esses elementos agrupados sob certas condições. Consideremos o seguinte problema: Uma lanchonete oferece a seus clientes apenas dois tipos de sanduíches: hot dog e hambúrger. Como sobremesa, há três opções: sorvete, torta ou salada de frutas. Pergunta-se: quantas são as possibilidades de uma pessoa fazer uma refeição incluindo um sanduíche e uma sobremesa? Podemos ter as seguintes refeições: a) hot dog e sorvete b) hot dog e torta 17 Probabilidade e Estatística Luiz Roberto c) hot dog e salada de frutas d) hambúrger e sorvete e) hambúrger e torta f) hambúrger e salada de frutas A determinação de tais possibilidades pode ser simplificada através de um diagrama, em que, na 1ª coluna, representaremos as possibilidades de escolha do sanduíche e, na 2ª coluna, as possibilidades de escolha da sobremesa. 1ª coluna 2ª coluna hot dog hambúrger sorvete Refeição 1 torta Refeição 2 salada de frutas Refeição 3 sorvete Refeição 4 torta Refeição 5 salada de frutas Refeição 6 Este esquema é conhecido como diagrama de árvore. Fazendo a leitura de todas as “ramificações” da árvore, obtemos as possíveis refeições. Notemos que fazer uma refeição completa representa uma ação constituída de duas etapas sucessivas: 1ª escolha do tipo de sanduíche: há duas possibilidades de fazer tal escolha. 2ª escolha da sobremesa: para cada uma das possibilidades anteriores, há três maneiras de escolher a sobremesa. Assim, a realização da ação (duas etapas sucessivas) pode ser feita de 2 x 3 = 6 maneiras distintas que foram anteriormente indicadas. 2.2 Para Fatorial de um número natural resolver problemas de Análise Combinatória precisamos utilizar uma ferramenta matemática chamada Fatorial. Seja n um número inteiro não negativo. Definimos o fatorial de n (indicado pelo símbolo n!) como sendo: n! = n . (n-1) . (n-2) . ... . 4 . 3 . 2 . 1 Se n = 1, então 1! = 1. Se n = 0, então 0! = 1. 18 para n ≥ 2. Probabilidade e Estatística Luiz Roberto Exemplos: a) 6! = 6 . 5! = 6 . 5 . 4 . 3 . 2 . 1 = 720 b) 4! = 4. 3! = 4 . 3 . 2 . 1 = 24 c) 7! = 7 . 6! = 7 . 6 . 5 . 4 . 3 . 2 . 1 = 5040 d) 10! = 10 . 9 . 8 . 7 . 6 . 5 . 4 . 3 . 2 . 1 e) 3! = 3 . 2 . 1 = 6 Perceba que 7! = 7 . 6 . 5 . 4!, ou que 6! = 6 . 5 . 4 . 3!, e assim sucessivamente. Relação de correspondência: N! = n . (n – 1)! , n N* e n≥ 2 Exercícios: 1) efetuar: 8! 6! 2) efetuar: (8!+7! ) 6! 3) efetuar: (n + 1)! (n − 1)! 4) efetuar: (n − 4)! (n − 3)! 5) efetuar: (6!−5! ) + 0! 5! 6) efetuar: (n + 2)! (n + 1)! 7) efetuar: (10!+9! ) 11! 8) efetuar: 7! 6! 8! + + 6! 7! 6! 9) efetuar: 6! - 20 10) Resolva a equação: (n+2)! = 6n! 11) Resolva a equação: 2.3 (2n)! = 12 (2n − 2)! Princípio fundamental da contagem - PFC Suponhamos que uma ação seja constituída de duas etapas sucessivas. A primeira etapa pode ser realizada de p maneiras distintas. Para cada uma 19 Probabilidade e Estatística Luiz Roberto dessas possibilidades, a 2ª etapa pode ser realizada de q maneiras distintas. Então, o número de possibilidades de se efetuar a ação completa é dado por p x q. Esse princípio pode ser generalizado para ações constituídas de mais de duas etapas sucessivas. Se determinado acontecimento ocorre em etapas independentes, e se a primeira etapa pode maneiras diferentes, ocorrer e assim de k1 maneiras diferentes, sucessivamente, então o a segunda número de k2 T de total maneiras de ocorrer o acontecimento, composto por n etapas, é dado por: T = k1. k2 . k3 . ... . kn Exemplo 1 No Brasil as placas dos veículos são confeccionadas usando-se 3 letras do alfabeto e 4 algarismos. Qual o número máximo de veículos que poderá ser licenciado? Imaginemos a seguinte situação: Placa ACD – 2172. Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como pode haver repetição, para a 2ª, e 3ª também teremos 26 alternativas. Com relação aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então afirmar que o número total de veículos que podem ser licenciados será igual a: 26 . 26 . 26 . 10 . 10 . 10 . 10 = 175.760.000. Exemplo 2 No Brasil, antes da alteração do sistema de emplacamento de automóveis, as placas dos veículos eram confeccionadas usando-se 2 letras do alfabeto e 4 algarismos. Qual o número máximo de veículos que podia ser licenciado neste sistema? Imaginemos a seguinte situação: Placa AC – 2172. Como o alfabeto possui 26 letras e nosso sistema numérico possui 10 algarismos (de 0 a 9), podemos concluir que: para a 1ª posição, temos 26 alternativas, e como pode haver repetição, para a 2ª, também teremos 26 alternativas. Com relação aos algarismos, concluímos facilmente que temos 10 alternativas para cada um dos 4 lugares. Podemos então afirmar que o número total de veículos que podem ser licenciados será igual a: 26 . 26 . 10 . 10 . 10 . 10 = 6.760.000. 20 Probabilidade e Estatística Luiz Roberto Percebe-se que a inclusão de apenas uma letra faz com que sejam licenciados, aproximadamente, mais 170.000.000 de veículos. Exemplo 3 Há quatro estradas ligando as cidades e A e B, e três estradas ligando as cidades B e C. De quantas maneiras distintas pode-se ir de A a C, passando por B? Fazer a viagem de A a C pode ser considerado uma ação constituída de duas etapas sucessivas: 1ª 2ª ir de A até B: teremos quatro possibilidades ir de B a C: para cada uma das possibilidades anteriores, há três maneiras de chegar a C, a partir de B. Assim, o resultado procurado é 4 x 3 =12. Exemplo 4 Com os algarismos 1, 2, 3, 4, 5 e 6, quantos números de três algarismos distintos podemos formar? Formar um número de três algarismos pode ser considerado uma ação constituída de três etapas sucessivas: 1ª 2ª escolha do algarismo das centenas: são seis possibilidades. escolha do algarismo das dezenas: como não pode haver repetição de algarismo, devemos ter um algarismo diferente do algarismo escolhido para a centena. Assim, há cinco possibilidades. 3ª escolha do algarismo das unidades: devemos ter um algarismo diferente dos dois algarismos escolhidos para a centena e para a dezena. Assim, há quatro possibilidades. Pelo PFC, o resultado é: 6 x 5 x 6 = 120 números. Exemplo 5 Uma prova consta de 10 questões do tipo V ou F. De quantas maneiras distintas ela pode ser resolvida? Resolver a prova representa uma ação constituída de 10 etapas sucessivas, que correspondem à resolução das 10 questões propostas. Para cada questão, há duas possibilidades de escolha de resposta: V ou F. Logo, pelo PFC, o resultado é: 2 x 2 x 2 ... x 2 = 210 = 1.024 possibilidades. 10 vezes 21 Probabilidade e Estatística Luiz Roberto Exemplo 6 Quantos números de três algarismos podemos formar com os algarismos 0, 1, 2, 3, 4, 5, 6 e 7? Algarismo das centenas: com exceção do zero, qualquer um dos algarismos dados pode ser escolhido, havendo, portanto, sete possibilidades. Algarismo das dezenas: não há restrição alguma, pois pode haver repetição de algarismos. Assim, há oito possibilidades. Algarismo das unidades: analogamente ao anterior, há oito possibilidades. Logo, pelo PFC: 7 x 8 x 8 = 448. Exemplo 7 Quantos números ímpares de três algarismos distintos podemos formar com os algarismos 0, 1, 2, 3, 4, 5, 6 e 7? Algarismo das unidades: há quatro possibilidades (1, 3, 5 e 7). Algarismo das centenas: há seis possibilidades – devemos excluir o zero e o algarismo escolhido para a unidade. Algarismo das dezenas: há seis possibilidades – devemos escolher algarismos diferentes dos algarismos escolhidos para a centena e unidade. Assim, pelo PFC, temos: 6 x 6 x 4 = 144 números. Todo problema de contagem pode, pelo menos teoricamente, ser resolvido pelo PFC. Porém, na prática, a resolução de alguns desses problemas pode se tornar muito complicada. Dessa forma, estudaremos técnicas de contagem de determinados agrupamentos – baseados no PFC – as quais simplificarão a resolução de muitos problemas. Consideraremos sempre os agrupamentos simples: arranjos, permutações e combinações. Exemplo 8 Determine o número de anagramas da palavra MATEMÁTICA.(não considere o acento). Solução: Temos 10 elementos, com repetição. Observe que a letra M está repetida duas vezes, a letra A três , a letra T, duas vezes. Na fórmula anterior, teremos: n=10, a=2, b=3 e c=2. Sendo k o número procurado, podemos escrever: k= 10! / (2!.3!.2!) = 151.200 anagramas 22 Probabilidade e Estatística 2.4 Luiz Roberto Arranjos simples Dado um conjunto com n elementos distintos, chama-se arranjo dos n elementos, tomados k a k, a qualquer seqüência ordenada de k elementos distintos escolhidos entre os n existentes. Temos um Arranjo quando os agrupamentos conseguidos ficam diferentes ao se inverter a posição dos seus elementos. Perceba que para formar centenas com algarismos distintos, utilizando apenas os 5 primeiros algarismos ímpares (1; 3; 5; 7; 9) teremos as seguintes centenas: 135; 137; 139; 153, 157, e assim sucessivamente. Se invertermos a posição dos elementos de qualquer uma destas centenas conseguiremos outra centena diferente: 135 • 351. Temos então um ARRANJO de cinco elementos tomados de três em três. Exemplo 1 Dado o conjunto A = (1, 2, 3, 4), vamos escrever todos os arranjos desses quatro elementos tomados dois a dois. (1, 2); (1, 3); (1, 4); (2, 1); (2, 3); (2, 4); (3, 1); (3, 2); (3, 4); (4, 1); (4, 2); (4, 3) Notamos que (2, 3) ≠ (3, 2), isto é, a troca na ordem dos elementos de um possível agrupamento gera um agrupamento diferente. Exemplo 2 Um cofre possui um disco marcado com os dígitos 0,1,2,...,9. O segredo do cofre é marcado por uma seqüência de 3 dígitos distintos. Se uma pessoa tentar abrir o cofre, quantas tentativas deverá fazer(no máximo) para conseguir abri-lo? As seqüências serão do tipo xyz. Para a primeira posição teremos 10 alternativas, para a segunda, 9 e para a terceira, 8. Aplicando a fórmula de arranjos pelo PFC, chegaremos ao mesmo resultado: 10.9.8 = 720. Observe que 720 = A10,3 2.5 Cálculo do número de arranjos Seja um conjunto de n elementos distintos. Vamos encontrar uma expressão para o número de arranjos dos n elementos tomados k a k (An,k). Escrever um arranjo de n elementos formados k a k significa escrever uma seqüência ordenada de k elementos distintos (k ≤ n), escolhidos entre os n 23 Probabilidade e Estatística Luiz Roberto disponíveis. Assim, pelo PFC, a ação pedida consta de k etapas sucessivas, que correspondem às escolhas dos k elementos. 1ª etapa etapa 2ª etapa (há n elementos para serem escolhidos) n 3ª etapa ... k-ésima (como os elementos devem ser distintos, há n-1 possibilidades) n – 1 n – 2 n – (k – 1) Desta forma, o número total de arranjos dos n elementos tomados k a k é: An,k = n . (n – 1) . (n – 2) ... (n - k +1) Multiplicando e dividindo a expressão acima por (n – k)! = (n – k) (n – k – 1) ... 3 . 2 . 1 An,k = n (n – 1) (n – 2) ... (n - k +1) . vem: (n − k )(n − k − 1)...3.2.1 , (n − k )(n − k − 1)...3.2.1 Isto é: An,k = n! (n − k )! n ≥ k Exemplo 3 Obter o valor de A4,2 + A7,3. Temos A4,2 = 4! 4! 4.3.2! = = = 12 (4 − 2)! 2! 2! A7,3 = 7! 7! 7.6.5.4! = = = 210 (7 − 3)! 4! 4! Exemplo 4 O quadrangular de um torneio mundial de basquete é disputado por quatro seleções: Brasil, China, Holanda e Itália. De quantas maneiras distintas podemos ter os três primeiros colocados? Um possível resultado do torneio é Holanda (campeã), Brasil (2°) e Itália (3°). Se trocarmos a ordem desses elementos, obtemos, entre outras, Brasil 24 Probabilidade e Estatística Luiz Roberto (campeão), Itália (2°) e Holanda (3°), que é um resultado diferente do anterior. Dessa forma, cada resultado do torneio é um arranjo das quatro equipes tomadas três a três. Assim, o número de possibilidades é : An,k = n! (n − k )! Î 4! (4 − 3)! A4,3 = 4! 1! = = 24 Exemplo 5 A senha de um cartão de banco é formada por duas letras distintas seguidas por uma seqüência de três algarismos distintos. Quantas senhas poderiam ser confeccionadas? Como importa a ordem que são escolhidas as letras, o número de maneiras de escolhê-las é dado por A26,2. Analogamente, a seqüência de três algarismos distintos pode ser escolhida de A10,3. Pelo PFC, o número de senhas que podem ser confeccionas é: A26,2 x A10,3 = 650 x 720 = 468.000. Exemplo 6 Usando-se as 26 letras do alfabeto (A,B,C,D,...,Z), quantos arranjos distintos com 3 letras podem ser montados? An,k = n! (n − k )! n=26, k=3 26! 26 . 25 . 24 . 23! = = 26.25.24 = 15600 23! 23! Resposta: A = 2.6 , Permutações simples Permutações simples de n elementos distintos são os agrupamentos formados com todos os n elementos e que diferem uns dos outros pela ordem de seus elementos. De outro modo, podemos entender permutação simples como um caso especial de arranjo, onde n = k, ou seja: An,k = n! (n − k )! = n! 0! = Chega-se então à relação: n! = n! 1 Pn = n! 25 Probabilidade e Estatística Luiz Roberto Notemos que a permutação é um caso particular de arranjo, pois, dado um conjunto de n elementos distintos, selecionamos exatamente n elementos para forma a seqüência ordenada. Exemplo 1 Escrever todos os anagramas da palavra SOL. Um anagrama da palavra SOL é qualquer permutação das letras S, O, L de modo que se forme uma palavra com ou sem sentido. Assim, temos: SOL, SLO, OSL, OLS, LOS, LSO. Exemplo 2 De quantas maneiras cinco pessoas, A, B, C, D e E podem ser dispostas em fila indiana? Cada maneira de compor a fila é uma permutação das cinco pessoas, pois qualquer fila obtida é uma seqüência ordenada na qual comparecem sempre as cinco pessoas. Assim, o resultado esperado é: P5 = 5! = 120 Exemplo 3 Baseado no exemplo anterior, quantas filas podem ser compostas começando por A ou B? A 1ª posição da fila pode ser escolhidas de duas maneiras (pois tanto A como B pode iniciá-la). Definido o início da fila, restarão sempre quatro lugares para preenchidos pelas quatro pessoas restantes, num total de P4 = 4! serem = 24 possibilidades. Pelo PFC, o resultado é: 2 x 24 = 48. Exemplo 4 Oito pessoas, entre elas, Antonio e Pedro, vão posar para uma foto. De quantas maneiras elas podem ser dispostas se Antonio e Pedro se recusarem-se a ficar lado a lado? Caso não houvesse a restrição mencionada, o número total de possibilidades seria: P8 = 8! = 40.320. Para determinar o número de possibilidades em que Antonio e Pedro aparecem juntos, vamos considerá-los uma só pessoa, que irá permutar com as seis restantes, num total de: 26 Probabilidade e Estatística Luiz Roberto P7 = 7! = 5.040 maneiras. Porém, para cada uma das possibilidades acima, Antonio e Pedro podem trocar de lugar entre si, num total de: P2 = 2! = 2. Desta forma, o número de possibilidades em que Antonio e Pedro aparecem juntos é: 2x 5.040 A diferença = 10.080. 40.320 – 10.080 = 30.240 fornece o número de situações em que Antonio e Pedro não aparecem lado a lado. Exemplo 5 Quantas possibilidades de agrupamentos há com os elementos A,B,C? São possíveis as seguintes permutações: ABC, ACB, BAC, BCA, CAB e CBA. De forma matemática: P3 = 3! = 3 . 2 . 1 = 6 Exemplo 6 Calcule o número de formas distintas de 5 pessoas ocuparem os lugares de um banco retangular de cinco lugares. P5 = 5! = 5 . 4 . 3 . 2 . 1 = 120 Exemplo 7 Denomina-se ANAGRAMA o agrupamento formado pelas letras de uma palavra, que podem ter ou não significado na linguagem comum. Os possíveis anagramas da palavra REI são: REI, RIE, ERI, EIR, IRE e IER. Calcule o número de anagramas da palavra MUNDIAL. P7 = 7! = 7 . 6 . 5 . 4 . 3 . 2 . 1 = 5040 2.7 Permutações com elementos repetidos Se entre os n elementos de um conjunto, existem a elementos repetidos, b elementos repetidos, c elementos repetidos e assim sucessivamente, o número total de permutações que podemos formar é dado por: Pn (a,b,c) = n! a!b! c! o número Exemplo 1 Determine de anagramas da palavra MATEMÁTICA.(não considere o acento) Temos 10 elementos, com repetições. A letra M está repetida duas vezes, a 27 Probabilidade e Estatística Luiz Roberto letra A três, a letra T, duas vezes. Na fórmula anterior, teremos: n=10, a=2, b=3 e c=2. P = 10! / (2!.3!.2!) = 151200 Exemplo 2 Quantos anagramas podem ser formados com as letras da palavra MARIA? Neste problema temos n = 5 (cinco letras) e a = 2 (a letra A se repete duas vezes) P = 5!/2! = 5.4.3 = 60 Exemplo 3 Quantos anagramas podem ser formados com as letras da palavra ARARA? Neste problema temos n = 5 (cinco letras), a = 2 (a letra R se repete duas vezes) e b = 3 (a letra A se repete três vezes). P = 5!/(3!.2!) = 5.4.3!/(3!.2) = 10 2.8 Combinações simples Dado um conjunto A com n elementos distintos, chama-se combinação dos n elementos de A, tomados k a k, a qualquer subconjunto formado por k elementos, isto é, temos uma combinação quando os agrupamentos conseguidos permanecem iguais ao se inverter a posição dos seus elementos. Perceba que se houver cinco pessoas entre as quais desejamos formar grupos de três, o grupo formado por João, Pedro e Luís é o mesmo grupo formado por Luís, Pedro e João. Temos, então, uma COMBINAÇÃO de cinco elementos em grupos de três. Cálculo do número de combinações Considere o seguinte problema: Uma turma é formada por 10 alunos. Deseja-se formar uma comissão de três alunos para representação discente na universidade. De quantas maneiras podemos fazer tal escolha? Calculemos inicialmente o número de triplas ordenadas de alunos: A10,3 = 10! = 720 seqüências ordenadas. 7! Suponhamos que A, B, C estejam entre os 10 alunos da turma. Essas 720 possibilidades incluem, entre outras, os seguintes arranjos: 28 Probabilidade e Estatística Luiz Roberto (A,B,C), (A,C,B), (B,A,C), (B,C,A), (C,A,B) e (C,B,,A) Em cada um desses casos – que diferem entre si apenas pela ordem – os alunos A, B e C farão parte da comissão. Assim, os seis arranjos acima passam a ser equivalentes entre si, correspondendo a uma única combinação {A, B, C} , pois determinam sempre a mesma comissão. Desta forma, aos seis arranjos corresponde uma combinação; então, para os 720 arranjos, teremos x combinações: 6 arranjos 1 combinação 720 arranjos x combinações Número de arranjos dos 10 alunos tomados três a três Logo, 720 x = = 120 comissões 6 Número de permutações da tripla (A,B,C) De modo geral, qualquer permutação de uma determinada seqüência ordenada dá origem e uma única combinação. Representando por Cn,k o número total de combinações de n elementos tomados k a k (taxa k), temos: Cn,k = A n, k Pk ou Cn,k = n! k! (n − k )! ,n ≥ k Exemplo 1 Escrever todas as combinações dos cinco elementos do conjunto M = {a, e, i, o, u} tomados dois a dois. Devemos determinar todos os subconjuntos de M formados por dois elementos. Lembremos que não importa a ordem dos elementos escolhidos: {a, e} exemplo. Assim, as combinações pedidas são: {a, e}, {a, i}, {a, o}, {a, u}, {e, i}, {e, o} , {e, u}, {i, o}, {i, u}, {o, u} 29 = {e, a}, por Probabilidade e Estatística Luiz Roberto Exemplo 2 Cinco alunos – Pedro, Luís, José, Abel e Márcio – participam de um concurso que serão sorteadas três bicicletas. Quais os possíveis resultados do concurso? {Pedro, José, Márcio} Sortear é o mesmo que sortear {José, Márcio, Pedro}, pois nas duas situações, esses alunos ganharão as bicicletas. Desta forma, cada resultado do sorteio é uma combinação dos cinco alunos tomados três a três. Os possíveis resultados do concurso são: {P, J , M } {P, J , A} {P, M , A} {P, L, J } {P, L, M } {P, L, A} {L, J , A} {L, J , M } {J , A, M } {L, A, M } , , , , , , , , , Exemplo 3 Uma prova consta de 15 questões das quais o aluno deve resolver 10. De quantas formas ele poderá escolher as 10 questões? Observe que a ordem das questões não muda o teste. Logo, podemos concluir que trata-se de um problema de combinação de 15 elementos com taxa 10. Aplicando simplesmente a fórmula chegaremos a: C15,10 = 15! / [(15-10)! . 10!] = 15! / (5! . 10!) = 15.14.13.12.11.10! / 5.4.3.2.1.10! = 3003 Tanto arranjo como combinação são agrupamentos de k elementos escolhidos a partir de um conjunto de n elementos. A diferença é que, no arranjo, se mudarmos a ordem dos elementos de certo agrupamento, obteremos um novo agrupamento; na combinação, mudando a ordem dos elementos de certo agrupamento, obtemos o mesmo agrupamento. Exemplo 3 Uma prova consta de 15 questões das quais o aluno deve resolver 10. De quantas formas ele poderá escolher as 10 questões? Observe que a ordem das questões não muda o teste. Logo, podemos concluir que trata-se de C15,10 15! (15 − 10)!.10! = um problema = de combinação 15! 5!.10! = 30 de 15 elementos 15.14.13.12.11.10! 5.4.3.2.1.10! com taxa 10. = 3003 Probabilidade e Estatística Luiz Roberto Exemplo 4 Um coquetel é preparado com três bebidas distintas. Se existem 7 bebidas distintas, quantos coquetéis diferentes podem ser preparados? 7! (7 − 3)!.3! C7,3 = = 7! 4!.3! 7.6.5.4! 4!.3.2.1 = = 35 Exemplo 5 Sobre uma circunferência são marcados 9 pontos, dois a dois distintos. Quantas retas podem ser construídas passando por estes 9 pontos? C9,2 = 9! (9 − 2)!.2! = 9! 7!.2! 9.8.7! 7!.2.1 = = 36 Exemplo 6 Uma pizzaria oferece 15 sabores de pizzas diferentes. a) De quantas maneiras se pode escolher três desses sabores? b) Suponha que uma família sempre opte por mussarela. Como poderão ser escolhidos os outros dois sabores? Resp. a) Escolher as pizzas {P1, P 2, P3} é o mesmo que escolher as pizzas {P3, P 2, P1}. Assim, cada possível escolha é uma combinação das 15 pizzas tomadas três a três: C15,3 = 15! 3!12! = 15.14.13.12! 3.2.1.12! = 455 Resp. b) Como um dos sabores já foi definido, os outros dois sabores serão escolhidos entre os 14 restantes. C14,2 = 14! 12!2! = 14.13.12! 12!.2.1 = 91 Exemplo 7 Uma turma tem 15 alunos, sendo 9 meninos e 6 meninas. a) Quantas comissões de dois meninos e duas meninas podem ser formadas? O número de escolher os meninos é C9,2. O número de escolher as meninas é C6,2. Pelo PFC, temos: C9,2 x C6,2 = 36 x 15 = 31 540 Probabilidade e Estatística Luiz Roberto b) Quantas comissões de quatro pessoas têm pelo menos um menino? O número total de comissões de quatro pessoas, sem nenhuma restrição, é C15,4. O número de comissões onde não aparecem meninos é C6,4, pois as vagas serão preenchidas pelas meninas. Assim, o número de comissões onde há pelo menos um menino é: C15,4 – C6,4 = 1.365 – 15 = 1.350 Exemplo 8 Marcam-se cinco pontos sobre uma reta r. Sobre outra reta s, paralela a r, marcam-se quatro pontos. Quantos triângulos podem ser formados com vértices em três quaisquer desses pontos? Observando a figura, vemos que para construir um triângulo não importa a ordem dos pontos escolhidos, pois, por exemplo, {A, B, C} e {B, C , A} determinam o mesmo triângulo. B A C Por outro lado, podemos construir um triângulo se escolhermos: 1° caso: dois pontos de r e C5,2 = 10 possibilidades um ponto de s C4,1 = 4 possibilidades Pelo PFC, há 10 x 4 = 40 possibilidades. 2° caso: um ponto de r C5,1 = 5 possibilidades e dois pontos de s C4,2 = 6 possibilidades Pelo PFC, há 5 x 6 = 430 possibilidades. Dessa forma, o número total de triângulos que podem ser construídos é: 40 + 30 = 70. 32 Probabilidade e Estatística Luiz Roberto Exemplo 9 Um salão tem 6 portas. De quantos modos distintos esse salão pode estar aberto? Para a primeira porta temos duas opções: aberta ou fechada Para a segunda porta temos também, duas opções, e assim sucessivamente. Para as seis portas, teremos então, pelo PFC: N = 2.2.2.2.2.2 = 64 Lembrando que uma dessas opções corresponde a todas as duas portas fechadas, teremos então que o número procurado é igual a 64 - 1 = 63. Resposta: o salão pode estar aberto de 63 modos possíveis. 2.9 Exercícios 01 - Um coquetel é preparado com duas ou mais bebidas distintas. Se existem 7 bebidas distintas, quantos coquetéis diferentes podem ser preparados? Resp: 120 02 - Sobre uma circunferência são marcados 9 pontos distintos. Quantos triângulos podem ser construídos com vértices nos 9 pontos marcados? Resp: 84 03 - Uma família com 5 pessoas possui um automóvel de 5 lugares. Sabendo que somente 2 pessoas sabem dirigir, de quantos modos poderão se acomodar para uma viagem? Resp: 48 33 Probabilidade e Estatística 3 Luiz Roberto PROBABILIDADE Todas as vezes que se estudam fenômenos de observação, cumpre-se distinguir o próprio fenômeno e o modelo matemático que melhor o explique. Os fenômenos estudados pela Estatística são fenômenos cujos resultados, mesmo em condições normais de experimentação variam de uma observação para outra. Para a explicação desses fenômenos – fenômenos aleatórios – adota-se um modelo matemático probabilístico. Nesse caso, o modelo utilizado será o CÁLCULO DAS PROBABILIDADES. 3.1 Experimento aleatório Todo experimento que, repetido em condições idênticas, pode apresentar diferentes resultados, recebe o nome de experimento aleatório. A variabilidade de resultados deve-se ao acaso. A fim de se entender melhor a caracterização desses experimentos, convém observar o que há de comum nos seguintes experimentos: E1: Retirar uma carta de um baralho com 52 cartas e observar seu naipe. E2: Jogar uma moeda 10 vezes e observar o número de coroas obtidas. E3: Retirar com ou sem reposição, bolas de uma urna que contém 5 bolas brancas e seis pretas. E4: Jogar um dado e observar o número mostrado na face de cima. E5: Contar o número de peças defeituosas da produção diária da máquina A. A análise desses experimentos revela: a) Cada experimento poderá ser repetido indefinidamente sob as mesmas condições. b) Não se conhece um particular valor do experimento “a priori” , porém pode-se descrever todos os possíveis resultados – as possibilidades. 34 Probabilidade e Estatística Luiz Roberto c) Quando o experimento for repetido um grande número de vezes surgirá uma regularidade, isto é, haverá uma estabilidade da fração f = r/n (freqüência relativa), onde n é o número de repetições e r o número de sucessos. 3.2 Espaço amostral Para cada experimento aleatório E, define-se espaço amostral o conjunto de todos os resultados possíveis desse experimento. Consideremos um experimento aleatório. O conjunto de todos os possíveis resultados desse experimento é chamado espaço amostral e indicado por Ω (letra grega que se lê: “omega”). Indicaremos o número de elementos de um espaço amostral por n(Ω). Exemplo 1 a) E = Jogar um dado e observar o número mostrado na face de cima Ω = {1, 2, 3, 4, 5, 6} b) E = jogar duas moedas e observar os resultados. Ω = {(C,C), (C,K), (K,C), (K,K)} onde C = cara e K = coroa. Exemplo 2 Lançamos uma moeda honesta e observamos a face voltada para cima: Temos: Ω = {K,C}, onde K: cara; e C: coroa; n(Ω) = 2. Chamamos cada um dos resultados possíveis de ponto amostral. Exemplo 3 Uma urna contém cinco bolas vermelhas e quatro brancas. Duas bolas são extraídas, ao acaso, sucessivamente e sem reposição. Observamos a seqüência de cores das bolas sorteadas. Para determinar Ω , vamos construir um diagrama de árvore: 1ª extração 2ª extração vermelha vermelha branca Vermelha branca branca 35 Probabilidade e Estatística Luiz Roberto Indicando vermelha por V e branca por B, temos: Ω = {(V , V ), (V , B), ( B, V ), ( B, B)} Î n(Ω) = 4. Cada par acima é um dos pontos amostrais de Ω. 3.3 Evento Evento é um conjunto de resultados do experimento, em termos de conjuntos, é um subconjunto de Ω. Em particular, Ω e Ø (conjunto vazio) são eventos. Ω é dito o evento certo e Ø o evento impossível. Usando as operações em conjunto, podemos formar novos eventos: A U B Î é o evento que ocorre se A ocorre ou B ocorre ou ambos ocorrem. A I B Î é o evento que ocorre se A e B ocorrem. Ā Î é o evento que ocorre se A não ocorre. Exemplo 1 a) Seja o experimento E: jogar três moedas e observar os resultados: Ω = {(c,c,c), (c,c,k), (c,k,c), (k,c,c), (k,k,k), (k,k,c), (k,c,k), (c,k,k)} Seja E1 o evento: ocorrer pelo menos duas caras. Então, E1 = {(c,c,c),(c,c,k), (c,k,c), (k,c,c)} b) Seja o evento E2: lançar um dado e observar o número de cima. Então, E2 = Ω = {1, 2, 3, 4, 5, 6} é um evento certo. E3: ocorrência de número maior que 8. E3 = Ø é um evento impossível. Seja E4: ocorrer múltiplo de 2. Então E4 = {2, 4, 6}; observe que E4 ⊂ Ω. Seja E5: ocorrer número ímpar. Então E5 = {1, 3, 5}; observe que E5 ⊂ Ω. 3.4 Probabilidade de um Evento Agora podemos quantificar o grau de confiança de qualquer evento. 36 Probabilidade e Estatística Luiz Roberto Atribuímos a cada evento um número obtido da soma das imagens de cada um de seus elementos na relação de freqüência. Este número chama-se probabilidade do evento. Observe como se resolve o seguinte caso. Exemplo: O experimento consiste em extrair uma bola do interior de uma caixa e observar sua cor. Há um total de nove bolas na caixa: duas brancas, três vermelhas e quatro pretas. Qual será a probabilidade de tirar uma bola que não seja preta? Para solucionar esta questão, preparamos o esquema da figura acima: O espaço amostral da figura acima é: Elemento Imagem (B) branca 2/9 (V) vermelha 3/9 (P) preta 4/9 = {branca, vermelha, preta} O evento “tirar uma bola de cor diferente do preto”, A = {B,V}, consta de dois elementos. Como foi dito na definição de probabilidade, atribuímos a cada evento um número obtido da soma das imagens de cada elemento na relação de freqüência. Portanto, se somarmos as imagens da bola branca, 2/9, e da vermelha, 3/9, que aparecem na relação de freqüência deste exemplo, vamos conhecer o valor da probabilidade do evento A, indicado por P(A). Assim, p(A) = 2 3 5 + = 9 9 9 Em alguns experimentos aleatórios, cada um dos resultados (eventos elementares) tem a mesma freqüência relativa esperada. 37 Probabilidade e Estatística Luiz Roberto Este é o caso de lançar uma moeda ou um dado e comprovar o resultado. Dizemos, então, que o espaço amostral é equiprovável, e que sua probabilidade é uniforme. 3.5 Evento complementar Consideremos um evento E relativo a um espaço amostral Ω. Chamamos evento complementar de – indicado por E – ao evento que ocorre quando se, e somente se, E não ocorre. Observe o seguinte diagrama: Notemos que E E I = Ø e E Ω U E = Ω Exemplo 1 Uma urna contém 10 bolas numeradas de 1 a 10. Retira-se da urna, ao acaso, uma bola. Se E é o evento “ocorre múltiplo de 3”, então = {1, 2, 4, 5, 7, 8, 10} Î é o evento “não ocorre múltiplo de 3”. Notemos que E 3.6 será: Ω = {1, 2, 3, ..., 10} e E = {3, 6, 9}; logo: Temos: E E U E = Ω. Probabilidades em espaços amostrais equiprováveis Consideremos o espaço amostral Ω formado por k pontos amostrais (ou eventos elementares): Ω = {a1, a2, a3, ..., ak} Vamos associar cada um desses pontos amostrais um número real, p{ai}, ou simplesmente pi, chamado probabilidade do evento {ai}, ou seja, probabilidade de ocorrência do ponto amostral ai, tal que: (I) 0 ≤ pi ≤ 1 k (II) ∑p i=1 i = 1 , isto é, p1 + p2 + ... + pk = 1 38 Probabilidade e Estatística Luiz Roberto Consideremos aqui os espaços amostrais equiprováveis, isto é, aqueles cujos pontos amostrais têm a mesma probabilidade de ocorrer. Assim, se denotarmos por p a probabilidade de ocorrência de cada um dos pontos amostrais de Ω, temos, em (II): Î p + p + p + ... + p = 1 k . p = 1 Î p = 1 k K vezes A probabilidade de ocorrência de um evento E, formado por r pontos amostrais E = {a1, a2, a3, ..., ar} , com r ≤ k, é dada por: Î P (E) = p1 + p2 + ... + pr Î p(E) = 1 1 1 1 + + + … k k k k r Número de elementos de E = k Número de elementos de Ω Como E ⊂ Ω, temos que P(E) = p(E) = n(E) n(Ω) = Î n(E) n(Ω) n(E) ≤ n(Ω). Assim: tal que 0 ≤ p(E) ≤ 1 Essa definição de probabilidade é intuitiva, isto é, a probabilidade de ocorrer determinado favoráveis (ou evento número de é dada caos que pala nos razão entre interessam) e o número de casos o número de casos possíveis (ou número total de casos). Assim: p(E) = n(E) n(Ω) = Número de casos favoráveis Número de casos possíveis Uma vez que o número de casos favoráveis coincide com o número de elementos do evento, e o número de casos possíveis corresponde ao número de elementos do espaço amostral, podemos escrever: p(A) = f , onde o evento A tem k f elementos e k o número possível de elementos. Para ocorrer o evento A, o resultado deve ser algum desses f elementos, que são os casos favoráveis. Assim, no exemplo do lançamento de um dado, se o evento A consiste em obter um “5”, o número de casos favoráveis será 1, pois num dado não-viciado 39 Probabilidade e Estatística Luiz Roberto só existe um “5”, e o número de casos possíveis é 6, portanto o espaço = {1,2,3,4,5,6} amostral é: Assim, a probabilidade do evento A será: P (A) = 1/6 Quando dizemos que a probabilidade do evento A é 1/6, isto não significa que, se jogarmos o dado seis vezes, em uma delas sairá, com toda a certeza, o número “5”. Pode ser que o número “5” não saia nenhuma vez, ou ele pode sair mais de uma vez. A probabilidade 1/6 indica apenas que, se repetirmos esse experimento um número muito grande de vezes, o evento A vai ocorrer em aproximadamente 1/6 do total de jogadas. Exemplo 1 Uma urna contém 15 bolas numeradas de 1 a 15. Uma bola é extraída ao acaso. Qual a probabilidade de ser sorteada uma bola com número maior ou igual a 11? Temos: Ω = {1, 2, 3, ..., 15} Seja o evento E: “o número da bola sorteada é maior ou igual a 11”. Logo: E = {11, 12, 13, 14, 15}. n(E) Assim, p(E) = n(Ω) = 5 1 = 15 3 = 33,3% Exemplo 2 Um dado é lançado e observa-se o número da face voltada para cima. Qual a probabilidade desse número ser: a) menor que 3? b) Maior ou igual a 3? a) Temos Ω = {1, 2, 3, 4, 5, 6} E = {1, 2}. Então, p(E) = 2 6 1 3 = b) basta considerar o evento complementar: Ec = {3, 4, 5, 6}. Assim, Note que n(Ec) p(E ) = n(Ω) c = 4 6 = 2 . 3 p(E) + p(Ec) = 1 Exemplo 3 Uma moeda é lançada três vezes, sucessivamente. Qual a probabilidade de observarmos: a) exatamente uma cara?; b) No máximo duas caras? 40 Probabilidade e Estatística Vamos construir um Luiz Roberto diagrama de árvore onde na 1ª, 2ª e 3ª colunas, respectivamente, representaremos os possíveis resultados para o 1°, 2° e 3° lançamentos. K K C K C C K (K,K,K) C (K,K,C) K (K,C,K) C (K,C,C) K (C,K,K) C (C,K,C) K (C,C,K) C (C,C,C) K: cara C: coroa O espaço amostral é formado pelas oito seqüências indicadas. a) O evento E1 = {(K,C,C), (C,C,K), (C,K,C)} n(E1) Assim, p(E1) = n(Ω) = 3 8 = 37,5% b) As seqüências que nos interessam são aquelas que apresentam nenhuma, uma ou duas caras. Assim, o evento pedido é: E2 = {(C,C,C),(K,C,C),(C,K,C),(C,C,K),(K,K,C),(K,C,K),(C,K,K)} Logo, p(e2) = 7 = 87,5%. 8 Exemplo 4 Uma turma tem 20 homens e 25 mulheres. Deseja-se formar uma comissão de cinco alunos para representantes de turma. Qual a probabilidade de essa comissão vir a ser formada exclusivamente por meninos? O número de elementos de Ω é igual ao número de maneiras de se escolher uma comissão qualquer de cinco pessoas, a partir dos 45 alunos. Como vimos, n(Ω) = C45,5 . O evento que interessa é aquele em que “todos os alunos da comissão são meninos”. O número de comissões assim existentes é C20,5 . Assim, a probabilidade pedida é: C20,5 P(E) = C45,5 = 0,0126 = 1,26% 41 Probabilidade e Estatística Luiz Roberto Exemplo 5 Escolhe-se, ao acaso, um dos anagramas da palavra XADREZ. Qual a probabilidade da palavra escolhida começar por XA? O número de elementos de Ω é o número de permutações da palavra XADREZ. Então, n(Ω) = P6 = 6! = 720. O evento E = “palavra começa por XA”: X A __ __ __ __ Definidas as duas primeiras letras, há P4 = 4! maneiras de se preencherem as lacunas restantes. Assim, n(E) = 4! = 24. n(E) Logo, a probabilidade pedida é p(E) = n(Ω) = 24 = 3,33% 720 Exemplo 6 Numa comunidade residem 100 pessoas. Uma pesquisa sobre os hábitos alimentares dessa comunidade revelou que: • 25 pessoas consomem carnes e verduras • 83 pessoas consomem verduras • 39 pessoas consomem carnes Uma pessoa da comunidade é escolhida ao acaso. Qual é a probabilidade de ela: a) consumir exclusivamente carne? b) Ter o hábito alimentar de não comer nem carne nem verdura? Vamos construir um diagrama representando carne por C e verdura por V. comunidade V C 25 58 14 3 1°) Há 25 pessoas na integração de C e V. 2°) Pessoas que consomem exclusivamente verduras: 83 – 25 = 58 3°) Pessoas que consomem exclusivamente carnes: 39 – 25 = 14 4°) Como 25 + 58 + 14 = 97, há 3 pessoas que não comem carnes nem verduras. Assim, as probabilidades pedidas são: a) 14 = 0,14 = 14% 100 b) 3 = 0,03 = 3% 100 42 Probabilidade e Estatística 3.7 Luiz Roberto Probabilidade da união de dois eventos Sejam A e B eventos de um mesmo espaço amostral Ω. Vamos encontrar uma expressão para a probabilidade de ocorrer o evento A ou o evento B, isto é, a U B. probabilidade da ocorrência do evento A Consideremos dois casos: 1°) eventos mutuamente exclusivos A I B = Ø Temos: Ω n(A U B) = n(A) + n(B) Como n(Ω) ≠ 0, podemos escrever: A n(A B U B) = n(Ω) n(A) n(Ω) + n(B) n(Ω) Da definição de probabilidade, segue: P(A U B) = p(A) + p(B) Nesse caso, A e B são chamados eventos mutuamente exclusivos. 2°) eventos com ocorrências simultâneas: A I B ≠ Ø Da teoria dos conjuntos, temos: n(A A B A De modo análogo ao primeiro caso: I B O evento A U B) = n(A) + n(B) – n(A I B) p(A U B) = p(A) + p(B) – p(A I B) I B representa a ocorrência simultânea dos eventos A e B. Exemplo 1 Uma urna contém 25 bolas numeradas de 1 a 25. Uma bola é extraída ao acaso dessa urna. a) Qual é a probabilidade de o número da bola sorteada ser múltiplo de 2 ou de 3? Consideremos os eventos A, “o número é múltiplo de 2” e B, “o número é múltiplo de 3”. Queremos encontrar p(A U B). Temos: 43 Probabilidade e Estatística Luiz Roberto A = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24} Î p(A) = B = {3, 6, 9, 12, 15, 18, 21, 24} Î p(B) = n(B) = n(Ω) n(A) n(Ω) = 12 25 8 25 A I B = {6, 12, 18, 24}: é o evento formado pelos múltiplos de 2 e 3 ao mesmo tempo, isto é, pelos múltiplos de 6. Temos: Como p(A U B) = p(A) + p(B) – p(A I B) Temos: p(A U B) = 12 8 4 + – = 25 25 25 p(A I B) = 4 . 25 16 = 0,64 = 64%. 25 b) Qual é a probabilidade de o número da bola sorteada ser múltiplo de 5 ou de 7? A = {5, 10, 15, 20, 25} Î p(A) = B = {7, 14, 21} Î p(B) = Como A p(A 5 25 3 25 I B = Ø, temos: U B) = p(A) + p(B) Î p(A U B) = 5 3 + = 25 25 8 = 0,32 = 32%. 25 Exemplo 2 A probabilidade de um guarda rodoviário aplicar quatro ou mais multas em um dia é de 63%; a probabilidade de ele aplicar quatro ou menos multas em um dia é de 56%. Qual é a probabilidade de o guarda aplicar exatamente quatro multas? Consideremos os eventos: A: “quatro ou mais multas”; p(A) = 0,63 B: “quatro ou menos multas”; p(B) = 0,56 Temos: 1°) A I B é o evento “guarda aplica exatamente quatro multas”. Queremos determinar p(A I B). 2°) A (em um dia o guarda aplica menos de quatro multas, ou quatro U B = multas, ou mais de quatro multas). 44 Probabilidade e Estatística Assim, p(A P(A Luiz Roberto U B) = p(Ω) = 1 (pois A U B é o evento certo). Daí: U B) = p(A) + p(B) – p(A I B) 1 = 0,63 + 0,56 - p(A I B) Î p(A I B) = 0,19 = 19% Exemplo 3 Observe a roleta da figura abaixo e pense na probabilidade existente de saída para cada número. a) Qual a probabilidade de cada evento elementar? P(1) = P(2) = P(4) = P(5) = P(6) = P(7) = 1/8 P(3) = 2/8 Î b) Qual a probabilidade de o número ser par? Î c) Qual a probabilidade de dar o número 3? 3.8 P({2,4,6}) = 3/8 P(3) = 2/8 = 1/4 Experiência Composta Também pode nos interessar o cálculo da probabilidade de uma experiência composta, ou seja, a realização de dois ou mais experimentos aleatórios simples. Nesses possível do casos, a freqüência experimento é obtida relativa a esperada partir do para produto cada das resultado freqüências relativas esperadas de cada elemento que compõe o referido resultado. Exemplo: Temos uma moeda e duas caixas cheias de bolas coloridas. Na caixa A temos duas bolas vermelhas e cinco pretas, enquanto na B há quatro bolas vermelhas e uma bola azul. Imagine a seguinte experiência composta: lançamos uma moeda; se der "cara", extraímos uma bola da caixa A; e se der "coroa", uma bola da caixa B. Em seguida, vamos representar por um diagrama em árvore os resultados possíveis da experiência composta. Vamos Indicar também as freqüências relativas esperadas para cada experiência parcial. Como observamos no esquema da figura anterior, o espaço amostral é: = {(cara, vermelha), (cara, preta), (coroa, vermelha), (coroa, azul)} 45 Probabilidade e Estatística Luiz Roberto 2 7 vermelha cara 5 7 1 2 1 2 preta vermelha 4 5 coroa 1 5 O objetivo é definir uma azul probabilidade para o conjunto , que representa os resultados possíveis da experiência composta. A relação de freqüência é obtida atribuindo-se a cada resultado o produto das freqüências relativas esperadas, que aparecem em cada ramo completo do diagrama em árvore da figura. Desta maneira, comprovamos que a relação de freqüência, neste caso, é a seguinte: Elemento Imagem cara, vermelha 1/2 x 2/7 = 2/14 cara, preta 1/2 x 5/7 = 5/14 coroa, vermelha 1/2 x 4/7 = 4/14 coroa, azul 1/2 x 1/7 = 1/10 Agora podemos calcular a probabilidade de qualquer evento dessa experiência composta. 3.9 Probabilidade condicional Seja E: lançar um dado e o evento A = {sair o n° 3}. Então, P(A) = 1 6 Considere agora o evento B = {sair um número ímpar} = {1, 3, 6}. É de grande importância para o cálculo das probabilidades se calcular a probabilidade condicional. No exemplo, pode-se querer avaliar a probabilidade do evento A condicionada à ocorrência do evento B. Em símbolos, 46 Probabilidade e Estatística Luiz Roberto designa-se por P(A/B) e lê-se: “probabilidade do evento A condicionada à ocorrência de B”, ou melhor, “probabilidade de A dado B”. Assim: P(A/B) = 1/3. Obs: dada a ocorrência de um evento, teremos a redução do espaço-amostra; no caso, ` = {1, 2, 3, 4, 5, 6} foi reduzido para = {1, 3, 5} e é neste espaço-amostra reduzido que se avalia a probabilidade do vento. Definição: Dados dois eventos, A e B, denota-se P(A/B) a probabilidade condicionada do evento A, quando B tiver ocorrido, por: P(A/B) = com P(B) ≠ 0, pois B já ocorreu P(A I B) P(B) Vamos encontrar uma fórmula para o cálculo da probabilidade condicional: P(A/B) = P(A I B) P(B) NCF(A I B) NTC = = NCF(A NCF(B) I B) NTC = Número total de casos NCF (B) NTC Desta maneira, para calcular a probabilidade de A dado B, basta contar o número de casos favoráveis ao evento A I B: [NCF(A I B)] e dividir pela quantidade de casos favoráveis ao evento B: [NCF(B)]. Exemplo: Dois dados são lançados. Consideremos os eventos: A = {(X1, X2)/ X1 + X2 = 10} e B = {(X1, X2)/ X1 > X2} Onde X1 é o resultado do dado 1 e X2 é o resultado do dado 2. Calcular P(A); P(B); P(A/B); P(B/A) Solução (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) Ω = (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) P(A) = NCF ao evento A = NTC P(A/B) = NCF a (A I B) NTC a B = 3 36 1 3 47 = 1 12 Obs: apenas o par (6,4) é favorável ao evento (A I B). Probabilidade e Estatística 4 Luiz Roberto ESTATÍSTICA BÁSICA 4.4 CONCEITOS FUNDAMENTAIS A Estatística pode ser encarada como uma ciência ou como um método de estudo. Duas concepções para a palavra ESTATÍSTICA: a) no plural (estatísticas), indica qualquer coleção consistente de dados numéricos, reunidos com a finalidade de fornecer informações acerca de uma atividade qualquer. Por exemplo, as estatísticas demográficas referem-se aos dados numéricos sobre nascimentos, falecimentos, matrimônios, desquites, etc. b) no singular (estatística), indica um corpo de técnicas, ou ainda uma metodologia técnica desenvolvida para a coleta, a classificação, a apresentação, a análise e a interpretação de dados quantitativos e a utilização desses dados para a tomada de decisões. Qualquer ciência experimental não pode prescindir das técnicas proporcionadas pela Estatística, como por exemplo, a Física, a Biologia, a Administração, a Economia, etc. Todos esses ramos de atividade profissional tem necessidade de um instrumental que se preocupa com o tratamento quantitativo dos fenômenos de massa ou coletivos, cuja mensuração e análise requerem um conjunto de observações de fenômeno ou particulares. DEFINIÇÃO DE ESTATÍSTICA Estatística é a ciência que se preocupa com a coleta, a organização, descrição (apresentação), análise e interpretação de dados experimentais e tem como objetivo fundamental o estudo de uma população. Este estudo pode ser feito de duas maneiras: • Investigando todos os elementos da população ou • Por amostragem, ou seja, selecionando alguns elementos da população. 48 Probabilidade e Estatística Luiz Roberto Planejamento Modelagem Formulação e análise do Problema Experimentação Coleta de dados Formulação do modelo conceitual Tradução do modelo Experimentação Verificação e validação do modelo Análise estatística dos resultados Coleta de macro informações 4.5 Conclusão Planejamento do projeto Projeto experimental Comparação e identificação das melhores soluções Documentação Apresentação dos resultados Implementação DIVISÃO DA ESTATÍSTICA Métodos Estatísticos Estatística Descritiva Estatística Inferencial Estatística Descritiva: é aquela que se preocupa com a coleta, organização, classificação,apresentação, interpretação e analise de dados referentes ao fenômeno através de gráficos e tabelas além de calcular medidas que permita descrever o fenômeno. Estatística Indutiva (Amostral ou Inferencial): é a aquela que partindo de uma amostra, estabelece hipóteses, tira conclusões sobre a população de origem e que formula previsões fundamentando-se na teoria das probabilidades. A estatística indutiva cuida da análise e interpretação dos dados. O processo de generalização do método indutivo está associado a uma margem de incerteza. Isto se deve ao fato de que a conclusão que se pretende obter para o conjunto de todos os indivíduos analisados quanto a determinadas características comuns baseia-se em uma parcela do total de observações. 49 Probabilidade e Estatística Luiz Roberto População? Envolve: • Estimação • Teste de Hipótese Propósito: • Tomar Decisões sobre as características da População População Estimativas & testes Estatística Amostral ( X ) Amostra 4.6 POPULAÇÃO É o apresentam conjunto, em finito comum ou infinito, determinadas de indivíduos características ou objetos definidas, que cujo comportamento interessa analisar. A população é estudada em termos de observações de características nos indivíduos (animados ou inanimados) que sejam relevantes para o estudo, e não em termos de pessoas ou objetos em si. O objetivo é tirar conclusões sobre o fenômeno em estudo, a partir dos dados observados. Como em qualquer estudo estatístico temos em mente estudar uma ou mais características dos elementos de uma população, é importante definir bem essas características de interesse para que seja delimitado os elementos que pertencem à população e quais os que não pertencem. 50 Probabilidade e Estatística Luiz Roberto Exemplos: 1. Estudar os filhos tidos, tipo de moradia, condições de trabalho, tipo de sanitário. Números de quartos para dormir, estado civil, uso da terra, tempo de trabalho, local de nascimento, tipo de cultivo, etc., dos agricultores do Estado do Amazonas. População: Todos os agricultores (proprietários de terra ou não) plantadores das culturas existentes no Estado do Amazonas. 2. Estudar a precipitação pluviométrica anual (em mm) na cidade de Manaus. População: Conjunto das informações coletadas pela Estação Pluviométrica, durante o ano. 4. As alturas dos cidadãos do Amazonas constituem uma população ou a população dos pesos desses cidadãos. População Dados Amostragem Estatística Descritiva Estatística Inferencial (Probabilidade) Divisão Da População - População Finita: apresenta um número limitado de elementos. É possível enumerar todos os elementos componentes. Exemplos: 1. Idade dos universitários do Estado do Pará. População: Todos os universitários do Estado do Pará. - População Infinita: apresenta um número ilimitado de elementos. Não é possível enumerar todos os elementos componentes. Entretanto, tal definição existe apenas no campo teórico, uma vez que, na prática, nunca encontraremos populações com infinitos elementos, mas sim, 51 Probabilidade e Estatística Luiz Roberto populações com grande número de componentes; e nessas circunstâncias, tais populações são tratadas como se fossem infinitas. Exemplos: 1. Tipos de bactérias no corpo humano População: Todas as bactérias existentes no corpo humano. 2. Comportamento das formigas de certa área População: Todas as formigas da área em estudo. 4.4 AMOSTRAGEM É a coleta das informações de parte da população, chamada amostra (representada por pela letra “n”), mediante métodos adequados de seleção destas unidades. 4.5 AMOSTRA É uma parte (um subconjunto finito) representativa de uma população selecionada segundo métodos adequados. O objetivo é fazer inferências, tirar conclusões sobre populações com base nos resultados da amostra, para isso é necessário garantir que amostra seja representativa, ou seja, a amostra deve conter as mesmas características básicas da população, no que diz respeito ao fenômeno que desejamos pesquisar. O termo indução é um processo de raciocínio em que, partindo-se do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade no todo. Ao induzir estamos sujeitos a erros. Entretanto, a Estatística Indutiva, que obtém resultados sobre populações a partir das amostras, diz qual a precisão dos resultados e com que probabilidade se pode confiar nas conclusões obtidas. 4.6 CENSO É o exame completo de toda população. Quanto maior a amostra, mais precisas e confiáveis deverão ser as induções feitas sobre a população. Logo, os resultados mais perfeitos são obtidos pelo Censo. Na prática, esta conclusão muitas vezes não acontece: o emprego de amostras, com certo rigor técnico, pode levar a resultados mais 52 Probabilidade e Estatística Luiz Roberto confiáveis ou até mesmo melhores do que os que seriam obtidos através de um Censo. As razões de se recorrer a amostras são: menor custo e tempo para levantar dados; melhor investigação dos elementos observados. 4.7 TIPOS DE VARIÁVEIS Variável Qualitativa Quando seus valores são expressos por atributos ou qualidade. Exemplos: 1) População: Estudantes universitários do Estado do Pará. Variáveis: sexo, profissão, escolaridade, religião, meio onde vivem (rural, urbano). 2) População: População dos bairros periféricos do município de Belém. Variáveis: tipo de casa, existência de água encanada (sim, não), bairro de origem. Variáveis qualitativas que não são ordenáveis recebem o nome de nominais. Exemplo: religião, sexo, raça, cor. Raça do AM - 2005 Raça Freqüência Branca Negra Parda Outra Total Fonte: Fictícia Variáveis qualitativas que são ordenáveis recebem o nome de ordinais. Exemplo: nível de instrução, classe social. Classe social Classe social do AM - 2005 Freqüência Classe A Classe B Classe C Classe D Total Fonte: Fictícia 53 Probabilidade e Estatística Luiz Roberto Variável Quantitativa Quando seus valores são expressos por números. Esses números podem ser obtidos por um processo de contagem ou medição. Exemplos: 1) População: Todos os agricultores do Estado do Pará. Variáveis: número de filhos tidos, extensão da área plantada, altura, idade. 2) População: População dos bairros periféricos do município de Belém Variáveis: número de quartos, área da casa em m2, número de moradores. A VARIÁVEL QUANTITATIVA DIVIDE-SE EM: a. Variável Discreta: são aquelas que podem assumir apenas valores inteiros em pontos da reta real. É possível enumerar todos os possíveis valores da variável. Exemplos: . População: Universitários do Estado do Pará. Variáveis: número de filhos, número de quartos da casa, número de moradores, número de irmãos. b. Variável Contínua: são aquelas que podem assumir qualquer valor num certo intervalo (contínuo) da reta real. Não é possível enumerar todos os possíveis valores. . População: Todos os agricultores do Estado do Pará. Variáveis: idade, renda familiar; extensão da área plantada (em m2 ) , peso e altura das crianças agricultoras. 4.8 DEFINIÇÃO DO PROBLEMA A primeira fase do trabalho estatístico consiste em uma definição ou formulação correta do problema a ser estudado e a seguir escolher a natureza dos dados. Além de considerar detidamente o problema objeto de estudo o 54 Probabilidade e Estatística Luiz Roberto analista deverá examinar outros levantamentos realizados no mesmo campo e análogos, uma vez que parte da informação de que necessita pode, muitas vezes, ser encontrada nesses últimos. Saber exatamente aquilo que pretende pesquisar é o mesmo que definir de maneira correta o problema. Por exemplo: - os preços dos produtos agrícolas produzidos no Estado do Pará são menores do que àqueles originados de outros Estados? - qual a natureza e o grau de relação que existe entre a distribuição da pluviosidade e a colheita do produto x? - estudar uma população por sexo: dividi-se os dois grupos em masculino e feminino; - estudar a idade dos universitários, por grupos de idade: distribui-se o total de casos conhecidos pelos diversos grupos etários pré-estabelecidos; - Analisar a capacidade de germinação de certo tipo de cereal: • Calcular a média, a mediana e a moda do número de sementes germinadas, ou seja, descrever com alguns valores resultados obtidos. • Representar graficamente os resultados. • Calcular a proporção de vasos com mais de três sementes germinadas. 4.9 DEFINIÇÃO DOS OBJETIVOS (GERAL E ESPECÍFICO) É definir com exatidão o que será pesquisado. É recomendável ter em vista um objetivo para o estudo, coletar o material em lugar de e definí-lo no decorrer do trabalho ou só no fim deste. Objetivos mais comuns em uma pesquisa: . Dados pessoais: grau de instrução, religião, nacionalidade, dados profissionais, familiares, econômicos, etc. . Dados sobre comportamento: como se comportam segundo certas circunstâncias. Ex: possível remanejamento da área habitada. . Opiniões, expectativas, níveis de informação, angústias, esperanças, aspirações sobre certos assuntos. . Dados sobre as condições habitacionais e de saneamento que avalie condições em que vivem e a qualidade de vida de certo grupo. 55 as Probabilidade e Estatística 4.10 Luiz Roberto PLANEJAMENTO Definição do Problema / Objetivos Planejamento da pesquisa Metodologia de estudo Coleta e crítica e apuração dos dados Apresentação dos dados Metodologia Estatística Análise e interpretação dos dados Resultados / Conclusões O problema está definido. Como resolvê-lo? Se através de amostra, esta deve ser significativa para que represente a população. O planejamento consiste em se determinar o procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto de estudo. Que dados deverão ser coletados? Como se deve obtê-los? É preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir. É nesta fase que será escolhido o tipo de levantamento a ser utilizado, que podem ser: a) levantamento censitário, quando a contagem for completa, abrangendo todo o universo; b) levantamento por amostragem, quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa fase são o cronograma das atividades, através do qual são fixados os prazos para as várias fases, os custos envolvidos, o exame das informações disponíveis, o delineamento da amostra, a forma como serão coletados os dados, os setores ou áreas de investigação, o grau de precisão exigido e outros. 4.11 COLETA DOS DADOS Refere-se a obtenção, reunião e registro sistemático de dados, com o objetivo determinado. 56 Probabilidade e Estatística Luiz Roberto A escolha da fonte de obtenção dos dados está diretamente relacionada ao tipo do problema, objetivos do trabalho, escala de atuação e disponibilidade de tempo e recursos. a) Fontes primárias: é o levantamento direto no campo através de mensurações diretas ou de entrevistas ou questionários aplicados a sujeitos de interesse para a pesquisa. Vantagens: grau de detalhamento com respeito ao interesse dos quesitos levantados; maior precisão das informações obtidas. b) Fontes secundárias: quando são publicados ou registrados por outra através documentos organização. A coleta de dados secundários se realiza de cartográficos (mapas, cartas, imagens e fotografias obtidas por sensor remoto ou por fotogrametria e imagens de radar). Estas fontes de informação são de extrema importância. Das fotografias aéreas em escalas reduzidas ou mais detalhadas, das imagens de radares ou satélite e de cartas obtêm-se informações quanto ao uso do solo, drenagem, estruturas viárias e urbanas, povoamento rural, recursos florísticos, minerais e pedológicos, estrutura fundiária e de serviços, dados altimétricos, etc. Vantagens: inclui um processo de redução e agregação de informações. A coleta dos dados pode ser feita de forma direta ou indireta. 4.12 CRÍTICA DOS DADOS A crítica dos dados deve ser feita com cuidado através de um trabalho de revisão e correção, ao qual chamamos de crítica (consistência), a fim de não de incorrer em erros que possam afetar de maneira sensível os resultados. As perguntas dos questionários uniformemente mal compreendidas, os enganos evidentes, tais como somas erradas, omissões, trocas de respostas e etc, são fáceis de corrigir. É necessário, entretanto, que o crítico não faça a correção por simples suposição sua, mas sim que tenha chegado a conclusão absoluta do engano. Quelet dividiu a crítica em: externa e interna. A crítica externa refere-se as imperfeições porventura existentes na coleta dos dados, por deficiência do observador, por imperfeição do instrumento de trabalho, por erro de registro nas fichas, imprecisão nas respostas aos quesitos propostos e outros fatores de erro que justificam um 57 Probabilidade e Estatística Luiz Roberto verificação minuciosa dos dados coletados antes de iniciar a elaboração do trabalho de análise. A crítica informações interna obtidas. É diz respeito mister a examinar verificação as da respostas exatidão dadas, das sanando imperfeições e omissões, de forma que os dados respondam com precisão aos quesitos formulados. As informações relativas a profissão não devem ser vagas como, por exemplo: operário, mas sim, oleiro, pedreiro, carpinteiro, etc., conforme o caso. O estado civil será declarado: solteiro, casado, viúvo ou desquitado. Em resumo, os dados devem sofrer uma crítica criteriosa com o objetivo de afastar os erros tão comuns nessa natureza de trabalho. As informações inexatas ou omissas devem ser corrigidas. Os questionários devem voltar a fonte de origem sempre que se fizerem necessário sua correção ou complementação. 4.13 APURAÇÃO (ARMAZENAMENTO) DOS DADOS É um processo de apuração ou sumarização que consiste em resumir os dados através de sua contagem ou agrupamento. É um trabalho de condensação e de tabulação dos dados, que chegam ao analista de forma desorganizada. Através da apuração, se tem a oportunidade de condensar os dados de modo a obter um conjunto compacto de números, o qual possibilita distinguir melhor o comportamento do fenômeno na sua totalidade. Os dados de fenômenos geográficos podem ser organizados em mapas, tabelas, matrizes, disquetes ou fitas. 4.14 EXPOSIÇÃO OU APRESENTAÇÃO DOS DADOS Há duas formas de apresentação que não se excluem mutuamente: Apresentação Tabular É uma apresentação numérica dos dados. Consiste em dispor os dados em linhas e colunas distribuídos de modo ordenado, segundo algumas regras práticas adotadas pelo Conselho Nacional de Estatística. As tabelas têm a vantagem de conseguir expor, sistematicamente em um só local, os resultados 58 Probabilidade e Estatística Luiz Roberto sobre determinado assunto, de modo a se obter uma visão global mais rápida daquilo que se pretende analisar. Apresentação Gráfica Constitui uma apresentação geométrica dos dados. Permite ao analista obter uma visão rápida e clara do fenômeno e sua variação. 4.15 ANÁLISE E INTERPRETAÇÃO DOS DADOS Nessa auxiliem etapa, o o interesse pesquisador estatísticos está a ligada maior resolver consiste seu essencialmente em tirar problema. ao A cálculo conclusões análise de dos medidas, que dados cuja finalidade principal é descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser expresso por número-resumo, as estatísticas, que evidenciam características particulares desse conjunto. 4.16 REGRAS DE ARREDONDAMENTO De acordo com as Normas de Apresentação Tabular - 3ª edição/1993 - da Fundação IBGE, o arredondamento é feito da seguinte maneira: 1. Se o número que vai ser arredondado for seguido de 0, 1, 2, 3 ou 4 ele deve ficar inalterado. Número a arredondar 6,197 12,489 20,733 35,992 Arredondamento para Inteiro Inteiro Décimos Centésimos Número arredondado 6 12 20,7 35,99 2. Se o número que vai ser arredondado for seguido de 5, 6, 7, 8 ou 9 ele deve ser acrescido de uma unidade. Número a arredondar 15,504 21,671 16,571 17,578 215,500 216,500 216,750 216,705 Arredondamento para Inteiro Inteiro Décimos Centésimos Inteiros inteiros décimos centésimos 59 Número arredondado 16 22 16,6 17,58 216 217 216,8 216,71 Probabilidade e Estatística Luiz Roberto OBS: Não faça arredondamento sucessivos Ex.: 17,3452 passa a 17,3 e não para 17,35 , para 17,4. Se houver necessidade de um novo arredondamento, voltar aos dados originais. Tabela 3.1: Produção de Café Brasil - 1978-1983 Anos Quantidade (1000 ton) 2535 2666 2122 3760 2007 2500 1978 (1) 1979 1980 1981 1982 1983 Fonte: Fictícia Nota: Produção destinada para o consumo interno. (1) Parte exportada para a Argentina. Denomina-se SÉRIE ESTATÍSTICA toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da ÉPOCA, do LOCAL, ou da ESPÉCIE (fenômeno). Numa série estatística observa-se a existência de três elementos ou fatores: o TEMPO, o ESPAÇO e a ESPÉCIE. Conforme varie um desses elementos, a série estatística classifica-se em TEMPORAL, GEOGRÁFICA e ESPECÍFICA. 4.17 SÉRIE TEMPORAL, HISTÓRICA OU CRONOLÓGICA É a série cujos dados estão em correspondência com o tempo, ou seja, variam com o tempo. Tabela 3.2: Produção Brasileira de Trigo 1988-1993 Quantidade Anos (1000 ton) 1988 (1) 2345 1989 2451 1990 2501 1991 2204 1992 2306 1993 2560 Fonte: IBGE Nota: Produção voltada para o consumo interno. (1) Parte da produção exportada. . Elemento variável: tempo (fator cronológico) . Elemento fixo: local (fator geográfico) e o fenômeno (espécie) 60 Probabilidade e Estatística 4.18 Luiz Roberto GRÁFICOS ESTATÍSTICOS A Estatística Descritiva pode descrever os dados através de gráficos. A apresentação gráfica é um complemento importante da apresentação tabular. A vantagem de um gráfico sobre a tabela está em possibilitar uma rápida impressão visual da distribuição dos valores ou das freqüências observadas. Os gráficos propiciam uma idéia inicial mais satisfatória da concentração e dispersão dos valores, uma vez que através deles os dados estatísticos se apresentam em termos de grandezas visualmente interpretáveis. REQUISITOS FUNDAMENTAIS EM UM GRÁFICO: a. Simplicidade: possibilitar a análise rápida do fenômeno observado. Deve conter apenas o essencial. b. Clareza: possibilitar a leitura e interpretações correta dos valores do fenômeno. c. Veracidade: deve expressar a verdade sobre o fenômeno observado. TIPOS DE GRÁFICOS QUANTO A FORMA: a. Diagramas: gráficos geométricos dispostos em duas dimensões. São mais usados na representação de séries estatísticas. b. Cartogramas: é a representação sobre uma carta geográfica, sendo muito usado na Geografia, História e Demografia. c. Estereogramas: representam volumes e são apresentados em três dimensões. d. Pictogramas: a representação gráfica consta de figuras representativas do fenômeno. Desperta logo a atenção do público. CLASSIFICAÇÃO DOS GRÁFICOS QUANTO AO OBJETIVO Gráficos de informação O objetivo é proporcionar uma visualização rápida e clara da intensidade das categorias ou dos valores relativos ao fenômeno. São gráficos tipicamente expositivos, devendo ser o mais completo possível, dispensando comentários explicativos. 61 Probabilidade e Estatística Luiz Roberto Características: - deve conter título em letra de forma; - as legendas podem ser omitidas, desde que as informações presentes possibilitem a interpretação do gráfico. Gráficos de análise Estes gráficos fornecem informações importantes na fase de análise dos dados, sendo também informativos. Os gráficos de análise, geralmente, vêm acompanhado de uma tabela e um texto onde se destacam os pontos principais revelados pelo gráfico ou pela tabela. 4.19 PRINCIPAIS TIPOS DE GRÁFICOS 4.19.1 GRÁFICOS EM CURVAS OU EM LINHAS São usados para representar séries temporais, principalmente quando a série cobrir um grande número de períodos de tempo. Considere a série temporal: Tabela 4.1 Produção de Arroz do Município X - 1984-1994 Quantidade Anos (1000 ton) 1984 816 1985 904 1986 1.203 1987 1.147 1988 1.239 1989 1.565 1990 1.620 1991 1.833 1992 1.910 1993 1.890 1994 1.903 Fonte: Fictícia 62 Probabilidade e Estatística Luiz Roberto Gráfico 4.1. Produção de Arroz do Município X - 1984-1994 (1000 ton) 2500 2000 1500 1000 500 0 84 4.19.2 É 85 86 87 88 89 90 91 92 93 94 GRÁFICOS EM COLUNAS a representação de uma série estatística através de retângulos, dispostos em colunas (na vertical) ou em retângulos (na horizontal). Este tipo de gráfico representa praticamente qualquer série estatística. As regras para a construção são as mesmas do gráfico em curvas. As bases das colunas são iguais e as alturas são proporcionais aos respectivos dados. Exemplo: Tabela 4.2 Produção de Soja do Município X - 1991-1995 Quantidade Anos (ton.) 1991 117.579 1992 148.550 1993 175.384 1994 220.272 1995 265.626 Fonte: Secretaria Municipal de Agricultura Para cada ano é construída uma coluna, variando a altura (proporcional a cada quantidade). As colunas são separadas uma das outras. Observação: O espaço entre as colunas pode variar de 1/3 a 2/3 do tamanho da base da coluna. 63 Probabilidade e Estatística Luiz Roberto Toneladas Gráfico 4.2. Produção de Soja do Município X - 1991-1995 300000 250000 200000 150000 100000 50000 0 1991 1992 1993 1994 1995 Uso do gráfico em colunas para representar outras séries estatísticas Tabela 4.3 Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966 Regiões Fisiográficas Área (Km2) Norte 3.581.180 Nordeste 965.652 Sudeste 1.260.057 Sul 825.621 Centro-oeste 1.879.965 Brasil 8.511.965 Fonte: IBGE. Grafico 4.3. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966. Km2 4.000.000 3.500.000 3.000.000 2.500.000 2.000.000 1.500.000 1.000.000 500.000 0 Norte Nordeste Sudeste Sul Centro-Oeste Obs: Na tabela as regiões são apresentadas em ordem geográficas. No gráfico as colunas são ordenadas pela altura, da maior para a menor, da esquerda para a direita. 64 Probabilidade e Estatística 4.19.7 Luiz Roberto GRÁFICOS EM BARRAS As alturas dos retângulos são iguais e arbitrárias e os comprimentos são proporcionais aos respectivos dados. As barras devem ser separadas uma das outras pelo mesmo espaço de forma que as inscrições identifiquem as diferentes barras. O espaço entre as barras pode ser a metade (½) ou dois terços(2/3) de suas larguras. As barras devem ser colocadas em ordem de grandeza de forma decrescente para facilitar a comparação dos valores. A categoria “outros” (quando existir) são representadas na barra inferior, mesmo que o seu comprimento exceda o de alguma outra. Outra representação gráfica da Tabela 4.3: Grafico 4.4. Áreas (Km2) das Regiões Fisiográficas - Brasil - 1966. Norte Centro-Oeste Sudeste Nordeste Sul 0 00 00 00 00 00 00 00 00 .0 .0 .0 .0 .0 .0 .0 .0 0 0 0 0 0 0 0 0 Km2 00 00 50 50 50 00 00 50 1. 2. 2. 1. 3. 3. 4. Tabela 4.4 Matrícula no Ensino Superior, segundo os ramos de ensino -Brasil - 1995 Ramos de ensino Filosofia, Ciências e Letras Direito Engenharia Administração e Economia Medicina Odontologia Agricultura Serviço Social Arquitetura e Urbanismo Farmácia Demais ramos Total 65 Matrículas 44.802 36.363 26.603 24.027 17.152 6.794 4.852 3.121 2.774 2.619 11.002 180.109 Probabilidade e Estatística Luiz Roberto Grafico 4.5. Matrícula efetiva no Ensino Superior, segundo os ramos de ensino - Brasil - 1999. Filosofia, Ciências e Letras Direito Engenharia Administração e Econômia Medicina Odontologia Agricultura Serviço Social Arquitetura e Urbanismo Farmácia Demais ramos 0 0 00 10 00 50 0 00 15 0 00 20 0 00 40 0 00 35 0 00 30 0 00 25 0 00 45 Matrículas OBS: Quando a variável em estudo for qualitativa e os nomes das categorias for extenso ou as séries forem geográficas ou específicas é preferível o gráfico em barras, devido a dificuldade em se escrever a legenda em baixo da coluna. 4.19.8 É GRÁFICO EM COLUNAS MÚLTIPLAS (AGRUPADAS) um tipo de gráfico útil para estabelecer comparações entre as Gráfico de grandezas de cada categoria dos fenômenos estudados. A modalidade de apresentação das colunas é chamado de Colunas Remontadas. Ele proporciona economia de espaços sendo mais indicado quando a série apresenta um número significativo de categorias. Exemplo: Tabela 4.5 Entrada de migrantes em três Estados do Brasil - 1992-1994 Número de migrantes Anos Estados Total 1992 4.526 1993 4.633 1994 4.450 Fonte: Fictícia Amapá 2.291 2.456 2.353 66 São Paulo 1.626 1.585 1.389 Paraná 609 592 708 Quantidade Probabilidade e Estatística Luiz Roberto Gráfico 4.6. Entrada de migrantes em três Estados do Brasil 1992-1994. 2500 2000 1500 1000 500 0 1992 Amapá 4.19.9 1993 São Paulo Paraná 1994 GRÁFICO EM BARRAS MÚLTIPLAS (AGRUPADAS) Útil quando a variável for qualitativa ou os dizeres das categorias a serem escritos são extensos. Exemplo: Tabela 4.6 Importação de vinho e champanhe (BR) proveniente de várias origens - 1994 Países Importação (1.000 dólares) Vinho Champanhe 220 15 175 25 230 90 50 5 75 20 110 16 Portugal Itália França Argentina Chile Espanha Gráfico 4.7. Importação Brasileira de vinho e champanhe proveniente de várias origens 1994. França Portugal Itália Espanha Chile Argentina 0 50 100 Vinho 67 Champanhe 150 200 250 1000 dólares Probabilidade e Estatística 4.19.10 Luiz Roberto GRÁFICO EM SETORES É a representação gráfica de uma série estatística em um círculo de raio qualquer, por meio de setores com ângulos centrais proporcionais às ocorrências. É utilizado quando se pretende comparar cada valor da série com o total. O total da série corresponde a 360° (total de graus de um arco de circunferência). O gráfico em setores representam valores absolutos ou porcentagens complementares. As séries geográficas, específicas e as categorias em nível nominal são mais representadas em gráficos de setores, desde que não apresentem muitas parcelas (no máximo sete). Cada parcela componente do total será expressa em graus, calculada através de uma regra de três: Total Parte Exemplo: - 360° x° Tabela 4.7 Produção Agrícola do Estado A - 1995 Produtos Quantidade (t) Café 400.000 Açúcar 200.000 Milho 100.000 Feijão 20.000 Total 720.000 Fonte: Fictícia Gráfico 4.8. Produção Agrícola do Estado A - 1995. Milho 14% Feijão 3% Café 55% Açucar 28% Outras maneiras de representar graficamente a Tabela 4.7: 68 Probabilidade e Estatística Luiz Roberto Gráfico 4.9. Produção Agrícola do Estado A - 1995. Quantidade (t) 400.000 350.000 300.000 250.000 200.000 150.000 100.000 50.000 0 Café Açucar Milho Feijão Gráfico 4.10. Produção Agrícola do Estado A - 1995. Café Açucar Milho Feijão 0 00 .0 0 5 0 00 1 . 00 0 00 1 . 50 0 00 2 . 00 0 00 2 . 50 0 00 3 . 00 0 00 3 . 50 0 00 4 . 00 Quantidade (t) 4.20 DISTRIBUIÇÃO DE FREQÜÊNCIAS As tabelas estatísticas, geralmente, condensam informações de fenômenos que necessitam da coleta de grande quantidade de dados numéricos. No caso das distribuições de freqüências que é um tipo de série estatística, os dados referentes ao fenômeno objeto de estudo se repetem na maioria das vezes sugerindo a apresentação em tabela onde apareçam valores distintos um dos outros. DISTRIBUIÇÃO DE FREQÜÊNCIA PARA DADOS AGRUPADOS É a série estatística que condensa um conjunto de dados conforme as freqüências ou repetições de seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as freqüências correspondentes. Os elementos 69 Probabilidade e Estatística época, local e fenômeno Luiz Roberto são fixos. O fenômeno apresenta-se através de gradações, ou seja, os dados estão agrupados de acordo com a intensidade ou variação quantitativa gradual do fenômeno. REPRESENTAÇÃO DOS DADOS AMOSTRAIS OU POPULACIONAIS a. Dados brutos: são aqueles que não foram numericamente organizados, ou seja, estão Tabela 2 6 1 3 3 na forma com que foram coletados. 4.1 - Número de filhos 3 0 2 1 1 4 4 1 3 1 3 5 0 4 1 de um grupo de 50 casais 1 1 1 3 0 1 5 6 1 7 6 2 7 1 3 1 2 2 1 2 2 0 0 1 3 5 2 1 0 2 b. Rol: é a organização dos dados brutos em ordem de grandeza crescente ou decrescente. Tabela 4.2 - Número de filhos de um grupo de 50 casais 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 5 5 5 6 6 6 1 1 2 3 7 1 1 2 4 7 A simples observação dos dados brutos apresentados na Tabela 4.1 não nos permite explicar o comportamento das variáveis em estudo. Um primeiro passo a ser dado, na obtenção de informações mais resumidas e precisas a respeito do comportamento das variáveis, é a construção de tabelas de freqüência. Para cada variável estudada, contamos o número de vezes que ocorre cada uma das suas realizações (ou valores). O número obtido é chamado freqüência absoluta e indicado por ni (cada realização de uma variável apresenta um valor para n). Considerando as realizações da variável “número de filhos”, temos os seguintes valores de ni (conforme Tabela 4.2): O filhos: 6 4 filhos: 3 1 filho: 16 5 filhos: 3 2 filhos: 9 6 filhos: 3 3 filhos: 8 7 filhos: 2 70 Probabilidade e Estatística Luiz Roberto c. Distribuição de freqüências: é a disposição dos valores com as respectivas freqüências. O número levantamento qualquer, de é observações chamado ou repetições freqüência desse de um valor. valor, Uma em um tabela de freqüências é aquela onde se procura fazer corresponder os valores observados da variável em estudo e as respectivas freqüências. Freqüência absoluta (Fi): a freqüência absoluta não é uma medida muito eficiente para a análise dos dados, especialmente nos caso em que se deseja comparar a distribuição de uma mesma variável ao longo de populações diferentes (poderíamos estar interessados em comparar o número de filhos em vários países africanos). Assim, precisamos definir uma medida que leve em, consideração o número total de observações colhidas. Freqüência relativa (fi): Para isso, definimos a freqüência relativa (fi) como a razão entre a freqüência absoluta (Fi) e o número total de observações n, isto é: fi = Como Fi ≤ n, segue que 0 ≤ Fi n fi ≤ 1. Por esse motivo, é comum expressar fi em porcentagem. Para expressar o resultado em termos percentuais, multiplica-se o quociente obtido por 100. Em % = fi = Fi n . 100 Obs 1: a soma das freqüências relativas de uma tabela de freqüência é sempre igual a 1,00 : ∑fi = 1,00. Obs 2: a soma das freqüências relativas percentuais de uma freqüência é sempre igual a 100%. c.1. Distribuição de freqüências para variável discreta Os dados não são agrupados em classes: Tabela 4.4 - Número de filhos de um grupo de 50 casais 71 tabela de Probabilidade e Estatística Variável N° filhos (xi) 0 1 2 3 4 5 6 7 Total (∑) Luiz Roberto Freqüência absoluta: Numero de casais (Fi) 6 16 9 8 3 3 3 2 50 Freqüência relativa (fi) Porcentagem 6/50 = 0,12 16/50 = 0,32 9/50 = 0,18 8/50 = 0,16 3/50 = 0,06 3/50 = 0,06 3/50 = 0,06 2/50 = 0,04 1,00 12% 32% 18% 16% 6% 6% 6% 4% 100% Obs: 1. X: representa a variável Número de filhos. 2. xi: representa os valores que a variável assume. 3. Fi: é o número de vezes que cada valor aparece no conjunto de dados (freqüência absoluta). 4. fi: representa a freqüência relativa 5. ∑ni = n = 50 : tamanho da amostra (ou nº de elementos observados). c.2. Distribuição de freqüências para variável contínua Os dados da variável são agrupados em classe (grupo de valores). 1. Dados brutos Tabela 4.5 - Taxas municipais de urbanização (em %) no Estado 8 24 46 13 38 54 44 20 18 15 30 24 20 8 24 18 38 79 15 62 23 13 62 18 11 17 9 35 23 22 37 36 10 6 92 16 15 23 37 36 44 17 9 30 26 18 37 43 28 41 42 35 35 42 71 50 19 7 28 23 29 29 58 77 12 40 25 7 32 34 22 7 9 16 31 30 de AL - 2000 17 14 9 10 8 22 8 13 8 13 14 9 52 17 72 34 44 15 2. Rol Tabela 4.6 - Rol das taxas municipais de urbanização, 6 6 7 7 7 8 8 9 9 9 9 10 10 11 13 13 14 14 14 15 15 16 17 17 17 17 18 18 20 20 22 22 22 23 23 24 24 25 26 28 28 29 30 31 32 34 34 34 35 37 37 38 38 40 41 42 44 44 46 50 52 54 58 72 77 79 92 72 em AL (em %) - 2000. 8 8 9 12 13 13 15 15 16 18 18 19 23 23 24 29 30 30 35 35 36 42 43 44 62 62 71 Probabilidade e Estatística Luiz Roberto 3. Distribuição de freqüências para dados agrupados em classes Tabela 4.7 - Taxas municipais de urbanização, no Estado de AL (em %) - 2000. Freqüência absoluta: Taxas (em %) Número de municípios(Fi) 6 --- 16 29 16 --- 26 24 26 --- 36 16 36 --- 46 13 46 --- 56 4 56 --- 66 3 66 --- 76 2 76 --- 86 2 86 --- 96 1 94 Total (∑) Obs: recomenda-se agrupar os valores observados em classes, tanto para variáveis contínuas quanto para discretas. Assim, evita-se grande extensão da tabela e a não interpretação dos valores de fenômeno. ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA a. Amplitude total (AT): é a diferença entre o maior e o menor valor observado no experimento. No exemplo, tabela 4.6, AT = 92 - 6 = 86 b. Amplitude da classe (Ac): é a diferença entre o maior e o menor valor da classe. No exemplo, tabela 4.7, Ac = 16 - 6 = 10 ou 36 – 26 = 10. Devemos procurar construir classes de mesma amplitude para que não haja comprometimento na análise. c. Classe: é cada um dos grupos de valores do conjunto de valores observados, ou seja, são os intervalos de variação da variável. Identifica-se uma classe pelos seus extremos ou pela ordem em que se encontra na tabela. 6 --- 16 (1ª classe); 86 --- 96 (7ª classe) Formas de expressar os limites das classes 20 ├--┤ 23: compreende todos os valores entre 20 e 23, inclusive os extremos. 20 ├---- 23: compreende todos os valores entre 20 e 23, excluindo o 23. 20 ----┤ 23: compreende todos os valores entre 20 e 23, excluindo o 20. 20 ----- 23: compreende todos os valores entre 20 e 23, excluindo os extremos. 73 Probabilidade e Estatística 4.21 Luiz Roberto DISTRIBUIÇÕES CUMULATIVAS Freqüência absoluta acumulada (Fac) É a soma das freqüências de valores inferiores ou iguais ao valor dado. Exemplo: xi Fi Fac 0 5 5 1 7 12 2 2 14 ∑ 14 Se quisermos incluir a freqüência relativa (fi= xi Fi Fac fi 0 5 5 5/14 1 7 12 7/14 = 1/2 2 2 14 2/14 = 1/7 ∑ 14 Fi ) nesta tabela: n 1 Pontos médios das classes È a média aritmética entre o limite superior e o limite inferior da classe. Assim, se a classe for 10-12, teremos: Xi = 10 + 12 = 11 2 Histograma É a representação gráfica de uma distribuição de freqüência por meio de retângulos justapostos. Polígono de freqüência É a representação gráfica de uma distribuição de freqüência por meio de um polígono. 74 Probabilidade e Estatística Luiz Roberto Fi Exemplo: Idade Fi 2-4 3 4-6 5 6-8 10 8-10 6 10-12 2 ∑ 26 10 9 8 7 6 5 4 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 limite das classes 4.22 MEDIDAS DE POSIÇAO (ou DE TENDÊNCIA CENTRAL) As distribuições de freqüências para variáveis discretas e contínuas descrevem os grupos que uma variável pode assumir. É possível visualizar a concentração de valores de uma distribuição de freqüências. Se se localizam no início, no meio ou no final, ou se distribuem de forma igual. As medidas de posição são chamadas de medidas de tendência central, devido à tendência dos dados observados se concentrarem em torno desses valores centrais que se localizam em torno do centro de uma distribuição. As medidas (número-resumo) mais usadas para representar um conjunto de dados são a média, a moda e a mediana. 75 Probabilidade e Estatística 4.22.1 Luiz Roberto Média Aritmética 16 Médias amostrais Distribuição amostral 1ª 2ª Obs. Obs 1 2 3 4 1 1,0 1,5 2,0 2,5 .3 2 1,5 2,0 2,5 3,0 .2 3 2,0 2,5 3,0 3,5 .1 4 2,5 3,0 3,5 4,0 .0 Histograma ־ X 1,0 1,5 2,0 2,5 3,0 3,5 4,0 Média aritmética – para dados não-agrupados (ou dados simples) Seja X uma variável que assume os valores x1, x2, x3 ,..., xn. A média aritmética simples de X, representada por x, é definida por: n x1 + x2 + x3 + ... + xn = ∑ xi = n ∑ xi i =1 ou simplesmente n X = ∑x n xi : são os valores que a variável X assume n: número de elementos da amostra observada Exemplo: A produção leiteira diária da vaca V, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produção média da semana (a média aritmética). ∑ xi = x1 + x2 + x3 + ... + xn n = 10 + 15 + 14 + 13 + 16 + 19 + 18 7 = 15 litros Média aritmética – para dados agrupados Se os valores da variável forem agrupados em uma distribuição de freqüências será usada a média aritmética dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas freqüências absolutas: F1, F2, F3 ,..., Fn. 76 Probabilidade e Estatística Luiz Roberto N X= ∑ xiFi ou I =1 n X= ∑ Fixi n A fórmula acima será usada para as distribuições de freqüências sem classes e com classes. Média aritmética para dados agrupados sem classes (Média aritmética ponderada) Tabela 4.4 - Número de filhos de um grupo de 50 casais Número de Numero filhos de casais Fi . xi (xi) (Fi) 0 6 ∑ Fixi X = = 1 16 n 2 9 3 8 4 3 5 3 X = 2,3 filhos 6 3 7 2 50 Total (∑) Os 50 casais possuem, em média 2,3 filhos. 117 50 = 2,34 Média aritmética para dados agrupados com classes intervalares (Dados com classes): Determinar a média aritmética da Tabela 4.7 Tabela 4.7 - Taxas municipais de urbanização, no Estado AL (em %) 1970. Número de Municípios xi Taxas (em %) xi . Fi (Fi) 6 --- 16 29 16 --- 26 24 26 --- 36 16 36 --- 46 13 46 --- 56 4 56 --- 66 3 66 --- 76 2 76 --- 86 2 86 --- 96 1 94 Total (∑) X = ∑ Fixi n = __________ → X = 77 Probabilidade e Estatística Luiz Roberto Propriedades da média aritmética 1ª propriedade A soma algébrica dos desvios em relação à média é zero (nula). ∑ di = ∑ (xi - x) = 0 ; onde: di são as distâncias ou afastamentos da média. Em uma distribuição simétrica, a soma algébrica dos desvios em relação à média será igual a zero; e tenderá a zero se a distribuição for assimétrica. Idades (xi) 2 4 6 8 10 ∑ d1 d2 d3 d4 d5 = = = = = di = xi 2 – 6 = 4 – 6 = 6 – 6 = 8 – 6 = 10 – 6 = x -4 -2 0 +2 +4 0 X = 2 + 4 + 6 + 8 + 10 5 = 2ª propriedade Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma variável, a média do conjunto fica aumentada ou diminuída dessa constante. Somar o valor 2 aos dados da tabela e calcular a nova média Idades (xi) 2 4 6 8 10 ∑ A nova média será: X = xi + 2 + 2 = 4 + 2 = 6 + 2 = 8 + 2 = 10 + 2 = 2 4 6 8 10 12 40 40 = 8. 5 No caso, a média aritmética anterior ficou aumentada de 2. 3ª propriedade Multiplicando-se ou dividindo-se todos os valores de uma variável por uma constante (c), a média do conjunto fica multiplicada ou dividida por essa constante: Multiplicar o valor 2 aos dados da tabela e calcular a nova média Idades (xi) 2 4 6 8 10 ∑ xi x 2 x 2 = 4 x 2 = 6 x 2 = 8 x 2 = 10 x 2 = 78 2 4 8 12 16 20 60 6 Probabilidade e Estatística A nova média é: X = 4.22.2 Luiz Roberto 60 = 12. A média aritmética ficou multiplicada por 2. 5 Esperança matemática Esperança Matemática ou Média de uma variável aleatória discreta é definida: E[X] = µx = µ = ∑x P(xi) i Exemplo: E = lançamento de um dado X = ponto obtido: 1, 2, 3, 4, 5, 6 P(X) = 1 1 1 1 1 1 , , , , , 6 6 6 6 6 6 E(X) = 1 . 4.22.3 1 1 1 1 1 1 +2. +3. 4. +5. +6. = 3,5 6 6 6 6 6 6 Moda (Mo) Também chamada de norma, valor dominante ou valor típico. Define-se a moda como o valor que ocorre com maior freqüência em conjunto de dados. Exemplo: Se o salário modal dos empregados de uma empresa é igual a mil reais, este é o salário recebido pela maioria dos empregados dessa empresa. A moda é utilizada quando os dados estão na escala nominal. Exemplo: Sexo dos alunos – Turma A – Escola Z Sexo Freqüência Masculino 40 Feminino 60 Total 100 A moda é sexo feminino porque tem maior freqüência. Moda – para dados não agrupados Primeiramente os dados devem ser ordenados para , em seguida, observar o valor que tem maior freqüência. Exemplo: Calcular a moda dos seguintes conjuntos de dados: 79 Probabilidade e Estatística Luiz Roberto 1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) → Mo = 6 (o valor mais freqüente) Esse conjunto é unimodal, pois apresenta apenas uma moda. 2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) → Mo = 2 e Mo = 4 (valores mais freqüentes) Esse conjunto é bimodal, pois apresenta duas modas. 3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) → Mo = 2, Mo = 3 e Mo = 4 (valores mais freqüentes) Esse conjunto é plurimodal, pois apresenta mais de duas modas. 4. W = (1, 2, 3, 4, 5, 6) → Esse conjunto é amodal porque não apresenta um valor predominante. Moda – para dados agrupados sem classes Basta observar, na tabela, o valor que apresenta maior freqüência. 1º) Cálculo da moda pelo ROL Na Tabela 4.2, o resultado 1 aparece mais vezes → Mo =1. Tabela 4.2 - Número de filhos de um grupo de 50 casais 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7 2º) Cálculo da moda pela distribuição de freqüências sem classes Tabela 4.4 - Número de filhos de um grupo de 50 casais Número de filhos (xi) 0 1 2 3 4 5 6 7 Total (∑) Numero de casais (fi) 6 16 9 8 3 3 3 2 50 O valor 1 apresenta a maior freqüência. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado. 80 Probabilidade e Estatística Luiz Roberto Moda – para dados agrupados com classes Tabela 4.7 – Taxas municipais de urbanização (em %) – Alagoas, 1970. 1º passo: Identifica-se a classe de maior freqüência: Número de Taxas(%) A maior freqüência é 29 (1ª classe): 6 --- 16 Municípios (fi) 6 --- 16 16 --- 26 26 --- 36 36 --- 46 46 --- 56 56 --- 66 66 --- 76 76 --- 86 86 --- 96 Total (∑) 4.22.4 29 24 16 13 4 3 2 2 1 94 2º passo: Aplica-se a fórmula: Mo = Li + Ls 2 Li: limite inferior da classe modal = 6 Ls: limite superior da classe modal = 16 6 + 16 Mo = 2 = 11 Mediana (Md) É uma medida de posição cujo número divide um conjunto de dados em duas partes iguais. Por esse motivo, a mediana é considerada uma medida separatriz. Portanto, a mediana se localiza no centro de um conjunto de números ordenados segundo uma ordem de grandeza. Mediana - para dados não agrupados a) O número de valores b) O número de valores observados é par observados é impar Exemplo: Considere o conjunto de dados: Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) X = (5, 2, 7, 10, 3, 4, 1) 1º) Colocar os valores em ordem crescente ou decrescente: 1º) Colocar os valores em ordem X = (2, 3, 4, 6, 7, 8, 9, 10) crescente ou decrescente: 2º) Determinar a ordem ou posição (P) da X = (1, 2, 3, 4, 5, 7, 10) 2º) Determinar a ordem posição (P) da Mediana por ou P = n +1 , 2 7 +1 P = = 4 ==> 4ª posição. 2 4ª posição é o número 4. Mediana: P = P = n 2 e 8 = 4ª posição 2 P = e n + 1 , 2 P = 8 + 1 = 5ª 2 posição Os números são 6 (4ª posição) e 7 (5ª posição). Tira-se a média aritmética entre os dois números. Md = 4 Md = 6+7 2 81 = 6,5 Probabilidade e Estatística 4.22.5 Luiz Roberto Medidas de dispersão (Medidas de variabilidade) São medidas utilizadas para medir o grau de variabilidade, ou dispersão dos valores observados em torno da média aritmética. Servem para medir a representatividade da média e proporcionam conhecer o nível de homogeneidade ou heterogeneidade dentro de cada grupo analisado. Considere a seguinte situação: Um empresário deseja comparar a performance de dois empregados, com base na produção diária de determinada peça, durante cinco dias: Empregado A : 70, 71, 69, 70, 70 → x = 70 Empregado B : 60, 80, 70, 62, 83 → x = 71 A performance média do empregado A é de 70 peças produzidas diariamente, enquanto que a do empregado B é de 71 peças. Com base na média aritmética, verifica-se que a performance de B é melhor do que a de A. Porém, observando bem os dados, percebe-se que a produção de A varia apenas de 69 a 71 peças, ao passo que a de B varia de 60 a 83 peças, o que revela que a performance de A é bem mais uniforme do que de B. Qual o melhor empregado? Amplitude total (AT) É é a diferença entre o maior e o menor valor observado. AT = xmax − xmin Empregado A = 71 − 69 = 2 Empregado B = 83 − 60 = 23 Desvio médio (DM) Analisa todos os desvios ou distâncias em relação a média aritmética. O cálculo dos desvios feito por: di = A soma de todos os desvios em relação a média aritmética é igual a zero: (xi − X ) xi = valores observados ∑ di = ∑ (xi – X ) = 0 X = média aritmética 82 Probabilidade e Estatística Luiz Roberto Cálculo dos di: Empregado d1 = 70 – d2 = 71 – d3 = 69 – d4 = 70 – d5 = 70 – ∑ di = 0 A 70 70 70 70 70 = = = = = 0 +1 − 1 0 0 Empregado d1 = 60 – d2 = 80 – d3 = 70 – d4 = 62 – d5 = 83 – ∑ di = 0 B 71 71 71 71 71 Para eliminar a soma zero, coloca-se os desvios em módulo: Empregado B Empregado A = = = = = − 11 +9 − 1 − 9 +12 d1 = d2 = d3 = d4 = d5 = ∑ |0|=0 |+1| = 1 |−1|= 1 |0|=0 |0|=0 | di | = 2 d1 = d2 = d3 = |–11| |+9 | |–1 | |–9 | = 11 = 9 = 1 = 9 d4 = d5 = |+12 | = 12 ∑ | di | = 42 Dessa forma, é possível calcular a média dos desvios por: DM = ∑ | di | n = ∑ | xi − X | Empregado A n DM = 2 5 Empregado B DM = = 0,4 42 5 = 8,4 Com freqüência absoluta (Fi): DM = 4.22.6 ∑ | di | .Fi = n ∑ | xi − X |.Fi n Variância Considera-se o quadrado de cada desvio, (xi – X )2, evitando que Σ di = 0. Assim, a definição da variância populacional é dada por: σ= 2 ∑ (di)2.Fi n = ∑ (xi - X )2.Fi . n Trata-se da média aritmética dos quadrados dos desvios. σ2 Î indica a variância populacional e lê-se sigma ao quadrado. X Î indica a média da população. d1 d2 d3 d4 d5 Empregado A = (0)2 = 0 = (+1)2 = 1 = (−1)2 = 1 = (0)2 = 0 = (0)2 = 0 ∑ (di)2 = 2 d1 d2 d3 d4 d5 Empregado B Empregado A = (–11)2 = 121 2 = 0,4 σ2 = = (+9)2 = 81 5 = (−1)2 = 1 = (–9)2 = 81 = (+12)2 = 144 ∑ (di)2 = 428 83 Empregado B σ2 = 428 = 85,6 5 Probabilidade e Estatística Luiz Roberto Para o caso do cálculo da variância amostral, é conveniente o uso da seguinte fórmula: ∑ (xi - X)2.Fi . 2 S = As n −1 diferenças populacional entre ( σ2 ), as fórmulas utiliza-se a são: média para o populacional caso da (X ) variância tendo como denominador o tamanho da população (n). Para o cálculo da variância amostral (S2), utiliza-se a média amostral ( X ), tendo como denominador o tamanho da mostra menos um (n-1). Assim, podemos usar as fórmulas práticas para os cálculos das variâncias: σ2 = 1 ∑ xi 2 Fi − n (∑ (xiFi) 2 ) n S2 = 1 n −1 ∑ 2 xi Fi − (∑ (xiFi) 2 ) n que foram obtidas por transformação nas respectivas fórmulas originais. 4.22.7 Desvio-padrão É a raiz quadrada da variância. Na fórmula original para o cálculo da variância, observa-se que é uma soma de quadrados. Por exemplo, se a unidade original for metro (m) o resultado será metro ao quadrado (m2). Para retornar a unidade de medida original, extrai-se a raiz quadrada da variância, passando a chamar-se de desviopadrão. Desvio-padrão populacional σ σ = Desvio-padrão amostral s 2 = s2 Exemplo 1: Calcular o desvio-médio, a variância e o desvio padrão da seguinte distribuição amostral: xi Fi 5 2 7 3 8 5 1°) Cálculo do desvio médio: DM = ∑ | xi − X |.Fi n ou ∑ | di | .Fi n 84 9 4 11 2 Probabilidade e Estatística Luiz Roberto Primeiramente, precisa-se do valor da média: Fi 2 3 5 4 2 16 xi 5 7 8 9 11 ∑ xi . Fi 10 21 40 36 22 129 X = ∑ Fixi n = 129 = 8,06 16 Para o cálculo do DM , são abertas novas colunas, assim: xi Fi xi . Fi | xi − X | |di| Fi 5 7 8 9 11 2 3 5 4 2 16 10 21 40 36 22 129 | 5 - 8,06 | | 7 - 8,06 | | 8 - 8,06 | | 9 - 8,06 | | 11 - 8,06 | 6,12 3,18 0,30 3,76 5,88 19,24 ∑ Portanto, DM = ∑ | di | .Fi n = 19,24 = 1,20 16 2°) Cálculo da variância amostral: 2 S = 1 n −1 ∑ xi 2 ( ( xiFi) 2 ) ∑ Fi − n Observe que o cálculo será facilitado, pois n = 16 e ∑ xi Fi = 129. Falta encontrar ∑ xi2 Fi. Para isso, uma nova coluna é considerada na tabela. xi 5 7 8 9 11 ∑ Logo: S2 = Fi 2 3 5 4 2 16 xi2 Fi 10 147 320 324 242 1.083 xi . Fi 10 21 40 36 22 129 (129 )2 = 2,86 1 1083 − 16 − 1 16 Então, a variância amostral é S2 = 2,86. 85 Probabilidade e Estatística Luiz Roberto 3°) Cálculo do desvio padrão amostral: Como S = S2 Î 2,86 = 1,69. S = Resumindo: a distribuição possui uma média 8,06. Isto é, seus valores estão em torno de 8,06 a seu grau de concentração é de 1,2, medido pelo Desvio Médio, e de 1,69, medido pelo Desvio-Padrão. Exemplo 2: Dada a distribuição amostral abaixo, calcular a média, o desvio médio e o desvio padrão. Classes 2 ├---- 4 4 ├---- 6 Fi 2 4 6 ├---- 8 8 ├---- 10 10 ├---- 12 7 4 3 A construção da tabela auxiliar para os cálculos deve ser construída à medida que você for necessitando dos resultados parciais; a ordem das colunas não é importante. Eis a tabela auxiliar: |di| Fi X2 Fi - 7,2|= 4,2 8,4 18 |7 - 7,2|= 2,2 8,8 100 49 |8 - 7,2|= 0,2 1,4 343 4 36 |9 - 7,2|= 1,8 7,2 324 11 3 33 |11 - 7,2|= 3,8 11,4 363 ∑ 16 129 37,2 1.148 Classes xi Fi xi . Fi 2 ├---- 4 5 2 6 |3 4 ├---- 6 7 4 20 6 ├---- 8 8 7 8 ├---- 10 9 10 ├---- 12 ∑ X = | xi − X | 144 = 7,2 20 Logo: S2 = DM = 37,2 = 1,86 20 (144)2 = 5,86 1 1148 − 20 − 1 20 σ = 86 5,86 = 2,42 Probabilidade e Estatística Luiz Roberto Exemplo 3: Cálculo da variância populacional. Determinar a variância para a série: xi 2 3 5 6 7 Fi 1 4 5 3 2 Solução: A fórmula prática para calcular a variância popu8lacional é: ( xiFi) 2 1 2 2 xi Fi − σ = n (∑ ∑ ) n Será conveniente construir a seguinte tabela: xi Fi xi . Fi X2 Fi 2 1 2 4 3 4 12 36 5 5 25 125 6 3 18 108 7 2 14 98 ∑ 15 71 371 (71)2 = 2,33 1 371 − 15 15 σ2 = Desvio-padrão populacional: σ = 2,33 = 1,53 Exemplo 4: Cálculo da variância e do desvio-padrão para a Tabela 4.4 Tabela 4.4 - Número de filhos de um grupo de 50 casais N° filhos (xi) 0 1 2 3 4 5 6 7 ∑ N° casais (Fi) 6 16 9 8 3 3 3 2 50 xi . Fi xi2 Variância amostral: xi2. Fi S2 = 1 n −1 ∑ 2 xi Fi − (∑ (xiFi) 2 ) Desvio-padrão: s 117 87 = s2 n Probabilidade e Estatística 4.23 Luiz Roberto DISTRIBUIÇÕES DISCRETAS DE PROBABILIDADE 4.23.1 DISTRIBUIÇÃO DE “BERNOULLI” Suponhamos a realização de um experimento E, cujo resultado pode ser um sucesso (se acontecer o evento que nos interessa) ou um fracasso (o evento não se realiza). Seja x a variável aleatória: sucesso ou fracasso. X Î x1 = 1 (sucesso) ou x2 = 0 P(X) Î p (x1) = p Diz-se que esta (fracasso) p (x2) = 1 – p = q variável, assim definida, tem uma distribuição de “Bernoulli”. Suas principais características são: 1 Média: µ (X) = ∑ xi P(Xi) = 0 . p + 1 . p = p 0 2 2 2 (X ) Variância: σ ( X ) = E[(X1 - µ )2] = E(X i ) - µ 2 E[X i ] = 1 ∑ 2 x i P(Xi) = 02 q + 12 p = p 0 2 σ ( X ) = p – p2 = p(1-p) = pq 4.23.2 DISTRIBUIÇÃO BINOMIAL Trata-se de uma distribuição de probabilidade adequada aos experimentos que apresentam apenas dois resultados (sucesso ou fracasso). Esse modelo fundamenta-se nas seguintes hipóteses: H1: n provas independentes e do mesmo tipo são realizadas. H2: cada prova admite dois resultados – sucesso ou fracasso. H3: a probabilidade de sucesso em cada prova é p e de fracasso 1-p = q Define-se a variável Y como o número de sucessos das n provas. Logo, Y pode tomar os valores 0, 1, 2, 3, ..., n. Fazendo sucesso corresponder a 1 e fracasso a 0, ou seja, provas Bernoulli, tem-se: Para Y = 0, uma seqüência de n zeros: 0000 ... 0. Logo: P (Y=0) = q . q . q . q ... q = qn Para Y = 1, uma seqüência do tipo: 1000 ... 0; 0100 ... 0; 001000 ... 0; 88 de Probabilidade e Estatística Luiz Roberto Serão n seqüências, cada uma com um único sucesso e n-1 fracassos: P (Y-1) = n . p . qn-1 Para Y = y, tem-se y sucessos e (n-y) fracassos, correspondendo às seqüências com y algarismos 1 e n – y zeros. Cada seqüência terá probabilidade pyqn-y e n como há seqüências distintas, tem-se: y n P (Y=y) = pyqn-y y Que é a expressão geral da distribuição Binomial. Para Y = n, tem-se uma seqüência de n uns: 1111 ... 1, logo: P(Y=n) = pn n O nome Binomial é porque pyqn-y nada mais é que o termo de grau y em p no y desenvolvimento do Binômio de Newton (p + q)n. Média: De acordo com as hipóteses, vê-se que y é a soma de n variáveis do tipo “Bernoulli”, daí: µ = nµ Variância: 2 (X) = n . p ou µ (Y) = np seja Baseado no que foi feito acima, temos: 2 σ (Y ) = n σ ( X ) = n . p . p 2 σ (Y ) = ou seja npq Exemplo: Uma moeda não viciada é lançada oito vezes. Encontre a probabilidade: a) dar cinco caras b) pelo menos uma cara c) no máximo duas caras. d) Calcular a média e a variância da distribuição. Solução: Sabe-se que: n = 8, p = 1 1 e q = ; Y Î número de caras 2 2 (sucessos). 5 8−5 a) P(Y=5) = 8 1 1 5 2 2 b) P(Y ≥ 1) = 1 – P(Y=0) = 1 - 7 = 0,22 = 22% 32 = 1 2 89 8 255 = 0,996 = 99,6% 256 = Probabilidade e Estatística c) P(Y ≤ 2) = Luiz Roberto P(Y=0) + P(Y=1) + P(Y=2) = 8 7 2 6 8 1 1 1 1 1 + 8 + = 2 2 2 2 2 2 1 8 28 37 + + + = 0,14 = 14% 256 256 256 256 A média será: 9(Y) = n . p = 8 . 2 A variância será: σ (Y ) = 1 = 4 2 n . p . q 90 = 8 . 1 1 . = 2 2 2 Probabilidade e Estatística Luiz Roberto BIBLIOGRAFIA FONSECA, Jairo Simon; MARTINS, G. A. Curso de Estatística. Atlas, 1996. São Paulo: MARTINS, G. A. DONAIRE, D. Princípios de estatística. São Paulo: Atlas, 1990. TOLEDO, G. L; OVALLE, I(. I. Estatística básica. 2ª ed. São Paulo: Atlas, 1995. IEZZI, G; DOLCE, O; DEGENSZAJN, D. M; PÉRIGO, R. Matemática volume único. São Paulo: Atual Editora, 1999. 91