Estatística Tópicos Média Aritmética Variância Desvio padrão Moda Distribuição de probabilidade Distribuição Binomial Coeficiente de variação Distribuição contínua Distribuição normal Moda Definição: Em um levantamento estatístico, a moda é o valor que aparece com maior frequência em um espaço amostral. Dado o conjunto {1,2,2,3,5,4,3,2}, sua Moda é 2. Obs: se existirem 2 números que se repetem a mesma quantidade de vezes, dizemos que o evento é bimodal, ou seja, tem duas modas: Ex: {1,2,2,3,3,5,4,3,2} Modas 2 e 3 Mediana Definição: Em estatística ou teoria da probabilidade, a mediana é o valor intermediário que divide o espaço amostral na mesma quantidade de elementos maiores e menores que a mediana. Dado o conjunto {1,9,8,5,4} ordenado: {1,4,5,8,9}, a Mediana é 5. Dado o conjunto {1,3,9,8,6,2,4,7} {1,2,3,4,6,7,8,9}, a Mediana é (4+6)/2 = 5. ordenado: Mediana Passos: 1 – Ordenar os elementos do conjunto. 2 – Contar o número de elementos (n). 3– • se n par, mediana é a média entre (n/2)-ésimo e (n/2+1)-ésimo elemento. • se n ímpar, mediana é o (n+1)/2-ésimo elemento. Range Definição: É a diferença entre o maior termo e o menor termo de um conjunto numérico. Ex: Dado o conjunto {1,3,9,8,6,2,4,7} ordenado: {1,2,3,4,6,7,8,9}, o range é 9-1=8. Média aritmética Definição: Dado um conjunto de n valores numéricos {x1,x2,…,xn}, sua média aritmética é: Média aritmética A média aritmética de 6 números positivos é 5. Se a média do menor e maior valor é 7, qual a média dos outros 4 números? Solução: Se x1 é o menor valor, e x6 o maior valor, então: Assim: Média aritmética Exercício Nos 3 primeiros testes dentre 4, um estudante tem uma média aritmética de 85 pontos. Este estudante quer aumentar sua média em 2 pontos. Quantos pontos ele deve tirar no quarto e último teste? Média aritmética Solução Média 1 = (x1+x2+x3)/3 x1+x2+x3 = 85*3 Média 2 = (x1+x2+x3+x4)/4 x1+x2+x3+x4 = 87*4 x4 = 87*4 – 85*3 x4 = 93 Média aritmética Exercício Se a média aritmética de a, b e 7 é 13; qual é a média de a+3, b-5 e 6? Média aritmética Solução (a+b+7)/3 = 13 a+b = 39-7 = 32 (a+3+b-5+6)/3 = (a+b+4)/3 = (32+4)/3 = 12 Variância Definição: É a quantidade de variação dos elementos do conjunto, ou quão distantes os elementos do espaço amostral estão uns dos outros. Variância Q 66 Petrobrás – 2011 – Químico de Petróleo Jr Variância A média inicial será dada por: Mi = (x1 +x2 + x3 + ....+xn)/n Após o aumento e o abono temos que: Mf = (1,1x1 +100 +1,1x2 +100 + 1,1x3 +100 + ....+1,1xn +100)/n Então: Mf = 1,1 Mi + 100 • A variância inicial será dada por: Vi=[(x1-)2+(x2-)2+(xn-)2]/n Após o aumento e o abono, temos que: Vi=[(1,1x1+100--100)2+(1,1x2+100--100)2+(1,1xn+100--100)2]/n Então: Vf =1,21Vi Resposta E Desvio padrão Definição: O desvio padrão é a medida de quão distantes os elementos do espaço amostral estão de sua média. De forma análoga, o desvio padrão é o quanto os números desviam da média, e é a raiz quadrada da variância. Estatística Exemplo: Os tempos despendidos por 12 alunos (N = 12), em segundos, para percorrer certo trajeto, sem barreira, foram 16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23. Determine o valor da moda, mediana, média aritmética, variância, range e do desvio padrão dessa população. Estatística Solução: Ordenando a população: 16, 16,16, 16, 17, 17, 18, 19, 20, 21, 22, 23. Temos que: Moda: 16 Média: (16+16+16+16+17+17+18+19+20+21+22+23)/12=18,42 Variância: [(16-18,42)2x4+ [(17-18,42)2x2+ [(18-18,42)2+ [(1918,42)2+ [(20-18,42)+ [(21-18,42)2+ [(22-18,42)2+23 [(1618,42)2]/12 = 6,45 Desvio padrão: Range: 23-16= 7 = 2,54 Desvio padrão Desvio padrão Distribuição de probabilidade • Definição: descreve a chance que uma variável pode assumir ao longo de um espaço de valores. • O conjunto deste tipo de função está sempre restrito ao intervalo entre 0 e 1. • Uma distribuição de probabilidade pode ser discreta (como em um jogo de dados) ou contínua. Distribuição de probabilidade • Modelo determinístico: experimentos que apresentam um resultado com um padrão matemático; – Ex: As leis da Física (Gravitacional e as de Kepler) • Modelo Não Determinístico: resultados irregulares quando analisados individualmente • Ex: jogar um dado comum, tirar uma carta de um baralho de 52 cartas, etc. Distribuição de probabilidade Variável aleatória: é aquela cujos valores são determinados por processos acidentais, ao acaso, que não estão sob o controle do observador. Tipos: • DISCRETA – se o número de resultados possíveis é finito ou pode ser contado; • CONTÍNUA – se pode assumir qualquer valor dentro de determinado intervalo. O número de resultados possíveis não pode ser listado. Distribuições A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes Ex: altura e idades de uma determinada população Distribuições A distribuição assimétrica positiva tem a maior frequência para valores menores e a cauda mais longa à direita Ex: uso de máquinas fotográficas de filme Distribuições A distribuição assimétrica negativa tem a maior frequência para os maiores valores e a cauda mais longa à esquerda Ex: Demanda por eletricidade ao longo do tempo Distribuições Ex: Quantidade de UV recebido em uma região ao longo de um período Distribuições Ex: Concentração de aerossóis, gotículas Distribuições Ex: Eficiência de reações químicas Distribuição de probabilidade Distribuição Discreta de Probabilidade – enumera cada valor possível da variável aleatória, bem como sua probabilidade. Ex: Demanda diária de aluguel de caminhonetes durante um período de 50 dias Distribuição de probabilidade P(X) é denominada função de probabilidade ou de frequência de X. Propriedades Cada probabilidade precisa estar entre 0 e 1, inclusive. 0 ≤ P(X ) ≤1 A soma de todas as probabilidades é 1. ∑P(X ) =1 Média Média - representado por E(X ) ou µ: É o valor médio que resulta das inúmeras observações de uma variável aleatória. Variância Variância: representada por Var(X) ou σ2 Medida de dispersão de uma variável aleatória X calculada em relação a E(X). Desvio Padrão •• Desvio Padrão: Coeficiente de variação Coeficiente de variação: é uma medida de dispersão relativa. Sua principal qualidade é a capacidade de comparação de distribuições diferentes. Onde, Cv → é o coeficiente de variação s → é o desvio padrão X → é a média dos dados O coeficiente de variação é dado em %, por isso a fórmula é multiplicada por 100 Distribuição Binomial Distribuição Binomial: Se p é a probabilidade de sucesso em uma tentativa única e q = 1 – p é a de insucesso, então a probabilidade do evento ocorrer exatamente X vezes, em N tentativas (isto é, de que haja X sucessos e N – X insucessos), é dada por: Distribuição Binomial Exemplo: Uma moeda não viciada é lançada 6 vezes, ou equivalentemente, seis moedas são lançadas. a) Qual é a probabilidade de exatamente duas caras ocorrerem? b) Qual é a probabilidade de ocorrerem pelo menos 4 caras? c) Qual é a probabilidade de não ocorrerem caras? d) Qual é a probabilidade de ocorrer pelos menos uma cara? Distribuição Binomial Solução: Distribuição Binomial Distribuição Binomial Exercício: Um homem de vendas calcula que cada contato resulta em venda com probabilidade de 20%. Certo dia, ele contata dois possíveis clientes. a) Construir a tabela de distribuição de probabilidade para a variável X: número de clientes que assinam um contrato de vendas. b) Calcular a número esperado de clientes que assinam um contrato de vendas, a variância e o desvio padrão desta distribuição. Distribuição Binomial Solução: a) P(0)=1.0,20.0,82=0,64 P(1)=2.0,21.0,81=0,32 P(2)=1.0,22.0,80=0,04 Distribuição Binomial b) E(X)= 0,32 + 0,08 = 0,40 c) Var(X) = 12.0,32+22.0,64-[0,32+(2.0,64)]2 Var(X)=0,32 σ= 0,56 Distribuição Binomial Exercício: Página 32 da apostila Uma firma exploradora de petróleo acha que 95% dos poços que perfura não acusam depósito de gás natural. Se ela perfurar 6 poços, a probabilidade de obter resultado positivo em pelo menos um deles é, aproximadamente, de: (A) 96,1% (B) 73,5% (C) 30,0% (D) 26,5% (E) 3,9% Distribuição Binomial Solução: A probabilidade de pelo menos 1 poço conter petróleo é: P(X>1)=1-[P(0)] P(0)=1.0,950.0,956-0 P(0)=0,735 P(X>1)=1-0,735=0,265 Resposta (D) Distribuição Contínua Distribuição Contínua de Probabilidade: A variável aleatória X é contínua e por isso não é possível enumerar todos os seus possíveis valores. É representada por uma curva contínua, a curva de probabilidade, cuja equação é Y = P(X ). • P(X ) é denominada função densidade de probabilidade. Distribuição Contínua • A área total limitada por essa curva e os eixo dos X é igual a 1. • A área compreendida entre as verticais X = a e X = dá a probabilidade de X ser um valor entre a e b. P(a ≤ X ≤ B) Distribuição Normal Distribuição normal: A distribuição ou curva normal (de Gauss) é definida como segue: • • • • • onde: -∞ < X < ∞ μ= média da distribuição σ= desvio padrão da distribuição p = 3,1416.... e = 2,71828... Distribuição Normal Cada distribuição normal fica determinada pelos parâmetros µ(média) e σ(desvio padrão). Notação: Distribuição Normal Características: • • • • • Curvas com forma de “sino”; Simétricas em torno de X=μ; Possuem ponto máximo em X=μ; Tendem a zero quando X tende a Distribuição Normal Variável normal padronizada Sendo X uma variável aleatória com distribuição N(μ ,σ2), quando μ = 0 e σ2 =1 temos uma distribuição padrão ou reduzida, ou brevemente N(0,1). Assim a função densidade reduz-se a: onde a variável Z é obtida pela transformação linear: Distribuição Normal Tabela de curva normal Há vários tipos de tabelas que nos oferecem as áreas (probabilidades) sob a curva normal. O tipo mais frequente é a tabela da faixa central, que dá a área sob a curva normal padrão entre Z = 0 e qualquer valor positivo de Z. Distribuição Normal Distribuição Normal Exemplo: As alturas dos alunos de uma determinada escola são normalmente distribuídas com média 1,60 m e desvio padrão 0,30 m. Encontre a probabilidade de um aluno medir: a) entre 1,50 m e 1,80 m; b) mais de 1,75 m. Distribuição Normal Solução: Distribuição Normal b) Distribuição Normal Exercício: 32 da apostila Página Em um concurso público serão chamados para contratação imediata 20% dos candidatos com as maiores notas. As notas obtidas seguem uma distribuição normal com média 5,5 e desvio padrão 3. A nota mínima para que o candidato seja chamado para contratação imediata é, aproximadamente: (A) 7,0 (B) 7,5 (B) 8,0 (C) 8,5 (E) 9,0 Obs: Lembre-se que a tabela Z é bicaudal, ou seja (50%-20%) =30%. Na tabela, 0,30 corresponde a um Z de 0,85 Distribuição Normal Solução: Normalizando-se a função para Z(0,1), temos que: Mas a tabela Z é bicaudal, ou seja (50%-20%) =30% (ver tabela) Na tabela, vemos que 0,30 corresponde a um Z de 0,85. Assim: 0,85=(X-5,5)/3 X=8,05 Resposta (C) Exercícios Exercício: Página 32 da apostila A tabela a seguir apresenta algumas estatísticas das ações de três empresas dos setores de petróleo e química. Os dados referem-se às últimas 80 semanas. Exercícios Considere as armações derivadas das estatísticas acima. I - O coeficiente de variação das ações da empresa A é o mesmo que o das ações da empresa C. II - A rentabilidade média das ações da empresa B é maior do que das demais e apresenta menor dispersão relativa, ou seja, menor risco. III - A rentabilidade média das ações da empresa C é menor do que das demais e apresenta menor dispersão relativa, ou seja, menor risco. Estão corretas as armações (A) I, apenas. (B) I e II, apenas. (C) I e III, apenas. (D) II e III, apenas. (E) I, II e III. Exercícios Solução: Cálculo dos coeficientes de variação: CA= 3,5/0,5=7% CB= 3,9/0,6=6,5% CC = 2,8/0,4=7% Resposta (B) Exercícios Exercício: Página 35 da apostila Na curva de distribuição de permeabilidades da rocha de um reservatório, mostrada na figura, os atributos X, Y e Z, respectivamente, são: (A) mediana, média e moda. (B) mediana, moda e média. (C) moda, mediana e média. (D) moda, média e mediana. (E) média, mediana e moda. Exercícios Solução: A Moda é o elemento de maior frequência, e a maior frequência está no topo (no ponto mais alto da curva!). A Mediana está sempre no meio do conjunto, dividindo-o em duas partes iguais. A Média é sempre influenciada por valores extremos, portanto é menor que a mediana. Resposta: (C) Exercícios Exercício: Página 35 da apostila Suponha os pesos dos pacotes de arroz normalmente distribuídos com média 1Kg e desvio padrão 20g. Escolhendo um pacote ao acaso, qual é a probabilidade de ele pesar mais de 1030g? (A) 13;4% (B) 11;6% (C) 10;0% (D) 8;4% (E) 6;7% *Dado que P(Z=1,5)=0,43319 Exercícios • Solução: Μ=1000g σ= 20g P(X>1030) = ? Z= (1030-1000)/20= 1,5 P(Z=1,5)=0,43319 P(Z>1,5)=0,5-0,43319= 0,067 ou 6,7% Resposta (E) Exercícios Exercício: Página 36 da apostila Estudando o número de infrações cometidas por postos de gasolina em determinada cidade, numa amostra de 100 postos foram encontradas as seguintes quantidades de infrações. Quais são, respectivamente, a média, a mediana, a moda e a variância desta amostra? (A) 0,7 1 0 0,94 (B) 0,7 1 1 0,94 (C) 0,8 0;5 0 0,96 (D) 0,8 1 0 0,96 (E) 0,8 1 1 0,96 Exercícios Solução: Média: E(X)=(1x30+2x10+3x10)/100 E(X)= 0,8 Mediana: se ordenarmos os dados de acordo com o número de infrações, existirão 50 zeros nas 50 primeiras posições, seguidos de 30 uns. Como a mediana será a media entre os pontos mais centrais da população, ela será 0,5. Moda: a moda é o elemento com maior frequência, portanto zero Exercícios Variância: Var(X)= [50x(0-0,8)2]+ [30x(1-0,8)2]+[10x(20,8)2]+[10x(3-0,8)2]/100 Var(X)=(32+1,2+14,4+48,4)/100 = 0,96 Resposta (C) Exercícios Exercício: Página 36 da apostila A covariância entre duas variáveis aleatórias X e Y é o valor médio: (A) da soma dos desvios de X e Y em relação ao valor absoluto de suas médias. (B) da soma dos desvios de X e Y em relação às suas respectivas médias. (C) do produto dos desvios de X e Y em relação ao quadrado de suas médias. (D) do produto dos desvios de X e Y em relação às suas respectivas médias. (E) do quadrado do produto dos desvios de X e Y em relação às suas respectivas médias. Exercícios Solução: O valor esperado do produto dos desvios é denominado covariância entre as variáveis aleatórias x e y e é definida por: Cov(x,y)=σxy Resposta (D)