Estatística - Tesla Concursos

Propaganda
Estatística
Tópicos
Média Aritmética
Variância
Desvio padrão
Moda
Distribuição de probabilidade
Distribuição Binomial
Coeficiente de variação
Distribuição contínua
Distribuição normal
Moda
Definição: Em um levantamento estatístico, a moda é
o valor que aparece com maior frequência em um
espaço amostral.
Dado o conjunto {1,2,2,3,5,4,3,2}, sua Moda é 2.
Obs: se existirem 2 números que se repetem a mesma
quantidade de vezes, dizemos que o evento é bimodal,
ou seja, tem duas modas:
Ex: {1,2,2,3,3,5,4,3,2}
Modas 2 e 3
Mediana
Definição: Em estatística ou teoria da probabilidade, a
mediana é o valor intermediário que divide o espaço
amostral na mesma quantidade de elementos maiores
e menores que a mediana.
Dado o conjunto {1,9,8,5,4} ordenado: {1,4,5,8,9}, a
Mediana é 5.
Dado
o
conjunto
{1,3,9,8,6,2,4,7}
{1,2,3,4,6,7,8,9}, a Mediana é (4+6)/2 = 5.
ordenado:
Mediana
Passos:
1 – Ordenar os elementos do conjunto.
2 – Contar o número de elementos (n).
3–
• se n par, mediana é a média entre (n/2)-ésimo e
(n/2+1)-ésimo elemento.
• se n ímpar, mediana é o (n+1)/2-ésimo elemento.
Range
Definição: É a diferença entre o maior termo e o
menor termo de um conjunto numérico.
Ex: Dado o conjunto {1,3,9,8,6,2,4,7} ordenado:
{1,2,3,4,6,7,8,9}, o range é 9-1=8.
Média
aritmética
Definição: Dado um conjunto de n valores numéricos
{x1,x2,…,xn}, sua média aritmética é:
Média
aritmética
A média aritmética de 6 números positivos é 5. Se a média
do menor e maior valor é 7, qual a média dos outros 4
números?
Solução:
Se x1 é o menor valor, e x6 o maior valor, então:
Assim:
Média
aritmética
Exercício
Nos 3 primeiros testes dentre 4, um estudante tem
uma média aritmética de 85 pontos. Este estudante
quer aumentar sua média em 2 pontos. Quantos
pontos ele deve tirar no quarto e último teste?
Média
aritmética
Solução
Média 1 = (x1+x2+x3)/3
x1+x2+x3 = 85*3
Média 2 = (x1+x2+x3+x4)/4
x1+x2+x3+x4 = 87*4
x4 = 87*4 – 85*3
x4 = 93
Média
aritmética
Exercício
Se a média aritmética de a, b e 7 é 13; qual é a média
de a+3, b-5 e 6?
Média
aritmética
Solução
(a+b+7)/3 = 13
a+b = 39-7 = 32
(a+3+b-5+6)/3 = (a+b+4)/3 = (32+4)/3 = 12
Variância
Definição: É a quantidade de variação dos elementos
do conjunto, ou quão distantes os elementos do
espaço amostral estão uns dos outros.
Variância
Q 66
Petrobrás – 2011 – Químico de Petróleo Jr
Variância
A média inicial será dada por:
Mi = (x1 +x2 + x3 + ....+xn)/n
Após o aumento e o abono temos que:
Mf = (1,1x1 +100 +1,1x2 +100 + 1,1x3 +100 + ....+1,1xn +100)/n
Então:
Mf = 1,1 Mi + 100
•
A variância inicial será dada por:
Vi=[(x1-)2+(x2-)2+(xn-)2]/n
Após o aumento e o abono, temos que:
Vi=[(1,1x1+100--100)2+(1,1x2+100--100)2+(1,1xn+100--100)2]/n
Então:
Vf =1,21Vi
Resposta E
Desvio padrão
Definição: O desvio padrão é a medida de quão
distantes os elementos do espaço amostral estão de
sua média. De forma análoga, o desvio padrão é o
quanto os números desviam da média, e é a raiz
quadrada da variância.
Estatística
Exemplo:
Os tempos despendidos por 12 alunos (N = 12), em
segundos, para percorrer certo trajeto, sem barreira,
foram 16, 17, 16, 20, 18, 16, 17, 19, 21, 22, 16, 23.
Determine o valor da moda, mediana, média
aritmética, variância, range e do desvio padrão dessa
população.
Estatística
Solução:
Ordenando a população:
16, 16,16, 16, 17, 17, 18, 19, 20, 21, 22, 23.
Temos que:
Moda: 16
Média: (16+16+16+16+17+17+18+19+20+21+22+23)/12=18,42
Variância: [(16-18,42)2x4+ [(17-18,42)2x2+ [(18-18,42)2+ [(1918,42)2+ [(20-18,42)+ [(21-18,42)2+ [(22-18,42)2+23 [(1618,42)2]/12 = 6,45
Desvio padrão:
Range: 23-16= 7
= 2,54
Desvio padrão
Desvio padrão
Distribuição de
probabilidade
• Definição: descreve a chance que uma
variável pode assumir ao longo de um
espaço de valores.
• O conjunto deste tipo de função está
sempre restrito ao intervalo entre 0 e 1.
• Uma distribuição de probabilidade pode
ser discreta (como em um jogo de dados)
ou contínua.
Distribuição de
probabilidade
• Modelo determinístico: experimentos
que apresentam um resultado com um
padrão matemático;
– Ex: As leis da Física (Gravitacional e as
de Kepler)
• Modelo Não Determinístico: resultados
irregulares quando analisados
individualmente
• Ex: jogar um dado comum, tirar uma carta
de um baralho de 52 cartas, etc.
Distribuição de
probabilidade
Variável aleatória: é aquela cujos valores são
determinados por processos acidentais, ao
acaso, que não estão sob o controle do
observador.
Tipos:
• DISCRETA – se o número de resultados
possíveis é finito ou pode ser contado;
• CONTÍNUA – se pode assumir qualquer valor
dentro de determinado intervalo. O número de
resultados possíveis não pode ser listado.
Distribuições
A distribuição normal é simétrica em torno da média o que implica que e
média, a mediana e a moda são todas coincidentes
Ex: altura e idades de uma determinada população
Distribuições
A distribuição assimétrica positiva tem a maior frequência para valores
menores e a cauda mais longa à direita
Ex: uso de máquinas fotográficas de filme
Distribuições
A distribuição assimétrica negativa tem a maior frequência para os maiores
valores e a cauda mais longa à esquerda
Ex: Demanda por eletricidade ao longo do tempo
Distribuições
Ex: Quantidade de UV recebido em uma região ao longo de um período
Distribuições
Ex: Concentração de aerossóis, gotículas
Distribuições
Ex: Eficiência de reações químicas
Distribuição de
probabilidade
Distribuição Discreta de Probabilidade –
enumera cada valor possível da variável
aleatória, bem como sua probabilidade.
Ex: Demanda diária de aluguel de
caminhonetes durante um período de 50 dias
Distribuição de
probabilidade
P(X) é denominada função de
probabilidade ou de frequência de
X.
Propriedades
Cada probabilidade precisa estar
entre 0 e 1, inclusive.
0 ≤ P(X ) ≤1
A soma de todas as probabilidades
é 1.
∑P(X ) =1
Média
Média - representado por E(X ) ou µ: É o
valor médio que resulta das inúmeras
observações de uma variável aleatória.
Variância
Variância: representada por Var(X) ou σ2
Medida de dispersão de uma variável aleatória
X calculada em relação a E(X).
Desvio Padrão
•• Desvio
Padrão:
Coeficiente de variação
Coeficiente de variação: é uma medida de dispersão
relativa. Sua principal qualidade é a capacidade de
comparação de distribuições diferentes.
Onde,
Cv → é o coeficiente de variação
s → é o desvio padrão
X → é a média dos dados
O coeficiente de variação é dado em %, por isso a
fórmula é multiplicada por 100
Distribuição Binomial
Distribuição Binomial: Se p é a probabilidade
de sucesso em uma tentativa única e q = 1 – p
é a de insucesso, então a probabilidade do
evento ocorrer exatamente X vezes, em N
tentativas (isto é, de que haja X sucessos e N –
X insucessos), é dada por:
Distribuição Binomial
Exemplo: Uma moeda não viciada é lançada 6
vezes, ou equivalentemente, seis moedas são
lançadas.
a) Qual é a probabilidade de exatamente duas
caras ocorrerem?
b) Qual é a probabilidade de ocorrerem pelo
menos 4 caras?
c) Qual é a probabilidade de não ocorrerem
caras?
d) Qual é a probabilidade de ocorrer pelos
menos uma cara?
Distribuição Binomial
Solução:
Distribuição Binomial
Distribuição Binomial
Exercício:
Um homem de vendas calcula que cada contato resulta
em venda com probabilidade de 20%. Certo dia, ele
contata dois possíveis clientes. a) Construir a tabela de
distribuição de probabilidade para a variável X: número
de clientes que assinam um contrato de vendas. b)
Calcular a número esperado de clientes que assinam um
contrato de vendas, a variância e o desvio padrão desta
distribuição.
Distribuição Binomial
Solução:
a)
P(0)=1.0,20.0,82=0,64
P(1)=2.0,21.0,81=0,32
P(2)=1.0,22.0,80=0,04
Distribuição Binomial
b)
E(X)= 0,32 + 0,08 = 0,40
c)
Var(X) = 12.0,32+22.0,64-[0,32+(2.0,64)]2
Var(X)=0,32
σ= 0,56
Distribuição Binomial
Exercício:
Página 32 da apostila
Uma firma exploradora de petróleo acha que 95%
dos poços que perfura não acusam depósito de gás
natural. Se ela perfurar 6 poços, a probabilidade de
obter resultado positivo em pelo menos um deles é,
aproximadamente, de:
(A) 96,1%
(B) 73,5%
(C) 30,0%
(D) 26,5%
(E) 3,9%
Distribuição Binomial
Solução:
A probabilidade de pelo menos 1 poço conter
petróleo é:
P(X>1)=1-[P(0)]
P(0)=1.0,950.0,956-0
P(0)=0,735
P(X>1)=1-0,735=0,265
Resposta (D)
Distribuição Contínua
Distribuição Contínua de Probabilidade:
A variável aleatória X é contínua e por isso não
é possível enumerar todos os seus possíveis
valores.
É representada por uma curva contínua, a curva
de probabilidade, cuja equação é Y = P(X ).
• P(X ) é denominada função densidade de
probabilidade.
Distribuição Contínua
• A área total limitada por essa curva e os eixo dos X é
igual a 1.
• A área compreendida entre as verticais X = a e X = dá a
probabilidade de X ser um valor entre a e b. P(a ≤ X ≤ B)
Distribuição Normal
Distribuição normal: A distribuição ou curva
normal (de Gauss) é definida como segue:
•
•
•
•
•
onde: -∞ < X < ∞
μ= média da distribuição
σ= desvio padrão da distribuição
p = 3,1416....
e = 2,71828...
Distribuição Normal
Cada distribuição normal fica determinada pelos
parâmetros µ(média) e σ(desvio padrão).
Notação:
Distribuição Normal
Características:
• •
•
•
•
Curvas com forma de “sino”;
Simétricas em torno de X=μ;
Possuem ponto máximo em X=μ;
Tendem a zero quando X tende a
Distribuição Normal
Variável normal padronizada
Sendo X uma variável aleatória com distribuição
N(μ ,σ2), quando μ = 0 e σ2 =1 temos uma
distribuição padrão ou reduzida, ou brevemente
N(0,1). Assim a função densidade reduz-se a:
onde a variável Z é obtida pela transformação
linear:
Distribuição Normal
Tabela de curva normal
Há vários tipos de tabelas que nos oferecem as
áreas (probabilidades) sob a curva normal.
O tipo mais frequente é a tabela da faixa
central, que dá a área sob a curva normal
padrão entre Z = 0 e qualquer valor positivo de
Z.
Distribuição Normal
Distribuição Normal
Exemplo: As alturas dos alunos de uma
determinada
escola
são
normalmente
distribuídas com média 1,60 m e desvio padrão
0,30 m. Encontre a probabilidade de um aluno
medir:
a) entre 1,50 m e 1,80 m;
b) mais de 1,75 m.
Distribuição Normal
Solução:
Distribuição Normal
b)
Distribuição Normal
Exercício:
32 da apostila
Página
Em um concurso público serão chamados para contratação
imediata 20% dos candidatos com as maiores notas. As notas
obtidas seguem uma distribuição normal com média 5,5 e desvio
padrão 3. A nota mínima para que o candidato seja chamado
para contratação imediata é, aproximadamente:
(A) 7,0
(B) 7,5
(B) 8,0
(C) 8,5
(E) 9,0
Obs: Lembre-se que a tabela Z é bicaudal, ou seja (50%-20%)
=30%. Na tabela, 0,30 corresponde a um Z de 0,85
Distribuição Normal
Solução:
Normalizando-se a função para Z(0,1), temos que:
Mas a tabela Z é bicaudal, ou seja (50%-20%) =30% (ver tabela)
Na tabela, vemos que 0,30 corresponde a um Z de 0,85. Assim:
0,85=(X-5,5)/3
X=8,05
Resposta (C)
Exercícios
Exercício:
Página 32 da apostila
A tabela a seguir apresenta algumas estatísticas das
ações de três empresas dos setores de petróleo e
química. Os dados referem-se às últimas 80 semanas.
Exercícios
Considere as armações derivadas das estatísticas acima.
I - O coeficiente de variação das ações da empresa A é o mesmo que
o das ações da empresa C.
II - A rentabilidade média das ações da empresa B é maior do que das
demais e apresenta menor dispersão relativa, ou seja, menor risco.
III - A rentabilidade média das ações da empresa C é menor do que
das demais e apresenta menor dispersão relativa, ou seja, menor
risco.
Estão corretas as armações
(A) I, apenas.
(B) I e II, apenas.
(C) I e III, apenas.
(D) II e III, apenas.
(E) I, II e III.
Exercícios
Solução:
Cálculo dos coeficientes de variação:
CA= 3,5/0,5=7%
CB= 3,9/0,6=6,5%
CC = 2,8/0,4=7%
Resposta (B)
Exercícios
Exercício:
Página 35 da apostila
Na curva de distribuição de permeabilidades da
rocha de um reservatório, mostrada na figura, os
atributos X, Y e Z, respectivamente, são:
(A) mediana, média e moda.
(B) mediana, moda e média.
(C) moda, mediana e média.
(D) moda, média e mediana.
(E) média, mediana e moda.
Exercícios
Solução:
A Moda é o elemento de maior frequência, e a
maior frequência está no topo (no ponto mais
alto da curva!). A Mediana está sempre no meio
do conjunto, dividindo-o em duas partes iguais.
A Média é sempre influenciada por valores
extremos, portanto é menor que a mediana.
Resposta: (C)
Exercícios
Exercício:
Página 35 da apostila
Suponha os pesos dos pacotes de arroz
normalmente distribuídos com média 1Kg e desvio
padrão 20g. Escolhendo um pacote ao acaso, qual
é a probabilidade de ele pesar mais de 1030g?
(A) 13;4%
(B) 11;6%
(C) 10;0%
(D) 8;4%
(E) 6;7%
*Dado que P(Z=1,5)=0,43319
Exercícios
•
Solução:
Μ=1000g
σ= 20g
P(X>1030) = ?
Z= (1030-1000)/20= 1,5
P(Z=1,5)=0,43319
P(Z>1,5)=0,5-0,43319= 0,067 ou 6,7%
Resposta (E)
Exercícios
Exercício:
Página 36 da apostila
Estudando o número de infrações cometidas por
postos de gasolina em determinada cidade, numa
amostra de 100 postos foram encontradas as
seguintes quantidades de infrações. Quais são,
respectivamente, a média, a mediana, a moda e a
variância desta amostra?
(A) 0,7 1 0 0,94
(B) 0,7 1 1 0,94
(C) 0,8 0;5 0 0,96
(D) 0,8 1 0 0,96
(E) 0,8 1 1 0,96
Exercícios
Solução:
Média:
E(X)=(1x30+2x10+3x10)/100
E(X)= 0,8
Mediana: se ordenarmos os dados de acordo com o
número de infrações, existirão 50 zeros nas 50
primeiras posições, seguidos de 30 uns. Como a
mediana será a media entre os pontos mais centrais da
população, ela será 0,5.
Moda: a moda é o elemento com maior frequência,
portanto zero
Exercícios
Variância:
Var(X)= [50x(0-0,8)2]+ [30x(1-0,8)2]+[10x(20,8)2]+[10x(3-0,8)2]/100
Var(X)=(32+1,2+14,4+48,4)/100 = 0,96
Resposta (C)
Exercícios
Exercício:
Página 36 da apostila
A covariância entre duas variáveis aleatórias X e Y é o
valor médio:
(A) da soma dos desvios de X e Y em relação ao valor
absoluto de suas médias.
(B) da soma dos desvios de X e Y em relação às suas
respectivas médias.
(C) do produto dos desvios de X e Y em relação ao
quadrado de suas médias.
(D) do produto dos desvios de X e Y em relação às suas
respectivas médias.
(E) do quadrado do produto dos desvios de X e Y em
relação às suas respectivas médias.
Exercícios
Solução:
O valor esperado do produto dos desvios é
denominado covariância entre as variáveis aleatórias x e y e
é definida por:
Cov(x,y)=σxy
Resposta (D)
Download