xp 1 - UFSM

Propaganda
Prof. Janete Pereira Amador
1
1 Introdução
Muitas situações cotidianas podem ser usadas como experimento que dão
resultados correspondentes a algum valor, e tais situações podem ser descritas por uma
variável aleatória. A palavra aleatória indica que só conhecemos aquele valor depois do
experimento ter sido realizado. Desta forma, defini-se variável aleatória como sendo uma
função que associa números reais aos eventos de um espaço amostral, ou seja, os
resultados do experimento aleatório são dados numéricos.
Usa-se as letras maiúscula (X, Y, Z....) para designar as variáveis aleatórias, e
minúsculas (x, y, z.....) para indicar particulares valores dessas variáveis.
As variáveis aleatórias podem ser discreta e contínuas e o seu comportamento pode
ser descrito por uma distribuição de probabilidade. No caso discreto, a distribuição de
probabilidade pode ser caracterizada por uma função de probabilidade, que indica
diretamente as probabilidades associada a cada valor. No caso contínuo, a distribuição é
caracterizada pela função densidade de probabilidade.
Uma Variável Aleatória é uma variável (geralmente representada por X) que tem um valor
numérico único (determinado aleatoriamente) para cada resultado de um experimento
2 Va riáveis Alea tória s Discretas (VAD)
Uma variável aleatória tem comportamento discreto quando ela admite um número
finito de valores ou tem uma quantidade enumerável de valores (admite apenas valores
inteiros).
A definição de uma VAD só fica completa a partir do momento em que se define a
função de probabilidade da variável aleatória X. Uma função de probabilidade é a função
que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, ou seja:
Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será
formado por um número finito ou enumerável de valores x1; x2;.........A cada possível
resultado xi, associaremos um número p(xi) = P(X = xi), i = 1; 2; 3;......, denominado
probabilidade de xi. Ou seja
Os números p(xi) devem satisfazer às seguintes condições:
a) p ( xi )  0, i ;
n
b)  p( xi )  1
i 1
Dessa forma função p, definida acima, é denominada função de probabilidade da
variável aleatória X e a coleção de pares [xi; p(xi)] i = 1; 2;..........., é denominada
distribuição de probabilidade de X.
Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os
resultados de um espaço amostral; mostra a proporção das vezes em que a variável
aleatória tende a assumir cada um dos diversos valores.
Prof. Janete Pereira Amador
2
Ex2: Lançam-se dois dados. Seja a v.a. X: soma das
probabilidade da variável aleatória X
O espaço amostral do experimento corresponde a:
 1,1 1,2  1,3 1,4 
2,1 2,2  2,3 2,4 

3,1 3,2  3,3 3,4 
S 
4,1 4,2  4,3 4,4 
5,1 5,2  5,3 5,4 

6,1 6,2  6,3 6,4 
O contradomínio de X é dado por:
 x  2,3,4,5,6,7,8,9,10,11,12
A distribuição de probabilidade de X é dado por:
faces. Determinar a distribuição de
1,5
2,5
3,5
4,5
5,5
6,5
1,6 
2,6
3,6
4,6
5,6

6,6
A representação gráfica desta distribuição de probabilidade equivale a:
2.1 Grandezas Características
As variáveis aleatórias podem ser caracterizadas por uma grandeza de tendência
central (média, moda, mediana) e outra de dispersão. A medida caracterizada como
grandeza de tendência central é uma média ponderada que recebe o nome particular de
esperança matemática (ou valor esperado); as grandezas de dispersão são a variância e o
desvio- padrão.
2.1.1 Valor esperado – E(X)
Seja X uma VAD, seja p(xi) = P(X=xi) onde p é a função de probabilidade de X.
Defini-se valor esperado ou esperança matemática de X anotado por E(X) da seguinte
forma.
n
E(X)   xi p ( xi )
i 1
Prof. Janete Pereira Amador
3
E(X) é a média ponderada dos valores de X, onde as ponderações são as
probabilidades de cada xi.
Diz-se também que E(X) é a media da distribuição de probabilidade da variável
aleatória X, algumas vezes anotada por  . Se X puder assumir “n” valores igualmente
prováveis.
Ex3: Considere a variável aleatória definida no Ex2. Calcule a E(X).
11
E(X)   xi p ( xi )  x1  p ( x1 )  x2  p ( x 2 )  ..........x11  p ( x11 )
i 1
E ( X )  (2 
1
2
3
1
)  (3  )  (4  )  ............................  (12  ) 
36
36
36
36
E( X )  7
2.1.2 Variância – V(X)
A variância de uma VAD pode ser definida como a média ponderada das diferenças
ao quadrado entre cada resultado possível e sua média aritmética, sendo os pesos as
probabilidades de cada um dos respectivos resultados. Assim a variância da variável
aleatória discreta X pode ser expressa da seguinte maneira:
n
V ( X ) ( xi   ) 2  P( xi ) onde :
I 1
X = variável aleatória discreta de interesse
xi = iésimo resultado de x
P(xi) = probabilidade de ocorrência do iésimo resultado de x
i= 1,2,3......,n
A formula mais usual para se calcular a variância
2
V ( X )   xi . pi  E ( X ) 2 .

 
corresponde
a:

Algumas vezes a V(X) é anotada por 2 . A raiz quadrada positiva da variância é
denominada desvio padrão e é anotado por  ( X )  V ( X ) .
Ex4: Considere a variável aleatória definida no Ex2. Calcule a V(X) e o  ( X )
V (X ) 
 x
2
i
 
. pi  E ( X ) 2

1
2
3
1 
1974

V ( X )  (2 2  )  (3 2  )  (4 2  )  ............................  (12 2  )  (7) 2 
 (7 ) 2 
36
36
36
36 
36

V ( X )  5,83
 ( X )  V ( X )  5,83
 ( X )  2,415
Exercícios:
1. A empresa Equilibrada S:A vende três produtos, cujos lucros e as probabilidades de
venda estão anotadas a seguir:
Produto
Lucro unitário (US$)
Probabilidade de venda
(%)
A
15
20
Prof. Janete Pereira Amador
B
20
C
10
Pede-se calcular:
a) o lucro médio por unidade vendida:
b) o desvio padrão:
4
30
50
2. Um empreiteiro faz as seguintes estimativas para o prazo de execução de uma obra:
Prazo de execução (dias)
Probabilidade de execução (%)
10
30
15
20
22
50
O prazo esperado para execução da obra e o desvio padrão, de acordo com estas
estimativas são:
3. Um investidor julga que tem 0,40 de probabilidade de ganhar $ 25.000,00 e 0, 60 de
probabilidade de perder $ 15.000,000 num investimento . Seu ganho esperado é:
2.2 Distribuições de Probabilidades para VAD
Quando estudamos fenômenos observáveis o que se verifica é se este se adapta as
condições de determinado modelo probabilístico conhecido, desta forma torna-se bem mais
fácil descrever o comportamento do fenômeno. No caso de variáveis aleatórias discretas os
modelos são No caso de variáveis aleatórias discretas as distribuições mais importantes
são:
a) a distribuição de Binomial
b) a distribuição Bernoulli;
c) a distribuição de Poisson;
d) a distribuição geométrica;
e) a distribuição hipergeométrica.
:
2.2.1 Distribuição Binomial
Consideramos n tentativas independentes, de um experimento aleatório. Cada
tentativa admite dois resultados: sucesso com probabilidade p (quando ocorre o evento
que estamos interessados) e fracasso com probabilidade q (quando o evento não ocorre),
logo a probabilidade total de fracasso ou sucesso p  q  1 sendo assim:
a probabilidade de fracasso q  1  p
Um experimento binomial deve satisfazer as seguintes condições:
1) O experimento deve comportar um número fixo de provas
2) As provas devem ser independentes, isto é, o resultado de qualquer prova não afeta as
probabilidades das outras provas.
3) Cada prova deve ter todos os resultados classificados em duas categorias.
4) As probabilidades devem permanecer constantes para cada prova
A probabilidade de ocorrer k sucessos em n provas será:
Prof. Janete Pereira Amador
P(X = k) =
C nk =
5
Cnk
p k qn-k
sendo k = 0, 1, 2, 3, …, n
n!
, que é a fórmula do Binômio de Newton (p + q)n, daí o nome Binomial.
k! n  k 
Desta forma tem-se:
n!
. p x .q n x para x = 1, 2, .................., n
n  x ! x!
com
n  número de provas
x  número de sucessos em n provas
p  probabilidade de sucesso em qualquer prova
q
probabilidade de falha (fracasso) em qualquer prova ( q  1  p )
Parâmetros da distribuição:
Média, Variância e Desvio padrão da distribuição binomial
Média ou valor esperado E(X)=   n. p
Px  
Variância V(X)=  2  n. p.q
Desvio padrão   n. p.q
Ex: Dado que 10% população são canhotos, suponha que se queira achar a probabilidade
de obter exatamente três estudantes canhotos em uma turma de 15 estudantes. Isso se deve
ao fato que algumas carteiras são adaptadas para estudantes canhotos, e a probabilidade
resultante poderia afetar o número de tais carteiras a serem encomendadas para as salas de
aulas. Calcule também a E(X), V(X) e o  .
Solução:
Satisfazendo as condições para ocorrência de um experimento binomial verifica-se que:
1. O número de provas é fixo 15.
2. As provas são independentes, porque o fato de um estudante ser canhoto ou destro
não afeta a probabilidade de outro estudante ser canhoto.
3. Cada prova tem duas categorias de resultado: o estudante é canhoto ou não é.
4. A probabilidade de um estudante ser canhoto (sucesso) é 0,1 e, assim, p =0,1
5. A probabilidade de falha (não-canhoto) é 0,9, logo q = 0,9.
Calculando a probabilidade de 3 estudantes canhotos:
n!
P x  
. p x .q n x sendo: n = 15; x =3; p = 0,1,
q = 0,9
n  x ! x!
15!
15.14.13.12!
P3 
.0,13.0,9153 
 0,001  0,282429536  455  0,00028243 
15  3!3!
12!3!
P(3)  0,129 corresponde a probablidade de exatamente 3 estudantes serem canhotos
Calculando a E(X) a V(X) e 
  15.0,1  1,5 ;  2  15.0,1.0,9  1,35 e  = 1,16
Exercícios
1. Aplicando a fórmula da probabilidade binomial, determine a probabilidade de obter
três estudantes canhotos em uma turma de 15 estudantes, dado que 10% população são
canhotos.
Prof. Janete Pereira Amador
6
2. A probabilidade de um cliente aleatoriamente escolhido faça uma compra é 0,20. Se
um vendedor visita seis clientes, a probabilidade de que ele fará exatamente quatro
compras será.
3. Sabe-se que a probabilidade de um estudante que entra na Universidade se formar é
0,3. Determine de que dentre 6 estudantes escolhidos aleatoriamente:
a) Nenhum se forme
b) Exatamente 4 se formem
c) Pelo menos 3 se formem
3 Va riável Alea tória Contínua (VAC)
Quando uma variável aleatória apresenta um grande número de resultados
possíveis, ou quando a variável aleatória em questão é continua (pode assumir qualquer
valor dentro de um intervalo definido de valores), não se pode usar distribuições discretas
como a de Poisson ou Binomial para obter probabilidades. Como uma variável contínua
inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser
adequadamente descrita por uma distribuição discreta. Sendo assim, abordagem mais
conveniente é construir uma função densidade de probabilidade, ou curva de
probabilidade, baseada na função matemática correspondente.
Definição: É aquela que pode tomar qualquer valor em um determinado intervalo. Diz-se
que X é uma VAC, se existir uma função f(x), denominada função densidade de
probabilidade (fdp) de x que satisfaça às seguintes condições:
a) f(x)  0 para todo o x;

b)
 f ( x) dx 1;

Observações:
Seja X uma variável aleatória contínua com função densidade de probabilidade f(x).
Sejam a < b, dois números reais. Define-se:
, isto é, a probabilidade de que X assuma valores entre os
números “a” e “b” é a área sob o gráfico de f(x) entre os pontos x = a e x = b.
Neste caso, tem-se também:
P(X = a) = 0, isto é, a probabilidade de que uma variável aleatória contínua assuma um
valor isolado é igual a zero. Para variáveis contínuas só faz sentido falar em probabilidade
em um intervalo, uma vez, que a probabilidade é definida como sendo a área sob o gráfico.
f(x) não representa nenhuma probabilidade. Somente quando ela for integrada entre dois
limites produzirá uma probabilidade. P(c < x < d) representa a área sob a curva, como
exemplificado na figura abaixo da f.d.p. f, entre x = c e x = d.
Prof. Janete Pereira Amador
7
Ex: Seja X uma variável aleatória contínua. Com a seguinte função densidade de

2 x para 0  x  1

f ( x)  
probabilidade
verificar se a função é uma

0 para quisquer outros valores
fdp da variável X.
1. f(x)  0

1
1
 x2 
12 0 2
2.  f ( x) dx   2 xdx   2    2  
1
2 0
2
2


0
Como vemos f(x) é uma um fdp satisfazendo as condições.
3.1 Distribuições Contínuas de Probabilidade
Em muitos problemas se torna matematicamente mais simples considerar um espaço
amostral “idealizado” para uma variável X, no qual todos os números reais (em algum
intervalo específico) passam ser considerados como resultados possíveis. Desta maneira
somos levados as variáveis aleatórias contínuas, principalmente quando as observações
referem-se a medidas como comprimento, peso, temperatura, etc.
Entende-se por distribuição contínua de probabilidade a distribuição que estiver
associada a uma variável aleatória contínua – VAC. Assim se uma variável puder assumir
um conjunto contínuo de valores de um certo conjunto de dados, então a distribuição de
probabilidade P(X) é dita de probabilidade contínua. Desta forma, a seguir estudarmos as
seguintes distribuições de probabilidade:
Distribuição Normal
Distribuição “t” de Student.
Distribuição Qui-quadrado ( x2
Distribuição F de Snedecor
Prof. Janete Pereira Amador
8
3.1.1 Distribuição Normal
É mais importantes distribuição de probabilidade contínua, sendo aplicada em
inúmeros fenômenos e utilizada para o desenvolvimento teórico da inferência estatística. A
distribuição normal serve também como aproximação para um grande número de
distribuições.
A variável aleatória X que tome todos os valores reais    X   , tem
distribuição normal com parâmetros  e 2 se sua função densidade de probabilidade for
dada por:
f ( x) 
 x  
1
1/ 2 

e    ,
 2
 X  
A equação da curva Normal é especificada usando 2 parâmetros: a média
populacional  , e o desvio padrão populacional,  ou equivalentemente a variância
populacional  2 e devem satisfazer as seguintes condições:
a)      
b) 2 > 0
Denotamos
Quando uma variável aleatória X tiver distribuição normal anotaremos.
X  N ( , 2)
A distribuição normal é simétrica em torno da média o que implica que e média, a mediana
e a moda são todas coincidentes.
A distribuição Normal possui as seguintes características:
1. forma campanular, isto é, possui forma de sino, sendo simétrica em relação a média;
2. a variável aleatória pode assumir qualquer valor real;
3. a área total sob a curva é 1; porque essa área corresponde à probabilidade da variável
aleatória assumir qualquer valor real;
4. é uma curva assintótica;
5. possui dois pontos de inflexão;
A configuração da curva é dada por dois parâmetros: a média e a variância.
Mudando a média, muda a posição da distribuição no sentido horizontal. Mudando a
variância, muda a dispersão da distribuição fazendo com que o gráfico mais achatado ou
mais alongado. Tias configurações estão representadas na figura a seguir:
Prof. Janete Pereira Amador
9
Na prática desejamos calcular probabilidades para diferentes valores de  e  .
Para isso, a variável X cuja distribuição é N ( , 2) é transformada numa forma
padronizada com distribuição N (0, 1) (distribuição normal padrão) pois tal
distribuição é tabelada. Nesse caso a função densidade de probabilidade é dada por:
1
 z2
1
f (z) 
.e 2 .
2
Teorema: Se X tiver uma distribuição normal com média  e variância 2 e se Z 
x

então Z terá distribuição normal padronizada.
X 
X  N ( , 2) ==> Z 
 N ( 0,1)

Esse teorema é usado da seguinte forma:
P( x1 < X < x2 ) = P(z1 < Z < z2), onde:
x1  
x 
z2  2


Desta forma a variável aleatória X transforma-se em variável normal reduzida Z, como
podemos ver graficamente a seguir:
z1 
68,27%
95,45%
99,73%
Prof. Janete Pereira Amador
10
Vê-se que a nova origem é 0 e o desvio padrão é a unidade de medida. Essa
transformação não altera a forma da distribuição, apenas refere-se a uma nova escala.
A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não
superior a Z0: P(Z  Z0). Tal probabilidade é representada pela área hachurada na figura a
seguir:
A importância da distribuição normal padronizada reside no fato de que ela encontrase tabelada, facilitando o cálculo.
Ex1: Determinar área sob a curva normal padronizada à esquerda de 1,72.
Consultando a tabela, vemos que z = 1,72
corresponde área (probabilidade) 0,9573,
ou seja, 95,73% da área sob a curva e acima
do eixo da v.a. reduzida estão à esquerda de
Z = 1,72. é o mesmo que dizermos que a
probabilidade de Z ser menor que 1,72 é
0,9573: P(Z <1,72) = 0,9573.
Ex2: Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53.
Na tabela, a Z = -0,53 corresponde a área
(probabilidade) 0,2981: P(Z < 0,53) =
0,2981, isto é 29,81% da área sob a curva e
acima do eixo da v.a. reduzida Z estão
abaixo do valor z = -0,53.
Ex3: A concentração de um poluente em água liberada por uma fábrica tem distribuição
N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite
regulatório de 10 ppm?
A solução do problema resume-se em determinar a proporção da distribuição que
está acima de 10 ppm, isto é P(X>10). Usando a estatística z temos:
Portanto, espera-se que a água liberada pela fábrica exceda os limites regulatórios
cerca de 9% do tempo.
Ex4: Sabe-se que as alturas das plantas de milho de uma certa variedade se distribuem
normalmente com média de 2,20m e desvio padrão de 0,20m. Qual a percentagem
esperada de plantas com altura compreendida entre 2,30 e 2,35m?
X = altura das plantas;
X = N (2,20 ; 0,202);
P (2,30 < X < 2,35) = P (z1 < Z < z2)
2,30  2,20 0,10
2,35  2,20
z1 =

 0,5
e z2 =
 0,75 então;
0,2
0,2
0,2
Prof. Janete Pereira Amador
11
P (2,30 < X < 2,35 ) = P (0,5 < X < 0,75) = 0,0819 ou 8,19% corresponde a percentagem
de plantas que espera –se alcançar as alturas de 2,30 a 2,35m.
Exercícios
1. Determinar área sob a curva normal padronizada à esquerda de 1,82.
2. Calcule as seguintes probabilidades:
a) P(- 2,3 < Z < 0) =
b) P( 1,50 < Z < 2,32) =
3. As alturas dos alunos de uma determinada escola são normalmente distribuídos com
=1,60 m e  = 0,30 m. Encontre a probabilidade de 1 aluno medir:
a) Entre 1,50 e 1,80 m;
b) Mais de 1,75 m;
c) Menos de 1,48m;
Download