1 1 Introdução Muitas situações cotidianas podem ser

Propaganda
Prof. Janete Pereira Amador
1
1 Introdução
Muitas situações cotidianas podem ser usadas como experimento que dão
resultados correspondentes a algum valor, e tais situações podem ser descritas por uma
variável aleatória. A palavra aleatória indica que só conhecemos aquele valor depois do
experimento ter sido realizado. Desta forma, defini-se variável aleatória como sendo uma
função que associa números reais aos eventos de um espaço amostral, ou seja, os
resultados do experimento aleatório são dados numéricos.
Usa-se as letras maiúscula (X, Y, Z....) para designar as variáveis aleatórias, e
minúsculas (x, y, z.....) para indicar particulares valores dessas variáveis.
As variáveis aleatórias podem ser discreta e contínuas e o seu comportamento pode
ser descrito por uma distribuição de probabilidade. No caso discreto, a distribuição de
probabilidade pode ser caracterizada por uma função de probabilidade, que indica
diretamente as probabilidades associada a cada valor. No caso contínuo, a distribuição é
caracterizada pela função densidade de probabilidade.
Uma Variável Aleatória é uma variável (geralmente representada por X) que tem um valor
numérico único (determinado aleatoriamente) para cada resultado de um experimento
Exemplos de Variáveis Aleatórias
X = número de ovos de lagarta em uma folha
X =numero de plantas por hectare.
X = número de alunos que não compareceram a aula de estatística hoje.
X = altura de um aluno de sexo masculino selecionado aleatoriamente.
X = variação do preço do dólar durante o plano real.
A seguir vermos variáveis aleatórias discretas e suas principais distribuições e as
variáveis aleatórias contínuas assim como suas principais distribuições
2 Variáveis Aleatórias Discretas (VAD)
Uma variável aleatória tem comportamento discreto quando ela admite um número
finito de valores ou tem uma quantidade enumerável de valores (admite apenas valores
inteiros).
A definição de uma VAD só fica completa a partir do momento em que se define a
função de probabilidade da variável aleatória X. Uma função de probabilidade é a função
que associa a cada valor assumido pela variável aleatória a probabilidade do evento
correspondente, ou seja:
Seja X uma variável aleatória discreta. Portanto, o contradomínio de X será
formado por um número finito ou enumerável de valores x1; x2;.........A cada possível
resultado xi, associaremos um número p(xi) = P(X = xi), i = 1; 2; 3;......, denominado
probabilidade de xi. Ou seja
Os números p(xi) devem satisfazer às seguintes condições:
a) p ( xi )  0, i ;
Prof. Janete Pereira Amador
2
n
b)  p ( xi )  1
i 1
Dessa forma função p, definida acima, é denominada função de probabilidade da
variável aleatória X e a coleção de pares [xi; p(xi)] i = 1; 2;..........., é denominada
distribuição de probabilidade de X.
Uma distribuição de probabilidades é uma distribuição de freqüências relativas para os
resultados de um espaço amostral; mostra a proporção das vezes em que a variável
aleatória tende a assumir cada um dos diversos valores.
2.3 Distribuições de Probabilidades para VAD
Quando estudamos fenômenos observáveis o que se verifica é se este se adapta as
condições de determinado modelo probabilístico conhecido, desta forma torna-se bem mais
fácil descrever o comportamento do fenômeno. Assim nesta seção irmos estudar alguns
desses modelos, procurando enfatizar as condições em que eles aparecem, sua função de
probabilidade, parâmetros e como encontrar as probabilidades. Alguns modelos são mais
importantes devido ao seu maior uso.
No caso de variáveis aleatórias discretas as distribuições mais importantes são:
a) a distribuição Binomial;
b) a distribuição de Poisson.
2.3.1 Distribuição Binomial
Consideramos n tentativas independentes, de um experimento aleatório. Cada
tentativa admite dois resultados: sucesso com probabilidade p (quando ocorre o evento que
estamos interessados) e fracasso com probabilidade q (quando o evento não ocorre), logo a
probabilidade total de fracasso ou sucesso p  q  1 sendo assim:
a probabilidade de fracasso q  1  p
Um experimento binomial deve satisfazer as seguintes condições:
1) O experimento deve comportar um número fixo de provas
2) As provas devem ser independentes, isto é, o resultado de qualquer prova não afeta as
probabilidades das outras provas.
3) Cada prova deve ter todos os resultados classificados em duas categorias.
4) As probabilidades devem permanecer constantes para cada prova
A probabilidade de ocorrer k sucessos em n provas será:
P(X = k) =
C nk =
C nk
p k qn-k
sendo k = 0, 1, 2, 3, …, n
n!
, que é a fórmula do Binômio de Newton (p + q)n, daí o nome Binomial.
k! n  k 
Desta forma tem-se:
P x  
com
n!
. p x .q n x para x = 1, 2, .................., n
n  x ! x!
n  número de provas
Prof. Janete Pereira Amador
3
x
número de sucessos em n provas
p  probabilidade de sucesso em qualquer prova
q
probabilidade de falha (fracasso) em qualquer prova ( q  1  p )
Parâmetros da distribuição:
Média, Variância e Desvio padrão da distribuição binomial
Média ou valor esperado E(X)=   n. p
Variância V(X)=  2  n. p.q
Desvio padrão   n. p.q
Ex: Dado que 10% população são canhotos, suponha que se queira achar a probabilidade
de obter exatamente três estudantes canhotos em uma turma de 15 estudantes. Isso se deve
ao fato que algumas carteiras são adaptadas para estudantes canhotos, e a probabilidade
resultante poderia afetar o número de tais carteiras a serem encomendadas para as salas de
aulas. Calcule também a E(X), V(X) e o  .
Solução:
Satisfazendo as condições para ocorrência de um experimento binomial verifica-se que:
1. O número de provas é fixo 15.
2. As provas são independentes, porque o fato de um estudante ser canhoto ou destro
não afeta a probabilidade de outro estudante ser canhoto.
3. Cada prova tem duas categorias de resultado: o estudante é canhoto ou não é.
4. A probabilidade de um estudante ser canhoto (sucesso) é 0,1 e, assim, p =0,1
5. A probabilidade de falha (não-canhoto) é 0,9, logo q = 0,9.
Calculando a probabilidade de 3 estudantes canhotos:
Exercícios
1) A probabilidade de que um animal de uma determinada população seja do sexo
feminino é de 0,20. Se seis animais são selecionados qual, a probabilidade de teremos
exatamente quatro fêmeas.
2) Se a probabilidade de ocorrência de uma determinada doença é de 30%, determinar a
média e o desvio padrão da distribuição desta doença em um total de 800 indivíduos
3) Suponha que a probabilidade de um individuo do sexo masculino, com mais de 60 anos,
vida sedentária e tabagismo ativo de desenvolver uma doença cardiovascular nos
próximos oito anos seja de 40%. A partir de um estudo controle com dez indivíduos
com essas características responda.
a) A probabilidade de que nenhum indivíduo desenvolva a doença.
b) A probabilidade que no máximo dois indivíduos desenvolvam a doença
4) No hospital psiquiátrico 40% dos pacientes internados são alcoólatras. Qual a
probabilidade de que seja internado pelo menos três pacientes alcoólatra em 20
internações.
5) A probabilidade de cura de lupus eritomatoso é de 25% . Considerando oito pacientes
submetidos a tratamento, responda
a) A probabilidade de que todos os indivíduos sejam curados .
c) A probabilidade de que nenhum paciente seja curado
Prof. Janete Pereira Amador
4
d) A probabilidade de que no máximo um paciente seja curado
e) A probabilidade de que pelo menos 50% dos pacientes sejam curados.
3 Va riável Alea tória Contínua (VAC)
Quando uma variável aleatória apresenta um grande número de resultados
possíveis, ou quando a variável aleatória em questão é continua (pode assumir qualquer
valor dentro de um intervalo definido de valores), não se pode usar distribuições discretas
como a de Poisson ou Binomial para obter probabilidades. Como uma variável contínua
inclui, em seus resultados, valores tanto inteiros como não inteiros, não pode ser
adequadamente descrita por uma distribuição discreta. Sendo assim, abordagem mais
conveniente é construir uma função densidade de probabilidade, ou curva de
probabilidade, baseada na função matemática correspondente.
Definição: É aquela que pode tomar qualquer valor em um determinado intervalo. Diz-se
que X é uma VAC, se existir uma função f(x), denominada função densidade de
probabilidade (fdp) de x que satisfaça às seguintes condições:
a) f(x)  0 para todo o x;

b)
 f ( x) dx 1;

3.3 Distribuições Contínuas de Probabilidade
Em muitos problemas se torna matematicamente mais simples considerar um espaço
amostral “idealizado” para uma variável X, no qual todos os números reais (em algum
intervalo específico) passam ser considerados como resultados possíveis. Desta maneira
somos levados as variáveis aleatórias contínuas, principalmente quando as observações
referem-se a medidas como comprimento, peso, temperatura, etc.
Entende-se por distribuição contínua de probabilidade a distribuição que estiver
associada a uma variável aleatória contínua – VAC. Assim se uma variável puder assumir
um conjunto contínuo de valores de um certo conjunto de dados, então a distribuição de
probabilidade P(X) é dita de probabilidade contínua. Desta forma, a seguir estudarmos as
seguintes distribuições de probabilidade:
Distribuição Normal
Distribuição “t” de Student.
Distribuição Qui-quadrado ( x2
Distribuição F de Snedecor
3.3.1 Distribuição Normal
É mais importantes distribuição de probabilidade contínua, sendo aplicada em
inúmeros fenômenos e utilizada para o desenvolvimento teórico da inferência estatística. A
distribuição normal serve também como aproximação para um grande número de
distribuições.
A variável aleatória X que tome todos os valores reais    X   , tem
distribuição normal com parâmetros  e 2 se sua função densidade de probabilidade for
dada por:
f ( x) 
 x  
1
1/ 2 

e    ,
 2
 X  
Prof. Janete Pereira Amador
5
A equação da curva Normal é especificada usando 2 parâmetros: a média
populacional  , e o desvio padrão populacional,  ou equivalentemente a variância
populacional  2 e devem satisfazer as seguintes condições:
a)      
b) 2 > 0
Denotamos
Quando uma variável aleatória X tiver distribuição normal anotaremos.
X  N ( , 2)
A distribuição normal é simétrica em torno da média o que implica que e média, a mediana
e a moda são todas coincidentes.
A distribuição Normal possui as seguintes características:
1. forma campanular, isto é, possui forma de sino, sendo simétrica em relação a média;
2. a variável aleatória pode assumir qualquer valor real;
3. a área total sob a curva é 1; porque essa área corresponde à probabilidade da variável
aleatória assumir qualquer valor real;
4. é uma curva assintótica;
5. possui dois pontos de inflexão;
A configuração da curva é dada por dois parâmetros: a média e a variância.
Mudando a média, muda a posição da distribuição no sentido horizontal. Mudando a
variância, muda a dispersão da distribuição fazendo com que o gráfico mais achatado ou
mais alongado. Tias configurações estão representadas na figura a seguir:
Prof. Janete Pereira Amador
6
Na prática desejamos calcular probabilidades para diferentes valores de  e  .
Para isso, a variável X cuja distribuição é N ( , 2) é transformada numa forma
padronizada com distribuição N (0, 1) (distribuição normal padrão) pois tal
distribuição é tabelada. Nesse caso a função densidade de probabilidade é dada por:
1
 z2
1
f (z) 
.e 2 .
2
Teorema: Se X tiver uma distribuição normal com média  e variância 2 e se Z 
x

então Z terá distribuição normal padronizada.
X 
X  N ( , 2) ==> Z 
 N (0,1)

Esse teorema é usado da seguinte forma:
P( x1 < X < x2 ) = P(z1 < Z < z2), onde:
x1  
x 
z2  2


Desta forma a variável aleatória X transforma-se em variável normal reduzida Z, como
podemos ver graficamente a seguir:
z1 
68,27%
95,45%
99,73%
Vê-se que a nova origem é 0 e o desvio padrão é a unidade de medida. Essa
transformação não altera a forma da distribuição, apenas refere-se a uma nova escala.
A tabela da distribuição normal fornece a probabilidade de Z tomar um valor não
superior a Z0: P(Z  Z0). Tal probabilidade é representada pela área hachurada na figura a
seguir:
Prof. Janete Pereira Amador
7
A importância da distribuição normal padronizada reside no fato de que ela encontrase tabelada, facilitando o cálculo.
Ex1: Determinar área sob a curva normal padronizada à esquerda de 1,72.
Consultando a tabela, vemos que z = 1,72
corresponde área (probabilidade) 0,9573, ou seja,
95,73% da área sob a curva e acima do eixo da v.a.
reduzida estão à esquerda de Z = 1,72. é o mesmo
que dizermos que a probabilidade de Z ser menor
que 1,72 é 0,9573: P(Z <1,72) = 0,9573.
Ex2: Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53.
Na tabela, a Z = -0,53 corresponde a área
(probabilidade) 0,2981: P(Z < 0,53) = 0,2981, isto é
29,81% da área sob a curva e acima do eixo da v.a.
reduzida Z estão abaixo do valor z = -0,53.
Ex3: A concentração de um poluente em água liberada por uma fábrica tem distribuição
N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite
regulatório de 10 ppm?
:
Ex4: Sabe-se que as alturas das plantas de milho de uma certa variedade se distribuem
normalmente com média de 2,20m e desvio padrão de 0,20m. Qual a percentagem
esperada de plantas com altura compreendida entre 2,30 e 2,35m?
X = altura das plantas;
X = N (2,20 ; 0,202);
P (2,30 < X < 2,35) = P (z1 < Z < z2)
2,30  2,20 0,10
2,35  2,20
z1 =

 0,5
e z2 =
 0,75 então;
0,2
0,2
0,2
P (2,30 < X < 2,35 ) = P (0,5 < X < 0,75) = 0,0819 ou 8,19% corresponde a percentagem
de plantas que espera –se alcançar as alturas de 2,30 a 2,35m.
Exercícios
1) Determinar a área sob a curva normal padronizada abaixo de Z= - 0,53.
Prof. Janete Pereira Amador
8
2) Calcule as seguintes probabilidades:
a) P(- 2,3 < Z < 0) =
b) P( 1,50 < Z < 2,32) =
3) As alturas dos alunos de uma determinada escola são normalmente distribuídos com
=1,60 m e  = 0,30 m. Encontre a probabilidade de 1 aluno medir:
a) Entre 1,50 e 1,80 m R: 0,3747
b) Mais de 1,75 m R: 0,3085
c) Menos de 1,48m R: 0,3446
d) Qual deve ser a medida mínima para escolhermos 10% dos mais altos. R: 1,98 m
4) Suponha que o comprimento de recém nascidos do sexo feminino não portadores de
anomalias congênitas seja uma variável aleatória com distribuição aproximadamente
normal de média 48,54cm e desvio padrão 2,5 cm, N~(48,54; 6,25).
a) Qual a probabilidade de um recém nascido ter o comprimento superior a 47,29 cm
b) Qual a probabilidade de um recém nascido ter o comprimento inferior a 44,79 cm
5) Os salários dos diretores das empresas de São Paulo distribuem-se normalmente com
média de R$ 8000,00 e desvio padrão de R$ 5000,00. Qual a percentagem de diretores que
recebem.
a) Menos de R$ 6470,00 R: 0,001107
b) Entre R$ 8920, 00 e R$ 9380,00. R: 0,02994
Download