estatística ii - Prof. Herivelto Tiago Marcondes dos Santos

Propaganda
FACULDADE DE TECNOLOGIA DE GUARATINGUETÁ
ESTATÍSTICA II
Nota de aula 1
Prof. MSc. Herivelto T Marcondes dos Santos
Fevereiro /2009
1 Modelos de probabilidade
1.1 Variável aleatória
Definição: Sejam ε um experimento e S um espaço amostral associado ao experimento. Uma função X, que
associe a cada s∈
∈S um número real, X(s), é denominada variável aleatória.
Exemplo 1: No lançamento independente de duas moedas obtemos as faces: S = {(Cara, Cara), (Cara, Coroa),
(Coroa, Cara), (Coroa, Coroa)}. Nesse caso, pode-se afirmar que o número de caras X, associado a cada
experimento s∈
∈S, deve ser considerado um X(s) = {2, 1, 1, 0}.
1.2 Variável aleatória discreta
Definição: Seja X uma variável aleatória. Se o número de valores possíveis de X for finito ou infinito
numerável, denominar-se-á X como variável aleatória discreta. Isto é, os valores possíveis de X, podem ser
colocados em listas como x1, x2, x3,..., xn.
Definição: Se X é uma variável aleatória discreta então, a cada valor possível de xi, associaremos um número
p(xi) = IP[X = xi], denominado probabilidade de xi. Esses valores devem satisfazer as seguintes condições:
a. 0, ∀
b. ∑
1
1.2.1
A função p, definida anteriormente, é denominada função de probabilidade da variável aleatória X. A
coleção de pares (xi, p(xi)) é denominada distribuição de probabilidade.
1.3 Variável aleatória contínua
Definição: Diz-se que X é uma variável aleatória contínua, se existir uma função f, denominada função
densidade de probabilidade (f.d.p.) de X que satisfaça as seguintes condições:
a. 0, ,
b. 1
/
c. Para quaisquer a, b, com # ∞ % a % b % &∞, implica que )*+ , - , . 0 1.4 Função distribuição Acumulada
Definição: Seja X uma variável aleatória, discreta ou contínua. Define-se a função F como a função
distribuição acumulada da variável aleatória X como:
1 )*- , 2
2 Principais modelos discretos de probabilidade
2.1 Modelo Uniforme Discreto
Seja X uma variável aleatória cujos valores possíveis são representados por x1, x2, x3,..., xk. Diz-se que X
segue o modelo Uniforme Discreto se atribui a mesma probabilidade 1/k a cada um desses k valores, isto é,
sua função de probabilidade é dada por
)*2- -3 4 1
, 6 1, 2, … , 5
5
Exemplo 2. Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de
21 a 25, e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem tem a maior
possibilidade de ser sorteado?
Solução. Pela definição acima ocorre que todos os 100 bilhetes do sorteio apresentam a mesma probabilidade
de serem sorteados, )*9- 3 : ;; , 5 1,2,3, . . . , 100 . Se ambos os indivíduos apresentam o mesmo
número de bilhetes, logo a probabilidade de serem sorteados é a mesma )*>21 % - % 25@ ∑AB
3A )*9- B
B
3 @ ;; C )*>- @ & )*>- @ & )*>- AD @ & )*>- EF @ & )*>- DG @ ;;
Exemplo 3. Sendo X uma variável seguindo o modelo Uniforme Discreto, com valores no conjunto {1, 2, 3,
..., 10}, pergunta-se:
J
a. )*>- 7@ I. ;
J
b. )*>3 % - , 7 @ I. ;
J
c. )*>- % 2 KL - 8@ I. ;
E
d. )*>- 5 KL - N 8@ I. ;
A
e. )*>- N 3 C - % 6@ I. ;
f.
J
)*>- , 9|- 6@ I. B
Exemplo 4. Uma manufatura deve escolher 1 funcionário por semana para fazer inspeção em suas máquinas
antes de cada turno de trabalho. Nesse caso poderá haver repetição, ou seja, um mesmo funcionário pode ser
escolhido em semanas consecutivas. Se há 10 funcionários nesse setor, qual é a probabilidade algum
funcionário ser escolhido para fazer a inspeção? E, se não ocorresse repetição até que o último dos 10
participe da escala, o que muda?
3
2.2 Modelo de Bernoulli [X~b(p)]
Diz-se que uma variável X segue o modelo de Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso,
respectivamente. Com p representando a probabilidade de sucesso, 0 , , 1, sua função discreta de
probabilidade é dada por:
)*- 5 R 1 # R , 5 0,1, ou ainda,
X
0
1
p(xi)
1-p
p
A repetição de n ensaios de Bernoulli independentes dá origem à mais importante variável aleatória discreta,
denominada modelo Binomial.
Exemplo 5. Sabe-se que a ocorrência de peças com algum tipo de imperfeição em uma linha de produção é de
10%. Escolhem-se três peças, ao acaso, e deseja-se verificar o número de peças defeituosas nesse grupo,
evento que será representado por D. Construa uma árvore de probabilidades que contemple todas as
possibilidades essa averiguação.
Defeituosa
D
10%
D 10%
DC 90%
Árvore de
probabilidades
Não
defeituosa
DC
90%
Evento
D 10%
DC 90%
D 10%
DC 90%
D 10%
DC 90%
D 10%
DC 90%
D 10%
DC 90%
Probabilidade
X
DDD
(0,1)3
3
DDDC
(0,9) (0,1)2
2
DDCD
(0,9) (0,1)2
2
DCDD
(0,9) (0,1)2
2
2
(0,9) (0,1)
1
2
(0,9) (0,1)
1
2
1
DDC DC
C
C
D DD
C
C
D D D
(0,9) (0,1)
4
(0,9)3
DCDCDC
0
A tabela anterior permite concluir que a ocorrência de n ensaios independentes de Bernoulli e todos com
mesma probabilidade de sucesso p é representada pela função de probabilidade dada por: )* S- 5 T 2UR4R 1 # UR , 5 0, 1, 2, 3, … , V. No caso do exemplo, pode-se representar a variável X: Número
de peças que apresentam algum tipo de imperfeição a função de probabilidade será dada por:
X
pi
0
(0,9)
1
3
2
2
3(0,9) (0,1) 3(0,9)(0,1)
3
2
(0,1)3
G
Ou ainda, )* S- 5 T 2R40,1R 1 # 0,1GR , 5 0, 1, 2, 3
Onde:
k=0; )*S- 0T 2G;40,1; 1 # 0,1G; 0,9G
k=1; )*S- 1T 2G40,1 1 # 0,1G 30,9A 0,1
k=2; )*S- 2T 2GA40,1A 1 # 0,1GA 30,90,1A
k=3; )*S- 3T 2GG40,1G 1 # 0,1GG 0,1G
2.3 Modelo Binomial [X~B(n, p)]
Considere a repetição de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso
p. A variável que conta o número total de sucessos é denominada Binomial com parâmetros n e p e sua função
de probabilidade é dada por:
V
V
U!
)*- 5 W X R 1 # UR , 5 0, 1, 2, … , V e W X R!UR!
5
5
Exemplo 6: Sabe-se, que na maioria das seleções de estágio, a exigência pela fluência em outro idioma é fator
requerido e diferencial para o profissional candidato. Por experiência verificou-se que apenas 5% dos
candidatos que buscam vagas de estágio em grandes empresas têm a fluência em outro idioma. Uma empresa
seleciona ao acaso 15 candidatos para sua seleção de estágio e deseja-se verificar qual a probabilidade de
nenhum deles apresentar fluência em outro idioma. E, qual a probabilidade de todos os candidatos serem
fluentes em outro idioma?
5
Solução. Suponha que temos 15 ensaios de Bernoulli independentes, dos quais a probabilidade de sucesso, ou
seja, a probabilidade de ser fluente em outro idioma é dada por 0,05, logo temos um modelo de probabilidade
que representa bem esses eventos dado por:
)*S- 5T 2B
40,05R 1 # 0,05BR , 5 0, … , 15, isto é, para a ocorrência de pessoas que são fluentes
R
em outro idioma, a probabilidade de sucesso é 0,05.
Por outro lado, se o desejo é saber qual a possibilidade de ocorrência de pessoas que não são fluentes em outro
idioma, a probabilidade de sucesso é 0,95 e o modelo de probabilidade será:
)*SZ 5T 2B
40,95R 1 # 0,95BR , 5 0, … , 15. {A mudança de variável é feita apenas para não
R
ocorrer confusão entre aptos e não aptos}.
Logo, a probabilidade de nenhum dos candidatos serem fluentes em outro idioma é igual a
)*S- 0T 2B
40,05R 1 # 0,05B; 0,95B 0,4633 e a probabilidade de todos serem fluentes é
;
(0,05)15≅ 0. Daí pode-se concluir que a possibilidade não haver pessoas fluentes em outro idioma é de 46,33%
porém com a possibilidade de 53,77% de haver ao menos um candidato com as características desejadas. De
outra maneira, é improvável que todos os candidatos tenham fluência em outro idioma afinal a probabilidade
de todos serem fluentes é nula.
2.4 Modelo Geométrico [X~G(p)]
Diz-se que uma variável aleatória X tem distribuição Geométrica de parâmetro p, se sua função de
probabilidade tem a forma:
)*- 5 R 1 # , 0 , , 1 C 5 0, 1, 2, …
Exemplo 7. Uma linha de produção está sendo analisada para efeito de controle de qualidade das peças
produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que
uma peça defeituosa é observada. Se 0,01 é a probabilidade da peça ser defeituosa, deseja-se verificar o
comportamento da variável quantidade de peças boas produzidas antes da 1ª defeituosa.
Assim temos, )*\ 5 0,010,99R e seu gráfico dado pela Figura 1
6
IP(Q=k)
0
10
20
30
40
50
60
k
Figura 1 Gráfico do modelo Geométrico de parâmetro p=0,01
O gráfico permite concluir que a probabilidade reduz a valores pequenos para os maiores valores de k. Em
tese, a produção nunca seria interrompida se não houvesse o aparecimento de uma peça defeituosa.
2.5 Modelo de Poisson [X~Po(λ)]
Uma variável aleatória X tem distribuição de Poisson com parâmetro λ>0, se sua função de probabilidade é
dada por:
)*- 5 ] ^_ `a
R!
, k = 0, 1, 2,...
Com parâmetro λ sendo usualmente referido como a taxa de ocorrência.
Observação: O modelo de Poisson é usado com freqüência em experimentos físicos e biológicos e, no caso, λ
é a freqüência média ou esperada de ocorrências num intervalo de tempo.
Uma das aplicações interessantes e que prestam bons resultados pelo uso do modelo de Poisson é a
observação de eventos que ocorrem segundo uma taxa de freqüência. Sempre que houver possibilidade de
tratar um evento que ocorre segundo um valor médio, ou valor médio esperado, então, pode-se tentar aplicar o
modelo de Poisson.
Exemplo 8. Engenheiros da companhia telefônica estudam se o modelo de Poisson pode ser ajustado ao
número N de chamadas interestaduais que chegam, por hora, a uma central telefônica, durante o período
noturno. Os dados coletados, referentes a 650 períodos de uma hora, estão apresentados a seguir:
7
Chamadas
0
1
2
3
4
5
6
7
≥8
Freqüência observada
9
38
71
115
125
106
79
50
57
Da tabela, tem-se que, por exemplo, em 125 períodos de uma hora ocorreram 4 chamadas. Os engenheiros
sugerem uma taxa de ocorrência de 4,5 chamadas por hora no período estudado. Seguindo o modelo indicado,
a freqüência esperada de ocorrências com k chamadas é obtida multiplicando 650 (o total de observações) pela
probabilidade de k chamadas. Assim, para k =2, tem-se
Freqüência esperada para 2 chamadas = 650)* b 2 650
] ^c,d J,Be
A!
73,13. Logo, pode-se
construir essa tabela de comparação de resultados observados e esperados.
Chamadas
Freqüência observada
Esperada
0
1
2
3
4
5
6
7
≥8
9
38
71
115
125
106
79
50
57
7,22 32,50 73,13 109,66 123,37 111,02 83,27 53,56 56,36
O que permite concluir que as freqüências esperadas e observadas têm aderência e o modelo de Poisson
parece ser adequado. Tome cuidado para concluir a funcionalidade do modelo, mas já tem um bom indicativo
de qual modelo é mais adequado para representar as chamadas da central telefônica.
8
Download