3. Variáveis Aleatórias Discretas: Uma quantidade X, associada a cada possível resultado do espaço amostral, é denominada de variável aleatória discreta se assume valores num conjunto enumerável, com certa probabilidade. 3.1. Função discreta de probabilidade: A função que atribui a cada valor da variável aleatória sua probabilidade é denominada de função discreta de probabilidade ou, simplesmente, função de probabilidade. A notação a ser utilizada é: P(X = x i ) = p( x i ) = p i, i = 1,2,... ou ainda, X x1 x2 x3 ... pi p1 p2 p3 ... Uma função de probabilidade satisfaz 0 ≤ p i ≤ 1 e ∑p i =1. i 3.2. Função de distribuição de probabilidade: A função de distribuição ou função acumulada de probabilidade de uma variável aleatória discreta X é definida, para qualquer número real x, pela seguinte expressão: F( x ) = P(X ≤ x ) Principais Modelos Discretos: 3.3. Modelo Uniforme Discreto: Seja X uma variável aleatória cujos possíveis valores são representados por x1 , x 2 , x 3 ,..., x k . Dizemos que X segue o modelo Uniforme Discreto se atribui a mesma probabilidade 1/k a cada um desses k valores, isto é, sua função de probabilidade é dada por P(X = x j ) = 1 / k , ∀ j = 1,2,..., k. Seu valor esperado, ou esperança, é dado por: E (X) = Variância: Var(X)= k² −1 . 12 1+ k . 2 3.4. Modelo Bernoulli: Diz-se que uma variável X segue o modelo Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso, respectivamente. Com p representando a probabilidade de sucesso, 0 ≤ p ≤ 1 , sua função discreta de probabilidade é dada por X 0 1 1p pi p Ou, de modo resumido, P(X = x ) = p x (1 − p)1− x , x = 0,1. Esperança: E(X) = p. Variância: Var(X) = p(1-p). 3.5. Modelo Binomial: Considere a repetição de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p. A variável aleatória que conta o número total de sucessos é denominada Binomial com parâmetros n e p e sua função de probabilidade é dada por n P(X = k ) = p k (1 − p) n −k , k = 0,1, 2, ..., n , k n com representando o coeficiente binomial calculado por k n n! = . k k!(n − k )! Utiliza-se a notação X~bin(n,p) para indicar que a variável aleatória X segue o modelo Binomial com parâmetros n e p. Esperança: E(X)= n.p. Variância: Var(X)=np(1-p). 3.6. Modelo Geométrico: Diz-se que uma variável aleatória X tem distribuição Geométrica de parâmetro p, se sua função de probabilidade tem a forma P(X = k ) = p(1 − p) k , 0 ≤ p ≤ 1 e k = 0,1,2,.... Nesse caso, utiliza-se a notação X~G(p). 1− p . Esperança: E(X)= p 1− p Variância: Var(X)= . p² 3.7. Modelo Poisson: Uma variável aleatória X tem distribuição de Poisson com parâmetro λ > 0 , se sua função de probabilidade é dada por e − λ .λk P(X = k ) = k = 0,1,2,..., k! Com o parâmetro λ sendo usualmente referido como a taxa de ocorrência. A notação utilizada é X~Po( λ ). Esperança: E(X) = λ . Variância: Var(X) = λ . 3.8. Modelo Hipergeométrico: Sendo um conjunto de n objetos dos quais m são do tipo I e n-m são do tipo II. Para um sorteio de r objetos (r<n), feito ao acaso e sem reposição, defina X como o número de objetos do tipo I selecionados. Assim a variável aleatória X segue o modelo Hipergeométrico e tem sua função de probabilidade dada pela expressão: m n − m . k r − k P(X = k ) = , k= 0,1, .... , min(r,m). n r Esperança e variância de uma Hipergeométrica (n,m,r): rm Esperança: E(X)= n rm(n − m)(n − r ) Variância: Var(X) = . n ²(n − 1) 4. Medidas Resumo: 4.1. Medidas de Posição: 4.1.1. Medidas de posição para um conjunto de dados: Considere uma variável X com observações representadas por x1 , x 2 ,..., x n . A média desse conjunto é a soma dos valores dividida pelo número total de observações. Isto é, n xi x1 + x 2 + ... + x n ∑ i =1 x obs = = . n n A mediana, representada por md obs , é o valor que ocupa a posição central dos dados ordenados. A moda é dada pelo valor mais frequente e é denotada por mo obs . 4.1.2. Medidas de posição para variáveis aleatórias discretas: Supondo que os possíveis valores da variável aleatória sejam representados por x 1 , x 2 ,..., x n , com correspondentes probabilidades p1 , p 2 ,..., p n . A média, valor esperado ou esperança de uma variável X é dada pela expressão: n E(X) = ∑ x i p i . i =1 A mediana é o valor Md que satisfaz às seguintes condições: P(X ≥ Md ) ≥ 1 / 2 e P(X ≤ Md ) ≥ 1 / 2 , a mediana é o ponto médio do intervalo. A moda, é o valor (ou valores) da variável que tem maior probabilidade de ocorrência, representando-a por Mo, tem-se: P(X = Mo) = max(p1 , p 2 ,..., p n ). 4.2. Medidas de dispersão: 4.2.1. Amplitude de uma variável em um conjunto de dados: A amplitude, referente a uma certa variável, é definida como a diferença entre o maior e o menor valor do conjunto de dados. E é denotada por ∆ . 4.2.2. Variância e desvio-padrão em um conjunto de dados: A variância, referente à variável X de um conjunto de dados, é definida por 1 n ( x i − x obs ) 2 . ∑ n i =1 Para manter a mesma unidade dos dados originais, é conveniente definir o desvio-padrão como sendo dp obs = varobs . varobs = Operação alternativa para o cálculo da variância: varobs = 1 n ∑ x ² i − x ² obs. n i =1 4.3. Variância de uma variável aleatória discreta: Seja X uma variável aleatória com P(X i = x i ) = p i ,i = 1,2,..., n e média µ . A variância de X é a ponderação pelas respectivas probabilidades, dos desvios relativos à média, elevados ao quadrado, isto é, n Var (X ) = ∑ ( x i − µ) 2 p i . i =1 Muitas vezes, variância é denotada por σ² . E o desvio-padrão que é a raiz quadrada da variância, por σ .