DEFINIÇÕES ADICIONAIS: PROBABILIDADE Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento. Evento é qualquer subconjunto do espaço amostral. Evento combinado: Possui duas ou mais características Dois eventos são mutuamente excludentes se não tiverem elementos comuns, isto é, se não puderem ocorrer simultaneamente. Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral. Dois ou mais eventos dizem-se independentes se o conhecimento prévio da ocorrência ou não ocorrência de um dos eventos não auxiliar a predizer a ocorrência dos demais. Dois ou mais eventos são dependentes se o conhecimento prévio da ocorrência ou não ocorrência de um dos eventos auxiliar a predizer a ocorrência dos outros. ORGANIZAÇÃO DE DADOS: Variáveis aleatórias: fenômenos ou características examinadas em cada elemento investigado. População: É o conjunto de todos os elementos ou resultados sobre os quais estamos interessados. Amostra: É qualquer subconjunto da população. Distribuição de freqüências: É uma tabela resumida na qual os dados são organizados em grupos de classes ou categorias convenientemente estabelecidos e numericamente ordenados, contendo as suas respectivas contagens, as quais são denominadas freqüências absolutas ou freqüências. Gráficos: Gráfico de Colunas ou Barras: Utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as freqüências ou percentagens no eixo das ordenadas. Em geral usar gráfico de barras horizontais para categorias (variáveis qualitativas) e gráfico de colunas para variáveis quantitativas. Diagrama de Pareto: É um tipo especial de gráfico de colunas no qual as respostas categorizadas são representadas em ordem decrescente de classificação de suas freqüências e combinada com um polígono acumulado na mesma escala. Gráfico de Disco ou Pizza ou Diagrama Circular: Consiste em repartir o disco em setores circulares correspondentes às percentagens de cada valor. Estatística - Definições Adicionais Profª Raquel Cymrot 1 Gráfico de Linhas: São gráficos em duas dimensões, baseados na representação cartesiana dos pontos no plano. Este gráfico é útil para representar séries cronológicas. Histograma: São gráficos de barras verticais nos quais as barras retangulares são construídas nos limites de cada classe. Os histogramas podem ser de freqüência, de freqüência relativa ou de percentagem. Polígono de Freqüências (ou percentagens): Os pontos do polígono são obtidos por perpendiculares traçadas a partir dos pontos médios das classes e de altura proporcional à freqüência (percentagem) de cada uma das classes. O polígono de percentagem é muito utilizado quando da comparação de dois ou mais conjuntos de dados. Lembrar que se utilizam as classes fictícias antecedente e sucedente com freqüências zero. Gráfico de Box-Plot: Define-se uma “caixa” com o nível superior dado pelo 3º quartil e o nível inferior pelo 1º quartil. A mediana é representada por um traço no interior da caixa e segmentos de reta são colocados da caixa até os valores máximo e mínimo que não sejam observações discrepantes (possíveis “outliers”). A representação gráfica através do Box-Plot informa, entre outras coisas, a variabilidade e a simetria dos dados. Exatidão: É o grau de concordância entre o resultado da medição e o valor verdadeiro convencional da grandeza medida. Precisão: É o grau de concordância entre medições independentes de uma característica dentro de condições específicas, medida através do desvio padrão. VARIÁVEIS ALEATÓRIAS DISCRETAS Variável Aleatória Discreta: É uma função X, definida sobre o espaço amostral Ω e que assume valores num conjunto enumerável de pontos, com certa probabilidade. Função de Probabilidade ou Distribuição de Probabilidade para uma variável aleatória discreta: É uma lista mutuamente excludente de todos os possíveis valores assumidos por aquela variável aleatória, de modo que uma determinada probabilidade de ocorrência esteja associada a cada um destes valores. Função de Distribuição ou Função Acumulada de Probabilidade de uma variável aleatória discreta X é definida, para qualquer número real x pela expressão: F(x) = P(X ≤ x). Dada a variável aleatória X, assumindo os valores X1, X2, ...,Xn, chamamos de valor médio ou n Esperança de X ao valor: µ = ∑ xi P ( xi ) i =1 Variância (σ2) de uma variável aleatória discreta é a média ponderada das diferenças ao quadrado entre cada resultado possível e a sua média aritmética, sendo os pesos as probabilidades de cada um dos resultados. n Onde E ( X 2 ) = ∑ X 2 P( X ) σ 2 = V ( X ) = ∑ [ X i − E ( X i )] 2 P ( X i ) = E[ X − E ( X )] 2 = E ( X 2 ) − [ E ( X )] 2 i =1 Estatística - Definições Adicionais Profª Raquel Cymrot 2 Desvio Padrão (σ) de uma variável aleatória é a raiz quadrada positiva de sua variância. Propriedades da esperança: Se a é uma constante então E(a) = a E(aX) = a E(X) Se a e b são constantes então: E(aX+b) = E(aX) + E(b) = aE(X) + b Se h(X) é uma função de X , então: E[ h ( X ) = ∑ h ( X ) P ( X ) Propriedades da variância: Se a é uma constante então V(a) = 0 V(aX) = a2V(X) Se a e b são constantes então: V(aX+b) = a2V(X) Variáveis Aleatórias Bidimensionais: Muitas vezes, ao descrever os resultados de um experimento aleatório, atribuímos a um mesmo ponto amostral os valores de duas variáveis aleatórias. Queremos conhecer as probabilidades associadas a cada par de variáveis aleatórias. Distribuição Conjunta de Probabilidades: É a função de probabilidade que atribui probabilidades a cada par das variáveis aleatórias. P(x,y) = P(X = x ; Y = y) denota a probabilidade do evento { X = x e Y = y} Note que a distribuição conjunta é uma distribuição de probabilidades, pois: P(X = x ; Y = y) ≥ 0 para qualquer x e qualquer y e ∑∑ P ( X = x, Y = y ) = 1 x y As variáveis aleatórias X e Y são independentes se para todo para de valores (xi,yj) de X e y tem-se: P(X = xi , Y = yj) = P(X = xi)P(Y = yj) Distribuições Marginais: São obtidas facilmente da tabela de distribuição conjunta de probabilidades. Propriedades das variáveis aleatórias bidimensionais: Se X e Y são duas variáveis aleatórias então E(X+Y) = E(X) + E(Y) Generalizando: E(X1+X2+...+Xn) = E(X1) + E(X2) + ...+ E(Xn) Se X e Y são duas variáveis aleatórias independentes então E(XY) = E(X)E(Y) Generalizando: Se X1, X2, ..., Xn são variáveis aleatórias independentes então: E(X1X2 ... Xn) = E(X1)E(X2)...E(Xn) Estatística - Definições Adicionais Profª Raquel Cymrot 3 Se X e Y são duas variáveis aleatórias independentes então V(X + Y) = V(X) + V(Y) Generalizando: Se X1, X2, ..., Xn são variáveis aleatórias independentes então: V(X1 + X2 + ... + Xn) = V(X1) + V(X2) + ... + V(Xn) Se X e Y são duas variáveis aleatórias independentes então V(X – Y) = V(X) + V(Y) Sejam X e Y são duas variáveis aleatórias. A covariância de X e Y é definida por: COV(X,Y) = E(XY) – E(X)E(Y) Quando COV(X,Y) = 0 dizemos que X e Y são não correlacionadas, isto é, não existe uma relação linear entre X e Y. Se X e Y são duas variáveis aleatórias independentes então COV(X,Y) = 0 (a recíproca não é verdadeira). Se X e Y são duas variáveis aleatórias quaisquer, então: V(X +Y) = V(X) + V(Y) + 2COV(X,Y) V(aX + bY) = a2V(X) + b2V(Y) + 2abCOV(X,Y) Coeficiente de Correlação: É uma medida da relação linear entre X e Y que não depende das unidades destas variáveis. O grau de associação linear entre X e Y varia à medida que ρx,y varia entre –1 e1. Quanto mais próximo ρx,y estiver de zero, menor será o grau de associação linear entre X e Y. Quando | ρx,y| = 1 existe uma relação linear perfeita entre X e Y, isto é, Y = aX + b. O coeficiente de correlação linear de X,Y é definido por: E ( XY ) − E ( X ) E (Y ) COV ( X , Y ) ρ X ,Y = = σ XσY σ XσY − 1 ≤ ρ X ,Y ≤ 1 DISTRIBUIÇÕES DISCRETAS Distribuição Binomial: Uma variável aleatória X tem distribuição Binomial se: - Há n observações. - Cada observação vem de uma população infinita com amostragem com ou sem reposição ou de uma população finita com amostragem com reposição. - Cada observação tem dois possíveis resultados (sucesso ou fracasso), onde sucesso é o resultado de interesse. - As probabilidades p de sucesso e (1 – p) de fracasso permanecem constantes em todas as observações. - O resultado de uma observação é independente do resultado das outras observações. X é o número total de sucessos nas n observações e X tem distribuição Binomial. Notação: X ~ B(n,p) Distribuição Hipergeométrica: A distribuição hipergeométrica também diz respeito ao número total de sucessos numa amostra com n observações, porém, os elementos da amostra são retirados sem reposição de uma população finita. A probabilidade p de sucesso não é mais constante e é afetada pelos resultados das observações anteriores. Considere um conjunto de N objetos, dos quais k são do tipo I e (N – k) são Estatística - Definições Adicionais Profª Raquel Cymrot 4 do tipo II. É feito um sorteio de n objetos ( n < N), ao acaso e sem reposição. Seja X o número total de objetos do tipo I selecionados. X terá uma distribuição hipergeométrica. Distribuição de Poisson: Existe um processo de Poisson se pudermos observar eventos discretos numa área de oportunidade (continuum) de modo que ao encurtarmos tal área suficientemente: -A probabilidade de se observar exatamente um sucesso no intervalo é estável. -A probabilidade de se observar mais de um sucesso no intervalo é zero. -A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em qualquer outro intervalo. VARIÁVEIS ALEATÓRIAS CONTÍNUAS Variável Aleatória Contínua: É uma variável aleatória X, tal que Rx, o contra domínio de X, seja um intervalo ou uma coleção de intervalos. Função Contínua de Probabilidade ou Função de Densidade de Probabilidade: f(x) é uma função contínua de probabilidade ou função de densidade de probabilidade se satisfizer duas condições: a)f(x) ≥ 0 para todo x ∈ ( –∝ , ∝) ∞ b)A área definida por f(x) é igual a 1, isto é: ∫ f ( x)dx = 1 −∞ Função de Distribuição Acumulada da variável aleatória contínua X: É definida como: x F(x) = P(X ≤ x) = ∫ f ( x)dx −∞ ∞ Esperança de uma variável aleatória contínua X: É definida como E(X) = ∫ xf ( x)dx −∞ DISTRIBUIÇÕES CONTÍNUAS Distribuição Uniforme: Uma variável aleatória X tem distribuição uniforme contínua no intervalo [a,b], a < b, se sua função de densidade de probabilidade for dada por: ⎧ 1 ⎪ b−a a≤ x≤b ⎪ f ( x) = ⎨ ⎪0 caso contrário ⎪ ⎩ Notação: X ~U[a,b] Distribuição Exponencial: Uma variável aleatória contínua X, assumindo valores não negativos, segue o modelo exponencial com parâmetro λ > 0 se X é igual à distância entre contagens sucessivas de um Estatística - Definições Adicionais Profª Raquel Cymrot 5 processo de Poisson, com média λ >0. A função densidade de probabilidade de X é f(x) =λe–λx para x ≥ 0. Notação: X ~EXP(λ) Esta distribuição é muito utilizada na teoria de filas, para medir o tempo decorrido entre duas chegadas. λ é o tempo médio de chegadas por unidade de tempo. A característica de permitir a translação da origem no cálculo de probabilidades é conhecida como falta de memória. A distribuição exponencial é a única distribuição contínua com essa característica. Distribuição Normal: Dizemos que uma variável aleatória contínua X tem distribuição Normal com parâmetros µ e σ2, se sua função densidade for dada por: f ( x) = 1 2π σ −( x−µ )2 e 2σ 2 para –∝ < x < ∝ Notação: X ~ N(µ , σ2) µ é a média da distribuição e σ é o desvio padrão da distribuição e é igual a distância do ponto de inflexão da curva até a média µ. Teorema do Limite Central: Se X tem qualquer distribuição com média µ e variância σ2, então para n grande (n ≥ 30) tem-se: ⎛ σ2 ⎞ ⎟⎟ X ~ N ⎜⎜ µ ; n ⎝ ⎠ ⎛ σ2 Se X ~ N(µ ; σ2), então para qualquer n tem-se: X ~ N ⎜⎜ µ ; n ⎝ ⎞ ⎟⎟ ⎠ Se X1 ~ N (µ1 ; σ12) e X2 ~ N (µ2 ; σ22) sendo X1 e X2 variáveis aleatórias independentes e se Y = a + b1X1 + b2 X2 então: Y ~ N(a + b1µ1 + b2µ2 ; b12σ12+ b22σ22) Se X1, X2, ..., Xn são variáveis aleatórias independentes com Xi ~ N(µ ; σ2) e S = X1 + X2 + ...+ Xn, então: S ~ N (nµ ; nσ2) AMOSTRAGEM População é o conjunto de todos os elementos sobre os quais se está a procura de informações. Amostra é qualquer subconjunto da população. Amostragem Casual Simples: É um processo de seleção em que cada elemento da população tem igual probabilidade de pertencer à amostra. Todos os elementos da população devem ser listados e numerados a fim de se sortear os elementos que farão parte da amostra. Amostragem Sistemática: Consiste em selecionar uma amostra a partir de uma listagem de todos os elementos da população, obedecendo a intervalos regulares. Estatística - Definições Adicionais Profª Raquel Cymrot 6 Amostragem Estratificada: Suponhamos que uma população esteja dividida em sub-populações, denominadas estratos, e que de cada estrato retiramos uma amostra casual simples proporcional ao seu tamanho. Denominamos de amostra estratificada a amostra obtida através da reunião das amostras retiradas dos estratos. Amostragem por Conglomerados: Um conglomerado é um conjunto de elementos amostrais que por razões de ordem prática ou econômica, tem que ser considerado como uma única unidade. A amostragem por conglomerados é a obtenção de uma amostra casual simples de conglomerados. ESTIMAÇÃO DE PARÂMETROS Parâmetros: São as quantidades da população, em geral desconhecidas e sobre as quais temos interesse. Notação: Em geral uso de letras gregas. Estimador: É a combinação dos elementos da amostra, construída com a finalidade de representar ou estimar um parâmetro de interesse na população. Notação: Em geral uso das letras gregas com acento circunflexo. Estimador Não Viciado ou Não Tendencioso: É um estimador que não tende a superestimar ou subestimar o valor do parâmetro, isto é, seu valor esperado coincide com o parâmetro de interesse. Estimador Consistente: É um estimador que à medida que o tamanho da amostra aumenta, seu valor esperado converge para o parâmetro de interesse e sua variância converge para zero. Dados dois estimadores θˆ1 e θˆ2 não viciados para um parâmetro θ , dizemos que θˆ1 é mais eficiente que θˆ se V( θˆ ) < V( θˆ ). 2 1 2 Estimativa por Ponto: Consiste em uma única estatística amostral que é utilizada para calcular o valor real de um parâmetro da população. Estimativa por Intervalo: Leva em conta a distribuição das amostras da estimativa pontual. O intervalo construído terá uma determinada confiança ou probabilidade de estar estimando corretamente o valor real do parâmetro da população. É usual se referir a semi-amplitude do intervalo como erro envolvido na estimação. O número tabelado é obtido utilizando-se a tabela da distribuição de probabilidades da estimativa pontual, levando em conta a confiança desejada no intervalo e o tamanho da amostra quando pertinente. A única forma de se diminuir o tamanho do intervalo de confiança sem alterar a confiança utilizada é aumentando o tamanho da amostra. O dimensionamento da amostra deve levar em conta o tamanho do erro do intervalo de confiança que se deseja obter. TESTES DE HIPÓTESES Hipótese estatística: É a afirmação sobre um parâmetro ou forma de uma distribuição de valores observados. Estatística - Definições Adicionais Profª Raquel Cymrot 7 Teste de uma hipótese estatística: É um procedimento que nos permite decidir com base em informações experimentais pela rejeição ou não rejeição de uma hipótese estatística. Hipótese nula (H0): É a hipótese que é sempre testada e sempre contém um sinal de igualdade com relação ao valor do parâmetro especificado. Quando não rejeitamos a hipótese nula, só podemos concluir que não existem evidências suficientes para garantir a sua rejeição. Denomina-se Região Crítica (R.C.) de um teste aos possíveis valores da estimativa que levam a rejeição da hipótese a ser testada (H0). Valor Crítico: É o valor da estatística a partir do qual rejeitamos a hipótese a ser testada. Erro Tipo I: Ocorre se a hipótese nula H0 for rejeitada quando de fato é verdadeira e não deveria ser rejeitada. Nível de Significância α: É a probabilidade de cometermos o erro tipo I. Erro Tipo II: Ocorre se a hipótese nula H0 não for rejeitada quando de fato é falsa e deveria ser rejeitada. β: É a probabilidade de cometermos o erro tipo II. Poder do teste ou eficácia do teste: É igual a (1 – β), isto é, é a probabilidade de se rejeitar a hipótese nula quando ela é de fato falsa e deveria ser rejeitada. Vemos que diminuindo α, aumenta-se β e vice-versa. É impossível zerar os dois tipos de erro. A única forma de diminuirmos α e β ao mesmo tempo é aumentando o tamanho da amostra. Nível Descritivo do teste p: É a probabilidade de se obter uma estatística de teste igual ou mais extrema que o resultado, a partir dos dados da amostra, dado que a hipótese nula H0, seja realmente verdadeira. Estatística - Definições Adicionais Profª Raquel Cymrot 8