Estatística - Definições Adicionais Profª Raquel Cymrot 1

Propaganda
DEFINIÇÕES ADICIONAIS:
PROBABILIDADE
Espaço amostral (Ω) é o conjunto de todos os possíveis resultados de um experimento.
Evento é qualquer subconjunto do espaço amostral.
Evento combinado: Possui duas ou mais características
Dois eventos são mutuamente excludentes se não tiverem elementos comuns, isto é, se não puderem
ocorrer simultaneamente.
Eventos coletivamente exaustivos: A união dos eventos é o espaço amostral.
Dois ou mais eventos dizem-se independentes se o conhecimento prévio da ocorrência ou não ocorrência
de um dos eventos não auxiliar a predizer a ocorrência dos demais.
Dois ou mais eventos são dependentes se o conhecimento prévio da ocorrência ou não ocorrência de um
dos eventos auxiliar a predizer a ocorrência dos outros.
ORGANIZAÇÃO DE DADOS:
Variáveis aleatórias: fenômenos ou características examinadas em cada elemento investigado.
População: É o conjunto de todos os elementos ou resultados sobre os quais estamos interessados.
Amostra: É qualquer subconjunto da população.
Distribuição de freqüências: É uma tabela resumida na qual os dados são organizados em grupos de
classes ou categorias convenientemente estabelecidos e numericamente ordenados, contendo as suas
respectivas contagens, as quais são denominadas freqüências absolutas ou freqüências.
Gráficos:
Gráfico de Colunas ou Barras: Utiliza o plano cartesiano com os valores da variável no eixo das
abscissas e as freqüências ou percentagens no eixo das ordenadas. Em geral usar gráfico de barras
horizontais para categorias (variáveis qualitativas) e gráfico de colunas para variáveis quantitativas.
Diagrama de Pareto: É um tipo especial de gráfico de colunas no qual as respostas categorizadas são
representadas em ordem decrescente de classificação de suas freqüências e combinada com um polígono
acumulado na mesma escala.
Gráfico de Disco ou Pizza ou Diagrama Circular: Consiste em repartir o disco em setores circulares
correspondentes às percentagens de cada valor.
Estatística - Definições Adicionais
Profª Raquel Cymrot
1
Gráfico de Linhas: São gráficos em duas dimensões, baseados na representação cartesiana dos pontos no
plano. Este gráfico é útil para representar séries cronológicas.
Histograma: São gráficos de barras verticais nos quais as barras retangulares são construídas nos limites
de cada classe. Os histogramas podem ser de freqüência, de freqüência relativa ou de percentagem.
Polígono de Freqüências (ou percentagens): Os pontos do polígono são obtidos por perpendiculares
traçadas a partir dos pontos médios das classes e de altura proporcional à freqüência (percentagem) de
cada uma das classes. O polígono de percentagem é muito utilizado quando da comparação de dois ou
mais conjuntos de dados. Lembrar que se utilizam as classes fictícias antecedente e sucedente com
freqüências zero.
Gráfico de Box-Plot: Define-se uma “caixa” com o nível superior dado pelo 3º quartil e o nível inferior
pelo 1º quartil. A mediana é representada por um traço no interior da caixa e segmentos de reta são
colocados da caixa até os valores máximo e mínimo que não sejam observações discrepantes (possíveis
“outliers”).
A representação gráfica através do Box-Plot informa, entre outras coisas, a variabilidade e a simetria dos
dados.
Exatidão: É o grau de concordância entre o resultado da medição e o valor verdadeiro convencional da
grandeza medida.
Precisão: É o grau de concordância entre medições independentes de uma característica dentro de
condições específicas, medida através do desvio padrão.
VARIÁVEIS ALEATÓRIAS DISCRETAS
Variável Aleatória Discreta: É uma função X, definida sobre o espaço amostral Ω e que assume valores
num conjunto enumerável de pontos, com certa probabilidade.
Função de Probabilidade ou Distribuição de Probabilidade para uma variável aleatória discreta: É uma
lista mutuamente excludente de todos os possíveis valores assumidos por aquela variável aleatória, de
modo que uma determinada probabilidade de ocorrência esteja associada a cada um destes valores.
Função de Distribuição ou Função Acumulada de Probabilidade de uma variável aleatória discreta X é
definida, para qualquer número real x pela expressão: F(x) = P(X ≤ x).
Dada a variável aleatória X, assumindo os valores X1, X2, ...,Xn, chamamos de valor médio ou
n
Esperança de X ao valor: µ = ∑ xi P ( xi )
i =1
Variância (σ2) de uma variável aleatória discreta é a média ponderada das diferenças ao quadrado entre
cada resultado possível e a sua média aritmética, sendo os pesos as probabilidades de cada um dos
resultados.
n
Onde E ( X 2 ) = ∑ X 2 P( X )
σ 2 = V ( X ) = ∑ [ X i − E ( X i )] 2 P ( X i ) = E[ X − E ( X )] 2 = E ( X 2 ) − [ E ( X )] 2
i =1
Estatística - Definições Adicionais
Profª Raquel Cymrot
2
Desvio Padrão (σ) de uma variável aleatória é a raiz quadrada positiva de sua variância.
Propriedades da esperança:
Se a é uma constante então E(a) = a
E(aX) = a E(X)
Se a e b são constantes então: E(aX+b) = E(aX) + E(b) = aE(X) + b
Se h(X) é uma função de X , então:
E[ h ( X ) = ∑ h ( X ) P ( X )
Propriedades da variância:
Se a é uma constante então V(a) = 0
V(aX) = a2V(X)
Se a e b são constantes então: V(aX+b) = a2V(X)
Variáveis Aleatórias Bidimensionais: Muitas vezes, ao descrever os resultados de um experimento
aleatório, atribuímos a um mesmo ponto amostral os valores de duas variáveis aleatórias. Queremos
conhecer as probabilidades associadas a cada par de variáveis aleatórias.
Distribuição Conjunta de Probabilidades: É a função de probabilidade que atribui probabilidades a cada
par das variáveis aleatórias.
P(x,y) = P(X = x ; Y = y) denota a probabilidade do evento { X = x e Y = y}
Note que a distribuição conjunta é uma distribuição de probabilidades, pois:
P(X = x ; Y = y) ≥ 0 para qualquer x e qualquer y e ∑∑ P ( X = x, Y = y ) = 1
x
y
As variáveis aleatórias X e Y são independentes se para todo para de valores (xi,yj) de X e y tem-se:
P(X = xi , Y = yj) = P(X = xi)P(Y = yj)
Distribuições Marginais: São obtidas facilmente da tabela de distribuição conjunta de probabilidades.
Propriedades das variáveis aleatórias bidimensionais:
Se X e Y são duas variáveis aleatórias então E(X+Y) = E(X) + E(Y)
Generalizando: E(X1+X2+...+Xn) = E(X1) + E(X2) + ...+ E(Xn)
Se X e Y são duas variáveis aleatórias independentes então E(XY) = E(X)E(Y)
Generalizando: Se X1, X2, ..., Xn são variáveis aleatórias independentes então:
E(X1X2 ... Xn) = E(X1)E(X2)...E(Xn)
Estatística - Definições Adicionais
Profª Raquel Cymrot
3
Se X e Y são duas variáveis aleatórias independentes então V(X + Y) = V(X) + V(Y)
Generalizando: Se X1, X2, ..., Xn são variáveis aleatórias independentes então:
V(X1 + X2 + ... + Xn) = V(X1) + V(X2) + ... + V(Xn)
Se X e Y são duas variáveis aleatórias independentes então V(X – Y) = V(X) + V(Y)
Sejam X e Y são duas variáveis aleatórias. A covariância de X e Y é definida por:
COV(X,Y) = E(XY) – E(X)E(Y)
Quando COV(X,Y) = 0 dizemos que X e Y são não correlacionadas, isto é, não existe uma relação linear
entre X e Y.
Se X e Y são duas variáveis aleatórias independentes então COV(X,Y) = 0 (a recíproca não é
verdadeira).
Se X e Y são duas variáveis aleatórias quaisquer, então:
V(X +Y) = V(X) + V(Y) + 2COV(X,Y)
V(aX + bY) = a2V(X) + b2V(Y) + 2abCOV(X,Y)
Coeficiente de Correlação: É uma medida da relação linear entre X e Y que não depende das unidades
destas variáveis. O grau de associação linear entre X e Y varia à medida que ρx,y varia entre –1 e1.
Quanto mais próximo ρx,y estiver de zero, menor será o grau de associação linear entre X e Y. Quando |
ρx,y| = 1 existe uma relação linear perfeita entre X e Y, isto é, Y = aX + b.
O coeficiente de correlação linear de X,Y é definido por:
E ( XY ) − E ( X ) E (Y ) COV ( X , Y )
ρ X ,Y =
=
σ XσY
σ XσY
− 1 ≤ ρ X ,Y ≤ 1
DISTRIBUIÇÕES DISCRETAS
Distribuição Binomial: Uma variável aleatória X tem distribuição Binomial se:
- Há n observações.
- Cada observação vem de uma população infinita com amostragem com ou sem reposição ou de uma
população finita com amostragem com reposição.
- Cada observação tem dois possíveis resultados (sucesso ou fracasso), onde sucesso é o resultado de
interesse.
- As probabilidades p de sucesso e (1 – p) de fracasso permanecem constantes em todas as observações.
- O resultado de uma observação é independente do resultado das outras observações.
X é o número total de sucessos nas n observações e X tem distribuição Binomial.
Notação: X ~ B(n,p)
Distribuição Hipergeométrica: A distribuição hipergeométrica também diz respeito ao número total de
sucessos numa amostra com n observações, porém, os elementos da amostra são retirados sem reposição
de uma população finita. A probabilidade p de sucesso não é mais constante e é afetada pelos resultados
das observações anteriores. Considere um conjunto de N objetos, dos quais k são do tipo I e (N – k) são
Estatística - Definições Adicionais
Profª Raquel Cymrot
4
do tipo II. É feito um sorteio de n objetos ( n < N), ao acaso e sem reposição. Seja X o número total de
objetos do tipo I selecionados. X terá uma distribuição hipergeométrica.
Distribuição de Poisson: Existe um processo de Poisson se pudermos observar eventos discretos numa
área de oportunidade (continuum) de modo que ao encurtarmos tal área suficientemente:
-A probabilidade de se observar exatamente um sucesso no intervalo é estável.
-A probabilidade de se observar mais de um sucesso no intervalo é zero.
-A ocorrência de um sucesso em qualquer intervalo é estatisticamente independente da ocorrência em
qualquer outro intervalo.
VARIÁVEIS ALEATÓRIAS CONTÍNUAS
Variável Aleatória Contínua: É uma variável aleatória X, tal que Rx, o contra domínio de X, seja um
intervalo ou uma coleção de intervalos.
Função Contínua de Probabilidade ou Função de Densidade de Probabilidade: f(x) é uma função
contínua de probabilidade ou função de densidade de probabilidade se satisfizer duas condições:
a)f(x) ≥ 0 para todo x ∈ ( –∝ , ∝)
∞
b)A área definida por f(x) é igual a 1, isto é:
∫ f ( x)dx = 1
−∞
Função de Distribuição Acumulada da variável aleatória contínua X: É definida como:
x
F(x) = P(X ≤ x) =
∫ f ( x)dx
−∞
∞
Esperança de uma variável aleatória contínua X: É definida como E(X) =
∫ xf ( x)dx
−∞
DISTRIBUIÇÕES CONTÍNUAS
Distribuição Uniforme: Uma variável aleatória X tem distribuição uniforme contínua no intervalo [a,b],
a < b, se sua função de densidade de probabilidade for dada por:
⎧ 1
⎪ b−a a≤ x≤b
⎪
f ( x) = ⎨
⎪0 caso contrário
⎪
⎩
Notação: X ~U[a,b]
Distribuição Exponencial: Uma variável aleatória contínua X, assumindo valores não negativos, segue o
modelo exponencial com parâmetro λ > 0 se X é igual à distância entre contagens sucessivas de um
Estatística - Definições Adicionais
Profª Raquel Cymrot
5
processo de Poisson, com média λ >0. A função densidade de probabilidade de X é f(x) =λe–λx para x ≥
0.
Notação: X ~EXP(λ)
Esta distribuição é muito utilizada na teoria de filas, para medir o tempo decorrido entre duas chegadas.
λ é o tempo médio de chegadas por unidade de tempo.
A característica de permitir a translação da origem no cálculo de probabilidades é conhecida como falta
de memória. A distribuição exponencial é a única distribuição contínua com essa característica.
Distribuição Normal: Dizemos que uma variável aleatória contínua X tem distribuição Normal com
parâmetros µ e σ2, se sua função densidade for dada por:
f ( x) =
1
2π σ
−( x−µ )2
e
2σ 2
para –∝ < x < ∝
Notação: X ~ N(µ , σ2)
µ é a média da distribuição e σ é o desvio padrão da distribuição e é igual a distância do ponto de
inflexão da curva até a média µ.
Teorema do Limite Central:
Se X tem qualquer distribuição com média µ e variância σ2, então para n grande (n ≥ 30) tem-se:
⎛ σ2 ⎞
⎟⎟
X ~ N ⎜⎜ µ ;
n
⎝
⎠
⎛ σ2
Se X ~ N(µ ; σ2), então para qualquer n tem-se: X ~ N ⎜⎜ µ ;
n
⎝
⎞
⎟⎟
⎠
Se X1 ~ N (µ1 ; σ12) e X2 ~ N (µ2 ; σ22) sendo X1 e X2 variáveis aleatórias independentes e se Y = a +
b1X1 + b2 X2 então: Y ~ N(a + b1µ1 + b2µ2 ; b12σ12+ b22σ22)
Se X1, X2, ..., Xn são variáveis aleatórias independentes com Xi ~ N(µ ; σ2) e S = X1 + X2 + ...+ Xn,
então: S ~ N (nµ ; nσ2)
AMOSTRAGEM
População é o conjunto de todos os elementos sobre os quais se está a procura de informações.
Amostra é qualquer subconjunto da população.
Amostragem Casual Simples: É um processo de seleção em que cada elemento da população tem igual
probabilidade de pertencer à amostra. Todos os elementos da população devem ser listados e numerados
a fim de se sortear os elementos que farão parte da amostra.
Amostragem Sistemática: Consiste em selecionar uma amostra a partir de uma listagem de todos os
elementos da população, obedecendo a intervalos regulares.
Estatística - Definições Adicionais
Profª Raquel Cymrot
6
Amostragem Estratificada: Suponhamos que uma população esteja dividida em sub-populações,
denominadas estratos, e que de cada estrato retiramos uma amostra casual simples proporcional ao seu
tamanho.
Denominamos de amostra estratificada a amostra obtida através da reunião das amostras
retiradas dos estratos.
Amostragem por Conglomerados: Um conglomerado é um conjunto de elementos amostrais que por
razões de ordem prática ou econômica, tem que ser considerado como uma única unidade. A
amostragem por conglomerados é a obtenção de uma amostra casual simples de conglomerados.
ESTIMAÇÃO DE PARÂMETROS
Parâmetros: São as quantidades da população, em geral desconhecidas e sobre as quais temos interesse.
Notação: Em geral uso de letras gregas.
Estimador: É a combinação dos elementos da amostra, construída com a finalidade de representar ou
estimar um parâmetro de interesse na população. Notação: Em geral uso das letras gregas com acento
circunflexo.
Estimador Não Viciado ou Não Tendencioso: É um estimador que não tende a superestimar ou
subestimar o valor do parâmetro, isto é, seu valor esperado coincide com o parâmetro de interesse.
Estimador Consistente: É um estimador que à medida que o tamanho da amostra aumenta, seu valor
esperado converge para o parâmetro de interesse e sua variância converge para zero.
Dados dois estimadores θˆ1 e θˆ2 não viciados para um parâmetro θ , dizemos que θˆ1 é mais eficiente
que θˆ se V( θˆ ) < V( θˆ ).
2
1
2
Estimativa por Ponto: Consiste em uma única estatística amostral que é utilizada para calcular o valor
real de um parâmetro da população.
Estimativa por Intervalo: Leva em conta a distribuição das amostras da estimativa pontual. O intervalo
construído terá uma determinada confiança ou probabilidade de estar estimando corretamente o valor
real do parâmetro da população. É usual se referir a semi-amplitude do intervalo como erro envolvido na
estimação. O número tabelado é obtido utilizando-se a tabela da distribuição de probabilidades da
estimativa pontual, levando em conta a confiança desejada no intervalo e o tamanho da amostra quando
pertinente.
A única forma de se diminuir o tamanho do intervalo de confiança sem alterar a confiança utilizada é
aumentando o tamanho da amostra. O dimensionamento da amostra deve levar em conta o tamanho do
erro do intervalo de confiança que se deseja obter.
TESTES DE HIPÓTESES
Hipótese estatística: É a afirmação sobre um parâmetro ou forma de uma distribuição de valores
observados.
Estatística - Definições Adicionais
Profª Raquel Cymrot
7
Teste de uma hipótese estatística: É um procedimento que nos permite decidir com base em informações
experimentais pela rejeição ou não rejeição de uma hipótese estatística.
Hipótese nula (H0): É a hipótese que é sempre testada e sempre contém um sinal de igualdade com
relação ao valor do parâmetro especificado. Quando não rejeitamos a hipótese nula, só podemos concluir
que não existem evidências suficientes para garantir a sua rejeição.
Denomina-se Região Crítica (R.C.) de um teste aos possíveis valores da estimativa que levam a rejeição
da hipótese a ser testada (H0).
Valor Crítico: É o valor da estatística a partir do qual rejeitamos a hipótese a ser testada.
Erro Tipo I: Ocorre se a hipótese nula H0 for rejeitada quando de fato é verdadeira e não deveria ser
rejeitada.
Nível de Significância α: É a probabilidade de cometermos o erro tipo I.
Erro Tipo II: Ocorre se a hipótese nula H0 não for rejeitada quando de fato é falsa e deveria ser rejeitada.
β: É a probabilidade de cometermos o erro tipo II.
Poder do teste ou eficácia do teste: É igual a (1 – β), isto é, é a probabilidade de se rejeitar a hipótese
nula quando ela é de fato falsa e deveria ser rejeitada.
Vemos que diminuindo α, aumenta-se β e vice-versa. É impossível zerar os dois tipos de erro. A única
forma de diminuirmos α e β ao mesmo tempo é aumentando o tamanho da amostra.
Nível Descritivo do teste p: É a probabilidade de se obter uma estatística de teste igual ou mais extrema
que o resultado, a partir dos dados da amostra, dado que a hipótese nula H0, seja realmente verdadeira.
Estatística - Definições Adicionais
Profª Raquel Cymrot
8
Download