1304 -Análise de Dados e Probabilidade 1 e 2 Clara Costa Duarte

Propaganda
Licenciatura
1304 -Análise de Dados e Probabilidade
1e2
1º Semestre 2006/2007
Clara Costa Duarte
1304- Análise de Dados e Probabilidade
1.1 – Introdução
Estatística:é um conjunto de instrumentos que servem para:
Recolher
Descrever e explorar
Interpretar
Dados numéricos
Estatística Descritiva: Procura sintetizar e representar de forma
compreensível a informação contida num conjunto de dados
Inferência Estatística: Pretende a partir de um conjunto restrito
de dados caracterizar um conjunto mais amplo
1304- Análise de Dados e Probabilidade
1.2 – Conceitos Básicos
População: Conjunto de elementos com característica(s) comum
(s) que pretendemos estudar. (ou o conjunto dos dados que
medem essa (s) característica (s)).
Amostra: Subconjunto representativo da população.
Unidade estatística : Elemento pertencente à população
Atributo ou Característica (Variável Estatística): Factor que
permite classificar a unidade estatística:
. Qualitativa (várias modalidades)
. Quantitativa (diferentes valores) : pode ser
Discreta ou Contínua
Dado Estatístico ou Observação: o registo da característica de
uma unidade estatística
1304- Análise de Dados e Probabilidade
1.2 – Conceitos Básicos
Terminologia :
•
Variável Estatística X
•
Colecção de dados com N elementos : Os dados estatísticos
resultantes são n valores designados por: x1, x2, ...xi,.... xn,
•
Frequência Absoluta (ni) : nº de vezes que a modalidade ou a
classe i é observada na base de dados.
•
Frequência Relativa (fi) : o mesmo em %
•
Frequência Absoluta Acumulada (Si) : nº de vezes que a
Variável tem valores ≤ à modalidade ou classe i
•
Frequência Relativa Acumulada (Fi) : o mesmo em %
1304- Análise de Dados e Probabilidade
2 – Classificação e Representação dos Dados
. Variáveis Discretas (Exemplo)
Quadro de Frequências
Representação Gráfica
. Distribuição de Frequências (Diagrama de Barras)
. Distribuição de Frequências Acumuladas
Representação Matemática
. Função Cumulativa da Frequência
F(x) = F(li-1) = Fi-1 ,
li-1≤ x< li
1304- Análise de Dados e Probabilidade
2 – Classificação e Representação dos Dados
. Variáveis Contínuas (Exemplo)
Quadro de Frequências
. l0 ≤ Min {xi} e
lj ≥ Max {xi}
. Escolha do número de Classes- várias formulas
. Estimar a amplitude e decidir
. Determinar os limites das classes
1304- Análise de Dados e Probabilidade
2 – Classificação e Representação dos Dados
. Variáveis Contínuas (Exemplo)
Representação Gráfica
. Distribuição de Frequências (Histograma; Polígono de Frequências)
. Distribuição de Frequências Acum. (Polígono Integral)
Representação Matemática
. Função Cumulativa da Frequência F(x)
x − li −1
fi,
F ( x) = Fi −1 +
li − li −1
Em que F(li)=Fi
li-1≤ x ≤ li
1304- Análise de Dados e Probabilidade
2 – Classificação e Representação dos Dados
. Variáveis Contínuas (Exemplo)
Histograma (Diagrama de áreas)- Sucessão de rectângulos
tendo por base o intervalo da classe e por altura a respectiva frequência
dividida pela amplitude da classe.
. Área de cada rectângulo =
ni
ou
fi
. Área total do Histograma =
N
ou
1
Caso particular: Todas as classes de igual amplitude é usual tomar-se
para altura dos rectângulos - ni ou fi
Polígono de Frequências- Obtêm-se unido os pontos
médios dos lados superiores dos rectângulos do Histograma. (+ 2
classes nos extremos com frequência 0)
Área total do Histograma = Área total do Polígono de Frequências
1304- Análise de Dados e Probabilidade
Variável Contínua e População infinita
Se N
∞ e
h
0
Histograma de área 1
Curva de Frequência
A área compreendida entre dois pontos x=a e x=b
Frequência relativa
Se N
∞ e
h
Polígono Integral
Probabilidade
0
Função de distribuição
Licenciatura
1304 -Análise de Dados e Probabilidade
3
1º Semestre 2006/2007
Clara Costa Duarte
1304- Análise de Dados e Probabilidade
3 – Variáveis Estatísticas Unidimensionais
Principais aspectos a considerar no estudo de uma uma
colecção de dados são:
. Localização
. Dispersão
. Assimetria
. Achatamento
das correspondentes distribuições de frequência.
Como medir estes aspectos?
1304- Análise de Dados e Probabilidade
3.1– Medidas de Localização Central (Média)
Definição:
N
∑ xi
x1 + x2 + ... + xN i =1
=
x=
N
N
Ou para dados classificados
n1 x1′ + ... + n j x′j
=
x=
N
j
∑ ni xi′
i =1
N
j
= ∑ f i xi′
i =1
Vantagens: Usa a totalidade das observações, fácil interpretação e
cálculo, definição rigorosa
Desvantagens: Muito sensível a valores extremos; pode não ser um
valor observado
1304- Análise de Dados e Probabilidade
Propriedades da Média:
1.
A soma dos valores observados é o produto da média pelo número
de observações
2.
A soma dos desvios dos valores observados relativamente à média
é zero.
3.
A soma
n
∑ ( xi − c)2 é mínima quando c = x
i =1
4.
Se adicionarmos c a todos os valores observados então a média
fica adicionada de c
5.
Se multiplicarmos por c todos os valores observados então a média
fica multiplicada por c
6.
Se adicionarmos todos os valores observados de duas colecções de
dados então a média da variável soma é igual à soma das médias
7.
Quando um conjunto de observações é dividido em j subcolecções, a média principal é igual à media ponderada das médias
dos subconjuntos.
1304- Análise de Dados e Probabilidade
Média Geométrica
Definição:
1
N
N
xg = ( x1 x2 ...xN ) = (∏ xi )
1
N
i =1
Ou para dados classificados:
1
N
j
xg = ( x1′ ...x′j ) = (∏ xi′ )
n1
nj
ni
i =1
1
N
_________________________________________________________
Média Harmónica
Definição:
N
xh = N
1
∑x
i =1 i
Ou para dados classificados:
xh =
N
j
ni
∑ x′
i =1 i
1304- Análise de Dados e Probabilidade
3.1– Medidas de Localização Central (Mediana)
Valores ordenados : x(1) ≤ x(2) ≤ ...≤ x(N)
Definição:
~
x = x N +1
(
~
x=
2
para N impar
)
x N + x N+1
( )
2
(
2
)
2
para N par
Ou para dados classificados:
0.5 − Fe −1
~
x = le −1 +
(le − le −1 )
fe
em que e é a classe da mediana
1304- Análise de Dados e Probabilidade
Propriedade da Mediana:
n
A soma
∑ xi − c
é mínima quando
c=~
x
i =1
Vantagens: Pouco sensível a valores extremos.
Desvantagens:Cálculo mais complexo; pouco significativo em
amostras pequenas; maior variabilidade
1304- Análise de Dados e Probabilidade
3.1– Medidas de Localização Central (Moda)
Definição: Valor que ocorre com maior frequência no
conjunto das observações.
Para dados classificados, quantitativos contínuos, define-se
a classe modal, como a classe com maior frequência
(apenas se todas as classes forem de igual amplitude).
f m+1
Moda = lm−1 +
(lm − lm−1 )
f m−1 + f m+1
em que m é a classe modal
Vantagens: Pouco sensível a valores extremos.
Desvantagens: Pouco significativo em amostras pequenas; para
variáveis contínuas cálculo mais complexo e de difícil
interpretação .
1304- Análise de Dados e Probabilidade
3.1– Medidas de Localização Não Central (Quantil)
Para dados discretos ou contínuos não classificados:
Definição: Quantil de ordem α (0< α <1) é
Zα = x(k )
em que k é o maior inteiro menor que (Nα)+1
Para dados classificados, quantitativos e contínuos:
Definição: Quantil de ordem α (0< α <1) é
x tal que
F (x) = α
1304- Análise de Dados e Probabilidade
3.1– Medidas de Localização Não Central (Quantil)
Casos Particulares:
Quartil (qk) : Dividir os dados em 4 partes iguais, definem-se 3 quartis.
Quartil de ordem k (k =1,2,3) = Quantil de ordem α=k/4
Decil (dk) : Dividir os dados em 10 partes iguais, definem-se 9 decis.
Decil de ordem k (k =1,2,...,9) = Quantil de ordem α=k/10
Percentil (pk) : Dividir os dados em 100 partes iguais, definem-se 99 percentis.
Percentil de ordem k (k =1,2,...,99) = Quantil de ordem α=k/100
~
x = p50 = d5 = q2
p10 =d1, p20 =d2 ,......
p25 =q1 , p50 =q2 , p75 =q3
1304- Análise de Dados e Probabilidade
3.2– Medidas de Dispersão
Existem 2 tipos de medidas de dispersão:
i) Definidas a partir da relação com um ponto fixo da amostra (Média)
Variância (s2) e desvio padrão (s) ; Desvio absoluto médio (δx)
Coeficiente de dispersão ou de variação (cv)
ii) Definidas a partir das estatísticas ordinais
Amplitude total ( r) ; Amplitude Inter quartil ( rq)
Desvio quartil reduzido
1304- Análise de Dados e Probabilidade
3.2– Medidas de dispersão (Variância e Desvio Padrão)
Definição: Média Aritmética do quadrado dos desvios para a média
N
2
( x1 − x ) + ( x2 − x ) + ... + ( x N − x )
=
s =
N
2
2
2
2
∑ ( xi − x )
i =1
N
Para dados classificados:
j
s2 =
∑ ni ( xi′ − x )
2
i =1
N
Para amostras pequenas é mais correcto dividir por N-1
O Desvio Padrão é a raiz quadrada positiva da Variância
Tem a vantagem de se exprimir nas mesmas unidades que a amostra.
1304- Análise de Dados e Probabilidade
Propriedades da Variância e do Desvio Padrão:
1.
A variância e o desvio padrão são sempre valores não negativos.
2.
Decomposição da Variância: A variância é igual à média dos quadrados das
observações menos o quadrado da média.
3.
Seja yi = ( xi − x ) / s x para todo i, A variável Y tem média de 0 e variância de 1
4.
Se adicionarmos c a todos os valores observados a variância e o desvio padrão
não se alteram.
5.
Se multiplicarmos por c todos os valores observados então a variância fica
multiplicada por c2 e o desvio padrão por |c |.
6.
Quando um conjunto de observações é dividido em j sub-colecções, a variância
principal relaciona-se com as variâncias das sub-colecções pela expressão:
j
s2 =
2
N
s
∑ kk
k =1
N
j
+
2
N
(
x
−
x
)
∑ k k
k =1
N
1304- Análise de Dados e Probabilidade
3.2– Medidas de dispersão (Desvio Médio)
Definição: Média dos módulos dos desvios para a média
N
xi − x
x1 − x + x2 − x + .. + x N − x ∑
= i=1
δx =
N
N
Para dados classificados:
j
∑ ni xi′ − x
δ x = i=1
N
Esta medida pode ser definida em relação a outro valor central
Propriedades
1.
O desvio médio é mínimo quando tomado em relação à mediana
2.
O desvio padrão é maior que o desvio médio
Desvantagem: O cálculo do módulo é mais difícil de tratar em termos
informáticos
1304- Análise de Dados e Probabilidade
3.2– Medidas de dispersão (Coeficiente de variação)
Definição:
s
cv =
x
Esta é uma medida de dispersão relativa, como não depende das unidades da
amostra permite comparar distribuições de variáveis com unidades ou
médias diferentes.
Não é definido quando a média é 0, pelo que só deve ser utilizado quando as
observações tem todos o mesmo sinal.
1304- Análise de Dados e Probabilidade
3.2– Medidas de dispersão
Medidas de dispersão absoluta
Amplitude Total: Diferença entre o maior e o menor valor da amostra
r = x(N) - x(1)
Amplitude Interquartil:
Medida de dispersão relativa
Desvio quartil reduzido:
rq = q3 – q1
q3 − q1
~
x
1304- Análise de Dados e Probabilidade
3.3– Medidas de Assimetria
Grau de Assimetria de Pearson
Parte da noção de que nas distribuições simétricas a Média a Moda e a Mediana
são iguais, e que quanto maior a assimetria da distribuição maior a distância
entre elas. Fórmula de Pearson : Média – Moda = 3 (Média – Mediana)
Grau de assimetria de Pearson :
(-3<g<3)
x − Moda
g=
s
Grau de Assimetria de Bowley
~ ~
Parte da noção de que nas distribuições simétricas q3 − x = x − q1
e que quanto maior a assimetria da distribuição maior a diferença.
Grau de Assimetria de Bowley :
(-1<g’<1)
x ) − (~
x − q1 ) (q3 − ~
x ) − (~
x − q1 )
(q3 − ~
g'=
=
~
~
rq
(q3 − x ) + ( x − q1 )
1304- Análise de Dados e Probabilidade
3.3– Medidas de Assimetria
Definição de Momento: Momento de ordem r em relação a um valor fixo V é
N
mr ,V = ∑ ( xi − V ) r N
i =1
Se V=0 , Momento simples de ordem r é
N
m'r = ∑ xi
i =1
N
Se V= Média, Momento centrado de ordem r é
r
N
mr = ∑ ( xi − x ) r N
i =1
1304- Análise de Dados e Probabilidade
3.3– Medidas de Assimetria
Partindo da noção de que nas distribuições simétricas todos os momentos de
ordem impar em relação á media são nulos.
2
Coeficiente de Pearson:
(m3 )
b1 =
(m2 ) 3
Coeficiente Assimetria de Fisher:
m3
g1 = 3
s
b1>0 sempre, não informa
sobre o sinal
g1 já informa sobre o sinal
1304- Análise de Dados e Probabilidade
3.4– Medidas de Achatamento ou Curtose
Procura medir o peso das caudas da distribuição. No 4º Momento, os grandes
desvios em relação á média tem mais peso que os pequenos, e divide-se pelo
desvio padrão para anular o efeito da dispersão.
Coeficiente de Achatamento:
m4
m4
b2 =
= 4
2
(m2 )
s
Sabendo que para a distribuição normal, b2=3, define-se
Excesso ou Kurtosis:
g2 = b2 – 3
O sinal de g2 compara o achatamento da distribuição com a distribuição normal.
g2 > 0 diz-se que a distribuição é “leptocúrtica” lepto = estreito, delgado
g2 < 0 diz-se que a distribuição é “platicúrtica” plati exprime a ideia de plano
1304- Análise de Dados e Probabilidade
3.5– Medidas de Concentração
As medidas de concentração destinam-se a medir a forma como determinado
atributo se distribui pelos elementos de uma dada população. Só faz sentido
para atributos quantitativos com carácter aditivo.
Dada a distribuição de frequências de X, agrupadas em i classes seja
t i = ∑ xk
k∈i
ou
ti = ni x'i
o valor do atributo acumulado na classe i
i
Defina-se
pi = Fi
e
qi =
∑ tk
k =1
j
∑ tk
k =1
Demonstra-se que
pi ≥ qi
i
=
∑ tk
k =1
N
∑ xi
i =1
1304- Análise de Dados e Probabilidade
3.5– Medidas de Concentração
j −1
j −1
Índice de Gini :
G=
0≤G≤1
G = 0 a concentração é mínima
∑ ( pi − qi )
i =1
j −1
∑ pi
i =1
= 1−
∑ qi
i =1
j −1
∑ pi
i =1
G = 1 a concentração é máxima
Curva de Lorenz : Representação gráfica dos pontos (pi , qi ) e
da recta de igual distribuição (pi = qi )
Licenciatura
1304 -Análise de Dados e Probabilidade
4
1º Semestre 2006/2007
Clara Costa Duarte
1304- Análise de Dados e Probabilidade
4. 1- Números Índices
Definição: Um índice é uma relação entre dois estados ou
situações de uma grandeza. Representa o nível em relação ao
nível tomado para base.
Permitem uma rápida avaliação da variação relativa do fenómeno
em análise.
Índice Simples: Quando traduz a evolução de um só fenómeno (x)
it / 0
xt
= .100
x0
Índice Sintético: Quando traduz a evolução de um conjunto de k
fenómenos. (x x’ x’’..)
1304- Análise de Dados e Probabilidade
4.2- Números Índices
Formas alternativas de construir índices sintéticos
1- Média dos índices simples
It / 0
it / 0 + it′/ 0 + it′′/ 0 + ... ∑ it / 0
=
=
k
k
2- Índice das médias (agregativo)
It / 0
xt + xt′ + xt′′ + ... ∑ xt
=
=
x0 + x0′ + x0′′ + ... ∑ x0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices ( Índices Ponderados)
1- Índice Sintético Ponderado
ωit / 0 + ω ′it′/ 0 + ω ′′it′′/ 0 + ... ∑ ωit / 0
It / 0 =
=
ω + ω ′ + ω ′′ + ..
∑ω
2- Índice Agregativo Ponderado
ω t xt + ω t′xt′ + ω t′′xt′′ + ... ∑ ω t xt
=
It / 0 =
ω 0 x0 + ω 0′ x0′ + ω 0′′x0′′ + ... ∑ ω 0 x0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Índice de Laspeyres
Consideram-se como ponderadores preços ou quantidades do ano
base.
Índice de Preços:
P
t/0
L
Índice de Quantidades:
Q
Lt / 0
pt q0
∑
=
∑ p0 q0
p0 qt
∑
=
∑ p0 q0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Índice de Paasche
Consideram-se como ponderadores preços ou quantidades do ano t.
Índice de Preços:
Ρ
P
t/0
Índice de Quantidades:
Ρt / 0
Q
pt qt
∑
=
∑ p0 qt
pt qt
∑
=
∑ pt q0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Índices de Laspeyres e de Paasche
1- O Índice de Preços de Laspeyres pode ser escrito como uma
média ponderada de índices de preços simples.
2- O Índice de Preços de Paasche pode ser escrito como uma média
ponderada de índices de preços simples, ou alternativamente
como a média harmónica de índices de preços simples.
3- O Índice de Quantidades de Laspeyres pode ser escrito como uma
média ponderada de índices de quantidades simples.
4- O Índice de Quantidades de Paasche pode ser escrito como uma
média ponderada de índices de quantidades simples, ou
alternativamente como a média harmónica de índices de
quantidades simples.
5- Demonstra-se que, em certas condições, o índice de Laspeyres é
superior ao de Paasche tanto para preços como para quantidades.
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Índice de Fisher
Média geométrica dos índices de Laspeyres e Paasche
Índice de Preços:
F =
p
t/0
Índice de Quantidades:
F =
q
t/0
∑ pt q0 ∑ pt qt
∑ p0 q0 ∑ p0 qt
∑ p0 qt ∑ pt qt
∑ p0 q0 ∑ pt q0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Índices de valor
Índice Simples:
pt qt
p q
i =
= it/0it/0
p0 q0
v
t/0
Índice Sintético:
I
v
t/0
pt qt
∑
p
q
q
p
=
= Lt/0 .Pt/0 = Lt/0 .Pt/0
∑ p0 q0
1304- Análise de Dados e Probabilidade
4.2 - Números Índices –Propriedades de um “bom”indíce
1- Boa determinação
2- Identidade
3- Homogeneidade
4- Proporcionalidade
5-Reversão dos factores
6- Reversão no tempo
7- Circularidade
1304- Análise de Dados e Probabilidade
4.3 – Índices de Base Móvel. Índices em cadeia.
De entre os índices de base móvel tem particular importância:
1) Índices elos, em que a base é sempre constituída pelo período
anterior
2) Índices homólogos (mensais ou trimestrais), tomam para base o
valor do mês (ou trimestre) homólogo do ano anterior.
“Encadeando” os índices de elos obtêm-se um novo tipo de índice de
base fixa chamados índices em cadeia:
I
c
t /0
= I1 / 0 .I 2 / 1.I 3 / 2 ....I t / t −1
1304- Análise de Dados e Probabilidade
4.3 – Mudança de base. Conciliação de Índices
Se o índice em causa satisfizer a propriedade da circularidade a
mudança de base é simples:
it / b
xt x0 it / 0
=
=
xb x0 ib / 0
Na prática, usa-se esta regra para todo o tipo de índices.
Licenciatura
1304 -Análise de Dados e Probabilidade
5
1º Semestre 2006/2007
Clara Costa Duarte
1304- Análise de Dados e Probabilidade
5.1 – Noções Preliminares
• Tipos de fenómenos: Determinísticos e Probabilísticos
•Conceitos de Base:
•Experiência Aleatória; Observação; Espaço Amostral (S); Evento Simples;
Evento Composto; Conjunto finito; Conjunto Infinito; Conjunto Contável.
•Definições:
A ={x∈S : x∉A}
•Complemento de um evento A (em S)
•Intersecção de dois eventos A
A∩B={x∈S: x∈A e x∈B}
A∩B=∅
eB
•Eventos mutuamente exclusivos
•Diferença entre dois eventos
A−B={x∈S: x∈Ae x∉B}
•Reunião de dois eventos A
A∪B={x∈S: x∈A ou x∈B}
eB
•Cardinal de um conjunto Finito -
#A
•Partição do Espaço Amostral B1, B2,
,Br
r
Bi ∩Bj =∅,i ≠ j e UBi =S
i=1
1304- Análise de Dados e Probabilidade
5.1 – Noções Preliminares ( cont.)
• Diagramas de Venn
•Propriedades das Operações no Espaço Amostral
A∩ A = ∅
A∪ A = S
Leis Associativas
Elemento Neutro
Leis Distributivas
Leis de Morgan
Leis Comutativas
A∩ B = B ∩ A
A∪ B = B ∪ A
A ∩ B ∩ C = ( A ∩ B) ∩ C = A ∩ ( B ∩ C )
A ∪ B ∪ C = ( A ∪ B) ∪ C = A ∪ ( B ∪ C )
A∪∅ = A
A∩ S = A
Elemento Absorvente
( A ∪ B) ∩ C = ( A ∩ C ) ∪ ( B ∩ C )
( A ∩ B) ∪ C = ( A ∪ C ) ∩ ( B ∪ C )
A∩ B = A ∪ B
A∪ B = A ∩ B
A∪ S = S
A∩∅ = ∅
1304- Análise de Dados e Probabilidade
5.1 – Noções Preliminares
• Métodos de Contagem
•Definições:
•Permutação; Factorial; Combinação
•Teoremas
•Princípio Fundamental da Contagem
•O número de Permutações de n objectos diferentes é:h
Pn = n!
•O número de Permutações de n objectos diferentes escolhendo r objectos
de cada vez é:
n!
n
Pr =
(n − r )!
•O número de Permutações de n objectos diferentes arranjados em círculo
é: P = ( n − 1)!
n
1304- Análise de Dados e Probabilidade
5.1 – Noções Preliminares
•Teoremas
•O número de Permutações de n objectos de r tipos diferentes em que,
n1+ n2 +...+ nr = n , é:
•O número de maneiras diferentes de dividir n objectos em r grupos com
ni elementos em cada grupo é: ⎛
n
⎞
n!
⎟⎟ =
⎜⎜
⎝ n1 , n2 ,.., nr ⎠ n1!n2 !..nr !
Caso particular: Combinação
•O número de Combinações de r objectos escolhidos de n objectos é:
⎛ n ⎞ ⎛n⎞
n!
C = ⎜⎜
⎟⎟ = ⎜⎜ ⎟⎟ =
⎝ r , n − r ⎠ ⎝ r ⎠ r!(n − r )!
n
r
1304- Análise de Dados e Probabilidade
5.2 – Conceito de Probabilidade
•Axiomas da Probabilidade
•Seja A um evento do espaço amostral S. Chama-se Probabilidade de A
P(A) o número real que mede a verosimilhança com que A ocorre e que
satisfaz os seguintes axiomas:
i) 0 ≤ P ( A) ≤ 1
ii) P ( S ) = 1
iii) Seja Ai um evento de S,
se Ai ∩ A j = 0 para i ≠ j, então
P( Ai ∪ A j ) = P ( Ai ) + P( A j )
•Frequência relativa
Probabilidade
1304- Análise de Dados e Probabilidade
5.3 – Teoremas Elementares do Cálculo das Probabilidades
•Teoremas
•Sejam A e B dois eventos de S em que B ⊆ A
Então: P ( A − B ) = P ( A) − P ( B )
•Sejam A e B dois eventos quaisquer de S
Então:
P ( A ∪ B) = P( A) + P( B ) − P ( A ∩ B)
•Sejam A , B e C eventos quaisquer de S
Então:
P ( A ∪ B ∪ C ) = P ( A) + P ( B ) + P (C )
− P( A ∩ B) − P( A ∩ C ) − P( B ∩ C ) + P( A ∩ B ∩ C )
1304- Análise de Dados e Probabilidade
5.3 – Teoremas Elementares do Cálculo das Probabilidades
•Teoremas
•Seja A um evento de S
P ( A) + P ( A ) = 1
Então:
•Se B ⊆ A
Então: P ( B ) ≤ P ( A)
•Sejam A1 , A2 , ...., An eventos mutuamente exclusivos
Então:
n
n
i =1
i =1
P ( U Ai ) = ∑ P ( Ai )
1304- Análise de Dados e Probabilidade
5.4 – Probabilidade Condicional. Independência de Eventos
•Definição: Probabilidade de A dado B:
P( A ∩ B)
P( A | B) =
, se P( B) ≠ 0
P( B)
•Definição: A e B são eventos independentes se e só se:
P( A ∩ B) = P( A) P( B )
Teorema: Se A e B são eventos independentes, com probabilidades
positivas, então:
P ( A | B ) = P( A) e P( B | A) = P( B )
1304- Análise de Dados e Probabilidade
5.4 – Probabilidade Condicional. Teoremas
•Teorema:
A Probabilidade Conjunta dos eventos A e B é:
P( A ∩ B) = P ( B) P( A | B ) = P( A) P( B | A)
A Probabilidade Conjunta dos eventos A1, A2 ,... Ar é:
P( A1 ∩ A2 ∩ ... ∩ Ar ) = P( A1 ) P ( A2 | A1 )...
.P( Ar | A1 ∩ A2 ∩ ... ∩ Ar −1 )
•Teorema da Probabilidade Total: Se B1, B2 ,... Br forem uma partição
de S, então para qualquer evento A :
r
P ( A) = ∑ P( A | Bi ) P( Bi )
i =1
1304- Análise de Dados e Probabilidade
5.4 – Probabilidade Condicional. Teorema de Bayes
•Teorema de Bayes:
Se B1, B2 ,... Br forem uma partição de S, então para qualquer evento A
então :
P ( Bk | A) =
P( Bk ∩ A) P ( A | Bk ) P( Bk )
= r
P ( A)
∑ P( A | B ) P( B )
i =1
i
i
para k=1,2,...,r
Permite calcular a probabilidade de Bk (uma causa) ocorrer dado que
ocorreu o evento A.
Licenciatura
1304 -Análise de Dados e Probabilidade
6
1º Semestre 2006/2007
Clara Costa Duarte
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias : Def: Variável Aleatória X(s): é uma função que
associa um número real x a cada resultado s do espaço amostral S
•Variável Aleatória Discreta X(s): o conjunto de valores possíveis
de X é finito (ou infinito numerável)
•Função de Probabilidade :
Propriedades:
f ( x) = P( X = x)
i) f ( x) ≥ 0
ii) ∑ f ( x) = 1
x
•Função de Distribuição Acumulada:
F ( x) = P( X ≤ x) = ∑ f (u )
u ≤x
Propriedades:
i) É uma função com descontinuidades e em escada
ii) Se x ≤ y, então F ( x) ≤ F ( y )
iii) F (−∞) = lim F ( x) = 0
x→−∞
iv) F (+∞) = lim F ( x) = 1
x→+∞
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias
•Variável Aleatória Continua X(s): toma valores de um intervalo ou de um
conjunto de intervalos
•Função de Densidade de Probabilidade (f.d.p.) : f(x) tal que
b
a
P(a < X < b) = ∫ f ( x)dx, ∀a, b ∈ IR : a ≤ b
Propriedades:
i) f ( x) ≥ 0, ∀ x ∈ IR
+∞
-∞
ii) ∫
f ( x)dx = 1
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias
•Variável Aleatória Continua X(s):
•Função de Distribuição Acumulada :
x
−∞
F ( x) = ( X ≤ x) = ∫ f (u )du
Propriedades: i) É uma função contínua
ii) Se x ≤ y, então F ( x) ≤ F ( y )
iii) F (−∞) = lim F ( x) = 0
x→−∞
iv) F (+∞) = lim F ( x) = 1
x→+∞
dF ( x)
v) f ( x) =
, se F for derivável
dx
vi)P(a ≤ x ≤ b) = F (b) − F (a)
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias - Duas ( ou n) dimensões; x =X(s) e y=Y(s))
•Seja (X,Y) um vector Aleatório Discreto
•Função de Probabilidade Conjunta: fXY (x,y)=
•Propriedades
i) f XY ( x, y ) ≥ 0
P(X = x,Y=y)
ii) ∑ ∑ f XY ( x, y ) = 1
x
y
•Função de Distribuição Acumulada Conjunta:
FXY = P ( X ≤ x, Y ≤ y ) = ∑ ∑ f XY (u , v)
u ≤ x v≤ y
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias-
Duas ( ou n) dimensões; x =X(s) e y=Y(s))
•Seja (X,Y) um vector Aleatório Contínuo
•Função de Densidade de Probabilidade Conjunta:
f XY tal que P ( X , Y ) ∈ A = ∫ ∫ f XY ( x, y )dxdy
A
Propriedades:
i) f XY ( x, y ) ≥ 0, ∀ x ∈ IR
+∞ +∞
-∞ -∞
ii) ∫ ∫
f XY ( x, y )dxdy = 1
•Função de Distribuição Acumulada Conjunta:
x
y
FXY = P ( X ≤ x, Y ≤ y ) = ∫−∞ ∫−∞ f XY (u , v) dvdu
e
∂ 2 FXY ( x, y )
f XY ( x, y ) =
∂x∂y
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias
•Distribuições Marginais de V.A. Discretas
•Funções de Probabilidade Marginal de X e Y:
f X ( x) = ∑ f XY ( x, y )
y
e fY ( y ) = ∑ f XY ( x, y )
x
•Função de Distribuição Acumulada Marginal:
FX ( x) = ∑ ∑ f XY (u , y )
u ≤x y
E
FY ( y ) = ∑ ∑ f XY ( x, v)
v≤ y x
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias (cont)
Distribuições Marginais de V.A. Continuas
•Funções de Probabilidade Marginal de X e Y:
+∞
+∞
f X ( x) = ∫−∞ f XY ( x, y )dy e fY ( y ) = ∫−∞ f XY ( x, y )dx
•Função de Distribuição Acumulada Marginal de X e Y:
x
+∞
FX ( x) = ∫−∞ ∫−∞ f XY (u , y )dydu
y
+∞
FY ( y ) = ∫−∞ ∫−∞ f XY ( x, v)dxdv
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias (cont)
•Distribuições Condicionais
•Funções de Probabilidade Condicional de X dado Y:
P ( X = x, Y = y ) f XY ( x, y )
f X Y = y ( x) = P( X = x Y = y )
=
fY ( y )
P (Y = y )
•e de Y dado X:
P ( X = x, Y = y ) f XY ( x, y )
fY X = x ( y ) = P (Y = y X = x)
=
f X ( x)
P( X = x)
1304- Análise de Dados e Probabilidade
6.1 – Variáveis Aleatórias (cont)
•Definição de independência de variáveis aleatórias
f XY ( x, y ) = f X ( x) fY ( y ) ∀x, y ∈ IR
•Funções de Variáveis Aleatórias Y=g(X)
•Como determinar fY a partir de fX?
fY ( y ) = P (Y = y ) = P[g ( X ) = y ] =
•e FY a partir de FX?
FY ( y ) = P (Y ≤ y ) = P[g ( X ) ≤ y ] =
∑ f X ( x)
x: g ( x ) = y
∑ f X ( x)
x: g ( x ) ≤ y
1304- Análise de Dados e Probabilidade
6.2 –Valor Esperado de uma V.A.(Média)
•Definição
•V.A.Discreta
•V.A. Continua
μ = μ x = E(X) =
∑ xf ( x)
μ = μ x = E(X) =
∫-∞
x
+∞
xf ( x)dx
•Teoremas para cálculo de Valores Esperados
•E[g(X)]
•E[g(X,Y)]
•E[ ∑ ai gi (X)]
•Se X e Y são V.A. Independentes E(X,Y)=E(X)*E(Y)
1304- Análise de Dados e Probabilidade
6.2 –Variância, Desvio Padrão,Coeficiente de Variação de uma V.A.
•Definições
•Variância :
σ = σ = Var(X) = E ( X − μ )
•V.A.Discreta
2
2
x
σ 2 = ∑ ( x − μ ) 2 f ( x)
x
+∞
σ = ∫−∞ ( x − μ ) f ( x)dx
2
•V.A. Continua
2
2
•Var(X) = E(X2)- μ2
σ = σ = Var(X = E ( X − μ )
σ
•Coeficiente de Variação: ω =
μ
•Desvio Padrão:
2
1304- Análise de Dados e Probabilidade
6.2 –Co-variância e Coeficiente de Correlação
•Relação entre 2 V.A.
Cov( X , Y ) = σ XY = E [( X − μ X )(Y − μY )]
•Co-variância :
•V.A.Discreta
•V.A. Continua
∑ ∑ ( X − μ X )(Y − μY ) f XY ( x, y )
x
y
+∞ +∞
−∞ −∞
∫ ∫ ( X − μ X )(Y − μY ) f XY ( x, y )dxdy
•Cov(X,Y) = E(XY)- μX μY
•Coeficiente de Correlação:
Corr ( X , Y ) = ρ XY =
Cov( X , Y )
E[( X − μ X )(Y − μY )]
=
Var ( X )Var (Y )
Var ( X )Var (Y )
1304- Análise de Dados e Probabilidade
6.2 –Variância e Co-variância
•Teoremas
•Var(X) = E(X2)- μ2
•Cov(X,Y) = E(XY)- μX μY
n
n n
⎡
⎤
• Var ∑ ai X i = ∑ ∑ ai a j Cov( X i , X j )
⎢⎣i =1
⎥⎦ i =1 j =1
1304- Análise de Dados e Probabilidade
6.2 – Momentos de uma V.A.
•Definições
•Momento simples de ordem r:
•V.A.Discreta
μ r′ = E( X r ) = ∑ x r f ( x)
x
•V.A. Continua
+∞ r
r
′
μ r = E( X ) = ∫−∞ x f ( x)dx
•Momento centrado de ordem r:
•V.A.Discreta
μ r = E( X − μ ) r = ∑ ( x − μ ) r f ( x)
x
•V.A. Continua
μ r = E( X − μ ) r = ∫−+∞∞( x − μ ) r f ( x)dx
1304- Análise de Dados e Probabilidade
6.2 – Momentos de uma V.A.
•Definições
•Função geradora de momentos da V.A. X:
•V.A.Discreta
m X (t ) = E(e tX ) = ∑ e tx f ( x)
•V.A. Continua
m X (t ) = E(e ) = ∫ e f ( x)dx
x
tX
+∞ tx
−∞
•A derivada de ordem r da f.g.m. é o momento de ordem r da V.A.
•Função geradora de momentos conjunta das V.A. X e Y:
m XY (t X , tY ) = E( Exp(t X X + tY Y)
1304- Análise de Dados e Probabilidade
6.2 – V.A. Estandardizadas
•Definições
X − μX
Forma estandardizada de X
σX
• Uma variável estandardizada tem Valor esperado 0 e Variância 1
•Desigualdade de Chebyshev : Seja X uma V.A.. com média e variância
finita
e k >0
P(−k <
X −μ
σ
1
< k) ≥ 1− 2
k
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
Embora exista uma diversidade infinita de possíveis distribuições
estatísticas algumas tem um âmbito de aplicação mais generalizado:
•Distribuição Uniforme : X ~ DU(i,j)
Aplica-se à ocorrência aleatória de resultados igualmente prováveis
⎧ 1
, x ∈ {i, i + 1,... j − 1, j}
⎪
•Função de Probabilidade; f ( x) = ⎨ j − i + 1
⎪0
x ∉ {i, i + 1,... j − 1, j}
⎩
•Definições:
•Função de Distribuição Acumulada
⎧0
⎪
⎪ ⎣x ⎦ − i + 1
F ( x) = ⎨
⎪ j − i +1
⎪⎩1
x<i
i≤x≤ j
x> j
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição Uniforme : X ~ DU(i,j)
•Parâmetros: Parâmetro de localização i; Parâmetro de escala i-j;
•Gama de valores:
{i, i + 1,..., j − 1, j}
•Propriedades:
E(X) = (i+j)/2
VAR(X) =[ (j-i+1)2 –1]/12
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Bernoulli : X ~ Bernoulli (p)
•Aplica-se a sequências de n tentativas repetidas independentes com
2 resultados possíveis: sucesso com probabilidade p; insucesso com
probabilidade (1-p).
•Definições:
•Função de Probabilidade:
⎧q = 1 − p x = 0
⎪
f ( x) = ⎨ p
x =1
⎪0
outros casos,
⎩
• Função de Distribuição Acumulada:
⎧0
⎪
F ( x ) = ⎨q = 1 − p
⎪1
⎩
x<0
0 ≤ x <1
x ≥1
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Bernoulli : X ~ Bernoulli (p)
•Parâmetros: Parâmetro de localização p
•Gama de valores: {0,1}
•Propriedades:
E(X) = p
VAR(X) = p (1-p)
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Binomial: X ~ Bin (n,p)
•X corresponde ao número de sucessos em n tentativas de Bernoulli
•Definições:
⎧⎛ n ⎞ x
n− x
x ∈ {0,1,2,..., n}
• Função de Probabilidade:
⎪⎜⎜ ⎟⎟ p (1 − p )
f ( x) = ⎨⎝ x ⎠
⎪0
x ∉ {0,1,2,..., n}
⎩
•Função de Distribuição Acumulada:
⎧0
⎪⎪⎣ x ⎦
F ( x) = ⎨ ∑ p i (1 − p ) n−i
⎪i =0
⎪⎩1
x<0
0≤ x≤n
x>n
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Binomial: X ~ Bin (n,p)
•Parâmetros: n, p
•Gama de valores: {0,1,2,....,n}
•Propriedades:
E(X) =n p
VAR(X) = np (1-p)
Se (n+1) p não é inteiro
Se (n+1) p é inteiro
Moda = Int [(n+1) p]
Bi-Modal em (n+1) p e (n+1)p -1
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Poisson: X ~ Poisson (λ)
Um processo de Poisson refere-se ao nº de eventos que ocorrem num
intervalo temporal ou numa região espacial, em que λ representa o nº
médio de eventos no referido intervalo.
•Definições:
• Função de Probabilidade:
⎧ e − λ λx
x ∈ {0,1,2,...}
⎪
f ( x) = ⎨ x!
⎪⎩0
x ∉ {0,1,2,...}
•Função de Distribuição Acumulada:
⎧0
⎪
F ( x) = ⎨ −λ ⎣ x ⎦ λi
⎪⎩e i∑
=0 i!
x<0
x≥0
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Discretas
•Distribuição de Poisson: X ~ Poisson (λ)
•Parâmetros: λ
•Gama de valores: {0,1,2,....}
•Propriedades:
E(X) = λ
VAR(X) = λ
Se λ não é inteiro
Moda = Int [λ]
Se λ é inteiro
Bi-Modal em λ -1 e λ
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição de Uniforme: X ~ U(a,b)
Aplica-se à ocorrência aleatória no intervalo [a,b] cuja probabilidade é
proporcional ao comprimento do intervalo
•Definições:
• Função de Densidade de Probabilidade:
⎧ 1
x ∈ [a, b]
⎪
f ( x) = ⎨ b − a
⎪⎩0
x ∉ [a, b]
•Função de Distribuição Acumulada:
⎧0
⎪⎪ x − a
F ( x) = ⎨
⎪b − a
⎪⎩1
x<a
x ∈ [a, b]
x>b
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição de Uniforme: X ~ U(a,b)
•Gama de Valores: [a,b]
•Propriedades:
E(X) = (a+b)/2
VAR(X) = (b-a)2/12
Função Geradora de Momentos
1 e bt − e at
, t≠0
mx (t ) =
t
b−a
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Normal: X ~ N(µ, σ2)
•Definições:
2
⎡
1⎛ x − µ ⎞ ⎤
1
exp ⎢− ⎜
• Função de Probabilidade: f ( x) =
⎟ ⎥
2
2πσ
⎣ 2⎝ σ ⎠ ⎦
•Função de Distribuição Acumulada:
2
⎡
1
1⎛t − µ ⎞ ⎤
x
F ( x) = P( X ≤ x) =
⎟ ⎥dt
∫ exp ⎢− ⎜
2 −∞
2πσ
⎣ 2⎝ σ ⎠ ⎦
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Normal: X ~ N(µ, σ2)
•Parâmetros: µ,σ2
•Gama de Valores: [-∞, +∞,]
•Propriedades:
E(X) = µ
VAR(X) = σ2
Moda = µ
Função Geradora de Momentos
⎛
σ 2t 2 ⎞
⎟⎟
mx (t ) = exp⎜⎜ µt +
2 ⎠
⎝
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Normal: X ~ N(µ, σ2)
P(µ −σ < X < µ + σ ) ≈ 0.68
1-
P(µ − 2σ < X < µ + 2σ ) ≈ 0.95
P(µ − 3σ < X < µ + 3σ ) ≈ 0.997
2- Se as variáveis Xi ~ N(µi , σi 2) são independentes então:
2 2
a
X
~
N
(
a
µ
,
a
∑ i i
∑ i i ∑ i σi )
i
i
i
3- Se as variáveis Xi ~ N(0 , 1) são independentes então:
n
2
2
X
~
ℵ
∑ i
(n)
i =1
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Normal: X ~ N(µ, σ2)
•1-
Se X ~ N ( µ , σ ) e Z =
2
P (a ≤ X ≤ b) = P (
a−µ
σ
X −µ
σ
≤Z≤
~ N ( 0,1)
b−µ
σ
)
•2- Se X ~ Bin ( n , p ) e n grande
X − np
converge para ~ N ( 0 ,1)
Z =
np (1 − p )
•3-
Se X ~ Poisson ( λ ) e λ grande
X −λ
Z =
converge para ~ N ( 0 ,1)
λ
Correcção de continuidade ( x-0.5<X<x+0.5)
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Exponencial –Exp(β): X ~ Exp(β)
Aplica-se à ocorrência de eventos a uma taxa constante, num intervalo de
tempo ou numa região. X representa o intervalo de tempo entre eventos
independentes
Definições:
• Função de Probabilidade:
⎧0
⎪
f ( x) = ⎨ 1 − x / β
⎪β e
⎩
•Função de Distribuição Acumulada:
⎧0
F ( x) = ⎨
−x / β
⎩1 − e
x<0
x≥0
x<0
x≥0
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Exponencial –Exp(β): X ~ Exp(β)
•Parâmetros: β
•Gama de Valores: [0, +∞,]
•Propriedades:
E(X) = β
VAR(X) = β2
Moda = 0
Função Geradora de Momentos
⎛ 1 ⎞
mx (t ) = ⎜
⎟
⎝ 1 − βt ⎠
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Gama –Gama(α,β): X ~ Gama(α,β)
X representa a soma de α V.A. exponenciais independentes.
⎧0
⎪
x
=
f
x
(
)
⎨ 1
α −1 − β
• Função de Probabilidade:
⎪ β α Γ(α ) x e
⎩
Definições:
+∞
•Em que
Γ(α ) = ∫0 xα −1e − x dx α > 0
•Função de Distribuição Acumulada:
x≤0
⎧0
⎪
i
α
−
1
F ( x) = ⎨
− xβ
1⎛ x ⎞
⎪1 − e ∑ i!⎜ β ⎟ x > 0
i =0 ⎝
⎠
⎩
x≤0
x>0
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Gama –Gama(α,β): X ~ Gama(α,β)
•Parâmetros: α,β
•Gama de Valores: [0, +∞,]
•Propriedades:
E(X) = α β
VAR(X) = α β2
Moda = (α –1) β
Função Geradora de Momentos
α
⎛ 1 ⎞
mx (t ) = ⎜
⎟
⎝ 1 − βt ⎠
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Qui –Quadrado -X2: X ~ X2(v)
Representa V.A.s que sejam o quadrado de V.A.s com distribuição
Normal Estandardizada. Permite fazer inferências sobre a variância de
uma população.
x≤0
⎧0
⎪
(ν 2 )−1 − x 2
f ( x) = ⎨ 1
x
e
ν
• Função de Probabilidade:
⎪ 2 2 Γ(ν )
⎩
2
Definições:
x>0
•Função de Distribuição Acumulada:*
x≤0
⎧0
⎪
ν −1
i
2 1 x
F ( x) = ⎨
x
− 2
⎛ ⎞
⎪1 − e ∑ i!⎜ 2 ⎟ x > 0
i =0 ⎝ ⎠
⎩
*apenas se v for um nº par , se v for impar a função não é definida
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição Qui –Quadrado -X2 : X ~ X2(v)
•Parâmetros: v ( graus de liberdade)
•Gama de Valores: [0, +∞,]
•Propriedades:
E(X) = v
VAR(X) = 2 v
Moda = v-2, se v≥2
Função Geradora de Momentos
ν
⎛ 1 ⎞
mx (t ) = ⎜
⎟
⎝ 1 − 2t ⎠
2
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição t-Student - T(v) : X ~ T(v)
Seja : X =
Z
Y
em que Z ~N(0,1) e Y~ X2(v)
ν
Permite fazer inferências sobre a média de uma população a partir de uma
amostra.
Definições:
• Função de Probabilidade:
Γ(ν 2+1 ) ⎛ 1 + x 2 ⎞
⎜⎜
⎟⎟
f ( x) =
πν Γ(ν2 ) ⎝ ν ⎠
•Função de Distribuição Acumulada: a função não é definida
ν +1
−
2
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição t-Student -
T(v) : X ~ T(v)
•Parâmetros: v
•Gama de Valores: [- ∞, + ∞,]
•Propriedades:
E(X) =0 se v>1
VAR(X) = v/(v-2), se v>2
Moda = 0
Função Geradora de Momentos: não existe
1304- Análise de Dados e Probabilidade
6.3 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição F : X ~ F(v1, v2)
•Parâmetros: v1 e v2
•Gama de Valores: [0, + ∞,]
•Propriedades:
E(X) = v2 / v2 -2 se v2 >2
VAR(X) =
2ν 22 (ν 1 +ν 2 − 2) , se v2 >4
ν 1 (ν 2 − 2 )2 (ν 2 − 4 )
Moda =
Função Geradora de Momentos: não existe
1304- Análise de Dados e Probabilidade
6.4 – Distribuições de Probabilidades de Variáveis Contínuas
•Distribuição F : X ~ F(v1, v2)
X1
ν1
Seja :
em que X1~
X=
X2
X2(v1) X2 Y~ X2(v2)
ν2
Permite comparar variâncias amostrais e fazer inferências sobre as variâncias
das populações.
Definições:
• Função de Probabilidade:
( ) ⎛⎜ ν
( ) ( ) ⎜⎝ν
Γ ν 1 +2ν 2
f ( x) = ν 1 ν 2
Γ 2 Γ 2
ν1
2 ν 1 −1 ⎛
⎞
ν
1
⎟⎟ x 2 ⎜⎜1 + 1
2 ⎠
⎝ ν2
⎞
x ⎟⎟
⎠
ν 1 +ν 2
−
2
•Função de Distribuição Acumulada: a função não é definida
Download