ESTATÍSTICA APLICADA Prof. Cezar Cerqueira

Propaganda
CURSO DE PROBABILIDADE E
ESTATÍSTICA BÁSICA
Prof. Cezar Augusto Cerqueira – UPE/UNICAP
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
ESTATÍSTICA: UMA VISÃO
GERAL

ESTATÍSTICA



Ciência de coletar, organizar, interpretar
dados
Visando...tomada de decisões
ESTATÍSTICAS


Somos bombardeados por elas a todo
momento
Números, informações, indicadores... Sociais,
econômicos, demográficos, gerenciais
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
A estatística reúne métodos para:



Coleta
Processamento
Análise e interpretação de dados


Informações numéricas analisadas servem de
base para tomada de decisões;
As estatísticas nos auxiliam a entender melhor
os fenômenos em geral;
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Métodos Estatísticos:
Importância - profissional




Ferramenta fundamental no processo de
solução de problemas
Gestores modernos lidam com grande
quantidade de informação.
Auxílio na determinação de planos de
ação para resolução de problemas
Tomada de decisões “bem informadas“




Apresentar e descrever de forma apropriada as
informações
Tirar conclusões sobre grandes populações com
base em amostras
Melhorar processos
Obter previsões confiáveis
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Métodos Estatísticos:
Importância - empresa




Aumento na competitividade
Eliminação de desperdícios
Redução na necessidade de inspeção
Aumento no grau de satisfação dos
clientes
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
PROCESSO








Equipamentos
Insumos
Métodos ou procedimentos
Condições ambientais
Pessoas
Informações do processo
Fabricação de um bem ou fornecimento
de um serviço
Uma Ferramenta importante: o fluxograma
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira

PROBABILIDADE


Teoria matemática utilizada para se estudar a
incerteza, oriunda de fenômenos de caráter aleatório.
INFERÊNCIA ESTATÍSTICA


Trata da análise e interpretação de dados amostrais
O principio básico é tirar conclusões sobre a população
a partir de uma amostra de dados obtida da mesma.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
População
Amostra
Descrição
ESTATÍSTICA APLICADA
Análise
Prof. Cezar Cerqueira
Inferência
Coleta de dados

Dados: base para tomada de decisões
Inteligência
(Projetos)
Conhecimento (Tomada de decisão)
Informação (Modelos Probab - Inferencia))
Dados Observados (análise exploratória)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
COLETA DE DADOS: OBJETIVOS




Desenvolvimento de novos produtos
 Pesquisas de mercado
Inspeção
 Classificação de produtos/insumos
Controle e acompanhamento de processos produtivos
 Verificar se o processo está sob controle; quantificar a
variabilidade; verificar se o processo é atende a
especificações.
Melhoria de processos produtivos
 Produtos que não satisfazem à meta
 Melhoria frente a novas exigências e necessidade de
sobrevivencia da empresa.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Indivíduo e Variável


Indivíduos: objetos descritos por um conjunto de dados
(pessoas, empresas, municípios, animais, ações, tempo,
etc)
Variáveis: qualquer característica de um indivíduo,
podendo assumir diferentes valores, de acordo com o
indivíduo a que se refere.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
OBSERVAÇÃO versus
EXPERIMENTO

Estudo observacional


Investiga indivíduos e mede variáveis de
interesse, sem influenciar as respostas
Experimento

Impõe algum tipo de tratamento sobre os
indivíduos, a fim de observar suas respostas
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
TIPOS DE DADOS: VARIÁVEIS

QUALITATIVAS



Nominais (sexo, região...)
Ordinais (grau de instrução)
QUANTITATIVAS

Discretas (contagens)


ESTATÍSTICA APLICADA
Ex: número de itens defeituosos; número de arranhões
em certa peça; número de acidentes de trabalho no mês.
Contínuas (mensurações em escala contínua)
 Diâmetro de uma peça; rendimento de uma reação
química; tempo gasto na execução de uma tarefa;
espessura de uma peça.
Prof. Cezar Cerqueira
O Banco de Dados
Nome
Idade Sexo Renda (Sal. Min)
José
27 Masc
5,32
Catarina
30 Fem
6,43
Pedro
21 Masc
1,20
Cibele
22 Fem
2,33
Helena
25 Fem
3,56
Marta
20 Fem
1,70
Carolina
35 Fem
4,50
Juan
45 Masc
8,00
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Instrução
Superior
2 Grau
1 Grau
2 Grau
2 Grau
1 Grau
Técnica
Superior
Levantamentos amostrais

População


Grupo inteiro de indivíduos sobre o qual se
deseja informações
Amostra

Parte da população da qual se coletam de fato
informações, utilizadas para se tirarem
conclusões sobre o todo.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Amostragem
Aleatória simples
Estratificada
PROBABILÍSTICA
Sistemática
Grupos (cluster)
Multifásica
AMOSTRAGEM
(Tipos)
NÃO PROBABILÍSTICA
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
ESTRATIFICAÇÃO


Agrupamento da informação (dados) sob
vários pontos de vista para dar foco à ação.
Equipamentos, insumos, pessoas, métodos,
medidas, condições ambientais.




Tempo (manhã, tarde, noite)
Local (linhas de produção, regiões)
Tipo (fornecedor)
Indivíduo(operadores)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Gráfico de Pareto



Princípio de Pareto (80/20)
Em torno de 80% dos problemas vem
de 20% das causas
Atacar 1/5 das causas solucionaria 4/5
dos problemas
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Distribuições de frequência: Gráfico
de Pareto
Tabela 2.4 – Defeitos encontrados em uma amostra de lentes fabricadas pela indústria
Freqüência
Freqüência Total
relativa
Percentual
Tipo de Defeito
de defeitos Acumulado (%)
Acumulado
Revest. Inadequado
55
55
43,3
43,3
Trinca
41
96
32,3
75,6
Arranhão
12
108
9,4
85,0
Espessura inadequada
11
119
8,7
93,7
Mal-acabada
5
124
3,9
97,6
outros
3
127
2,4
100,0
Total
127
FONTE: Indústria de lentes
ESTATÍSTICA APLICADA
-
100,0
-
Prof. Cezar Cerqueira
Gráfico de Pareto






Para causas: equipamentos, insumos, informação do
processo ou medidas, condições ambientais, pessoas,
métodos ou procedimentos.
Para efeitos: qualidade, custo, entrega, moral,
segurança, etc.
Expresso em unidades monetárias
Gráfico de Pareto estratificado (por operador, etc)
Comparações tipo antes e depois
Desdobramento de gráficos de Pareto (causas e subcausas)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Organização e Análise de dados
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
FERRAMENTAS GRÁFICAS
SIMPLES: VARIÁVEIS CONTÍNUAS
Diagrama de Pontos
Considere os dados: 3
o
3
o
4
o
o
5
o
6
4
4,5
7
o
8
4,5
Exibem: Dispersão, conglomerados de
pontos, lacunas, outliers, comparações
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
6
8
GRÁFICOS SIMPLES: VARIÁVEIS
CONTÍNUAS : Gráfico Ramo-e-Folhas
Exemplo: Considere os dados abaixo representando a resistência à compressão de
uma amostra de 80 corpos de prova de liga de alumínio:
105
97
245
163
207
134
218
199
160
196
221
154
228
131
180
178
157
151
175
201
183
153
174
154
190
76
101
142
149
200
186
174
199
115
193
167
171
163
87
176
ESTATÍSTICA APLICADA
121
120
181
160
194
184
165
145
160
150
181
168
158
208
133
135
172
171
237
170
180
167
176
158
156
229
158
148
150
118
143
141
110
133
123
146
169
158
135
149
Ramo Folha
76
87
97
10 51
11 580
12 103
13 413535
14 29583169
15 471340886808
16 3073050879
17 8544162106
18 361410
19 960934
20 7108
21 8
22 189
23 7
24 5
Prof. Cezar Cerqueira
Frequencia
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
Apresentação de Dados
Distribuições de frequências: caso
nominal
Tabela 2.1
Empregados do setor de produção, segundo o grau de instrução, 2005.
GRAU DE INSTRUÇÃO Freqüência (fi)
Primeiro Grau
15
Segundo Grau
25
Superior
10
TOTAL
50
FONTE: Pesquisa direta
Empregados do Setor de Produção, segundo grau de
instrução - 2000
20%
30%
Primeiro Grau
Segundo Grau
Superior
50%
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
VARIABILIDADE






Sempre presente em processos de produção ou
serviços
É afetada por diversos fatores
Produtos defeituosas são produzidos devido à
presença da variabilidade
A redução da variabilidade implica na redução
do número de itens defeituosos
Causas comuns (inerentes) e causas especiais
Processo sob controle: atuam apenas as
causas comuns
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Gráfico de Sequencias no tempo

Os dados representam a resistencia
à compressão de uma amostra de 20
conectores plásticos:
280
260
240
220
200
241
258
237
210
189
194
225
190
250
220
190
250
240
190
180
209
212
123
178
190
180
160
140
120
100
1
ESTATÍSTICA APLICADA
2
3
Prof. Cezar Cerqueira
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
HISTOGRAMA



Distribuição: modelo estatístico para o padrão
de ocorrencia dos valores de determinada
população
O histograma é um gráfico de barras no qual o
eixo horizontal é subdividido em vários
pequenos intervalos, sendo construída uma
barra vertical, de área proporcional ao número
de observações na amostra cujos valores
pertencem ao intervalo correspondente.
As informações são dispostas de modo a
permitir a possível visualização da forma da
distribuição dos dados e a percepção do valor
central e da dispersão em torno desta valor
central.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Distribuições de frequência: Caso
contínuo - Histograma

As distribuições podem diferir em:



Locação (centralidade, média, mediana)
Variabilidade (desvio padrão, variância)
Forma (assimetria)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Um procedimento para construção de
um Histograma (variáveis contínuas)



Coletar “n” observações
Escolher o número de intervalos (k)
Calcular a amplitude total dos dados (R)


Calcular o comprimento de cada intervalo (amplitude de
classe, h)




h=R/k
Arredondar convenientemente h
Calcular os limites de cada intervalo
Construir a tabela de frequencias, que deve conter:


R = Max - Min
Limites de cada intervalo; ponto médio; frequencia simples (fi);
frequencia relativa; frequencia acumulada (simples e relativa)
Desenhar o Histograma
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Distribuições de frequência variável
contínua: Histograma
Dados relativos ao comprimento de uma amostra de 100 parafusos
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Distribuições de frequência: Caso
discreto
Dados referentes ao número de defeitos encontrados em uma
amostra de 90 chapas de aço
45
40
Total
Peças
0
35
1
40
2
7
3
5
4
2
5
1
90
35
30
25
20
15
10
5
0
0
ESTATÍSTICA APLICADA
1
2
Prof. Cezar Cerqueira
3
4
5
Tipos de Histogramas: simétrico


Valor médio no centro
Frequencia mais alta no centro diminuindo gradualmente de forma
simétrica em direção aos extremos
100
80
60
40
20
0
Média=mediana=moda
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Tipos de Histogramas: assimétrico
positivo

freqüência decresce bruscamente em um dos lados e de forma gradual
no outro
Média fora do centro do histograma

cauda mais longa em um dos lados

90
80
70
60
50
40
30
20
10
0
Média>mediana; média>moda
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Tipos de Histogramas: despenhadeiro
90
80
70
60
50
90
80
70
60
50
40
30
20
10
0
40
30
20
10
0
Frequencia diminui de forma abrupta de um ou dos 2 lados
Processo não atende às especificações
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Tipos de Histogramas: dois picos
100
80
60
40
20
0
Mistura de dados com médias diferentes
Dados de 2 máquinas ou 2 turnos, etc
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Tipos de Histogramas: ilhas isoladas
100
80
60
40
20
0
Erros de medição, erros de registro ou transcrição dos dados
Anormalidades temporárias no processo
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Tipos de Histogramas: achatado (platô)
80
70
60
50
40
30
20
10
0
Mistura de várias distribuições com médias diferentes
Classes centrais possuem aproximadamente a mesma frequência.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Histograma: estratificação


Quando estratificado o Histograma pode
exibir diferentes distribuições para
distintos fatores.
A existencia de diferentes distribuições
podem estar contribuindo para
aumentar a variabilidade do processo.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Histogramas e limites de especificação
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Resumindo dados: análise
descritiva e exploratória

“Um estatístico é um sujeito que se está com a
cabeça num forno e os pés enterrados no gelo,
ainda diz que na média a temperatura está
ótima”.( K. Dunnigan)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
RESUMO NUMÉRICO DE DADOS
QUANTITATIVOS: LOCALIZAÇÃO DO
CENTRO DOS DADOS

Média Aritmética
n
Dados brutos

i 1
Mediana

Moda

n
k
Dados
agrupados
X 
X
i 1
i
fi
n
Valor do meio em uma sequencia ordenada de dados
“n” ímpar

X 
 Xi
X
n 1
(
)
2
Dados
agrupados
“n” par
Me  Li 
Me 
[(0,5)n  Fant ]
.c
f Me
Valor mais frequente de uma série de dados
ESTATÍSTICA APLICADA
X ( n / 2)  X ([ n / 2 ]1)
Prof. Cezar Cerqueira
2
OUTRAS MEDIDAS DE LOCAÇÃO:
Quartis

Primeiro Quartil

25% das observações são menores e 75%
maiores
Q1  X


(
n 1
)
4
Segundo Quartil (Mediana)
Terceiro Quartil
Q3  X
ESTATÍSTICA APLICADA
(
3( n 1)
)
4
Prof. Cezar Cerqueira
VARIABILIDADE



Medidas de tendência central podem mascarar
importantes aspectos em uma série de dados
Um processo de produção de bens e
fornecimento de serviços sempre apresenta
variabilidade
A variabilidade é resultado de uma série de
alterações nas condições sob as quais as
observações são tomadas.

matérias-primas, condições de equipamentos, métodos de
trabalho, condições ambientais e operadores
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
VARIABILIDADE: Problematizando

Os dados abaixo referem-se a notas obtidas em 3
turmas de 5 alunos cada:
 Turma A:
3 4 5 6 7
 Turma B:
1 3 5 7 9





Turma C:
5 5 5 5 5
Em termos de tendência central como podemos analisar
os grupos ?
E em termos de dispersão? Qual deles parece mais
disperso? E qual deles apresenta maior variabilidade?
Façamos uma investigação gráfica do fenômeno.
Como obter uma medida de variabilidade média para os
grupos?
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE

Variância Populacional
( X i ) 2
1
2
  [ X i 
]
n
n
2

Variância Amostral
2
(
X
)
1

i
s2 
[ X i2 
]
n 1
n

Desvio Padrão

Corresponde à raiz quadrada da variância
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
MEDINDO A VARIABILIDADE: outras
medidas

Amplitude Total


Amplitude Interquartil


Xmax-Xmin
J = Q3–Q1
Coeficiente de variação
CV 


Desvio  padrão S

média
X
Comparação de grupos muito diferentes
Comparação de dispersão com escalas diferentes
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
ESTUDO DA FORMA: ASSIMETRIA

Curva Simétrica
Distribuição dos salários dos empregados do setor de produção da
Companhia A
30
freq. simples
25
20
15
10
5
0
6
10
14
sal.min.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
18
22
ESTUDO DA FORMA: ASSIMETRIA
Assimetria Negativa
ESTATÍSTICA APLICADA
Simetria
Prof. Cezar Cerqueira
Assimetria Positiva
Gráfico Box-Plot


Índice de Desenvolvimento Humano
no Brasil, por Região - 2000
Juntas: Q1,Q2,Q3
Extremos: E1 e E2
1.0
.9
E1
Q1
Me
Q3
E2
.8
.7
IDHMUN
.6
.5
.4
NO
REGIAO
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
NE
SE
SUL
CO
Explorando a relação entre variáveis
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
EXPLORANDO A RELAÇÃO ENTRE
VARIÁVEIS



Mensurar o tipo e grau de associação entre
duas ou mais variáveis.
Foco inicial: duas variáveis quantitativas
Etapas:


Abordagem gráfica: diagrama de dispersão
Cálculo do coeficiente de correlação linear de Pearson,
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Diagrama de dispersão


Gráfico utilizado para a visualização do
tipo de relacionamento entre 2 variáveis
quantitativas
Este entendimento contribui para
aumentar a eficiencia dos métodos de
controle de um processo
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Construção do diagrama de
dispersão
1.
2.
3.
4.
5.
6.
7.
Coletar ao menos 30 pares de observações (x,y) das
variáveis a serem estudadas;
Registrar os dados em uma tabela;
Escolher uma variável a ser representada no eixo ‘x’
(preditora) e outra variável em ‘y’ (dependente);
Determinar os valores máximo e mínimo para cada
variável;
Escolher as escalas para ‘x’ e ‘y’
Representar no gráfico os pares de observações (x,y).
Registrar informações importantes que devem constar no
gráfico: título, legendas, unidades de medidas, etc
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de diagramas de
dispersão

Correlação positiva:
à medida que x
aumenta, y
também aumenta.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão

Moderada correlação
positiva: y tende a
aumentar com x,
porém com elevada
variabilidade.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão

Ausência de
correlação: os valores
das variáveis não
estão relacionados.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão

Moderada correlação
negativa: y tende a
diminuir com o
aumento de x.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão

Forte correlação
negativa: à medida que
x aumenta, y diminui.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão
Outliers: São
observações extremas
não condizentes com
o restante dos
dados.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Interpretação de
diagramas de dispersão
Exemplo: O diagrama
ao lado mostra forte
correlação negativa
entre as variáveis
Tensão e Variação
no Corte.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Estratificação de Diagramas de
Dispersão
Em muitos casos a estratificação de
um diagrama de dispersão permite a
descoberta da causa de um problema.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
CORRELAÇÃO: diagrama de
dispersão



Gráfico que representa no plano cartesiano duas
variáveis quantitativas
Ferramenta simples que permite aprofundar o estudo da
associação entre 2 variáveis.
Como ilustração, considere a tabela abaixo, que
representa o tempo de serviço e o volume de vendas
semanais de uma amostra de 5 vendedores de
determinado produto:
ESTATÍSTICA APLICADA
Tempo
(anos)
1
3
4
6
8
Vendas
35
40
42
50
55
Prof. Cezar Cerqueira
Diagrama de Dispersão
55
Y vendas
50
45
40
35
0
1
2
3
4
5
6
X te m p o
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
7
8
9
CORRELAÇÃO




Quando as variáveis crescem no mesmo
sentido temos o caso de correlação positiva.
Quando as variáveis crescem em sentidos
opostos temos uma correlação negativa.
Se os dados estão perfeitamente alinhados
sobre uma reta temos uma correlação perfeita.
Quando o crescimento de uma variável é
acompanhado de variações casuais da outra
variável a correlação é nula.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
COEFICIENTE DE CORRELAÇÃO
LINEAR: FÓRMULA DE CÁLCULO
r
XY

S XY
onde:
S XX S YY
S XY   XY 
 X Y
n
S XX   X 
2
S YY   Y 
2
( X ) 2
n
( Y ) 2
n
Lembre que: -1 rxy  1
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
COEFICIENTE DE CORRELAÇÃO LINEAR:
CÁLCULO PARA O EXEMPLO ANTERIOR
X2
Elemento Tempo (anos) Vendas
1
1
35
2
3
40
3
4
42
4
6
50
5
8
55
Total
22
222
X
i
 22;
Y
i
S xx   X 
2
S yy   Y 
2
S xy   XY 
rxy 
 222;
( X ) 2
n
( Y ) 2
n
S xy
S xx S yy

1
9
16
36
64
126
X
XY
1225
1600
1764
2500
3025
10114
2
i
 126;
35
120
168
300
440
1063
Y
i
2
 10114 e
XY
i i
 1063
222
 126 
 29,2
5
 10114 
( X )( Y )
n
Y2
222 2
 257,2
5
 1063 
( 22)(222)
 86,2
5
86,2
 0,995
(29,2)(257,2)
Indica uma associação
forte e positiva !!
CUIDADO!!! Correlação não implica em relação de causa efeito. !!
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS:
QUANTITATIVAS X QUALITATIVAS


Comparação do Comportamento de uma
Variável Contínua por Grupos
Captar diferenças: i)nos níveis médios,
ii)em variabilidade, iii)na forma da
distribuição, iv)detalhes individuais.
Via:



Diagrama de Pontos
Gráficos tipo Box-Plot
Gráfico Ramo-e-Folhas
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
RELAÇÕES ENTRE VARIÁVEIS: AMBAS
QUALITATIVAS






Tabela de contingência a 2 fatores
Variável dependente e explicativa
Medir associações
Encontrar distribuições percentuais
Distribuições marginais
Distribuições condicionais
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Noções de Probabilidade e Inferência:
mensurando a incerteza...
O Acaso existe?
“ O acaso não existe: tudo é provação, ou punição, ou
recompensa, ou previdencia”. (Voltaire)
“O acaso é a causa ignorada de um efeito conhecido” (Voltaire)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
NOÇÕES DE PROBABILIDADE


Aleatoriedade
Experimentos aleatórios



Probabilidade




Resultados imprevisíveis
regularidade
chance de ocorrência de um evento aleatório.
idealização do que aconteceria se feita uma sequencia
longa de repetições
Proporção de vezes em quem um evento ocorre em
uma sequencia longa de repetições do experimento
Independencia

Resultado de uma tentativa não deve influenciar o
resultado de outra
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Modelos Probabilísticos para
variáveis Discretas: Distribuição
Binomial



Considera n repetições independentes de um
experimento de Bernoulli.
Exemplos:
 Jogue uma moeda 10 vezes. Seja X=nº de caras obtido
 Uma máquina produz 1% de peças defeituosas. Seja X=nº
de peças defeituosas nas próximas 25 produzidas.
 Nos próximos 30 nascimentos em uma maternidade, seja
X=nº de meninas observado.
Seja a VA X=nº de sucessos obtidos. Portanto:
P( X  k ) 

 p
n
k
k
(1  p) nk , k  0,1,....., n
E(X)=np e V(X)=np(1-p)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Modelos Probabilísticos para
variáveis Discretas: Distribuição de
Poisson



Largamente empregada quando se deseja contar o
número de eventos de certo tio que ocorrem em um
intervalo de tempo, superfície ou volume.
Exemplos:
Fórmula:
e  t ( t ) K
P( X  k ) 
k!



Número de chamadas telefônicas recebidas em uma
central em um intervalo de tempo.
Número de falhas em um computador em um dia de
operação.
Número de defeitos em uma chapa de metal de 1 m2
produzida.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Modelos Probabilísticos para variáveis
contínuas: Distribuição Normal

Representação Gráfica:
68%
-

+
A distribuição Normal é um modelo estatístico que
fornece uma base teórica para o estudo do padrão de
ocorrência dos elementos de várias populações de
interesse.
µ é a média da distribuição (centro)
ơ é o desvio padrão da distribuição (dispersão)
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
Curva Normal

Para calcular probabilidades associadas
a uma variável Normal de média µ e
desvio padrão ơ, (N(µ,ơ)), deve ser
utilizada a variável Normal padronizada
ou reduzida:
z

X 

A média de Z é zero e seu desvio padrão
é 1.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
X
µ-3ơ
µ-2ơ
µ-ơ
µ
µ+ơ µ+2ơ
µ+3ơ
z
-3
ESTATÍSTICA APLICADA
-2
-1
0
1
2
Prof. Cezar Cerqueira
3
Distribuição Normal: uso da tabela
z
0
X 

z
P(0<Z<1)
0,3413
0
P(Z<-1)
0,5+0,3413
1
-1
P(Z>1)
0,5-0,3413
0
Uso inverso da Tabela
5%
z=1,64
1
0
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
z
Curva Normal

Propriedades:
1) A área sob a curva é igual a 1.
2) A curva é simétrica em relação à sua média.
3) f(x) tende para 0 quando X tende para +/- 
4) A curva possui um ponto máximo em x = .
Intervalo
Probabilidade (Área)
Interna
Externa
(µ±ơ)
68,3%
31,7%
(µ±2ơ)
95,5%
4,5%
(µ±3ơ)
99,73%
0,27
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
DISTRIBUIÇÕES AMOSTRAIS





Lei dos grandes números – Extraia observações
aleatórias e independentes de uma população de média

À medida que o número de observações aumenta, a
média amostral
aproxima-se cada vez mais da média
da população .
Características de uma população podem ser descritas
pelos parâmetros.
Os parâmetros são quantidades desconhecidas, a serem
estimadas via amostra.
As distribuições amostrais podem ser vistas como:


Distribuição de probabilidades de uma estatística
amostral
Indicam como variam as estatísticas devido a variações
no processo de amostragem.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
DISTRIBUIÇÃO AMOSTRAL DE
MÉDIAS



Obtida a partir da média aritmética de uma série de amostras
de tamanho n, extraída de uma população que tem média  e
desvio padrão .
A média da distribuição amostral de médias é igual à média
populacional
O desvio-padrão da distribuição amostral de médias é dada
por:

n


A distribuição amostral de médias é aproximadamente normal,
para n grande.
A
estatística
correspondente
à
equação
abaixo
é
aproximadamente N(0,1).
Z
ESTATÍSTICA APLICADA
(x  ) n

Prof. Cezar Cerqueira
DISTRIBUIÇÃO AMOSTRAL DE
PROPORÇÕES



Obtida a partir da proporção de elementos em uma amostra que
possuem certa característica de interesse.
A média da distribuição amostral da proporção é igual à
proporção populacional.
O desvio-padrão da distribuição amostral da proporção é dado
por:
p 


p(1  p)
n
A distribuição amostral da proporção é aproximadamente
normal, para n grande.
A
estatística
correspondente
à
equação
abaixo
é
aproximadamente N(0,1).
z
ESTATÍSTICA APLICADA
pa  P
P(1  P)
n
Prof. Cezar Cerqueira
INTERVALO DE CONFIANÇA PARA A
MÉDIA – com desvio padrão
conhecido






Objetivo do IC: estimar um parâmetro desconhecido com uma
indicação da precisão da estimativa.
Formato: estimativa +/- margem de erro
Nível de confiança: probabilidade de que o método forneça
uma resposta correta.
A média amostral varia de amostra para amostra
Para levar em consideração esta fato devemos construir um
intervalo de confiança para a verdadeira média populacional,
com base na média amostral.
Tal intervalo tem uma probabilidade (nível de confiança) de
estar estimando corretamente (conter) o parâmetro.
ESTATÍSTICA APLICADA
Prof. Cezar Cerqueira
INTERVALO DE CONFIANÇA PARA A
MÉDIA – com desvio padrão
conhecido

O intervalo para a média, com desvio-padrão conhecido, pode
ser representado pela expressão:
x  Z

2
n
x  média amostral
Z   valor obtido na tabela normal
2
  nível de significancia adotado

n
ESTATÍSTICA APLICADA
 erro  padrão da distribuição amostral da média
Prof. Cezar Cerqueira
Download