PROBABILIDADE E ESTATÍSTICA

Propaganda
PROBABILIDADE E
ESTATÍSTICA
Flávia Komatsuzaki
FEAMIG
1.1 Desenvolvimento histórico da estatística
• Estatística: a palavra provém do latim status que significa estado.
• A primeira utilização da estatística envolvia compilação de dados e
gráficos que descreviam vários aspectos de um estado ou país.
• Em 1662 John Graunt publicou informes estatísticos sobre
nascimentos e mortes. O trabalho de Graunt foi relacionado por
estudos de mortalidade e taxas de morbidade, tamanho de
populações, rendas e taxas de desemprego.
• Hoje, as famílias, os governos, as escolas e as empresas se
apoiam largamente em dados estatísticos.
Unidade I - Introdução
1.1 Definição de Estatística, objetivo, suas aplicações e
grandes áreas.
1.2 Fases do trabalho estatístico.
1.3 Conceitos básicos: população e amostra.
1.4 Classificação de variáveis aleatórias: quantitativa
(discreta ou contínua) e qualitativa (nominal ou
ordinal).
1.5 Estatística no curso de engenharia.
1.1 Objetivo e método da Estatística
(Montgomery,DC & Runger, GC)
• O campo de estatística lida com a coleta, apresentação, análise e
uso dos dados para tomadas de decisões, resolver problemas e
planejar produtos e processos.
• Técnicas estatísticas podem ser uma ajuda poderosa no
planejamento de novos produtos e sistemas, melhorando os
projetos existentes e planejando, desenvolvendo e melhorando os
processos de produção.
• A estatística abrange muito mais do que gráficos, tabelas, cálculo
de médias e taxas.
1.1 Aplicações
Saúde
Agricultura
Financeira
Industrial
Telecom
Educação
Outras
1.1 Grandes áreas da estatística
Estatística descritiva
Dados categorizados
Bioestatística
Probabilidade
Controle de Qualidade
Inferência estatística
Séries Temporais
Estatística multivariada
Modelos lineares generalizados
Econometria
Processos estocásticos
Estatística Bayesiana
Planejamento de experimentos
Amostragem
1.2 Fases do trabalho estatístico
1) Coleta de Dados
Planejamento e
Amostragem
2) Estatística descritiva
Organiza, apresenta e
sintetiza
3) Estatística
inferencial
Método para tomada
de decisões nas
situações de incerteza
e variação
Cálculo de tamanho de amostra nos diferentes
tipos de amostragem, tipos de estudos e
planejamento e experimentos.
Medidas de tendência central, localização,
variação, índices e distribuição de freqüência
apresentada através de gráficos e/ou tabelas
e técnicas multivariadas exploratórias
Testes de hipóteses paramétricos, não
paramétricos e exatos, intervalos de
confianças e modelos estatísticos.
1.3 Conceitos básicos
• População: é uma coleção completa de todos os elementos,
valores, pessoas, medidas, etc) a serem estudados.
• Amostra: é uma subcoleção de elementos extraídos de uma
população.
• Censo: é uma coleção de dados relativos a todos os elementos de
uma população.
• Parâmetro: é uma medida numérica que descreve uma
característica de uma população.
• Estatística: é uma medida numérica que descreve uma
característica de uma amostra.
1.4 Tipos de variáveis
Variável
Categórica
Nominal
Ordinal
Quantitativa
Discreta
Contínua
1.4 Tipos de variáveis
– Variável categórica: pode ter duas ou mais categorias, o número
de categorias pode depender do interesse do estudo. Ex: para a
variável hábito de fumar, pode-se classificar um indivíduo como
fumante ou não-fumante ou ainda utilizar uma classificação mais
detalhada não fumante, ex-fumante, fumante ocasional, fumante
inveterado, etc.
– Variável discreta: os valores diferem entre si por quantidades fixas,
tamanho da família é uma variável discreta, já que indivíduos
diferentes têm tamanhos de família que diferem, por exemplo, 1, 2,
3, 4 ou mais. Nenhum valor intermediário é possível. Geralmente,
estas variáveis são os resultados de contagens, como por
exemplo, número de peças defeituosas no lote de peças, número
de funcionários contratados por mês e número de peças
fabricadas por hora, etc.
– Variável contínua: tais como comprimento, largura e peso de uma
peça, são usualmente medidas através de um aparelho (régua,
balança, etc). A diferença entre medidas de indivíduos distintos
pode ser arbitrariamente pequena. Por exemplo, quando dizemos
que o tempo de fabricação de um carro for de 2 horas, estamos
provavelmente simplificando a unidade de medida tomando-a em
horas, mas na verdade poderia ser 1 hora, 57 minutos e 10
segundos.
1.4 Tipos de variáveis
Variável discreta x variável categórica ordinal
– A diferença é que a ordenação tem um significado diferente como
o seguinte exemplo: Suponha duas variáveis de grau de
satisfação em relação a um telefone celular (I, II, III, IV) em que
grau I significa muito insatisfeito, grau II significa insatisfeito, grau
III satisfeito e grau IV muito satisfeito e número de telefones
celulares nas residências (0, 1, 2, 3, 4 e 5)
-> Não se pode dizer que a diferença entre I e II é equivalente
aquela diferença entre III e IV.
-> 4 celulares corresponde exatamente ao dobro de 2 celulares.
– A variável discreta número de celulares mostra que é uma
contagem e que 6 celulares é o triplo de 2 celulares, etc. Já a
categórica ordinal grau de satisfação mostra o grau, mas esta
relação numérica não acontece neste tipo de variável.
– A ordenação mostra que o Grau IV é o maior grau de satisfação
que os demais e o grau I é o menor, já os graus II e III são
intermediários, a distância entre eles não são necessariamente
iguais.
1.4 Tipos de variáveis
– Variável quantitativa
• Contínua: medida (cm2, gramas, litros)
• Contagem: quantidade de peças
• Escala: (escala de satisfação de 0 a 100)
– Variável categórica
• Nominal: cor do carro, tipo de carro, marca do carro, etc.
• Ordinal: grau de satisfação (0 a 5), grau de concordância, etc.
– Categorização de variáveis quantitativas
• Referências já estabelecidas, pela literatura nacional e
internacional ou limites de especificações
• Através de medidas estatísticas: Quartis, média, mediana, moda,
etc.
1.5 O método de engenharia e o pensamento estatístico
1) Desenvolva uma descrição clara
2) Identifique os fatores importantes
3) Proponha um modelo para o problema
4) Conduza experimentos apropriados e colete dados para testar ou validar o modelo
tentativa ou conclusões feitas nas etapas 2 e 3
5) Refinar o modelo, com base nos dados observados
6) Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema
7) Conduzir um experimento apropriado para confirmar que a solução do problema é
efetiva e eficiente
8) Tirar conclusões ou fazer recomendações baseadas na solução do problema
1.5 Estatística na engenharia
• Métodos estatísticos são usados para nos ajudar a entender a
variabilidade.
• Sucessivas observações de um sistema ou fenômeno não
produzem exatamente o mesmo resultado.
• Julgamento estatístico pode nos dar uma maneira útil para essa
variabilidade em nossos processos para tomadas de decisões.
• Exemplo: Desempenho de consumo de gasolina de seu carro. Você
sempre consegue o mesmo desempenho do consumo em cada
tanque de combustível? Quais são os fatores que podem influenciar
o desempenho?
A estatística nos fornece uma estrutura para descrever essa
variabilidade e para aprender sobre quais fontes potenciais de
variabilidade são mais importantes ou quais tem o maior impacto no
desempenho de consumo de gasolina.
1.5 O pensamento estatístico
1)
Coleta de dados
•
No ambiente de engenharia, os dados são quase sempre uma
amostra que foi selecionada a partir de alguma população.
•
Um procedimento efetivo de coletar dados pode simplificar
grandemente a análise e conduzir a um melhor entendimento da
população ou processo que está sendo estudado.
•
Três métodos básicos de coletar dados são:
1) Estudo retrospectivo:
•
•
•
•
Utiliza dados históricos,
Pode envolver uma porção de dados,
Dados podem conter informação relativamente de pouca utilidade sobre o
problema;
Dados relevantes podem ter sido omitidos, pode haver erros de
transcrição ou de registro.
1.5 Pensamento estatístico
1)
Coleta de dados (continuação)
•
Três métodos básicos de coletar dados são:
2) Estudo de observação:
•
•
•
•
•
•
•
•
O engenheiro observa o processo ou população;
Pertubando-o tão pouco quanto possível;
Registra a grandeza de interesse;
Geralmente conduzidos por um período relativamente curto;
Algumas vezes variáveis que rotineiramente não são medidas podem ser
incluídas.
Um estudo de observação tende a resolver os problemas 1 e 2.
Seguir um longo caminho em direção a obtenção de dados acurados e
confiáveis.
Estudos de observação podem não ajudar os problemas 3 e 4.
1.5 Pensamento estatístico
1)
Coleta de dados (continuação)
•
Três métodos básicos de coletar dados são:
3) Experimento planejado:
•
•
•
O engenheiro faz variações propositais nas variáveis controláveis do
sistema;
Observa os dados de saída do sistema resultante;
Faz uma inferência ou decisão acerca de quais variáveis são responsáveis
pelas mudanças observadas no desempenho de saída.
1.5 Estatística na engenharia
a) Desenvolver uma descrição clara e concisa do problema.
b) Identificar, no mínimo testar, os fatores importantes que afetam esse
problema ou que possam desempenhar um papel em sua solução.
c) Propor um modelo para o problema, usando conhecimento científico
ou de engenharia do fenômeno estudado. Estabelecer limitações ou
suposições do modelo.
d) Conduzir experimentos apropriados e coletar dados para testar ou
validar o modelo, tentativa ou conclusões feitas nas etapas b e c.
e) Refinar o modelo, com base nos dados observados.
f) Manipular o modelo de modo a ajudar o desenvolvimento da solução
do problema.
g) Conduzir um experimento apropriado para confirmar que a solução
proposta para o problema é efetiva e eficiente.
h) Tirar conclusões ou fazer recomendações baseadas na solução do
problema.
Download