PROBABILIDADE E ESTATÍSTICA Flávia Komatsuzaki FEAMIG 1.1 Desenvolvimento histórico da estatística • Estatística: a palavra provém do latim status que significa estado. • A primeira utilização da estatística envolvia compilação de dados e gráficos que descreviam vários aspectos de um estado ou país. • Em 1662 John Graunt publicou informes estatísticos sobre nascimentos e mortes. O trabalho de Graunt foi relacionado por estudos de mortalidade e taxas de morbidade, tamanho de populações, rendas e taxas de desemprego. • Hoje, as famílias, os governos, as escolas e as empresas se apoiam largamente em dados estatísticos. Unidade I - Introdução 1.1 Definição de Estatística, objetivo, suas aplicações e grandes áreas. 1.2 Fases do trabalho estatístico. 1.3 Conceitos básicos: população e amostra. 1.4 Classificação de variáveis aleatórias: quantitativa (discreta ou contínua) e qualitativa (nominal ou ordinal). 1.5 Estatística no curso de engenharia. 1.1 Objetivo e método da Estatística (Montgomery,DC & Runger, GC) • O campo de estatística lida com a coleta, apresentação, análise e uso dos dados para tomadas de decisões, resolver problemas e planejar produtos e processos. • Técnicas estatísticas podem ser uma ajuda poderosa no planejamento de novos produtos e sistemas, melhorando os projetos existentes e planejando, desenvolvendo e melhorando os processos de produção. • A estatística abrange muito mais do que gráficos, tabelas, cálculo de médias e taxas. 1.1 Aplicações Saúde Agricultura Financeira Industrial Telecom Educação Outras 1.1 Grandes áreas da estatística Estatística descritiva Dados categorizados Bioestatística Probabilidade Controle de Qualidade Inferência estatística Séries Temporais Estatística multivariada Modelos lineares generalizados Econometria Processos estocásticos Estatística Bayesiana Planejamento de experimentos Amostragem 1.2 Fases do trabalho estatístico 1) Coleta de Dados Planejamento e Amostragem 2) Estatística descritiva Organiza, apresenta e sintetiza 3) Estatística inferencial Método para tomada de decisões nas situações de incerteza e variação Cálculo de tamanho de amostra nos diferentes tipos de amostragem, tipos de estudos e planejamento e experimentos. Medidas de tendência central, localização, variação, índices e distribuição de freqüência apresentada através de gráficos e/ou tabelas e técnicas multivariadas exploratórias Testes de hipóteses paramétricos, não paramétricos e exatos, intervalos de confianças e modelos estatísticos. 1.3 Conceitos básicos • População: é uma coleção completa de todos os elementos, valores, pessoas, medidas, etc) a serem estudados. • Amostra: é uma subcoleção de elementos extraídos de uma população. • Censo: é uma coleção de dados relativos a todos os elementos de uma população. • Parâmetro: é uma medida numérica que descreve uma característica de uma população. • Estatística: é uma medida numérica que descreve uma característica de uma amostra. 1.4 Tipos de variáveis Variável Categórica Nominal Ordinal Quantitativa Discreta Contínua 1.4 Tipos de variáveis – Variável categórica: pode ter duas ou mais categorias, o número de categorias pode depender do interesse do estudo. Ex: para a variável hábito de fumar, pode-se classificar um indivíduo como fumante ou não-fumante ou ainda utilizar uma classificação mais detalhada não fumante, ex-fumante, fumante ocasional, fumante inveterado, etc. – Variável discreta: os valores diferem entre si por quantidades fixas, tamanho da família é uma variável discreta, já que indivíduos diferentes têm tamanhos de família que diferem, por exemplo, 1, 2, 3, 4 ou mais. Nenhum valor intermediário é possível. Geralmente, estas variáveis são os resultados de contagens, como por exemplo, número de peças defeituosas no lote de peças, número de funcionários contratados por mês e número de peças fabricadas por hora, etc. – Variável contínua: tais como comprimento, largura e peso de uma peça, são usualmente medidas através de um aparelho (régua, balança, etc). A diferença entre medidas de indivíduos distintos pode ser arbitrariamente pequena. Por exemplo, quando dizemos que o tempo de fabricação de um carro for de 2 horas, estamos provavelmente simplificando a unidade de medida tomando-a em horas, mas na verdade poderia ser 1 hora, 57 minutos e 10 segundos. 1.4 Tipos de variáveis Variável discreta x variável categórica ordinal – A diferença é que a ordenação tem um significado diferente como o seguinte exemplo: Suponha duas variáveis de grau de satisfação em relação a um telefone celular (I, II, III, IV) em que grau I significa muito insatisfeito, grau II significa insatisfeito, grau III satisfeito e grau IV muito satisfeito e número de telefones celulares nas residências (0, 1, 2, 3, 4 e 5) -> Não se pode dizer que a diferença entre I e II é equivalente aquela diferença entre III e IV. -> 4 celulares corresponde exatamente ao dobro de 2 celulares. – A variável discreta número de celulares mostra que é uma contagem e que 6 celulares é o triplo de 2 celulares, etc. Já a categórica ordinal grau de satisfação mostra o grau, mas esta relação numérica não acontece neste tipo de variável. – A ordenação mostra que o Grau IV é o maior grau de satisfação que os demais e o grau I é o menor, já os graus II e III são intermediários, a distância entre eles não são necessariamente iguais. 1.4 Tipos de variáveis – Variável quantitativa • Contínua: medida (cm2, gramas, litros) • Contagem: quantidade de peças • Escala: (escala de satisfação de 0 a 100) – Variável categórica • Nominal: cor do carro, tipo de carro, marca do carro, etc. • Ordinal: grau de satisfação (0 a 5), grau de concordância, etc. – Categorização de variáveis quantitativas • Referências já estabelecidas, pela literatura nacional e internacional ou limites de especificações • Através de medidas estatísticas: Quartis, média, mediana, moda, etc. 1.5 O método de engenharia e o pensamento estatístico 1) Desenvolva uma descrição clara 2) Identifique os fatores importantes 3) Proponha um modelo para o problema 4) Conduza experimentos apropriados e colete dados para testar ou validar o modelo tentativa ou conclusões feitas nas etapas 2 e 3 5) Refinar o modelo, com base nos dados observados 6) Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema 7) Conduzir um experimento apropriado para confirmar que a solução do problema é efetiva e eficiente 8) Tirar conclusões ou fazer recomendações baseadas na solução do problema 1.5 Estatística na engenharia • Métodos estatísticos são usados para nos ajudar a entender a variabilidade. • Sucessivas observações de um sistema ou fenômeno não produzem exatamente o mesmo resultado. • Julgamento estatístico pode nos dar uma maneira útil para essa variabilidade em nossos processos para tomadas de decisões. • Exemplo: Desempenho de consumo de gasolina de seu carro. Você sempre consegue o mesmo desempenho do consumo em cada tanque de combustível? Quais são os fatores que podem influenciar o desempenho? A estatística nos fornece uma estrutura para descrever essa variabilidade e para aprender sobre quais fontes potenciais de variabilidade são mais importantes ou quais tem o maior impacto no desempenho de consumo de gasolina. 1.5 O pensamento estatístico 1) Coleta de dados • No ambiente de engenharia, os dados são quase sempre uma amostra que foi selecionada a partir de alguma população. • Um procedimento efetivo de coletar dados pode simplificar grandemente a análise e conduzir a um melhor entendimento da população ou processo que está sendo estudado. • Três métodos básicos de coletar dados são: 1) Estudo retrospectivo: • • • • Utiliza dados históricos, Pode envolver uma porção de dados, Dados podem conter informação relativamente de pouca utilidade sobre o problema; Dados relevantes podem ter sido omitidos, pode haver erros de transcrição ou de registro. 1.5 Pensamento estatístico 1) Coleta de dados (continuação) • Três métodos básicos de coletar dados são: 2) Estudo de observação: • • • • • • • • O engenheiro observa o processo ou população; Pertubando-o tão pouco quanto possível; Registra a grandeza de interesse; Geralmente conduzidos por um período relativamente curto; Algumas vezes variáveis que rotineiramente não são medidas podem ser incluídas. Um estudo de observação tende a resolver os problemas 1 e 2. Seguir um longo caminho em direção a obtenção de dados acurados e confiáveis. Estudos de observação podem não ajudar os problemas 3 e 4. 1.5 Pensamento estatístico 1) Coleta de dados (continuação) • Três métodos básicos de coletar dados são: 3) Experimento planejado: • • • O engenheiro faz variações propositais nas variáveis controláveis do sistema; Observa os dados de saída do sistema resultante; Faz uma inferência ou decisão acerca de quais variáveis são responsáveis pelas mudanças observadas no desempenho de saída. 1.5 Estatística na engenharia a) Desenvolver uma descrição clara e concisa do problema. b) Identificar, no mínimo testar, os fatores importantes que afetam esse problema ou que possam desempenhar um papel em sua solução. c) Propor um modelo para o problema, usando conhecimento científico ou de engenharia do fenômeno estudado. Estabelecer limitações ou suposições do modelo. d) Conduzir experimentos apropriados e coletar dados para testar ou validar o modelo, tentativa ou conclusões feitas nas etapas b e c. e) Refinar o modelo, com base nos dados observados. f) Manipular o modelo de modo a ajudar o desenvolvimento da solução do problema. g) Conduzir um experimento apropriado para confirmar que a solução proposta para o problema é efetiva e eficiente. h) Tirar conclusões ou fazer recomendações baseadas na solução do problema.