CURSO DE PROBABILIDADE E ESTATÍSTICA BÁSICA Prof. Cezar Augusto Cerqueira – UPE/UNICAP ESTATÍSTICA APLICADA Prof. Cezar Cerqueira ESTATÍSTICA: UMA VISÃO GERAL ESTATÍSTICA Ciência de coletar, organizar, interpretar dados Visando...tomada de decisões ESTATÍSTICAS Somos bombardeados por elas a todo momento Números, informações, indicadores... Sociais, econômicos, demográficos, gerenciais ESTATÍSTICA APLICADA Prof. Cezar Cerqueira A estatística reúne métodos para: Coleta Processamento Análise e interpretação de dados Informações numéricas analisadas servem de base para tomada de decisões; As estatísticas nos auxiliam a entender melhor os fenômenos em geral; ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Métodos Estatísticos: Importância - profissional Ferramenta fundamental no processo de solução de problemas Gestores modernos lidam com grande quantidade de informação. Auxílio na determinação de planos de ação para resolução de problemas Tomada de decisões “bem informadas“ Apresentar e descrever de forma apropriada as informações Tirar conclusões sobre grandes populações com base em amostras Melhorar processos Obter previsões confiáveis ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Métodos Estatísticos: Importância - empresa Aumento na competitividade Eliminação de desperdícios Redução na necessidade de inspeção Aumento no grau de satisfação dos clientes ESTATÍSTICA APLICADA Prof. Cezar Cerqueira PROCESSO Equipamentos Insumos Métodos ou procedimentos Condições ambientais Pessoas Informações do processo Fabricação de um bem ou fornecimento de um serviço Uma Ferramenta importante: o fluxograma ESTATÍSTICA APLICADA Prof. Cezar Cerqueira PROBABILIDADE Teoria matemática utilizada para se estudar a incerteza, oriunda de fenômenos de caráter aleatório. INFERÊNCIA ESTATÍSTICA Trata da análise e interpretação de dados amostrais O principio básico é tirar conclusões sobre a população a partir de uma amostra de dados obtida da mesma. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira População Amostra Descrição ESTATÍSTICA APLICADA Análise Prof. Cezar Cerqueira Inferência Coleta de dados Dados: base para tomada de decisões Inteligência (Projetos) Conhecimento (Tomada de decisão) Informação (Modelos Probab - Inferencia)) Dados Observados (análise exploratória) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira COLETA DE DADOS: OBJETIVOS Desenvolvimento de novos produtos Pesquisas de mercado Inspeção Classificação de produtos/insumos Controle e acompanhamento de processos produtivos Verificar se o processo está sob controle; quantificar a variabilidade; verificar se o processo é atende a especificações. Melhoria de processos produtivos Produtos que não satisfazem à meta Melhoria frente a novas exigências e necessidade de sobrevivencia da empresa. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Indivíduo e Variável Indivíduos: objetos descritos por um conjunto de dados (pessoas, empresas, municípios, animais, ações, tempo, etc) Variáveis: qualquer característica de um indivíduo, podendo assumir diferentes valores, de acordo com o indivíduo a que se refere. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira OBSERVAÇÃO versus EXPERIMENTO Estudo observacional Investiga indivíduos e mede variáveis de interesse, sem influenciar as respostas Experimento Impõe algum tipo de tratamento sobre os indivíduos, a fim de observar suas respostas ESTATÍSTICA APLICADA Prof. Cezar Cerqueira TIPOS DE DADOS: VARIÁVEIS QUALITATIVAS Nominais (sexo, região...) Ordinais (grau de instrução) QUANTITATIVAS Discretas (contagens) ESTATÍSTICA APLICADA Ex: número de itens defeituosos; número de arranhões em certa peça; número de acidentes de trabalho no mês. Contínuas (mensurações em escala contínua) Diâmetro de uma peça; rendimento de uma reação química; tempo gasto na execução de uma tarefa; espessura de uma peça. Prof. Cezar Cerqueira O Banco de Dados Nome Idade Sexo Renda (Sal. Min) José 27 Masc 5,32 Catarina 30 Fem 6,43 Pedro 21 Masc 1,20 Cibele 22 Fem 2,33 Helena 25 Fem 3,56 Marta 20 Fem 1,70 Carolina 35 Fem 4,50 Juan 45 Masc 8,00 ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Instrução Superior 2 Grau 1 Grau 2 Grau 2 Grau 1 Grau Técnica Superior Levantamentos amostrais População Grupo inteiro de indivíduos sobre o qual se deseja informações Amostra Parte da população da qual se coletam de fato informações, utilizadas para se tirarem conclusões sobre o todo. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Amostragem Aleatória simples Estratificada PROBABILÍSTICA Sistemática Grupos (cluster) Multifásica AMOSTRAGEM (Tipos) NÃO PROBABILÍSTICA ESTATÍSTICA APLICADA Prof. Cezar Cerqueira ESTRATIFICAÇÃO Agrupamento da informação (dados) sob vários pontos de vista para dar foco à ação. Equipamentos, insumos, pessoas, métodos, medidas, condições ambientais. Tempo (manhã, tarde, noite) Local (linhas de produção, regiões) Tipo (fornecedor) Indivíduo(operadores) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Gráfico de Pareto Princípio de Pareto (80/20) Em torno de 80% dos problemas vem de 20% das causas Atacar 1/5 das causas solucionaria 4/5 dos problemas ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Distribuições de frequência: Gráfico de Pareto Tabela 2.4 – Defeitos encontrados em uma amostra de lentes fabricadas pela indústria Freqüência Freqüência Total relativa Percentual Tipo de Defeito de defeitos Acumulado (%) Acumulado Revest. Inadequado 55 55 43,3 43,3 Trinca 41 96 32,3 75,6 Arranhão 12 108 9,4 85,0 Espessura inadequada 11 119 8,7 93,7 Mal-acabada 5 124 3,9 97,6 outros 3 127 2,4 100,0 Total 127 FONTE: Indústria de lentes ESTATÍSTICA APLICADA - 100,0 - Prof. Cezar Cerqueira Gráfico de Pareto Para causas: equipamentos, insumos, informação do processo ou medidas, condições ambientais, pessoas, métodos ou procedimentos. Para efeitos: qualidade, custo, entrega, moral, segurança, etc. Expresso em unidades monetárias Gráfico de Pareto estratificado (por operador, etc) Comparações tipo antes e depois Desdobramento de gráficos de Pareto (causas e subcausas) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Organização e Análise de dados ESTATÍSTICA APLICADA Prof. Cezar Cerqueira FERRAMENTAS GRÁFICAS SIMPLES: VARIÁVEIS CONTÍNUAS Diagrama de Pontos Considere os dados: 3 o 3 o 4 o o 5 o 6 4 4,5 7 o 8 4,5 Exibem: Dispersão, conglomerados de pontos, lacunas, outliers, comparações ESTATÍSTICA APLICADA Prof. Cezar Cerqueira 6 8 GRÁFICOS SIMPLES: VARIÁVEIS CONTÍNUAS : Gráfico Ramo-e-Folhas Exemplo: Considere os dados abaixo representando a resistência à compressão de uma amostra de 80 corpos de prova de liga de alumínio: 105 97 245 163 207 134 218 199 160 196 221 154 228 131 180 178 157 151 175 201 183 153 174 154 190 76 101 142 149 200 186 174 199 115 193 167 171 163 87 176 ESTATÍSTICA APLICADA 121 120 181 160 194 184 165 145 160 150 181 168 158 208 133 135 172 171 237 170 180 167 176 158 156 229 158 148 150 118 143 141 110 133 123 146 169 158 135 149 Ramo Folha 76 87 97 10 51 11 580 12 103 13 413535 14 29583169 15 471340886808 16 3073050879 17 8544162106 18 361410 19 960934 20 7108 21 8 22 189 23 7 24 5 Prof. Cezar Cerqueira Frequencia 1 1 1 2 3 3 6 8 12 10 10 7 6 4 1 3 1 1 Apresentação de Dados Distribuições de frequências: caso nominal Tabela 2.1 Empregados do setor de produção, segundo o grau de instrução, 2005. GRAU DE INSTRUÇÃO Freqüência (fi) Primeiro Grau 15 Segundo Grau 25 Superior 10 TOTAL 50 FONTE: Pesquisa direta Empregados do Setor de Produção, segundo grau de instrução - 2000 20% 30% Primeiro Grau Segundo Grau Superior 50% ESTATÍSTICA APLICADA Prof. Cezar Cerqueira VARIABILIDADE Sempre presente em processos de produção ou serviços É afetada por diversos fatores Produtos defeituosas são produzidos devido à presença da variabilidade A redução da variabilidade implica na redução do número de itens defeituosos Causas comuns (inerentes) e causas especiais Processo sob controle: atuam apenas as causas comuns ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Gráfico de Sequencias no tempo Os dados representam a resistencia à compressão de uma amostra de 20 conectores plásticos: 280 260 240 220 200 241 258 237 210 189 194 225 190 250 220 190 250 240 190 180 209 212 123 178 190 180 160 140 120 100 1 ESTATÍSTICA APLICADA 2 3 Prof. Cezar Cerqueira 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 HISTOGRAMA Distribuição: modelo estatístico para o padrão de ocorrencia dos valores de determinada população O histograma é um gráfico de barras no qual o eixo horizontal é subdividido em vários pequenos intervalos, sendo construída uma barra vertical, de área proporcional ao número de observações na amostra cujos valores pertencem ao intervalo correspondente. As informações são dispostas de modo a permitir a possível visualização da forma da distribuição dos dados e a percepção do valor central e da dispersão em torno desta valor central. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Distribuições de frequência: Caso contínuo - Histograma As distribuições podem diferir em: Locação (centralidade, média, mediana) Variabilidade (desvio padrão, variância) Forma (assimetria) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Um procedimento para construção de um Histograma (variáveis contínuas) Coletar “n” observações Escolher o número de intervalos (k) Calcular a amplitude total dos dados (R) Calcular o comprimento de cada intervalo (amplitude de classe, h) h=R/k Arredondar convenientemente h Calcular os limites de cada intervalo Construir a tabela de frequencias, que deve conter: R = Max - Min Limites de cada intervalo; ponto médio; frequencia simples (fi); frequencia relativa; frequencia acumulada (simples e relativa) Desenhar o Histograma ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Distribuições de frequência variável contínua: Histograma Dados relativos ao comprimento de uma amostra de 100 parafusos ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Distribuições de frequência: Caso discreto Dados referentes ao número de defeitos encontrados em uma amostra de 90 chapas de aço 45 40 Total Peças 0 35 1 40 2 7 3 5 4 2 5 1 90 35 30 25 20 15 10 5 0 0 ESTATÍSTICA APLICADA 1 2 Prof. Cezar Cerqueira 3 4 5 Tipos de Histogramas: simétrico Valor médio no centro Frequencia mais alta no centro diminuindo gradualmente de forma simétrica em direção aos extremos 100 80 60 40 20 0 Média=mediana=moda ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Tipos de Histogramas: assimétrico positivo freqüência decresce bruscamente em um dos lados e de forma gradual no outro Média fora do centro do histograma cauda mais longa em um dos lados 90 80 70 60 50 40 30 20 10 0 Média>mediana; média>moda ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Tipos de Histogramas: despenhadeiro 90 80 70 60 50 90 80 70 60 50 40 30 20 10 0 40 30 20 10 0 Frequencia diminui de forma abrupta de um ou dos 2 lados Processo não atende às especificações ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Tipos de Histogramas: dois picos 100 80 60 40 20 0 Mistura de dados com médias diferentes Dados de 2 máquinas ou 2 turnos, etc ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Tipos de Histogramas: ilhas isoladas 100 80 60 40 20 0 Erros de medição, erros de registro ou transcrição dos dados Anormalidades temporárias no processo ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Tipos de Histogramas: achatado (platô) 80 70 60 50 40 30 20 10 0 Mistura de várias distribuições com médias diferentes Classes centrais possuem aproximadamente a mesma frequência. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Histograma: estratificação Quando estratificado o Histograma pode exibir diferentes distribuições para distintos fatores. A existencia de diferentes distribuições podem estar contribuindo para aumentar a variabilidade do processo. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Histogramas e limites de especificação ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Resumindo dados: análise descritiva e exploratória “Um estatístico é um sujeito que se está com a cabeça num forno e os pés enterrados no gelo, ainda diz que na média a temperatura está ótima”.( K. Dunnigan) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira RESUMO NUMÉRICO DE DADOS QUANTITATIVOS: LOCALIZAÇÃO DO CENTRO DOS DADOS Média Aritmética n Dados brutos i 1 Mediana Moda n k Dados agrupados X X i 1 i fi n Valor do meio em uma sequencia ordenada de dados “n” ímpar X Xi X n 1 ( ) 2 Dados agrupados “n” par Me Li Me [(0,5)n Fant ] .c f Me Valor mais frequente de uma série de dados ESTATÍSTICA APLICADA X ( n / 2) X ([ n / 2 ]1) Prof. Cezar Cerqueira 2 OUTRAS MEDIDAS DE LOCAÇÃO: Quartis Primeiro Quartil 25% das observações são menores e 75% maiores Q1 X ( n 1 ) 4 Segundo Quartil (Mediana) Terceiro Quartil Q3 X ESTATÍSTICA APLICADA ( 3( n 1) ) 4 Prof. Cezar Cerqueira VARIABILIDADE Medidas de tendência central podem mascarar importantes aspectos em uma série de dados Um processo de produção de bens e fornecimento de serviços sempre apresenta variabilidade A variabilidade é resultado de uma série de alterações nas condições sob as quais as observações são tomadas. matérias-primas, condições de equipamentos, métodos de trabalho, condições ambientais e operadores ESTATÍSTICA APLICADA Prof. Cezar Cerqueira VARIABILIDADE: Problematizando Os dados abaixo referem-se a notas obtidas em 3 turmas de 5 alunos cada: Turma A: 3 4 5 6 7 Turma B: 1 3 5 7 9 Turma C: 5 5 5 5 5 Em termos de tendência central como podemos analisar os grupos ? E em termos de dispersão? Qual deles parece mais disperso? E qual deles apresenta maior variabilidade? Façamos uma investigação gráfica do fenômeno. Como obter uma medida de variabilidade média para os grupos? ESTATÍSTICA APLICADA Prof. Cezar Cerqueira MEDINDO A VARIABILIDADE Variância Populacional ( X i ) 2 1 2 [ X i ] n n 2 Variância Amostral 2 ( X ) 1 i s2 [ X i2 ] n 1 n Desvio Padrão Corresponde à raiz quadrada da variância ESTATÍSTICA APLICADA Prof. Cezar Cerqueira MEDINDO A VARIABILIDADE: outras medidas Amplitude Total Amplitude Interquartil Xmax-Xmin J = Q3–Q1 Coeficiente de variação CV Desvio padrão S média X Comparação de grupos muito diferentes Comparação de dispersão com escalas diferentes ESTATÍSTICA APLICADA Prof. Cezar Cerqueira ESTUDO DA FORMA: ASSIMETRIA Curva Simétrica Distribuição dos salários dos empregados do setor de produção da Companhia A 30 freq. simples 25 20 15 10 5 0 6 10 14 sal.min. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira 18 22 ESTUDO DA FORMA: ASSIMETRIA Assimetria Negativa ESTATÍSTICA APLICADA Simetria Prof. Cezar Cerqueira Assimetria Positiva Gráfico Box-Plot Índice de Desenvolvimento Humano no Brasil, por Região - 2000 Juntas: Q1,Q2,Q3 Extremos: E1 e E2 1.0 .9 E1 Q1 Me Q3 E2 .8 .7 IDHMUN .6 .5 .4 NO REGIAO ESTATÍSTICA APLICADA Prof. Cezar Cerqueira NE SE SUL CO Explorando a relação entre variáveis ESTATÍSTICA APLICADA Prof. Cezar Cerqueira EXPLORANDO A RELAÇÃO ENTRE VARIÁVEIS Mensurar o tipo e grau de associação entre duas ou mais variáveis. Foco inicial: duas variáveis quantitativas Etapas: Abordagem gráfica: diagrama de dispersão Cálculo do coeficiente de correlação linear de Pearson, ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Diagrama de dispersão Gráfico utilizado para a visualização do tipo de relacionamento entre 2 variáveis quantitativas Este entendimento contribui para aumentar a eficiencia dos métodos de controle de um processo ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Construção do diagrama de dispersão 1. 2. 3. 4. 5. 6. 7. Coletar ao menos 30 pares de observações (x,y) das variáveis a serem estudadas; Registrar os dados em uma tabela; Escolher uma variável a ser representada no eixo ‘x’ (preditora) e outra variável em ‘y’ (dependente); Determinar os valores máximo e mínimo para cada variável; Escolher as escalas para ‘x’ e ‘y’ Representar no gráfico os pares de observações (x,y). Registrar informações importantes que devem constar no gráfico: título, legendas, unidades de medidas, etc ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Correlação positiva: à medida que x aumenta, y também aumenta. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Moderada correlação positiva: y tende a aumentar com x, porém com elevada variabilidade. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Ausência de correlação: os valores das variáveis não estão relacionados. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Moderada correlação negativa: y tende a diminuir com o aumento de x. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Forte correlação negativa: à medida que x aumenta, y diminui. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Outliers: São observações extremas não condizentes com o restante dos dados. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Interpretação de diagramas de dispersão Exemplo: O diagrama ao lado mostra forte correlação negativa entre as variáveis Tensão e Variação no Corte. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Estratificação de Diagramas de Dispersão Em muitos casos a estratificação de um diagrama de dispersão permite a descoberta da causa de um problema. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira CORRELAÇÃO: diagrama de dispersão Gráfico que representa no plano cartesiano duas variáveis quantitativas Ferramenta simples que permite aprofundar o estudo da associação entre 2 variáveis. Como ilustração, considere a tabela abaixo, que representa o tempo de serviço e o volume de vendas semanais de uma amostra de 5 vendedores de determinado produto: ESTATÍSTICA APLICADA Tempo (anos) 1 3 4 6 8 Vendas 35 40 42 50 55 Prof. Cezar Cerqueira Diagrama de Dispersão 55 Y vendas 50 45 40 35 0 1 2 3 4 5 6 X te m p o ESTATÍSTICA APLICADA Prof. Cezar Cerqueira 7 8 9 CORRELAÇÃO Quando as variáveis crescem no mesmo sentido temos o caso de correlação positiva. Quando as variáveis crescem em sentidos opostos temos uma correlação negativa. Se os dados estão perfeitamente alinhados sobre uma reta temos uma correlação perfeita. Quando o crescimento de uma variável é acompanhado de variações casuais da outra variável a correlação é nula. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira COEFICIENTE DE CORRELAÇÃO LINEAR: FÓRMULA DE CÁLCULO r XY S XY onde: S XX S YY S XY XY X Y n S XX X 2 S YY Y 2 ( X ) 2 n ( Y ) 2 n Lembre que: -1 rxy 1 ESTATÍSTICA APLICADA Prof. Cezar Cerqueira COEFICIENTE DE CORRELAÇÃO LINEAR: CÁLCULO PARA O EXEMPLO ANTERIOR X2 Elemento Tempo (anos) Vendas 1 1 35 2 3 40 3 4 42 4 6 50 5 8 55 Total 22 222 X i 22; Y i S xx X 2 S yy Y 2 S xy XY rxy 222; ( X ) 2 n ( Y ) 2 n S xy S xx S yy 1 9 16 36 64 126 X XY 1225 1600 1764 2500 3025 10114 2 i 126; 35 120 168 300 440 1063 Y i 2 10114 e XY i i 1063 222 126 29,2 5 10114 ( X )( Y ) n Y2 222 2 257,2 5 1063 ( 22)(222) 86,2 5 86,2 0,995 (29,2)(257,2) Indica uma associação forte e positiva !! CUIDADO!!! Correlação não implica em relação de causa efeito. !! ESTATÍSTICA APLICADA Prof. Cezar Cerqueira RELAÇÕES ENTRE VARIÁVEIS: QUANTITATIVAS X QUALITATIVAS Comparação do Comportamento de uma Variável Contínua por Grupos Captar diferenças: i)nos níveis médios, ii)em variabilidade, iii)na forma da distribuição, iv)detalhes individuais. Via: Diagrama de Pontos Gráficos tipo Box-Plot Gráfico Ramo-e-Folhas ESTATÍSTICA APLICADA Prof. Cezar Cerqueira RELAÇÕES ENTRE VARIÁVEIS: AMBAS QUALITATIVAS Tabela de contingência a 2 fatores Variável dependente e explicativa Medir associações Encontrar distribuições percentuais Distribuições marginais Distribuições condicionais ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Noções de Probabilidade e Inferência: mensurando a incerteza... O Acaso existe? “ O acaso não existe: tudo é provação, ou punição, ou recompensa, ou previdencia”. (Voltaire) “O acaso é a causa ignorada de um efeito conhecido” (Voltaire) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira NOÇÕES DE PROBABILIDADE Aleatoriedade Experimentos aleatórios Probabilidade Resultados imprevisíveis regularidade chance de ocorrência de um evento aleatório. idealização do que aconteceria se feita uma sequencia longa de repetições Proporção de vezes em quem um evento ocorre em uma sequencia longa de repetições do experimento Independencia Resultado de uma tentativa não deve influenciar o resultado de outra ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Modelos Probabilísticos para variáveis Discretas: Distribuição Binomial Considera n repetições independentes de um experimento de Bernoulli. Exemplos: Jogue uma moeda 10 vezes. Seja X=nº de caras obtido Uma máquina produz 1% de peças defeituosas. Seja X=nº de peças defeituosas nas próximas 25 produzidas. Nos próximos 30 nascimentos em uma maternidade, seja X=nº de meninas observado. Seja a VA X=nº de sucessos obtidos. Portanto: P( X k ) p n k k (1 p) nk , k 0,1,....., n E(X)=np e V(X)=np(1-p) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Modelos Probabilísticos para variáveis Discretas: Distribuição de Poisson Largamente empregada quando se deseja contar o número de eventos de certo tio que ocorrem em um intervalo de tempo, superfície ou volume. Exemplos: Fórmula: e t ( t ) K P( X k ) k! Número de chamadas telefônicas recebidas em uma central em um intervalo de tempo. Número de falhas em um computador em um dia de operação. Número de defeitos em uma chapa de metal de 1 m2 produzida. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Modelos Probabilísticos para variáveis contínuas: Distribuição Normal Representação Gráfica: 68% - + A distribuição Normal é um modelo estatístico que fornece uma base teórica para o estudo do padrão de ocorrência dos elementos de várias populações de interesse. µ é a média da distribuição (centro) ơ é o desvio padrão da distribuição (dispersão) ESTATÍSTICA APLICADA Prof. Cezar Cerqueira Curva Normal Para calcular probabilidades associadas a uma variável Normal de média µ e desvio padrão ơ, (N(µ,ơ)), deve ser utilizada a variável Normal padronizada ou reduzida: z X A média de Z é zero e seu desvio padrão é 1. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira X µ-3ơ µ-2ơ µ-ơ µ µ+ơ µ+2ơ µ+3ơ z -3 ESTATÍSTICA APLICADA -2 -1 0 1 2 Prof. Cezar Cerqueira 3 Distribuição Normal: uso da tabela z 0 X z P(0<Z<1) 0,3413 0 P(Z<-1) 0,5+0,3413 1 -1 P(Z>1) 0,5-0,3413 0 Uso inverso da Tabela 5% z=1,64 1 0 ESTATÍSTICA APLICADA Prof. Cezar Cerqueira z Curva Normal Propriedades: 1) A área sob a curva é igual a 1. 2) A curva é simétrica em relação à sua média. 3) f(x) tende para 0 quando X tende para +/- 4) A curva possui um ponto máximo em x = . Intervalo Probabilidade (Área) Interna Externa (µ±ơ) 68,3% 31,7% (µ±2ơ) 95,5% 4,5% (µ±3ơ) 99,73% 0,27 ESTATÍSTICA APLICADA Prof. Cezar Cerqueira DISTRIBUIÇÕES AMOSTRAIS Lei dos grandes números – Extraia observações aleatórias e independentes de uma população de média À medida que o número de observações aumenta, a média amostral aproxima-se cada vez mais da média da população . Características de uma população podem ser descritas pelos parâmetros. Os parâmetros são quantidades desconhecidas, a serem estimadas via amostra. As distribuições amostrais podem ser vistas como: Distribuição de probabilidades de uma estatística amostral Indicam como variam as estatísticas devido a variações no processo de amostragem. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira DISTRIBUIÇÃO AMOSTRAL DE MÉDIAS Obtida a partir da média aritmética de uma série de amostras de tamanho n, extraída de uma população que tem média e desvio padrão . A média da distribuição amostral de médias é igual à média populacional O desvio-padrão da distribuição amostral de médias é dada por: n A distribuição amostral de médias é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1). Z ESTATÍSTICA APLICADA (x ) n Prof. Cezar Cerqueira DISTRIBUIÇÃO AMOSTRAL DE PROPORÇÕES Obtida a partir da proporção de elementos em uma amostra que possuem certa característica de interesse. A média da distribuição amostral da proporção é igual à proporção populacional. O desvio-padrão da distribuição amostral da proporção é dado por: p p(1 p) n A distribuição amostral da proporção é aproximadamente normal, para n grande. A estatística correspondente à equação abaixo é aproximadamente N(0,1). z ESTATÍSTICA APLICADA pa P P(1 P) n Prof. Cezar Cerqueira INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido Objetivo do IC: estimar um parâmetro desconhecido com uma indicação da precisão da estimativa. Formato: estimativa +/- margem de erro Nível de confiança: proporão de intervalos que conteriam o verdadeiro valor do parâmetro, caso o processo fosse repetido grande número de vezes. A média amostral varia de amostra para amostra Para levar em consideração esta fato devemos construir um intervalo de confiança para a verdadeira média populacional, com base na média amostral. ESTATÍSTICA APLICADA Prof. Cezar Cerqueira INTERVALO DE CONFIANÇA PARA A MÉDIA – com desvio padrão conhecido O intervalo para a média, com desvio-padrão conhecido, pode ser representado pela expressão: x Z 2 n x média amostral Z valor obtido na tabela normal 2 nível de significancia adotado n ESTATÍSTICA APLICADA erro padrão da distribuição amostral da média Prof. Cezar Cerqueira