Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Professor Confiabilidade Estrutural Jorge Luiz A. Ferreira Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Análise Estatística dos Experimentos Conjunto de Observações e o Planejamento de Experimentos são essenciais para indicar a estrutura sob o qual as hipóteses de interesse podem ser verificadas. Fatores Controláveis Excitação Controle dos Fatores (quais e como escolhê-los ?) FENÔMENO EM ESTUDO Fatores Não Controláveis Observáveis e Não-Observáveis Resposta Cuidado !!!!!!! Planejamento Experimental e Análise dos Resultados Estão Intrinsecamente Associados !!!!!!!!!!!! Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatística A estatística é um conjunto de técnicas que permite, organizar, de forma descrever, sistemática, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Análise Estatística dos Experimentos Recorrendo ao Diagrama de Etapas de Desenvolvimento de Pesquisas: Proposta e Definição do Problema e Elaboração de hipóteses (A) Observação (B) Amostragem e Planejamento Experimental Análise Descritiva e Exploratória dos Dados Verificação das Hipóteses (C) Inferência Estatística Conclusões (D) Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Análise Estatística dos Experimentos O campo da estatística lida com a coleta, a apresentação, a análise e o uso dos dados para tomar decisões, resolver problemas e planejar produtos e processos. Devido a muitos aspectos da prática pesquisas científicas envolver o trabalho com dados, obviamente algum conhecimento de estatística é importante para qualquer pesquisador. Além disso, técnicas estatísticas podem ajudar muito no planejamento de novos produtos e sistemas, melhorando os projetos existentes e planejando, desenvolvendo e melhorando os pesquisas futuras. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Conceitos Importantes Método: é um conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. Método experimental: consiste em manter, ou admitir hipoteticamente, constantes todas as causas (fatores) que controlam um determinado fenômeno, menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. Método estatístico: diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Conceitos Importantes • População: É o conjunto de todos os valores que descrevem o comportamento de um fenômeno. • Amostra: é um subconjunto de elementos pertencentes a uma população. A informação recolhida para uma amostra é depois generalizada a toda a população. Nem sempre as amostras refletem a estrutura da população de onde foram retiradas ou são representativas dessas populações, podendo levar nesses casos a inferências erradas ou ao enviesamento dos resultados. • Amostragem: Técnica de pesquisa na qual um sistema preestabelecido de amostras é considerado idôneo para representar o universo pesquisado, com margem de erro aceitável. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatísticas Áreas da Estatística Estatística Descritiva Probabilidade Tem o objetivo de descrever e sumariar um conjunto de dados. Compreende a coleta, a organização, o resumo e, em geral, a simplificação de informações que podem ser muito complexas. As técnicas usadas costumam classificar-se como: Inferência 1.Gráficos descritivos: São usados vários tipos de gráficos para sumarizar os dados. Por exemplo: Histogramas. 2.Descrição Tabular: Na qual se usam tabelas para sumarizar os dados. Por exemplo tabelas de Freqüências. 3.Descrição Paramétrica: Na qual estimam-se os valores de certos parâmetros, os quais assume-se que completam a descrição do conjunto dos dados. Por exemplo: Média. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatísticas Área da Estatística Estatística Descritiva Probabilidade Inferência É utilizada para analisar situações que envolvem o acaso. Probabilidade de freqüência ou Probabilidade Aleatória Representação de uma série de eventos futuros cuja ocorrência é definida por alguns fenômenos físicos aleatórios. Este conceito poder ser dividido em: - fenômenos físicos que são previsíveis através de informação suficiente e - fenômenos que são essencialmente imprevisíveis. Um exemplo para o primeiro tipo é uma roleta, e um exemplo para o segundo tipo é um decaimento radioativo. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatísticas Área da Estatística Estatística Descritiva Probabilidade Inferência Thomas Bayes (beɪz) (1702 – 1761) É utilizada para analisar situações que envolvem o acaso. Probabilidade epistemológica ou Probabilidade Bayesiana, Representa nossas incertezas sobre proposições quando não se tem conhecimento completo das circunstâncias causativas. Tais proposições podem ser sobre eventos passados ou futuros. Exemplos de probabilidade epistemológica: i) designar uma probabilidade à proposição de que uma lei da Física proposta seja verdadeira, e ii) determinar o quão "provável" é que um suspeito cometeu um crime, baseado nas provas apresentadas. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatísticas Probabilidade Clássica versus Bayesiana Probabilidade Clássica ou Física: É a probabilidade verdadeira ou física de um evento ocorrer. Ex: prob. de ao se lançar uma moeda cair a face cara é de 50% Probabilidade Bayesiana ou Pessoal: É uma propriedade da pessoa que determina a probabilidade, atribuindo o grau de crença em um dado evento Ex: grau de crença de que a moeda vai cair com a face cara Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva O que é Estatísticas Áreas da Estatística Coleta, redução, análise e interpretação de dados amostrais, com o objetivo de Estatística Descritiva propor conclusões sobre uma população na qual os dados (amostra) foram obtidos. Probabilidade Inferência As conclusões devem sempre vir acompanhadas de medidas de precisão sobre sua veracidade !!! Inferência Frequentista (ou Clássica) Baseia-se na regularidade estatística das freqüências relativas e sustenta que a probabilidade de um dado acontecimento pode ser medida observando a freqüência relativa do mesmo acontecimento, em uma sucessão numerosa de experiências idênticas e independentes. Exemplo: Considera-se que ao lançar uma moeda 1000 vezes, observa-se que a face cara ocorre 650 vezes. Ou seja, uma probabilidade estimada de 65%. Conclui-se daí que a moeda é irregular (ou viciada) ! Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Etapas da Análise Experimental/Estatística Modelagem do Fenômeno em Estudo Técnicas de Amostragem Obtenção de Amostra(s) (Caracterização da População) Análise Descritiva Formulação de Novas Hipóteses Conclusões sobre Características específicas do Fenômeno em Estudo Inferência Estatística Levantamento de Informações na Amostra Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Etapas da Análise Experimental/Estatística Amostragem o Conjunto de Técnicas que permitem o estudo de um pequeno grupo de elementos (amostra) retirado de uma população que se pretende conhecer. o Técnica de pesquisa na qual um sistema preestabelecido de amostras é considerado idôneo para representar o universo pesquisado, com margem de erro aceitável. Caracterização de atributos mensuráveis que tipicamente variam entre indivíduos Variável Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Etapas da Análise Experimental/Estatística Amostragem - Variáveis Em Estatística, variável é atribuição de um valor a cada característica da unidade experimental de uma amostra ou população. Tipos de Variáveis: Variável Qualitativa ou Atributo: característica ou variável é não-numérica. Quando uma Está ligada a qualidade do indivíduo pesquisado Variável Quantitativa: Quando a variável é expressa numericamente. Está ligada a contagem ou mensuração Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Etapas da Análise Experimental/Estatística Amostragem - Variáveis Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Pertencem ao grupo de ferramentas estatísticas que permitem caracterizar um conjunto de dados sob ponto de vista da tendência central ou da dispersão dos dados estudados Medidas de Tendência Central • Médias • Aritmética • Harmônica • Geométrica • Quadrática Medidas de Dispersão • Ponderada • Amplitude, Faixa, ou Range • Aparada (Trimmed) • Variância • Mediana • Desvio Padrão • Moda • Coeficiente de Variação • Quartis • Distância Interquartílica Medidas de Assimetria e Curtose Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central Como o próprio nome já diz, medidas de tendência central são aquelas cujo valor tende a localizar-se no centro de uma série de dados. Freqüentemente, quando se analisa os valores de uma variável em uma amostra, constata-se que os dados não se distribuem uniformemente, havendo concentração em alguns pontos, notadamente próximos ao centro da distribuição. Qual a posição que melhor representa o centro destes dados ? Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central e de Dispersão Valor Esperado – Expectância - Momento Se x(t) ou xk = Resultados de uma medição E x a n 1 T n x t a dt T 0 1 K n k 0 xk a K Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Média Aritmética A Média Aritmética é o Valor Que Define o “ponto de equilíbrio” dos Dados de uma Distribuição. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Média Aritmética Cálculo exato: (da população) 1 T Lim xt dt T T 0 1 N Lim k 1 xk N N Estimativa: (da amostra) 1 T m xt dt T 0 1 N k 1 xk N k 1 xk f k K Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Média Geométrica Média geométrica é a média dos elementos amostrais em relação à multiplicação. Sua estimativa é realizada por meio da seguinte expressão: mg N N k 1 xk Exercício: Aplicar a função log na expressão acima e análisar resultado Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Mediana A mediana é um número que caracteriza as observações de uma determinada variável de tal forma que a sua posição, em um grupo de dados ordenados, separe a metade inferior da amostra, população ou distribuição de probabilidade, da metade superior. Esta medida também é conhecida como média posicional ! 1 11 3 5 7 9 6 8 75 2 4 11 9 8 7 5 11 9 8 7 5 3 4 3 1 1 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Mediana Estimadores da Mediana Dados não Agrupados Dados Agrupados N 1 Pos 2 1 11 3 5 7 9 N Fant Md lsi c 2 f Md Onde: Pos = 4 lsi - Limite Inferior da Classe Mediana c – Intervalo de Classe N - Tamanho da Amostra fMd - freqüência absoluta da classe mediana Fant - freqüência acumulada anterior à classe mediana 6 8 75 2 4 11 9 11 9 8 7 8 7 5 Pos = 4,5 5 3 4 3 1 1 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Média Aparada Uma média aparada, trimmed, não é mais do que uma “mistura” entre os conceitos de média e mediana por forma a combinar as qualidades de ambas. Podendo ser entendida também como uma média que é calculada excluindo uma certa proporção de observações em cada extremo da amostra. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Moda A moda é o valor que detém o maior número de observações, ou seja, o valor ou valores mais freqüentes. A moda não é necessariamente única, ao contrário da média ou da mediana. É especialmente útil quando os valores ou observações não são numéricos, uma vez que a média e a mediana podem não ser bem definidas. 5 1 11 7 3 9 8 4 Não Possui Moda 1 11 3 4 7 9 8 4 Possui Moda Igual a 4 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Moda Estimadores da Moda Dados não Agrupados Mo xi = ponto médio da classe de maior freqüência Dados Agrupados Moda de King Mok lsi c f f pos ant f post Onde: lsi = limite inferior da classe modal onde se localiza a moda c - intervalo de classe fmo- freqüência da classe modal fant- freqüência anterior à classe modal fpost - freqüência posterior à classe modal Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Tendência Central – Moda Estimadores da Moda Dados não Agrupados Dados Agrupados Moda de Czuber Mo xi = ponto médio da classe de maior freqüência f mo f ant Moc lsi c 2 f mo f ant f post Onde: lsi = limite inferior da classe modal onde se localiza a moda c - intervalo de classe fmo- freqüência da classe modal fant- freqüência anterior à classe modal fpost - freqüência posterior à classe modal Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Idade dos Pessoal da Turma Média, Mediana, Moda – Aplicação 20 22 A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, 25 20 24 30 24 25 21 28 20 20 50 24 Média = 25,2 Mediana = 24 Moda = 20 A moda é apropriada para representar o comportamento de dados ao nível nominal Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Idade dos Pessoal da Turma Média, Mediana, Moda – Aplicação 20 22 A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, 25 20 24 30 24 25 21 28 20 20 50 24 Média = 23,3 Mediana = 24 Moda = 20 A moda é apropriada para representar o comportamento de dados ao nível nominal Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Numeração dos calçados do Pessoal da Turma Média, Mediana, Moda – Aplicação 38 35 A média permite explicar muito bem o comportamento de resultados experimentais, A mediana também permite explicar muito bem o comportamento de resultados experimentais de fenômenos com eventos extremos, 36 37 36 36 37 39 44 39 39 40 39 40 Média = 38,2 ??? Mediana = 35,5 Moda = 39 A moda é apropriada para representar o comportamento de dados ao nível nominal Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas Separatrizes – Quartis As separatrizes são valores que dividem a distribuição em um certo número de partes iguais, como o objetivo de proporcionar uma melhor idéia da dispersão do conjunto Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. 1o quartil = quartil inferior = é o valor aos 25% da amostra ordenada 2o quartil = mediana = é o valor até ao qual se encontra 50% da amostra ordenada 3o quartil = quartil superior = valor a partir do qual se encontram 25% dos valores mais elevados Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas Separatrizes – Quartis Um quartil é qualquer um dos três valores que divide o conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa 1/4 da amostra ou população. 7 36 41 15 40 39 41 Mediana = Q2/4 = 37,5 37,5 36 39 2 Q3/4 = 40 40 39 36 Q1/4 = 7 15 7 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas Separatrizes – Decil e Percentil O Decil é responsável por dividir o conjunto em dez partes iguais. Já o Percentil (ou centil), é a Medida que dividirá o conjunto em cem partes iguais Mediana Medidas Separatrizes Quartil Decil Percentil !-------------------!-------------------! Md !---------!---------!---------!---------! Q1 Q2 Q3 !---!---!---!---!---!---!---!---!---!---! D1 D2 D3 D4 D5 D6 D7 D8 D9 !---!---!---!---!---!---!---!---!---!---! C10 C20 C30 C40 C50 C60 C70 C80 C90 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão Variação ou dispersão é o grau com que os dados numéricos tendem a se espalhar em torno de um valor médio. Ou seja, medidas de dispersão são indicadores do grau de variabilidade demonstrada pelos indivíduos em torno das medidas de tendência central. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão - Amplitude É a Diferença entre o maior valor e o menor valor observado na Amostra Min. 20 22 25 20 24 30 20 24 25 21 28 20 20 50 24 20 20 20 21 22 Amplitude = Max. – Min. = 30 24 24 24 25 25 28 Max. 30 50 Amplitude =30 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Usando o Conceito de Expectância E x a 2 1 T 1 K x T xt a dt 2 0 K k 0 xˆ 2 k a = 0 E[(x-a)2] é o Desvio Médio Quadrático a = ^x E[(x-a)2] é a Variância. E x xˆ r Momento central do ordem r Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Desvio Padrão Cálculo exato: (da população) Estimativa: (da amostra) n n lim n xi x̂ n x (x i 1 i n x ) 2 s 2 ˆ ( x x ) i i 1 n 1 i-ésima indicação média Amostral (Base da Estimativa: "n" indicações) número de medições repetitivas efetuadas Média Populacional Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Desvio Padrão Desvio Padrão: É um valor que quantifica a dispersão dos eventos de uma determinada população, ou seja, a média das diferenças entre o valor de cada evento e a média central. A vantagem que apresenta sobre a variância é de permitir uma interpretação direta da variação do conjunto de dados, pois o desvio padrão é expresso na mesma unidade que a variável Apesar de ser a medida de dispersão mais usada, tal medida não tem uma interpretação intuitivamente óbvia. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Coeficiente de Variação O coeficiente de variação de Pearson, cv, é uma medida relativa de variabilidade. É independente da unidade de medida utilizada. Estimador: 100 s cv(%) mˆ Karl Pearson 1857 - †1936 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Coeficiente de Variação Por ser uma medida relativizada, o coeficiente de variação tem, portanto, aplicações na pesquisa para comparar a precisão de diferentes experimentos, quando a unidade de medição é diferente. Dicas para tomada de decisão: Baixa dispersão: cv 15% Média dispersão: cv 15-30% Alta dispersão: cv 30% Karl Pearson 1857 - †1936 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Coeficiente de Variação Aplicação: Comparação de dispersão de resultado de experimentos realizados com unidades de medição diferentes Tipo de Lâmpada Incandecente (1) Fluorecente (2) 976 10271 Medidas Resumo Média Desvio Padrão C.V. 898 9710 1020 9939 Lampada (1) (2) 1004 9962 103 449 10.3% 4.5% Horas de Uso Até Falhar 1102 1096 1139 9729 10423 10001 825 10853 981 9845 1088 9448 913 9398 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Dispersão – Distância Interquartílica É a diferença entre o 3º e o 1º quartis, Q3 - Q1. Ou seja, no intervalo interquartílico concentra-se metade das observações mais centrais. 50% Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Assimetria e Curtose As medidas de assimetria e curtose complementam as medidas de posição e de dispersão no sentido de proporcionar uma descrição e compreensão mais completa das distribuições de freqüências. Ampliando o conceito de Momento Estatístico: São medidas de caráter mais geral e dão origem às demais medidas descritivas, como as de tendência central, dispersão, assimetria e curtose. Conforme a potência considerada tem-se a ordem ou o grau do momento calculado. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Assimetria e Curtose - Momentos Momentos Simples ou Centrados na Origem, Mr 1 N r mr i 1 xi N i 1 c f i Nclas r i N = tamanho da amostra, x = observação amostral, c = centro da classe da distribuição de freqüências de x f = freqüência relativa Nclas = número de Classes da distribuição de freqüências de x Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Assimetria e Curtose - Momentos Momentos ou Centrados na Média, Mr 1 N r M r i 1 xi xˆ N i 1 Nclas ci xˆ r fi N = tamanho da amostra, xi = i-ésima observação amostral, f = freqüência relativa c = centro da classe da distribuição de freqüências de x Nclas = número de Classes da distribuição de freqüências de x r é um número inteiro positivo que define a ordem do momento m2 = Variância Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Assimetria e Curtose - Momentos Momentos Abstratos, ar Mr ar r s s = Desvio Padrão Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medida de Assimetria – Coeficiente de Assimetria O coeficiente de assimetria quantifica o grau de desvio, afastamento da simetria ou grau de deformação de uma distribuição de freqüências. Estimadores: Coeficiente de Assimetria de Pearson Coeficiente Momento de Assimetria xˆ Mo As s Se As < 0 a curva será assimétrica negativa Se As > 0 a curva será assimétrica positiva Se As = 0 a curva será simétrica M3 a3 3 s Se |a3| < 0,2 a curva será simétrica Se 0,2 < |a3| < 1,0 a curva será assimétrica fraca Se |a3| > 1,0 a curva será assimetria forte. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medida de Assimetria – Coeficiente de Assimetria Assimetria positiva Coef.ass. >0 Quase simetria Coef.ass. ~ 0 Assimetria negativa Coef.ass. <0 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Curtose ou de Achatamento Mostram até que ponto uma distribuição é a mais aguda ou a mais achatada do que uma curva normal, de altura média. Classificação: Mesocúrtica: É considerada a curva padrão. Leptocúrtica: É uma curva mais alta do que a normal. Apresenta o topo relativamente alto, significando que os valores se acham mais agrupados em torno da moda. Curva Platicúrtica: É uma curva mais baixa do que a normal. Apresenta o topo achatado, significando que várias classes apresentam freqüências quase iguais. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Curtose ou de Achatamento Mostram até que ponto uma distribuição é a mais aguda ou a mais achatada do que uma curva normal, de altura média. Estimadores: Coeficiente de Curtose Q3 Q1 K 2 P90 P10 - K > 0.263 distribuição Platicúrtica; - K = 0.263 distribuição Mesocúrtica; - K < 0.263 distribuição Leptocúrtica; Coeficiente Momento de Curtose M4 a4 4 s - a4 < 3 distribuição Platicúrtica; - a4 = 3 distribuição Mesocúrtica; - a4 > 3 distribuição Leptocúrtica; Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Medidas Resumo Medidas de Assimetria e de Achatamento Atenção Numa amostra é quase impossível observar simetria e curtose puras. Por isso os coeficientes de assimetria e de curtose assumem valores quase sempre diferentes de zero, 0,263 e 3. Para termos uma ideia se a assimetria ou curtose é relevante devemos comparar o valor dos coeficientes com o erro associado. Se o coeficiente não exceder 2 ou 3 vezes o erro, o seu valor não será muito relevante, especialmente quando queremos extrapolar para a população. Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Estatística Descritiva Tipos de Gráficos – Gráfico de Caixa – Boxplot Exemplo - Para ilustrar o uso do gráfico de caixa, consideremos os dados apresentados na tabela abaixo, que representam leituras de durezas obtidas por tipos diferentes de tratamento térmico realizados durante a fabricação de uma determinada peça. Dureza Brinell, HB [Mpa] (1) (2) (3) 220,2 214,9 203,3 235,0 225,6 204,9 238,3 226,7 216,7 253,8 227,8 219,5 254,9 241,8 222,8 259,0 244,6 224,5 266,7 246,2 270,0 Visualização dos Dados Dureza Brinell, HB [MPa] 300 250 200 150 1 2 Tratamento Térmico 3 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Estatística Descritiva Tipos de Gráficos – Gráfico de Caixa – Boxplot Exemplo – Estatísticas descritivas Descriptives T3 Descriptives T1 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtos is Lower Bound Upper Bound Statis tic 24,6843 23,1842 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtos is Std. Error ,6131 26,1844 24,7220 25,3800 2,631 1,6220 22,02 26,67 4,65 2,4000 -,586 -,594 Mean 95% Confidence Interval for Mean Lower Bound Upper Bound Statis tic 22,3100 20,2493 Std. Error ,8422 24,3707 22,1594 21,9500 4,965 2,2282 20,33 27,00 6,67 1,9600 1,879 4,262 ,794 1,587 Descriptives ,794 1,587 T2 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtos is Lower Bound Upper Bound Statis tic 23,2514 22,1613 Std. Error ,4455 O 24,3416 23,2733 22,7800 1,389 1,1788 21,49 24,62 3,13 1,9000 -,138 -1,435 que conseguimos Extrair do Gráfico e das Medidas Resumo ? ,794 1,587 Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Estatística Descritiva Tipos de Gráficos – Gráfico de Caixa – Boxplot Exemplo – Nova Representação Gráfica 280 280 7 260 240 Dureza Brinell, HB [MPa] Dureza Brinell, HB [MPa] 260 240 220 200 180 N= 220 7 7 7 A B C Tratamento Térmico O 200 T1 T2 Tratamento Térmico T3 que conseguimos Extrair do Gráfico ? Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Estatística Descritiva Tipos de Gráficos – Gráfico de Caixa – Boxplot Exemplo – Nova Representação Gráfica Condição de Assimetria Outliers ou Dados Discrepantes ou Dados espúrios Máximo da Amostra, mas não mais do que Q1 + k∙(Q3-Q1) 3o Quartil 2o Quartil - Mediana Valor Típico de k = 1,5 1o Quartil Mínimo da Amostra, mas não menos do que Q1 - k∙(Q3-Q1) Universidade de Brasília Departamento de Engenharia Mecânica Programa de Pós-graduação em Integridade Estrutural Introdução à Análise Estatística – Estatística Descritiva Estatística Descritiva Tipos de Gráficos – Gráfico de Caixa – Boxplot Exemplo – Nova Representação Gráfica Assimetria positiva Simetria Assimetria negativa Boxplot (Diagrama de Caixa) ou Box-whiskers (Diagrama de Bigode) – São gráficos que apresentam os valores centrais dos dados e alguma informação a respeito da amplitude deles.