ESTATÍSTICA •MEDIDAS DE TENDÊNCIA CENTRAL •MEDIDAS DE DISPERSÃO Estatística • ELEMENTOS TÍPICOS DE UMA DISTRIBUIÇÃO: Medidas de posição Medidas de variabilidade ou dispersão Medidas de Tendência Central • É um valor calculado para um grupo de dados • usado para descrever esses dados. • Tipicamente, desejamos que o valor seja representativo de todos os valores do grupo • os dados observados tendem, em geral, a se agrupar em torno dos valores centrais. Medidas de Tendência Central • São Medidas de Tendência Central: 1. média; 2. mediana; 3. moda 1 - MÉDIA ARITMÉTICA • definida como a soma dos valores dividida pelo número de elementos. • Sua aplicação é seguramente a mais usada • podem ser: – Média para dados simples – Média para dados agrupados – Média para dados agrupados em classes. 1.1. MÉDIA ARITMÉTICA PARA DADOS SIMPLES (X) Exemplo: Dado um a idade de 5 crianças Xi (idade) : 4; 6; 8; 10; 12 média - x = 4 + 6 + 8 + 10 +12 5 X = ∑xi n sendo “ n “ o número de elementos Assim: X = 40 = 8 5 Portanto a idade média dessas 5 crianças é 8 anos. 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) • Exemplo: Idade de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 X = 1+1+1 + 2+2+2 + 3+3+3+3 + 5+5+5+5+5+5 + 6+6+6 + 9 20 X = 1 . 3 + 2 . 3 + 3 . 4 + 5 . 6 + 6 . 3 + 9 .1 = 3+6+12+30+18+9 3+3+4+6+3+1 20 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) • Quando o conjunto de dados para os quais precisamos calcular a média é mais extenso, temos a necessidade de agrupar os dados. Assim, a média desse grupo é calculado da seguinte forma: X = (Xi . fi ) fi 1.2. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS (MÉDIA ARITMÉTICA PONDERADA) Xi 1 2 3 5 6 9 fi 3 3 4 6 3 1 20 Fonte: dados fictícios Xi . fi 3 6 12 30 18 9 78 X = Xi . fi fi X = 78 = 3,9 20 1.3. MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS EM CLASSES IDADE DE ALUNOS Xi 0 2.......... 2 4.......... 4 6.......... 6 8.......... 8 10.......... total ......... Fonte: Dados fictícios X = (PM. Fi ) fi PM 1 3 5 7 9 fi 3 7 6 3 1 20 X = 87 20 PM.fi 1.3 = 6 3.7 = 21 5.6 = 30 7.3 = 21 9.1 = 9 87 X = 4,35 2 – MEDIANA ( X ) • É o valor que se localiza no centro da distribuição • é obtida a partir de seus valores centrais • Pode ser: 2.1 MEDIANA PARA DADOS SIMPLES 2.2 MEDIANA PARA DADOS AGRUPADOS 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES INTERVALARES ~ 2.1 MÉDIANA PARA DADOS SIMPLES (X) Há duas situações: 1) Quando o número de elementos pesquisados é ímpar Xi Xi (idade) : 4; 6; 8; 10; 12 Posição: 1ª 2ª 3ª 4ª 5ª posição central “ n “ o número de elementos ímpar Uma posição central - P ~ P = n +1 P = 5 + 1 = 3ª posição => Xi = 8, portanto X = 8 2 2 ~ 2.1 MÉDIANA PARA DADOS SIMPLES (X) 2) Quando o número de elementos pesquisados é par X1 Xi (idade) : Posição: X2 4; 6; 8; 10; 1ª 2ª 3ª 4ª P1 P2 10; 12 5ª 6ª (2 Posições centrais) “ n = 6 número PAR de elementos Duas posições centrais - P1 e P2 P1 = n P1 = 6 = 3ª posição => X1 = 8, 2 2 P2 = é a próxima P2 = 4ª posição => X2= 10, ~ X = X1 + X2 = 8 + 10 2 2 ~ X=9 2.2 MEDIANA PARA DADOS AGRUPADOS 1)Quando o nº de elementos é IMPAR Xi fi fac nº de elementos = 1 2 2 fi = 19 (ímpar) 2 3 5 3 4 9 uma posição central 5 6 15 P = fi +1 = 19+1 6 3 18 2 2 9 1 19 P = 10ª posição 19 2.2 MEDIANA PARA DADOS AGRUPADOS Xi 1 2 3 5 6 9 Σ fi 2 3 4 6 3 1 19 fac 2 5 9 15 18 19 Xi posição Xi posição Xi posição 1 1ª 1 2ª 3 8ª 3 9ª 5 15ª 6 16ª 2 3ª 2 4ª 5 10ª 5 5 11ª 12ª 6 17ª 2 5ª 6 18ª 9 19ª 3 6ª 3 7ª 5 5 13ª 14ª 2.2. MÉDIANA PARA DADOS AGRUPADOS 1) Quando o nº de elementos é IMPAR Xi 1 2 3 Xi = 5 6 9 - fi 2 3 4 6 3 1 19 fac 2 5 9 15 18 19 P = 10ª posição ~ X=5 2.2 MÉDIANA PARA DADOS AGRUPADOS 2)Quando o nº de elementos é PAR Xi 1 2 3 5 6 9 - fi 2 3 4 6 3 2 20 fac 2 5 9 15 18 20 nº de elementos = fi = 20(par) duas posição centrais P1 = fi = 20 = 10ª posição 2 2 P2 = é a próxima= 11ª posição 2.2 MÉDIANA PARA DADOS AGRUPADOS 2)Quando o nº de elementos é PAR Xi 1 2 3 X 1= X 2= 5 6 9 - fi 2 3 4 6 3 2 20 fac 2 5 9 15 18 20 P1 = 10ª posição P2 = 11ª posição X = (X 1 + X 2 ) = 5 + 5 2 2 ~ X=5 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA” 2.3. MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 faa 1º passo: ACHAR A POSIÇÃO CENTRAL “P” P = Fi P = 23 P = 11,5º posição 2 2 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE MEDIANA” 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi 0 2 4 6 8 PM fi fac 2.......... 1 3 3 faa li 4.......... 3 10 13 ls 6.......... 5 6 19 8.......... 7 3 22 10.......... 9 1 23 total ......... 23 Posição central -> P = 11,5º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe -> h = ls - li = 4 – 2 = 2 Freqüência da classe -> fi = 10 Freqüência acumulada anterior -> faa = 3 ~ X = li + P - faa . h fi ~ X = 2 + 11,5 - 3 . 2 10 2.3 MEDIANA PARA DADOS AGRUPADOS EM CLASSES Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 faa ~ X = 2 + 8,5 10 .2 ~ X = 2 + 0,85 . 2 ~ X = 2 + 1,70 ~ X = 3,70 ^ 2 – MODA ( X ) • É o ponto de maior concentração de ocorrências de uma variável • Coincide com o conceito vulgar da palavra, isto é, o que ocorre com maior freqüência ^ 2.1 – MODA PARA DADOS SIMPLES ( X ) • Exemplo: Idade de 20 alunos: Xi: 1, 1, 1, 2, 2, 2, 3, 3, 3, 3 5, 5, 5, 5, 5, 5, 6, 6, 6, 9 O valor que apareceu maior número de vezes é o 5 ^ portanto => X = 5 ^ 2.2 – MODA PARA DADOS AGRUPADOS ( X ) Xi 1 2 3 Xi = 5 6 9 - fi 2 3 4 6 3 1 19 Maior valor de fi ^ Xi = 5 2.3. MODA PARA DADOS AGRUPADOS EM CLASSES – MODA DE CZUBER - ^ Xcz Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi 1 3 5 7 9 3 10 6 3 1 23 fmax 1º passo: Achar a classe onde se encontra a maior freqüência - fmax ^ 2.3. MODA DE Czuber - XCZ Xi 0 2 4 6 8 2.......... li 4.......... ls 6.......... 8.......... 10.......... total ......... Limite inferior => Limite superior => Amplitude da classe=> PM fi 1 3 5 7 9 3 10 6 3 1 23 fant fmax fpos li = 2 ls = 4 freqüência máxima => fmax = 10 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 2 = fmax – fpost = 10 – 6 =7 = 4 ^ 2.3. MODA DE Czuber - XCZ Limite inferior Limite superior => => Amplitude da classe=> li = 2 ls = 4 freqüência máxima => fmax = 10 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 h = ls – li = 4 – 2 = 2 1 = fmax – fant = 10 – 3 2 = fmax – fpost = 10 – 6 =7 = 4 Cálculo da moda de Czuber ^ Xcz = li + ___ 1 ___ . h 1 + 2 ^ Xcz = 2 + __7__ . 2 = 2 + _7_ . 2 = 2 + 14 = 2 + 1,3 = 7+4 11 11 3,3 2.3. MODA DE KING Xi 0 2 4 6 8 2.......... li 4.......... ls 6.......... 8.......... 10.......... total ......... Limite inferior => Limite superior => Amplitude da classe=> PM fi 1 3 5 7 9 3 10 6 3 1 23 li = 2 ls = 4 - ^ Xki fant fmax fpos freqüência máxima => fmax = 10 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 h = ls – li = 4 – 2 = 2 2.3. MODA DE KING Limite inferior Limite superior => => Amplitude da classe=> - ^ Xki li = 2 ls = 4 freqüência máxima => fmax = 10 freqüência anterior => fant = 3 freqüência posterior => fpost = 6 h = ls – li = 4 – 2 = 2 Cálculo da moda de KING ^ Xki = li + fpost . h fant + fpost ^ Xcz = 2 + 6 . 2 = 2 + 6 . 2 = 2 + 12 = 2 + 1,3 = 3+6 9 9 3,3 ^ 2.3. MODA DE Pearson - Xpe Cálculo da moda de PEARSON ~ _ ^ Xpe = 3. X - 2. X ~ Exemplo: Em um levantamento de dados onde a Mediana = X = 4 Média A moda de Pearson será: ^ X = 3.4 - 2 . 4,2 = 12 – 8,4 ^ X = 3,6 = X = 4,2 Outras separatrizes • A Mediana divide a distribuição em duas partes. • É o atributo que está no meio da distribuição: – 50% dos valores acima da mediana – 50% dos valores abaixo da mediana Outras separatrizes QUARTIS ou QUARTILHOS • o Quartil divide a distribuição em 4 partes de igual freqüência. • Seu cálculo é importante para as medidas de dispersão e variabilidade • São três: Outras separatrizes Quartil • São três: • Q1 = quartil inferior ou primeiro quartil. Tem 25% da distribuição abaixo de si • Q2 = é a mediana ou quartil mediano • Q3 = quartil superior ou terceiro quartil. Tem 75% da distribuição abaixo de si Quartil • 1º quartil - Q1 = assume a posição P1q = Σfi 4 • 2º quartil – Q2 = assume a posição P2q = 2. Σfi 4 • 3º quartil - Q3 = assume a posição P3q = 3.Σfi 4 1º QUARTIL – Q1 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO QUARTIL “ P1q ” P1q = Fi P1q = 23 P 1q = 5,75º posição 4 4 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO QUARTIL – Q1” 1º QUARTIL – Q1 Xi 0 2 4 6 8 PM fi fac 2.......... 1 3 3 faa li 4.......... 3 10 13 ls 6.......... 5 6 19 8.......... 7 3 22 10.......... 9 1 23 total ......... 23 Posição 1º quartil -> P 1q= 5,75º posição Limite inferior da classe -> li = 2 Limite superior da classe -> ls = 4 Amplitude da classe -> h = ls - li = 4 – 2 = 2 Freqüência da classe -> fi = 10 Freqüência acumulada anterior -> faa = 3 Q1 = li + P1q - faa . h fi Q1 = 2 + 5,75 - 3 . 2 10 1º QUARTIL – Q1 Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 faa Q1 = 2 + 2,75 . 2 10 Q1 = 2 + 0,55 Q1 = 2,55 3º QUARTIL – Q3 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO TERCEIRO QUARTIL “ P3q ” P3q = 3. Fi P3q = 3. 23 P 3q = 17,25º posição 4 4 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O TERCEIRO QUARTIL – Q3” 3º QUARTIL – Q3 Xi 0 2 4 6 8 PM fi fac 2.......... 1 3 3 4.......... 3 10 13 faa li 6.......... 5 6 19 ls 8.......... 7 3 22 10.......... 9 1 23 total ......... 23 Posição central -> P 3q= 17,25º posição Limite inferior da classe -> li = 4 Limite superior da classe -> ls = 6 Amplitude da classe -> h = ls - li = 6 – 4 = 2 Freqüência da classe -> fi = 6 Freqüência acumulada anterior -> faa = 13 Q3 = li + P3q - faa . h fi Q3 = 4 + 17,25 - 13 .2 6 3º QUARTIL – Q3 Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 faa Q3 = 4 + 4,25 . 2 13 Q3 = 4 + 0,65 Q3 = 4,65 Outras separatrizes Decil • Dividem a distribuição em 10 partes de igual freqüência. • São nove • o quinto decil é a mediana. Decil • 1º decil • 2º decil – • 9º decil Σfi 10 D2 = assume a posição P2d = 2. Σfi 10 D1 = assume a posição P1d= - D9 = assume a posição P9d = 9.Σfi 10 1º DECIL – D1 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO PRIMEIRO DECIL “ P1d ” P1d = Fi P1d = 23 P 1d = 2,3º posição 10 10 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O PRIMEIRO DECIL – D1” 1º DECIL – D1 Xi li ls 0 2 4 6 8 PM fi fac 2.......... 1 3 3 faa 4.......... 3 10 13 6.......... 5 6 19 8.......... 7 3 22 10.......... 9 1 23 total ......... 23 Posição 1º DECIL -> P 1d= 2,3º posição Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe -> h = ls - li = 2 – 0 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 0 D1 = li + P1d - faa . h fi D1 = 0 + 2,3 – 0 . 2 3 1º DECIL – D1 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 D1 = 0 + 2,3 . 2 3 D1 = 1,53 9º DECIL – D9 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO NONO DECIL “ P9d ” P9d = 9. Fi P9d = 9. 23 P9d = 20,70º posição 10 10 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O NONO DECIL – D9” 9º DECIL – D9 Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 faa Posição central -> P 9d= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe -> h = ls - li = 8 – 6 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 19 D9 = li + P9d - faa . h fi D9 = 6 + 20,7 - 19 .2 3 9º DECIL – D9 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi 1 3 5 7 9 3 10 6 3 1 23 fac 3 13 19 faa 22 23 D9 = 6 + 1,7 3 D9 = 6 + 1,13 D9 = 7,13 .2 Outras separatrizes Centil ou Percentil • Dividem a distribuição em 100 partes de igual freqüência. • São noventa e nove • o qüinquagésimo centil é a mediana. Percentil - Ci • 1º percentil - C1 = assume a posição P1c= Σfi 100 • 2º percentil – C2 = assume a posição P2c = 2. Σfi 100 • 99ºpercentil - C99 = assume a posição P99c =99.Σfi 100 10º PERCENTIL – C10 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO DÉCIMO PERCENTIL “ P10c ” P10c = 10 . Fi P10c = 10 .23 P 10c = 2,3º posição 100 100 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O Décimo Percentil – C10” 10º PERCENTIL – C10 Xi PM fi fac 2.......... 1 3 3 faa C10 = li + P10c - faa . h fi 4.......... 3 10 13 6.......... 5 6 19 8.......... 7 3 22 10.......... 9 1 23 total ......... 23 C10 = 0 + 2,3 – 0 . 2 Posição 10º percentil -> P 10c= 2,3º posição 3 Limite inferior da classe -> li = 0 Limite superior da classe -> ls = 2 Amplitude da classe -> h = ls - li = 2 – 0 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 0 li ls 0 2 4 6 8 10º PERCENTIL – C10 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 C10 = 0 + 2,3 . 2 3 C10 = 1,53 90º percentil – C90 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 1º passo: ACHAR A POSIÇÃO DO NONAGÉSIMO PERCENTIL “ P90c ” P90c = 90. Fi P90c = 9. 23 P90c = 20,70º posição 100 100 2º passo: IR NA COLUNA “freqüência acumulada = fac” E LOCALIZE A CLASSE QUE PERTENCE O nonagésimo percentil – C90” 90º PERCENTIL – C90 Xi li ls 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 C90 = li + P90c - faa . h fi faa Posição central -> P 90c= 20,7º posição Limite inferior da classe -> li = 6 Limite superior da classe -> ls = 8 Amplitude da classe -> h = ls - li = 8 – 6 = 2 Freqüência da classe -> fi = 3 Freqüência acumulada anterior -> faa = 19 C90 = 6 + 20,7 - 19 .2 3 90º PERCENTIL – C90 Xi 0 2 4 6 8 2.......... 4.......... 6.......... 8.......... 10.......... total ......... PM fi fac 1 3 5 7 9 3 10 6 3 1 23 3 13 19 22 23 C90 = 6 + 1,7 3 C90 = 6 + 1,13 C90 = 7,13 .2 Relações Quartil Q1 = Q2 = Q3 = Decil D1 = = D5 = = D9 = Percentil C10 C25 C50 = C75 C90 Mediana ~ X Outras médias MÉDIA DE INTERVALO É a média entre a menor e a maior observação em um conjunto de dados. Média de Intevalo = XMENOR + XMAIOR 2 MÉDIA DAS JUNTAS ou Midhinge É a média entre o primeiro e o terceiro quartil. Midhinge = Q1 + Q3 2 Medidas de Dispersão • As Medidas de Tendência Central: – representam de certa forma uma determinada distribuição de dados – só elas não são suficientes para caracterizar a distribuição. • Para uma análise estatística mais exata é necessária a verificação da flutuação dos valores em torno de sua média aritmética Medidas de Dispersão • Suponha as notas de 2 grupos de estudantes, cada qual com 5 alunos. • GRUPO “A” : 4, 5, 5, 6 • GRUPO “B” : 0, 0, 10, 10 • Média do grupo “A”: 5 • Média do grupo “B”: 5 Medidas de Dispersão • Os dois grupos apresentam a mesma média • O comportamento dos 2 grupos são bem distintos. GRUPO “A”: valores são mais homogêneos GRUPO “B”: valores são dispersos em relação à média Medidas de Dispersão • Dentre as medidas de dispersão pode-se citar algums delas: – a) Amplitude Total – b) Amplitude Interquartil – c) Desvio Quartílico ou Amplitude Semi-interquartílico – d)Desvio Médio – e) Variância – f) Desvio Padrão a) Amplitude Total - R – é a diferença entre o maior e o menor valor observados. R = Limite superior - Limite Inferior • Exemplo 5: Idade de 20 alunos: Xi: 1, 1, 2, 2, 2, 3, 3, 3, 5, 5, 5, 5, 5, 6, 6, 6, 9 R=9–1=8 b) Amplitude Interquartil – AIQ ou IQR ( InterQuartile Range ) é a diferença entre o terceiro quartil e o primeiro quartil. AIQ ou IQR = Q3 - Q1 – Supera a dependência dos valores extremos – Abrange 50% dos valores centrais, eliminando os 25% dos valores mais baixos e os 25% dos valores mais altos c) Desvio Quartílico ou Amplitude Semi-interquartílico é a diferença entre o terceiro quartil e o primeiro quartil. Dq = Q3 - Q1 2 d) Desvio Médio - DM é a diferença entre o terceiro quartil e o primeiro quartil. DM = Σ Xi – X_ n Sendo: DM = Desvio Médio n = nº elementos X = média aritmética Xi = vr. variável d) Desvio Médio - DM Exemplo 6: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 a) Calcule a média Σ Xi X= n b) Montar a tabela a seguir: 40 =10 =4 d) Desvio Médio - DM Xi 2 2 3 3 3 4 4 4 5 10 Xi - x 2–4= -2 2–4= -2 3–4= -1 3–4= -1 3–4= -1 4–4= 0 4–4= 0 4–4= 0 5–4= 1 10 – 4 = 6 Σ Xi – x 2 2 1 1 14 Σ Xi – x_ 1 DM = n - 1 = 9 0 0 DM = 1,56 0 1 6 14 d) Variância - 2 – é a média dos quadrados dos afastamentos entre as os valores da variável e sua média aritmética – Revela a dispersão do conjunto que se estuda d.1) Variância - 2 – dados simples Exemplo 7: Dado o levantamento: Xi : 2, 2, 3, 3, 3, 4, 4, 4, 5, 10 a) Calcule a média Σ Xi X= n b) Montar a tabela a seguir: 40 =10 =4 d.1) Variância - 2 – dados simples Xi 2 2 3 3 3 4 4 4 5 10 Xi - x 2–4= -2 2–4= -2 3–4= -1 3–4= -1 3–4= -1 4–4= 0 4–4= 0 4–4= 0 5–4= 1 10 – 4 = 6 Σ ( Xi – x )2 22 = 4 22 = 4 12 = 1 12 = 1 12 = 1 02 = 0 02 = 0 02 = 0 12 = 1 62 = 36 48 2 Σ ( Xi – x ) 2 = n-1 2 = 48 = 5,33 9 = d.2) Variância - 2 – dados agrupados Xi fi 2 2 3 4 4 3 5 1 10 1 Σ fi = 10 2 Xi . fi Xi - x ( Xi – x )2 ( Xi – x )2 . fi 2 . 2 = 4 2 – 4 = -2 (-2)2 = 4 4.2= 8 3.3= 9 3 – 4 = -1 (-1)2 = 1 1.3= 3 4 . 3 = 12 4–4=0 02 = 0 0.3= 0 5.1= 5 5–4=1 12 = 1 1.1= 1 10 . 1 = 10 10 - 4 = 6 62 = 36 36 . 1 = 36 Σ fi = 40 Σ fi = 48 2 . fi Σ ( Xi – x ) = Σ fi - 1 2 = 48 9 = 5,33 d.2) Variância - 2 – dados agrupados em classes Xi PM fi PM.fi 0 2..... 1 2 1.2 = 2 2 4..... 3 4 3.4 = 12 4 6..... 5 8 5.8 = 40 6 8..... 7 6 7.6 = 42 8 10.... 9 1 9.1 = 9 total .... 21 105 2 = 4,4 PM-x ( PM–x )2 ( PM–x )2.fi 1-5= -4 (-4)2 = 16 16 . 2 = 32 3-5= -2 (-2)2 = 4 4 . 4 = 16 5-5= 0 02 = 0 0.8= 0 7-5= 2 (2)2 = 4 4 . 6 = 24 9-5= 4 (4)2 = 16 16 . 1 = 16 88 X = Σ ( PM.fi) = 105 Σ fi 21 2 X=5 2 . fi 2 = 88 Σ ( PM – x ) = = 20 Σ fi - 1 d) Desvio Padrão - – Por definição, é a raiz quadrada da média aritmética dos quadrados dos desvios = 2 – É a mais utilizada – Revela a dispersão do conjunto que se estuda e) Desvio Padrão - – Se todos os valores forem iguais, o desvio padrão é nulo. – quanto maior o desvio padrão mais heterogênea é a distribuição, significa que os valores são mais dispersos em torno da média – MEDIA ± 1 => 68,26% dos valores – MEDIA ± 2 => 95,44% dos valores – MEDIA ± 3 => 99,74% dos valores f) Coeficiente de Variação - CV CV = X - desvio padrão X - média artitmética – o CV mede o grau de heterogeneidade da distribuição – Valor máximo é CV = 1 0 ≤ CV ≤ 1 Coeficiente de Variação - CV – Quanto mais próximo de 1: mais heterogênea é a distribuição Os valores estão mais dispersos – Quanto mais próximo de 0: mais homogênea é a distribuição Os valores da variável estão mais próximos em torno da média Coeficiente de Variação - CV – Ex: Dado 2 estudantes cujas notas bimestrais foram: • “a”: 60; 40; 50; 50 • “b”: 70; 70; 30; 30 • Qual foi mais regular ? f) Coeficiente de Variação - CV Na comparação de variabilidade de dois ou mais conjuntos de dados: 1. expressos em diferentes unidades de medida 2. expressos nas mesmas unidades, mas com médias diferentes. f) Coeficiente de Variação - CV Comparação de valores expressos em diferentes unidades de medida Exemplo 8: Deseja-se comparar qual grandeza varia mais: PESO ou COMPRIMENTO XPESO = 20 g XCOMPRIMENTO = 50 metros PESO = 2 g COMPRIMENTO = 4 metros f) Coeficiente de Variação - CV PESO CVP = CVP = XPESO CVC = COMPRIMENTO XCOMPRIMENTO CVPESO = 0,10 ≥ CVC = 2 20 CVP = 4 50 CVC = 0,08 0,10 CVCOMPRIMENTO = 0,08 PESO varia mais que o comprimento f) Coeficiente de Variação - CV expressos nas mesmas unidades, mas com médias diferentes Exemplo 9: Deseja-se comparar qual grupo “ A ” ou “ B “ tem mais variação de rendimento em um processo: XA = 80 % XB = 50 % A = 2 % B = 1 % f) Coeficiente de Variação - CV CVA = CVB = A XA B XB CVP = 2 80 CVA = 0,025 CVB = 1 50 CVB = 0,020 CVA = 0,025 ≥ CVB = 0,020 O rendimento do Produto A varia mais que o rendimento do produto B no decorrer do processo Esquema dos 5 Números Box – Plot ou Gráfico Box-and-Whisker XMENOR 25% XMAIOR 25% dos dados 25% dos dados Q1 ~X Q3 3º Quartil Mediana 3º Quartil 25% Dados suspeitos ou Outliers Suspeito IQR = Q3 - Q1 Q1 - 3 . IQR Q3 + 3 . IQR Q1 – 1,5. IQR Q3 + 1,5. IQR Possível suspeito