Unidade de Ensino Descentralizada de Colatina Coordenadoria de Informática Disciplina: Probabilidade e Estatística Prof. Leandro Melo de Sá 2006/2 Unidade 1 – ESTATÍSTICA DESCRITIVA → Conceitos básicos * Estatística: constitui um conjunto de métodos para planejar experimentos, obter dados, organizá-los, resumilos, analisá-los, interpretá-los e deles extrair conclusões. * Estatística descritiva: métodos utilizados para resumir ou descrever as características de um conjunto conhecido de dados. * Variável: é um conjunto de resultados possíveis de um fenômeno. - qualitativa: (ex: cor, sexo – não numérica) - quantitativa (número de alunos presentes à aula, estatura, idade, salário, número de automóveis – numérica) - discreta: admite um número finito de valores. - contínua: admite um número infinito de valores. * População: é o conjunto completo de todos os elementos possíveis de ocorrer. * Amostra: é um subconjunto ou subcoleção de elementos extraídos de uma população. → Tabela de freqüência Uma tabela de freqüência relaciona categorias (ou classes) de valores, juntamente com as contagens (ou freqüências) do número de valores que se enquadram em cada categoria. * Freqüência absoluta: número de vezes que o valor da variável é observada. Seja fi a freqüência do i-ésimo valor observado e n o número de elementos na amostra: Tem-se então que: ∑ f i = n . Ex. 1. Número de enchentes ocorridas por ano de 1939 a 1972 na estação de monitoramento de Calamazza, no rio Magra, entre Pisa e Genova no noroeste da Itália. A ocorrência de enchente é definida por uma vazão excedendo a 300 m3/s. Quantidade de enchentes no ano 0 1 2 3 4 5 6 7 8 9 TOTAL Freqüência de ocorrência (fi) 0 2 6 7 9 4 1 4 1 0 ∑f i = 34 * Freqüência relativa (FR) = freqüência da categoria ou classe freqüência total * Freqüência absoluta acumulada (FA) = soma das freqüências daquela categoria ou classe e de todas que a antecedem. * Freqüência relativa acumulada (FRA) = soma das freqüências relativas daquela categoria ou classe e de todas que a antecedem. Ex. 2. Estatura (em centímetros) de alunos de uma turma: 166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153 Construir uma tabela contendo: (a) a freqüência absoluta de ocorrência; (b) a freqüência relativa; (c) a freqüência absoluta acumulada; (d) a freqüência relativa acumulada. 1 Estatura (xi) 150 152 153 154 155 156 160 161 162 163 166 168 172 TOTAL Freqüência absoluta (fi) 1 1 1 1 2 2 2 3 2 2 1 1 1 ∑f i = 20 Freqüência relativa (FR) 0,05 0,05 0,05 0,05 0,10 0,10 0,10 0,15 0,10 0,10 0,05 0,05 0,05 Freqüência absoluta acumulada (FA) 1 2 3 4 6 8 10 13 15 17 18 19 20 Freqüência relativa acumulada (FRA) 0,05 0,10 0,15 0,20 0,30 0,40 0,50 0,65 0,75 0,85 0,90 0,95 1,00 1,00 - - → Determinação do número de classes (nc) A escolha do número de classes deve ser feita com muito cuidado. Poucas classes podem causar uma omissão de algumas características importantes dos dados, enquanto que muitas classes podem não dar uma visão global nítida dos dados devido às flutuações na freqüência. Três métodos para determinar o número de classes podem ser utilizados: a) regra prática: nc = n , onde n é o número de elementos da amostra e deve estar no intervalo 25 ≤ n ≤ 650. b) regra de Sturges: nc = 1 + 3,3 × log n, onde n é o número de elementos da amostra. c) a expressão proposta por Freedmam e Diaconis: An1 3 , onde A é a amplitude da amostra (valor máximo – valor mínimo), n é o número de elementos da nc = 2I q amostra, e Iq é o intervalo interquartil (ver medidas de dispersão). Ex. 3. Com base nos dados do exemplo 2 determinar: (a) o número ideal de classes usando a regra de Sturges (arredonde o resultado para menos se necessário); (b) construir uma tabela dividida em classes contendo (c) a freqüência absoluta de ocorrência, (d) a freqüência relativa, (e) a freqüência relativa acumulada. a) nc = 1 + 3,3 × log n = 1 + 3,3 × log 20 = 5,29 ≅ 5 classes. (b) Intervalo das classes (cm) 150 – 154 155 – 159 160 – 164 165 – 169 170 – 174 TOTAL (c) Freqüência absoluta (fi) 4 4 9 2 1 ∑f i = 20 (d) Freqüência relativa 0,20 0,20 0,45 0,10 0,05 (e) Freqüência relativa acumulada 0,20 0,40 0,85 0,95 1,00 1,00 → Medidas de tendência central As medidas de tendência central procuram indicar o centro da distribuição de freqüências (média e mediana) e a região de maior concentração de freqüências (moda). * Média amostral ( x ) ∑ xi x= n ∑ ( f i xi ) , onde xi é o ponto Obs: Numa tabela de freqüência, a média amostral x pode ser determinada por x = ∑ fi médio e fi é a freqüência da i-ésima classe, respectivamente. 2 * Moda (M) É o valor da variável que ocorre com maior freqüência. Uma amostra pode não possuir moda (amodal), pode apresentar duas modas (bimodal) ou pode ter várias modas (multimodal). * Mediana ( ~ x) É o valor que ocupa a posição central quando os dados são ordenados, ou seja, 50% dos elementos da amostra ficam abaixo da mediana e 50% ficam acima da mediana. A mediana é o elemento central que divide a amostra em dois subconjuntos de mesmo número de elementos. Quando a amostra possui um número par de elementos, a mediana é comumente dada pela média dos dois elementos centrais. Ex. 4. Com base nos dados do exemplo 2 determine: (a) a média, (b) a moda, (c) a mediana. Ordenando os dados: 150 152 153 154 155 155 156 156 160 160 161 161 161 162 162 163 163 166 168 172 a) x= ∑(f x ) = ∑f i i i 150 × 1 + 152 × 1 + 153 × 1 + 154 × 1 + 155 × 2 + 156 × 2 + 160 × 2 + 161 × 3 + 162 × 2 + 163 × 2 + 166 × 1 + 168 × 1 + 172 × 1 1+1+1+1+ 2 + 2 + 2 + 3 + 2 + 2 +1+1+1 3190 = = 159,5 20 b) M = 161 160 + 161 c) ~ x= = 160,5 2 → Medidas de dispersão As medidas de dispersão quantificam a variabilidade ou dispersão dos dados. * Amplitude total (A) É a diferença entre o maior e o menor valor de um conjunto de dados. A = (valor máximo – valor mínimo) * Desvio-médio absoluto (d) ∑ xi − x = x1 − x + x 2 − x + x3 − x + ... + x n − x d= n n * Variância amostral (s2) (∑ x ) − 2 s2 = ∑ (x − x) i 2 = n −1 ∑x i 2 i n −1 n Obs: Em uma tabela de freqüência, a variância amostral pode ser dada por s = 2 ∑(f x i ) − (∑ f x ) 2 2 i i n n −1 i , onde xi é o ponto médio e fi é a freqüência da i-ésima classe, respectivamente. * Variância populacional (σ2) σ 2 ∑ (x = − x) i 2 ∑ x − (∑ x ) = 2 2 i i n n * Desvio-padrão amostral (s) (∑ x ) ∑x − n 2 s= ∑ (x σ = ∑ (x − x) i i 2 i 2 = n −1 n −1 * Desvio-padrão populacional (σ) i − x) n 2 = . ∑ x − (∑ x ) 2 2 i i n 3 Ex. 5. Com base nos dados do exemplo 2 determine: (a) a média, (b) a variância, (c) o desvio-padrão. Estatura (xi) ( xi − x ) ( x i − x )2 150 152 153 154 155 155 156 156 160 160 161 161 161 162 162 163 163 166 168 172 -9,5 -7,5 -6,5 -5,5 -4,5 -4,5 -3,5 -3,5 0,5 0,5 1,5 1,5 1,5 2,5 2,5 3,5 3,5 6,5 8,5 12,5 90,25 56,25 42,25 30,25 20,25 20,25 12,25 12,25 0,25 0,25 2,25 2,25 2,25 6,25 6,25 12,25 12,25 42,25 72,25 156,25 ∑ x = 3190 ∑ x = 3190 = 159,5 x= ∑ (x i i n 20 s 2 ∑ (x = i − x) n −1 2 599 = = 31,53 20 − 1 s= ∑ (x i − x ) = 599 2 i − x) n −1 2 = 599 = 5,61 20 − 1 Ex. 6. Com base nos dados do exemplo 3 determine: (a) a média, (b) a variância, (c) o desvio-padrão. Intervalo da classe (cm) 150 – 154 155 – 159 160 – 164 165 – 169 170 – 174 ∑ ( f x ) = 3200 = 160 x= 20 ∑f i Ponto médio da classe (xi) 152 157 162 167 172 2 i i ( fx) ∑ ( f x )− ∑ n Freqüência absoluta (fi) 4 4 9 2 1 ∑ f i = 20 s2 = i i 2 i i n −1 = 512570 − (3200 )2 20 − 1 20 = 30 fixi 608 628 1458 334 172 ( f x ∑ i i ) = 3200 xi2 fixi2 23104 92416 24649 98596 26244 236196 27889 55778 29584 29584 2 ( ) f x = 512570 ∑ ii s = s 2 = 30 = 5,48 → Medidas de posição As medidas de posição são utilizadas para identificar a posição de um determinado elemento dentro da amostra. * Escore padronizado (ou escore z): É o número de desvios-padrão pelo qual um valor x dista da média (para mais ou para menos). x−x x−µ (para uma amostra), ou z = (para uma população). z= s σ A importância do escore z na estatística reside no fato de que eles permitem distinguir entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estão entre -2,00 e 2,00, e incomuns os valores com escore z inferior a -2,00 ou superior a 2,00. * Regra prática: Para um conjunto de dados com a distribuição aproximadamente em forma de sino, temos que: 68% dos valores estão a 1 desvio-padrão amostral s afastados da média amostral x . 95% dos valores estão a 2 desvios-padrão amostral s afastados da média amostral x . 99,7% dos valores estão a 3 desvios-padrão amostral s afastados da média amostral x . 99,99% dos valores estão a 4 desvios-padrão amostral s afastados da média amostral x . 4 Ex. 7. A altura da população de homens adultos têm média µ = 175,26 cm e desvio-padrão σ = 7,11 cm e possui distribuição em forma de sino. Michel Jordan, com 198,12 cm de altura, pode ser considerado excepcionalmente alto? x − µ 198,12 − 175,26 = = 3,22 . Como o escore z é maior que 2,00, Michel Jordan pode ser considerado z= σ 7,11 excepcionalmente alto. * Quartis (Q1, Q2 e Q3): Os quartis dividem o conjunto de dados em quatro partes iguais. O quartil inferior Q1 (ou primeiro quartil) separa os 25% inferiores dos 75% superiores. O quartil Q2 (ou segundo quartil) é a mediana. O quartil superior Q3 (ou terceiro quartil) separa os 75% inferiores dos 25% superiores. Ex. 8. (a) Dada a amostra: 60, 67, 68, 83, 87, 89, determine os quartis. 60 + 67 68 + 83 87 + 89 Q1 = = 63,5 ; Q2 = = 75,5 ; Q3 = = 88,0 . 2 2 2 Ex. 8. (b) Os quartis inferior (Q1) e superior (Q3) podem também ser determinados da seguinte forma: O primeiro quartil (Q1) é o valor que ocupa a posição (n + 1)/4, e o terceiro quartil (Q3) é o valor que ocupa a posição 3(n + 1)/4, onde n é o número de elementos na amostra. Se a posição obtida não for um número inteiro, usa-se a interpolação. Dessa forma teríamos n = 6; (n + 1)/4 = (6 + 1)/4 = 1,75 (Q1 está entre o 1o e 2o valor) e 3(n + 1)/4 = 3(6 + 1)/4 = 5,25 (Q3 está entre o 5 e 6o valor). Logo Q1 = 60 + 0,75.(67 – 60) = 65,25; e Q3 = 87 + 0,25.(89 – 87) = 87,5 * Decis: Os nove decis (D1, D2, D3, ..., D9) dividem a amostra em 10 grupos com cerca de 10% deles em cada grupo. * Percentis: Os 99 percentis dividem a amostra em 100 grupos com cerca de 1% em cada grupo: percentil do valor x = número de valores inferiores a x × 100 número total de valores → Usando a calculadora científica * Algumas medidas vistas anteriormente podem ser obtidas através de uma calculadora científica (e.g., CASIO fx-82SUPER FRACTION) usando os seguintes passos: (1) acionar o modo estatístico (tecla MODE, seguida da tecla •), (2) digitar cada valor da variável, seguido da tecla DATA; (3) pressionar a tecla com a função x, x 2 , etc.) estatística desejada ( x , σ n −1 , ∑ ∑ → Usando o programa MINITAB * As medidas vistas anteriormente podem ser obtidas no MINITAB usando-se os seguintes comandos: Digite os valores da variável na coluna C1. Em seguida acesse o menu: Stat Basic Statistics Display Descriptive Statistics Ex. 9. Obtenha um sumário estatístico para os dados do exemplo 2. Descriptive Statistics Variable C1 Variable C1 N 20 Minimum 150,00 Mean 159,50 Maximum 172,00 Median 160,50 Q1 155,00 TrMean 159,33 Q3 162,75 StDev 5,61 SE Mean 1,26 onde: Mean = média dos dados Median = mediana TrMean = média ajustada eliminando-se valores extremos StDev = desvio-padrão SE Mean = desvio-padrão da média ( s n ) A análise descritiva completa, com gráficos e medidas, também pode ser obtida no MINITAB com os comandos: Stat Basic Statistics Display Descriptive Statistics 5 Clicando em Graphs aparece a janela abaixo - figura (a). Clicando a opção Graphical summary obtemos a saída a seguir – figura (b): (a) (b) → Gráficos ou representação pictórica dos dados * Histograma: Um histograma consiste em uma escala horizontal para os valores dos dados a serem representados, e uma escala vertical para representar os valores das freqüências das diversas classes. O histograma é usado para verificar a distribuição dos dados amostrais, que é uma característica extremamente importante, pois muitos processos estatísticos exigem que a amostra tenha distribuição em forma de sino (curva gaussiana). Ex. 10. Histogramas de freqüência relativa (%) para (a) velocidade média horária do vento (m/s) e (b) temperatura média horária do ar (oC), monitoradas a 17,5 m de altura na estação meteorológica da UFES no período de jul-ago/2003. 30 Freqüência relativa (%) Freqüência relativa (%) 20 10 20 10 0 0 0 1 2 3 4 5 6 16 7 18 20 22 24 26 28 30 32 Temperatura (oC) Velocidade do vento (m/s) (a) (b) * Diagrama de caixa (boxplot): É um gráfico de dados que consiste em uma reta que se prolonga do menor ao maior valor, e um retângulo com retas traçadas no primeiro quartil Q1, na mediana e no terceiro quartil Q3 (ver figura a seguir). Valores que superam Q3 em 1,5Iq a 3,0Iq ou estão 1,5Iq a 3,0Iq abaixo de Q1 são considerados valores ligeiramente destoantes (outliers suaves), e valores que excedem Q3 em mais de 3,0Iq ou estão a mais de 3,0Iq abaixo de Q1 são considerados valores extremamente destoantes (outliers extremos). Q1 Q3 outlier suave outliers suaves outlier extremo 1,5Iq Iq 3,0Iq 6 O diagrama de caixa também pode ser utilizado para indicar a forma da distribuição dos dados amostrais. A figura a seguir ilustra alguns diagramas de caixas, juntamente com as formas usuais da distribuição. Em forma de sino Uniforme Assimétrica Concentração de H2S (mg/L) Ex. 11. Diagrama de caixa para concentração de H2S (em mg/L) em cinco pontos da estação de tratamento de esgotos das UFES (os pontos representam a concentração média e o asterisco indica um outlier suave). 14 12 10 8 6 4 2 0 EE CA UASB CDV BF1 * Diagrama de dispersão: O diagrama de dispersão é útil para dados observados aos pares (emparelhados). É um gráfico de dados emparelhados (x,y), com um eixo x, horizontal, e um eixo y, vertical. O padrão dos pontos alocados no gráfico costuma ajudar a determinar se existe algum relacionamento entre as duas variáveis. Ex. 12. Diagramas de dispersão para dados de (a) pesos de ursos anestesiados (em libras) e perímetro dos seus tóraxes (em polegadas) e (b) idades (em anos) e concentração de álcool no sangue (mg/L) medidas quando os motoristas intoxicados condenados foram presos pela primeira vez. (a) Forte correlação. (b) Não há correlação. → Usando o programa MINITAB * Gráficos como histograma, diagrama de caixa e diagrama de dispersão podem ser obtidos através do MINITAB usando-se os seguintes comandos: Digite os valores da variável(eis) na(s) coluna(s) C1 (e/ou C2). Em seguida acesse o menu: Graph Histogram, ou Boxplot, ou Plot 7 O programa exibirá uma janela tal como na figura a seguir onde deve(m) ser indicada(s) a(s) coluna C1 (e/ou C2) para a lacuna da(s) variável(eis) envolvida(s). O tipo de histograma (freqüência absoluta/relativa ou freqüência acumulada absoluta/relativa) pode ser escolhido clicando o ícone Options, que permite também selecionar o número de classes e o tipo de intervalo das classes. → Exercícios 1. Os dados a seguir representam os tempos decorridos (em segundos) entre a formulação do pedido e a entrega do prato em uma lanchonete fast food. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude; (d) a moda; (e) a mediana; (f) a média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o percentil do valor 121; (l) o desvio padrão; (m) a variância; (n) um tempo de espera de 1 min pode ser considerado excepcionalmente baixo?; (o) e 0,5 min? 135 90 85 121 83 69 87 159 177 135 227 Respostas: (a) 69, (b) 227, (c) 158, (d) 135, (e) 121, (f) 124,4, (g) 38,4, (h) 85, (i) 159, (j) 45o, (l) 48,6, (m) 2364,5. 2. Os dados a seguir representam a precipitação pluviométrica mensal (em mm) ocorrida em Carapina, Serra (ES), no ano de 2001. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude total; (d) a moda; (e) a mediana; (f) a média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o intervalo interquartil; (l) o percentil do valor 211; (m) a variância; (n) o desvio-padrão; (o) uma precipitação mensal de 400 mm pode ser considerada excepcionalmente alta?; (p) e 60 cm? 35 33 55 10 127 82 140 126 211 299 686 246 3. Os dados a seguir representam os tempos (em segundos) de resposta de uma consulta a um certo banco de dados. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude total; (d) a moda; (e) a mediana; (f) a média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o intervalo interquartil; (l) o percentil do valor 32; (m) a variância; (n) o desvio-padrão; (o) um tempo de 20 segundos pode ser considerado excepcionalmente baixo?; (p) e 1,5 min? 28 35 43 23 62 38 34 27 32 37 4. Os dados a seguir se referem às idades de presidentes dos EUA na ocasião da posse. Determine: (a) o número ideal de classes usando a regra de Sturges (arredonde o resultado para mais se necessário); construa uma tabela contendo (b) a freqüência absoluta de ocorrência (use 42 como o limite inferior e 3 como a amplitude da classe); (c) a freqüência relativa; (d) a freqüência relativa acumulada; (e) o ponto médio de cada classe; (f) Σfixi; (g) Σfixi2; (h) a média; (i) o desvio-padrão; (j) a variância. (Obs.: use a própria tabela de freqüência para determinar os três últimos itens). 57 61 57 57 58 57 61 54 68 51 49 64 50 48 65 52 56 46 54 49 51 47 55 55 54 42 51 56 55 51 54 51 60 62 43 55 56 61 52 69 64 46 8 5. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes anterior); (d) o diagrama de caixa; (e) os dados possuem distribuição em forma de sino? 6. Os dados a seguir representam a precipitação anual (em cm) em Baixo Guandu (ES) durante um período de 39 anos, de 1942 a 1980. Determine: (a) o número ideal de classes usando a regra de Sturges (arredonde o resultado para menos se necessário). Construa uma tabela contendo: (b) a freqüência absoluta de ocorrência (use 20 como o limite inferior e 19 como a amplitude das classes); (c) a freqüência relativa; (d) a freqüência relativa acumulada; (e) o ponto médio de cada classe; (f) Σfi.xi; (g) Σ(fi.xi2); (h) a média; (i) a variância; (j) o desvio padrão. (Obs.: use a tabela de freqüência para determinar os três últimos itens) 116 78 101 117 82 99 91 131 65 55 123 87 64 98 95 86 83 59 81 79 107 29 115 110 77 90 74 79 80 105 79 97 77 88 94 64 92 137 113 7. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes anterior); (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino? 8. Os dados a seguir representam a distância (em km) entre a residência e o local de trabalho dos funcionários de uma certa empresa. Determine: (a) o número ideal de classes usando a regra de Sturges (arredonde o resultado para menos se necessário). Construa uma tabela contendo: (b) a freqüência absoluta de ocorrência; (c) a freqüência relativa; (d) a freqüência relativa acumulada; (e) o ponto médio de cada classe; (f) Σfi.xi; (g) Σ(fi.xi2); (h) a média; (i) a variância; (j) o desvio padrão. (Obs.: use a tabela de freqüência para determinar os três últimos itens) 1,8 1,2 0,5 2,5 2,3 0,9 0,4 1,9 1,7 1,9 0,8 0,5 4,4 1,5 0,8 2,2 1,7 3,7 3,5 1,4 1,4 0,2 2,1 1,8 0,9 3,2 2,0 1,4 1,5 1,1 1,1 2,1 1,0 1,7 1,4 0,8 9. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes do exercício anterior); (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino? 10. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Colorado, durante um período de 52 anos, de 1878 a 1929. Determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência relativa; (d) o diagrama de caixa; (e) os dados possuem distribuição em forma de sino? 1980 2120 1840 4550 1130 2410 3120 2690 3120 2550 3290 2270 2120 1980 3170 5660 1700 2120 1980 5950 2550 2410 4960 3400 8500 2410 2120 3120 3260 1420 2550 2070 3960 1980 4250 1470 2270 2690 1980 2410 1700 3260 4670 3310 1570 1840 1700 3230 2830 2410 2410 3090 11. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Tevere, medida na estação de monitoramento de Roma, na região central da Itália, durante um período de 54 anos, de 1921 a 1974. Determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência relativa; (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino? 1092 1099 1440 1083 1621 1132 935 1540 1966 775 1166 843 1508 1876 1696 1690 2730 1440 985 1346 1553 1370 743 1340 896 1600 2190 1600 714 794 1460 1240 1230 1270 861 1355 612 822 1370 1380 510 810 735 259 1290 1325 528 622 355 468 472 664 717 950 12. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Po, medida na estação de monitoramento de Pontelagoscuro, no norte da Itália, durante um período de 56 anos, de 1918 a 1973. Determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência relativa percentual; (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino? 9 5390 4150 5130 6510 4240 4690 5460 4880 7220 6810 6630 4540 3000 6620 7220 6430 2590 6620 3260 5630 2980 7700 8940 6110 3920 4380 4200 7240 3460 3900 7400 2470 8850 5420 4450 7830 3760 6870 2400 6080 8600 4600 5090 3170 2220 3270 6990 5270 5400 3660 5680 5940 3700 6830 7730 4030 13. A tabela a seguir apresenta dados de concentração média anual (em µg/m3) de partículas totais em suspensão (PTS) e partículas inaláveis menores que 10 mícrons* (PM10) monitoradas na rede automática da qualidade do ar da região da Grande Vitória durante o ano de 2003. Determine através do programa MINITAB: (a) o sumário estatístico; (b) o diagrama de dispersão; (c) as variáveis estão correlacionadas? * 1 mícron = 10-6 metro Estação de monitoramento Concentração (µg/m3) Laranjeiras Carapina Jardim Camburi Enseada do Suá Ibes Cariacica PTS 49 33 40 47 45 78 PM10 31 23 28 28 25 45 14. A tabela a seguir apresenta dados de um estudo desenvolvido para verificar o quanto o comprimento de um cabo da porta serial de microcomputadores influencia na qualidade da transmissão de dados, medida através do número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Determine através do programa MINITAB: (a) o sumário estatístico; (b) o diagrama de dispersão; (c) as variáveis estão correlacionadas? Comprimento do cabo (m) 8 9 10 11 12 13 14 15 2,2 3,0 4,1 6,2 9,8 12,5 19,3 28,2 Taxa de falha Curiosidades 10