if - N09

Propaganda
Unidade de Ensino Descentralizada de Colatina
Coordenadoria de Informática
Disciplina: Probabilidade e Estatística
Prof. Leandro Melo de Sá
2006/2
Unidade 1 – ESTATÍSTICA DESCRITIVA
→ Conceitos básicos
* Estatística: constitui um conjunto de métodos para planejar experimentos, obter dados, organizá-los, resumilos, analisá-los, interpretá-los e deles extrair conclusões.
* Estatística descritiva: métodos utilizados para resumir ou descrever as características de um conjunto
conhecido de dados.
* Variável: é um conjunto de resultados possíveis de um fenômeno.
- qualitativa: (ex: cor, sexo – não numérica)
- quantitativa (número de alunos presentes à aula, estatura, idade, salário, número de automóveis – numérica)
- discreta: admite um número finito de valores.
- contínua: admite um número infinito de valores.
* População: é o conjunto completo de todos os elementos possíveis de ocorrer.
* Amostra: é um subconjunto ou subcoleção de elementos extraídos de uma população.
→ Tabela de freqüência
Uma tabela de freqüência relaciona categorias (ou classes) de valores, juntamente com as contagens (ou
freqüências) do número de valores que se enquadram em cada categoria.
* Freqüência absoluta: número de vezes que o valor da variável é observada.
Seja fi a freqüência do i-ésimo valor observado e n o número de elementos na amostra:
Tem-se então que: ∑ f i = n .
Ex. 1. Número de enchentes ocorridas por ano de 1939 a 1972 na estação de monitoramento de Calamazza, no
rio Magra, entre Pisa e Genova no noroeste da Itália. A ocorrência de enchente é definida por uma vazão
excedendo a 300 m3/s.
Quantidade de enchentes no ano
0
1
2
3
4
5
6
7
8
9
TOTAL
Freqüência de ocorrência (fi)
0
2
6
7
9
4
1
4
1
0
∑f
i
= 34
* Freqüência relativa (FR) = freqüência da categoria ou classe
freqüência total
* Freqüência absoluta acumulada (FA) = soma das freqüências daquela categoria ou classe e de todas que a
antecedem.
* Freqüência relativa acumulada (FRA) = soma das freqüências relativas daquela categoria ou classe e de todas
que a antecedem.
Ex. 2. Estatura (em centímetros) de alunos de uma turma:
166 162 155 154 160 161 152 161 161 168 163 156 150 163 160 172 162 156 155 153
Construir uma tabela contendo: (a) a freqüência absoluta de ocorrência; (b) a freqüência relativa; (c) a
freqüência absoluta acumulada; (d) a freqüência relativa acumulada.
1
Estatura
(xi)
150
152
153
154
155
156
160
161
162
163
166
168
172
TOTAL
Freqüência
absoluta (fi)
1
1
1
1
2
2
2
3
2
2
1
1
1
∑f
i
= 20
Freqüência relativa
(FR)
0,05
0,05
0,05
0,05
0,10
0,10
0,10
0,15
0,10
0,10
0,05
0,05
0,05
Freqüência absoluta
acumulada (FA)
1
2
3
4
6
8
10
13
15
17
18
19
20
Freqüência relativa
acumulada (FRA)
0,05
0,10
0,15
0,20
0,30
0,40
0,50
0,65
0,75
0,85
0,90
0,95
1,00
1,00
-
-
→ Determinação do número de classes (nc)
A escolha do número de classes deve ser feita com muito cuidado. Poucas classes podem causar uma omissão
de algumas características importantes dos dados, enquanto que muitas classes podem não dar uma visão global
nítida dos dados devido às flutuações na freqüência. Três métodos para determinar o número de classes podem
ser utilizados:
a) regra prática:
nc = n , onde n é o número de elementos da amostra e deve estar no intervalo 25 ≤ n ≤ 650.
b) regra de Sturges:
nc = 1 + 3,3 × log n, onde n é o número de elementos da amostra.
c) a expressão proposta por Freedmam e Diaconis:
An1 3
, onde A é a amplitude da amostra (valor máximo – valor mínimo), n é o número de elementos da
nc =
2I q
amostra, e Iq é o intervalo interquartil (ver medidas de dispersão).
Ex. 3. Com base nos dados do exemplo 2 determinar: (a) o número ideal de classes usando a regra de Sturges
(arredonde o resultado para menos se necessário); (b) construir uma tabela dividida em classes contendo (c) a
freqüência absoluta de ocorrência, (d) a freqüência relativa, (e) a freqüência relativa acumulada.
a) nc = 1 + 3,3 × log n = 1 + 3,3 × log 20 = 5,29 ≅ 5 classes.
(b)
Intervalo das classes (cm)
150 – 154
155 – 159
160 – 164
165 – 169
170 – 174
TOTAL
(c)
Freqüência absoluta (fi)
4
4
9
2
1
∑f
i
= 20
(d)
Freqüência relativa
0,20
0,20
0,45
0,10
0,05
(e)
Freqüência relativa acumulada
0,20
0,40
0,85
0,95
1,00
1,00
→ Medidas de tendência central
As medidas de tendência central procuram indicar o centro da distribuição de freqüências (média e mediana) e a
região de maior concentração de freqüências (moda).
* Média amostral ( x )
∑ xi
x=
n
∑ ( f i xi ) , onde xi é o ponto
Obs: Numa tabela de freqüência, a média amostral x pode ser determinada por x =
∑ fi
médio e fi é a freqüência da i-ésima classe, respectivamente.
2
* Moda (M)
É o valor da variável que ocorre com maior freqüência. Uma amostra pode não possuir moda (amodal), pode
apresentar duas modas (bimodal) ou pode ter várias modas (multimodal).
* Mediana ( ~
x)
É o valor que ocupa a posição central quando os dados são ordenados, ou seja, 50% dos elementos da amostra
ficam abaixo da mediana e 50% ficam acima da mediana. A mediana é o elemento central que divide a amostra
em dois subconjuntos de mesmo número de elementos. Quando a amostra possui um número par de elementos,
a mediana é comumente dada pela média dos dois elementos centrais.
Ex. 4. Com base nos dados do exemplo 2 determine: (a) a média, (b) a moda, (c) a mediana.
Ordenando os dados: 150 152 153 154 155 155 156 156 160 160 161 161 161 162 162 163 163 166 168 172
a)
x=
∑(f x ) =
∑f
i
i
i
150 × 1 + 152 × 1 + 153 × 1 + 154 × 1 + 155 × 2 + 156 × 2 + 160 × 2 + 161 × 3 + 162 × 2 + 163 × 2 + 166 × 1 + 168 × 1 + 172 × 1
1+1+1+1+ 2 + 2 + 2 + 3 + 2 + 2 +1+1+1
3190
=
= 159,5
20
b) M = 161
160 + 161
c) ~
x=
= 160,5
2
→ Medidas de dispersão
As medidas de dispersão quantificam a variabilidade ou dispersão dos dados.
* Amplitude total (A)
É a diferença entre o maior e o menor valor de um conjunto de dados.
A = (valor máximo – valor mínimo)
* Desvio-médio absoluto (d)
∑ xi − x = x1 − x + x 2 − x + x3 − x + ... + x n − x
d=
n
n
* Variância amostral (s2)
(∑ x )
−
2
s2 =
∑ (x
− x)
i
2
=
n −1
∑x
i
2
i
n −1
n
Obs: Em uma tabela de freqüência, a variância amostral pode ser dada por s =
2
∑(f x
i
) − (∑ f x )
2
2
i
i
n
n −1
i
, onde xi
é o ponto médio e fi é a freqüência da i-ésima classe, respectivamente.
* Variância populacional (σ2)
σ
2
∑ (x
=
− x)
i
2
∑ x − (∑ x )
=
2
2
i
i
n
n
* Desvio-padrão amostral (s)
(∑ x )
∑x − n
2
s=
∑ (x
σ =
∑ (x
− x)
i
i
2
i
2
=
n −1
n −1
* Desvio-padrão populacional (σ)
i
− x)
n
2
=
.
∑ x − (∑ x )
2
2
i
i
n
3
Ex. 5. Com base nos dados do exemplo 2 determine: (a) a média, (b) a variância, (c) o desvio-padrão.
Estatura (xi)
( xi − x )
( x i − x )2
150
152
153
154
155
155
156
156
160
160
161
161
161
162
162
163
163
166
168
172
-9,5
-7,5
-6,5
-5,5
-4,5
-4,5
-3,5
-3,5
0,5
0,5
1,5
1,5
1,5
2,5
2,5
3,5
3,5
6,5
8,5
12,5
90,25
56,25
42,25
30,25
20,25
20,25
12,25
12,25
0,25
0,25
2,25
2,25
2,25
6,25
6,25
12,25
12,25
42,25
72,25
156,25
∑ x = 3190
∑ x = 3190 = 159,5
x=
∑ (x
i
i
n
20
s
2
∑ (x
=
i
− x)
n −1
2
599
=
= 31,53
20 − 1
s=
∑ (x
i
− x ) = 599
2
i
− x)
n −1
2
=
599
= 5,61
20 − 1
Ex. 6. Com base nos dados do exemplo 3 determine: (a) a média, (b) a variância, (c) o desvio-padrão.
Intervalo da classe (cm)
150 – 154
155 – 159
160 – 164
165 – 169
170 – 174
∑ ( f x ) = 3200 = 160
x=
20
∑f
i
Ponto médio da classe
(xi)
152
157
162
167
172
2
i
i
( fx)
∑ ( f x )− ∑ n
Freqüência absoluta
(fi)
4
4
9
2
1
∑ f i = 20
s2 =
i i
2
i i
n −1
=
512570 −
(3200 )2
20 − 1
20
= 30
fixi
608
628
1458
334
172
(
f
x
∑ i i ) = 3200
xi2
fixi2
23104
92416
24649
98596
26244
236196
27889
55778
29584
29584
2
(
)
f
x
=
512570
∑ ii
s = s 2 = 30 = 5,48
→ Medidas de posição
As medidas de posição são utilizadas para identificar a posição de um determinado elemento dentro da amostra.
* Escore padronizado (ou escore z): É o número de desvios-padrão pelo qual um valor x dista da média (para
mais ou para menos).
x−x
x−µ
(para uma amostra), ou z =
(para uma população).
z=
s
σ
A importância do escore z na estatística reside no fato de que eles permitem distinguir entre valores usuais e
valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estão entre -2,00 e 2,00,
e incomuns os valores com escore z inferior a -2,00 ou superior a 2,00.
* Regra prática: Para um conjunto de dados com a distribuição aproximadamente em forma de sino, temos que:
68% dos valores estão a 1 desvio-padrão amostral s afastados da média amostral x .
95% dos valores estão a 2 desvios-padrão amostral s afastados da média amostral x .
99,7% dos valores estão a 3 desvios-padrão amostral s afastados da média amostral x .
99,99% dos valores estão a 4 desvios-padrão amostral s afastados da média amostral x .
4
Ex. 7. A altura da população de homens adultos têm média µ = 175,26 cm e desvio-padrão σ = 7,11 cm e
possui distribuição em forma de sino. Michel Jordan, com 198,12 cm de altura, pode ser considerado
excepcionalmente alto?
x − µ 198,12 − 175,26
=
= 3,22 . Como o escore z é maior que 2,00, Michel Jordan pode ser considerado
z=
σ
7,11
excepcionalmente alto.
* Quartis (Q1, Q2 e Q3): Os quartis dividem o conjunto de dados em quatro partes iguais. O quartil inferior Q1
(ou primeiro quartil) separa os 25% inferiores dos 75% superiores. O quartil Q2 (ou segundo quartil) é a
mediana. O quartil superior Q3 (ou terceiro quartil) separa os 75% inferiores dos 25% superiores.
Ex. 8. (a) Dada a amostra: 60, 67, 68, 83, 87, 89, determine os quartis.
60 + 67
68 + 83
87 + 89
Q1 =
= 63,5 ; Q2 =
= 75,5 ; Q3 =
= 88,0 .
2
2
2
Ex. 8. (b) Os quartis inferior (Q1) e superior (Q3) podem também ser determinados da seguinte forma: O
primeiro quartil (Q1) é o valor que ocupa a posição (n + 1)/4, e o terceiro quartil (Q3) é o valor que ocupa a
posição 3(n + 1)/4, onde n é o número de elementos na amostra. Se a posição obtida não for um número inteiro,
usa-se a interpolação. Dessa forma teríamos n = 6; (n + 1)/4 = (6 + 1)/4 = 1,75 (Q1 está entre o 1o e 2o valor) e
3(n + 1)/4 = 3(6 + 1)/4 = 5,25 (Q3 está entre o 5 e 6o valor).
Logo Q1 = 60 + 0,75.(67 – 60) = 65,25; e Q3 = 87 + 0,25.(89 – 87) = 87,5
* Decis: Os nove decis (D1, D2, D3, ..., D9) dividem a amostra em 10 grupos com cerca de 10% deles em cada
grupo.
* Percentis: Os 99 percentis dividem a amostra em 100 grupos com cerca de 1% em cada grupo:
percentil do valor x = número de valores inferiores a x × 100
número total de valores
→ Usando a calculadora científica
* Algumas medidas vistas anteriormente podem ser obtidas através de uma calculadora científica (e.g., CASIO
fx-82SUPER FRACTION) usando os seguintes passos: (1) acionar o modo estatístico (tecla MODE, seguida da
tecla •), (2) digitar cada valor da variável, seguido da tecla DATA; (3) pressionar a tecla com a função
x,
x 2 , etc.)
estatística desejada ( x , σ n −1 ,
∑ ∑
→ Usando o programa MINITAB
* As medidas vistas anteriormente podem ser obtidas no MINITAB usando-se os seguintes comandos:
Digite os valores da variável na coluna C1. Em seguida acesse o menu:
Stat
Basic Statistics
Display Descriptive Statistics
Ex. 9. Obtenha um sumário estatístico para os dados do exemplo 2.
Descriptive Statistics
Variable
C1
Variable
C1
N
20
Minimum
150,00
Mean
159,50
Maximum
172,00
Median
160,50
Q1
155,00
TrMean
159,33
Q3
162,75
StDev
5,61
SE Mean
1,26
onde: Mean = média dos dados
Median = mediana
TrMean = média ajustada eliminando-se valores extremos
StDev = desvio-padrão
SE Mean = desvio-padrão da média ( s n )
A análise descritiva completa, com gráficos e medidas, também pode ser obtida no MINITAB com os
comandos:
Stat
Basic Statistics
Display Descriptive Statistics
5
Clicando em Graphs aparece a janela abaixo - figura (a). Clicando a opção Graphical summary obtemos a saída
a seguir – figura (b):
(a)
(b)
→ Gráficos ou representação pictórica dos dados
* Histograma: Um histograma consiste em uma escala horizontal para os valores
dos dados a serem representados, e uma escala vertical para representar os valores
das freqüências das diversas classes. O histograma é usado para verificar a
distribuição dos dados amostrais, que é uma característica extremamente
importante, pois muitos processos estatísticos exigem que a amostra tenha
distribuição em forma de sino (curva gaussiana).
Ex. 10. Histogramas de freqüência relativa (%) para (a) velocidade média horária do vento (m/s) e (b)
temperatura média horária do ar (oC), monitoradas a 17,5 m de altura na estação meteorológica da UFES no
período de jul-ago/2003.
30
Freqüência relativa (%)
Freqüência relativa (%)
20
10
20
10
0
0
0
1
2
3
4
5
6
16
7
18
20
22
24
26
28
30
32
Temperatura (oC)
Velocidade do vento (m/s)
(a)
(b)
* Diagrama de caixa (boxplot): É um gráfico de dados que consiste em uma reta que se prolonga do menor ao
maior valor, e um retângulo com retas traçadas no primeiro quartil Q1, na mediana e no terceiro quartil Q3 (ver
figura a seguir). Valores que superam Q3 em 1,5Iq a 3,0Iq ou estão 1,5Iq a 3,0Iq abaixo de Q1 são considerados
valores ligeiramente destoantes (outliers suaves), e valores que excedem Q3 em mais de 3,0Iq ou estão a mais de
3,0Iq abaixo de Q1 são considerados valores extremamente destoantes (outliers extremos).
Q1
Q3
outlier
suave
outliers
suaves
outlier
extremo
1,5Iq
Iq
3,0Iq
6
O diagrama de caixa também pode ser utilizado para indicar a forma da distribuição dos dados amostrais. A
figura a seguir ilustra alguns diagramas de caixas, juntamente com as formas usuais da distribuição.
Em forma de sino
Uniforme
Assimétrica
Concentração de H2S (mg/L)
Ex. 11. Diagrama de caixa para concentração de H2S (em mg/L) em cinco pontos da estação de tratamento de
esgotos das UFES (os pontos representam a concentração média e o asterisco indica um outlier suave).
14
12
10
8
6
4
2
0
EE
CA
UASB
CDV
BF1
* Diagrama de dispersão: O diagrama de dispersão é útil para dados observados aos pares (emparelhados). É um
gráfico de dados emparelhados (x,y), com um eixo x, horizontal, e um eixo y, vertical. O padrão dos pontos
alocados no gráfico costuma ajudar a determinar se existe algum relacionamento entre as duas variáveis.
Ex. 12. Diagramas de dispersão para dados de (a) pesos de ursos anestesiados (em libras) e perímetro dos seus
tóraxes (em polegadas) e (b) idades (em anos) e concentração de álcool no sangue (mg/L) medidas quando os
motoristas intoxicados condenados foram presos pela primeira vez.
(a) Forte correlação.
(b) Não há correlação.
→ Usando o programa MINITAB
* Gráficos como histograma, diagrama de caixa e diagrama de dispersão podem ser obtidos através do
MINITAB usando-se os seguintes comandos:
Digite os valores da variável(eis) na(s) coluna(s) C1 (e/ou C2). Em seguida acesse o menu:
Graph
Histogram, ou
Boxplot, ou
Plot
7
O programa exibirá uma janela tal como na figura a seguir onde deve(m) ser indicada(s) a(s) coluna C1 (e/ou
C2) para a lacuna da(s) variável(eis) envolvida(s). O tipo de histograma (freqüência absoluta/relativa ou
freqüência acumulada absoluta/relativa) pode ser escolhido clicando o ícone Options, que permite também
selecionar o número de classes e o tipo de intervalo das classes.
→ Exercícios
1. Os dados a seguir representam os tempos decorridos (em segundos) entre a formulação do pedido e a entrega
do prato em uma lanchonete fast food. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude; (d)
a moda; (e) a mediana; (f) a média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o
percentil do valor 121; (l) o desvio padrão; (m) a variância; (n) um tempo de espera de 1 min pode ser
considerado excepcionalmente baixo?; (o) e 0,5 min?
135 90 85 121 83 69 87 159 177 135 227
Respostas: (a) 69, (b) 227, (c) 158, (d) 135, (e) 121, (f) 124,4, (g) 38,4, (h) 85, (i) 159, (j) 45o, (l) 48,6, (m) 2364,5.
2. Os dados a seguir representam a precipitação pluviométrica mensal (em mm) ocorrida em Carapina, Serra
(ES), no ano de 2001. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude total; (d) a moda; (e)
a mediana; (f) a média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o intervalo
interquartil; (l) o percentil do valor 211; (m) a variância; (n) o desvio-padrão; (o) uma precipitação mensal de
400 mm pode ser considerada excepcionalmente alta?; (p) e 60 cm?
35 33 55 10 127 82 140 126 211 299 686 246
3. Os dados a seguir representam os tempos (em segundos) de resposta de uma consulta a um certo banco de
dados. Determine: (a) o valor mínimo; (b) o valor máximo; (c) a amplitude total; (d) a moda; (e) a mediana; (f) a
média; (g) o desvio médio absoluto; (h) o quartil inferior; (i) o quartil superior; (j) o intervalo interquartil; (l) o
percentil do valor 32; (m) a variância; (n) o desvio-padrão; (o) um tempo de 20 segundos pode ser considerado
excepcionalmente baixo?; (p) e 1,5 min?
28 35 43 23 62 38 34 27 32 37
4. Os dados a seguir se referem às idades de presidentes dos EUA na ocasião da posse. Determine: (a) o número
ideal de classes usando a regra de Sturges (arredonde o resultado para mais se necessário); construa uma tabela
contendo (b) a freqüência absoluta de ocorrência (use 42 como o limite inferior e 3 como a amplitude da classe);
(c) a freqüência relativa; (d) a freqüência relativa acumulada; (e) o ponto médio de cada classe; (f) Σfixi; (g)
Σfixi2; (h) a média; (i) o desvio-padrão; (j) a variância. (Obs.: use a própria tabela de freqüência para determinar
os três últimos itens).
57 61 57 57 58 57 61 54 68 51 49 64 50 48
65 52 56 46 54 49 51 47 55 55 54 42 51 56
55 51 54 51 60 62 43 55 56 61 52 69 64 46
8
5. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o
sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes anterior); (d) o
diagrama de caixa; (e) os dados possuem distribuição em forma de sino?
6. Os dados a seguir representam a precipitação anual (em cm) em Baixo Guandu (ES) durante um período de
39 anos, de 1942 a 1980. Determine: (a) o número ideal de classes usando a regra de Sturges (arredonde o
resultado para menos se necessário). Construa uma tabela contendo: (b) a freqüência absoluta de ocorrência (use
20 como o limite inferior e 19 como a amplitude das classes); (c) a freqüência relativa; (d) a freqüência relativa
acumulada; (e) o ponto médio de cada classe; (f) Σfi.xi; (g) Σ(fi.xi2); (h) a média; (i) a variância; (j) o desvio
padrão. (Obs.: use a tabela de freqüência para determinar os três últimos itens)
116 78 101 117 82 99 91 131 65 55 123 87 64
98 95 86 83 59 81 79 107 29 115 110 77 90
74 79 80 105 79 97 77 88 94 64 92 137 113
7. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o
sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes anterior); (d) o
diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino?
8. Os dados a seguir representam a distância (em km) entre a residência e o local de trabalho dos funcionários de
uma certa empresa. Determine: (a) o número ideal de classes usando a regra de Sturges (arredonde o resultado
para menos se necessário). Construa uma tabela contendo: (b) a freqüência absoluta de ocorrência; (c) a
freqüência relativa; (d) a freqüência relativa acumulada; (e) o ponto médio de cada classe; (f) Σfi.xi; (g) Σ(fi.xi2);
(h) a média; (i) a variância; (j) o desvio padrão. (Obs.: use a tabela de freqüência para determinar os três últimos
itens)
1,8
1,2
0,5
2,5
2,3
0,9
0,4
1,9
1,7
1,9
0,8
0,5
4,4
1,5
0,8
2,2
1,7
3,7
3,5
1,4
1,4
0,2
2,1
1,8
0,9
3,2
2,0
1,4
1,5
1,1
1,1
2,1
1,0
1,7
1,4
0,8
9. Para os dados do exercício anterior, determine através do programa MINITAB: (a) o sumário estatístico; (b) o
sumário gráfico; (c) o histograma de freqüência absoluta (considere a mesma divisão de classes do exercício
anterior); (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino?
10. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Colorado, durante um período de 52
anos, de 1878 a 1929. Determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário
gráfico; (c) o histograma de freqüência relativa; (d) o diagrama de caixa; (e) os dados possuem distribuição em
forma de sino?
1980
2120
1840
4550
1130
2410
3120
2690
3120
2550
3290
2270
2120
1980
3170
5660
1700
2120
1980
5950
2550
2410
4960
3400
8500
2410
2120
3120
3260
1420
2550
2070
3960
1980
4250
1470
2270
2690
1980
2410
1700
3260
4670
3310
1570
1840
1700
3230
2830
2410
2410
3090
11. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Tevere, medida na estação de
monitoramento de Roma, na região central da Itália, durante um período de 54 anos, de 1921 a 1974. Determine
através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de freqüência
relativa; (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em forma de sino?
1092 1099 1440 1083 1621 1132 935 1540 1966 775 1166 843 1508 1876 1696 1690 2730 1440
985 1346 1553 1370 743 1340 896 1600 2190 1600 714 794 1460 1240 1230 1270 861 1355
612 822 1370 1380 510 810 735 259 1290 1325 528 622 355 468 472 664 717 950
12. Os dados a seguir representam a vazão máxima anual (em m3/s) no rio Po, medida na estação de
monitoramento de Pontelagoscuro, no norte da Itália, durante um período de 56 anos, de 1918 a 1973.
Determine através do programa MINITAB: (a) o sumário estatístico; (b) o sumário gráfico; (c) o histograma de
freqüência relativa percentual; (d) o diagrama de caixa; (e) os dados possuem distribuição aproximadamente em
forma de sino?
9
5390
4150
5130
6510
4240
4690
5460
4880
7220
6810
6630
4540
3000
6620
7220
6430
2590
6620
3260
5630
2980
7700
8940
6110
3920
4380
4200
7240
3460
3900
7400
2470
8850
5420
4450
7830
3760
6870
2400
6080
8600
4600
5090
3170
2220
3270
6990
5270
5400
3660
5680
5940
3700
6830
7730
4030
13. A tabela a seguir apresenta dados de concentração média anual (em µg/m3) de partículas totais em suspensão
(PTS) e partículas inaláveis menores que 10 mícrons* (PM10) monitoradas na rede automática da qualidade do
ar da região da Grande Vitória durante o ano de 2003. Determine através do programa MINITAB: (a) o sumário
estatístico; (b) o diagrama de dispersão; (c) as variáveis estão correlacionadas?
*
1 mícron = 10-6 metro
Estação de monitoramento
Concentração (µg/m3) Laranjeiras Carapina Jardim Camburi Enseada do Suá Ibes Cariacica
PTS
49
33
40
47
45 78
PM10
31
23
28
28
25
45
14. A tabela a seguir apresenta dados de um estudo desenvolvido para verificar o quanto o comprimento de um
cabo da porta serial de microcomputadores influencia na qualidade da transmissão de dados, medida através do
número de falhas em 100.000 lotes de dados transmitidos (taxa de falha). Determine através do programa
MINITAB: (a) o sumário estatístico; (b) o diagrama de dispersão; (c) as variáveis estão correlacionadas?
Comprimento do cabo (m) 8 9 10 11 12 13 14 15
2,2 3,0 4,1 6,2 9,8 12,5 19,3 28,2
Taxa de falha
Curiosidades
10
Download