PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA ÍNDICE CAPITULO 1 – CONCEITOS BÁSICOS ............................................................................................................................ 3 1.1 – ESTATÍSTICA ...................................................................................................................................... 3 1.2 – ESTATÍSTICA DESCRITIVA ................................................................................................................ 3 1.3 – ESTATÍSTICA INFERENCIAL ............................................................................................................. 3 1.4 – POPULAÇÃO OU UNIVERSO ........................................................................................................... 3 1.5 – CENSO .............................................................................................................................................. 3 1.6 – AMOSTRA ........................................................................................................................................... 3 1.7 – EXPERIMENTO ALEATÓRIO ............................................................................................................. 3 1.8 – EXPERIMENTO DETERMINÍSTICO .................................................................................................. 3 CAPÍTULO 2 – DISTRIBUIÇÃO DE FREQÜÊNCIA ............................................................................................................. 3 2.1 – DADOS ESTATÍSTICOS ..................................................................................................................... 3 2.2 – DADOS BRUTOS ............................................................................................................................... 3 2.3 – ROL ................................................................................................................................................ 3 2.4 – DISTRIBUIÇÃO DE FREQÜÊNCIA .................................................................................................... 3 2.5 – ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA .............................................................. 4 CAPITULO 3 – MEDIDAS DE POSIÇÃO ........................................................................................................................... 9 3.1 – INTRODUÇÃO ................................................................................................................................... 9 3.2 – MÉDIA ARITMÉTICA X ................................................................................................................. 9 ( ) 3.2.1. MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS .......................................................... 9 3.2.2. DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA ....................................................................... 9 3.2.3. PROPRIEDADES DA MÉDIA ARITMÉTICA ........................................................................... 10 3.3 – MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS ............................................................................ 11 3.3.1. DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS ................................. 11 3.3.2. DADOS AGRUPADOS CONFORME UMA DISTRIBUIÇÃO DE FREQÜÊNCIAS POR CLASSE .... 12 3.3.3. PROCESSO BREVE PARA CÁLCULO DA MÉDIA ARITMÉTICA ........................................... 13 CAPÍTULO 4 – MODA (Mo) ............................................................................................................................................ 15 4.1 – MODA PARA DADOS NÃO AGRUPADOS ......................................................................................... 15 4.2 – MODA PARA DADOS AGRUPADOS ................................................................................................. 15 4.2.1. MODA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA. ............... 15 4.2.2. MODA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE ....................................................................................................................... 15 4.3 – DETERMINAÇÃO GRÁFICA DA MODA ............................................................................................. 17 4.4 – A MODA NA CURVA DE FREQÜÊNCIA. ........................................................................................... 17 CAPÍTULO 5 – MEDIANA (Md) ....................................................................................................................................... 18 5.1 – MEDIANA PARA DADOS NÃO AGRUPADOS ................................................................................... 18 5.2 – MEDIANA PARA DADOS AGRUPADOS ............................................................................................ 19 5.2.1. MEDIANA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR VALOR .......................................................................................................................... 19 5.2.2. MEDIANA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE ....................................................................................................................... 20 5.3 – RELAÇÃO ENTRE A MÉDIA ARITMÉTICA, MEDIANA E MODA ......................................................... 21 1 DISCIPLINA: ESTATÍSTICA CAPÍTULO 6 – PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] SEPARATRIZES ..................................................................................................................................... 21 6.1 – QUARTIS ......................................................................................................................................... 21 6.2 – DECIS .............................................................................................................................................. 22 6.3 – PERCENTIS .................................................................................................................................... 23 CAPÍTULO 7 – OUTRAS MÉDIAS .................................................................................................................................. 24 7.1 – MÉDIA GEOMÉTRICA (G) ................................................................................................................. 24 7.1.1. MÉDIA GEOMÉTRICA PARA DADOS NÃO AGRUPADOS ..................................................... 24 7.1.2. MÉDIA GEOMÉTRICA PARA DADOS AGRUPADOS ............................................................. 24 7.2 – MÉDIA HARMÔNICA (H) ................................................................................................................... 24 7.2.1. MÉDIA HARMÔNICA PARA DADOS NÃO AGRUPADOS ....................................................... 24 7.2.2. MÉDIA HARMÔNICA PARA DADOS AGRUPADOS ............................................................... 24 CAPÍTULO 8 – MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE ............................................................................. 25 8.1 – DISPERSÃO OU VARIABILIDADE ................................................................................................... 25 8.2 – AMPLITUDE TOTAL ......................................................................................................................... 25 8.2.1. DADOS NÃO AGRUPADOS .................................................................................................. 25 8.2.2. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA. ......................... 25 8.2.3. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE .......... 25 8.3 – VARIÂNCIA E DESVIO PADRÃO 8.3.1. PARA DADOS NÃO AGRUPADOS ........................................................................................ 26 8.3.2. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA ........................... 27 8.3.3. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE .......... 28 8.3.4. PROCESSO BREVE PARA CÁLCULOS DO DESVIO PADRÃO ........................................... 29 Capítulo 9 – TESTES DE ESTATÍSTICA .................................................................................................................... 31 Capítulo 10 – BATERIA DE EXERCÍCIOS RESOLVIDOS E COMENTADOS .................................................................. 44 10.1 – BATERIA 1 ........................................................................................................................................ 44 10.2 – BATERIA 2 ........................................................................................................................................ 45 10.3 – BATERIA 3 ........................................................................................................................................ 47 10.4 – BATERIA 4 ........................................................................................................................................ 50 2 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] Capitulo 1 CONCEITOS BÁSICOS 1.1 — ESTATÍSTICA A estatística constitui uma parte da matemática aplicada que tem como finalidade obter conclusões sobre os verdadeiros parâmetros do universo, utilizando para isso a coleta, a organização, a descrição, a análise e a interpretação dos dados. 1.2 — ESTATÍSTICA DESCRITIVA É o ramo da estatística que se preocupa apenas em descrever os dados observados da amostra, sem se preocupar em fazer previsões sobre os parâmetros do universo. Na estatística descritiva temos a coleta, organização e descrição dos dados. 1.3 — ESTATÍSTICA INFERENCIAL A estatística inferencial ou estatística indutiva é a parte mais importante da estatística, pois é a inferência estatística que permite a análise e a interpretação dos dados através de estimativas de parâmetros do universo. 1.4 — POPULAÇÃO OU UNIVERSO Portanto, são muitas as dificuldades para a realização de um censo, logo, nos geralmente utilizamos os processos de amostragem. 1.6 — AMOSTRA Amostra é qualquer subconjunto não vazio da população. Para a seleção da amostra devemos tomar cuidado para que a amostra seja representativa da população, considerando a aleatoriedade da seleção e o tamanho da amostra. 1.7 — EXPERIMENTO ALEATÓRIO Experimentos Aleatórios são aqueles que, repetidos nas mesmas condições, produzem resultados possíveis e diferentes. Exemplo: O lançamento de uma moeda honesta várias vezes nas mesmas condições, produz cara ou coroa como resultado, que só pode ser conhecido após o lançamento. 1.8 — EXPERIMENTO DETERMINÍSTICO Quando o resultado do experimento já está determinado antes de sua realização, portanto não interessa ao estudo da Estatística. Capítulo 2 É qualquer conjunto de elementos ou indivíduos, com pelo menos uma característica comum ao objeto em estudo. DISTRIBUIÇÃO DE FREQÜÊNCIA Exemplo: 2.1 — DADOS ESTATÍSTICOS ¾ A população de alturas dos candidatos ao concurso de AFRF/2000; ¾ A população de escolas de estatística no Brasil em 2000; ¾ A população de computadores em São Paulo. A população pode ser dita finita ou infinita conforme o número de elementos que possui. Por exemplo a população dos pesos dos candidatos ao concurso do ICMS/2002 é finita. Porém se cada aluno é sorteado e recolocado no conjunto para novo sorteio, teríamos a população de pesos infinita. Na prática consideramos como infinitas aquelas populações com número de elementos muito grande. 1.5 — CENSO O censo é o processo que consiste no exame de todos os elementos da população. Na prática, a coleta de dados sobre a população requer: I — Disponibilidade de tempo III — Precisão dos dados coletados III — Recursos financeiros IV — Planejamento das etapas de coleta Dados estatísticos são todas as informações levantadas (coletadas) que servirão como base para o estudo e análise estatística e que chamaremos de Dados. 2.2 — DADOS BRUTOS Dados Brutos são dados inicialmente coletados que ainda não foram organizados sistematicamente. 2.3 — ROL Rol é qualquer arranjo de dados brutos em ordem crescente ou decrescente. 2.4 — DISTRIBUIÇÃO DE FREQÜÊNCIA A Distribuição de Freqüência é uma disposição de dados numéricos, de acordo com o tamanho ou magnitude dos mesmos. Neste tipo de série não variam local, tempo e o fato. A distribuição de freqüência pode ser apresentada por valor (único) ou por grupo de escalares (classes), discriminando a freqüência dos mesmos. 3 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Descrevemos a seguir cada coluna: Exemplo: título a) Distribuição de freqüência por valor: a) Classe de Freqüência NOTAS DOS APROVADOS NO AFRF/2000-SP cabeçalho As classes de freqüência são os intervalos em que a variável nota foi agrupada. NOTAS FREQÜÊNCIAS 0 2 1 4 2 5 3 4 4 8 5 3 Os limites de classe são os valores ínfimo e supremo da classe, sendo que o limite inferior ( lI ) o ínfimo da classe e limite superior ( LS ) o supremo da classe. 6 9 Assim teremos: 7 5 O limite inferior da 2ª classe é 20 8 2 O limite superior da 3ª classe é 60 9 8 TOTAL 50 Exemplo: 0 20 - representa as notas desde 0 até quase 20 b) Limites de uma Classe ( lI , LS ) c) Intervalo de classe (amplitude de classe) – FONTE: ALUNO rodapé b) Distribuição de freqüência por classe: É a diferença entre o limite superior real da classe e o limite inferior real da classe. h = LS – lI NOTAS DOS APROVADOS NO AFRF/2000-SP NOTAS classes h FREQÜÊNCIAS 0 20 10 20 40 15 40 60 50 60 80 20 80 100 5 TOTAL Obs: Quando o limite inferior da classe coincide com o limite superior da classe anterior, ele é chamado de limite real. Caso contrário será chamado de limite aparente, e o limite real será a média aritmética entre eles. d) Amplitude Total ( 100 FONTE: ALUNO Obs.: E —––| I I |—–– E I |—––| I E –––– E AT ) É a diferença entre o maior valor e o menor valor da amostra. No exemplo acima: AT = 100 – 0 = 100. E ® Excluindo I ® Incluindo e) Ponto médio da classe 2.5 - ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA É a média aritmética entre o limite inferior real e o limite superior real A Tabela abaixo representa as notas de100 alunos aprovados no concurso de AFTN/94 em São Paulo. NOTAS DOS ALUNOS APROVADOS NO CONCURSO AFTN/94-SP NOTAS f Xi Freq. Acumuladas Abaixo de A partir de Fr 0 20 10 10 10 100 0,10 10% 40 15 30 25 90 0,15 15% 40 60 50 50 75 75 0,50 50% 60 80 20 70 95 25 0,20 20% 80 100 5 90 100 5 0,05 5% 1,00 100% 100 lI + L S 2 Fr(%) 20 TOTAL Xi = f) Freqüência absoluta simples ( fi ) Freqüência absoluta é o número de observações que ocorreram em determinada classe. No exemplo acima a Freqüência absoluta ou simplesmente Freqüência da 3ª classe é 50. 4 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA g) Freqüência Total ( N ) NORMAS PARA APRESENTAÇÃO TABULAR DE DADOS A Freqüência total é a soma de todas as freqüências absolutas. k ∑ fi N= Exemplo: i =1 Título È CANDIDATOS APROVADOS NO AFRF/2000 POR ESTA- k – nº de classes onde A apresentação tabular é a apresentação dos dados (ou resultados) de determinado assunto de modo sintético a fim de se obter uma visão global do que vamos analisar. { DO DO BRASIL fi – Freqüência absoluta da i-ésima classe N – Freqüência total. Cabeçalho → ESTADOS CANDIDATOS MARANHÃO h) Freqüências Acumuladas Freqüência Acumulada Crescente ( ou Freqüência acumulada “abaixo de”, ou Freqüência acumulada “até”) 100 CEARÁ 120 R. G. DO NORTE que representaremos por F + é a soma das freqüênci- PARAÍBA AC 40 110 MINAS GERAIS as absolutas anteriores de uma determinada classe. Por exemplo, na tabela acima, a Freqüência acumulada crescente da 3ª classe é a Freqüência acumulada abaixo de 60 que é 10 + 15 + 50 = 75. Como a classe é do tipo (40 60) poderíamos falar em Freqüência acumulada crescente como sendo a Freqüência acumulada até 60, que é: 10 + 15 + 50 = 75. 50 PIAUÍ 80 SÃO PAULO 200 RIO DE JANEIRO 250 R. G. DO SUL 50 TOTAL Rodapé → Corpo 1000 FONTE : CURSO PRÉ-FISCAL Freqüência Acumulada Decrescente (ou Freqüência acumulada “a partir de”, ou Freqüência acumulada “acima de”) − que representaríamos por F AC é a soma das freqüências absolutas acima de determinado valor de classe. Assim, a Freqüência acumulada decrescente de 3ª classe é a Freqüência acumulada a partir de 40, que dá 75. Se a classe fosse do tipo (40 60) poderíamos falar em freqüência acumu-lada decrescente como sendo freqüência acumulada decrescente acima 40, seria: 50 + 20 + 5 = 75 SÉRIES ESTATÍSTICAS Chamamos de série estatística ao quadro de distribuição de dados estatísticas em função da época, do local ou da espécie do fenômeno. Sendo assim teremos: a) série histórica, ou temporal, ou cronológica Aquela em que a variável é o tempo, permanecendo fixos o local e a espécie do fenômeno. Exemplo: i) Freqüência Relativa ( fr ) É a razão entre a Freqüência absoluta e a Freqüência total EXPORTAÇÕES BRASILEIRAS DE CARROS ENTRE 1997-2001 ANOS f fr = i N ou fr = fi 1997 100 ∑ fi 1999 200 1999 400 2000 500 2001 300 Portanto, a Freqüência relativa da 4ª classe é 20 VALOR (US$ 1 MILHÃO) = 0,20 , podemos repre-sentar a Freqüência re- 100 lativa em porcentagem que seria 20% e a somatória da freqüência absoluta igual a 1ou 100% FONTE: BANCO DO BRASIL 5 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA b) Série territorial, ou geográfica, ou de localização Aquela em que a variável é o local, permanecendo fixos o tempo e a espécie do fenômeno. Exemplo: Primeiramente veremos a representação gráfica de uma distribuição de Freqüência. a) Histograma EXPORTAÇÕES BRASILEIRAS — 2000 PAÍSES DE DESTINO REPRESENTAÇÃO GRÁFICA É a representação gráfica de uma distribuição de Freqüência através de retângulos justapostos de forma que a área de cada retângulo é proporcional à Freqüência da classe que ele representa e as bases de cada retângulo iguais às amplitudes das classes que elas representam. VALOR (US$ 1 MILHÃO) ESTADOS UNIDOS 200 CANADÁ 100 ALEMANHA 150 ITÁLIA 100 Exemplo: INGLATERRA 300 Seja a distribuição de freqüência: FONTE: BANCO DO BRASIL FAC+ FAC– CLASSES fi Xi 0 —— 5 10 2,5 10 130 Aquela em que variam as espécies ou categórica do fenômeno mantendo-se fixos o tempo e o local. 5 —— 6 20 5,5 30 120 6 —— 7 40 6,5 70 100 Exemplo: 7 —— 8 20 7,5 90 60 c) Série categórica, ou específica REBANHO BRASILEIRO ESPÉCIE 8 —— 9 10 8,5 100 40 9 —— 10 30 9,5 130 30 QUANTIDADE (1.000 CABEÇAS) BOVINOS 5.000 SUÍNOS 9.000 OVINOS 2.000 CAPRINOS 1.000 Total 130 Então teremos o histograma: 40 FONTE: MINISTÉRIO DA ECONOMIA 30 d) Série conjugada Chamamos de séries conjugadas aquelas onde são cruzados 2 (dois) ou mais tipos de séries, podendo ter, assim, duas ou mais entradas. 20 10 Exemplo: POPULAÇÃO DE CÃES BRASILEIROS (100 UNIDADES) UNID. DA FEDERAÇÃO ANOS 1998 1999 2000 2001 AMAZONAS 100 150 200 90 MARANHÃO 30 400 300 350 ----------------- ------ ----- ------ ------ ----------------- ------ ----- ------ ------ 195 ------ ------ SÃO PAULO ----------------- ------ ------ ------ ------ ----------------- ------ ------ ------ ------ ----------------- ------ ------ ------ ------ ------------------ ------ ------ ------ ------ 0 5 6 7 8 9 10 classes b) Polígono de freqüência É o gráfico obtido quando se une os pontos médios das bases superiores dos retângulos de um histograma, através de segmentos de retas consecutivos Exemplo: O polígono de Freqüência no exemplo anterior seria: 40 30 20 FONTE: IBGE A tabela acima é chamada de dupla entrada, pois podemos consultá-la no sentido horizontal ou no sentido vertical. 10 0 2,5 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10 classes 6 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA obs: Para finalmente fechar o polígono de Freqüência devemos unir os pontos do polígono aos pontos médios das classes anterior e posterior supostas, até atingir os limites e superfícies correspondentes. c) Ogivas Decrescentes É o gráfico construído através da freqüência acumulada decrescente. c) Ogivas Crescentes É o gráfico construído através da freqüência acumulada crescente. . 130 130 120 100 100 90 70 60 40 30 30 10 0 5 6 7 8 9 10 classes 0 5 6 7 8 9 10 classes Obs.: Orgivas Crescentes e Decrescentes se cruzam na mediana. 7 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA GRÁFICOS DE SÉRIES ESTATÍSTICAS Anotações: a) Gráfico de Barras (ou colunas) São gráficos que utilizam barras horizontais ou verticais para representar a magnitude dos dados estatísticos. Exemplo: Produção de carros 2000 - São Paulo Espécie Produção (mil) Caminhão Fusca Gol BMW 1.000 10.000 4.000 1.000 10.000 4.000 1.000 1.000 Caminhão Fusca Gol BMW Obs.: Pode também ser feito na vertical. b) Gráficos Pictóricos São gráficos que utilizam figuras para representar a magnitude dos dados. c) Gráficos de Setores São gráficos que evidenciam uma parte do todo. Exemplo: Aprovados no INSS/2002 Estados RJ SP MG RS CE Aprovados 50 500 150 200 100 Fonte: ESAF Modo de Calcular: RJ 1.000 —– 360º 50 —— X X = 18º CE MG RS RJ SP 8 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 3.2.1 – Capítulo 3 MÉDIA ARITMÉTICA PARA DADOS NÃO AGRUPADOS MEDIDAS DE POSIÇÃO 3.1 –INTRODUÇÃO No caso dos dados não estarem agrupados em uma distribuição, teremos a fórmula semelhante à da definição. Exemplo 1: As medidas de posição irão nos mostrar como estão concentrados os nossos dados. Essas medidas dividem-se em medidas de tendência central, que se caracterizam pelo fato dos dados tenderem a se concentrar em valores centrais, e as medidas conhecidas como separatrizes. Sendo assim teremos: Média Aritmética Medidas de tendência Central MEDIDAS DE POSIÇÃO X= 105 + 102 + 108 + 104 + 106 + 107 + 103 7 X= 735 7 X = 105 pães Mediana Moda Mediana quartis Separatrizes Sabendo que a produção de pães diária em uma padaria, durante uma semana foi, 105, 102, 108, 104, 106, 107 e 103 pães, temos a produção média da semana como: centis Exemplo 2: O número de filhos de 5 funcionários de uma empresa é 1, 9, 2, 8 e 0 filhos, temos que a média de filhos, nesse escritório, é X= 1+ 9 + 2 + 8 + 0 5 X= 20 5 percentis Inicialmente veremos as medidas de tendência central. 3.2 –MÉDIA ARITMÉTICA ( X ) Chamamos de média aritmética a razão entre a soma dos dados assumidos pela variável e o número de dados considerados. Sendo assim temos: n ∑ Xi X= i =1 n X = 4 filhos 3.2.2 — DESVIO EM RELAÇÃO À MÉDIA ARITMÉTICA Chamamos de desvio em relação à média aritmética, ou simplesmente de desvio em relação à média, a diferença entre cada valor observado da variável e a sua média aritmética. Isto é, Sendo X1, X2, X3, ........, Xn, os dados observados da variável e X a respectiva média aritmética, E os desvios em relação a média como sendo: d1 = X1 – X onde: X – média aritmética Xi – os valores observados da variável n – número de valores d2 = X2 – X d3 = X3 – X ................. ................. n Obs: Anotação ∑ X i significa a soma de todos os valo- i=1 res Xis para i variando de 1 até n. Isto é, n ∑ X i = X1 + X2 + X3 +...............+ Xn i=1 Teremos; dn = X n – X d i = Xi − X Onde di é o desvio do i-ésimo dado em relação à média aritmética. 9 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo 3: Exemplo 5: Considerando, o exemplo 1, teremos: Considerando o exemplo 3, temos: d1 = 0 X1 = 105, X2= 102, X3 = 108, X4 = 104, X5 = 106, X6 = 107, X7 = 103 d 2 = –3 X = 105 d3 = 3 Então: d 4 = –1 d1 = X1 – X = 105 –105 \ d1 = 0 d5 = 1 d2 = X2 – X = 102 –105 \ d2 = –3 d6 = 2 d3 = X3 – X = 108 –105 \ d3 = 3 d 7 = –2 d4 = X4 – X = 104 –105 \ d4 = –1 7 d5 = X5 – X = 106 –105 \ d5 = 1 d6 = X6 – X = 107 –105 \ d6 = 2 d7 = X7 – X = 103 –105 \ d7 = –2 ∑ di = 0 i =1 Exemplo 6: Considerando o exemplo 4, temos: Exemplo 4: d 1 = –3 Considerando o exemplo 2 , temos: d2 = 5 d 3 = –2 X1 = 1, X2 = 9, X3 = 2, X4 = 8, X5 = 0 e X = 4 d1 = X1 – X \ d1 = 1 – 4 \ d1 = –3 d2 = X 2 – X \ d2 = 9 – 4 \ d2 = 5 d3 = X3 – X \ d3 = 2 – 4 \ d3 = –2 d4 = X 4 – X \ d4 = 8 – 4 \ d4 = 4 d4 = 4 d 5 = –4 5 ∑ di = 0 i =1 2ª. PROPRIEDADE d5 = X5 – X \ d5 = 0 – 4 \ – d5 = 4 Somando-se (ou subtraindo-se) uma constante (K) a todos os valores de uma variável, a nova média aritmética se altera, fica aumentada (ou diminuida) da constante ( K ) Isto é: Yi = Xi ± K 3.2.3 – PROPRIEDADES DA MÉDIA ARITMÉTICA Se Salientamos que este ponto é muito freqüente em provas de concursos públicos. Exemplo 7: 1ª. PROPRIEDADE A soma de todos os desvios em relação à média aritmética é sempre igual a zero. Isto é: então Y=X±K Suponha que o padeiro do exemplo 1 resolve aumentar a produção diária da sua padaria em mais 10 pães por dia. Assim, temos: X1 = 105, X2 = 102, X3 = 108, X4 = 104, X5 = 106, X6 = 107, X7 = 103 aumentando em 10 pães por dia, teríamos: ∑ di = 0 i =1 ∑ (X1 – X) = 0 n n OU i =1 Y1 = 115, Y2 = 112, Y3 = 118, Y4 = 114, Y5 = 116, Y6 = 117, Y7 = 113 Observe que Yi = Xi + 10, logo Y = X + 10 \ Y = 105 + 10 Y = 115 pães 10 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo 8: Suponhamos que cada funcionário do exemplo 2 tivesse mais 3 filhos, então: X1 = 1, X2 = 9, X3 = 2, X4 = 8, X5 = 0 3.3.1- CONSIDERE OS DADOS AGRUPADOS EM Aumentando em mais 3 filhos, cada funcionário, teríamos Y1 = 4, Y2 = 12, Y3 = 5, Y4 = 11, Y5 = 3 Y = 4+3 \ UMA DISTRIBUIÇÃO DE FREQÜÊNCIA ABAIXO: VALORES (Xi) Observe que Yi = Xi + 3 Logo Y = X + 3 \ 3.3 –MÉDIA ARITMÉTICA PARA DADOS AGRUPADOS Y = 7 filhos 3ª. PROPRIEDADE Multiplicando-se (ou dividindo-se) por uma constante ( K ), todos os valores de uma variável, a nova média aritmética se altera, fica multiplicada (ou dividida) pela constante. FREQÜÊNCIA ABSOLUTA (fi) X1 f1 X2 f2 X3 . . . . f3 . . . . Xk fk K Isto é: ∑ fi Total Se Se Yi = K • Xi Xi Yi = K então Y =K⋅ X então X Y= K (K ¹0) i=1 Então a média aritmética da distribuição acima terá a seguinte fórmula: K ∑ Xi fi Exemplo 9: X = Suponha que o padeiro gostaria de dobrar a produção diária de pães, então teríamos: ∑ fi X1 = 105, X2 = 102, X3 = 108, X4 = 104, X5 = 106, X6 = 107, X7 = 103 dobrando a produção diária, teríamos: Y1 = 210, Y2 = 204, Y3 = 216, Y4 = 208, Y5 = 212, Y6 = 214, Y7 = 206 Observe que Yi = 2 • Xi Logo Y = 2 • X \ Y = 2 • 105 \ Y = 210 pães Exemplo 10: Suponhamos que os funcionários do exemplo 2 triplicassem o nº de filhos, daí, X1 = 1, X2 = 9, X3 = 2, X4 = 8, X5 = 0 i=1 K i=1 A partir desse ponto iremos suprimir os índices no símbolo de somatório para facilitar a notação, sendo assim, teremos: Xi fi ∑ X= ∑ fi ou ∑ X i fi N Exemplo 11: Consideremos a distribuição do número de filhos de uma determinada classe de alunos NÚMEROS DE FILHOS ( Xi ) Triplicando o nº de filhos, teríamos: X= ALUNOS ( fi ) Y1 = 3, Y2 = 27, Y3 = 6, Y4 = 24, Y5 = 0 0 5 1 10 Observe que: Yi = 3 • Xi 2 20 3 10 4 5 Total 50 Logo Y = 3 • X \ Y =2•4 \ Y = 12 filhos 11 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Então o método mais fácil de se calcular a média é fazer mais uma coluna Xi fi , isto é: fi Xi Xi fi 0 5 0 1 10 10 2 20 40 3 10 30 4 5 20 50 100 Total X = e ∑ Xi ⋅ fi ∑ fi Classes L1 f1 l2 L2 f2 L3 f3 . . . . Lk fk . . . . logo 100 ∴ X = 2 filhos 50 Freqüências aparentes ( fi ) l1 l3 ∑ fi = 50, ∴ X = AGRUPADOS ABAIXO CONFORME UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE Então, temos: ∑ Xi fi = 100 3.3.2 - CONSIDEREMOS AGORA OS DADOS lk ∑ fi Total Exemplo 12: Considere as notas de 100 alunos aprovados em concurso público. NOTAS ( Xi ) Então a média aritmética para a distribuição de freqüência em classe acima terá a seguinte fórmula: X ALUNOS ( fi ) 2 15 4 18 6 47 8 15 9 5 Total onde Xi — ponto médio da i-ésima classe. Exemplo 13: Considere as alturas de 50 indivíduos de uma empresa, conforme a distribuição abaixo: 100 Alturas (cm) Então vamos considerar mais uma coluna de Xifi Xi fi Xi fi 2 15 30 4 18 72 6 47 252 8 15 120 9 5 45 100 549 Total 150 160 5 160 170 10 170 180 20 180 190 10 190 200 5 50 Então o método mais fácil é considerar duas colunas, dos pontos médios ( Xi ) e do produto do ponto médio pela freqüência absoluta ( Xi fi ), isto é, Classe X = ∑ ∑ fi Xi ⋅ fi e ∑ fi = 100, ∴ X = Indivíduos ( fi ) Total Logo: ∑ Xi fi = 549 X i fi ∑ = ∑ fi logo 549 ∴ X = 5,49 100 fi Xi Xifi 150 160 5 155 775 160 170 10 165 1.650 170 180 20 175 3.500 180 190 10 185 1.850 190 200 5 195 975 50 X Total 8.750 12 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Temos, então: ∑ Xi fi = 8.750 X = ∑ Xi ⋅ fi ∑ fi ∑ fi = 50, e ∴ X = 8.750 ∴ 50 Onde X0 é uma constante arbitrária escolhida convenientemente entre os valores dos pontos médios, geralmente o da classe que possui a maior freqüência. Através da relação acima podemos chegar a seguinte fórmula: logo X = 175 cm X = X0 + ∑ (Yi ⋅ fi )h ∑ fi Exemplo 14: Exemplo 15: Considere os salários de 100 funcionários de uma empresa, conforme a distribuição abaixo: Salários Mínimos ( S.M.) Funcionários ( fi ) Vamos considerar o exemplo 13 Alturas (cm) Indivíduos ( fi ) Xi 0 2 20 150 160 5 155 2 4 40 160 170 10 165 20 170 180 20 175 190 10 185 200 5 195 4 6 6 8 15 180 8 10 5 190 Total Total 100 Considerando então mais duas colunas, dos pontos médios (Xi ) e do produto do ponto médio pela freqüência absoluta ( Xi fi ), temos: Classe (SM) fi Xi 0 2 20 1 20 2 4 40 3 120 4 6 20 5 100 6 8 15 7 105 8 10 5 9 45 Total Xifi 100 ∑ Xi fi = 390 X = ∑ Xi ⋅ fi ∑ fi Observando a coluna de pontos médios (Xi), temos que o ponto médio da classe de maior freqüência é o valor 175, portanto X0= 175 e h = 10 (intervalo de classe). Logo os valores de Yi , serão: Y1 = Y2 = Y3 = e ∑ fi = 100, ∴ X = X1 − X 0 h logo 390 100 Y4 = Y5 = ∴ X 2 − X0 h 390 Temos, então: 50 X3 − X0 h X 4 − X0 h X5 − X0 h Y1 = ∴ Y2 = ∴ Y3 = ∴ Y4 = ∴ Y5 = 155 − 175 10 165 − 175 10 175 − 175 10 185 − 175 10 195 − 175 10 ∴ Y1 = −2 ∴ Y2 = −1 ∴ Y3 = 0 ∴ Y4 = 1 ∴ Y5 = 2 X = 3,9 salários mínimos Logo, vamos construir a tabela de cálculos 3.3.3 – PROCESSO BREVE PARA CÁLCULO DA Classes MÉDIA ARITMÉTICA Como geralmente o cálculo da média aritmética em distribuição de freqüência por classe é trabalhoso, inventaram um processo, que consiste em mudar a variável original X por outro Y, de modo que obedeça a seguinte relação: Yi = Xi − X 0 h fi Xi Yi Yifi 150 160 5 155 –2 –10 160 170 10 165 –1 –10 170 180 20 175 0 0 180 190 10 185 1 10 190 200 5 195 2 10 Total 50 0 13 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Temos, então: ∑ Yi ⋅ fi = 0 X 0 = 175 ∑ (Yi ⋅ fi )h X = X0 + ∑ fi X = X0 + ∑ fi = 50 → X = 175 + 0 Como : X 0 = 3, h = 2, 50 Temos : X = 3 + X = 175 cm X = 3 + 0,9 ∴ 45 ⋅ 2 100 ∑ (Yi ⋅ fi )h ∑ fi ∑ (Yi ⋅ fi ) = 45, ∑ fi = 100 → X =3+ 90 100 X = 3,9 salários mínimos Exemplo 16: Consideremos o exemplo 14: OBSERVAÇÕES IMPORTANTES SOBRE A MÉDIA ARITMÉTICA Classe (SM) fi Xi 0 2 20 1 2 4 40 3 4 6 20 5 6 8 15 7 8 10 5 9 100 X Total 1) A média sofre influência de valores extremos (pequenos ou grandes) da distribuição. 2) Quanto à propriedade 1, observe que a soma dos desvios em relação à média aritmética tem a seguinte notação: Analogamente teremos X0 = 3, h = 2 Y1 = Y2 = Y3 = Y4 = Y5 = X1 − X 0 h X 2 − X0 h X3 − X0 h X 4 − X0 h X5 − X0 h ∴ Y1 = ∴ Y2 = ∴ Y3 = ∴ Y4 = ∴ Y5 = 1− 3 2 3−3 2 5−3 2 7−3 2 9−3 2 ∴ Y1 = −1 ∴ Y2 = 0 ∴ Y3 = 1 ∴ Y4 = 2 • Sdi = 0 ou S (Xi – X ) = 0 para dados não agrupados. • Sdifi = 0 ou S (Xi – X ) • fi = 0 para dados agrupados. 3) O processo breve pode ser usado no caso dos dados não estarem agrupados em uma distribuição de freqüência por classe, basta fazer h = 1. 4) A média aritmética representa o centro de massa dos dados. 5) A média aritmética, no caso de dados agrupados, é a média ponderada pelas freqüências absolutas. ∴ Y5 = 3 Construindo a tabela de cálculo temos: Classes (SM) fi Xi Yi Xifi 0 2 20 1 –1 –20 2 4 40 3 0 0 4 6 20 5 1 20 6 8 15 7 2 30 8 10 5 9 3 15 Total 100 45 14 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo 20 Capítulo 4 Vamos considerar a distribuição do exemplo 12. MODA (MO ) Notas (Xi) Chamamos de moda o valor ou atributo que ocorre com maior freqüência em uma distribuição. Por exemplo, a nota modal dos alunos de um concurso é a nota mais comum, isto é, a nota que a maioria dos alunos obtiveram. 4.1 - MODA PARA DADOS NÃO AGRUPADOS Quando temos série de valores não agrupados, a moda é facilmente encontrada, pois pela definição, basta encontrar o valor que mais se repete. Exemplo 17 4, 2, 6, 4, 3, 5, 7, 9, 4, 10, 8, 4, 3, 2, 4 Mo = 4. (unimodal) Exemplo 18 3, 2, 3, 4, 5, 3, 4, 2, 3, 2, 5, 2. Neste caso são dois valores (2 e 3) que mais se repetem, e na mesma quantidade. Portanto, dizemos que a distribuição possui duas modas iguais a 2 e 3, e chamamos de bimodal. Exemplo 18.1 1, 2, 3, 0, 7, 3, 2, 5, 1, 9, 15 Mo = 1 Mo = 2 Mo = 3 (multimodal) Exemplo 18.2 2, 0, 1, 3, 4, 15, 7 Não existe Moda (amodal) 2 15 4 18 6 47 8 15 9 5 Observamos que o valor da nota 6 possui a maior freqüência (47), portanto a nota modal é 6. 4.2.2 — MODA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE Quando os dados estiverem agrupados em distribuição de freqüência por classe, a moda estará evidentemente na classe que possui a maior freqüência (classe modal). Se os dados forem agrupados em classe, perdemos o conhecimento dos dados e os respectivos cálculos da média, da moda e da mediana, nesse caso, fazemos uma estimativa entre os limites inferiores e superiores da classe da mesma. No caso da moda, existem 3 métodos de cálculo da moda: a) MODA BRUTA 4.2 - MODA PARA DADOS AGRUPADOS 4.2.1 – Alunos ( fi ) Chamaremos de moda bruta ao ponto médio da classe modal (classe que contém a maior freqüência). MODA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA. Sendo assim teremos uma fórmula para a moda bruta: Quando os dados estiverem agrupados em uma distribuição de freqüência de valores, para acharmos a moda basta observar qual é o valor da variável que possui a maior freqüência. Exemplo 19 Vamos considerar a distribuição do exemplo 11. M0 = onde: li* — li* + L* 2 limite inferior da classe modal L* — limite superior da classe modal Número de filhos (Xi) Alunos ( fi ) Exemplo 21 0 5 1 10 2 20 Alturas (cm) 3 10 150 160 5 160 170 10 170 180 20 180 190 10 190 200 5 4 5 Observamos que o valor 2 filhos possui a maior freqüência (20), logo a moda é 2 filhos Vamos considerar a distribuição do exemplo 13 Indivíduos (fi) 15 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Temos que a classe modal é a classe 170 180, logo li* = 170 e L* = 180 e a moda bruta será: li* + L* M0 = 2 → M0 = 170 + 180 ∴ M 0 = 175 cm 2 Exemplo 22 Vamos considerar a distribuição do exemplo 14 Salários Mínimos (SM) Funcionários (fi) 0 2 20 2 4 40 4 6 20 6 8 15 8 10 5 logo, classe modal: 2 Moda bruta: M0 = 4 li* = 2 Então, temos: Classe modal: 170 li* = 170, h* = 180 –170 = 10 fmax = 20, fant = 10 fpos=10 logo: M0 = li* + M0 = 170 + M0 = 170 + L* = 4 2+4 ∴ M0 = 3 salários mínimos 2 180 [ f max − f ant ]⋅ h* [ f max − f ant ] + [f max [ 20 − 10 ]⋅ 10 [ 20 − 10 ] + [ 20 − 10 ] − f post ] 10 ⋅ 10 → M0 = 170 + 5 ∴ M 0 = 175 cm 10 + 10 Exemplo 24 Vamos considerar a distribuição do exemplo 14 b) MODA DE CZUBER Salários Mínimos (SM) Trata-se que uma estimativa, na classe modal, através de uma regra de três, que resulta na seguinte fórmula: l M 0 = i* + [ f max − f ant ]⋅ h* [ f max − f ant ] + [f max − f post ] 0 2 20 2 4 40 4 6 20 6 8 15 8 10 5 Classe modal: 2 onde: li* – é o limite inferior da classe modal fmax – é a freqüência absoluta máxima (freqüência de classe modal) fant – é a freqüência absoluta anterior à classe modal fpost – é a freqüência posterior à classe modal h* h* = 4 – 2 = 2 fmax = 40 fant = 20 fpost = 20 M0 = li* + Vamos considerar a distribuição do exemplo 13. Alturas (cm) Indivíduos (fi) 150 160 5 160 170 10 170 180 20 180 190 10 190 200 5 4 li* = 2 – intervalo da classe modal Exemplo 23 Funcionários (fi) M0 = 2 + [ f max − f ant ]⋅ h* [ f max − f ant ] + [f max [ 40 − 20 ] ⋅ 2 [ 40 − 20 ] + [ 40 − 20 ] − f post ] M 0 = 3 salários mínimos 16 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA c) MODA DE KING b) MODA CZUBER A fórmula da moda de King é também uma estimativa na classe modal, mas não considera a freqüência absoluta da classe modal. * M0 = l i + freqüências A f post ⋅ h* B D C f ant + f post Exemplo 25 li* Considerando os dados do exemplo 13 temos: li* = 170 fant = 10 fpost = 10 M0 = 170 + Classes Moda de Czuber Para achar a moda de Czuber no histograma acima, basta descer uma perpendicular, a partir da intersecção dos segmentos AD e CB, ao eixo horizontal das classes. h* = 10 M0 = li* + L* c) MODA DE KING f post ⋅ h* freqüências f ant + f post A 10 ⋅ 10 ∴ M0 = 175 cm 10 + 10 B D D` C 4.3. DETERMINAÇÃO GRÁFICA DA MODA li* Podemos determinar graficamente a posição da moda no histograma da distribuição de freqüência absoluta, como veremos a seguir. Classes L* C´ a) MODA BRUTA Moda de King Para achar a moda de King no histograma acima, basta unir os pontos D’C’ e verificar a intersecção com o eixo freqüências horizontal, onde D’ A B li* = DL* e L*C’= C li* 4.4. A MODA NA CURVA DE FREQÜÊNCIA. Na curva de freqüência, a moda será o valor que corresponde, no eixo horizontal, ao ponto de freqüência máxima (vertical). f li*↑L* classes UNIMODAL (UMA MODA) Moda bruta (Mo) Para achar a moda bruta no histograma acima basta descer uma perpendicular, a partir do ponto médio do segmento AB, ao eixo horizontal das classes. Mo x 17 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA f Capítulo 5 MEDIANA (MD) BIMODAL (DUAS MODAS) --- A mediana é outra medida de posição, que representa o valor que divide a distribuição em dois conjuntos com o mesmo número de elementos. M01 M02 x 5.1. MEDIANA PARA DADOS NÃO AGRUPADOS X = Md A definição é bem clara e fácil de ser interpretada no caso de dados não agrupados. Exemplo 26 MULTIMODAL Dado a série de valores 4, 12, 10, 3, 15, 5, 14, 8, 7 Mo1 Mo2 Mo3 x X = Md f ANTIMODAL ou AMODAL a mediana será fácil de ser identificada após encontrarmos o Rol. Rol: 3, 4, 5, 7, 8, 10, 12, 14, 15. Agora veremos qual é o valor central que divide a distribuição de forma que tenha o mesmo nº de elementos à esquerda e à direita desse valor. Logo a mediana é 8 (Md = 8), pois temos quatros valores abaixo de 8 e quatro valores acima de 8. Observe que no exemplo acima havia 9 valores, e nove é um número ímpar. x OBS.: 1. Em uma distribuição simétrica e unimodal a Média Aritmética é igual a moda e igual a Mediana. 2. Em uma distribuição simétrica e bimodal apenas a Média Artimética e a Mediana são iguais. 3. Em uma distribuição simétrica e multimodal a Média Artimética e a Mediana são iguais e coincidem apenas como uma das modas. Portanto, se o rol tem um número ímpar de dados a mediana será justamente o termo central. Se, porém, houvesse um número par de dados, a mediana, seria então valor entre os dois termos centrais, e por convenção adotamos a mediana como sendo a média aritmética entre os dois termos centrais. Exemplo 27 Dada a série de valores 6, 4, 10, 5, 12, 3, 20, 7 Existem 8 dados, como o número de dados é par, existem dois termos centrais no Rol. Rol: 3, 4, 5, 6, 7, 10, 12, 20 ↑↑ termos centrais Logo a mediana será: Md = 6+7 2 Md = 6,5 18 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA RESUMINDO • Nota Se a série possui n elementos teremos: Se n for ímpar, existe um termo central no rol e este termo central do rol será justamente a mediana, que será calculada como sendo o a) n +1 termo de ordem do rol. 2 b) Se n for par, existem dos termos centrais no rol, e a mediana será a média aritmética entre esses termos centrais, que será calculado como sendo a média aritmética entre os termos de ordem freqüência freq. Acum. 6 10 10 7 15 25 8 2 27 9 14 41 10 10 51 TOTAL 51 X Observamos então, na coluna de freqüência acumulada, que o 26º elemento do rol é 8, logo Md = 8. Se a freqüência total (N) fosse par, procederíamos da seguinte forma, n n e +1 2 2 Portanto no exemplo 26, temos n = 9 (ímpar), logo, a Exemplo 29 Nº de aprovados em um concurso, por nota ⎛ n +1 ⎞ mediana será o 5º termo do rol ⎜ 2 ⎟ , isto é, Md = 5º ⎝ ⎠ termo do rol = 8. Nota Aprovados No exemplo 27, termos n = 8 (par), logo a mediana será a 6 10 ⎞º + 1⎟⎟ ⎠ 7 15 8 1 9 14 10 10 TOTAL 50 média aritmética entre o 4º e 5º termo do rol ⎛ ⎜ ⎜ ⎝ n 2 ⎞º ⎟ e ⎟ ⎠ ⎛ ⎜ ⎜ ⎝ n 2 6+7 Md = = 6,5 2 5.2. MEDIANA PARA DADOS AGRUPADOS 5.2.1. MEDIANA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR VALOR Nota Vamos ver esta situação através de um exemplo. Exemplo 28 Nº DE APROVADOS EM UM CONCURSO, POR NOTAS NOTA Como a freqüência total (N) é 50, existem dois termos centrais (25º e 26º), logo construindo a freqüência acumulada teríamos. APROVADOS 6 10 7 15 8 2 9 14 10 10 TOTAL 51 Seja N a freqüência total N = freqüência freq. Acum. 6 10 10 7 15 25 8 1 26 9 14 40 10 10 50 TOTAL 50 X Logo, a mediana será a média aritmética entre os termos de ordem ⎛ N ⎞ ⎛ N ⎞ 25º ⎜ + 1 ⎟ , isto é, ⎟ e 26º ⎜ ⎝ 2 ⎠ ⎝ 2 ⎠ ∑ f i , portanto N = 51 apro- vados, isto é, existem 51 dados, como 51 é ímpar existe ⎛ N+1 um termo central, que é o termo de ordem 26 ⎜ ⎝ 2 ⎞ ⎟, ⎠ Md = 7+8 2 Md = 7,5 no rol. Para ser fácil a identificação dele vamos construir a freqüência acumulada crescente. 19 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 5.2.2. MEDIANA PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE N = 25 , então a classe que contém a 2 Daí, N = 50 \ mediana será a classe 170 Quando temos os dados agrupados em uma distribuição de freqüência por classe, teremos que determinar qual será o ponto do intervalo de classe em que está compreendida a mediana. Logo, precisamos achar qual a classe que contém a mediana. Evidentemente a classe que contém a mediana será a que corresponde a freqüência acumulada imediatamente su- ⎛ N ⎞ ⎟. ⎝ 2 ⎠ perior a ⎜ h* = 10 F f* = 20 Md = l i* + AC . ANT ⎡N ⎤ ⎢⎣ 2 – FAC ⋅ ANT ⎥⎦ f* Md = 170 + 5 ∴ = 15 → Md = 170 + [ 25 – 15 ] ⋅ 10 20 Md = 175 cm Exemplo 31 Tudo que foi dito acima está considerado na fórmula abaixo: Considerando os dados do exemplo 14 temos: Salários minímos (SM) Md = l i* + Funcionários ⎡N ⎤ ⎢⎣ 2 – FAC.ANT ⎥⎦ ⋅ h * 0 |—––– 2 20 2 |—––– 4 40 f* 4 |—––– 6 20 6 |—––– 8 15 8 |—––– 10 5 Onde: l * – é o limite inferior da classe que contém a mediana i h* – f* – N – li* = 170 180, logo, o intervalo da classe que contém a mediana a freqüência absoluta da classe que contém a mediana Freqüência total FAC.ANT – Freqüência acumulada crescente anterior à classe que contém a mediana. TOTAL 100 Primeiramente precisamos fazer a freqüência acumulada crescente Salários minímos (SM) Funcionários Freq. Acum. 0 |—––– 2 20 20 Exemplo 30 2 |—––– 4 40 60 Considerando o exemplo 13 4 |—––– 6 20 80 6 |—––– 8 15 95 8 |—––– 10 5 100 Altura (Cm) Indivíduo (fi) 150 160 5 160 170 10 170 180 20 180 190 10 190 200 5 TOTAL TOTAL Daí, N =100 ∴ FAC . ANT = 20 Ìndivíduo (fi) Freq. Acum. 150 160 5 5 160 170 10 15 170 180 20 35 180 190 10 45 190 200 5 50 50 X TOTAL X N = 50 , e então a classe que contém a 2 mediana será a classe 2 50 Primeiramente precisamos fazer a freqüência acumulada crescente. Alturas (Cm) 100 4, logo, li* = 2 h* = 2 f* = 40 ⎡N ⎤ * ⎢⎣ 2 – FAC.ANT ⎥⎦ ⋅ h Md = l i* + f* Md = 2 + Md = 2 + [50 – 20 ] ⋅ 2 40 60 ∴ 40 Md = 3,5 salários mínimos 20 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 5.3. RELAÇÃO ENTRE A MÉDIA ARITMÉTICA, MEDIANA E MODA Capítulo 6 SEPARATRIZES Quando a distribuição for unimodal, isto é, a moda for única teremos a seguinte situação. a) DISTRIBUIÇÃO SIMÉTRICA 6.1. QUARTIS (Q) Chamamos de quartis os valores que dividem a distribuição em quatro partes iguais. X = Md = Mo Logo, teremos três quartis: Primeiro quartil ( Q1 ) será o valor que terá 25% dos dados à sua esquerda e 75% dos dados à sua direita. Isto é, SE A DISTRIBUIÇÃO É SIMÉTRICA E UNIMODAL ENTÃO: X = Md = Mo Segundo quartil ( Q2 ) será o valor que terá 50% dos dados à sua esquerda e 50% dos dados à sua direita. Portanto o segundo quartil é a própria mediana. Terceiro quartil ( Q3 ) será o valor que terá 75% dos dados à sua esquerda e 25% dos dados à sua direita logo. b) DISTRIBUIÇÃO ASSIMÉTRICA NEGATIVA 25% 25% Q1 25% Q2 25% Q3 X < Md < Mo Isto é, Para calcular os quartil, basta, na fórmula da mediana, SE A DISTRIBUIÇÃO É ASSIMÉTRICA NEGATIVA E UNIMODAL ENTÃO: substituir o X < Md < Mo c) DISTRIBUIÇÃO É ASSIMÉTRICA POSITIVA Q K KN N por 2 4 = l i* + ⎤ ⎡ KN ⎢⎣ 4 – FAC.ANT ⎥⎦ ⋅ h* f* onde K = 1, 2, 3, daí teremos: ⎡ ⎤ * ⋅h –F AC.ANT ⎥⎦ * ⎢⎣ 4 Q1 = l + i f* N Mo < Md < X Isto é, SE A DISTRIBUIÇÃO É ASSIMÉTRICA POSITIVA E UNIMODAL ENTÃO: Mo < Md < X ⎡N ⎤ * ⎢⎣ 2 – FAC.ANT ⎥⎦ ⋅ h * Q =l + i 2 f* ⎡ 3N ⎤ * ⎢⎣ 4 – FAC.ANT ⎥⎦ ⋅ h * Q =l + i 3 f* 21 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo 32 Considerando os dados do exemplo 14 Salários minímos (SM) Funcionários Freq. Acum. 0 2 20 20 2 4 40 60 4 6 20 80 6 8 15 95 8 10 5 100 100 X TOTAL Q3 = 4 + Q3 = 4 + KN 100 = = 25. 4 4 li* = 2 4. daí, Q 1 = li* + Q1 = 2 + h* = 2 f* = 40 F AC . ANT = 20 6.2. DECIS (D) Chamamos de decis os valores que dividem a distribuição em dez partes iguais. O primeiro decil ( D1 ) será o valor que terá 10% dos dados à sua esquerda e 90% dos dados à sua direita. [ 25 – 20 ] ⋅ 2 40 O segundo decil ( D2 ) será o valor que terá 20% dos dados à sua esquerda e 80% dos dados à sua direita. Q1 = 2,25 salários mínimos O terceiro decil ( D3 ) será o valor que terá 30% dos dados à sua esquerda e 70% dos dados à sua direita e assim por diante até ... N 100 = = 50 2 2 ∴ Logo, a classe que contém o primeiro quartil será a classe 4. daí, Q 2 = li* + Q2 = 2+ li* = 2 h* = 2 = 20 f* = 40 F AC . ANT ⎡N ⎤ * ⎢⎣ 2 – FAC . ANT ⎥⎦ ⋅ h Nono decil ( D9 ) será o valor que terá 90% dos dados à sua esquerda e 10% dos dados à sua direita. 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% D 1 D 2 D3 D4 D5 D 6 D7 D8 D9 f* obs: [50 – 20 ]⋅ 2 Q2 = 2 + 1,5 40 logo: D K KN 3 × 100 K=3 ∴ = = 75 4 4 logo, a classe que contém o terceiro quartil será a classe 6. daí, Note que o quinto decil ( D5 ), pela definição, coincide com a mediana. \ Q2 = 3,5 salários mínimos Cálculo do terceiro quartil (Q3) 4 30 20 Logo, teremos nove decis: f* Cálculo do segundo quartil (Q2) 2 20 Obs.: A Mediana será sempre igual ao 2º quartil. ⎡N ⎤ * ⎢⎣ 4 – FAC . ANT ⎥⎦ ⋅ h Q1 = 2 + 0,25 \ K=2 [75 – 60 ] ⋅ 2 Q3 = 5,5 salários mínimos Logo, a classe que contém o primeiro quartil será a classe 2 f* Q3 = 4 + 1,5 Cálculo do primeiro quartil (Q1): K =1 ∴ Q 3 = l i* + ⎡ 3N ⎤ * ⎢⎣ 4 – FAC . ANT ⎥⎦ ⋅ h li* = 4 h* = 2 f* = 20 F AC . ANT = 20 = l*+ i ⎡ KN ⎤ –F ⎢⎣ ⎥⎦ ⋅ h* AC.ANT 10 f* Para calcular os decis basta substituir na fórmula da mediana o N KN por . 2 10 22 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo 33 Salários minímos (SM) Funcionários Freq. Acum. 0 2 20 20 2 4 40 60 4 6 20 80 6 8 15 95 8 10 5 100 100 X TOTAL K Salários minímos (SM) KN 9 × 100 K=9 ∴ = = 90 10 10 Logo, a classe que contém o nono decil será a classe 8, daí: li* = 6 h* = 2 f* = 15 F AC . ANT [90 – 80 ]⋅ 2 15 D9 = 6 + 1,33 \ ∴ D9 = 6 + Freq. Acum. 0 2 20 20 2 4 40 60 4 6 20 80 6 8 15 95 8 10 5 100 100 X Vamos calcular, por exemplo, o qüinquagésimo quinto percentil ( P55 ) K = 55 ∴ 20 15 D9 = 7,33 salários mínimos Obs.: A Mediana será sempre igual ao 5º decil. 6.3. PERCENTIS (P) KN 55 × 100 = = 55 100 100 Logo, a classe que contém o qüinquagésimo quinto percentil será a classe 2 F AC . ANT 4, daí: = 20 li* = 2 h* = 2 f* = 40 ⎡ ⎤ – F AC . ANT . ⎥ ⋅ h* ⎦ * ⎢⎣ 100 P55 = li + * 55 N Chamamos de percentis os valores que dividem a distribuição em cem partes iguais. Logo, teremos noventa e nove percentis: O primeiro percentil (P1) será o valor que terá 1% dos dados à sua esquerda e 99% dos dados à sua direita. O segundo percentil (P2) será o valor que terá 2% dos dados à sua esquerda e 98% dos dados à sua direita. E assim por diante até o Nonagésimo nono percentil (P99) que será o valor que terá 99% dos dados à sua esquerda e 1% dos dados à sua direita. Obs: Note que o quinquagésimo percentil (P50), pela definição, coincide com a mediana. Logo: 1% 1% 1% 1% P 1 P2 P3 P4 Funcionários TOTAL = 80 ⎡ 9N ⎤ * ⎢⎣ 10 – FAC . ANT ⎥⎦ ⋅ h D 9 = l i* + f* D9 = 6 + f* Exemplo 34 Calcular o nono decil ( D9 ) 6 = l i* + P ⎡ KN ⎤ * ⎢⎣ 100 – FAC.ANT ⎥⎦ ⋅ h f P55 = 2 + P55 = 2 + [55 – 20 ] ⋅ 2 40 70 40 ∴ P55 = 2 + 1, 75 P55= 3,75 salários mínimos Obs.: A Mediana será sempre igual 50º percentil. Portanto: Q 2 = D 5 = P 50 = Md 1% 1% P8 P99 Para calcular o percentil basta substituir na fórmula da mediana o N KN por 2 100 23 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Capítulo 7 G= OUTRAS MÉDIAS G= 7.1. MÉDIA GEOMÉTRICA (G) 7.1.1. 17 17 1 ⋅ 16 ⋅ 243 ⋅ 4096 15925248 ∴ G = 2,65 7.2. MÉDIA HARMÔNICA (H) MÉDIA GEOMÉTRICA PARA DADOS NÃO É o inverso da média aritmética dos inversos dos dados. AGRUPADOS Sejam X1, X2, X3, ..., Xn dados não agrupados, então a média geométrica será G=n X 1 ⋅ X 2 ⋅ X 3 ⋅ LL X n 7.2.1. MÉDIA HARMÔNICA PARA DADOS NÃO AGRUPADOS Sejam X1, X2, X3, ........., Xn, dados não agrupados. Então a média hamônica será: n H= n ∑ X1i Exemplo 1 Calcular a média geométrica dos dados: 2, 8, 4, 16, 1. G= G= G= i =1 Exemplo 4 5 2 ⋅ 8 ⋅ 4 ⋅ 16 ⋅ 1 ∴ 5 Calcule a média harmônica dos dados: 2, 3, 4, 1. H= 21 ⋅ 2 3 ⋅ 2 2 ⋅ 2 4 ⋅ 2 0 ∴ 5 2 10 G = 22 ∴ H= G=4 2⋅6⋅8 → 3 G= 96 \ G = 4,5 AGRUPADOS G= X f1 1 4 6 + 4 + 3 + 12 12 H = 1,92 MÉDIA HARMÔNICA PARA DADOS N H= K f ∑ Xii MÉDIA GEOMÉTRICA PARA DADOS N H= ∴ Observe que é necessário o uso de máquina de calcular. 7.1.2. ∴ AGRUPADOS Calcular a média geométrica de 2,6,8. 3 4 × 12 25 7.2.2. Exemplo 2 G= 4 1 1 1 + + +1 2 3 4 i=1 Exemplo 5 f2 ⋅ X2 ⋅ LL X fK K Exemplo 3 Calcular a média geométrica Xi fi f X i i 1 2 3 2 4 5 1 16 243 4 6 4.096 TOTAL 17 H= Xi fi 1 2 1 Xi fi Xi 1 2 2 4 0,5 2 3 6 0,33 2 4 5 0,25 1,25 TOTAL 17 N fi ∑ Xi → H= 7,25 17 ∴ 7 , 25 H = 2,34 Observação importante: H ≤ G ≤ X 24 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] Exemplos: Capítulo 8 a) X: 10, 10, 10, 10, 10 MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE AT = 10 - 10 AT = 0 (Dispersão nula) b) Y: 8, 9, 10, 11, 12 8.1. DISPERSÃO OU VARIABILIDADE Já aprendemos que um conjunto de dados pode ser resumido a alguns parâmetros de posição, como: a média aritmética, a mediana e a moda, que através de suas características resumem informações importantes sobre todo o conjunto. AT = 12 - 8 AT = 4 c) Z: 2, 3, 10, 15, 20 AT = 20 - 2 AT = 18 Porém não é o bastante para as medidas de posições, representarem os dados, pois faltaria a idéia de concentração (grau de homogeneidade ou heterogeneidade) que existem entre os dados do conjunto. Observamos, então, que a maior dispersão é da variável Z (AT = 18), e a menor dispersão é da variável X (AT = 0). Por exemplo: 8.2.2. DISTRIBUIÇÃO DE FREQÜÊNCIA. X: 10, 10, 10, 10, 10 Y: 8, 9, 10, 11, 12 AT = XMax – XMin Z: 2, 3, 10, 15, 20 observamos que as médias X, Y e Z são X = 10 , Y = 10 , PARA DADOS AGRUPADOS EM UMA Exemplo: Z = 10 Notamos então, que apesar das três variáveis X, Y, Z terem a mesma média aritmética, o conjunto X é o mais homogêneo, pois todos os valores são iguais a 10. Prosseguindo então, o conjunto Y é mais heterogêneo que o X, isto é, os dados do conjunto Y são mais dispersos (tem maior dispersão ou variabilidade) que os dados da variável X. Daí, temos que, a dispersão de Z é maior que a dispersão de Y, que é mais disperso que X. Xi fi 0 1 2 3 4 5 8 10 15 20 AT = 4 – 0 AT = 4 8.2.3. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR Outro exemplo característico é aquele em que dois indivíduos saem para jantar e, um deles come um leitão inteiro e o outro não come nada. Em média os dois comeram a metade do leitão, cada um. Observe que nesse caso a média aritmética não caracteriza, sozinha a situação, pois a dispersão nesta situação é alta. Sendo assim os dois indivíduos morreriam, um de fome e outro de indigestão. Concluímos então que para caracterizar os dados precisamos simultaneamente das medidas de posição e das medidas de dispersão que estudaremos a seguir. 8.2. AMPLITUDE TOTAL 8.2.1. DADOS NÃO AGRUPADOS Chamamos de amplitude total (AT) a diferença entre o maior e menor valor dos dados AT = XMAX – XMIN CLASSE A amplitude total é a diferença entre o maior limite superior e o menor limite inferior. AT = LMAX– lMIN Classes Freq. Exemplo: 0 2 4 6 2 4 6 8 10 20 30 40 AT = 8 – 0 AT = 8 OBS: A amplitude total não é uma medida conveniente de dispersão, pois considera somente os valores extremos da distribuição. Portanto sua aplicação é limitada. 25 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 8.3. VARIÂNCIA E DESVIO PADRÃO PROPRIEDADES No tópico anterior vimos que a amplitude total sofre influência apenas dos valores extremos, por isso procuramos uma medida de dispersão que considere todos os dados. a) Quando somamos (ou subtraímos) a todos os nossos dados uma constante (k), a variância não se altera, continua a mesma. A variância é uma medida de dispersão que considera o quadrado dos desvios em torno da média aritmética. Assim teremos: b) Quando somamos (ou subtraímos) a todos os nossos dados uma constante (K), o desvio padrão não se altera, continua o mesmo. 2 ∑ (X i – X ) n σ2 = c) Quando multiplicamos (ou dividimos) todos os nossos dados por uma constante (k), a nova variância se altera, fica multiplicada (ou dividida) pelo quadrado da constante. i =1 n Isto é, A variância é a média aritmética dos quadrados dos desvios em torno da média aritmética. Obs: d) Quando multiplicamos (ou dividimos) todos os nossos dados por uma constante (K), o novo desvio padrão se altera, fica multiplicado (ou dividido) pelo valor absoluto da constante. 8.3.1. PARA DADOS NÃO AGRUPADOS a) É fácil mostrar que: ∑ (X i – X ) n 2 n = i=1 ∑ Xi 2 – nX VARIÂNCIA ⎛⎜ σ ⎝ 2 i=1 Portanto podemos escrever a variância como: n σ 2 ∑ X2i = i =1 n 2 – X Fórmula prática b) Quando queremos estimar a variância através de uma amostra, consideramos como estimador não tendencioso da variância a estatística ∑ (X 1 – X ) n S 2 = n–1 2 ∑ (X i – X ) n n 2 ∑ (X i – X ) n σ2 = i =1 (1) n ou n ∑ X i2 σ2 = i =1 – X n 2 (2) DESVIO PADRÃO ( σ ) i =1 Por isso, se criou a medida chamada de desvio padrão (σ), como sendo a raiz quadrada do desvio padrão. i =1 ⎟ ⎠ 2 É fácil observar que se a variância considera o quadrado dos desvios em torno da média, a sua unidade é o quadrado da unidade original. σ= ⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎩ 2 ⎞ n ∑ ou σ = X i =1 n 2 – X 2 ⎧ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎨ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 2 ∑ (X i – X ) n σ= i=1 (3) n ou n ∑ X i2 σ= i =1 n – X 2 (4) 26 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Exemplo: 8.3.2. PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA Vamos aplicar as duas fórmulas para exemplificar. Seja a variável X: 0, 2, 4, 6, 8 ⎧ ⎪ X = 0+2+4+6+8 ⎪ 5 X: 0, 2, 4, 6, 8 ⎪⎪ 20 →⎨ desvios: -4, -2, 0, 2, 4 X = ⎪ 5 desvio quadrado: 16, 4, 0, 4, 16 ⎪ ⎪X =4 ⎩⎪ Pela fórmula 1 2 ∑ (Xi – X ) 2 VARIÂNCIA (σ ) ∑ (X i – X ) n σ 2 = 2 i =1 σ = σ2 = i =1 n 40 5 ou n ∑ X i fi 16 + 4 + 0 + 4 + 16 = 5 σ2 σ2 = 8 ∴ Onde N = Pela fórmula 2 X = ∑ X1 n Xi X i2 0 0 2 4 4 16 6 36 8 64 20 120 20 =4 5 σ 2 σ 2 σ 2 = = n 2 (Freqüência Total) Xi fi 0 10 2 20 4 40 6 20 8 10 100 1ª solução: – Primeiramente calculamos a média aritmética. – X = 24 – 16 ∴ σ 2 Xi fi 0 10 0 2 20 40 4 40 160 6 20 120 8 10 80 Total 100 400 =8 Para calcular o desvio padrão basta saber que o desvio padrão é a raiz quadrada da variância, daí ∴ N – X 2 120 2 –4 5 8 i =1 Exemplo: 2 Logo, vimos que a variância ( σ ) é 8. σ= 2 Vamos calcular a variância usando as duas fórmulas, para exemplificar n ∑ X2i i =1 ∑ fi = Total = i N n 2 ⋅f σ = 2,83 X = ∑ Xi f i N = 400 100 fiXi ∴ X =4 27 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Prosseguimos, no cálculo dos desvios e seus quadrados Xi 0 10 –4 2 20 4 40 6 PARA DADOS AGRUPADOS EM UMA DISTRIBUIÇÃO DE FREQÜÊNCIA POR CLASSE (X i – X )2 (X i – X )2 fi Xi – X fi 8.3.3. 16 160 –2 4 80 0 0 0 20 2 4 80 8 10 4 16 160 Total 100 ( ) 2 VARIÂNCIA σ ∑ (X i – X ) ⋅ f i n σ2 480 2 ∑ (X i – X ) ⋅ f i 2 i =1 = N n σ2 = ou i =1 480 ∴ σ 2 = 4,8 100 → σ2 = N n ∑ X i fi 2ª solução: Como já calculamos a média aritmética, temos: 2 Xi fi Xi f i 2 Xi 0 10 0 0 2 20 4 80 4 40 16 640 6 20 36 720 8 10 64 640 Total 100 2080 σ2 = onde: N = σ N 2 Xi f i i =1 N = 20 , 8 – 16 2 – X ∴ → σ2 = σ 2 Considere as alturas de 50 alunos de uma turma, conforme a distribuição abaixo: 2080 – ( 4 )2 100 Para o cálculo do desvio padrão temos: σ= 2 ⋅f i =1 i 160 5 160 170 10 170 180 20 180 190 10 190 200 5 ou n ∑ X i fi σ= 2 i =1 N – X 2 4,8 ∴ σ = 2,19 Alunos Xi Xi fi 150 160 5 155 775 160 170 10 165 1650 170 180 20 175 3500 180 190 10 185 1850 190 200 5 195 975 Total Para calcular o desvio padrão basta achar a raiz quadrada da variância σ= 50 Para exemplificar vamos resolver pelas duas fórmulas. Primeiramente vamos calcular a média aritmética. Alturas N Alunos 150 Total ∑ (X i – X ) 2 Exemplo: = 4,8 n – X Xi — ponto médio da i-ésima classe Alturas (cm) ∑ 2 i =1 ∑ f i — (Freqüência Total) n σ2 = 2 X = ∑ X i fi N 50 = 8750 8750 ∴ X = 175 cm 50 28 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 1ª solução: 8.3.4. PROCESSO BREVE PARA CÁLCULOS DO DESVIO PADRÃO Prosseguimos no cálculo dos desvios e seus quadrados. Xi – X Altura (cm) Alunos Xi (X i – X )2 (X i – X )2 fi Analogamente ao cálculo do processo breve para a média aritmética, mudamos a variáveis x por y tal que 150 160 5 155 –20 400 2000 160 170 10 165 –10 100 1000 170 180 20 175 0 0 0 180 190 10 185 10 100 1000 onde: Xo – 190 200 5 195 20 400 2000 h – Total 50 6000 2 ∑ (X i – X ) f i n σ 2 = = N 6000 2 ∴ σ = 120 cm 50 2ª solução: Altura (cm) Alunos 2 150 160 5 155 –2 –10 4 20 160 170 10 165 –1 –10 1 10 180 190 10 185 1 10 1 10 190 200 5 195 2 10 4 20 165 27.225 272.250 170 180 20 175 30.625 612.500 180 190 10 185 34.225 342.250 190 200 5 195 38.025 190.125 50 Total 50 n ∑ 1.537.250 σ=h 1.537.250 – (175 ) 2 50 i =1 f Y2 i i N σ 2 = 30.745 – 30.625 ∴ σ 2 = 120 cm Para o cálculo do desvio padrão temos: ∑ (X i – X ) n σ= 2 f i Yi2 0 10 N Yi2 0 170 → σ2 = f i Yi 0 160 2 Yi 0 120.125 – X Xi 175 24.025 ∑ Alunos 20 155 σ2 = Alturas (cm) 180 5 2 i i Xo = 175cm 170 160 X f intervalo de classe X i fi 150 Total é um valor arbitrário 2 Xi Xi h No exemplo anterior teríamos: h = 10 i =1 Xi – Xo y= ⋅f 1=1 i N ⎛ n ⎜ f Y ⎜ i i ⎜ i =1 –⎜ N ⎜ ⎜⎜ ⎝ ∑ σ = 10 60 ⎛ 0 ⎞ –⎜ ⎟ 50 ⎝ 50 ⎠ σ = 10 60 50 σ = 10 1, 20 0 ∴ ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟⎟ ⎠ 60 2 2 σ = 10,95 cm ou n ∑ X i fi σ= 2 i =1 N – X 2 Mas para calcular o desvio padrão basta achar a raiz quadrada da variância. σ= 120 ∴ σ = 10,95 cm 29 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] Anotações: 30 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] CAPÍTULO 9 - TESTES DE ESTATÍSTICA TESTE 1 Calcule a Média Aritmética dos números: 5, 9, 7, 1, 3. a) 5 b) 4 c) 6 d) 7 e) 8 TESTE 6 Calcule a Média Geométrica dos números: 1, 9, 1, 3, 27, 9,3, 3, 1, 1. a) 9 b) 1 c) 3 d) 6 e) 8 TESTE 2 TESTE 7 Calcule a Média Aritmética dos números: 8, 2, 4, 6, 0. a) 4 b) 2 c) 3 d) 5 e) 6 Calcule a Média Harmônica dos números: 2, 4, 6, 8. a) 3,84 b) 3,48 c) 4,83 d) 4,38 e) 8,43 TESTE 3 TESTE 8 Calcule a Média Aritmética dos números: 17, 15, 1, 3, 7, 6, 8, 11, 13. a) 9 b) 8 c) 7 d) 6 e) 5 TESTE 4 Calcule a Média Geométrica dos números: 1, 3, 6, 72. a) 6 b) 5 c) 3 d) 7 e) 4 Calcule a Média Geométrica dos números: 2, 4, 6, 8. a) 4,42 b) 4,78 c) 5,00 d) 6,0 e) 5,52 TESTE 9 Calcule a Média Aritmética dos números: 2, 4, 6, 8. a) 4 b) 5 c) 6 d) 7 e) 8 TESTE 10 TESTE 5 Calcule a Média Geométrica dos números: 25, 1, 5, 125, 1, 1. a) 6 b) 5 c) 4 d) 3 e) 25 Os intervalos de classe podem ser apresentados de várias maneiras. Dentre situações abaixo, a correta é: a) 2 — 6 compreende todos os valores entre 2 e 6, inclusive os extremos. b) 2 I—I 6 compreende todos os valores entre 2 e 6, exclusive os extremos. c) 2 I— 6 compreende todos os valores entre 2 e 6, exclusive o 2 e inclusive o 6. d) 2 —I 6 compreende todos os valores entre 2 e 6, inclusive o 2 e exclusive o 6. e) 2 — 6 compreende todos os valores entre 2 e 6, exclusive os extremos. 31 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Considere a distribuição de freqüência transcrita a seguir para responder às questões 11 e 12. Peso (kg) 2 I— 4 4 I— 6 6 I— 8 8 I— 10 10 I— 12 Freqüência simples Absoluta 9 12 6 2 1 TESTE 13 a) A soma dos pontos médios dos intervalos de classe é inferior à soma das freqüências absolutas simples. b) 28% das observações estão no quarto intervalo de classe. c) Manos de 25 observações têm diâmetro abaixo de 10 cm. d) Mais de 85% das observações têm diâmetro não inferior a 6 cm. e) 75% das observações estão no intervalo 6 I—— 12. TESTE 11 a) 65% das observações têm peso não inferior a 4 kg e inferior a 10 kg. b) Mais de 65% das observações têm peso maior ou igual a 4 kg. c) Menos de 20 observações têm peso igual ou superior a 4 kg. d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. e) 8% das observações tem peso no intervalo de classe 8 I—— 10. TESTE 14 A Média Aritmética da distribuição é igual a: a) 9,00 cm b) 8,80 cm c) 8,70 cm d) 8,90 cm e) 9,15 cm TESTE 15 TESTE 12 Calcule a mediana : 4, 12, 10, 3, 15, 5, 14, 8, 7 A Média Aritmética da distribuição é igual a: a) 5,27 kg b) 5,24kg c) 5,21 kg d) 5,19 kg e) 5,30 kg TESTE 16 Calcule a mediana : 6, 4, 10, 5, 12, 3, 20, 7 TESTE 17 Considere a distribuição de freqüência transcrita a seguir para responder às questões 13 e 14. Diâmetro (cm) Freqüência simples Absoluta 4 I— 6 6 I— 8 8 I— 10 10 I— 12 12 I— 14 6 8 12 10 4 Calcule a mediana Nº DE APROVADOS EM UM CONCURSO, POR NOTAS NOTA 6 7 8 9 10 APROVADOS 10 15 2 14 10 TOTAL 51 32 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 22 TESTE 18 Calcule a mediana Nº de aprovados em um concurso, por nota Nota Aprovados 6 10 7 15 8 1 9 14 10 10 TOTAL 50 Seja a tabela abaixo: IDADE FREQ. ACUMULADA 1 10 2 15 3 25 4 40 5 50 Calcule a média aritmética: a) 3,75 b) 3,25 TESTE 19 c) 3,00 Calcule a mediana Altura (Cm) d) 3,20 Indivíduo (fi) 150 |—– 160 5 160 |—– 170 10 170 |—– 180 20 180 |—– 190 10 190 |—– 200 5 TOTAL e) 2,80 TESTE 23 Calcule a média aritmética CLASSES FREQÜÊNCIA 0|—– 2 10 2|—– 4 20 4|—– 6 40 6|—– 8 20 8|—– 10 10 a) 4 b) 5 c) 6 d) 7 e) NRA 50 TESTE 20 Calcule a mediana Salários minímos (SM) Funcionários 0 |—––– 2 20 2 |—––– 4 40 4 |—––– 6 20 6 |—––– 8 15 8 |—––– 10 5 TOTAL TESTE 24 O depósito em caderneta da poupança no mês de março de 2002 de 600 clientes de um banco encontrase na tabela abaixo: DEPÓSITO EM R$ 1.000,00 100 TESTE 21 Calcule a média aritmética da distribuição abaixo: Nº DE CLIENTES 0 |—– 10 100 10 |—– 20 120 20 |—– 30 80 30 |—– 40 70 40 |—– 50 60 Xi freq. 50 |—– 60 50 10 5 60 |—– 70 40 11 8 70 ou mais 12 10 13 6 a) 11,58 Total b) 11,00 d) 12,00 e) 12,99 29 c) 12,58 80 A porcentagem dos que depositaram R$ 30.000,00 ou mais é: a) 50% b) 70% c) 60% d)30% e)80% 33 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 25 TESTE 28 Calcule a mediana da distribuição abaixo: Xi fi 2 15 4 10 6 40 8 10 10 a) 2 b) 3 20 d) 5 c) 4 Calcule a mediana da distribuição abaixo: CLASSE FREQÜÊNCIA 0|—– 1 1|—– 2 2|—– 3 3|—– 4 4|—– 5 5|—– 6 6|—– 7 7|—– 8 8|—– 9 9|—– 10 e) 6 Total TESTE 26 Calcule a mediana da distribuição abaixo: Xi fi a) 2 2 20 4 10 6 40 8 10 10 b) 3 b) 3, 44 d) 3, 21 e) NRA TESTE 29 d) 5 e) 6 Nº DE CASAS TESTE 27 Calcule a mediana da distribuição abaixo: CLASSE FREQÜÊNCIA a) 2 0|—– 2 10 2|—– 4 20 4|—– 6 30 6|—– 20 8 8|—– 10 b) 3 c) 4 100 c) 4, 69 A fim de implementar um projeto de instalação de parques infantis em uma certa região de uma cidade, foi selecionada uma amostra de 50 quadras das 300 existentes na região. A distribuição da amostra é apresentada a seguir: 20 c) 4 a) 4, 42 7 9 12 16 14 15 11 8 5 3 10 d) 5 e) 6 Nº DE QUADRAS 0|—– 20 20|—–40 40|—–60 60|—–80 80|—– 100 7 20 11 7 5 Total 50 A instalação dos parques deve ser iniciada pelas quadras mais populosas. Por limitação de verbas, decidiu-se beneficiar somente as 50% mais populosas. O número mínimo de casas que a quadra deverá ter para ser beneficiada com a instalação de um parque infantil é: a) 25 b) 30 c) 32 d) 35 e) 38 34 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 30 TESTE 33 A tabela abaixo representa os salários pagos a 200 funcionários de uma empresa. Nº de Salários Mínimos Nº de Funcionários 0 |¾ 2 80 2 |¾ 4 60 4 |¾ 6 20 6 |¾ 8 30 8 |¾ 10 10 Total 200 Calcule: a) O salário médio dos funcionários. b) O salário mediano dos funcionários c) A moda bruta d) A moda de czuber e) A moda de King TESTE 31 Seja a distribuição de estatura de 300 alunos de uma turma. Estaturas(cm) 130 |¾ 140 140 |¾ 150 150 |¾ 160 160 |¾ 170 170 |¾ 180 Total Alunos 40 60 100 60 40 300 Calcule: a) A moda bruta b) A moda de Czuber c) A moda de king Seja a distribuição de estatura de 400 alunos de uma turma. Calcule: a) A moda bruta b) A moda de Czuber c) O primeiro quartil d) O segundo quartil e) O terceiro quartil Calcule: a) O primeiro quartil. b) O segundo quartil. c) O terceiro quartil. d) O quarto decil. e) O quinto decil. f) O nono decil. TESTE 34 Seja a distribuição de estatura de 300 alunos de uma turma. Estaturas(cm) 130 |¾ 140 140 |¾ 150 150 |¾ 160 160 |¾ 170 170 |¾ 180 Total Alunos 40 60 100 60 40 300 Calcule: a) O oitavo percentil. b) O 45º percentil. c) O 50º percentil. TESTE 32 Estaturas(cm) 140 |¾ 150 150 |¾ 160 160 |¾ 170 170 |¾ 180 180 |¾ 190 Total A tabela abaixo representa os salários pagos a 20 funcionários de uma empresa. Nº de Salários Mínimos Nº de Funcionários 0 |¾ 10 8 10 |¾ 20 6 20 |¾ 30 2 30 |¾ 40 3 40 |¾ 50 1 Total 20 Alunos 80 60 120 80 60 400 TESTE 35 Seja a distribuição de estatura de 400 alunos de uma turma. Estaturas(cm) 140 |¾ 150 150 |¾ 160 160 |¾ 170 170 |¾ 180 180 |¾ 190 Total Alunos 80 60 120 80 60 400 Calcule: a) A média aritmética. b) O desvio médio. c) A variância. d) O desvio padrão 35 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Seja P a proporção de empregados com salários fora do intervalo [R$ 12.500,00; R$ 16.100,00]. Assinale a opção correta. TESTE 36 A tabela abaixo representa os salários pagos a 20 funcionários de uma empresa. Nº de Salários Mínimos 0 |¾ 10 10 |¾ 20 20 |¾ 30 30 |¾ 40 40 |¾ 50 Total Calcule: a) A média aritmética. b) O desvio médio. c) A variância. d) O desvio padrão. Nº de Funcionários 8 6 2 3 1 20 a) b) c) d) e) P é no máximo 1/2 P é no máximo 1/1,5 P é no mínimo 1/2 P é no máximo 1/2,25 P é no máximo 1/20 TESTE 39 (INSS- ESAF) Sejam X1,X2,X3,........Xn observações de um atributo X. Sejam: n X = ∑ i=1 Seja a distribuição de estatura de 40 alunos de uma turma. Estaturas(cm) 140 |¾ 150 150 |¾ 160 160 |¾ 170 170 |¾ 180 180 |¾ 190 Total Calcule: a) A média aritmética b) A mediana c) A moda bruta d) A moda de Czuber e) O 2º quartil f) O 5º decil g) O 50º percentil h) A variância i) O desvio padrão Alunos 8 6 12 6 8 40 (SUSEP-ESAF) Seja X uma variável aleatória com valor esperado µ e desvio padrão . Pode-se afirmar que: (AFRF-2003) As realizações anuais Xi dos salários anuais de uma firma com N empregados produziram as estatísticas 1 N ∑ X i = R$ 14.300,00 N i=1 ) 2⎤ ⎡1 N S = ⎢ ∑ Xi − X ⎥ ⎣ N i=1 ⎦ de X em valor absoluto por menos que 2S. b) Pelo menos 99% das observações de X diferem de X em valor absoluto por menos que 2S. c) Pelo menos 75% das observações de X diferem de X em valor absoluto por menos que 2S. d) Pelo menos 80% das observações de X diferem de X em valor absoluto por menos que 2S. e) Pelo menos 90% das observações de X diferem de X em valor absoluto por menos que 2S. TESTE 40 TESTE 38 ( ∑ Assinale a opção correta: a) Pelo menos 95% das observações de X diferem TESTE 37 X= Xi e n 1 S = ( Xi − X) 2 n i =1 2 0,5 a) Pelo menos 75% das observações de X pertencerão ao intervalo . b) Pelo menos 80% das observações de X pertencerão ao intervalo [µ − 2σ; µ + 2σ] . c) Pelo menos 90% das observações de X pertencerão ao intervalo [µ − 2σ; µ + 2σ] . d) Pelo menos 95% das observações de X pertencerão ao intervalo [µ − 2σ; µ + 2σ] . e) a) Apenas com o conhecimento de µ e não é possível fazer afirmação sobre o percentual de realizações de X que cairão no intervalo . = R$ 1.200,00 36 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] TESTE 41 (AFRF-2000-ESAF) Numa amostra de tamanho 20 de uma população de contas a receber, representadas generica-mente por X, foram determinadas a média amostral M =100 e o desvio-padrão S =13 da variável transformada (X-200)/5. Assinale a opção que dá o coeficiente de variação amostral de X. a) 3,0 % b) 9,3 % c) 17,0 % d) 17,3 % e) 10,0 % TESTE 42 (AFRF-2000-ESAF)Tem-se um conjunto de n mensurações X 1 , ... , X n com média aritmética M e variância S2, onde M = (X1 + ... + Xn )/ n e S2 = (1/ n) Si ( Xi – M )2 Seja ? a proporção dessas mensurações que diferem de M, em valor absoluto, por pelo menos 2S. Assinale a opção correta. a) Apenas com o conhecimento de M e S não podemos determinar q exatamente, mas sabe-se que 0,25 ≥ θ. b) O conhecimento de M e S é suficiente para determinar q exatamente, na realidade tem-se q = 5% para qualquer conjunto de dados X1, ... , Xn. c) O conhecimento de M e S é suficiente para determinar q exatamente, na realidade tem-se q = 95% para qualquer conjunto de dados X1, ... , Xn. d) O conhecimento de M e S é suficiente para determinar q exatamente, na realidade tem-se q = 30% para qualquer conjunto de dados X1, ... , Xn. e) O conhecimento de M e S é suficiente para determinar? q exatamente, na realidade tem-se q = 15% para qualquer conjunto de dados X1, ... , Xn. TESTE 43 Seja a distribuição de estatura de 30 alunos de uma turma. Estaturas(cm) Alunos 10 |¾ 20 4 20 |¾ 30 6 30 |¾ 40 10 40 |¾ 50 6 50 |¾ 60 4 Total 30 Calcule: a) A variância b) O primeiro coeficiente de assimetria de Pearson. c) O segundo coeficiente de assimetria de Pearson d) O coeficiente de assimetria quartílico e) O coeficiente de assimetria percentílico TESTE 44 Seja a distribuição de estatura de 50 alunos de uma turma. Estaturas(cm) Alunos 0 |¾ 10 6 10 |¾ 20 4 20 |¾ 30 30 30 |¾ 40 6 40 |¾ 50 4 Total 50 Calcule: a) A variância b) O primeiro coeficiente de assimetria de Pearson. c) O segundo coeficiente de assimetria de Pearson d) O coeficiente de assimetria quartílico e) O coeficiente de assimetria percentílico TESTE 45 (TCU-93) Com base na tabela de freqüência acumulada de salários abaixo, assinale a opção incorreta. Salários Frequência em reais Acumulada abaixo de 50000 0 abaixo de 60000 25 abaixo de 70000 45 abaixo de 80000 65 abaixo de 90000 80 abaixo de 100000 90 abaixo de 110000 95 abaixo de 120000 100 a) Apenas 5 funcionários ganham salários iguais ou superiores a R$ 110.000,00. b) Um quarto dos funcionários ganham menos de R$ 60.000,00. c) 70% dos funcionários ganham mais de R$ 60.000,00 e menos de R$ 80.000,00. d) O nono decil é maior ou igual a R$ 100.000,00. e) Mais da metade dos funcionários ganham menos de R$ 80.000,00. 37 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 46 Os dados seguintes, ordenados do menor para o maior, foram obtidos de uma amostra aleatória, de 50 preços (Xi) de ações, tomada numa bolsa de valores internacional. A unidade monetária é o dólar americano. 4, 5, 5, 6, 6, 6, 6, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8, 8, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 12, 12, 13, 13,14, 15, 15, 15, 16, 16, 18, 23 Os valores seguintes foram calculados para a amostra: åi Xi = 490 e å i Xi2 – ( å i Xi )2 / 50 = 668 Assinale a opção que corresponde à mediana e à variância amostral, respectivamente (com aproximação de uma casa decimal) a) b) c) d) e) (9,0 14,0) (9,5 14,0) (9,0 13,6) (8,0 13,6) (8,0 15,0) TESTE 49 O índice de inflação no mês de junho foi 10% e se manteve constante nesse nível em julho e agosto. Assinale a opção que mais se aproxima da desvalorização da moeda nesse período. a) 33% b) 30% c) 25% d) 20% e) 10% TESTE 50 TESTE 47 Considere os preços e quantidades dos bens durante o período de 2000 a 2002. Bens c) A série S3 mostra evolução de preços distinta das séries S1 e S2 d) A série S1 mostra evolução de preços distinta das séries S2 e S3 e) As três séries não podem ser comparadas pois têm períodos-base distintos 2000 p q 2001 p q 2002 p q B1 10 2 12 1 13 3 B2 8 4 9 3 10 11 B3 12 6 14 5 13 14 Total 30 12 35 9 36 28 Calcule: a) O índice de preços de Laspeyres com base em 2000. b) O índice de preços de Paasche com base em 2000. c) O índice de quantidade de Laspeyres com base em 2000. d) O índice de quantidade de Paasche com base em 2000. TESTE 48 Dadas as três séries de índices de preços abaixo, assinale a opção correta. Ano S1 S2 S3 1999 50 75 100 2000 75 100 150 2001 100 125 200 2002 150 175 300 a) As três séries mostram a mesma evolução de preços b) A série S2 mostra evolução de preços distinta das séries S1 e S3 A tabela abaixo dá os valores dos preços Pti e quantidades Qti de quatro itens de consumo A, B, C e D nos tempos t1 < t2 . Os preços estão em reais e as quantidades em unidades apropriadas. Item A B C D Pt1 10 9 4 5 Pt2 15 11,5 5 6,5 Qt1 5 5 3 3 Qt2 4 4 2 2 Assinale a opção que dá o valor mais próximo do índice de preços de Paasche no tempo t2 com base em t1. a) 136 b) 137 c) 138 d) 139 e) 136,5 TESTE 51 A tabela abaixo dá a evolução nos tempos t1 e t2 dos preços, em reais e das quantidades, em unidades apropriadas, de três produtos A, B e C. Assinale a opção que corresponde ao índice de preços de Paasche com base em t1, com duas casas decimais. a) 131% b) 202% c) 129% d) 186% e) 154% 38 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 52 TESTE 55 A tabela abaixo apresenta a evolução de preços e quantidades de cinco produtos. Ano Produto Produto Produto Produto Produto A B C D E 1960 (ano base) Preço (po) Quant. (qo) 6,5 53 12,2 169 7,9 27 4,0 55 15,7 393 Σpo qo = 9009,7 Totais 1970 1979 Preço (p1) Preço (p2) 11,2 15,3 22,7 4,9 26,2 29,3 47,2 42,6 21,0 64,7 Σp1 qo = 14358,3 Σp2 qo = 37262,0 Assinale a opção que corresponde aproximadamente ao índice de Laspeyres para 1979 com base em 1960. a) 415,1 b) 414,4 c) 398,6 d) 416,6 e) 413,6 TESTE 53 Marque a opção que representa os índices de Laspeyres de preços, no período de 1993 a 1995, tomando por base o ano de 1993: Artigos a) b) c) d) e) Quantidades (1000t) 93 12 20 Preços (R$/t) 93 94 95 A1 94 13 25 58 81 109 A2 95 14 27 84 120 164 A tabela abaixo apresenta a distribuição de freqüências relativas da variável tempo, em segundos, requerido para completar uma operação de montagem: Tempo (Seg.) a ------ b b ------ c c ------ d d ------ 40 Total Sabendo-se que nessa tabela todas as classes têm a mesma amplitude e que 22 segundos é o tempo que é excedido por 75% das montagens, o valor de a é: a) 20 b) 18,5 c) 17,8 d) 17,2 e) 16 Atenção: Para resolver as questões de números 56 e 57 considere o resultado abaixo: O histograma representa a distribuição de salários (X) dos 500 funcionários da firma A, no mês de agosto de 2004, expressos em números de salários mínimos (SM). 40% 25% 100,00; 141,2; 192,5 100,00; 141,4; 192,8 100,00; 141,9; 193,1 100,00; 142,3; 193,3 100,00; 142,8; 193,7 TESTE 54 Marque a opção que representa os índices de Paasche de preços, no período de 1993 a 1995, tomando por base o ano de 1993: a) 100,00; 141,3; 192,3 b) 100,00; 141,6; 192,5 c) 100,00; 141,8; 192,7 d) 100,00; 142,0; 193,3 e) 100,00; 142,4; 193,6 Freüência relativa 0,25 0,25 0,25 0,25 1,00 18% 17% 1 3 5 7 9 x TESTE 56 O valor de X que separa os 35% dos funcionários que ganham menos é: a) 3,5 SM b) 4 SM c) 4,2 SM d) 4,5 SM e) 4,8 SM TESTE 57 Em setembro de 2004 todos os salários receberam um aumento de 4% sobre os de agosto. A mediana de X em setembro passou a ser igual a: a) 4,25 SM b) 4,42 SM c) 4,50 SM d) 4,65 SM e) 4,82 SM 39 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 58 As realizações anuais Xi dos salários anuais de uma firma com n empregados produziram as seguintes estatísticas: 800 1000 1200 1250 1500 TESTE 61 N ∑ Xi X = i=1 N a) b) c) d) e) e = R$30.000,00 As realizações anuais Xi dos salários anuais de uma firma com n empregados produziram as seguintes estatísticas: ∑ (Xi − X) N S= N 2 i=1 N ∑ Xi X = i=1 N = R$1.000,00 Seja P a probabilidade de empregados com salários fora do intervalo [R$27.500,00;R$32.500,00]. Assinale a opção correta. a) P é no máximo 5% b) P é no mínimo 5% c) P é no máximo 16% d) P é no mínimo 16% e) P é no máximo 25% TESTE 59 As realizações anuais Xi dos salários anuais de uma firma com N empregados produziram as estatísticas ∑ (Xi − X) N N ∑ Xi X = i=1 N = R$8.000,00 S= 2 i=1 N Se P a proporção máxima de empregados com salários fora do intervalo [R$ 5.500,00; R$ 10.500,00] for 16%, o valor de S será em reais: a) 800 b) 1000 c) 1200 d) 1600 e) 2000 TESTE 60 As realizações anuais Xi dos salários anuais de uma firma com N empregados produziram as estatísticas ∑ (Xi − X) N N ∑ Xi X = i=1 N = R$8.000,00 S= 2 i=1 N Se P a proporção máxima de empregados com salários fora do intervalo [R$ 5.500,00; R$ 10.500,00] for 25%, o valor de S será em reais: e = R$15.800,00 ∑ (Xi − X) N S= 2 i=1 = R$1.800,00 N Seja P a probabilidade de empregados com salários no intervalo [R$13.400,00;R$18.200,00]. Assinale a opção correta. a) P é no máximo 7/16 b) P é no mínimo 7/16 c) P é no máximo 9/16 d) P é no mínimo 9/16 e) P é no máximo 1/2,25 As questões de número 62 até 63 referem-se ao enunciado abaixo: O diagrama de ramos e folhas abaixo corresponde às observações (22,22,23,24,25,...,78) de uma amostra com cem elementos do atributos X. Conforme os dados da amostra observamos que ∑ Xi = 4900 e . 2 2 3 3 4 4 5 5 6 6 7 7 2234 566778 0122334 55677888 00011333444 555688888888889 000122333444444 55566888999 00001112 566777 111222 668 40 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA TESTE 62 Assinale a opção que dá o valor da mediana amostral de X. a) 44,5 b) 48,0 c) 48,5 d) 49,0 e) 50,0 TESTE 63 Assinale a opção que dá o valor da moda amostral de X. a) 48,0 b) 50,0 c) 53,0 d) 54,0 e) 55,0 Assinale a opção que dá o valor do índice para 2003. a) 170,00 b) 168,60 c) 166,00 d) 169,00 e) 167,00 As questões 67 e 68 dizem respeito ao enunciado seguinte: Considere a tabela de freqüências seguinte correspondente a uma amostra da variável X. Não existem observações coincidentes com os extremos das classes. Classes 2000 – 4000 4000 – 6000 6000 – 8000 8000 – 10000 10000 – 12000 12000 – 14000 Freqüências Acumuladas(%) 5 16 42 77 89 100 TESTE 64 Assinale a opção que dá o valor aproximado da variância amostral de X. a) 186,4 b) 188,3 c) 190,3 d) 199,3 e) 225,0 TESTE 65 Assinale a opção que dá o valor aproximado do primeiro coeficiente de assimetria de Pearson amostral de X. a) 0,072 b) 0,078 c) 0,082 d) 0,089 e) 0,091 TESTE 66 Deseja-se construir um índice de preços, com base em 2001, utilizando a técnica de Laspeyres, para o conjunto de produtos {A,B,C}. Produtos UnidadesConsumidas No Ano Base TESTE 67 (ESAF-AFRF-2003) Assinale a opção que corresponde à estimativa do valor x da distribuição amostral de X que não é superado por cerca de 80% das observações. a) 10.000 b) 12.000 c) 12.500 d) 11.000 e) 10.500 TESTE 68 (ESAF-AFRF-2003) Assinale a opção que corresponde ao valor do coeficiente de assimetria percentílico da amostra de X, baseado no 1º, 5º e 9º decis. a) 0,024 b) 0,300 c) 0,010 d) - 0,300 e) - 0,028 Preços Unitários A B 250 600 2001 50 30 C 300 100 2002 90 40 2003 120 50 120 140 41 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] TESTE 69 (ESAF-AFRF-2003) Dadas as três séries de índices de preços abaixo, assinale a opção correta. a) As três séries mostram a mesma evolução de preços. b) A série S2 mostra evolução de preços distinta das séries S1 e S3. c) A série S3 mostra evolução de preços distinta das séries S1 e S2. d) A série S1 mostra evolução de preços distinta das séries S2 e S3. e) As três séries não podem ser comparadas pois têm períodos-base distintos. TESTE 70 (ESAF-AFRF-2003) O atributo Z= (X-2)/3 tem média amostral 20 e variância amostral 2,56. Assinale a opção que corresponde ao coeficiente de variação amostral de X. a) 12,9% b) 50,1% c) 7,7% d) 31,2% e) 10,0% TESTE 71 (ESAF-AFRF-2002-1) Em um ensaio para o estudo da distribuição de um atributo financeiro (X) foram examinados 200 itens de natureza contábil do balanço de uma empresa. Esse exercício produziu a tabela de freqüências abaixo. A coluna Classes representa intervalos de valores de X em reais e a coluna P representa a freqüência relativa acumulada. Não existem observações coincidentes com os extremos das classes. As questões de 71 a 76 referem-se a esses ensaios. TESTE 71 Assinale a opção que dá o valor médio amostral de X. a) 140,10 b) 115,50 c) 120,00 d) 140,00 e) 138,00 TESTE 72 (ESAF-AFRF-2002-1) Assinale a opção que corresponde à estimativa do quinto decil da distribuição de X. a) 138,00 b) 140,00 c) 136,67 d) 139,01 e) 140,66 TESTE 73 (ESAF-AFRF-2002-1) Seja S o desvio padrão do atributo X. Assinale a opção que corresponde à medida de assimetria de X como definida pelo primeiro coeficiente de Pearson. a) 3/S b) 4/S c) 5/S d) 6/S e) 0 TESTE 74 (ESAF-AFRF-2002-1) Assinale a opção que corresponde à estimativa da freqüência relativa de observações de X menores ou iguais a 145. a) 62,5% b) 70,0% c) 50,0% d) 45,0% e) 53,4% 42 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] TESTE 75 (ESAF-AFRF-2002-1) Considere a transformação Z=(X-140)/10. Para o atributo Z encontrou-se 2 ∑i7=1 Z i fi = 1680 onde fi é a freqüência simples da classe i e Zi o ponto médio de classe transformado. Assinale a opção que dá a variância amostral do atributo X. a) 720,00 b) 840,20 c) 900,10 d) 1200,15 e) 560,30 TESTE 76 (ESAF-AFRF-2002-1) Entende-se por curtose de uma distribuição seu grau de achatamento em geral medido em relação à distribuição normal. Uma medida de Q curtose é dada pelo quociente K = P − P onde Q 90 10 b ≠1 é a metade da distância interquartílica e P90 e P10 representam os percentis de 90% e 10%, respectivamente. Assinale a opção que dá o valor da curtose ê para a distribuição de X. a) 0,263 b) 0,250 c) 0,300 d) 0,242 e) 0,000 TESTE 77 (ESAF-AFRF-2002-1) Um atributo W tem média amostral a ≠ 0 e desvio padrão positivo . Considere a transformação Z=(W-a)/b. Assinale a opção correta. a) A média amostral de Z coincide com a de W. b) O coeficiente de variação amostral de Z é unitário. c) O coeficiente de variação amostral de Z não está definido. d) A média de Z é a/b. e) O coeficiente de variação amostral de W e o de Z coincidem. TESTE 78 (ESAF-AFRF-2002-1) A inflação de uma economia, em um período de tempo t, medida por um índice geral de preços, foi de 30%. Assinale a opção que dá a desvalorização da moeda dessa economia no mesmo período. a) 30,00% b) 23,08% c) 40,10% d) 35,30% e) 25,00% Para a solução das questões de números 79 a 81 utilize o enunciado que segue. O atributo do tipo contínuo X, observado como um inteiro, numa amostra de tamanho 100 obtida de uma população de 1000 indivíduos, produziu a tabela de freqüências seguinte: Classes Freqüência (f) 29,5-39,5 4 39,5-49,5 8 49,5-59,5 14 59,5-69,5 20 69,5-79,5 26 79,5-89,5 18 89,5-99,5 10 TESTE 79 (ESAF-AFRF-2002-2) Assinale a opção que corresponde à estimativa da mediana amostral do atributo X. a) 71,04 b) 65,02 c) 75,03 d) 68,08 e) 70,02 TESTE 80 (ESAF-AFRF-2002-2) Assinale a opção que corresponde à estimativa do número de indivíduos na população com valores do atributo X menores ou iguais a 95,5 e maiores do que 50,5. a) 700 b) 638 c) 826 d) 995 e) 900 TESTE 81 (ESAF-AFRF-2002-2) Assinale a opção que corresponde ao valor modal do atributo X no conceito de Czuber. a) 69,50 b) 73,79 c) 71,20 d) 74,53 e) 80,10 43 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 58. Os intervalos de classe podem ser apresentados de várias maneiras. Dentre as situações abaixo, a correta é: Capítulo 10 BATERIA DE EXERCÍCIOS RESOLVIDOS E COMENTAD0S a. 2 — 6 compreende todos os valores entre 2 e 6, inclusive os extremos b. 2 — 6 compreende todos os valores entre 2 e 6, exclusive os extremos 10.1. BATERIA 1 c. 2 — 6 compreende todos os valores entre 2 e 6, exclusive o 2 e inclusive o 6 d. 2 — 6 compreende todos os valores entre 2 e 6, inclusive o 2 e exclusive o 6 56. Analisando-se corretamente a figura abaixo, conclui-se que em uma distribuição de freqüência deste tipo: e. 2 — 6 compreende todos os valores entre 2 e 6, exclusive os extremos Solução e comentário Evidente, pois a classe 2 — 6 exclui o 2 e o 6. Resposta: Alternativa E a. a moda é maior que a mediana b. a mediana é maior que a moda c. a mediana é maior que a média d. a média é menor que a moda 59. Assinale a alternativa correta, considerando a série: 8, 5, 14, 10, 8 e 15 a. A média aritmética é 10 e a mediana é 12 e. média, moda e mediana são iguais b. A amplitude total é 7 e a moda é 8 Solução e comentário c. A mediana é 9 e a amplitude total é 10 Observamos que a cauda está para o lado direito, portanto a distribuição é assimétrica positiva d. A média aritmética é 10 e a amplitude total é 7 logo: e a resposta é a opção B. Resposta: Alternativa B 57. O tipo de diagrama de área que procura demonstrar a proporção de partes em um todo representado por um círculo é a. Gráfico de setores b. Ogiva de Galton e. A mediana é 12 e a amplitude total é 7 Solução e comentário Média aritmética ( X ) X= X = 8 + 5 + 14 + 10 + 8 + 15 6 60 6 X = 10 c. Gráfico Pictórico d. Cartograma Moda ( M0 ) e. Gráfico Pola Como a moda é o valor mais freqüente, temos: M0 = 8 Solução e comentário Evidente, a opção correta é o gráfico de setores, também conhecido como gráfico de pizzas Resposta: Alternativa A Mediana ( Md ) Rol: 5, 8, 8, 10, 14, 15 Md = 8 + 10 2 \ Md = 9 AMPLITUDE TOTAL (AT) ® AT = 15 – 5 \ AT = 10 Resposta: Alternativa C 44 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 60. Dado o gráfico abaixo, onde fi é a freqüência simples ou absoluta da i-ésima classe então: 10.2. BATERIA 2 37. Marque a opção correta. fi 12 a) Um evento tem, no mínimo, dois elementos do espaço-amostra de um experimento aleatório. 10 b) Em um experimento aleatório uniforme todos os elementos do espaço-amostra são iguais. 8 c) Dois experimentos aleatórios distintos têm, necessáriamente, espaços-amostra distintos. 6 d) Uma parte não nula do espaço-amostra de um experimento aleatório define um evento. 4 e) Um experimento aleatório pode ser repetido indefinidamente, mantidas as condições iniciais. 2 Solução e comentário 2 4 6 8 10 12 14 16 idade A opção A é falsa, pois a definição de evento é qualquer subconjunto do espaço amostral. a) A moda se encontra na 4a classe e é igual a 9 A opção B é falsa. Observe também que a opção é absurda, b) O número de observações é igual a 42 A opção C é absurda. c) Como a distribuição é assimétrica, moda = média = mediana d) A freqüência acumulada crescente da 3a classe é 20 A opção D é confusa, poderia ser verdadeira, já que um evento é qualquer subconjunto do espaço amostral. A opção E é verdadeira, pois qualquer experimento mesmo não aleatório pode ser repetido. 7 e) ∑ f i = 48 Resposta: Alternativa E i =1 Considere a distribuição de freqüência transcrita a seguir para responder às questões 38 a 41: Solução e comentário Baseado no gráfico poderíamos ajustar a seguinte distribuição de freqüência, sem perder as características principais: CLASSES Peso (kg) fi 2 4 2 4 6 6 6 8 Freqüência simples Absoluta 2 4 9 10 4 6 12 8 10 12 6 8 6 10 12 8 8 10 2 12 14 6 10 12 1 14 16 4 TOTAL 48 A opção A é falsa, pois: A moda Bruta seria 9 A moda de CZUBER seria 8,33. A moda de King seria 8,88 Como o problema se omitiu sobre o tipo de moda, vamos supor que se refere à moda de CZUBER. 38. a) 65% das observações têm peso não inferior a 4 Kg e inferior a 10 Kg. b) Mais de 65% das observações têm peso maior ou igual a 4 Kg. A opção C é falsa, pois a distribuição é claramente c) Menos de 20 observações têm peso igual ou superior a 4 Kg. assimétrica, e a relação Mo = Md = X só é válida para as simétricas. d) A soma dos pontos médios dos intervalos de classe é inferior ao tamanho da população. A opção B é falsa, pois o número de observações é 48. A opção D é falsa pois a freqüência acumulada da 3ª classe é 18. A opção E é correta pois a freqüência total é 48. Resposta: Alternativa E e) 8% das observações tem peso no intervalo de classe 8 l—— 10 45 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Solução e comentário PESO (kg) Onde Freqüência Ponto Médio simples absoluta (Xi) Freqüência Relativa Freqüência Acumulada Crescente Xi — Ponto médio da i-ésima classe. Freqüência Acumulada Decrescente 2 l—— 4 9 3 30% 9 30 4 l—— 6 12 5 40% 21 21 6 l—— 8 6 7 20% 27 9 8 l—— 10 2 9 7% 29 3 10 l—— 12 1 11 3% 30 1 Total 30 35 — Freqüência Absoluta simples da i-ésima classe fi N — Freqüência Absoluta total. Logo: X = 158 30 ∴ X = 5,27 Kg Resposta: Alternativa A 40. A mediana da distribuição é igual a A opção A é falsa, pois 67% (40% + 20% + 7%) têm peso não inferior a 4 Kg e inferior a 10 Kg (4 l–— 10) a. 5,30 kg A opção B é correta, pois 70% (40% + 20% + 7% + 3%) têm peso maior ou igual as 4 Kg. c. um valor inferior a 5 kg b. 5,00 kg d. 5,10 kg A opção C é falsa, pois 21 observações têm peso igual ou superior a 4 Kg. A opção D é falsa, pois a soma das partes médias é 35 e o tamanho da população é 30. (Ao aluno que está começando a estudar estatística informamos que a soma dos pontos médios não serve para nada). A opção E é falsa, pois 7% das observações têm peso no intervalo 8 l–— 10 Resposta: Alternativa B e. 5,20 kg Solução e comentário Fórmula da Mediana: + ⎡N ⎢⎣ 2 − F AC ant Md = li* + fi ⎤ * ⎥⎦ ⋅ h Onde: 39. A média aritimética da distribuição é igual a a. 5,27 kg b. 5,24 kg l *i → limite inferior da classe que contém a mediana. + FAC c. 5,21 kg ANT → Freqüência acumulada anterior da classe que contém a mediana. d. 5,19 kg h* → Intervalo de classe que contém a mediana. e. 5,30 kg f i → Freqüência absoluta da classe que contém a mediana Solução e comentário Peso (kg) fi Ponto Médio (Xi) Xifi N → Freqüência absoluta total. 2 l—– 4 9 3 27 4 l—– 6 12 5 60 logo 6 l—– 8 6 7 42 diana é 4 l—– 6. Logo: 8 l—– 10 2 9 18 10 l—– 12 1 11 11 Total 30 158 ( ) Fórmula da Média Aritmética X N 30 = = 15 , portanto a classe que contém a Me2 12 Md = 4 + Md = 4 + [15 − 9 ] ⋅ 2 12 6x2 n ∑ Xi fi X = i=1 N Md = 4 + 1 12 → Md = 4 + 12 12 ∴ Md = 5 Kg Resposta: Alternativa B 46 DISCIPLINA: ESTATÍSTICA PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] 41. A moda da distribuição e. Os intervalos de classe de uma distribuição de freqüência têm o ponto médio eqüidistante dos limites inferior e superior de cada classe e sua amplitude ou é constante ou guarda uma relação de multiplicidade com a freqüência absoluta simples da mesma classe. a. coincide com o limite superior de um intervalo de classe b. coincide com o ponto médio de um intervalo de classe c. é maior do que a mediana e do que a média geométrica Solução e comentário d. é um valor inferior à média aritmética e à mediana A opção A é falsa, pois é absurda. e. pertence a um intervalo de classe distinto do da média aritmética A opção B é Falsa, também não tem sentido. Solução e comentário Obs.: Se o aluno souber o que é uma distribuição assimétrica positiva, basta observar a distribuição para concluir que a opção correta é a letra D. A opção C é correta, pois se for a Freqüência Relativa acumulada crescente é na última classe, caso contrário, se for decrescente é na primeira classe. A opção D é Falsa, só seria verdade para a moda e não para a mediana. A opção E é falsa, pois não existe a relação dita na opção. Ou ainda, pela moda de CZUBER: Mo = li* + [f max − f ant ]⋅ h [f max − f ant ] + [f max − f post ] Onde: li* → Resposta: Alternativa C 10.3. BATERIA 3 limite inferior da classe modal. f max → Freqüência absoluta simples da classe modal 43. Assinale a opção correta. f ant → Freqüência absoluta simples anterior à classe modal. a. A média harmônica é a média geométrica dos inversos das determinações da variável f post → Freqüência absoluta simples posterior à classe modal. b. A média aritimética não é influenciada pelos valores extremos da distribuição. h → intervalo da classe modal. c. A moda e a mediana são influenciadas pelos valores extremos da distribuição. Daí: Mo = 4 + Mo = 4 + [12 − 9 ].2 [12 − 9 ] + [12 − 6 ] d. a moda, a mediana e a média aritmética são expressas na mesma unidade de medida da variável a que se referem 3x2 e. A moda é uma medida de posição que permite dividir a distribuição em duas partes de igual freqüência. 3+6 6 ∴ Mo = 4 + 9 logo, Mo = 4,67 Kg daí Mo < Md < X Resposta: Alternativa D Solução e comentário A opção A é falsa, pois a média harmônica é o inverso da média aritmética dos inversos dos dados. A opção B é falsa, pois uma das maiores desvantagens da média aritmética é a influência sofrida pelos valores extremos. 42. Marque a assertiva correta. a. O intervalo de classe que contém a moda é o de maior freqüência relativa acumulada (crescentemente) b. A freqüência acumulada denominada “abaixo de” resulta da soma das freqüências simples em ordem decrescente. c. Em uma distribuição de freqüência existe uma freqüência relativa acumulada unitária, ou no primeiro, ou no último intervalo de classe. d. O intervalo de classe que contém a mediana é o de maior freqüência absoluta simples. A opção C é falsa, pois a moda e a mediana não sofrem influência de valores extremos por isso é que são chamadas de estatísticas robustas. A opção D é correta, pois a moda, a mediana a média aritmética são expressas na mesma unidade dos dados. A opção E é falsa, pois a moda é o valor mais freqüente da distribuição, a opção tentou confundir o candidato com a definição da mediana que é o valor que divide a distribuição em duas partes iguais. Resposta: Alternativa D 47 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Considere a distribuição de freqüência transcrita a seguir para responder às questões de 44 a 47. Diâmetro (cm) 45. A média aritmética da distribuição é igual a a. 9,00 cm b. 8,80 cm Freqüência simples absolutas c. 8,70 cm 4 l—— 6 6 d. 8,90 cm 6 l—— 8 8 e. 9,15 cm 8 l—— 10 12 10 l—— 12 10 12 l—— 14 4 Solução e comentário Diâmetro (cm) fi Xi 4 l—– 6 6 5 30 6 l—– 8 8 7 56 8 l—– 10 12 9 108 10 l—– 12 10 11 110 12 l—– 14 4 13 52 Total 40 44. a. A soma dos pontos médios dos intervalos de classe é inferior à soma das freqüências absolutas simples. b. 28% das observações estão no quarto intervalo de classe c. Menos de 25 observações têm diâmetro abaixo de 10cm 356 Fórmula da Média Aritmética ( x ) d. Mais de 85% das observações têm diâmetro não inferior a 6cm e. 75% das observações estão no intervalo 6 l—–12. Xifi n ∑ X i fi X = Solução e comentário i=1 N Onde: Ponto Médio Freqüência Relativa (Xi) Diâmetro (cm) Freqüência simples absoluta 4 l—— 6 6 5 6 l—— 8 8 8 l—— 10 Freqüência Acumulada Crescente Freqüência Acumulada Decrescente 15% 6 40 7 20% 14 34 12 9 30% 26 26 10 l—— 12 10 11 25% 36 14 12 l—— 14 4 13 10% 40 4 Total 40 45 100% X x A opção A é falsa, pois a soma das freqüências absolutas simples é 40 e a soma do pontos médios dos intervalos de classe é 45. Vale a pena ressaltar, também, para o aluno que está começando a estudar estatística que a soma dos pontos médios não serve para nada. A opção B é falsa, pois 25% das observações (Freq. Relativa) estão no quarto intervalo de classe. A opção C é falsa, pois 26 observações têm diâmetro abaixo de 10 cm (Ver Freq. Acumulada Crescente) Xi — ponto médio da i-ésima classe. fi — freqüência simples absoluta. N — freqüência absoluta total. X = 356 40 ∴ X = 8,9 cm Resposta: Alternativa D 46. A moda da distribuição é igual a a. 9,7 cm b. 9,3 cm c. 9,6 cm d. 9,4 cm e. 9,5 cm Solução e comentário A opção D é falsa, pois 34 (85%) das observações têm diâmetro não inferior a 6 cm (Ver Freq. Acumulada Decrescente). Como o problema se omitiu, vamos calcular a moda de Czuber. A opção E é correta, pois 75% (20% + 30% + 25%) das observações estão no intervalo 6 l—–12 (Ver Freq. Relativa) Mo = li* + [ f max [ f max − f ant ] ⋅ h [ − f ant ] + f max − f post ] Resposta: Alternativa E 48 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Onde: l * i — limite inferior da classe que contém a moda Md = 8 + [ 20 − 14 ].2 12 6x2 12 fmax — freqüência absoluta simples da classe modal. Md = 8 + 1 f ant logo, coincide com o ponto médio da 3ª classe. — freqüência anterior à classe modal. ∴ → Md = 8 + Md = 9 cm fpost — freqüência posterior à classe modal. h Resposta: Alternativa C — intervalo da classe modal. Mo = 8 + [12 − 8 ].2 [12 − 8 ] + [12 − 10 ] 48. Assinale a opção correta Mo = 8 + 4x2 4+2 a. Em um experimento aleatório é impossível garantir a ocorrência de um evento em uma particular realização do experimento, se ele não é um evento certo. Mo = 8 + 8 ∴ Mo = 8 + 1, 3 ∴ Mo = 9,3 cm 6 b. Um plano de amostragem corretamente elaborado garante a fidedignidade dos dados da população. Resposta: Alternativa B 47. A mediana da distribuição a. é igual à média aritmética b. é inferior à média aritmética c. coincide com o ponto médio de um intervalo de classe d. pertence a um intervalo de classe distinto do que contém a média aritmética e. é eqüidistante da média aritmética e da moda Solução e comentário ⎡N + ⎢⎣ 2 − F AC ant * Md = li + fi ⎤ * ⎥⎦ ⋅ h Onde: li* – limite inferior da classe que contém a mediana. N + FAC c. A opção pela amostragem, em relação ao censo, garante a redução de tempo, mas conduz sempre ao incremento de custo e à perda de precisão. d. Uma amostra aleatória extraída de uma população deve superar, no tamanho, a 5% do número de elementos populacionais. e. Em um experimento aleatório cada elemento do espaço-amostra tem a mesma probabilidade de ser selecionado em uma realização do experimento. Solução e comentário A opção A está correta, pois é a definição de experimento aleatório. A opção B é Falsa, pois o plano de amostragem não garante a fidedignidade dos dados. A opção C é falsa, pois a amostragem reduz o custo. A opção D é falsa, pois o tamanho da Amostra depende da precisão desejada. A opção E é falsa, opção absurda. – frequência absoluta total. Resposta: Alternativa A ant – Frequência Acumulada crescente anterior à classe que contém a mediana. h* – Intervalo da classe que contém a mediana fi – Freqüência absoluta da classe que contém a mediana. Logo: N 40 = = 20 2 2 logo, a classe que contém a mediana é: 8 — 10, daí: 49 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA 10.4. BATERIA 4 Cálculo do coeficiente de Assimetria: AS = Considere a distribuição de freqüência transcrita a seguir para responder às questões de 07 a 08: Peso (kg) ( 3 X − Md ) σ ∴ AS = 3 ( 6.96 − 7 , 00 ) 2 , 38 A S ≅ −0,017 Resposta: Alternativa D Freqüência absolutas simples 2 l—— 4 7 4 l—— 6 9 6 l—— 8 18 8 l—— 10 10 10 l—— 12 6 08 - A mediana e a moda da distribuição; a) diferem por um valor superior a 10% da média aritmética; b) têm valor superior ao da média aritmética; c) têm valor inferior ao da média aritmética; d) têm o mesmo valor; 07. O coeficiente de assimetria da distribuição é : e) diferem por um valor igual a 10% da média aritmética. a) nulo; Solução e comentário b) positivo e maior do que um; c) positivo e menor do que um; P e so (kg) d) maior do que menos um; Freqüência absoluta simples e) menor do que menos um. Ponto Freqüência Médio Acumulada Crescente (X ) i ( fi ) Solução e comentário (Xi – X)2 Xifi 2 l—— 4 7 3 7 221 (Xi – X)2.fi 4 l—— 6 9 5 16 45 Peso (Kg) fi Xi Xi – X 2 l—— 4 7 3 –3,96 15,6816 109,7712 6 l—— 8 18 7 34 126 4 l—— 6 9 5 –1,96 3,8416 34,5744 8 l—— 10 10 9 44 90 6 l—— 8 18 7 0,04 0,0016 0,0288 8 l—— 10 10 l—— 12 6 11 50 66 10 9 2,04 4,1616 41,6160 10 l—— 12 6 11 4,04 16,3216 97,9296 Total 50 X X 348 Total 50 X X X 283,92 Obs.: O aluno mais preparado poderia observar que a diferença X – Md seria pequena, próxima de zero, e que o desvio padrão certamente seria maior do que 1, chegando então a conclusão que a única opção correta seria a opção D. Cálculo da variância: σ2 = 2 ⋅ fi ∑ x i fi N então : X = 348 ∴ X = 6,96 Kg 50 classe que contém a mediana: 6 l—— 8 , pois ∴ daí, σ = 2,38 Kg Cálculo da Média aritmética: Cálculo da mediana: N σ 2 = 5 , 68 Kg 2 ∴ Prosseguindo, então: X = Prosseguindo, então: ∑ (X i − X ) Obs.: Antes de prosseguir com a solução, notamos que o aluno mais preparado poderia observar que a distribuição acima é assimétrica negativa e portanto a opção correta seria a opção B. σ= 5 , 68 σ2 283 , 92 = 50 N 50 = = 25 2 2 ⎡ N ⎤ * ⎢⎣ 2 − Freq.Acum. Ant. ⎥⎦ ⋅ h Md = l * + i fi 50 PROFESSOR: JOSELIAS SANTOS DA SILVA - [email protected] DISCIPLINA: ESTATÍSTICA Md = 6 + [ 25 − 16 ].2 18 Md = 6 +1 ∴ 10 – Assinale a opção correta: 9⋅2 → Md = 6 + 18 M d = 7 Kg a) A utilização de gráficos de barras ou de colunas exige amplitude de classe constante na distribuição de freqüência; b) O histograma é um gráfico construído com freqüências de uma distribuição de freqüência ou de uma série temporal; c) O polígono de freqüência é um indicador gráfico da distribuição de probabilidade que se ajusta à distribuição empírica a que ele se refere; d) O histograma pode ser construído para a distribuição de uma variável discreta ou contínua; e) O polígono de freqüência é constituído unindose os pontos correspondentes aos limites inferiores dos intervalos de classe da distribuição de freqüência. Cálculo da Moda (Czuber): classe modal: M 0 = l i* + 6 |–— 8 [ f max [ f max − f ant ] ⋅ h [ − f ant ] + f max − f post ] então: M0 = 6 + Mo = 6 + [18 − 9 ] ⋅ 2 [18 − 9 ] + [18 − 10 ] Solução e comentário 18 17 A opção "B" é falsa, pois o histograma representa apenas a distribuição de freqüência por classe . ∴ M 0 = 7,06 Kg logo: X < M d < M 0 Resposta: Alternativa B 09 - Assinale a assertiva correta: a) Toda medida de posição, ou de assimetria, é um momento de uma variável aleatória; b) A média aritmética é uma medida de posição, cuja representatividade independe da variação da variável, mas depende do grau de assimetria da distribuição de freqüência; c) Em qualquer distribuição de freqüência, a média aritmética é mais representativa do que a média harmônica; d) A soma dos quadrados dos resíduos em relação à média aritmética é nula; A opção "C" é correta, mas seria necessário considerar as freqüências relativas e as densidades das classes (freqüência relativa dividida pela amplitude), para se obter um indicador da distribuição de probabilidade. Esta opção está mal formulada, forçando a resposta da questão. (ver Estatística básica Amilcar Gomes de Azevedo - pág. 80 - Livros Técnicos e Científicos e Estatísticas Básica - Pedro Alberto Marettin - pág. 118 - Atual Editora). A opção "D" é falsa, porém, o gráfico (histograma) representa a tabulação feita através da distribuição de freqüência por classe, o que pode ser feito independentemente da variável ser discreta ou contínua (ver Estatística Básica Pedro Alberto Marettin - pág. 12 - Atual Editora). Opção "E" é falsa, pois o polígono de freqüência é construído unindo-se os pontos médios das classes . Opção "A" é absurda. Resposta: Alternativa C e) A moda, a mediana e a média aritmética são medidas de posição com valores expressos em reais que pertencem ao domínio da variável a que se referem. Solução e comentário Opção "A", totalmente absurda. Opção "C" é falsa pois a representatividade das médias depende das peculiaridades dos dados. Opção "D" é falsa, pois o que é zero é a soma dos desvios em relação à média aritmética, e não à soma do quadrado dos resíduos. Opção "E" é falsa, pois a mediana e até mesmo a média aritmética podem não pertencer ao domínio da variável. Opção "B" é absurda. Resposta: Não há opção correta. 51