Probabilidade e Estatística I.p65

Propaganda
VICE-REITORIA DE ENSINO DE GRADUAÇÃO E CORPO DISCENTE
COORDENAÇÃO DE EDUCAÇÃO A DISTÂNCIA
PROBABILIDADE E
ESTATÍSTICA I
Rio de Janeiro / 2007
TODOS OS DIREITOS RESERVADOS À
UNIVERSIDADE CASTELO BRANCO
UNIVERSIDADE CASTELO BRANCO
Todos os direitos reservados à Universidade Castelo Branco - UCB
Nenhuma parte deste material poderá ser reproduzida, armazenada ou transmitida de qualquer forma ou por
quaisquer meios - eletrônico, mecânico, fotocópia ou gravação, sem autorização da Universidade Castelo
Branco - UCB.
U n3p
Universidade Castelo Branco.
Probabilidade e Estatística I. –
Rio de Janeiro: UCB, 2007.
60 p.
ISBN
1. Ensino a Distância. I. Título.
CDD – 371.39
Universidade Castelo Branco - UCB
Avenida Santa Cruz, 1.631
Rio de Janeiro - RJ
21710-250
Tel. (21) 2406-7700 Fax (21) 2401-9696
www.castelobranco.br
Responsáveis Pela Produção do Material Instrucional
Coordenadora de Educação a Distância
Prof.ª Ziléa Baptista Nespoli
Coordenadora do Curso de Graduação
Sônia Albuquerque - Matemática
Conteudista
Vicente Meliande Giovanni
Supervisor do Centro Editorial – CEDI
Joselmo Botelho
U n3p
Universidade Castelo Branco.
Fonética e Fonologia. –
Rio de Janeiro: UCB, 2007.
36 p.
ISBN 978-85-86912-22-1
1. Ensino a Distância. I. Título.
CDD – 371.39
Apresentação
Prezado(a) Aluno(a):
É com grande satisfação que o(a) recebemos como integrante do corpo discente de nossos cursos de graduação, na certeza de estarmos contribuindo para sua formação acadêmica e, conseqüentemente, propiciando
oportunidade para melhoria de seu desempenho profissional. Nossos funcionários e nosso corpo docente
esperam retribuir a sua escolha, reafirmando o compromisso desta Instituição com a qualidade, por meio de uma
estrutura aberta e criativa, centrada nos princípios de melhoria contínua.
Esperamos que este instrucional seja-lhe de grande ajuda e contribua para ampliar o horizonte do seu conhecimento teórico e para o aperfeiçoamento da sua prática pedagógica.
Seja bem-vindo(a)!
Paulo Alcantara Gomes
Reitor
Orientações para o Auto-Estudo
O presente instrucional está dividido em seis unidades programáticas, cada uma com objetivos definidos e
conteúdos selecionados criteriosamente pelos Professores Conteudistas para que os referidos objetivos sejam
atingidos com êxito.
Os conteúdos programáticos das unidades são apresentados sob a forma de leituras, tarefas e atividades
complementares.
As Unidades 1, 2 e 3 correspondem aos conteúdos que serão avaliados em A1.
Na A2 poderão ser objeto de avaliação os conteúdos das seis unidades.
Havendo a necessidade de uma avaliação extra (A3 ou A4), esta obrigatoriamente será composta por todos os
conteúdos das Unidades Programáticas.
A carga horária do material instrucional para o auto-estudo que você está recebendo agora, juntamente com os
horários destinados aos encontros com o Professor Orientador da disciplina, equivale a 60 horas-aula, que você
administrará de acordo com a sua disponibilidade, respeitando-se, naturalmente, as datas dos encontros
presenciais programados pelo Professor Orientador e as datas das avaliações do seu curso.
Bons Estudos!
Dicas para o Auto-Estudo
1 - Você terá total autonomia para escolher a melhor hora para estudar. Porém, seja
disciplinado. Procure reservar sempre os mesmos horários para o estudo.
2 - Organize seu ambiente de estudo. Reserve todo o material necessário. Evite
interrupções.
3 - Não deixe para estudar na última hora.
4 - Não acumule dúvidas. Anote-as e entre em contato com seu monitor.
5 - Não pule etapas.
6 - Faça todas as tarefas propostas.
7 - Não falte aos encontros presenciais. Eles são importantes para o melhor aproveitamento
da disciplina.
8 - Não relegue a um segundo plano as atividades complementares e a auto-avaliação.
9 - Não hesite em começar de novo.
SUMÁRIO
Quadro-síntese do conteúdo programático...............................................................................................................
11
Contextualização da disciplina ..................................................................................................................................
12
UNIDADE I
PROBABILIDADE E ESTATÍSTICA
1.1 - Conceitos básicos....................... .................................................................................................................
13
1.2 - População e amostra..................................................................................................................................... 13
1.3 - Variáveis ......................................................................................................................................................... 13
1.4 - Funções da estatística.....................................................................................................................................14
UNIDADE II
ORGANIZAÇÃO DE DADOS
15
2.2 - Distribuição de freqüência.................................................................................................................................... 16
2.3 - Elementos de uma distribuição de freqüência........................................................................................... 17
2.1 - Séries estatísticas..................................................................................................................................................
UNIDADE III
REPRESENTAÇÃO GRÁFICA
3.1 - Gráficos da distribuição de freqüência.......................................................................................................
23
UNIDADE IV
MEDIDAS DE TENDÊNCIA CENTRAL
4.1 - Conceituação..................................................................................................................................................
4.2 - Média aritmética............................................................................................................................................
4.3 - Moda...............................................................................................................................................................
4.4 - Mediana.............................................................................................................................................................
26
26
31
34
UNIDADE V
MEDIDAS SEPARATRIZES
5.1 - Conceituação..................................................................................................................................................
5.2 - Cálculo das medidas separatrizes.......................................................................................................................
39
40
UNIDADE VI
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
44
6.2 - Amplitude total............................................................................................................................................. 44
6.3 - Desvio médio........................................................................................................................................................ 44
6.4 - Variância e desvio padrão................................................................................................................................. 47
6.5 - Coeficiente de variação................................................................................................................................... 50
6.1 - Conceituação..................................................................................................................................................
Glossário ..................................................................................................................................................................
53
Gabarito ......................................................................................................................................................................
54
Referências bibliográficas .......................................................................................................................................
59
Quadro-síntese do conteúdo
programático
UNIDADES DE PROGRAMA
OBJETIVOS
I - PROBABILIDADE E ESTATÍSTICA
1.1 - Conceitos básicos
1.2 - População e amostra
1.3 - Variáveis
1.4 - Funções da estatística
• Distinguir população de amostra;
• Distinguir, entre variáveis, as contínuas e as discretas;
• Distinguir estatística descritiva de estatística indutiva.
II - ORGANIZAÇÃO DE DADOS
2.1 - Séries estatísticas
• Identificar, numa relação, os conceitos de: classe,
freqüência absoluta, ponto médio, freqüência relativa,
percentual e acumulada;
• Construir uma distribuição de freqüência;
• Calcular o ponto médio de uma classe;
• Calcular a freqüência relativa de uma classe;
• Calcular a freqüência percentual de uma classe;
• Calcular a freqüência acumulada de uma distribuição;
• Estudar as séries estatísticas mais comuns.
2.2 - Distribuição de freqüência
2.3 - Elementos de uma distribuição de
freqüência
III - REPRESENTAÇÃO GRÁFICA
3.1 - Gráficos da distribuição de freqüência
• Listar os diferentes tipos de gráficos;
• Construir um gráfico a partir de uma tabela.
IV- MEDIDAS DE TENDÊNCIA CENTRAL
4.1 - Conceituação
4.2 - Média aritmética
4.3 - Moda
4.3 - Mediana
• Definir média aritmética, moda e mediana;
V - MEDIDAS SEPARATRIZES
5.1 - Conceituação
5.2 - Cálculo das medidas separatrizes
• Definir medidas separatrizes;
• Calcular a mediana, os quartis, os decis e os percentis;
• Comparar as medidas separatrizes, identificando
a relação entre elas.
VI - MEDIDAS DE DISPERSÃO OU DE
VARIABILIDADE
6.1 - Conceituação
6.2 - Amplitude total
6.3 - Desvio médio
6.4 - Variância e desvio padrão
6.5 - Coeficiente de variação
• Definir amplitude total, desvio médio,variância e
desvio padrão de um grupo de dados;
• Calcular a amplitude total de um grupo de dados;
• Calcular o desvio médio de um grupo de dados;
• Calcular a variância de um grupo de dados;
• Calcular o desvio padrão de um grupo de dados;
• Calcular o coeficiente de variação, conhecendo
os resultados da média aritmética e do desvio padrão.
• Calcular a média aritmética, a moda e a mediana.
11
12
Contextualização da Disciplina
Ao elaborarmos este instrucional, procuramos apresentar a teoria de modo resumido, enfatizando os exercícios e suas resoluções, evitando o excessivo formalismo. Acreditamos ter conseguido um bom desenvolvimento
seqüencial das unidades, mantendo um rigor coerente com o nível para o qual o material é proposto. O objetivo
é fazer com que você domine as idéias básicas da disciplina de Probabilidade e Estatística I, as quais são
importantes para um bom desempenho na disciplina que a segue – Probabilidade e Estatística II – e para a
avaliação do seu trabalho futuro como professor.
UNIDADE I
13
PROBABILID ADE E EST
A TÍSTICA
ESTA
1.1 - Conceitos Básicos
Como todas as outras disciplinas, podemos buscar as origens da Estatística no aparecimento do primeiro
homem.
Desde a antiguidade, vários povos já registravam o número de habitantes, de nascimentos, de óbitos, faziam
estimativas das riquezas individual e social que, atualmente, chamaríamos de estatísticas.
A estatística, hoje, é aplicada em todas as atividades humanas: na educação, no comércio, na indústria, na
agricultura, nas comunicações etc. O nome estatística (denominação dada no século XVIII) vem do seu uso em
negócio de Estado, pois no início tratava apenas de dados relativos aos negócios de Estado.
A Estatística constitui uma parte da Matemática Aplicada e tem por objetivo tirar conclusões sobre uma
população a partir de dados observados em uma amostra dessa população.
1.2 - População e Amostra
Uma população é o conjunto universo dos dados sobre os quais se quer tirar conclusões, e uma amostra é um
subconjunto da população.
U (população)
A (amostra)
1.3 - Variáveis
As variáveis podem ser:
• Qualitativas
• Quantitativas
• Variáveis qualitativas – quando seus valores forem expressos por atributos: sexo, cor da pele etc.
• Variáveis quantitativas – quando seus valores forem expressos em números: idade dos alunos de uma
escola, salários dos operários etc.
As variáveis quantitativas podem ser:
•Discretas
ou
•Contínuas
14
•Variáveis discretas – são aquelas que podem assumir somente valores pertencentes a um conjunto enumerável.
Exemplo:
O número de chamadas telefônicas, o número de quartos de uma casa, número de livros de uma estante etc.
•Variáveis contínuas – são aquelas que podem assumir qualquer valor num intervalo de observação.
Exemplo:
O peso de uma certa pessoa ou a sua estatura, o comprimento de um terreno etc.
1.4 - Funções da Estatística
A coleta, a organização e a descrição dos dados estão a cargo da Estatística Descritiva.
A análise e a interpretação desses dados ficam a cargo da Estatística Indutiva ou Inferencial.
UNIDADE II
15
ORGANIZAÇÃO DE DADOS
2.1 – Séries Estatísticas
Denominamos séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie.
Podemos considerar três elementos em uma tabela:
A época a que ela se refere (o tempo);
A região onde se passam os fatos (o espaço);
O fenômeno que é descrito (a espécie do fato).
Deste modo, podemos classificar as séries estatísticas em:
a) Séries temporais, cronológicas, históricas ou marchas – em que a variável é o tempo, permanecendo fixos
o local e o fato.
Exemplo:
b) Séries geográficas ou territoriais – sendo variável o local , e fixos: o tempo e a espécie do fenômeno.
Exemplo:
16
c) Séries específicas – em que varia a espécie do fenômeno que é descrito, ficando fixos o tempo e o local.
Exemplo:
d) Distribuição de freqüência – por se tratar de um conceito estatístico importantíssimo, merecerá um estudo
mais aprofundado, a seguir.
2.2 – Distribuição de Freqüência
Entre as séries estatísticas, merece referência especial a distribuição de freqüência. Ela requer uma característica específica de apuração, pois resulta de informações numéricas, bem mais diversificadas do que as informações literais.
Dados Brutos
Dados brutos são aqueles que ainda não foram numericamente organizados.
Um exemplo é o conjunto das notas de 60 alunos da turma A.
Colégio C – notas obtidas na prova P.
Turma A – Mês M – ano T
Rol
Um rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza.
2.3 – Elementos de Uma Distribuição de
Freqüência
a) Classes:
São agrupamentos de dados entre limites determinados.
b) Amplitude total (At):
At = V (máx.) – V (mín.)
Veja nosso exemplo:
At = 10 – 0 = 10
Os valores 10 e 0 foram retirados dos dados brutos fornecidos pelo exemplo anterior, no conjunto
das notas de 60 alunos da turma A.
c) Intervalo de classe (h):
h=
At
k
,k = número de classes
Observação:
Para uniformização das respostas dos exercícios, usaremos o número de classes variando no intervalo de 8 a
16, sem contudo existir um rigor absoluto.
Veja nosso exemplo:
d) Tabulação:
Ao registro de cada dado no seu respectivo intervalo de classe dá-se o nome de tabulação.
e) Freqüência simples ou absoluta (f ou fi):
São valores que realmente representam o número de dados de cada classe.
Observação: A soma das freqüências simples é igual ao número total dos dados.
( Σ fi = N )
Para que você tenha condições de tabular convenientemente um conjunto de números, siga este roteiro:
1 – Achar a amplitude total (At);
2 – Dividi-la por 8 e por 16, para que você possa encontrar o intervalo de classe (h);
3 – Escolher o intervalo de classe (h), de preferência número inteiro, no intervalo dos quocientes obtidos;
17
18
4 – Organizar os limites de classe, podendo começar ou terminar em número não pertencente ao conjunto, mas
em torno dos limites extremos.
Aplique esse roteiro no exemplo abaixo:
Usando os dados anteriores (do exemplo de um conjunto das notas de 60 alunos da turma A), elabore uma
distribuição de freqüência:
1) At = V(máx.) – V(mín.)
At = 10 – 0 = 10
2)
3) Escolhendo h = 1
4) Assim, temos:
Observação:
Repare que na coluna “classe”, iniciamos pelo menor valor apresentado nos dados brutos, isto é, o 0 |
A notação 0 | 1 é idêntica a [0,1) e significa um intervalo que inclui o valor 0 (zero) e exclui o valor 1.
f) Ponto médio da classe (Xi ou Pm):
É o valor que melhor representa a classe.
li ⇒ limite inferior da classe
ls ⇒ limite superior da classe
1.
g) Tipos de freqüências:
19
1 – Freqüência simples ou absoluta
São valores que realmente representam o número de dados de cada classe.
Obs.: A soma das freqüências simples é igual ao número total dos dados.
( Σ fi = N )
2 – Freqüência relativa (fr)
São os valores das razões entre as freqüências simples e a freqüência total, isto é:
3 – Freqüência percentual (fp ou f%)
4 – Freqüência acumulada (fac)
A freqüência acumulada de uma classe significa o número de dados daquela classe acrescido de todas as
freqüências anteriores ou posteriores e é simbolizada por fac.
Vamos encontrar dois tipos:
Freqüência acumulada “abaixo de” (↓)
Freqüência acumulada “acima de “ (↑)
Exemplo:
Na turma da 2ª série do Instituto de Educação K, estão matriculados 40 alunos no corrente ano. O levantamento das fichas biométricas revelou as seguintes estaturas (em centímetros):
Elabore uma distribuição de freqüência, apresentando as colunas auxiliares de freqüências absolutas, relativas, percentuais e acumuladas.
Solução:
20
Exercícios de Fixação
1) Complete as lacunas:
a) As variáveis podem ser de natureza ________________ e natureza ______________ .
b) Enquanto as variáveis________________ utilizam a contagem e só podem assumir valores inteiros, as
variáveis ________________ utilizam a medida e podem assumir valores fracionários.
c) A coleta, a organização e a descrição dos dados estão a cargo da Estatística ___________________,
enquanto a análise e a interpretação desses mesmos dados ficam a cargo da Estatística ________________.
d) A Estatística constitui uma parte da Matemática aplicada e tem por objetivo tirar conclusões sobre uma
_______________, a partir de dados observados em uma__________________ dessa população.
2) Pontos obtidos na prova de Matemática de 1ª série da Escola T, de BH, em junho de 2005:
a) Calcule a amplitude total.
b) Qual o melhor tamanho de h para este caso?
c) Faça o quadro da distribuição de freqüência.
3) Pesos (em quilogramas) dos 50 informantes do questionário X:
a) Tabule convenientemente.
4) Dada a distribuição de freqüência abaixo, calcular os pontos médios, as freqüências
relativas simples, as percentagens simples e as freqüências acumuladas:
Responder:
a) Quantos alunos têm estatura de 147 | 165?
b) Quantos alunos têm estatura de 159 | 168?
c) Qual a f% dos alunos que medem abaixo de 165 cm?
d) Qual a f% dos alunos que medem de 159 | 171?
e) Qual o valor que melhor representa a 5ª classe?
5) Classifique as séries:
a)
21
22
b)
c)
d)
UNIDADE III
23
REPRESENTAÇÃO GRÁFICA
3.1 – Gráficos da Distribuição de Freqüência
A distribuição de freqüência poderá ser ilustrada através de três gráficos:
Histograma;
Polígono de freqüência;
Polígono de freqüência acumulada.
Para a construção do histograma e do polígono de freqüência, representamos as classes no eixo das abscissas
e as freqüências no eixo das ordenadas. O histograma é constituído de retângulos cujas bases são os intervalos
de classe, e as alturas são as correspondentes freqüências.
O polígono de freqüência é o polígono que tem a base no eixo das abscissas e tem, por vértices, as coordenadas (Xi, f).
O polígono de freqüência acumulada é o polígono que tem a base no eixo das abscissas e seus vértices têm
coordenadas dadas pelos limites superiores das classes e respectivas freqüências acumuladas.
Exemplo:
Com a base na distribuição de freqüência abaixo, construa o histograma, o polígono de freqüência e o polígono
de freqüência acumulada:
LOCAL Z - PESO (KG) - ANO T
24
HISTOGRAMA
POLÍGONO DE FREQÜÊNCIA
XI
POLÍGONO DE FREQÜÊNCIA ACUMULADA
Exercício de Fixação
1 - Com base na distribuição abaixo, construa o histograma, o polígono de freqüência e o polígono de
freqüência acumulada:
25
26
UNIDADE IV
MEDIDAS DE TENDÊNCIA CENTRAL
4.1 - Conceituação
São valores que tendem a se localizar no centro de uma distribuição.
São medidas de tendência central:
• Média aritmética (X);
• Moda (Mo);
• Mediana (Md).
4.2 - Média Aritmética (X)
É o quociente da divisão da soma dos valores da variável pelo número deles.
Veja:
Onde:
X = Média aritmética;
∑x = Soma de todos os valores da variável;
N = Número de valores.
Cálculo da X Para Dados Não Agrupados
Exemplos:
a) Notas de sete alunos em História: 4, 8, 10, 6, 9, 7 e 5
b) Idades de cinco crianças: 6, 14, 11, 10 e 9
Cálculo da X Para Dados Agrupados
a) Sem intervalos de classe:
Ex.: Dada a distribuição abaixo, calcule o valor da média aritmética:
Solução:
Como:
b) Com intervalos de classe:
• Processo longo:
Consideremos a distribuição:
27
28
~
~
Vamos abrir duas colunas auxiliares, uma para os pontos médios e outra para os produtos
fXi:
~
Aplicando a fórmula, temos: ∑fXi = 6692 e ∑ f = 40
Logo:
• Processo breve:
Onde:
X = Média aritmética;
Xs = Média suposta, isto é, o ponto médio de qualquer classe;
x’i = desvio reduzido.
Vamos utilizar a distribuição do exemplo anterior.
Abriremos três colunas auxiliares (ponto médio, desvio reduzido e freqüência vezes o desvio).
29
(Fórmula p/ o cálculo do desvio)
Aplicando a fórmula, temos:
Observação: Não importa o processo utilizado (longo ou breve); o resultado é o mesmo.
Exercícios de Fixação
1 - Calcule a média aritmética das séries:
a) 120 e 150
b) 17, 19, 5, 10 e 22
c) 2, 8, 15, 10 e 22
d) 10, 14, 13, 15, 16, 18 e 12
30
2 - Complete a tabela para o cálculo da média aritmética:
3 - Complete a tabela abaixo:
4 - Calcule a nota média correspondente à distribuição do exercício 3 utilizando os processos longo e breve.
5 - Usando o processo longo e o processo breve, calcule a média aritmética das notas relacionadas a seguir:
6 - Calcule o peso médio de 50 universitários, cujos pesos se distribuem conforme o quadro abaixo:
4.3 - Moda
Moda ou norma (Mo) de uma série de N valores x1, x2, x3, ..., xN é o valor que se
repete o maior número de vezes, isto é, o valor que ocorre com mais alta
freqüência, ou ainda, em outras palavras, é o valor que está na “moda”.
Dados Não Agrupados
De acordo com o comportamento dos termos da série, podemos ter:
a) Série amodal:
Não existe moda, pois todos os valores da série ocorrem com a mesma freqüência.
Ex.: Idades de 6 crianças:
4, 10, 6, 5, 8 e 9
b) Série modal (ou unimodal):
Existe uma única moda.
Ex.: Idades de 9 crianças:
2, 7, 7, 5, 6, 8, 7, 5 e 6
Mo = 7
c) Série bimodal:
Existem duas modas.
Ex.: Notas de 8 alunos:
7, 6, 6, 5, 2, 7, 7 e 6
Mo = 6 e 7
d) Série multimodal (ou plurimodal):
Existem mais de duas modas.
Ex.: Idades de 10 crianças:
4, 7, 7, 6, 6, 8, 8, 5, 9 e 10
Mo = 6, 7 e 8
31
32
Cálculo da Moda Para Dados Agrupados
a) Sem intervalos de classe:
Ex.: Dada a distribuição abaixo, calcule o valor da moda.
O valor modal é 1,70 m, isto porque é o resultado que apresenta o maior número de alunos (20).
Logo: Mo = 1,70 m
b) Com intervalo de classe:
Em uma distribuição de freqüência, denominamos classe modal a classe que possui a mais alta freqüência ou,
conseqüentemente, a classe que contém a moda.
Moda bruta é, por definição, o ponto médio da classe modal.
Assim sendo, na distribuição seguinte, a classe modal é a sexta classe (5 a → 6) e a moda bruta é 5,5.
Moda de Czuber
Onde:
Mo = Moda;
li = Limite inferior da classe modal;
fmax. = Freqüência modal, isto é, maior freqüência;
fant. = Freqüência anterior à freqüência modal;
fpost. = Freqüência posterior à freqüência modal;
h = Intervalo de classe.
Exemplo:
Utilizando a fórmula de Czuber, calcular a moda da distribuição de notas dadas na tabela.
Solução:
Mo = 5,6
Exercícios de Fixação
1 - Calcule a moda das séries:
a) 7, 5, 6, 10, 7, 8, 7, 37, 7, 15, 7, 7 e 20
b) 11, 15, 13, 19, 13, 21, 13, 6, 13 e 16
c) 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8 e 9
33
34
2 - Complete a tabela abaixo:
3 - Com referência à tabela anterior, responda às seguintes perguntas:
a) Qual a nota média da turma?
b) Qual o valor modal da turma?
4.4 - Mediana
Mediana (Md) de uma série de N termos, x1, x2, x3, ..., xN colocados em ordem crescente (ou decrescente) de valor, é o termo da série que é precedido e seguido pelo mesmo número de ocorrências.
Dados Não Agrupados
Quando a série é constituída de um número (N) ímpar de termos, a posição (P) da mediana é dada por
P = N + 1.
2
Exemplo:
Calcule a mediana da série:
9, 15, 7, 6, 3, 16, 4, 19 e 1
Colocando a série em ordem crescente:
1, 3, 4, 6, 7, 9, 15, 16 e 19
N=9
P = N + 1 = 9 + 1 = 5 (quinto termo da série)
2
2
Concluímos que a mediana é Md = 7.
Quando a série é constituída de um número (N) par de termos, ela terá dois valores centrais. Convencionou-se,
então, que para esses casos (N par) a mediana é a média aritmética dos dois valores centrais cujas posições são
.
Exemplo:
Calcule a mediana da série:
3, 7, 4, 12, 15, 10, 18 e 14
Colocando a série em ordem crescente:
3, 4, 7, 10, 12, 14, 15 e 18
Cálculo da Mediana Para Dados Agrupados
a) Sem intervalos de classe:
A mediana é encontrada da mesma forma que é mostrada para dados não agrupados.
Ex.: Determine a mediana das séries apresentadas a seguir:
35
36
b) Com intervalo de classe:
A fórmula utilizada será:
Onde:
Md = Mediana;
Li = Limite inferior da classe que contém a mediana (classe mediana);
∑ f /2= Posição (P) da mediana, seja N par ou ímpar;
Facant = Freqüência acumulada anterior à classe mediana;
f = Freqüência simples da classe mediana;
h = Intervalo de classe.
Exemplo:
Calcule o valor mediano da distribuição abaixo:
Em primeiro lugar, calcule a posição, isto é:
Agora, Aplique a fórmula:
Exercícios de Fixação
1 - Calcule a mediana das séries:
a) 9, 14, 2, 8, 7, 15, 3, 21 e 1
b) 9, 14, 2, 8, 7, 24, 3, 21, 1 e 23
c) 34, 40, 47, 36, 28 e 37
2 - Dada a distribuição abaixo, calcule o valor da mediana:
37
38
3 - Complete a tabela abaixo:
4 - Com base na distribuição anterior, calcule:
a) a média aritmética (utilize o processo breve);
b) a moda;
c) e a mediana.
UNIDADE V
MEDIDAS SEPARATRIZES
5.1 – Conceituação
As medidas separatrizes são números reais que dividem a seqüência ordenada de dados em partes que contêm
a mesma quantidade de elementos da série.
A mediana que divide uma seqüência ordenada em dois grupos, cada um deles contendo 50% dos valores da
seqüência, é também uma medida separatriz.
As principais medidas separatrizes, além da mediana, são: quartis, decis e percentis (centis).
Os quartis, decis e percentis são as medidas separatrizes que dividem a série, respectivamente, em quatro, dez
e cem partes.
Sendo assim, temos:
39
40
5.2 - Cálculo Das Medidas Separatrizes
Dados Não Agrupados
Para localizarmos a posição de uma medida separatriz, calculamos i % de N.
Se i % de N for um número inteiro, então a medida que estamos procurando é um dos elementos da seqüência
ordenada. Caso i % de N não seja número inteiro, a medida é um elemento intermediário entre os elementos que
ocupam as posições aproximadas por falta e por excesso. Nesse caso, a medida procurada é a média aritmética
dos valores que ocupam essas posições aproximadas.
Exemplos:
a) Calcule o Q1 da seqüência A: 3, 5, 6, 6, 8, 8, 8, 9, 9, 9, 10, 10.
Solução:
O rol dado acima tem 12 elementos.
A medida Q1 corresponde a 25%, portanto 25% de 12 é igual a 3.
Esse valor indica a posição de Q1 no rol, isto é, Q1 é o terceiro elemento do rol.
Logo Q1 = 6 .
b) Calcule o Q1da seqüência A: 3, 5, 6, 6, 8, 8, 8, 9, 9, 9, 10.
Solução:
O rol dado acima tem 11 elementos.
A medida Q1 corresponde a 25%, portanto 25% de 11 é igual 2,75.
Este valor não é inteiro, indica que Q1 está localizado entre o 2º e o 3ºelementos da série.
No rol, os valores que ocupam a 2ª e a 3ª posição são 5 e 6.
Portanto:
Dados Agrupados na Forma de Variável Discreta
Para localizarmos a posição de uma medida separatriz, calculamos i % de N.
Em seguida, utilizamos a freqüência acumulada da série para localizar o elemento que ocupa essa posição.
Exemplo: Calcular Q1 na tabela abaixo:
Como Q1 corresponde a 25%, calculamos 25%, calculamos 25% de 100 que é
igual a 25, logo nos interessa o 25º elemento da série que é igual a 6.
Dados Agrupados na Forma de Variável Contínua
Para localizarmos a posição de uma medida separatriz, calculamos i % de N. Em seguida, utilizamos a freqüência
acumulada da série para localizar a classe que ocupa essa posição.
A fórmula geral para o cálculo de uma medida separatriz é a seguinte:
onde:
Sp → medida separatriz desejada;
Li → limite inferior da classe que contém a medida separatriz;
P → posição da medida separatriz;
fac(ant) → freqüência acumulada anterior a classe que contém a medida separatriz;
f → freqüência da classe que contém a medida separatriz;
h → amplitude da classe que contém a medida separatriz.
Determinamos a posição (P) de uma separatriz, sendo:
Para os quartis:
Para os decis:
Para os percentis:
Exemplo:
Com base na distribuição abaixo, calcule:
a) o primeiro quartil (Q1);
b) o quinto decil (D5);
c) o trigésimo percentil (P30).
41
42
Fórmula:
Solução:
Exercícios de Fixação
1 - Com base na distribuição abaixo, calcule:
a) O primeiro quartil;
b) O quinto decil;
c) O oitavo decil;
d) O trigésimo percentil;
e) O quadragésimo quinto percentil.
2) Os dados abaixo se referem aos salários pagos a 800 funcionários da empresa SERAFIM S.A. , em quantidade de salários mínimos.
Determine:
a) A quantidade de funcionários que não chegam a ganhar 22 salários;
b) A porcentagem de funcionários que ganham pelo menos 10 salários;
c) O salário mediano;
d) O salário modal (Czuber);
e) Abaixo de quantos salários se situam os 30% mais mal remunerados;
f) Acima de quantos salário se encontram os 20% mais bem pagos;
g) A medida que deixa ¼ dos salários;
h) A medida que separa 77% dos salários.
43
44
UNIDADE VI
MEDIDAS DE DISPERSÃO OU DE VARIABILIDADE
6.1 - Conceituação
Chamamos de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável, em
torno da média ou de um outro valor de tendência central tomado como ponto de comparação.
Observamos, como exemplo, as seqüências:
A: 20, 20, 20, 20, 20, 20, 20, 20, 20, 20. ⇒ x = 20.
B: 14, 15, 18, 18, 20, 21, 22, 23, 24, 25. ⇒ x = 20.
C: 5, 6, 15, 18, 20, 20, 26, 28, 29, 33. ⇒ x = 20.
Embora as três seqüências apresentem a mesma média, é fácil observar que elas são completamente distintas
em relação à variabilidade dos dados. Podemos afirmar que na seqüência A não há dispersão e que a seqüência
B apresenta dispersão menor que a seqüência C.
Para qualificar os valores de uma variável, ressaltando a maior ou menor dispersão entre seus valores e uma
medida tomada como ponto de comparação, usamos as medidas de dispersão.
As principais medidas de dispersão são: amplitude total, desvio médio, variância, desvio padrão e coeficiente de variabilidade.
Todas as medidas citadas têm um mesmo objetivo principal, ou seja, a qualificação da dispersão ou
homogeneidade dos elementos das séries, permitindo dessa forma a comparação entre as mesmas.
Podemos, em princípio, afirmar que, entre duas ou mais séries, a mais homogênea ( ou menos dispersa) é
aquela que apresenta a menor medida de dispersão, medida essa escolhida convenientemente.
6.2 - Amplitude Total
É a diferença entre o maior e o menor valor da seqüência.
AT = x(máx.) – x(mín.)
É evidente que quanto maior a amplitude total, maior é a dispersão ou variabilidade dos valores da variável.
Considerando as seqüências vistas anteriormente, temos:
Seqüência A: AT = 20 – 20 = 0.
Seqüência B: AT = 25 – 14 = 11.
Seqüência C: AT = 33 – 5 = 28.
No caso de os dados estarem distribuídos em intervalos de classe, as amplitudes totais serão a diferença entre
o limite superior da última classe e o limite inferior da primeira classe.
A amplitude total tem o inconveniente de só levar em conta os dois valores extremos da série, não considerando os intermediários, o que normalmente invalida a idoneidade do resultado.
Normalmente, usamos a amplitude total quando queremos determinar, por exemplo, a amplitude da temperatura
em um dia, mês ou ano; no controle de qualidade, como é uma medida de cálculo rápido; e quando a compreensão popular é mais importante do que a exatidão e a estabilidade.
6.3 - Desvio Médio
O conceito de desvio em estatística corresponde ao conceito de distância em matemática.
A dispersão dos dados em relação à média de uma seqüência pode ser avaliada através dos desvios de cada
elemento da seqüência em relação à média da seqüência.
O desvio médio que indicaremos por Dm é definido como sendo a média aritmética dos desvios de cada
elemento da seqüência para a média da seqüência.
Dados Não Agrupados
No caso de dados isolados, calculamos inicialmente a média da seqüência, em seguida, identificamos a
distância entre cada elemento da seqüência e a média e, finalmente, calculamos a média aritmética dessas
distâncias.
Dm =
xi → os elementos da seqüência;
x →média aritmética da seqüência;
N →número de elementos da seqüência.
Ex.:
Calcule o Dm da seqüência: 3, 5, 8, 9, 10.
Solução:
O rol dado tem 5 elementos, logo N = 5.
A média aritmética da seqüência é:
Logo,
Em média, cada elemento da seqüência está afastado do valor 7 por 2,4 unidades.
Dados Agrupados na Forma de Variável Discreta
No caso da apresentação com freqüência, devemos lembrar que a freqüência de cada elemento representa o
número de vezes que este valor figura na seqüência. Logo, haverá repetições de distâncias iguais de cada
elemento distinto da série para a média da série.
Então:
onde:
x → os elementos da seqüência;
x → média aritmética da seqüência;
∑ f → soma das freqüências;
fi→ freqüência de cada elemento.
45
46
Exemplo:
A média aritimética é:
Então:
Dados Agrupados na Forma de Variável Contínua
O procedimento para o cálculo é o mesmo do utilizado no caso da variável discreta, mas, por desconhecer os
valores individuais dos elementos da série, substituiremos os valores Xi pelos pontos médios da classe.
onde:
Xi → os pontos médios da classe;
x → média aritmética da seqüência;
∑ f → soma das freqüências;
fi→ freqüência de cada elemento.
Exemplo:
Calculando a média aritmética, obtemos:
6.4 - Variância e Desvio Padrão
47
No desvio médio, observamos a dificuldade e, principalmente, o trabalho, devido à presença do módulo.
Podemos fazer com que as diferenças (xi x) se tornem sempre positivas ou nulas, considerando o quadrado
dessas diferenças, ou seja, (xi x)2.
Nas fórmulas de desvio médio, substituindo xi x . por (xi x)2, obteremos uma nova medida de dispersão
chamada variância.
O desvio padrão é a raiz quadrada positiva da variância.
Devemos observar que, no cálculo da variância, quando elevamos ao quadrado a diferença (xi x), a unidade
de medida da seqüência fica também elevada ao quadrado. Por exemplo, se os dados são expressos em metros,
a variância é expressa em metros quadrados. Sendo assim, devemos observar que, em algumas unidades, a
unidade de medida da variância nem faz sentido.
Por exemplo, se os dados forem expressos em litros, a variância seria expressa em litros quadrados. Exatamente
para suprir essa deficiência da variância é que se define o desvio padrão.
Logo o desvio padrão terá sempre a mesma unidade da seqüência, sempre admitindo interpretação.
Usaremos s2 e s para variância e desvio padrão quando os dados forem representativos de uma amostra.
Usaremos σ2 e σ para variância e desvio padrão quando os dados forem representativos de uma população.
Posteriormente, veremos a necessidade de usar denominador N no caso de se referir a uma população e
denominador (N – 1) no caso de se referir a uma amostra.
Dados Não Agrupados
Como vimos acima, a variância é a fórmula do desvio médio substituindo o módulo da diferença (xi
quadrado da diferença (xi x)2.
Logo,
para população e para amostra, respectivamente.
O desvio padrão é:
No presente curso, cuidaremos apenas da variância e do desvio padrão populacional.
x) pelo
48
Dados Agrupados na Forma de Variável Discreta
Considerando cada elemento xi com freqüência f , temos:
Exemplo:
Dados Agrupados na Forma de Variável Contínua
O procedimento para o cálculo é o mesmo utilizado no caso da variável discreta, mas, por desconhecer os
valores individuais dos elementos da série, substituiremos os valores xi pelos pontos médios da classe.
Exemplo:
Calculando a média aritmética, obtemos:
A Fórmula do Desvio Padrão Também Pode Ser Escrita:
Considerando o exemplo acima, temos:
Temos:
Processo Simplificado de Cálculo do Desvio Padrão Para o Caso de Dados Agrupados em
Classes de Freqüência
Quando todas as classes de uma distribuição de freqüência têm a mesma amplitude, podemos usar, à semelhança do que fizemos para a média aritmética, o chamado processo simplificado, traduzido por:
Exemplo:
Usando o processo simplificado, calcular o desvio padrão da distribuição abaixo:
49
50
6.5 - Coeficiente de Variação
O coeficiente de variação é uma medida de dispersão relativa. A medida de dispersão relativa leva em consideração a medida de dispersão absoluta e a média da série.
Exemplo:
Série A:
Série B:
Todas as duas séries têm o mesmo desvio padrão = 2, mas o desvio padrão 2 em média 5 representa muito,
enquanto 2 em média 72.464 representa bem menos.
Vejamos:
Série A:
Série B:
Exercícios de Fixação
1) A distribuição de freqüência abaixo apresenta o resultado de uma pesquisa sobre a altura de 20 pessoas, de
um determinado grupo:
Determine:
a) A amplitude total;
b) A estatura média;
c) A estatura modal – Czuber;
d) A estatura mediana;
e) A estatura que separa os 25% mais baixos;
f) A medida D6;
g) A variância;
h) O desvio padrão;
i) O coeficiente de variação.
2) Em relação ao seguinte conjunto de dados {2, 3, 4, 6, 6, 7, 9}, determine:
a) A amplitude total;
b) A média aritmética;
c) A moda;
d) A mediana;
e) O desvio padrão;
f) O coeficiente de variação.
3) Em uma prova final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão 0,8. Em
Estatística, entretanto, o grau médio foi 7,3 e o desvio padrão 0,76. Em que disciplina foi maior a dispersão?
4) Realizada uma determinada pesquisa com 1.017 indivíduos, sobre suas estaturas e pesos, obtiveram-se os
seguintes resultados: Estatura: média = 162,2cm e desvio padrão 8,01cm; Peso: média = 52kg e desvio padrão =
2,3kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso?
5) Um grupo de 85 pessoas têm estatura média de 160,6cm, com um desvio padrão igual a 1,6.
Qual o coeficiente de variação?
6) Um levantamento feito em uma determinada empresa revelou que os salários de 5 horistas eram, respectivamente: R$ 15,10; R$ 16,80; R$ 14,60 e R$ 15,30. Pede-se:
a) O salário médio – hora;
b) O salário mediano – hora.
7) Em uma certa empresa, trabalham 4 analistas de mercado, 2 supervisores, 1 chefe de seção e 1 gerente, que
ganham respectivamente: R$ 1.300,00; R$ 1.600,00; R$ 1.750,00 e R$ 2.500,00.
Qual o valor do salário médio, do salário mediano e do salário modal?
51
52
Se você:
1)
2)
3)
4)
concluiu o estudo deste guia;
participou dos encontros;
fez contato com seu tutor;
realizou as atividades previstas;
Então, você está preparado para as
avaliações.
Parabéns!
Glossário
Amostra – grupo de objetos da população escolhidos e utilizados para estimar propriedades da mesma.
Dados brutos – dados iniciais com que o pesquisador começa seu trabalho, antes de passar à análise.
Estatística descritiva – estudo das maneiras de sintetizar dados.
Histograma – diagrama em barras que ilustra uma distribuição de freqüência; cada barra é construída de modo
que sua área seja proporcional ao número de elementos contidos no intervalo que ela representa.
Polígono de freqüência – diagrama que ilustra uma distribuição de freqüência por meio de segmento retilíneo
em lugar de barras.
53
54
Gabarito
UNIDADE II
Exercícios de Fixação
1) a) quantitativa; qualitativa
b) discretas; contínuas
c) descritiva; indutiva
d) população; amostra
2) a) AT = 48
b)
Sendo escolhido = 5
c)
3) AT = 42
Sendo escolhido = 5
55
4)
a) 30 alunos.
b) 11 alunos.
c) 75 %.
d) 32,5 %.
e) 160,5.
5) a) Temporal.
b) Especificativa.
c) Geográfica.
d) Geográfica.
56
UNIDADE III
FALTA
UNIDADE IV
4.1 - Exercícios de Fixação
1) a) 135
b) 14,6
c) 11,4
d) 14
2) X = 3,29
3)
4) X = 47,8
5) X = 49,2
6) X = 65,4 kg
4.2 - Exercícios de Fixação
1) a) Mo = 7
b) Mo = 13
c) Mo = 4 e 7
2)
3) a) X = 47,1
b) Mo = 51,7
4.3 - Exercícios de Fixação
1) a) Md = 8
b) Md = 8,5
c) Md = 36,5
2) Md = 6
3)
57
58
4) a) X = 162,3 cm
b) Mo = 160,5 cm
c) Md = 162,2 cm
UNIDADE V
Exercícios de Fixação
1) a) Q1 = 23,4 kg
b) D5 = 28,5 kg
c) D8 = 36 kg
d) P30 = 24,9 kg
e) P45 = 27,7 kg
Exercício 2 - falta
UNIDADE VI
falta
Referências Bibliográficas
COSTA, Sergio Francisco. Introdução Ilustrada à Estatística. São Paulo: Harbra Ltda, 1994.
CRESPO, Antônio Arnot. Estatística Fácil. São Paulo: Saraiva, 1995.
LIPSCHUTZ, Seymour. Probabilidade. São Paulo: McGraw-Hill, 1988.
MEYER, Paul L. Probabilidade: Aplicação a Estatística. Rio de Janeiro: LTC, 1979.
OLIVEIRA, Francisco E. Martins. Estatística e Probabilidade. São Paulo: Atlas, 1995.
PEREIRA, Wilson e TANAKA, Oswaldo K. Elementos de Estatística. São Paulo: McGraw-Hill, 1984.
TOLEDO, Geraldo Luciano e OVALLE, Ivo Izidoro. Estatística Básica. São Paulo: Atlas, 1995.
59
Download