Questão 10 - Amazon Web Services

Propaganda
Caderno de Atividades
Estatística
Disciplina
Administração
Coordenação do Curso
Fernando Conter Cardoso
Autor
Marcio Luis Carreira
Chanceler
Ana Maria Costa de Sousa
Reitora
Leocádia Aglaé Petry Leme
Pró-Reitor Administrativo
Antonio Fonseca de Carvalho
Pró-Reitor de Graduação
Eduardo de Oliveira Elias
Pró-Reitor de Extensão
Ivo Arcangêlo Vedrúsculo Busato
Pró-Reitor de Pesquisa e Pós-Graduação
Luciana Paes de Andrade
Coordenadora de Controle DidáticoPedagógico EAD
Geise Cristina Lubas Grilo
Diretor da Anhanguera Publicações
Luiz Renato Ribeiro Ferreira
Núcleo de Produção de Conteúdo e Inovações
Tecnológicas
Diretora
Carina Maria Terra Alves
Gerente de Produção
Rodolfo Pinelli
Coordenadora de Processos Acadêmicos
Juliana Alves
Diretor Geral de EAD
Coordenadora de Ambiente Virtual
José Manuel Moran
Lusana Verissimo
Diretora de Desenvolvimento de EAD
Coordenador de Operações
Thais Costa de Sousa
Marcio Olivério
Gerente Acadêmico de EAD
Fábio Cardoso
Coordenadora Pedagógica de EAD
Adriana Aparecida de Lima Terçariol
Como citar esse documento:
CARREIRA, Marcio Luis. Estatística
Valinhos, p. 1-85, 2012.
Disponível em: www.anhanguera.com
Acesso em: 01 fev. 2012
© 2012 Anhanguera Publicações
Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua
portuguesa ou qualquer outro idioma. Diagramado no Brasil 2012.
3
Legenda de Ícones
Leitura Obrigatória
Agora é a sua vez
Vídeos
Links Importantes
Ver Resposta
Finalizando
i
a
lf
h
g
k
t sv
ud r i e
b mq
l
nc p x w
o
zj
x y
i
Glossário
Referências
Início
4
Nossa Missão, Nossos Valores
Desde sua fundação, em 1994, os fundamentos da “Anhanguera Educacional” têm sido o principal
motivo do seu crescimento.
Buscando permanentemente a inovação e o aprimoramento acadêmico em todas as ações e
programas, ela é uma Instituição de Educação Superior comprometida com a qualidade do ensino,
pesquisa de iniciação científica e extensão. Ela procura adequar suas iniciativas às necessidades do mercado de trabalho e às exigências do
mundo em constante transformação.
Esse compromisso com a qualidade é evidenciado pelos intensos e constantes investimentos
no corpo docente e de funcionários, na infraestrutura, nas bibliotecas, nos laboratórios, nas
metodologias e nos Programas Institucionais, tais como:
·
·
·
·
·
Programa de Iniciação Científica (PIC), que concede bolsas de estudo aos alunos para o
desenvolvimento de pesquisa supervisionada pelos nossos professores.
Programa Institucional de Capacitação Docente (PICD), que concede bolsas de estudos
para docentes cursarem especialização, mestrado e doutorado.
Programa do Livro-Texto (PLT), que propicia aos alunos a aquisição de livros a preços
acessíveis, dos melhores autores nacionais e internacionais, indicados pelos professores.
Serviço de Assistência ao Estudante (SAE), que oferece orientação pessoal,
psicopedagógica e financeira aos alunos.
Programas de Extensão Comunitária, que desenvolve ações de responsabilidade social,
permitindo aos alunos o pleno exercício da cidadania, beneficiando a comunidade no
acesso aos bens educacionais e culturais.
A fim de manter esse compromisso com a mais perfeita qualidade, a custos acessíveis, a
Anhanguera privilegia o preparo dos alunos para que concretizem seus Projetos de Vida e obtenham
sucesso no mercado de trabalho. Adotamos inovadores e modernos sistemas de gestão nas suas
instituições. As unidades localizadas em diversos Estados do país preservam a missão e difundem
os valores da Anhanguera.
Atuando também na Educação a Distância, orgulha-se de oferecer ensino superior de qualidade
em todo o território nacional, por meio do trabalho desenvolvido pelo Centro de Educação a Distância
da Universidade Anhanguera - Uniderp, nos diversos polos de apoio presencial espalhados por
todo o Brasil. Sua metodologia permite a integração dos professores, tutores e coordenadores
habilitados na área pedagógica com a mesma finalidade: aliar os melhores recursos tecnológicos
e educacionais, devidamente revisados, atualizados e com conteúdo cada vez mais amplo para o
desenvolvimento pessoal e profissional de nossos alunos.
A todos bons estudos!
Prof. Antonio Carbonari Netto
Presidente do Conselho de Administração — Anhanguera Educacional
5
Sobre o Caderno de Atividades
Caro (a) aluno (a),
O curso de Educação a Distância acaba de ganhar mais uma inovação: o caderno de atividades
digitalizado. Isso significa que você passa a ter acesso a um material interativo, com diversos links
de sites, vídeos e textos que enriquecerão ainda mais a sua formação. Se preferir, você também
poderá imprimi-lo.
Este caderno foi preparado por professores do seu Curso de Graduação, com o objetivo de auxiliá-lo
na aprendizagem. Para isto, ele aprofunda os principais tópicos abordados no Livro-texto, orientando
seus estudos e propondo atividades que vão ajudá-lo a compreender melhor os conteúdos das
aulas. Todos estes recursos contribuem para que você possa planejar com antecedência seu tempo
e dedicação, o que inclusive facilitará sua interação com o professor EAD e com o professor-tutor
a distância.
Assim, desejamos que este material possa ajudar ainda mais no seu desenvolvimento pessoal e
profissional.
Um ótimo semestre letivo para você!
José Manuel Moran
Diretor-Geral de EAD
Universidade Anhanguera ­– Uniderp
Thais Sousa
Diretora de Desenvolvimento de EAD
Universidade Anhanguera ­– Uniderp
6
Caro Aluno,
Este Caderno de Atividades foi elaborado com base no livro “Guia de Implementação
de Marketing de Relacionamento e CRM, do autor Roberto Madruga, editora Atlas
2010, Livro-Texto 390.
Roteiro de Estudo
Prof. Marcio Luis Carreira
Estatística
Este roteiro tem como objetivo orientar seu percurso por meio dos materiais disponibilizados no Ambiente
Virtual de Aprendizagem. Assim, para que você faça um bom estudo, siga atentamente os passos
seguintes:
1. Leia o material didático referente a cada aula.
2. Assista às aulas na sua unidade e depois disponível no Ambiente Virtual de Aprendizagem para
você; (sugestão: Assista às aulas na sua unidade e também no Ambiente Virtual de Aprendizagem).
3. Responda às perguntas referentes ao item “Habilidades” deste roteiro.
4. Participe dos Encontros Presenciais e tire suas dúvidas com o tutor local.
5. Após concluir o conteúdo dessa aula, acesse a sua ATPS e verifique a etapa que deverá ser
realizada.
Tema 1
Estatística Descritiva
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
7
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• A importância da estatística.
• Os conceitos de variáveis, população e amostra.
• As fases do método estatístico.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• O que é uma população e uma amostra de um estudo?
• Como selecionar dados qualitativos e quantitativos?
• Qual a importância do estudo da estatística?
• Quais as técnicas de amostragem?
AULA 1
Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Estatística Descritiva
Durante os estudos do tema 1, você encontrara as definições iniciais sobre o estudo e importância da
estatística. Após definir uma população de estudo é possível extrair amostras dessa população para
estudo, assim consegue-se, dentro de padrões da estatística, reduzir custos com a pesquisa e obter
resultados pertinentes à população utilizando-se a amostra. De acordo com as variáveis utilizadas para
estudo, poderá separá-las distintamente entre qualitativas, que demonstram um atributo, como exemplo,
sexo, etnia, e quantitativas, que demonstram números, como exemplo, renda de uma família, filhos.
8
Com esses dados separados e seguindo as fases do método estatístico, a estatística descritiva é a
primeira a ser utilizada para uma análise mais simplificada. A partir dos dados obtidos na amostra
é possível extrair uma média que serve como parâmetro para os demais resultados. Esses dados
poderão ser trabalhados de forma agrupada (comumente utilizada), ou não agrupada (para pequenas
amostras). Independente do tratamento a ser utilizado (agrupada ou não), a estatística descritiva poderá
ser utilizada para observar qual valor mais frequente na amostra, e qual será a posição que separa a
amostra em exatamente duas partes iguais, para que seja possível trabalhar com essas partes em
separado, optando por uma decisão mais focada, por exemplo.
Entretanto, você percebe outro fator de importância no estudo da estatística descritiva, e, novamente
dentro do método estatístico é a apresentação dos dados coletados. Essa apresentação normalmente é
feita por meio de tabelas e/ou gráficos. Assim, quando um noticiário na mídia apresenta uma reportagem
sobre o consumo das famílias brasileiras, geralmente é elaborado um gráfico para demonstrar a evolução
do consumo, baseando-se em dados anteriores, ou ainda separado por categoria, como por exemplo:
alimentação, bens de consumo duráveis (geladeira, fogão), veículos. Os gráficos proporcionam uma
melhor visualização da situação, e esteticamente melhor apresentável que uma tabela. Imagine este
mesmo gráfico do consumo das famílias brasileiras sendo apresentado em forma de tabelas nos grandes
telejornais.
A estatística descritiva também auxilia no processo de decisões, por meio da análise das medidas de
tendência central (média, moda, mediana) e pela variabilidade. Assim, quando se fala de um conjunto de
dados, a referência é a população ou a amostra. Se o objetivo é a inferência estatística, serão utilizadas
medidas descritivas numéricas da amostra para fazer inferência sobre as medições correspondentes a
população. A análise dessas medidas descritivas será quanto a tendência central e a sua variabilidade
(dispersão dos dados).
A mais conhecida e melhor compreendida medida de tendência central é a média aritmética, ou
simplesmente média, de um conjunto de dados. A média aritmética de um conjunto de dados quantitativos
é a soma das medições dividida pelo número de medições contidas no conjunto de dados.
A mediana divide o conjunto de dados em duas partes iguais (50% - 50%), em algumas situações
pode ser uma melhor medida de tendência central do que a média sendo de muito valor quando se
está descrevendo grandes conjuntos de dados. Especificamente, a mediana é menos sensível do que
a média em medições extremamente grandes ou pequenas. A mediana, portanto, é o número do meio
quando as medidas são organizadas em ordem ascendente (ou descendente).
Uma terceira medida de tendência central é a moda de um grupo de medições. A moda é medição que
9
ocorre com mais frequência no conjunto de dados. Para dados agrupados, a moda é o valor que mais
aparece, isso aparentemente pode causar alguma indecisão sobre o valor da moda. Porém, o que deve
ser lembrado é da definição “valor que mais aparece”, assim pode-se definir qual é a classe modal
(classe com maior frequência de observações) e em seguida utilizar-se da equação de Czuber para
determinar a moda para dados agrupados.
Medidas de tendência central proporcionam apenas uma descrição parcial de conjunto de dados
quantitativos. A descrição é incompleta sem uma medida de variabilidade, ou dispersão, do conjunto
de dados. Conhecer a variabilidade dos dados juntamente com seu centro pode ajudar a visualizar o
formato do conjunto de dados, assim como seus extremos.
Uma medida de variabilidade bem simples é a amplitude, ou seja, a diferença entre os valores extremos
de dados (maior valor – menor valor). Porém, as medidas de variabilidade mais utilizadas são: a
variância e o desvio padrão. A variância da amostra de n medições é igual a soma dos desvios da média
ao quadrado, dividido por (n – 1). Na variância quando é utilizado a potência 2 (ao quadrado) é para
evitar números negativos, uma vez que os desvios da média nada mais é do que um ponto da amostra
subtraído o valor da média, que dependendo do valor poderá ser negativo, mas quando se “eleva” ao
quadrado, o efeito do sinal negativo não aparecerá. Já o desvio padrão é a raiz quadrada da variância.
10
Agora é a sua vez
Questão 01
(PROVÃO, 2001 – Economia)
Para fazer inferência sobre a média de rendimen-
INSTRUÇÕES
tos da população brasileira, é possível se basear
Desenvolva as atividades objetivas, procu-
em uma amostra aleatória fornecida pelos resul-
rando localizar as respostas a partir do Li-
tados de uma pesquisa, tomando a média arit-
vro-Texto e de outros livros de apoio dispo-
mética dos valores observados nessa amostra.
níveis em sua biblioteca.
Se estiver interessado em diminuir o tamanho de
As respostas devem ser apresentadas em
um intervalo de confiança para esta estimativa
textos claros, objetivos e específicos a cada
da média, sem a tornar viesada, uma saída pos-
proposta. Tenha sempre em mãos calcula-
sível seria:
doras para desenvolver os cálculos quan-
a) Descartar da amostra as observações relati-
do necessário. Não se esqueça do processo
vas aos trabalhadores que estão no primeiro
matemático, ou seja, desenvolver o cálculo
quartil da distribuição de rendimentos.
linha a linha. Não pule etapas, pois um sim-
b) Descartar da amostra as observações rela-
ples cálculo pode fazer diferença em sua
tivas aos trabalhadores que estão no último
resposta. Para padronização, utilize 4 (qua-
quartil da distribuição de rendimentos.
tro) casas decimais após a vírgula.
c) Descartar da amostra as observações relativas aos trabalhadores que estão no primeiro e
Ponto de Partida
último quartis da distribuição de rendimentos.
Em uma visita familiar (com seus pais, avós,
d) Aumentar o tamanho da amostra.
tios) de final de semana, anote quantos in-
e) Aumentar o nível de confiabilidade desejado
tegrantes há na família. Separe os dados
para o intervalo (por exemplo, 90% para 95%).
qualitativos e monte um gráfico que contenha quantos do sexo masculino e quantos
do sexo feminino. Depois anote os dados
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
referentes aos pesos de cada um, não importando aqui a separação entre sexo masculino/feminino. Em seguida, tabule os dados (coloque que tabela), mas não utilize
Questão 02
As fases do método estatístico são:
dados agrupados. Faça o cálculo da média
a) Coleta de dados, crítica dos dados, apuração
dos pesos de sua família. Qual o peso mais
dos dados, apresentação dos dados e análise
encontrado? Discuta os resultados com seus
dos resultados.
familiares.
b) Apuração dos dados, coleta dos dados, apresentação dos dados, crítica dos dados e aná-
Agora é com você! Responda às questões a
seguir para conferir o que aprendeu!
lise dos resultados.
c) Crítica dos dados, coleta dos dados, apuração
11
dos dados, apresentação dos dados e análise
dos resultados.
d) Coleta de dados, apresentação de dados e
análise dos resultados.
e) Coleta de dados e análise dos resultados apenas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 04
A técnica para recolher amostras ao acaso,
tanto quanto possível, é chamada:
a) Variável contínua.
b) Variável discreta.
c) Amostragem.
d) Amostragem estratificada.
e) Amostragem tendenciosa.
Questão 03
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
I. É uma tabela que mostra classes ou inter-
Questão 05
Sobre a distribuição de frequência.
valos de entrada de dados com um número
total de entradas em cada classe.
II. Para determinar o número de classes em
uma distribuição de frequência, utiliza-se a
regra de Sturges, em que: i (número de classes) = 1 + 3,3 x log n. na qual n é o número
total de dados.
III. A frequência simples de uma classe é o número de observações encontradas na amostra que pertence ao intervalo calculado.
IV. A frequência simples acumulada ao seu fi-
A ogiva de Galton é um gráfico que representa:
a) Uma distribuição de frequência é formada
por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo
horizontal.
b) Uma distribuição de frequência simples.
c) Um intervalo de classe.
d) Uma amostra aleatória
e) Uma distribuição de frequência cumulativa.
nal tem que ter como resultado o mesmo
número de observações do ponto médio.
Está(ão) correta(s) a(s) afirmativa(s):
a) I apenas.
b) IV apenas.
c) III apenas.
d) I, II, III apenas.
e) I, II apenas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 06
O departamento de recursos humanos de
uma empresa precisa recrutar internamente,
com a finalidade de criar um novo departamento, que será intitulado de departamento
de inteligência. Para isso será preciso que
todos os departamentos façam uma amostra
estratificada em 10% de seu quadro de fun-
12
cionários para a criação do novo departamento. De acordo com os dados a seguir, pede-se:
a) o número a ser liberado de funcionários de
cada departamento existente; b) o número de
funcionários do novo departamento.
Departamento
Funcionários
Recursos Humanos
7
Marketing e vendas
35
Financeiro
17
Produção
41
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
Com base no exercício anterior, calcule a média para dados agrupados e não agrupados.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Atenção: As questões de 7 a 10 devem ser respondidas baseadas no enunciado a seguir.
Uma agência bancária pesquisou entre seus
clientes os valores emprestados por eles. Assim para uma amostra de 40 clientes obtiveram os seguintes dados (todos em R$):
800
1350
2000
1750
1100
750
500
3500
900
1500
2200
2500
1600
1450
1400
1200
1000
1000
950
3300
3000
2350
1800
1750
1650
1600
2000
2100
3100
3000
2000
1500
700
600
750
1100
2100
1800
1900
3650
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
Responda:
a)Pela regra de Sturges, calcule o número de
Questão 09
Para dados agrupados e utilizando-se da
regra de Czuber, calcule a moda. E qual é a
moda para dados não agrupados?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Faça uma análise dos resultados obtidos, se
você fosse o gerente dessa agência, qual seria o seu planejamento para o próximo ano?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
classes.
b)Monte a tabela de distribuição de frequências para os dados acima. (Dica: monte na
sequência 4
número de classes; interva-
lo; frequência simples; frequência simples
relativa; frequência acumulada; frequência
acumulada relativa; ponto médio; produto
da frequência simples com o ponto médio).
13
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
• Acesse o site: IBGE - Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://www.ibge.
gov.br/home/>. Acesso em: 26 jul. 2012.
Verifique as metodologias das pesquisas realizadas por eles.
• Leia o artigo: PETERNELLI, Luiz Alexandre. Estatística Descritiva. Disponível em: <http://www.each.
usp.br/rvicente/Paternelli_Cap2.pdf>. Acesso em: 26 jul. 2012.
O autor explica a estatística descritiva dividida em duas áreas: estatística indutiva e descritiva.
• Leia o artigo: GUEDES, Terezinha Aparecida; ACORSI, Clédina Regina Lonardan. Estatística Descritiva.
Disponível em: <http://www.tecnicodepetroleo.ufpr.br/apostilas/matematica/estatistica_descritiva.pdf>.
Acesso em: 26 jul. 2012.
O artigo faz a introdução da estatística e mostra exemplos da estatística descritiva
FINALIZANDO
Nesse tema, você viu que a estatística está presente em todos os setores, nas empresas, no governo,
em saúde. A amostra é uma parte da população a ser estudada e por meio dos dados obtidos pela
amostra, sendo possível desenvolver gráficos e análises de resultados para futuros planejamentos.
Assim, você percebeu que a estatística é de grande importância para análises descritivas de diversos
processos e preocupações práticas de instituições.
Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
14
Tema 2
Probabilidade
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• O conceito de probabilidade.
• A aplicação da probabilidade nos negócios.
• A importância do uso das propabilidades.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Como utilizar a probabilidade como estimador de valor?
• Como é possível minimizar os riscos causados em investimentos, negócios, vendas?
• Qual a importância do estudo da probabilidade?
• Como ocorre as distribuições de probabilidade?
15
AULA 2
Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Probabilidade
Apenas a estatística descritiva não basta para análise detalhada, é preciso criar estimativas para eventos
futuros, e é nesse momento que o estudo de probabilidade se faz necessário. É a probabilidade, um
percentual de chance, que um determinado evento pode ocorrer, por exemplo, aos administradores
financeiros, qual a probabilidade das ações de sua empresa atingir o preço de R$ 100,00 até o fim do
ano? A probabilidade está presente em todos os setores da empresa produção, qualidade, financeiro
e principalmente, o comercial. Qual a probabilidade de um vendedor não atingir a sua cota diária?
Sabe-se que o planejamento da empresa está ligado diretamente ao volume de vendas, pois assim é
garantido o lucro ao final do ano.
Um experimento é um ato ou processo de observação que leva a um único resultado que não pode
ser previsto. Com isso, um espaço amostral de um experimento é o conjunto de todos os seus pontos
amostrais, que, por sua vez, é o resultado mais básico de um experimento. A probabilidade de um
ponto amostral é um número de 0 a 1, incluindo-os, que mensura a possibilidade de que o resultado vá
ocorrer quando o experimento for realizado. Assim sendo, esse número é normalmente tomado como
a frequência relativa de ocorrência de um ponto amostral em uma longa sequência de repetições do
experimento. Portanto, qualquer que seja a forma de atribuição de probabilidades para pontos amostrais,
essas probabilidades devem obedecer a duas regras, seja pi representando a probabilidade do ponto
amostral i, então, a) todas as probabilidades dos pontos amostrais devem estar entre 0 e 1 (isto é, 0 ≤
pi ≤ 1); b) as probabilidades de todos os pontos amostrais dentro de um espaço amostral devem somar
1 (isto é, ∑pi = 1).
Atribuir probabilidades a pontos amostrais é fácil para alguns experimentos, como exemplo, se o
experimento for lançar uma moeda regular e obter sua face, a designação de sua probabilidade nada
mais é que 0,5 para os dois pontos amostrais, ou seja, 50% para cara; 50% para coroa. Entretanto,
existem muitos experimentos cujas probabilidades são mais difíceis de atribuir.
16
Ainda que as probabilidades de pontos amostrais frequentemente interessem por si só, normalmente as
probabilidades de conjuntos de pontos amostrais é que são importantes, para isso é preciso definir quais
os pontos amostrais que pertencerão ao evento, e, na sequência, seja testado cada ponto amostral no
espaço amostral.
Com isso, a probabilidade de um evento A é calculado somando-se as probabilidades dos pontos
amostrais no espaço amostral de A. Voltando ao exemplo do lançamento de uma moeda, agora pode
descrever da seguinte forma:
P(A) = n(A) ÷ n(S), em que,
P(A): é a probabilidade de ocorrer o evento A.
n(A): é o número exato da resposta desejada.
n(S): é o número de respostas possíveis.
Assim se o evento A for “tirar cara”:
E = tirar cara 4
n(A) = 1
O espaço amostral seria:
S = {cara, coroa} 4
n(S) = 2
Com isso, a equação ficaria:
P(A) = 1 ÷ 2 = 0,5 ou 50%.
Isso demonstrou a atribuição de 0,5 para a probabilidade do lançamento de uma moeda.
No entanto, pode-se acrescentar outros eventos ao estudo de probabilidade.
Uma delas são os eventos complementares. O complemento de um evento A é o evento que não ocorre,
isto é, o evento que consiste em todos os pontos amostrais que não estão no evento A.
Outro evento é o mutuamente exclusivo, no qual dois eventos são mutuamente exclusivos, a probabilidade
de A e B é igual à soma das probabilidades de A e B.
Eventos independentes são aqueles em que, ao realizar um evento, não irá interferir no outro evento a
ser realizado. Assim, utilizando-se da multiplicação de probabilidades você encontrará o resultado para
os eventos independentes
.
Quando você dispõe de conhecimentos adicionais que podem afetar as chances do resultado de um
17
experimento, de modo que necessite alterar a probabilidade de interesse, uma probabilidade que reflete
esse conhecimento adicional é chamada de probabilidade condicional do evento. Entretanto, para
calcular a probabilidade condicional de que o evento A ocorra, dado que o evento B ocorra, divida a
probabilidade de que A e B ocorram pela probabilidade de B ocorra, mas para isso, deve-se supor que
a probabilidade de B não pode ser 0 (zero), isso se deve pelo fato da divisão por zero “não existir”.
Por isso, a probabilidade é o reverso da estatística, você usará a informação da população para inferir a
natureza provável da amostra. Já a estatística descritiva, as conclusões sobre a população, serão feitas
por meio da informação de uma amostra.
A estatística descritiva e a probabilidade são assuntos iniciais desse tema.
18
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (qua-
de universidades e conceitos.
Universidades
Conceitos
A
B
C
X
0,20
0,10
0,00
Y
0,25
0,10
0,05
Z
0,15
0,10
0,05
Tal tabela mostra, por exemplo, que 20% do total
dos alunos que fizeram o exame eram da universidade X e tiveram o conceito A; 5% eram da universidade Y e tiveram o conceito C, e assim por
diante. Sabendo-se que um estudante qualquer
teve conceito A, a probabilidade que ele tenha
estudado na universidade X é:
a) 1/3.
b) 1/4.
c) 1/5.
d) 2/3.
e) 2/5.
tro) casas decimais após a vírgula.
Ponto de Partida
Utilizando-se de um dado (esse deve ser
não viciado), calcule a probabilidade de ao
lançá-lo uma vez e obter o número 6. Em seguida, lance dois dados ao mesmo tempo e
calcule a probabilidade de ocorrer o número
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 02
(BACEN, 2006 - Analista) O número de automóveis modelos k vendidos diariamente em uma
6 e o número 1 na jogada.
concessionária de veículos é uma variável alea-
Agora é com você! Responda às questões a
probabilidades:
seguir para conferir o que aprendeu!
tória discreta (X) com a seguinte distribuição de
X
P(x)
0
m
1
n
2
n
3
m
Questão 01
O preço unitário de venda desse modelo é de R$
(PROVÃO, 2001 – Economia) Estudantes de três
das superiores a duas unidades. Se num deter-
universidade diferentes, X, Y e Z, fazem um exa-
minado dia a receita de vendas referente a esse
me em que os resultados são medidos pelos con-
modelo for positiva, a probabilidade dela ser infe-
ceitos A, B e C. A tabela abaixo mostra as distri-
rior a R$ 60.000,00 é de:
buições de frequências relativas das combinações
a) 60%.
20.000,00 e somente 20% dos dias tem-se ven-
19
b) 75%.
c) 40%.
c) 80%.
d) 50%.
d) 87,5%.
e) 60%.
e) 90%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 03
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 05
A probabilidade do clube campeão brasileiro de
Sobre eventos independentes de probabilidade:
2012 não ser paulista é:
I. É quando a realização de um ou a não realiza-
a) 40%.
ção de um dos eventos não afeta a probabilida-
b) 50%.
de da realização do outro e vice-versa.
c) 60%.
II. A probabilidade é igual ao produto das probabilidades de realização dos dois eventos.
d) 70%.
e) 80%.
III. A probabilidade é igual soma das probabilidades de realização dos dois eventos
IV. Os resultados dependem um do outro.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Está(ão) correta(s) a(s) afirmativa(s):
a) I apenas.
b) IV apenas.
c) III apenas.
Questão 06
Ao lançar dois dados simultaneamente, qual a
d) I, II, III apenas.
probabilidade de se obter 2 no primeiro e 6 no
e) I, II apenas.
segundo dado.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 04
Questão 07
O Campeonato Brasileiro de Futebol 2012 será
disputado na forma de pontos corridos, ou seja,
No lançamento de um dado, qual a probabilidade
se obter 2 ou 6.
não há separação em grupos e todos jogarão contra todos. A probabilidade de um clube paulista ser
o campeão brasileiro de 2012 será de:
a) 20%.
b) 30%.
20
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
Qual a probabilidade de sair uma bola verde, onde
constam 3 azuis, 5 vermelhas e 2 verdes em uma
mesma urna.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
Em um jogo de cartas, com baralho não viciado,
qual a probabilidade se sair uma carta do naipe
de copas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Em um jogo de cartas, com baralho não viciado,
qual a probabilidade se sair uma carta do naipe de
copas e que seja Reis.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
21
LINKS IMPORTANTES
Quer saber mais sobre esse assunto? Então:
Você quer saber mais sobre esse assunto? Então:
Leia a dissertação de mestrado: RIBEIRO, Silvério Domingos. As pesquisas sobre o ensino da
estatística e da probabilidade no período de 2000 a 2008: uma pesquisa a partir do banco de teses
da CAPES. Disponível em: <http://www.pucsp.br/pos/edmat/mp/dissertacao/silverio_domingos_ribeiro.
pdf>. Acesso em: 26 jul. 2012.
Esse trabalho teve como objetivo fazer um levantamento da produção acadêmica que consta no banco
de teses da Capes, relacionados com a problemática do ensino da estatística e da probabilidade.
Leia o livro: STEIN, Carlos Efrain; LOESCH; Claudio. Estatística Descritiva e Teoria das probabilidades.
2 ed. Edifurb.
Este livro foi elaborado a partir de notas de aulas das disciplinas lecionadas pelos autores ao longo dos
semestres em vários cursos de graduação. A obra pretende contribuir significativamente como material
didático no auxílio do ensino da Estatística em sala de aula.
FINALIZANDO
Nesse tema, você viu que o estudo da probabilidade é essencial para redução de riscos. É por meio
da probabilidade que as empresas estimam suas vendas no mês, o lucro desejável, profissionais da
área da saúde estimam a necessidade de doadores para um determinado tipo sanguíneo. Não se pode
confundir a probabilidade com incertezas, sendo que estas não existem mensuração matemática. Você
pôde observar como exemplo, o grande tema atual devido o ocorrido no Japão (março/2011), podese ocorrer um terremoto de grandes proporções no Brasil? Isso não se pode determinar pelo método
probabilístico, ou seja, é uma incerteza de ocorrência.
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
22
Tema 3
Distribuições Discretas de Probabilidade
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• Variáveis aleatórias, discretas e contínuas.
• A distribuição binômia.
• Média, variância e desvio padrão.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Quais as diferenças entre variáveis aleatórias, discretas e contínuas?
• De que forma é possível estabelecer uma distribuição discreta de probabilidade?
• Como descobrir a média, variância e desvio padrão de uma distribuição discreta de
probabilidade?
23
AULA 3
Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Distribuições Discretas de Probabilidade
Você viu que uma variável aleatória é aquela cujos valores são determinados ao acaso, ou seja, não
estão sob o controle do observador (pesquisador). Assim, para uma variável aleatória discreta, todos
os possíveis valores da variável aleatória podem ser listados numa tabela com as probabilidades
correspondentes.
Tal como utilizado para conjuntos de dados de amostras e populações, é frequentemente útil descrever
uma distribuição de probabilidade em termos de sua média e de sua variância. Nesse caso, a média
é chamada de valor esperado da distribuição de probabilidade. O valor esperado de uma variável
aleatória discreta X, é denotado por E(X), é a média ponderada de todos os valores possíveis da variável
aleatória com os respectivos valores de probabilidade tomados como pesos. Com isso, como a soma
dos pesos (probabilidade) é sempre igual a 1, a fórmula da média ponderada pode ser simplificada. O
valor esperado de uma distribuição discreta de probabilidade é: E(X) = ∑ X P(X).
A utilização da fórmula pode ser mais visível com a sua aplicação. Por exemplo, supondo que a
possível demanda (procura) por um produto em um mês seja: 3; 5; 7; 8. As probabilidades para que
essa demanda aconteça é 0,2; 0,35; 0,25; 0,2 respectivamente. Assim o valor esperado da demanda do
produto no mês seria: E(X) = (3 x 0,2) + (5 x 0,35) + (7 x 0,25) + (8 x 0,2) 4 5,70. Observe que a soma
das probabilidades é igual a 1. Mas o que significa o valor esperado de 5,70? Na verdade, não se pode
vender 5,70 de um produto, com isso deve-se arredondar para 6 unidades demandadas. A utilização do
valor esperado servirá como guia ao departamento de vendas para o cumprimento de metas ao final do
mês. Pode ser utilizado também como planejamento para o próximo período também.
Já a variância de uma variável aleatória X, denotada por Var (X), é calculada em relação ao valor
esperado, E(X), como a média da distribuição de probabilidade. Ou seja:
Var (X) = ∑[X – E(X)]² P(X)
Um passo a passo para o cálculo da variância pode ser observado na tabela 1, a seguir.
24
Tabela 1 – Cálculo da variância de uma variável aleatória discreta.
Demanda
(X)
3
5
7
8
Probabili- X – E(X)
dade P(X)
0,2
3 – 5,70 = 2,70
0,35
5 – 5,70 = 0,70
0,25
7 – 5,70 =
1,30
0,2
8 – 5,70 =
2,30
[X – E(X)]²
(-2,70)² =
7,29
(-0,70)² =
0,49
(1,30)² =
1,69
(2,30)² =
5,29
Total
[X – E(X)]² x
P(X)
7,29 x 0,2=
1,46
0,49 x 0,35 =
0,17
1,69 x 0,25 =
0,42
5,29 x 0,2 =
1,06
3,11
Tabela 1 – Cálculo da variância de uma variável aleatória discreta.
A variância, portanto, para o exemplo da demanda de um produto é de 3,11. Isso representa a variabilidade
da demanda, se extrair a raiz quadrada, obter-se-á o desvio padrão para a demanda. Outra distribuição de
probabilidade para variável aleatória discreta é a distribuição binomial.
A distribuição binômia é uma distribuição discreta de probabilidade, aplicável sempre que o processo de
amostragem for do tipo Bernoulli. Um processo de Bernoulli é um processo de amostragem no qual: a) em
cada tentativa existem dois resultados possíveis mutuamente exclusivos. Eles são chamados de sucesso
e fracasso; b) as séries de tentativas, ou observações, são constituídas de eventos independentes; c) a
probabilidade de sucesso, indicada por p, permanece constante de tentativa para tentativa.
A distribuição binomial pode ser utilizada para determinar a probabilidade de se obter um dado número de
sucessos em um processo de Bernoulli. Três valores são necessários: número de sucessos (X); o número
de tentativas, ou observações (n); e a probabilidade de sucesso em cada tentativa (p).
A distribuição de Poisson pode ser usada para determinar a probabilidade de um dado número de sucessos
quando os eventos ocorrem em um continuum de tempo ou espaço. Tal processo, chamado de processo
de Poisson, é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um continuum ao invés
de ocorrerem em tentativas ou observações fixadas. Para esse caso, apenas um valor é necessário para
determinar a probabilidade de um dado número de sucessos em um processo, que é o número médio de
sucessos para a específica dimensão de tempo ou espaço de interesse. Este número médio é geralmente
representado pela letra grega “lambda” (λ).
25
Como você pode observar, as características da variável aleatória de Poisson são, em geral, difíceis de
verificar para exemplos práticos. Como em todos os modelos de probabilidades, o teste real de adequação
de modelo de Poisson é se ele proporciona uma aproximação razoável da realidade, isto é, se os dados
empíricos o suportam. Para o cálculo da distribuição de Poisson será facilitado se fornecido Tabelas
Estatísticas, como a encontrada no apêndice B do Livro-Texto – tabela 3 – distribuição de Poisson.
26
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula.
Ponto de Partida
Visitando um hipermercado, ou uma concessionária de automóveis a probabilidade
de que um cliente aleatoriamente fazer uma
compra é de 0,15. Se um vendedor atender
6 presumíveis clientes, qual será probabilidade que ele faça 4 vendas?
Agora é com você! Responda às questões a
seguir para conferir o que aprendeu!
creta deve estar entre 0 e 1.
c) A soma de todas as probabilidades tem de ser
igual a 1.
d) É incontável de resultados possíveis, representado por um intervalo sobre o eixo.
e) A distribuição de probabilidade discreta enumera cada valor que a variável aleatória pode
assumir ao lado de sua probabilidade.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 02
Assinale a alternativa correta:
I. Uma distribuição binomial é baseada no processo de Bernoulli.
II. A distribuição binomial em cada tentativa existem dois resultados possíveis independentes.
III.As séries de tentativas, ou observações, são
constituídas de eventos mutuamente exclusivos.
IV.A probabilidade de sucesso permanece constante de tentativa para tentativa.
As afirmativas acima estão corretas:
a) I, II apenas.
b) II e III apenas.
c) I, IV apenas.
d) III, IV apenas.
e) Todas estão corretas.
Questão 01
É incorreto dizer que uma variável aleatória discreta possui a característica:
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
a) É contável com resultados possíveis que possam ser enumerados.
b) A probabilidade de cada valor da variável dis-
Questão 03
27
Você trabalha em uma seguradora e a venda de
que:
uma apólice de seguros de um ano é $ 10.000,00
I. A média (ou número esperado) de eventos
com um prêmio anual de $ 290,00. Tabelas atua-
em cada unidade é denotada pela letra grega
riais mostram que a probabilidade de morte duran-
“lambda” – λ.
te o próximo ano para uma pessoa da idade, sexo,
II. O experimento consiste em contar o núme-
nível de saúde, do seu cliente é 0,001. Qual o ga-
ro de vezes que certo evento ocorre durante
nho esperado (quantidade de dinheiro feito pela
uma dada unidade de tempo.
empresa) para uma apólice desse tipo?
III.A probabilidade de que um evento ocorra em
a) $ 290,00.
uma dada unidade de tempo é a mesma para
b) $ 9.710,00.
todas as unidades.
c) $ 280,00.
IV.O número de eventos que ocorre em uma
d) $ 10.000,00.
unidade de tempo é independente do número
e) $ 570,00.
que ocorre em qualquer outra unidade mutuamente excludente.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Está(ao) correta(s):
a) Apenas I.
b) Apenas II.
Questão 04
Considere que x seja igual ao número de peças
c) Apenas III.
d) Apenas IV.
e) Todas corretas.
defeituosas em 5 tentativas. Então, x é uma variável aleatória binomial com p, a probabilidade de
que uma única peça seja defeituosa é igual a 0,1.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
A probabilidade de que 3 peças sejam defeituosas
em 5 tentativas será:
Atenção: Para as questões 6 a 10 considerar o
a) 0,81%.
enunciado a seguir.
b) 0,08%.
c) 1,00%.
Devido às altas taxas de juros, uma empresa
d) 8,00%.
informa que 40% de suas contas a receber de
e) 8,10%.
outras empresas comerciais se encontram vencidas. Se um analista financeiro escolhe aleatoriamente uma amostra de cinco contas, determinar
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
a sua probabilidade de acordo com a distribuição
Questão 05
Questão 06
Sobre a distribuição de Poisson é correto afirmar
28
binomial
Caso nenhuma das contas estejam vencidas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
Exatamente duas contas estejam vencidas
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
A maioria das contas estejam vencidas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
Exatamente uma conta esteja vencida.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Se você fosse o analista financeiro da empresa
continuaria utilizando essa técnica para avaliar a
inadimplência da empresa. Justifique.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
29
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: SCHEIN, Diana; LIMA, Milton Luiz Paiva. Uma metodologia para o dimensionamento de
frota de rebocadores em terminais portuários: uma aplicação ao porto do Rio Grande. Disponível em:
<http://www.podesenvolvimento.org.br/inicio/index.php?journal=podesenvolvimento&page=article&op=
view&path[]=47>. Acesso em: 26 jul. 2012.
Nesse trabalho é aplicada uma metodologia para encontrar o número adequado de rebocadores para
atender ao Porto do Rio Grande.
Leia a dissertação de mestrado: RIBEIRO, Silvério Domingos. As pesquisas sobre o ensino da estatística
e da probabilidade no período de 2000 a 2008: uma pesquisa a partir do banco de teses da CAPES.
Disponível em: <http://www.pucsp.br/pos/edmat/mp/dissertacao/silverio_domingos_ribeiro.pdf>. Acesso
em: 26 jul. 2012.
Esse trabalho teve como objetivo fazer um levantamento da produção acadêmica que consta no banco
de teses da Capes.
Leia: LANDÍN, Pedro R.; SÁNCHEZ, Ernesto. Niveles de razonamiento probabilístico de estudiantes de
bachillerato frente a tareas de distribuición binomial. Disponível em: <http://revistas.pucsp.br/index.php/
emp/article/view/4842/3703> Acesso em: 26 jul. 2012.
Neste artigo os autores apresentam uma hierarquia de raciocínios utilizados para avaliar as respostas
de alunos do ensino médio a um questionário contendo tarefas relacionadas com a distribuição binomial.
FINALIZANDO
Nesse tema, você viu que o estudo de variáveis aleatórias discretas e suas distribuições de probabilidades.
Sendo que a mais utilizada é a distribuição de probabilidade por atribuição (para cada valor), e assim
encontra-se o valor esperado, a distribuição binomial seguindo o modelo de amostra proposto por
Bernoulli e a distribuição de Poisson. Portanto, você observou a aplicação dessas teorias na prática do
cotidiano com exemplos reais utilizados por empresas em seus mais diversos departamentos e setore
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
30
Tema 4
Distribuição Normal de Probabilidade
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• A distribuição normal das probabilidades.
• A distribuição contínua das probabilidades.
• A utilização das variáveis aleatórias contínuas.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Como calcular uma distribuição normal de probabilidade?
• De que forma é possível estimar áreas sob a curva normal?
• Como compreender a utilização de variáveis aleatórias contínuas?
31
AULA 4
Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Distribuição Normal de Probabilidade
Durante os estudos do tema 4, você encontrará as definições sobre o estudo e importância das
distribuições discretas de probabilidade para variáveis contínuas, sendo a mais utilizada a distribuição
normal de probabilidade. Utilizando-se da função densidade de probabilidade seria necessário uma
série de cálculos para integrar áreas sob curvas de probabilidade. Porém, essas integrações (cálculo
de integrais) se tornam desnecessárias, uma vez que foram desenvolvidas tabelas de probabilidades
para tais distribuições contínuas.
A distribuição normal de probabilidade é uma distribuição contínua que é simétrica e mesocúrtica, ou
seja, a curva de sino não é nem achatada e nem pontiaguda, em termos de valores observados.
Além disso, a distribuição de probabilidade normal é importante na inferência estatística por três razões
distintas: a) as medidas produzidas em diversos processos aleatórios seguem essa distribuição; b)
probabilidades normais podem ser usadas frequentemente como aproximações de outras distribuições
de probabilidades, como por exemplo, distribuições binomial e Poisson; c) as distribuições de
estatísticas da amostra, tais como a média e a proporção frequentemente, seguem a distribuição normal
independentemente da distribuição da população.
Para qualquer distribuição contínua de probabilidade, o valor da probabilidade somente pode ser
determinado para um intervalo de valores da variável. A altura da função densidade, ou curva de
probabilidade, para uma variável normalmente distribuída é dada por:
f (X ) =
( X − µ )²
−
1
e 2σ ²
2πσ
Em que ∏ é a constante 3,1416 e, e é a constante 2,7183 (expoente natural); μ é a média da
população e σ é o desvio padrão da distribuição. Porém, as tabelas de probabilidades da normal são
32
baseadas em uma distribuição particular: a distribuição normal padronizada. Esta é a distribuição de
probabilidade com média = 0 (zero) e desvio padrão = 1. Qualquer conjunto de valores X normalmente
distribuído pode ser convertido em valores normais padronizados z.
z=
X −µ
σ
A tabela 4 do apêndice B do Livro-Texto mostra as probabilidades da distribuição normal padronizada.
Assim, gestores de empresas podem se utilizar da distribuição normal de probabilidade para
determinação de metas, ou criar padrões para seus produtos ou serviços. Por exemplo, o
departamento de recursos humanos está estudando mudanças na política salarial da empresa.
Em sua pesquisa descobriu que a média salarial é de $ 2000,00 com desvio padrão de $ 200. A
probabilidade que um funcionário tenha um salário entre $ 2000,00 e $ 2500,00 é definido da seguinte
maneira:
z=
2500 − 2000
= +2,50
200
Observe que pela definição da distribuição normal padronizada, primeiro o valor a ser estudado ($ 2500)
subtrai a média ($ 2000) e seu resultado é dividido pelo desvio padrão.
Pela tabela 4 do Livro-Texto z (2,50) – deve-se encontrar o valor da tabela z (2,5) na primeira coluna.
Depois verificar na horizontal o valor que completa o valor de z, nesse caso 0,00. Uma vez que o
resultado de z é igual 2,50. Fazendo a intersecção entre linha e coluna (linha 2,5 e coluna 0,00)
o valor correspondente será de 0,9938. Observe a pintura da figura (gráfico acima dos valores
da tabela) e verá que a parte pintada corresponde do lado negativo ao positivo (pelos números
naturais), assim a probabilidade de encontrar um funcionário com salário entre $ 2000 e $ 2500 será:
0,9938 – 0,5= 0,4938, ou seja, 49,38%. Por que esse último cálculo? Mais uma vez é por causa da
representatividade, em outras bibliografias pode ser encontrada a parte pintada partindo da média
(mais comum nas bibliografias), nesse caso verá que o resultado já é obtido automaticamente.
Compete agora analisar o resultado encontrado. Como já fora definido, a distribuição de probabilidade
normal necessita de um intervalo de dados, nesse caso salários entre $ 2000 e $ 2500. Assim,
note que a probabilidade de aleatoriamente um funcionário tenha salário entre este intervalo é de
49,38%, portanto, o departamento de recursos humanos poderá determinar mais alguns estudos e
com seus resultados determinar a nova política salarial. Atualmente as grandes empresas utilizam
da remuneração por produtividade e esse estudo é importante para definição dos pesos que servirão
para multiplicar o salário de seus funcionários. A faixa em que tiver a menor concentração salarial
poderá receber um tratamento diferenciado para igualar ou melhorar o salário.
33
Como já mencionado anteriormente, a distribuição normal pode ser utilizada para aproximações
da distribuição binomial. Assim quando, a variável aleatória binomial discreta pode assumir um
grande número de valores, o cálculo de suas probabilidades pode se tornar entediante. Quando n
da distribuição binomial for grande, uma distribuição de probabilidade normal pode ser utilizada para
proporcionar uma boa aproximação. Basta utilizar as tabelas de distribuição binomial e distribuição
normal padronizada, no entanto deve-se observar à média e o desvio padrão da distribuição binomial
para uso no cálculo.
34
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula.
Ponto de Partida
Visitando um hipermercado com seus amigos ou familiares, faça a média do gasto
com as compras realizadas pelas pessoas.
Em seguida, calcule o desvio padrão, para
isso volte ao capítulo 2. Em seguida crie faixas para a percepção da probabilidade de
ocorrência dos valores utilizados. No final
de suas análises, poderá observar como os
grandes supermercados determinam suas
políticas promocionais.
Agora é com você! Responda às questões a
seguir para conferir o que aprendeu!
Questão 01
O tempo x entre cargas de um telefone celular seja
normalmente distribuído com média de 10 horas e
desvio padrão de 1,5 horas. A probabilidade de
que o celular dure entre 8 e 12 horas entre as
cargas será:
a) 81,64%.
b) 18,36%.
c) 90,82%.
d) 9,18%.
e) 50,00%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 02
A probabilidade de que um ponto x qualquer,
dentro de uma distribuição normal de probabilidade esteja do lado direito da curva de sino será:
a) 50%.
b) 100%.
c) 25%.
d) 75%.
e) 0%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 03
Sobre distribuição normal de probabilidade avalie as afirmativas abaixo:
I. É a distribuição utilizada para variável contínua.
II. Sua curva é chamada de curva de GAUSS.
III. Sua curva é assimétrica em torno da média e
tem formato de sino.
IV. A curva normal à medida que se afasta da média ela toca no eixo x.
Está(ao) correta(s).
a) I apenas.
35
b) II apenas.
Atenção: As questões de 6 a 10 devem ser res-
c) I e II apenas.
pondidas de acordo com enunciado a seguir.
d) II e III apenas.
e) Todas estão corretas.
O processo de engarrafamento de refrigerantes
de uma companhia foi ajustado para que uma
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
média de 1000 ml de refrigerante seja colocada
em cada garrafa. É claro que nem todas as garrafas têm precisamente 1000 ml devido a fontes
Questão 04
Em uma linha de produção, um determinado pro-
aleatórias de variabilidade. O desvio padrão líquido é de 25 ml, e sabe-se que a distribuição de
seus “mls” segue uma distribuição normal.
duto possui uma especificação que segue uma
distribuição normal. A média do produto é 2 mm
e seu desvio padrão 0,2 mm. A probabilidade de
que um componente aleatoriamente selecionado
esteja entre 2 mm e 2,4 mm será:
Questão 06
Calcular a probabilidade de que uma garrafa
a) 47,72%.
aleatoriamente escolhida contenha entre 1000 e
b) 48,93%.
1050 ml de refrigerante.
c) 50,00%.
d) 52,28%.
e) 97,72%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
Qual a probabilidade de que uma garrafa de refri-
Questão 05
gerante esteja entre 985 e
1002 ml?
A função matemática da distribuição normal de
probabilidade é:
a) Exponencial.
b) Linear.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
c) Logaritma.
d) Identidade.
e) Densidade.
Questão 08
Qual a probabilidade de que uma garrafa conteVerifique seu desempenho nesta
questão, clicando no ícone ao lado.
36
nha entre 950 ml e 1020 ml?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
Qual a probabilidade de uma garrafa de refrigerante contenha entre 990 e 1000 ml?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Faça uma síntese baseada nos exercícios anteriores. Se você fosse o gerente de produção dessa
empresa, qual seria uma decisão imediata a ser
tomada para melhorar o processo de engarrafamento?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
37
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: DANFÁ, Sadjo et al. Distribuição espacial de valores prováveis de precipitação pluvial
para períodos quinzenais, em Guiné-Bissau. Disponível em: <http://www.scielo.br/pdf/rbeaa/v15n1/
a10v15n01.pdf>. Acesso em: 26 jul. 2012.
O artigo fala sobre a utilização da distribuição normal reduzida (padronizada – valor de z), em que no
artigo ele é demonstrado para diversas culturas, ou seja z já foi calculado. Análise de risco de otimização
de recursos hídricos e retorno financeiro em nível de fazenda.
Leia o artigo: SILVA, Vicente P. R. da et al. Análise da pluviosidade e dias chuvosos na região
Nordeste
do
Brasil.
Disponível
em
<http://www.scielo.br/scielo.php?script=sci_pdf&pid=S1415-
43662011000200004&lng=en&nrm=iso&tlng=pt> Acesso em: 26 jul. 2012.
Artigo que mostrará alguns tratamentos estatísticos utilizados até o momento.
FINALIZANDO
Nesse tema, você viu o estudo de variáveis aleatórias contínuas e suas distribuições de probabilidades. Assim,
você pôde concluir que a distribuição normal pode assumir qualquer valor dentro dos limites estabelecidos,
por isso, na maioria das pesquisas realizadas, a distribuição de probabilidade normal é a mais utilizada.
Nesse contexto, você verificou que basta utilizar as tabelas de distribuição binomial e distribuição normal
padronizada para uso no cálculo.
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
38
Tema 5
Intervalos de Confiança
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• O conceito e aplicação de intervalos de confiança.
• A obtenção de estimativas.
• O tamanho exigido da amostra para estimativas.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Como obter uma estimativa pontual e um erro máximo da estimativa?
• De que forma construir e interpretar intervalos de confiança para a média populacional?
• Como é possível determinar o tamanho mínimo exigido da amostra na estimativa da
média populacional μ?
39
AULA 5
Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Intervalos de Confiança
Os intervalos de confiança para a média são tipicamente construídos com o estimador não
tendencioso, estando a média no centro do intervalo. Assim, ao considerar todos os possíveis
estimadores não tendenciosos de algum parâmetro, aquele que apresentar a menor variância é
chamado de estimador mais eficiente.
Porém, até mesmo o estimador não tendencioso mais eficiente dificilmente estimará o parâmetro
populacional exatamente. Mesmo sendo verdadeiro que a acurácia aumente com amostras
maiores, ainda não haverá razão para que uma estimativa pontual obtida em uma dada amostra
seja exatamente igual ao parâmetro populacional a ser estimado. Talvez este seja um ponto
importante para as desconfianças das pesquisas realizadas em época de eleições. Há muitas
situações nas quais é preferível determinar um intervalo dentro do qual esperaríamos encontrar
o valor do parâmetro. Tal intervalo é chamado de estimativa intervalar.
Para um estimador intervalar (ou intervalo de confiança) é necessário determinar um coeficiente
de confiança, com isso o coeficiente de confiança nada mais é que a probabilidade que um
intervalo de confiança selecionado aleatoriamente inclua o parâmetro da população – isto é, a
freqüência relativa com a qual intervalos construídos de forma similar incluirão o parâmetro da
população quando o estimador for usado repetidamente um grande número de vezes. O nível de
confiança é o coeficiente de confiança expresso em percentual.
As condições requeridas para um intervalo de confiança válido de amostra grande para a média
populacional (μ); a) uma amostra aleatória é selecionada da população alvo, b) o tamanho n da
amostra é grande (isto é, n ≥30; devido ao teorema do limite central, essa condição garante que a
distribuição amostral de x’ seja aproximadamente normal. Além disso, para n grande, s será um
bom estimador de σ). Em que s é o desvio padrão da amostra e σ o desvio padrão da população.
O intervalo de confiança de (1 – α)% de uma amostra grande para μ é dado pela equação, a
40
seguir:
x ± zα /2σ x =
x ± zα /2
σ
n
em que zα/2 é o valor z com uma área α/2 à sua direita e σx = σ/√n.
O parâmetro σ é o desvio padrão da população amostrada e n é o tamanho da amostra.
Dessa forma consegue-se observar a distinção entre os objetivos das estimativas pontuais e
de estimativas por intervalos de confiança. A primeira fornece um número único extraído de
um conjunto de dados experimentais, e a última fornece um intervalo, conforme os dados
experimentais que sejam razoáveis para o parâmetro; ou seja, 100(1 – α)% de tais intervalos
compreendam o parâmetro. No entanto, essas duas abordagens para estimação estão relacionadas
entre si. A relação comum é a distribuição amostral de um estimador pontual. Assim, como visto
na equação acima, a parte da equação que σ/√n é chamado de erro-padrão de um estimador que
é seu desvio padrão.
A equação do erro padrão, portanto, pode ser escrita da seguinte maneira: x ±zα/2 e.p.(x), onde
“e.p” é o erro padrão. Vale ressaltar, o ponto importante é que a amplitude do intervalo de
confiança para µ depende da qualidade do estimador pontual por meio de seu erro padrão. O
intervalo de confiança não é melhor (em termos de amplitude) do que a qualidade da estimativa
pontual, neste caso por meio de seu erro padrão estimado.
As estimativas pontuais e intervalar da média fornecem boas informações sobre o parâmetro
desconhecido µ de uma distribuição normal, ou de uma distribuição não normal da qual uma
grande amostra é retirada. Às vezes, além da medida populacional, o pesquisador pode também
estar interessado em prever o possível valor de uma observação futura. Essa estimativa é
chamada de intervalo de predição.
Para obtenção de um intervalo de predição, deve-se assumir que uma amostra aleatória venha
de uma população normal com média µ desconhecida e variância σ² conhecida. Um estimador
pontual natural de uma nova observação é X. A variância de X é σ²/n. Entretanto, para prever uma
nova observação, é preciso considerar não somente a variação devida à estimativa da média
(X), mas também a variação de uma observação futura. Assim o intervalo de predição pode ser
encontrado pela equação:
41
X – zα/2σ√1+1/n <x0 < x + zα/2σ√1+1/n
Em que:
x0 – é a observação futura.
zα/2 – é o valor de z que deixa uma área α/2 à direita.
O intervalo de predição fornece uma boa estimativa da localização de uma observação futura,
o que é bastante diferente da estimativa do valor da média amostral. Nota-se, portanto, que a
variação desta predição é a soma da variação devido à estimativa da média com a variação de
uma única observação. A distribuição t de student é a melhor a ser utilizada.
42
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula.
Ponto de Partida
Um aparelho de telefone celular possui um
desvio padrão de sua vida útil conhecido e
é igual a σ = 500, mas a média da vida útil
é desconhecida. Suponha que a vida útil dos
Questão 01
Um estimador de qualidade imparcial é:
a) Média amostral.
b) Média populacional.
c) Variância.
d) Desvio padrão.
e) Erro padrão.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 02
Em um esquema em que se toma a amostra aleatória simples de tamanho 160 de uma população de 1600 indivíduos encontram-se os valores
X = 20 (média) e σ² = 16 para a variância. Assinale a opção que corresponde à estimativa não
viezada da variância.
a) 0,07.
b) 0,08.
c) 0,09.
d) 0,10.
e) 0,15.
aparelhos celulares tenham uma distribuição aproximadamente normal. Para uma
amostra de n = 15, a média da vida útil é
X = 2900 horas de operação. Construa um
intervalo de confiança de 95% para estimar
a média da população.
Agora é com você! Responda às questões a
seguir para conferir o que aprendeu!
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 03
A concentração média de iodo recuperado de
uma amostra de medições desse material em 36
locações diferentes é 2,6 gramas por mililitro. O
valor do intervalo de confiança de 95% para a
média de concentração de iodo, com desvio padrão da população igual a 0,3.
43
a) 2,50 a 2,70.
Atenção: Para as questões 6, 7 e 8 utilize o enun-
b 2,60 a 2,80.
ciado a seguir:
c) 2,50 a 2,80.
d) 2,50 a 2,60.
Um analista financeiro obtém dados de uma
e) 2,60 a 2,70.
amostra de 600 consumidores de um total de
1000 que adquiriram uma determinada oferta. Os
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
600 consumidores gastaram, nesse supermercado, uma média de X = $ 37,49 com um desvio padrão s = $ 7,89. Para um intervalo de confiança
Questão 04
Com referência a questão anterior, o intervalo de
confiança para 99% será:
a) 2,40 a 2,80.
Questão 06
O valor médio de compras para todos os 1000
b) 2,47 a 2,73.
consumidores.
c) 2,47 a 2,60.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
d) 2,60 a 2,73.
e) 2,60 a 2,80.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 05
De acordo com a questão 3, qual deverá ser o tamanho da amostra para um intervalo de 95% e
desvio padrão populacional = 0,3, e, que a estimativa para a média (µ) esteja distante por menos
de 0,05.
a) 100.
b) 120.
c) 121.
d) 135.
e) 139.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
44
de 95%, estimar:
Questão 07
O valor total das compras dos 1000 consumidores
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
O valor médio de compras para todos os 1000
consumidores, mas para um intervalo de confiança de 99%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
O departamento de compras da empresa XYZ
deseja estimar o valor médio das compras por
cliente em uma loja de perfumes no novo shopping da cidade. Com base em dados do outro
shopping existente na cidade, o desvio padrão
de tais valores de vendas é estimado em cerca
de σ $ 80,00. Qual o tamanho da amostra mínimo que deveria ter uma amostra aleatória se ele
deseja estimar a média das vendas dentro de $
25,00 e com uma confiança de 95%?
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Devido à crise econômica mundial ocorrida em
2009, muitos bancos deixaram de receber seus
créditos. Uma amostra recente de 50 empréstimos resultou em uma média de $ 257.300,00.
Assumindo um desvio padrão da população de
$ 25.000,00. Se o próximo cliente necessitar de
um novo empréstimo, determine um intervalo de
confiança de predição de 95% para a quantia do
empréstimo do cliente.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
45
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: BALABAN, Geni; SILVA, Gisélia A.P da. Prevalência de sobrepeso e obesidade
em crianças e adolescentes. Disponível em: <http://www.scielo.br/pdf/jped/v77n2/v77n2a08.pdf>
Acesso em: 26 jul. 2012.
O artigo demonstra a utilização de intervalos de confiança para a pesquisa realizada.
Leia o artigo: FERREIRA, Marlene de Cássia Trivellato; MARTURANO, Edna Maria. Ambiente
familiar e os problemas do comportamento apresentados por crianças com baixo desempenho
escolar. Disponível em: <http://www.scielo.br/pdf/%0D/prc/v15n1/a05v15n1.pdf> Acesso em: 26
jul. 2012.
Leia o artigo: RIBEIRO, Carla de Matos et al. Determinação do índice de acidez de biodiesel por
titulação potenciométrica utilizando-se diferentes métodos. Disponível em: <http://200.20.213.30/
handle/10926/1193 > Acesso em: 26 jul. 2012.
Esse trabalho consistiu na determinação do índice de acidez de biodiesel de soja/sebo por meio
de titulação potenciométrica.
Leia o artigo: SCHEIN, Diana; LIMA, Milton Luiz Paiva. Uma metodologia para o dimensionamento
de frota de rebocadores em terminais portuários: uma aplicação ao porto do Rio Grande.
Disponível em: <http://www.podesenvolvimento.org.br/inicio/index.php?journal=podesenvolvim
ento&page=article&op=view&path[]=47>. Acesso em: 26 jul. 2012.
Nesse trabalho é aplicada uma metodologia para encontrar o número adequado de rebocadores
para atender ao Porto do Rio Grande.
FINALIZANDO
Nesse tema, você viu que o estudo de intervalos de confiança oferece ao pesquisador uma melhor
compreensão dos dados em estudo, isto se deve porque a utilização do intervalo de confiança determina,
basicamente, uma faixa possível de sua resposta. Como observado, em “ampliando o conhecimento”,
diversas pesquisas utilizam intervalos de confiança para justificar e validar seus estudos. Por meio de
distribuição normal ou aproximadamente normal (t student) pode-se determinar um intervalo pontual ou
estimado de confiança.
46
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
Tema 6
Teste de Hipótese com Uma ou Duas Amostras
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• Os testes de hipóteses.
• Níveis de significância utilizados nas hipóteses.
• Os tipos de erros I e II.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Como estabelecer hipóteses aos estudos (nula e alternativa)?
• Como identificar os erros tipo I e II?
• De que forma é possível interpretar um nível de significância?
• Como analisar quando é necessário usar um teste estatístico mono ou bicaudal?
47
• De que forma é possível explicar uma decisão baseada nos resultados de um teste
estatístico?
AULA 6
Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Teste de Hipótese com Uma ou Duas Amostras
Entende-se por uma hipótese estatística afirmação ou conjectura sobre uma ou mais populações.
Em um teste de hipótese, é necessário iniciar com um suposto valor (hipotético) de um parâmetro
da população. Depois de coletar uma amostra aleatória, compara-se a estatística da amostra, tal
como a média amostral (X), com o parâmetro suposto, tal como a média populacional hipotética
(µ). Então, ou é aceito ou rejeitado o valor hipotético como correto. O valor hipotético é rejeitado
somente se o resultado da amostra for claramente improvável de ocorrer quando a hipótese for
verdadeira.
Em geral, o problema enfrentado por pesquisadores não é tanto a estimativa dos parâmetros
populacionais, mas sim a formação de um procedimento com base em dados que se possa
concluir sobre algum sistema científico. Para isso, há a necessidade de postular algo, ou seja,
criar uma hipótese.
Nunca se sabe com absoluta certeza se uma hipótese estatística é verdadeira ou falsa, a não ser
que toda a população seja examinada, o que é inviável na maioria das situações. Por isso, ao
extrair uma amostra aleatória da população de interesse e usar os dados contidos nela, conseguese fornecer evidência que se apoie ou refute a hipótese. O procedimento de decisão deve ser
feito em consonância com a probabilidade de uma conclusão errada. A afirmação formal de
uma hipótese é frequentemente influenciada pela estrutura da probabilidade de uma conclusão
errônea. Assim, se o pesquisador está interessado em apoiar fortemente uma alegação, ele
espera chegar à alegação na forma de rejeição de uma hipótese.
Portanto, você percebe que a primeira etapa em um teste de hipótese é a de formular hipótese
48
nula e a hipótese alternativa, comumente nos livros de estatísticas são indicadas por H0 ou Hn
para hipótese nula; e H1 ou Ha para hipótese alternativa. A hipótese nula é o valor suposto ou
alegado do parâmetro o qual é comparado com o resultado da amostra. Ele é rejeitado somente
se o resultado da amostra for improvável sendo a hipótese considerada verdadeira. A hipótese
alternativa é aceita somente se a hipótese nula for rejeitada.
Em seguida, em uma próxima etapa (2), o pesquisador deve especificar o nível de significância a
ser utilizado. O nível de significância é o padrão estatístico especificado para rejeitar a hipótese
nula. Assim, se for especificado um nível de significância de 5%, a hipótese nula é rejeitada
somente se o resultado da amostra for tão diferente do valor suposto ou alegado que uma
diferença igual ou maior ocorreria por acaso com uma probabilidade máxima de 0,05.
Observe que ainda existe uma probabilidade de 0,05 de rejeitar a hipótese nula sendo a mesma
verdadeira. Este é o chamado erro tipo I. A probabilidade do erro tipo I é sempre igual ao nível
de significância utilizado como padrão para rejeitar a hipótese nula; ele é representado pela letra
grega minúscula α (“alfa”), sendo que α, deste modo, representa o nível de significância. Os
níveis de significância mais frequentemente utilizados em testes de hipóteses são os de 5% e
1%. Já um erro tipo II é aquele que ocorre quando a hipótese nula é aceita mesmo sendo falsa.
Nesse contexto, após especificado o nível de significância, o pesquisador deve selecionar a
estatística do teste. A estatística de teste será ou a estatística da amostra (o estimador não
tendencioso do parâmetro sendo testado), ou uma versão modificada da estatística da amostra.
Em seguida, estabelece o valor crítico ou valores críticos da estatística de teste. Porém, antes
de tomar a decisão, o pesquisador precisa determinar o valor real da estatística de teste, por
fim, com esses procedimentos adotados, toma-se a decisão, baseado no valor observado da
estatística da amostra é comparada com o valor crítico (ou valores) as estatística de teste.
As situações possíveis ao testar uma hipótese estatística, pode ser observado na figura 1, a
seguir:
Não rejeitar H0
Rejeitar H0
H0 é verdadeira
Decisão correta
Erro tipo I
H0 é falsa
Erro tipo II
Decisão correta
Figura 1 – Situações possíveis ao testar uma hipótese estatística.
49
Para a probabilidade de se cometer um erro tipo II, denotada pela letra grega β (“beta”), é
impossível de ser calculada, a não ser que se tenha uma hipótese alternativa específica. Essa
é uma probabilidade alta, que indica um procedimento de teste no qual é muito provável que
será rejeitada. Idealmente seria utilizar um procedimento de teste para o qual a probabilidade
dos erros tipo I e II sejam ambos pequenos. Existem situações, por exemplo, em que se deseje
cometer um erro tipo II, assim à medida que a hipótese alternativa aproxima de 1, o valor de β
diminui para 0 (zero).
50
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (qua-
com média μ e variância σ2. O valor da estatística teste t com distribuição de Student sob a hipótese H0:μ =100 é de –1,7864 e sabe-se que P(t
≥1,7864) = 0,0446. Suponha que a probabilidade
de erro do tipo I esteja sendo controlada em 5%.
Assinale a resposta correta.
a) Como o valor probabilístico do teste é 0,0446
conclua H0: µ = 100.
b) Como o valor probabilístico do teste é 0,0446
conclua H1: µ ≠ 100.
c) Como o valor probabilístico do teste é 0,0892
não há evidência para rejeitar H0: µ = 100.
d) Como o valor probabilístico do teste é 0,0223
conclua H1: µ ≠ 100.
e) Não se pode tirar nenhuma conclusão, pois o
tamanho da amostra, a média amostral e o desvio padrão amostral não foram dados.
tro) casas decimais após a vírgula.
Ponto de Partida
Um aparelho de telefone celular possui um
desvio padrão de sua vida útil conhecido e
é igual a σ = 500, mas a média da vida útil
é desconhecida. Suponha que a vida útil dos
aparelhos celulares tenham uma distribuição aproximadamente normal. Para uma
amostra de n = 15, a média da vida útil é
X = 2900 horas de operação. Construa um
intervalo de confiança de 95% para estimar
a média da população.
Agora é com você! Responda às questões a
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 02
O resultado de um ensaio destinado a investigar
a efetividade da vacinação de animais na prevenção de certo tipo de doença produziu a tabela
de contingência seguinte.
Vacina
Sim
Não
Doença
Sim
Não
14
42
16
28
seguir para conferir o que aprendeu!
Deseja-se testar a hipótese de que os perfis (de
Questão 01
Assinale a opção que dá o valor da contribuição
Considere o teste da hipótese H0:μ =100 contra
alternativa H1:μ ≠ 100 em uma amostra da normal
linha) de vacinados e não vacinados coincidem.
da primeira célula da tabela para a estatística
teste de homogeneidade do qui-quadrado.
51
a) 0,326.
Assinale a opção que dá o valor da estatística F
b) 0,450.
utilizada para testar a hipótese de igualdade de
c) 0,400.
médias das marcas.
d) 0,500.
a) 2.
e) 0,467.
b) 10.
c) 12.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
d) 20.
e) 72.
Atenção: As questões 3 e 4 referem-se ao enunciado seguinte.
Em um estudo controlado em que o interesse con-
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
centra-se no desgaste de pneus testaram-se um
certo número de marcas obtendo-se os resultados
constantes da tabela de análise de variância dada
abaixo.
Fonte
Questão 05
A probabilidade de cometer um erro tipo II ao
Graus de Li-
Soma de Qua-
custo de aumentar a probabilidade de cometer
berdade
drados
Marcas
3
60
um erro tipo I, para um tamanho fixo de amostra,
Erro
36
72
Total (Corrigi-
39
132
do)
Questão 03
Assinale a opção que dá o número de marcas de
pneus estudadas.
a) 2.
b) 3.
c) 4.
d) 5.
e) 12.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
uma redução na probabilidade de um erro normalmente resulta num aumento da probabilidade
de outro erro. Felizmente, a probabilidade de cometer ambos os tipos de erros pode ser reduzida
se:
a) Rejeitar H0.
b) Aceitar H0.
c) Aceitar H1.
d) Rejeitar H1.
e) Aumentar o tamanho da amostra.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 06
Utilizando as distribuições t student.
Questão 04
52
A hipótese nula formulada é de que a média da
vida útil de um ar condicionado da marca X é, no
mínimo, de 4.200 horas. A média da vida útil para
uma amostra de n = 10 é X (média) = 4.000 horas,
com um desvio padrão amostral de s = 200 horas.
A vida útil do ar condicionado, presume-se, segue
uma distribuição normal. Teste a hipótese nula a
mece com uma hipótese nula de que o valor
médio de todas as contas a receber é, no mínimo, $ 260.000,00. Dado que a média da amostra é $ 240.000,00, teste essa hipótese, ao nível
de significância de 5%.
um nível de significância de 5%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
Um controller deseja testar a hipótese de que o
valor médio de todas as contas a receber em uma
empresa é $ 260.000,00, tomando para tanto uma
amostra de 36 clientes (n = 36) e calculando a média amostral. Ele deseja rejeitar o valor hipotético
de $ 260.000,00 somente se tal valor for contraditado pela média da amostra. Determine as hipóteses nula e alternativa.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
O representante de um grupo comunitário informa, a uma pessoa que está interessada em
estabelecer um centro comercial, que a renda
média familiar na área é de $ 1.500,00. Suponha que, para o tipo de região em questão, é
possível supor que a renda média familiar tem
distribuição aproximadamente normal, e que se
pode aceitar o desvio padrão como sendo σ = $
200,00, com base em um estudo anterior. Para
uma amostra aleatória de n = 15 famílias, a ren-
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
Para a hipótese nula da questão 7, determinar os
valores críticos da média da amostra para testar a
hipótese a um nível de significância de 5%. Dado
da média familiar foi X (média) $ 1.400,00. Testar a hipótese nula de que µ = $ 1.500,00, estabelecendo limites críticos da média da amostra,
utilizando um nível de significância de 5%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
que se conhece o desvio padrão dos valores das
contas a receber, σ = $ 43.000,00.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
Suponha que o controller das questões 7 e 8 co-
53
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: LANDÍN, Pedro R.; SÁNCHEZ, Ernesto. Niveles de razonamiento probabilístico
de estudiantes de bachillerato frente a tareas de distribuición binomial. Disponível em: <http://
revistas.pucsp.br/index.php/emp/article/view/4842/3703> Acesso em: 26 jul. 2012.
Neste artigo os autores apresentam uma hierarquia de raciocínios utilizados para avaliar as
respostas de alunos do ensino médio a um questionário contendo tarefas relacionadas com a
distribuição binomial.
Leia o artigo: SILVA, Vicente P. R et. al. Análise da pluviosidade e dias chuvosos na região Nordeste
do Brasil. Disponível em <http://www.scielo.br/pdf/rbeaa/v15n2/v15n02a04.pdf>. Acesso em: 26.
Jul. 2012.
O artigo mostrará alguns tratamentos estatísticos utilizados até o momento.
Leia o artigo: GUARIEIRO, Lílian Lefol Nani et. al. Metodologia analítica para quantificar o teor
de biodiesel na mistura biodiesel: diesel utilizando espectroscopia na região do infravermelho
Disponível em <http://www.scielo.br/pdf/qn/v31n2/a41v31n2.pdf>. Acesso em: 26 jul. 2012.
O artigo mostrará a metodologia do teste de hipótese, bem como o método de regressão linear
a ser visto no tema 8.
Leia o artigo: RODRIGUES, Jackson Martins et. al. Efeitos locais e de larga escala na dinâmica
climática do município de Viçosa/MG. Disponível em <http://www.seer.ufu.br/index.php/
sociedadenatureza/article/viewFile/9883/pdf_21> Acesso em: 26 jul. 2012.
O artigo trará o teste de hipótese utilizando t student.
FINALIZANDO
Nesse tema, você viu que o teste de hipótese auxilia o pesquisador na tomada de decisão.
Necessariamente é preciso lançar mão uma hipótese, e em seguida adotar o procedimento para teste
estatístico de hipótese. A hipótese nula é o valor suposto do parâmetro o qual é comparado com o
resultado da amostra. Ele é rejeitado somente se o resultado da amostra for improvável sendo a hipótese
considerada verdadeira. Portanto, você viu que em um teste de hipótese deve-se levar em consideração
um nível de significância, pois é ele que determina se a hipótese é aceita ou rejeitada.
54
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
Tema 7
Correlação e Regressão
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• O conceito de correlação linear, variáveis dependentes e independentes
• O uso de coeficiente de um correlação.
• Os tipos de correlações.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Quais os conceitos de correlação linear, variáveis dependentes e independentes e tipos
de correlações?
• Como simular um coeficiente de correlação?
• Como diagnosticar um teste de hipótese para um coeficiente de correlação populacional
p.?
55
AULA 7
Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Correlação e Regressão
O termo regressão foi introduzido por Francis Galton, em seu estudo inicial, Galton verificou
que, embora houvesse uma tendência de pais altos terem filhos altos e que pais baixos terem
filhos baixos, a altura média de pais de uma dada altura tendia a se deslocar ou “regredir” até
uma média da população como um todo. Assim, pode-se dizer que a altura dos filhos de pais
extraordinariamente altos ou baixos tende a se mover para a altura média da população. A lei de
regressão universal de Galton foi confirmada por seu amigo Karl Pearson, que coletou mais de
mil registros das alturas dos membros de grupos de famílias.
A moderna interpretação da regressão é, porém, bem diferente, em linhas gerais a análise de
regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em
relação a uma ou mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever
a média (da população) ou o valor médio da dependente em termos dos valores conhecidos ou
fixos (em amostragem repetida) das explicativas.
Assim, o modelo estatístico de uma regressão linear simples para dados n pares de valores de
duas variáveis Xi, Yi (i = 1,2,3,...,n), se admitir que Y é uma função linear de X, pode-se estabelecer
uma regressão linear simples, cujo modelo estatístico é: Yi = α + βXi + ui.
Em que α e β são parâmetros. O coeficiente angular da reta (β) é também denominado de
coeficiente de regressão e o coeficiente linear da reta (α) é também denominado como termo
constante da equação de regressão. A análise de regressão também pode ser aplicada às
relações não lineares. Ao estabelecer o modelo de regressão linear simples, pressupõem que: a)
a relação entre X e Y é linear; b) os valores de X são fixos, isto é, X não é uma variável aleatória;
c) a média do erro é nula, isto é, E(ui) = 0; d) para um dado valor de X, a variância do erro u é
sempre σ², denominada variância residual, isto é: E(ui²) = σ², ou então, E[Yi – E(Yi|Xi)]² = σ².
Assim, pode-se dizer que, o erro é homocedástico ou que tem-se homocedasticia (do erro ou
56
da variável dependente); e) o erro de uma observação é não correlacionado com o erro de outra
observação, isto é, E(uiuj) = 0 para i ≠ j; f) os erros tem distribuição normal.
Deve-se ainda verificar, se o número de observações disponíveis é maior do que o número de
parâmetros da equação de regressão. Para ajustar uma regressão linear simples precisa-se
ter, no mínimo, três observações. Assim, se só dispor de duas observações (dois pontos), a
determinação da reta é um problema de geometria analítica; não é possível, nesse caso, fazer
nenhuma análise estatística. Com base nas cinco pressuposições, é possível demonstrar que
as estimativas dos parâmetros obtidas pelo método dos mínimos quadrados são estimativas
lineares não tendenciosas de variância mínima.
A pressuposição (b) não é, na verdade, essencial. Já a pressuposição (c) exclui, por exemplo, a
existência de erros sistemáticos de medida da variável Y. A pressuposição (d) é necessária para
que se possa utilizar as distribuições de t e de F para testar hipóteses a respeito dos valores
dos parâmetros ou construir intervalos de confiança. Em alguns casos, é possível justificar
essa pressuposição com base no teorema do limite central. Esse teorema, na sua versão mais
geral, estabelece que a soma de um grande número de variáveis aleatórias independentes
tem distribuição aproximadamente, normal, desde que nenhuma delas seja dominante. A
pressuposição (e) geralmente não é obedecida quando é trabalhado com séries cronológicas de
dados, portanto, há uma autocorrelação nos resíduos.
O erro (ui) do modelo estatístico de uma regressão linear pode ser devido à influência de todas
as variáveis que afetam a variável dependente e que não foram incluídas no modelo. Uma vez
que as variáveis não foram consideradas, devem ser as menos importantes, seus efeitos devem
ser relativamente pequenos. Considerando que o número de fatores que podem afetar certa
variável dependente é bastante grande, e desde que seus efeitos sejam aditivos e independentes,
pode-se concluir, com base no teorema do limite central, que erro residual tem distribuição
aproximadamente normal.
Portanto, a regressão e correlação estão intimamente relacionadas, porém, conceitualmente
muito diferente da análise de regressão, é a análise de correlação, cujo objetivo básico é medir
a intensidade ou o grau de associação linear entre duas variáveis. O coeficiente de correlação
mede essa intensidade da associação (linear). Na análise de regressão não está preocupada em
princípio em tal medição. Em vez disso, estimar ou prever o valor médio de uma variável com
base nos valores fixados de outras variáveis.
Assim, vale a pena mencionar algumas diferenças fundamentais entre regressão e correlação. Na
57
análise de regressão há uma assimetria na forma como as variáveis dependentes e explicativas
são tratadas. Supõe-se que a variável dependente seja estatística, aleatória ou estocástica,
isto é, que tenha uma distribuição de probabilidade. Portanto, por outro lado, que as variáveis
explicativas tenham fixadas (em amostragem repetida). Na análise de correlação, por outro lado,
é tratado quaisquer (duas) variáveis simetricamente; não há nenhuma distinção entre as variáveis
dependente e explicativa. Ainda que ambas as variáveis sejam aleatórias.
58
Agora é a sua vez
INSTRUÇÕES
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um sim-
II. A correlação linear negativa é aquela em que
os pontos do diagrama é uma reta descendente.
III. Uma correlação não linear é aquela em que
os pontos do diagrama é uma reta ascendente e
descendente.
IV. O coeficiente de correlação de Pearson os limites de r serão sempre [0,1].
a) Apenas I está correta.
b) Apenas III está correta.
c) I e IV estão corretas.
d) II e III estão corretas.
e) I e II estão corretas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
ples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula.
Ponto de Partida
Calcule o coeficiente de correlação e analise
o resultado. Para isso, veja em sua sala de
aula e aleatoriamente anote 10 valores das
notas de matemática e estatística, depois
que treinarem bastante façam outras correlações com outras disciplinas.
Agora é com você! Responda às questões a
seguir para conferir o que aprendeu!
Atenção: O enunciado seguinte diz respeito às questões 2, 3, 4 e 5.
Considere o modelo de regressão linear com t =
1,..., n, onde α e β são parâmetros desconhecidos, os yt são observações de uma variável dependente Y, os xt são realizações de uma variável exógena X e os erros εt são realizações não
diretamente observáveis de variáveis aleatórias
não correlacionadas com média nula e σ² > 0.
Questão 02
No contexto da distribuição amostral do estimador de mínimos quadrados de β (β^), assinale a
Questão 01
Analise as proposições a seguir:
opção que não é correta.
a) O valor esperado da distribuição amostral de
β^ é β.
I. A correlação linear positiva é aquela em que os b) A variância da distribuição amostral de β^ aumenta com σ².
pontos do diagrama é uma reta ascendente.
c) A variância da distribuição amostral de β^ dimi-
59
nui quando aumenta a variabilidade das observa- e) Tem pouco interesse prático se nenhuma das
ções X em torno da média.
observações de X for exatamente nula.
d) Como β^ é constante para uma amostra particular
qualquer modelo de regressão, não possui uma Verifique seu desempenho nesta
distribuição amostral.
questão, clicando no ícone ao lado.
e) A distribuição amostral de β^ é normal se os erros
forem normalmente distribuídos.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 05
Os estimadores de mínimos quadrados α^ e β^
tendem a mostrar que tipo de comportamento
quando a média das observações de X é posi-
Questão 03
tiva?
a) São independentes.
Suponha os erros normais. Se o intervalo de con- b) Variam na mesma direção, pois para uma
fiança calculado para β inclui o zero pode-se con-
amostra particular qualquer do modelo subes-
cluir que:
tima-se ou superestima-se a reta de regres-
a) O erro médio quadrático da regressão é nulo.
são verdadeira.
b) O coeficiente de determinação é nulo.
c) Não existe um efeito causal de X em Y, mas pode
haver um efeito causal de Y em X.
d) Y não sofre influência linear de X.
e) A função de regressão passa pela origem.
c) Variam em direções opostas dado o sinal negativo da covariância entre eles.
d) Variam na mesma direção se o sinal de β^ for
positivo.
e) Variam na mesma direção se os sinais de α^ e
β^ forem ambos positivos.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 04
No contexto do cálculo do intervalo de confiança
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Atenção: Para as questões 6, 7, 8 e 10
utilize o enunciado a seguir:
para α quando X=0 é um valor plausível para a regressão, assinale a opção correta.
Um dos problemas desafiadores enfrentados
a) O intervalo coincide com o intervalo de previsão pela área de controle de poluição nas águas é
para uma nova observação de Y quando X=0.
apresentado pela indústria de couro. Os deje-
b) O intervalo coincide com o intervalo para E(Y|X=0). tos dos curtumes são quimicamente complexos.
c) Geralmente o intervalo terá limites iguais ao inter- Eles são caracterizados por altos valores de devalo análogo calculado para β .
manda de oxigênio bioquímico, sólidos voláteis e
d) O intervalo de confiança só deve ser calculado se outras medidas de poluição. Considere os dados
o intervalo para β contiver o zero.
60
experimentais obtidos e dispostos na tabela 1.
São 33 amostras de desejos quimicamente tratados
metro (a).
em um estudo da Universidade Estadual da Virgínia.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Redução de
Demanda
Redução de
Demanda
sólidos, x
de oxigênio
sólidos, x
de oxigênio
(%)
químico, y
(%)
químico, y
(%)
(%)
3
5
36
34
7
11
37
36
11
21
38
38
15
16
39
37
18
16
39
36
21
28
39
45
29
27
40
39
30
25
41
41
30
35
42
40
31
30
42
44
31
40
43
37
32
32
44
44
33
34
45
46
33
32
46
46
34
34
47
49
36
37
50
51
36
38
Questão 09
Indique o parâmetro (b) da regressão
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
Determine a equação de Y^ estimado.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 06
Determine o coeficiente de correlação.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
O coeficiente de correlação linear é positivo, negativo, não linear, explique.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
Faça a análise de regressão linear – indique o parâ-
61
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: BALABAN, Geni; SILVA, Gisélia A.P da. Prevalência de sobrepeso e obesidade
em crianças e adolescentes. Disponível em: <http://www.scielo.br/pdf/jped/v77n2/v77n2a08.pdf>
Acesso em: 26 jul. 2012.
O artigo demonstra a utilização de intervalos de confiança para a pesquisa realizada.
Leia o artigo: RIBEIRO, Carla de Matos et al. Determinação do índice de acidez de biodiesel por
titulação potenciométrica utilizando-se diferentes métodos. Disponível em: <http://200.20.213.30/
handle/10926/1193>. Acesso em: 26 jul. 2012.
Esse trabalho consistiu na determinação do índice de acidez de biodiesel de soja/sebo por meio
de titulação potenciométrica.
Leia o artigo: DESSEN, Marina Campos; PAZ, Maria das Graças da. Bem-estar pessoal nas
organizações. Disponível em: <http://www.scielo.br/pdf/ptp/v26n3/a18v26n3.pdf> Acesso em: 26
jul.2012.
As autoras observarão a utilização da regressão linear para confrontar personalidades dentro
das organizações.
FINALIZANDO
Nesse tema, você viu que a regressão linear e correlação estão intimamente relacionadas, mas que
a regressão linear há uma assimetria na forma como as variáveis dependentes e explicativa são
tratadas. Pode-se por meio de uma regressão linear estimar uma situação por meio da equação de
regressão. Nessa perspectiva, você viu que já a análise de correlação tem por objetivo básico mensurar
a intensidade ou o grau de associação linear entre duas variáveis.
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
62
Tema 8
Teste Qui-Quadrado e Teste F
ícones:
i
a
lf
h
g
k
t s
ud r
b mi e q
l
nc p x w
o
zj
x y
i
Conteúdos e Habilidades
Conteúdo
Nesta aula, você estudará:
• A importância e utilidade dos testes qui-quadrado.
• A distribuição de frequência.
• As distribuições F.
Habilidades
Ao final, você deverá ser capaz de responder as seguintes questões:
• Como usar a distribuição qui-quadrado para testar se uma distribuição de frequência se
ajusta a uma distribuição alegada?
• Como utilizar uma tabela de contingência para obter frequências esperadas?
• Como utilizar o teste qui-quadrado para verificar se duas variáveis são independentes?
• Como interpretar a distribuição F e usar sua tabela para obter valores críticos?
• De que forma é possível realizar um teste F de duas amostras para comparar duas
variâncias?
63
AULA 8
Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de
Aprendizagem para você.
Leitura Obrigatória
Correlação e Regressão
Em um teste qui-quadrado a preocupação é testar um valor hipotético da variância populacional,
de acordo com a equação a seguir:
X2 =
( n − 1) s 2
σ 02
Dessa forma, é possível comparar frequências, obtidas em amostras, de certas categorias, com frequências
esperadas baseadas, em cada caso, em hipóteses particulares. Assim, todos os procedimentos apresentados
são testes de hipóteses, e, portanto, possuem relação com a análise dos resultados da amostra. As
distribuições X² (qui-quadrado) podem ser utilizadas ainda em hipóteses relativas à bondade de ajustamento,
à independência de duas variáveis e à diferença entre k proporções amostrais.
A hipótese nula, em testes de bondade de ajustamento, é uma condição estipulada referida ao padrão
esperado de frequências em uma série de categorias. O padrão esperado pode ajustar-se à suposição de igual
verossimilhança e ser uniforme, ou pode ajustar-se a distribuições de probabilidade tais como a binomial,
Poisson ou Normal.
Enquanto o teste qui-quadrado é utilizado para testar as diferenças entre k proporções a análise de variância
é empregada para testar as diferenças entre k médias. Uma suposição básica implícita na análise de variância
é que as diversas médias amostrais são obtidas de populações normalmente distribuídas e que tem a mesma
variância. Todavia, descobriu-se que o procedimento de teste não é afetado por violações na hipótese de
normalidade, quando as populações são unimodais e os tamanhos das amostras são aproximadamente iguais.
Uma vez que a hipótese nula é que as médias da população são iguais, a suposição de iguais variâncias
(homogeneidade da variância) também implica que o teste se relaciona com a hipótese de que as médias
foram obtidas de uma mesma população. Isto porque toda população normalmente distribuída se define
tendo como parâmetros a média, a variância (ou desvio padrão).
O conceito básico implícito na análise de variância foi desenvolvido por Ronald Aylmer Fisher, a distribuição
F foi assim denominada justamente em sua honra.
64
A distribuição F tem grande aplicação na comparação de duas variâncias. As aplicações da distribuição F são
encontradas em problemas que envolvam duas ou mais amostras. A estatística F ou distribuição F é definida
pela razão de duas variáveis aleatórias qui-quadrado independentes, cada uma dividida por seu número
de graus de liberdade. Ou seja, , em que U e V são variáveis aleatórias independentes com distribuições
qui-quadrado com v1 e v2 graus de liberdade, respectivamente. Assim, como a distribuição normal de
probabilidade a distribuição F também é caracterizada por uma função densidade.
No entanto, o raciocínio conceitual deve-se primeiramente, calcular a média para cada grupo de amostra e
depois determinar o erro padrão da média (sx) com base somente nas diversas médias amostrais.
Operacionalmente, este é o desvio padrão dos diversos valores da média. O erro padrão da média será que
pode ser utilizada para calcular a variância da população (comum) da qual forma obtida as diversas amostras.
Essa estimação da variância da população chama-se quadrado médio entre grupos (QME). Em seguida,
calcula-se separadamente a variância dentro de cada grupo amostral e com relação a cada média de grupo.
Por conseguinte, combinam-se estes valores da variância, ponderando-os de acordo com (n – 1) para cada
amostra. A estimação resultante da variância da população chama-se quadrado médio dentro dos grupos
(QMD).
Sendo a hipótese nula μ1 = μ2 = μ3, ..., μk, for verdadeira, tem-se que as duas médias quadráticas obtidas são
estimadores independentes e não tendenciosos da mesma variância da população σ². Todavia, se a hipótese
nula for falsa, o valor esperado QME é maior do que o de QMD. Isto acontece, porque essencialmente, todas
as diferenças entre as médias populacionais inflacionarão QME, enquanto QMD não será afetado.
É desta forma que chegamos à equação F =
Fgl1 , gl2 =
U / v1
V / v2 ue pode ser agora reescrita da seguinte forma:
QME
QMD trata-se, portanto de um teste unilateral. Se razão F se encontrar na região
de rejeição para o nível de significância especificado, então rejeita-se a hipótese de que as
diversas médias amostrais foram obtidas da mesma população.
Ainda que o processo descrito acima seja útil para elucidar o enfoque teórico implícito na
análise de variância, a ampliação desse procedimento para delineamentos mais complexos do
que a comparação de k médias amostrais torna-se demasiadamente trabalhosa e incômoda.
Até por isso, para esse procedimento é utilizado de uma tabela de distribuição F, que você
pode encontrar nos livros de estatística aplicada.
65
Agora é a sua vez
INSTRUÇÕES
Área
Nº observado na
Total
A
B
C
D
6
12
14
8
40
10
10
10
10
40
amostra, f0
Nº esperado, fe
Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Li-
Agora é com você! Responda às questões a
vro-Texto e de outros livros de apoio dispo-
seguir para conferir o que aprendeu!
níveis em sua biblioteca.
As respostas devem ser apresentadas em
textos claros, objetivos e específicos a cada
proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo
matemático, ou seja, desenvolver o cálculo
linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua
resposta. Para padronização, utilize 4 (qua-
Questão 01
Assinale a opção correta.
a) As variáveis aleatórias Y1 e Y2 são independentemente distribuídas.
b) As variáveis aleatórias Y3 e Y4 são independentemente distribuídas.
c) As variáveis aleatórias (Y1+Y3) e (Y2+Y4) não
tem distribuição conjunta normal bivariada.
tro) casas decimais após a vírgula.
d) Os vetores (Y1,Y2) e (Y3,Y4) são independen-
Ponto de Partida
e) A variável aleatória Z=(Y1)2 + (Y2)2 tem dis-
Uma empresa terceirizada de instalação
de tv a cabo, dividiu sua região em quatro
temente distribuídos.
tribuição qui-quadrado com 2 graus de liberdade.
áreas. Um cliente da operadora necessita
com certa urgência da instalação. A empresa informou ao funcionário responsável
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
pelas instalações estariam igualmente distribuídas entre as quatro áreas. A empresa
de tv a cabo toma uma amostra de 40 instalações realizadas no ano anterior, com base
Questão 02
A variável aleatória Y se distribui como a variável
nos arquivos da companhia e verifica que a
quantidade instalada em cada uma das quatro áreas , pode ser observada na tabela a
seguir. Adotando que a hipótese de que as
instalações estão distribuídas de maneira
igual (também observada na tabela), monte
a distribuição qui-quadrado.
66
em que X tem distribuição
F com dois graus de liberdade no numerador
e 3 graus de liberdade no denominador.
Assinale a opção que corresponde ao valor
esperado de Y.
a) 0,100.
b) 0,500.
c) 0,667.
d) 0,700.
e) 0,600.
a) 2.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
d) 20.
b) 10.
c) 12.
e) 72.
Verifique seu desempenho nesta
Atenção: As questões 3 e 4 referem-se ao
questão, clicando no ícone ao lado.
enunciado seguinte:
Em um estudo controlado no qual o interesse
é concentrado no desgaste de pneus testaramse um certo número de marcas obtendo-se os
resultados constantes da tabela de análise de
variância dada abaixo.
Fonte
Graus de Liber-
Soma de Quadrados
Questão 05
A distribuição F tem por finalidade:
a) Comparar a média de amostras.
b) Aceitar erro tipo II.
c) Comparar a variância de duas ou mais
dade
Marcas
3
60
amostras.
Erro
36
72
Total (Corrigi-
39
132
d) Rejeitar erro tipo II.
do)
Questão 03
Assinale a opção que dá o número de marcas de
pneus estudadas.
a) 2.
b) 3.
c) 4.
d) 5.
e) 12.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 04
Assinale a opção que dá o valor da estatística F
utilizada para testar a hipótese de igualdade de
médias das marcas.
e) Aumentar o tamanho da amostra.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 06
Para o enunciado de “Ponto de Partida”, formule
e teste a hipótese para o nível de significância
de 5%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 07
Quinze pessoas que participam de um
programa de treinamento são colocadas,
de forma aleatória, sob três diferentes tipos
de ensaio, todos eles relacionados com o
desenvolvimento de um nível específico de
67
habilidade em pesquisa científica. Os graus obtidos
Para o enunciado 7 determine o quadrado
no teste de conclusão da unidade instrucional são
médio entre os grupos.
apresentados na tabela abaixo, juntamente com
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
o grau médio de desempenho associado a cada
tipo de ensino. Usar o procedimento da análise de
variância (distribuição F) para testar a hipótese nula
de que as três médias amostrais foram obtidas da
mesma população, a um nível de significância de
5%.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 08
Método
Graus de prova
de Instrução
Total
Média
de
dos
graus
graus
A1
86
79
81
70
84
400
80
A2
90
76
88
82
89
425
85
A3
82
68
73
71
81
375
75
Determine as hipóteses para o modelo acima e
calcule a média global dos 15 graus das provas.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 09
Para o enunciado da questão 7, determine o
erro padrão da média, baseado nas três médias
amostrais.
Verifique seu desempenho nesta
questão, clicando no ícone ao lado.
Questão 10
68
LINKS IMPORTANTES
Você quer saber mais sobre esse assunto? Então:
Leia o artigo: SILVA, Vicente P. R. et. al. Análise da pluviosidade e dias chuvosos na região
Nordeste do Brasil. Disponível em <http://www.scielo.br/pdf/rbeaa/v15n2/v15n02a04.pdf> Acesso
em: 26 jul. 2012.
Artigo que mostrará alguns tratamentos estatísticos utilizados até o momento
Leia o artigo: VASCONCELOS, Edmar Soares et. al. Agrupamento de modelos de regressão da
análise de adaptabilidade e estabilidade de genótipos. Disponível em: <http://www.scielo.br/pdf/
pab/v45n12/v45n12a04.pdf>. Acesso em: 26 jul. 2012.
O artigo demonstra a utilização de regressão linear, visto no tema anterior e a distribuição F.
Ler o artigo: BECK, Carmem Cristina et. al. Fatores de risco cardiovascular em adolescentes
de município do sul do Brasil: prevalência e associações com variáveis sociodemográficas.
Disponível em: <http://www.scielo.br/pdf/rbepid/v14n1/04.pdf>. Acesso em: 26 jul. 2012.
Esse artigo determina a prevalência de fatores de risco cardiovasculares com variáveis
sociodemográficas utilizando o procedimento estatístico qui-quadrado.
FINALIZANDO
Nesse tema, você viu que o teste de hipótese auxilia o pesquisador na tomada de decisão. Observou
ainda que para comparar variâncias é utilizado a distribuição F e que o teste qui-quadrado é utilizado
para comparar as frequências, sendo que uma frequência é a observada na amostra e a outra é a
frequência esperada. Assim como conclusão, você viu que esses testes são de grande importância para
pesquisadores, administradores de empresa e contabilistas (auditores).
Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS
e verificar a etapa que deverá ser realizada. Bons estudos!
69
REFERÊNCIAS
BECK, C. C.; et al. Fatores de risco cardiovascular em adolescentes de município do sul do Brasil:
prevalência e associações com variáveis sociodemográficas. Revista Brasileira Epidemiologia: 2011, v.
14, n. 1, p. 36-49.
BRASIL. CAPES. Disponível em: <http://www.capes.gov.br/>. Acesso em: 26 jul. 2012.
CRESPO, A. A. Estatística Fácil. São Paulo: Editora Saraiva, 1998.
GUARIEIRO, L. L, N.; et al. Metodologia analítica para quantificar o teor de biodiesel na mistura de
biodiesel: diesel utilizando espectroscopia na região do infravermelho. Revista Química Nova, 2008, v.
31, n. 2, p. 421-426.
IBGE. Disponível em: < http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm>.
Acesso em: 26 jul. 2012
KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: McGraw-Hill do Brasil,
1982.
LANDÍN, P. R.; SÁNCHEZ, E. Niveles de razonamiento probabilístico de estudiantes de bachillerato
frente a tareas de distribuición binomial. São Paulo: Revista de Educação Matemática e Pesquisa, 2010,
v. 12, n. 3, pp 598-618.
LOPES, C. E. O ensino da estatística e da probabilidade na educação básica e a formação dos
professores. Disponível em: <http://www.scielo.br/pdf/ccedes/v28n74/v28n74a05.pdf>. Acesso em: 26
jul. 2012.
RIBEIRO, S. D. As pesquisas sobre o ensino da estatística e da probabilidade no período de 2000 a
2008: uma pesquisa a partir do Banco de Teses da CAPES. São Paulo: PUCSP, 2010.
RON, L.; FARBER, B. Estatística aplicada. trad. Cyro Patarra. 2. ed. São Paulo: Prentice Hall, 2007.
RODRIGUES, J. M.; et alli. Efeitos locais e de escala na dinâmica climática no município de Viçosa.
Uberlândia: Revista Sociedade e Natureza, 2010, v. 22, n. 3, p. 593-610.
70
SEADE. Disponível em: <http://www.seade.gov.br/>. Acesso em: 26 jul. 2012.
SILVA, V. P. R.; PEREIRA, E. R. R.; AZEVEDO, P. V.; SOUSA, F. A. S.; SOUSA, I. F. Análise da
pluviosidade e dias chuvosos na região Nordeste do Brasil. Campina Grande: Revista Brasileira de
Engenharia Agrícola e Ambiental, v. 15, n. 2, p. 131-138, 2011.
SHEIN, D.; de LIMA, M. L. P. Uma metodologia para o dimensionamento de frota de rebocadores
em terminais portuários: uma aplicação ao porto do Rio Grande. Rio de Janeiro: Revista Pesquisa
Operacional para o Desenvolvimento, v. 2, n. 2, p. 119-139, mai/ago 2010.
TAVARES, B. S.; BORGES JUNIOR, J. C. F.; CORREA, M. M.; LIMA, J. R. S.; DANTAS NETO, J.
Análise de risco e otimização de recursos hídricos e retorno financeiro em nível de fazenda. Campinas
Grande: Revista Brasileira de Engenharia Agrícola e Ambiental, v. 15, n. 4, p. 338-346, 2011.
VASCONCELOS, E. S.; et alli. Agrupamento de modelos de regressão da análise de adaptabilidade
e estabilidade de genótipos. Revista Pesquisa Agropecuária Brasileira. Brasília: 2010, v. 45, n. 12, p.
1357-1362.
71
GABARITO
TEMA 1
Estatística Descritiva
Ponto de Partida
Resposta: Isto irá depender do número de pessoas entrevistadas. Para o cálculo da
média basta somar os valores apontados e dividir pelo número de observações. Já a
moda é o valor que mais aparecer no apontamento feito.
Questão 1
Resposta: alternativa “D”.
Questão 2
Resposta: alternativa “A”.
Questão 3
Resposta: alternativa “D”.
Questão 4
Resposta: alternativa “C”.
Questão 5
Resposta: alternativa “E”.E
Questão 6
Resposta: Departamento de Recursos Humanos = 7 x 0,1 = 0,7, como não existe 0,7
pessoa arredondar para 1 pessoa.
Departamento Marketing e vendas = 35 x 0,1 = 3,5 arredondar para 4 pessoas.
Departamento Financeiro = 17 x 0,1 = 1,7 arredondar para 2 pessoas.
Departamento Produção = 41 x 0,1 = 4,1 arredondar para 4 pessoas.
Portanto, o número de funcionários do novo departamento será de 11 pessoas.
Questão 7
Resposta: Cálculo da amplitude total = 3650 – 500 = 3150.
Cálculo do nº de classes, segundo Sturges.
i= 1 + (3,3 x log n)  1+ (3,3 x log 40)  1 + (3,3 x 1,60)
72
i = 1 + 5,29  6, 29, portanto, tem-se 6 classes.
Cálculo da amplitude da classe (h) = 3150 (amplitude total) ÷ 6 (número de
classes)  525.
Questão 8
Resposta: Cálculo da média dados não agrupados = 60.800 (soma de todos os
dados) ÷ 40 (número de dados na amostra)  R$ 1.520,00.
Cálculo da média dados agrupados = 68.300 (total do produto entre o ponto médio
e a frequência simples de cada classe) ÷ 40 (número total de dados na amostra) 
R$ 1.707,50.
Questão 9
Resposta: Moda para dados não agrupados = R$ 2.000,00 (basta verificar o valor
que mais aparece na amostra  2.000 aparece 3 vezes).
Moda, segundo Czuber:
Em que:
Mo: moda.
l: limite inferior da classe modal.
D1: fi - fant.
D2: fi - fpost.
h: intervalo da classe modal.
Primeiro deve-se descobrir qual é a classe modal. C, como a moda é o valor que
mais aparece, então, a classe modal é a que tem mais elementos no caso a classe 3
com 11 elementos. Assim, desenvolvendo a equação ficará:
(11 − 8)
x525
(11 − 8) + (11 − 5)
3
=
Mo 1550 +
x525
3+ 6
3
M
o = 1550 + x525
9
=
Mo 1550 + (0,3333x525)
=
Mo 1550 + 175
=
Mo 1550 +
73
Mo = 1725
Portanto, a moda para dados agrupados será de R$ 1.725,00 – o que está
dentro da classe modal indicando que os cálculos estão corretos.
Questão 10
Resposta: Pelos dados agrupados percebe-se que o valor médio dos
empréstimos são de R$ 1.707,50, com o valor que mais aparece de
empréstimos são R$ 1.725,00. Sendo que apenas 8% da amostra emprestam
valores acima de R$ 3.125,00, como pode ser observado na tabela de
distribuição de frequência, última classe. Como gerente, o esforço deve ser
para diminuir os empréstimos entre R$ 500 a R$ 1500, que representam
45% dos valores emprestados e fazer com estes valores se aproximem da
média ou da moda emprestada pela agência.
TEMA 2
Probabilidade
Ponto de Partida
Resposta: Probabilidade de sair o número 6 = Evento (sair 6) e Respostas
possíveis = (1, 2, 3, 4, 5, 6). Portanto, a probabilidade de sair o número 6 é
1/6.
A probabilidade de o número e o número 1 é: (1/6 multiplicado por 1/6),
assim tem-se 1/36
Questão 1
Resposta: alternativa “A”.
Questão 2
Resposta: alternativa “B”.
Questão 3
Resposta: alternativa “E”.
Questão 4
Resposta: alternativa “A”.
Questão 5
Resposta: alternativa “E”.
Questão 6
Resposta: Prob = (1/6 x 1/6) = 1/36 ou 2,78%.
74
Questão 7
Resposta: Prob = 1/6 + 1/6  2/6  1/3 ou 33,33%.
Questão 8
Resposta: Prob = 1/10 ou seja, 10%.
Questão 9
Resposta: Em um baralho não viciado existem 52 cartas, com 4 naipes e cada
um com 13 cartas. Assim, a probabilidade será de Prob. Será 13/52, ou 25%.
Questão 10
Resposta: Prob = 1/52 ou 1,92%.
TEMA 3
Distribuições Discretas de Probabilidade
Ponto de Partida
Resposta: Utilizando a fóormula da distribuição discreta binomial, , temseremos:
Portanto, a probabilidade do vendedor efetuar 4 vendas será:: 0,55%.
Questão 1
Resposta: alternativa “D”.
Questão 2
Resposta: alternativa “C”.
Questão 3
Resposta: alternativa “C”.
Questão 4
Resposta: alternativa “A”.
75
Questão 5
Resposta: alternativa “E”.
Questão 6
Resposta:
Portanto, a probabilidade será: 7,78%.
Questão 7
Portanto, a probabilidade será: 34,56%.
Questão 8
Resposta: Como o analista financeiro quer saber se a maioria das contas
estão em inadimplência, então, deve-se verificar a probabilidade de 3, 4, 5
ocorrências.
= 23,04%
= 7,68%
= 1,02%
A probabilidade da maioria das contas estarem inadimplentes será a soma das
probabilidades, portanto, 31,74%.
Questão 9
Resposta:
Portanto, a probabilidade será: 25,92%
76
Questão 10
Resposta: Como os números da inadimplência podem ser contabilizados, poderiam ser utilizados
como estimadores, porém, poderiam utilizar uma distribuição normal
TEMA 4
Distribuição Normal de Probabilidade
Ponto de Partida
Resposta: Primeiro deve-se calcular a média e o desvio padrão. Em seguida, utilizando da
distribuição normal padronizada em que
basta alocar os resultados na formula fórmula e consultar a tabela 4 do Livro - Texto no apêndice
B.
Questão 1
Resposta: A
Questão 2
Resposta: alternativa “A”.
Questão 3
Resposta: alternativa “C”.
Questão 4
Resposta: alternativa “A”.
Questão 5
Resposta: alternativa “ E”
Questão 6
Resposta:
Consultando a tabela 4, apêndice B tem-seremos o valor 0,9772.
Como já visto, pela característica da tabela apresentada, para encontrar a probabilidade temos
deve que subtrair este valor do ponto médio da simetria, onde em que está localizada a média,
esse valor de simetria é 0,5000.
Com isso, a probabilidade será P(X) = 0,9772 – 0,5000= 0,4772 x 100 47,72%
Questão 7
77
Resposta:
= - 0,60, esse valor na tabela tem- seteremos 0,2743.
Como o valor está aà esquerda da média e pela definição a curva é simétrica, tem-seremos: P(X)
= 0,5000 – 0,2743 = 0,2257 ou 22,57%.
Observe que não há temos apenas um valor a ser calculado, portanto:
com isso a P(X) = 0,5319 – 0,5000 = 0,0319 ou 3,19%, perceba que a probabilidade final será a
soma das probabilidades anteriores. P(X) = 22,57% + 3,19%  25,76%
Questão 8
Resposta:
- 2,0 na tabela como já foi vistovimos 0,0228 que resulta em 47,72%.
= - 0,40, que na tabela 0,3446
P(X) = 0,5000 – 0,3446 = 0,1554 ou 15,54%
Questão 10
Resposta: Para melhorar o processo, basta reduzir o desvio padrão.
TEMA 5
Intervalos de Confiança
Ponto de Partida
Resposta: A distribuição normal de probabilidade pode ser usada neste caso porque a população
é normalmente distribuída e σ é conhecido.
Assim, temos:
X ± zσx = 2900 ± 1,96(σ/√n)  2900 ± 1,96(500/√15)
= 2900 ± 1,96(129,10)  2770,90 a 3029,10 horas (este será o intervalo)
Questão 1
Resposta: alternativa “C”.
78
Questão 2
Resposta: alternativa “D”.
Questão 3
Resposta: alternativa “A”.
Questão 4
Resposta: alternativa “B”.
Questão 5
Resposta: alternativa “E”.
Questão 6
Resposta:
Questão 7
Resposta:
N(X ± zsx) = 1000($ 37,09 a $ 37,89) = $ 37089,45 a $ 37890,00
Questão 8
Resposta:
X (média) = ± zsx = $ 37,49 ± 2,58(0,2038)  $ 36,96 a $ 38,02
Questão 9
Resposta:
n = (zσ ÷ E)²  [(1,96 x 80) ÷ 25]² = (39,34)²  1548
Questão 10
Resposta: a A predição pontual da quantia de empréstimo do próximo cliente é $257.300. O valor
de z = 1,96, então o intervalo de 95% será:
257.300 ± (1,96)(25.000)√1 + (1/50)  intervalo entre $ 207.812,43 a $ 306.787,57
TEMA 6
Teste de Hipótese com Uma ou Duas Amostras
79
Ponto de Partida
Resposta: Observe que 25% (0,25) corresponde a 5 pessoas vacinadas.
O teste de hipótese ficaria:
H0: p = 0,25
H1: p > 0,25
Os valores possíveis de X, de 0 a 20, são divididos em dois conjuntos: aqueles números menores
ou iguais a 8 e aqueles maiores que 8. Portanto, o valor crítico é 8.
Se x > 8 rejeita-semos a H0 em favor da H1.
Se x ≤ 8, não se rejeitamos H0
Questão 1
Resposta: alternativa “C”.
Questão 2
Resposta: alternativa “E”.
Questão 3
Resposta: alternativa “C”.
Questão 4
Resposta: alternativa “B”.
Questão 5
Resposta: alternativa “E”.
Questão 6
Resposta:
H0: µ ≥ 4200
H1: µ < 4200
t crítico (gl = 10 -1 = 9, α = 0,05)  1,833 (tabela 5 – PLT – monocaudal)
sx = s ÷ √n = 200 ÷ √10  63,3 h
t = X - µ0 ÷ sx
t = (4000 – 4200) ÷ 63,3  - 3,16
Portanto, rejeita-se a hipótese nula e aceita-se a hipótese alternativa, qual seja, a de que a
verdadeira média da vida útil é menor de que 4.000 horas.
Questão 7
Resposta:
H0: µ = $260.000,00
H1: µ ≠ $ 260.000,00
Questão 8
Resposta:
Hipóteses: H0: µ = $260.000,00; H1: µ ≠ $ 260.000,00
Nível de significância: α = 0,05
Estatística de teste: X (média) baseada em uma amostra de n = 36 e com σ = $ 43.000,00
80
X = µ0 ± zσx = 260.000,00 ± 1,96(σ ÷ √n)
X = 260.000 ± 1,96(43.000 ÷ √36)  $ 245.953,33 a $274.046,67
Portanto, para rejeitar a hipótese nula, a média amostral deve ter um valor menor do que $
245.953,33, ou maior do que $ 274.046,67.
Questão 9
Resposta:
H0: µ ≥ $ 260.000 e H1: µ < $ 260.000
X = µ0 + zσx = 260.000 + (- 1,65)(7.166,67)  $ 260.000 – 11.825  $ 248.175,00
Uma vez que X (média) = $ 240.000, o mesmo se encontra na região de rejeição. Portanto,
rejeita-se a hipótese nula e aceita-se a hipótese alternativa µ< $ 260.000.
Questão 10
Resposta:
H0: µ = $ 1500; H1: µ ≠ $ 1500; nível de significância (α = 0,05)
X = µ0 ± zσx = µ0 ± z(σ ÷ √n)  1500 ± 1,96(200 ÷ √15)  1500 ± 101,21  $ 1398,79 a $
1601,21.
Uma vez que a média da amostra $ 1400,00 se encontra na região de aceitação da hipótese nula,
não se pode rejeitar a afirmação do representante da comunidade.
TEMA 7
Correlação e Regressão
Ponto de Partida
Resposta: Para responder a questão utilize o esquema a seguir:
Em seguida, basta colocar na equação
r=
n ∑ xi yi − ( ∑ xi )( ∑ yi )
[n ∑ xi2 − ( ∑ xi ) 2 ][n ∑ yi2 − ( ∑ yi ) 2 ]
Questão 1
Resposta: alternativa “E”.
Questão 2
Resposta: alternativa “D”.
Questão 3
Resposta: alternativa “D”.
81
Questão 4
Resposta: alternativa “B”.
Questão 5
Resposta: alternativa “C”.
Questão 6
Resposta:
r=
33x 41355 − (1104 x1124)
[(33x 41086) − (1104) 2 ] x[(33x 41998) − (1124)2
r = 1,06 ou aproximadamente 1.
Questão 7
Resposta: A correlação é positiva. Existe uma relação perfeita entre as variáveis estudadas.
Questão 8
Resposta: Parâmetro a
a=
n ∑ xi yi − ∑ xi ∑ yi
n ∑ xi2 − ( ∑ xi ) 2
a=
(33x 41355) − (1104 x1124)
(33x 41086) − (1104) 2
a = 0,9036
Questão 9
Resposta: Parâmetro b
b = Υ − aX  b = 33,9697 – 0,9036(33,4545)  b = 3,7402 em que Y é média de yi e X é a média xi
Questão 10
Resposta:
Y^= aX + b  0,9036X + 3,7402
TEMA 8
Teste Qui-quadrado e Distribuição
Ponto de Partida
82
Resposta:
( ∑ f 0 − f e ) 2 (6 − 10) 2 (12 − 10) 2 (14 − 10) 2 (8 − 10) 2 40
X2 =
= +
+
+
=
=
4
fe
10
10
10
10
10
Questão 1
Resposta: alternativa “D”.
Questão 2
Resposta: alternativa “E”.
Questão 3
Resposta: alternativa “C”.
Questão 4
Resposta: alternativa “B”
Questão 5
Resposta: alternativa “C”.
Questão 6
Resposta:
H0: A quantidade de instalações está igualmente distribuída entre as quatro áreas.
H1: A quantidade de instalações não está igualmente distribuída entre as quatro áreas.
gl = k – m – 1  4 – 0 – 1 =3
X² crítico (gl = 3; α = 0,05)  7,81 (tabela distribuição F)
Portanto, não pode rejeitar a hipótese nula de que as instalações estão igualmente distribuídas
entre as quatro áreas, a um nível de significância de 5%.
Questão 7
Resposta:
H0: μ1 = μ2 = μ3 e H1: as médias não são todas mutuamente iguais.
A média global dos 15 graus é:
Questão 8
Resposta:
o O erro da média, baseado nas 3 médias amostrais é:
=
sx
∑( X − X t ) 2
=
N º médias − 1
(80 − 80)² + (85 − 80)² + (75 − 80)²
=
3 −1
50
= 5
2
Questão 9
83
Resposta:
QME = nsx² = 5(5)² = 5(25) = 125
Questão 10
Resposta: a variância para cada uma das amostras.
s2 =
84
∑( X − X ´)
n −1
2
FICHA TÉCNICA
Supervisão Editorial:
Editoração Eletrônica:
Barbara Monteiro Gomes de Campos
Celso Luiz Braga de Souza Filho
Juliana Cristina e Silva
Glauco Berti de Oliveira
Maurício Rodrigues de Moraes
Diagramação:
Diogo da Silva Pereira Botelho
Capa:
Fourmi Comunicação e Arte
Revisão Textual:
Giovana Valente Ferreira
85
Download