Caderno de Atividades Estatística Disciplina Administração Coordenação do Curso Fernando Conter Cardoso Autor Marcio Luis Carreira Chanceler Ana Maria Costa de Sousa Reitora Leocádia Aglaé Petry Leme Pró-Reitor Administrativo Antonio Fonseca de Carvalho Pró-Reitor de Graduação Eduardo de Oliveira Elias Pró-Reitor de Extensão Ivo Arcangêlo Vedrúsculo Busato Pró-Reitor de Pesquisa e Pós-Graduação Luciana Paes de Andrade Coordenadora de Controle DidáticoPedagógico EAD Geise Cristina Lubas Grilo Diretor da Anhanguera Publicações Luiz Renato Ribeiro Ferreira Núcleo de Produção de Conteúdo e Inovações Tecnológicas Diretora Carina Maria Terra Alves Gerente de Produção Rodolfo Pinelli Coordenadora de Processos Acadêmicos Juliana Alves Diretor Geral de EAD Coordenadora de Ambiente Virtual José Manuel Moran Lusana Verissimo Diretora de Desenvolvimento de EAD Coordenador de Operações Thais Costa de Sousa Marcio Olivério Gerente Acadêmico de EAD Fábio Cardoso Coordenadora Pedagógica de EAD Adriana Aparecida de Lima Terçariol Como citar esse documento: CARREIRA, Marcio Luis. Estatística Valinhos, p. 1-85, 2012. Disponível em: www.anhanguera.com Acesso em: 01 fev. 2012 © 2012 Anhanguera Publicações Proibida a reprodução final ou parcial por qualquer meio de impressão, em forma idêntica, resumida ou modificada em língua portuguesa ou qualquer outro idioma. Diagramado no Brasil 2012. 3 Legenda de Ícones Leitura Obrigatória Agora é a sua vez Vídeos Links Importantes Ver Resposta Finalizando i a lf h g k t sv ud r i e b mq l nc p x w o zj x y i Glossário Referências Início 4 Nossa Missão, Nossos Valores Desde sua fundação, em 1994, os fundamentos da “Anhanguera Educacional” têm sido o principal motivo do seu crescimento. Buscando permanentemente a inovação e o aprimoramento acadêmico em todas as ações e programas, ela é uma Instituição de Educação Superior comprometida com a qualidade do ensino, pesquisa de iniciação científica e extensão. Ela procura adequar suas iniciativas às necessidades do mercado de trabalho e às exigências do mundo em constante transformação. Esse compromisso com a qualidade é evidenciado pelos intensos e constantes investimentos no corpo docente e de funcionários, na infraestrutura, nas bibliotecas, nos laboratórios, nas metodologias e nos Programas Institucionais, tais como: · · · · · Programa de Iniciação Científica (PIC), que concede bolsas de estudo aos alunos para o desenvolvimento de pesquisa supervisionada pelos nossos professores. Programa Institucional de Capacitação Docente (PICD), que concede bolsas de estudos para docentes cursarem especialização, mestrado e doutorado. Programa do Livro-Texto (PLT), que propicia aos alunos a aquisição de livros a preços acessíveis, dos melhores autores nacionais e internacionais, indicados pelos professores. Serviço de Assistência ao Estudante (SAE), que oferece orientação pessoal, psicopedagógica e financeira aos alunos. Programas de Extensão Comunitária, que desenvolve ações de responsabilidade social, permitindo aos alunos o pleno exercício da cidadania, beneficiando a comunidade no acesso aos bens educacionais e culturais. A fim de manter esse compromisso com a mais perfeita qualidade, a custos acessíveis, a Anhanguera privilegia o preparo dos alunos para que concretizem seus Projetos de Vida e obtenham sucesso no mercado de trabalho. Adotamos inovadores e modernos sistemas de gestão nas suas instituições. As unidades localizadas em diversos Estados do país preservam a missão e difundem os valores da Anhanguera. Atuando também na Educação a Distância, orgulha-se de oferecer ensino superior de qualidade em todo o território nacional, por meio do trabalho desenvolvido pelo Centro de Educação a Distância da Universidade Anhanguera - Uniderp, nos diversos polos de apoio presencial espalhados por todo o Brasil. Sua metodologia permite a integração dos professores, tutores e coordenadores habilitados na área pedagógica com a mesma finalidade: aliar os melhores recursos tecnológicos e educacionais, devidamente revisados, atualizados e com conteúdo cada vez mais amplo para o desenvolvimento pessoal e profissional de nossos alunos. A todos bons estudos! Prof. Antonio Carbonari Netto Presidente do Conselho de Administração — Anhanguera Educacional 5 Sobre o Caderno de Atividades Caro (a) aluno (a), O curso de Educação a Distância acaba de ganhar mais uma inovação: o caderno de atividades digitalizado. Isso significa que você passa a ter acesso a um material interativo, com diversos links de sites, vídeos e textos que enriquecerão ainda mais a sua formação. Se preferir, você também poderá imprimi-lo. Este caderno foi preparado por professores do seu Curso de Graduação, com o objetivo de auxiliá-lo na aprendizagem. Para isto, ele aprofunda os principais tópicos abordados no Livro-texto, orientando seus estudos e propondo atividades que vão ajudá-lo a compreender melhor os conteúdos das aulas. Todos estes recursos contribuem para que você possa planejar com antecedência seu tempo e dedicação, o que inclusive facilitará sua interação com o professor EAD e com o professor-tutor a distância. Assim, desejamos que este material possa ajudar ainda mais no seu desenvolvimento pessoal e profissional. Um ótimo semestre letivo para você! José Manuel Moran Diretor-Geral de EAD Universidade Anhanguera ­– Uniderp Thais Sousa Diretora de Desenvolvimento de EAD Universidade Anhanguera ­– Uniderp 6 Caro Aluno, Este Caderno de Atividades foi elaborado com base no livro “Guia de Implementação de Marketing de Relacionamento e CRM, do autor Roberto Madruga, editora Atlas 2010, Livro-Texto 390. Roteiro de Estudo Prof. Marcio Luis Carreira Estatística Este roteiro tem como objetivo orientar seu percurso por meio dos materiais disponibilizados no Ambiente Virtual de Aprendizagem. Assim, para que você faça um bom estudo, siga atentamente os passos seguintes: 1. Leia o material didático referente a cada aula. 2. Assista às aulas na sua unidade e depois disponível no Ambiente Virtual de Aprendizagem para você; (sugestão: Assista às aulas na sua unidade e também no Ambiente Virtual de Aprendizagem). 3. Responda às perguntas referentes ao item “Habilidades” deste roteiro. 4. Participe dos Encontros Presenciais e tire suas dúvidas com o tutor local. 5. Após concluir o conteúdo dessa aula, acesse a sua ATPS e verifique a etapa que deverá ser realizada. Tema 1 Estatística Descritiva ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i 7 Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • A importância da estatística. • Os conceitos de variáveis, população e amostra. • As fases do método estatístico. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • O que é uma população e uma amostra de um estudo? • Como selecionar dados qualitativos e quantitativos? • Qual a importância do estudo da estatística? • Quais as técnicas de amostragem? AULA 1 Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Estatística Descritiva Durante os estudos do tema 1, você encontrara as definições iniciais sobre o estudo e importância da estatística. Após definir uma população de estudo é possível extrair amostras dessa população para estudo, assim consegue-se, dentro de padrões da estatística, reduzir custos com a pesquisa e obter resultados pertinentes à população utilizando-se a amostra. De acordo com as variáveis utilizadas para estudo, poderá separá-las distintamente entre qualitativas, que demonstram um atributo, como exemplo, sexo, etnia, e quantitativas, que demonstram números, como exemplo, renda de uma família, filhos. 8 Com esses dados separados e seguindo as fases do método estatístico, a estatística descritiva é a primeira a ser utilizada para uma análise mais simplificada. A partir dos dados obtidos na amostra é possível extrair uma média que serve como parâmetro para os demais resultados. Esses dados poderão ser trabalhados de forma agrupada (comumente utilizada), ou não agrupada (para pequenas amostras). Independente do tratamento a ser utilizado (agrupada ou não), a estatística descritiva poderá ser utilizada para observar qual valor mais frequente na amostra, e qual será a posição que separa a amostra em exatamente duas partes iguais, para que seja possível trabalhar com essas partes em separado, optando por uma decisão mais focada, por exemplo. Entretanto, você percebe outro fator de importância no estudo da estatística descritiva, e, novamente dentro do método estatístico é a apresentação dos dados coletados. Essa apresentação normalmente é feita por meio de tabelas e/ou gráficos. Assim, quando um noticiário na mídia apresenta uma reportagem sobre o consumo das famílias brasileiras, geralmente é elaborado um gráfico para demonstrar a evolução do consumo, baseando-se em dados anteriores, ou ainda separado por categoria, como por exemplo: alimentação, bens de consumo duráveis (geladeira, fogão), veículos. Os gráficos proporcionam uma melhor visualização da situação, e esteticamente melhor apresentável que uma tabela. Imagine este mesmo gráfico do consumo das famílias brasileiras sendo apresentado em forma de tabelas nos grandes telejornais. A estatística descritiva também auxilia no processo de decisões, por meio da análise das medidas de tendência central (média, moda, mediana) e pela variabilidade. Assim, quando se fala de um conjunto de dados, a referência é a população ou a amostra. Se o objetivo é a inferência estatística, serão utilizadas medidas descritivas numéricas da amostra para fazer inferência sobre as medições correspondentes a população. A análise dessas medidas descritivas será quanto a tendência central e a sua variabilidade (dispersão dos dados). A mais conhecida e melhor compreendida medida de tendência central é a média aritmética, ou simplesmente média, de um conjunto de dados. A média aritmética de um conjunto de dados quantitativos é a soma das medições dividida pelo número de medições contidas no conjunto de dados. A mediana divide o conjunto de dados em duas partes iguais (50% - 50%), em algumas situações pode ser uma melhor medida de tendência central do que a média sendo de muito valor quando se está descrevendo grandes conjuntos de dados. Especificamente, a mediana é menos sensível do que a média em medições extremamente grandes ou pequenas. A mediana, portanto, é o número do meio quando as medidas são organizadas em ordem ascendente (ou descendente). Uma terceira medida de tendência central é a moda de um grupo de medições. A moda é medição que 9 ocorre com mais frequência no conjunto de dados. Para dados agrupados, a moda é o valor que mais aparece, isso aparentemente pode causar alguma indecisão sobre o valor da moda. Porém, o que deve ser lembrado é da definição “valor que mais aparece”, assim pode-se definir qual é a classe modal (classe com maior frequência de observações) e em seguida utilizar-se da equação de Czuber para determinar a moda para dados agrupados. Medidas de tendência central proporcionam apenas uma descrição parcial de conjunto de dados quantitativos. A descrição é incompleta sem uma medida de variabilidade, ou dispersão, do conjunto de dados. Conhecer a variabilidade dos dados juntamente com seu centro pode ajudar a visualizar o formato do conjunto de dados, assim como seus extremos. Uma medida de variabilidade bem simples é a amplitude, ou seja, a diferença entre os valores extremos de dados (maior valor – menor valor). Porém, as medidas de variabilidade mais utilizadas são: a variância e o desvio padrão. A variância da amostra de n medições é igual a soma dos desvios da média ao quadrado, dividido por (n – 1). Na variância quando é utilizado a potência 2 (ao quadrado) é para evitar números negativos, uma vez que os desvios da média nada mais é do que um ponto da amostra subtraído o valor da média, que dependendo do valor poderá ser negativo, mas quando se “eleva” ao quadrado, o efeito do sinal negativo não aparecerá. Já o desvio padrão é a raiz quadrada da variância. 10 Agora é a sua vez Questão 01 (PROVÃO, 2001 – Economia) Para fazer inferência sobre a média de rendimen- INSTRUÇÕES tos da população brasileira, é possível se basear Desenvolva as atividades objetivas, procu- em uma amostra aleatória fornecida pelos resul- rando localizar as respostas a partir do Li- tados de uma pesquisa, tomando a média arit- vro-Texto e de outros livros de apoio dispo- mética dos valores observados nessa amostra. níveis em sua biblioteca. Se estiver interessado em diminuir o tamanho de As respostas devem ser apresentadas em um intervalo de confiança para esta estimativa textos claros, objetivos e específicos a cada da média, sem a tornar viesada, uma saída pos- proposta. Tenha sempre em mãos calcula- sível seria: doras para desenvolver os cálculos quan- a) Descartar da amostra as observações relati- do necessário. Não se esqueça do processo vas aos trabalhadores que estão no primeiro matemático, ou seja, desenvolver o cálculo quartil da distribuição de rendimentos. linha a linha. Não pule etapas, pois um sim- b) Descartar da amostra as observações rela- ples cálculo pode fazer diferença em sua tivas aos trabalhadores que estão no último resposta. Para padronização, utilize 4 (qua- quartil da distribuição de rendimentos. tro) casas decimais após a vírgula. c) Descartar da amostra as observações relativas aos trabalhadores que estão no primeiro e Ponto de Partida último quartis da distribuição de rendimentos. Em uma visita familiar (com seus pais, avós, d) Aumentar o tamanho da amostra. tios) de final de semana, anote quantos in- e) Aumentar o nível de confiabilidade desejado tegrantes há na família. Separe os dados para o intervalo (por exemplo, 90% para 95%). qualitativos e monte um gráfico que contenha quantos do sexo masculino e quantos do sexo feminino. Depois anote os dados Verifique seu desempenho nesta questão, clicando no ícone ao lado. referentes aos pesos de cada um, não importando aqui a separação entre sexo masculino/feminino. Em seguida, tabule os dados (coloque que tabela), mas não utilize Questão 02 As fases do método estatístico são: dados agrupados. Faça o cálculo da média a) Coleta de dados, crítica dos dados, apuração dos pesos de sua família. Qual o peso mais dos dados, apresentação dos dados e análise encontrado? Discuta os resultados com seus dos resultados. familiares. b) Apuração dos dados, coleta dos dados, apresentação dos dados, crítica dos dados e aná- Agora é com você! Responda às questões a seguir para conferir o que aprendeu! lise dos resultados. c) Crítica dos dados, coleta dos dados, apuração 11 dos dados, apresentação dos dados e análise dos resultados. d) Coleta de dados, apresentação de dados e análise dos resultados. e) Coleta de dados e análise dos resultados apenas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 04 A técnica para recolher amostras ao acaso, tanto quanto possível, é chamada: a) Variável contínua. b) Variável discreta. c) Amostragem. d) Amostragem estratificada. e) Amostragem tendenciosa. Questão 03 Verifique seu desempenho nesta questão, clicando no ícone ao lado. I. É uma tabela que mostra classes ou inter- Questão 05 Sobre a distribuição de frequência. valos de entrada de dados com um número total de entradas em cada classe. II. Para determinar o número de classes em uma distribuição de frequência, utiliza-se a regra de Sturges, em que: i (número de classes) = 1 + 3,3 x log n. na qual n é o número total de dados. III. A frequência simples de uma classe é o número de observações encontradas na amostra que pertence ao intervalo calculado. IV. A frequência simples acumulada ao seu fi- A ogiva de Galton é um gráfico que representa: a) Uma distribuição de frequência é formada por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal. b) Uma distribuição de frequência simples. c) Um intervalo de classe. d) Uma amostra aleatória e) Uma distribuição de frequência cumulativa. nal tem que ter como resultado o mesmo número de observações do ponto médio. Está(ão) correta(s) a(s) afirmativa(s): a) I apenas. b) IV apenas. c) III apenas. d) I, II, III apenas. e) I, II apenas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 06 O departamento de recursos humanos de uma empresa precisa recrutar internamente, com a finalidade de criar um novo departamento, que será intitulado de departamento de inteligência. Para isso será preciso que todos os departamentos façam uma amostra estratificada em 10% de seu quadro de fun- 12 cionários para a criação do novo departamento. De acordo com os dados a seguir, pede-se: a) o número a ser liberado de funcionários de cada departamento existente; b) o número de funcionários do novo departamento. Departamento Funcionários Recursos Humanos 7 Marketing e vendas 35 Financeiro 17 Produção 41 Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 Com base no exercício anterior, calcule a média para dados agrupados e não agrupados. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Atenção: As questões de 7 a 10 devem ser respondidas baseadas no enunciado a seguir. Uma agência bancária pesquisou entre seus clientes os valores emprestados por eles. Assim para uma amostra de 40 clientes obtiveram os seguintes dados (todos em R$): 800 1350 2000 1750 1100 750 500 3500 900 1500 2200 2500 1600 1450 1400 1200 1000 1000 950 3300 3000 2350 1800 1750 1650 1600 2000 2100 3100 3000 2000 1500 700 600 750 1100 2100 1800 1900 3650 Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 Responda: a)Pela regra de Sturges, calcule o número de Questão 09 Para dados agrupados e utilizando-se da regra de Czuber, calcule a moda. E qual é a moda para dados não agrupados? Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Faça uma análise dos resultados obtidos, se você fosse o gerente dessa agência, qual seria o seu planejamento para o próximo ano? Verifique seu desempenho nesta questão, clicando no ícone ao lado. classes. b)Monte a tabela de distribuição de frequências para os dados acima. (Dica: monte na sequência 4 número de classes; interva- lo; frequência simples; frequência simples relativa; frequência acumulada; frequência acumulada relativa; ponto médio; produto da frequência simples com o ponto médio). 13 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: • Acesse o site: IBGE - Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://www.ibge. gov.br/home/>. Acesso em: 26 jul. 2012. Verifique as metodologias das pesquisas realizadas por eles. • Leia o artigo: PETERNELLI, Luiz Alexandre. Estatística Descritiva. Disponível em: <http://www.each. usp.br/rvicente/Paternelli_Cap2.pdf>. Acesso em: 26 jul. 2012. O autor explica a estatística descritiva dividida em duas áreas: estatística indutiva e descritiva. • Leia o artigo: GUEDES, Terezinha Aparecida; ACORSI, Clédina Regina Lonardan. Estatística Descritiva. Disponível em: <http://www.tecnicodepetroleo.ufpr.br/apostilas/matematica/estatistica_descritiva.pdf>. Acesso em: 26 jul. 2012. O artigo faz a introdução da estatística e mostra exemplos da estatística descritiva FINALIZANDO Nesse tema, você viu que a estatística está presente em todos os setores, nas empresas, no governo, em saúde. A amostra é uma parte da população a ser estudada e por meio dos dados obtidos pela amostra, sendo possível desenvolver gráficos e análises de resultados para futuros planejamentos. Assim, você percebeu que a estatística é de grande importância para análises descritivas de diversos processos e preocupações práticas de instituições. Caro aluno, agora que o conteúdo dessa aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 14 Tema 2 Probabilidade ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • O conceito de probabilidade. • A aplicação da probabilidade nos negócios. • A importância do uso das propabilidades. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Como utilizar a probabilidade como estimador de valor? • Como é possível minimizar os riscos causados em investimentos, negócios, vendas? • Qual a importância do estudo da probabilidade? • Como ocorre as distribuições de probabilidade? 15 AULA 2 Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Probabilidade Apenas a estatística descritiva não basta para análise detalhada, é preciso criar estimativas para eventos futuros, e é nesse momento que o estudo de probabilidade se faz necessário. É a probabilidade, um percentual de chance, que um determinado evento pode ocorrer, por exemplo, aos administradores financeiros, qual a probabilidade das ações de sua empresa atingir o preço de R$ 100,00 até o fim do ano? A probabilidade está presente em todos os setores da empresa produção, qualidade, financeiro e principalmente, o comercial. Qual a probabilidade de um vendedor não atingir a sua cota diária? Sabe-se que o planejamento da empresa está ligado diretamente ao volume de vendas, pois assim é garantido o lucro ao final do ano. Um experimento é um ato ou processo de observação que leva a um único resultado que não pode ser previsto. Com isso, um espaço amostral de um experimento é o conjunto de todos os seus pontos amostrais, que, por sua vez, é o resultado mais básico de um experimento. A probabilidade de um ponto amostral é um número de 0 a 1, incluindo-os, que mensura a possibilidade de que o resultado vá ocorrer quando o experimento for realizado. Assim sendo, esse número é normalmente tomado como a frequência relativa de ocorrência de um ponto amostral em uma longa sequência de repetições do experimento. Portanto, qualquer que seja a forma de atribuição de probabilidades para pontos amostrais, essas probabilidades devem obedecer a duas regras, seja pi representando a probabilidade do ponto amostral i, então, a) todas as probabilidades dos pontos amostrais devem estar entre 0 e 1 (isto é, 0 ≤ pi ≤ 1); b) as probabilidades de todos os pontos amostrais dentro de um espaço amostral devem somar 1 (isto é, ∑pi = 1). Atribuir probabilidades a pontos amostrais é fácil para alguns experimentos, como exemplo, se o experimento for lançar uma moeda regular e obter sua face, a designação de sua probabilidade nada mais é que 0,5 para os dois pontos amostrais, ou seja, 50% para cara; 50% para coroa. Entretanto, existem muitos experimentos cujas probabilidades são mais difíceis de atribuir. 16 Ainda que as probabilidades de pontos amostrais frequentemente interessem por si só, normalmente as probabilidades de conjuntos de pontos amostrais é que são importantes, para isso é preciso definir quais os pontos amostrais que pertencerão ao evento, e, na sequência, seja testado cada ponto amostral no espaço amostral. Com isso, a probabilidade de um evento A é calculado somando-se as probabilidades dos pontos amostrais no espaço amostral de A. Voltando ao exemplo do lançamento de uma moeda, agora pode descrever da seguinte forma: P(A) = n(A) ÷ n(S), em que, P(A): é a probabilidade de ocorrer o evento A. n(A): é o número exato da resposta desejada. n(S): é o número de respostas possíveis. Assim se o evento A for “tirar cara”: E = tirar cara 4 n(A) = 1 O espaço amostral seria: S = {cara, coroa} 4 n(S) = 2 Com isso, a equação ficaria: P(A) = 1 ÷ 2 = 0,5 ou 50%. Isso demonstrou a atribuição de 0,5 para a probabilidade do lançamento de uma moeda. No entanto, pode-se acrescentar outros eventos ao estudo de probabilidade. Uma delas são os eventos complementares. O complemento de um evento A é o evento que não ocorre, isto é, o evento que consiste em todos os pontos amostrais que não estão no evento A. Outro evento é o mutuamente exclusivo, no qual dois eventos são mutuamente exclusivos, a probabilidade de A e B é igual à soma das probabilidades de A e B. Eventos independentes são aqueles em que, ao realizar um evento, não irá interferir no outro evento a ser realizado. Assim, utilizando-se da multiplicação de probabilidades você encontrará o resultado para os eventos independentes . Quando você dispõe de conhecimentos adicionais que podem afetar as chances do resultado de um 17 experimento, de modo que necessite alterar a probabilidade de interesse, uma probabilidade que reflete esse conhecimento adicional é chamada de probabilidade condicional do evento. Entretanto, para calcular a probabilidade condicional de que o evento A ocorra, dado que o evento B ocorra, divida a probabilidade de que A e B ocorram pela probabilidade de B ocorra, mas para isso, deve-se supor que a probabilidade de B não pode ser 0 (zero), isso se deve pelo fato da divisão por zero “não existir”. Por isso, a probabilidade é o reverso da estatística, você usará a informação da população para inferir a natureza provável da amostra. Já a estatística descritiva, as conclusões sobre a população, serão feitas por meio da informação de uma amostra. A estatística descritiva e a probabilidade são assuntos iniciais desse tema. 18 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (qua- de universidades e conceitos. Universidades Conceitos A B C X 0,20 0,10 0,00 Y 0,25 0,10 0,05 Z 0,15 0,10 0,05 Tal tabela mostra, por exemplo, que 20% do total dos alunos que fizeram o exame eram da universidade X e tiveram o conceito A; 5% eram da universidade Y e tiveram o conceito C, e assim por diante. Sabendo-se que um estudante qualquer teve conceito A, a probabilidade que ele tenha estudado na universidade X é: a) 1/3. b) 1/4. c) 1/5. d) 2/3. e) 2/5. tro) casas decimais após a vírgula. Ponto de Partida Utilizando-se de um dado (esse deve ser não viciado), calcule a probabilidade de ao lançá-lo uma vez e obter o número 6. Em seguida, lance dois dados ao mesmo tempo e calcule a probabilidade de ocorrer o número Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 02 (BACEN, 2006 - Analista) O número de automóveis modelos k vendidos diariamente em uma 6 e o número 1 na jogada. concessionária de veículos é uma variável alea- Agora é com você! Responda às questões a probabilidades: seguir para conferir o que aprendeu! tória discreta (X) com a seguinte distribuição de X P(x) 0 m 1 n 2 n 3 m Questão 01 O preço unitário de venda desse modelo é de R$ (PROVÃO, 2001 – Economia) Estudantes de três das superiores a duas unidades. Se num deter- universidade diferentes, X, Y e Z, fazem um exa- minado dia a receita de vendas referente a esse me em que os resultados são medidos pelos con- modelo for positiva, a probabilidade dela ser infe- ceitos A, B e C. A tabela abaixo mostra as distri- rior a R$ 60.000,00 é de: buições de frequências relativas das combinações a) 60%. 20.000,00 e somente 20% dos dias tem-se ven- 19 b) 75%. c) 40%. c) 80%. d) 50%. d) 87,5%. e) 60%. e) 90%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 03 Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 05 A probabilidade do clube campeão brasileiro de Sobre eventos independentes de probabilidade: 2012 não ser paulista é: I. É quando a realização de um ou a não realiza- a) 40%. ção de um dos eventos não afeta a probabilida- b) 50%. de da realização do outro e vice-versa. c) 60%. II. A probabilidade é igual ao produto das probabilidades de realização dos dois eventos. d) 70%. e) 80%. III. A probabilidade é igual soma das probabilidades de realização dos dois eventos IV. Os resultados dependem um do outro. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Está(ão) correta(s) a(s) afirmativa(s): a) I apenas. b) IV apenas. c) III apenas. Questão 06 Ao lançar dois dados simultaneamente, qual a d) I, II, III apenas. probabilidade de se obter 2 no primeiro e 6 no e) I, II apenas. segundo dado. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 04 Questão 07 O Campeonato Brasileiro de Futebol 2012 será disputado na forma de pontos corridos, ou seja, No lançamento de um dado, qual a probabilidade se obter 2 ou 6. não há separação em grupos e todos jogarão contra todos. A probabilidade de um clube paulista ser o campeão brasileiro de 2012 será de: a) 20%. b) 30%. 20 Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 Qual a probabilidade de sair uma bola verde, onde constam 3 azuis, 5 vermelhas e 2 verdes em uma mesma urna. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 Em um jogo de cartas, com baralho não viciado, qual a probabilidade se sair uma carta do naipe de copas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Em um jogo de cartas, com baralho não viciado, qual a probabilidade se sair uma carta do naipe de copas e que seja Reis. Verifique seu desempenho nesta questão, clicando no ícone ao lado. 21 LINKS IMPORTANTES Quer saber mais sobre esse assunto? Então: Você quer saber mais sobre esse assunto? Então: Leia a dissertação de mestrado: RIBEIRO, Silvério Domingos. As pesquisas sobre o ensino da estatística e da probabilidade no período de 2000 a 2008: uma pesquisa a partir do banco de teses da CAPES. Disponível em: <http://www.pucsp.br/pos/edmat/mp/dissertacao/silverio_domingos_ribeiro. pdf>. Acesso em: 26 jul. 2012. Esse trabalho teve como objetivo fazer um levantamento da produção acadêmica que consta no banco de teses da Capes, relacionados com a problemática do ensino da estatística e da probabilidade. Leia o livro: STEIN, Carlos Efrain; LOESCH; Claudio. Estatística Descritiva e Teoria das probabilidades. 2 ed. Edifurb. Este livro foi elaborado a partir de notas de aulas das disciplinas lecionadas pelos autores ao longo dos semestres em vários cursos de graduação. A obra pretende contribuir significativamente como material didático no auxílio do ensino da Estatística em sala de aula. FINALIZANDO Nesse tema, você viu que o estudo da probabilidade é essencial para redução de riscos. É por meio da probabilidade que as empresas estimam suas vendas no mês, o lucro desejável, profissionais da área da saúde estimam a necessidade de doadores para um determinado tipo sanguíneo. Não se pode confundir a probabilidade com incertezas, sendo que estas não existem mensuração matemática. Você pôde observar como exemplo, o grande tema atual devido o ocorrido no Japão (março/2011), podese ocorrer um terremoto de grandes proporções no Brasil? Isso não se pode determinar pelo método probabilístico, ou seja, é uma incerteza de ocorrência. Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 22 Tema 3 Distribuições Discretas de Probabilidade ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • Variáveis aleatórias, discretas e contínuas. • A distribuição binômia. • Média, variância e desvio padrão. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Quais as diferenças entre variáveis aleatórias, discretas e contínuas? • De que forma é possível estabelecer uma distribuição discreta de probabilidade? • Como descobrir a média, variância e desvio padrão de uma distribuição discreta de probabilidade? 23 AULA 3 Assista às aulas nos polos presenciais e também às disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Distribuições Discretas de Probabilidade Você viu que uma variável aleatória é aquela cujos valores são determinados ao acaso, ou seja, não estão sob o controle do observador (pesquisador). Assim, para uma variável aleatória discreta, todos os possíveis valores da variável aleatória podem ser listados numa tabela com as probabilidades correspondentes. Tal como utilizado para conjuntos de dados de amostras e populações, é frequentemente útil descrever uma distribuição de probabilidade em termos de sua média e de sua variância. Nesse caso, a média é chamada de valor esperado da distribuição de probabilidade. O valor esperado de uma variável aleatória discreta X, é denotado por E(X), é a média ponderada de todos os valores possíveis da variável aleatória com os respectivos valores de probabilidade tomados como pesos. Com isso, como a soma dos pesos (probabilidade) é sempre igual a 1, a fórmula da média ponderada pode ser simplificada. O valor esperado de uma distribuição discreta de probabilidade é: E(X) = ∑ X P(X). A utilização da fórmula pode ser mais visível com a sua aplicação. Por exemplo, supondo que a possível demanda (procura) por um produto em um mês seja: 3; 5; 7; 8. As probabilidades para que essa demanda aconteça é 0,2; 0,35; 0,25; 0,2 respectivamente. Assim o valor esperado da demanda do produto no mês seria: E(X) = (3 x 0,2) + (5 x 0,35) + (7 x 0,25) + (8 x 0,2) 4 5,70. Observe que a soma das probabilidades é igual a 1. Mas o que significa o valor esperado de 5,70? Na verdade, não se pode vender 5,70 de um produto, com isso deve-se arredondar para 6 unidades demandadas. A utilização do valor esperado servirá como guia ao departamento de vendas para o cumprimento de metas ao final do mês. Pode ser utilizado também como planejamento para o próximo período também. Já a variância de uma variável aleatória X, denotada por Var (X), é calculada em relação ao valor esperado, E(X), como a média da distribuição de probabilidade. Ou seja: Var (X) = ∑[X – E(X)]² P(X) Um passo a passo para o cálculo da variância pode ser observado na tabela 1, a seguir. 24 Tabela 1 – Cálculo da variância de uma variável aleatória discreta. Demanda (X) 3 5 7 8 Probabili- X – E(X) dade P(X) 0,2 3 – 5,70 = 2,70 0,35 5 – 5,70 = 0,70 0,25 7 – 5,70 = 1,30 0,2 8 – 5,70 = 2,30 [X – E(X)]² (-2,70)² = 7,29 (-0,70)² = 0,49 (1,30)² = 1,69 (2,30)² = 5,29 Total [X – E(X)]² x P(X) 7,29 x 0,2= 1,46 0,49 x 0,35 = 0,17 1,69 x 0,25 = 0,42 5,29 x 0,2 = 1,06 3,11 Tabela 1 – Cálculo da variância de uma variável aleatória discreta. A variância, portanto, para o exemplo da demanda de um produto é de 3,11. Isso representa a variabilidade da demanda, se extrair a raiz quadrada, obter-se-á o desvio padrão para a demanda. Outra distribuição de probabilidade para variável aleatória discreta é a distribuição binomial. A distribuição binômia é uma distribuição discreta de probabilidade, aplicável sempre que o processo de amostragem for do tipo Bernoulli. Um processo de Bernoulli é um processo de amostragem no qual: a) em cada tentativa existem dois resultados possíveis mutuamente exclusivos. Eles são chamados de sucesso e fracasso; b) as séries de tentativas, ou observações, são constituídas de eventos independentes; c) a probabilidade de sucesso, indicada por p, permanece constante de tentativa para tentativa. A distribuição binomial pode ser utilizada para determinar a probabilidade de se obter um dado número de sucessos em um processo de Bernoulli. Três valores são necessários: número de sucessos (X); o número de tentativas, ou observações (n); e a probabilidade de sucesso em cada tentativa (p). A distribuição de Poisson pode ser usada para determinar a probabilidade de um dado número de sucessos quando os eventos ocorrem em um continuum de tempo ou espaço. Tal processo, chamado de processo de Poisson, é similar ao processo de Bernoulli, exceto que os eventos ocorrem em um continuum ao invés de ocorrerem em tentativas ou observações fixadas. Para esse caso, apenas um valor é necessário para determinar a probabilidade de um dado número de sucessos em um processo, que é o número médio de sucessos para a específica dimensão de tempo ou espaço de interesse. Este número médio é geralmente representado pela letra grega “lambda” (λ). 25 Como você pode observar, as características da variável aleatória de Poisson são, em geral, difíceis de verificar para exemplos práticos. Como em todos os modelos de probabilidades, o teste real de adequação de modelo de Poisson é se ele proporciona uma aproximação razoável da realidade, isto é, se os dados empíricos o suportam. Para o cálculo da distribuição de Poisson será facilitado se fornecido Tabelas Estatísticas, como a encontrada no apêndice B do Livro-Texto – tabela 3 – distribuição de Poisson. 26 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula. Ponto de Partida Visitando um hipermercado, ou uma concessionária de automóveis a probabilidade de que um cliente aleatoriamente fazer uma compra é de 0,15. Se um vendedor atender 6 presumíveis clientes, qual será probabilidade que ele faça 4 vendas? Agora é com você! Responda às questões a seguir para conferir o que aprendeu! creta deve estar entre 0 e 1. c) A soma de todas as probabilidades tem de ser igual a 1. d) É incontável de resultados possíveis, representado por um intervalo sobre o eixo. e) A distribuição de probabilidade discreta enumera cada valor que a variável aleatória pode assumir ao lado de sua probabilidade. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 02 Assinale a alternativa correta: I. Uma distribuição binomial é baseada no processo de Bernoulli. II. A distribuição binomial em cada tentativa existem dois resultados possíveis independentes. III.As séries de tentativas, ou observações, são constituídas de eventos mutuamente exclusivos. IV.A probabilidade de sucesso permanece constante de tentativa para tentativa. As afirmativas acima estão corretas: a) I, II apenas. b) II e III apenas. c) I, IV apenas. d) III, IV apenas. e) Todas estão corretas. Questão 01 É incorreto dizer que uma variável aleatória discreta possui a característica: Verifique seu desempenho nesta questão, clicando no ícone ao lado. a) É contável com resultados possíveis que possam ser enumerados. b) A probabilidade de cada valor da variável dis- Questão 03 27 Você trabalha em uma seguradora e a venda de que: uma apólice de seguros de um ano é $ 10.000,00 I. A média (ou número esperado) de eventos com um prêmio anual de $ 290,00. Tabelas atua- em cada unidade é denotada pela letra grega riais mostram que a probabilidade de morte duran- “lambda” – λ. te o próximo ano para uma pessoa da idade, sexo, II. O experimento consiste em contar o núme- nível de saúde, do seu cliente é 0,001. Qual o ga- ro de vezes que certo evento ocorre durante nho esperado (quantidade de dinheiro feito pela uma dada unidade de tempo. empresa) para uma apólice desse tipo? III.A probabilidade de que um evento ocorra em a) $ 290,00. uma dada unidade de tempo é a mesma para b) $ 9.710,00. todas as unidades. c) $ 280,00. IV.O número de eventos que ocorre em uma d) $ 10.000,00. unidade de tempo é independente do número e) $ 570,00. que ocorre em qualquer outra unidade mutuamente excludente. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Está(ao) correta(s): a) Apenas I. b) Apenas II. Questão 04 Considere que x seja igual ao número de peças c) Apenas III. d) Apenas IV. e) Todas corretas. defeituosas em 5 tentativas. Então, x é uma variável aleatória binomial com p, a probabilidade de que uma única peça seja defeituosa é igual a 0,1. Verifique seu desempenho nesta questão, clicando no ícone ao lado. A probabilidade de que 3 peças sejam defeituosas em 5 tentativas será: Atenção: Para as questões 6 a 10 considerar o a) 0,81%. enunciado a seguir. b) 0,08%. c) 1,00%. Devido às altas taxas de juros, uma empresa d) 8,00%. informa que 40% de suas contas a receber de e) 8,10%. outras empresas comerciais se encontram vencidas. Se um analista financeiro escolhe aleatoriamente uma amostra de cinco contas, determinar Verifique seu desempenho nesta questão, clicando no ícone ao lado. a sua probabilidade de acordo com a distribuição Questão 05 Questão 06 Sobre a distribuição de Poisson é correto afirmar 28 binomial Caso nenhuma das contas estejam vencidas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 Exatamente duas contas estejam vencidas Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 A maioria das contas estejam vencidas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 Exatamente uma conta esteja vencida. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Se você fosse o analista financeiro da empresa continuaria utilizando essa técnica para avaliar a inadimplência da empresa. Justifique. Verifique seu desempenho nesta questão, clicando no ícone ao lado. 29 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: SCHEIN, Diana; LIMA, Milton Luiz Paiva. Uma metodologia para o dimensionamento de frota de rebocadores em terminais portuários: uma aplicação ao porto do Rio Grande. Disponível em: <http://www.podesenvolvimento.org.br/inicio/index.php?journal=podesenvolvimento&page=article&op= view&path[]=47>. Acesso em: 26 jul. 2012. Nesse trabalho é aplicada uma metodologia para encontrar o número adequado de rebocadores para atender ao Porto do Rio Grande. Leia a dissertação de mestrado: RIBEIRO, Silvério Domingos. As pesquisas sobre o ensino da estatística e da probabilidade no período de 2000 a 2008: uma pesquisa a partir do banco de teses da CAPES. Disponível em: <http://www.pucsp.br/pos/edmat/mp/dissertacao/silverio_domingos_ribeiro.pdf>. Acesso em: 26 jul. 2012. Esse trabalho teve como objetivo fazer um levantamento da produção acadêmica que consta no banco de teses da Capes. Leia: LANDÍN, Pedro R.; SÁNCHEZ, Ernesto. Niveles de razonamiento probabilístico de estudiantes de bachillerato frente a tareas de distribuición binomial. Disponível em: <http://revistas.pucsp.br/index.php/ emp/article/view/4842/3703> Acesso em: 26 jul. 2012. Neste artigo os autores apresentam uma hierarquia de raciocínios utilizados para avaliar as respostas de alunos do ensino médio a um questionário contendo tarefas relacionadas com a distribuição binomial. FINALIZANDO Nesse tema, você viu que o estudo de variáveis aleatórias discretas e suas distribuições de probabilidades. Sendo que a mais utilizada é a distribuição de probabilidade por atribuição (para cada valor), e assim encontra-se o valor esperado, a distribuição binomial seguindo o modelo de amostra proposto por Bernoulli e a distribuição de Poisson. Portanto, você observou a aplicação dessas teorias na prática do cotidiano com exemplos reais utilizados por empresas em seus mais diversos departamentos e setore Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 30 Tema 4 Distribuição Normal de Probabilidade ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • A distribuição normal das probabilidades. • A distribuição contínua das probabilidades. • A utilização das variáveis aleatórias contínuas. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Como calcular uma distribuição normal de probabilidade? • De que forma é possível estimar áreas sob a curva normal? • Como compreender a utilização de variáveis aleatórias contínuas? 31 AULA 4 Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Distribuição Normal de Probabilidade Durante os estudos do tema 4, você encontrará as definições sobre o estudo e importância das distribuições discretas de probabilidade para variáveis contínuas, sendo a mais utilizada a distribuição normal de probabilidade. Utilizando-se da função densidade de probabilidade seria necessário uma série de cálculos para integrar áreas sob curvas de probabilidade. Porém, essas integrações (cálculo de integrais) se tornam desnecessárias, uma vez que foram desenvolvidas tabelas de probabilidades para tais distribuições contínuas. A distribuição normal de probabilidade é uma distribuição contínua que é simétrica e mesocúrtica, ou seja, a curva de sino não é nem achatada e nem pontiaguda, em termos de valores observados. Além disso, a distribuição de probabilidade normal é importante na inferência estatística por três razões distintas: a) as medidas produzidas em diversos processos aleatórios seguem essa distribuição; b) probabilidades normais podem ser usadas frequentemente como aproximações de outras distribuições de probabilidades, como por exemplo, distribuições binomial e Poisson; c) as distribuições de estatísticas da amostra, tais como a média e a proporção frequentemente, seguem a distribuição normal independentemente da distribuição da população. Para qualquer distribuição contínua de probabilidade, o valor da probabilidade somente pode ser determinado para um intervalo de valores da variável. A altura da função densidade, ou curva de probabilidade, para uma variável normalmente distribuída é dada por: f (X ) = ( X − µ )² − 1 e 2σ ² 2πσ Em que ∏ é a constante 3,1416 e, e é a constante 2,7183 (expoente natural); μ é a média da população e σ é o desvio padrão da distribuição. Porém, as tabelas de probabilidades da normal são 32 baseadas em uma distribuição particular: a distribuição normal padronizada. Esta é a distribuição de probabilidade com média = 0 (zero) e desvio padrão = 1. Qualquer conjunto de valores X normalmente distribuído pode ser convertido em valores normais padronizados z. z= X −µ σ A tabela 4 do apêndice B do Livro-Texto mostra as probabilidades da distribuição normal padronizada. Assim, gestores de empresas podem se utilizar da distribuição normal de probabilidade para determinação de metas, ou criar padrões para seus produtos ou serviços. Por exemplo, o departamento de recursos humanos está estudando mudanças na política salarial da empresa. Em sua pesquisa descobriu que a média salarial é de $ 2000,00 com desvio padrão de $ 200. A probabilidade que um funcionário tenha um salário entre $ 2000,00 e $ 2500,00 é definido da seguinte maneira: z= 2500 − 2000 = +2,50 200 Observe que pela definição da distribuição normal padronizada, primeiro o valor a ser estudado ($ 2500) subtrai a média ($ 2000) e seu resultado é dividido pelo desvio padrão. Pela tabela 4 do Livro-Texto z (2,50) – deve-se encontrar o valor da tabela z (2,5) na primeira coluna. Depois verificar na horizontal o valor que completa o valor de z, nesse caso 0,00. Uma vez que o resultado de z é igual 2,50. Fazendo a intersecção entre linha e coluna (linha 2,5 e coluna 0,00) o valor correspondente será de 0,9938. Observe a pintura da figura (gráfico acima dos valores da tabela) e verá que a parte pintada corresponde do lado negativo ao positivo (pelos números naturais), assim a probabilidade de encontrar um funcionário com salário entre $ 2000 e $ 2500 será: 0,9938 – 0,5= 0,4938, ou seja, 49,38%. Por que esse último cálculo? Mais uma vez é por causa da representatividade, em outras bibliografias pode ser encontrada a parte pintada partindo da média (mais comum nas bibliografias), nesse caso verá que o resultado já é obtido automaticamente. Compete agora analisar o resultado encontrado. Como já fora definido, a distribuição de probabilidade normal necessita de um intervalo de dados, nesse caso salários entre $ 2000 e $ 2500. Assim, note que a probabilidade de aleatoriamente um funcionário tenha salário entre este intervalo é de 49,38%, portanto, o departamento de recursos humanos poderá determinar mais alguns estudos e com seus resultados determinar a nova política salarial. Atualmente as grandes empresas utilizam da remuneração por produtividade e esse estudo é importante para definição dos pesos que servirão para multiplicar o salário de seus funcionários. A faixa em que tiver a menor concentração salarial poderá receber um tratamento diferenciado para igualar ou melhorar o salário. 33 Como já mencionado anteriormente, a distribuição normal pode ser utilizada para aproximações da distribuição binomial. Assim quando, a variável aleatória binomial discreta pode assumir um grande número de valores, o cálculo de suas probabilidades pode se tornar entediante. Quando n da distribuição binomial for grande, uma distribuição de probabilidade normal pode ser utilizada para proporcionar uma boa aproximação. Basta utilizar as tabelas de distribuição binomial e distribuição normal padronizada, no entanto deve-se observar à média e o desvio padrão da distribuição binomial para uso no cálculo. 34 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula. Ponto de Partida Visitando um hipermercado com seus amigos ou familiares, faça a média do gasto com as compras realizadas pelas pessoas. Em seguida, calcule o desvio padrão, para isso volte ao capítulo 2. Em seguida crie faixas para a percepção da probabilidade de ocorrência dos valores utilizados. No final de suas análises, poderá observar como os grandes supermercados determinam suas políticas promocionais. Agora é com você! Responda às questões a seguir para conferir o que aprendeu! Questão 01 O tempo x entre cargas de um telefone celular seja normalmente distribuído com média de 10 horas e desvio padrão de 1,5 horas. A probabilidade de que o celular dure entre 8 e 12 horas entre as cargas será: a) 81,64%. b) 18,36%. c) 90,82%. d) 9,18%. e) 50,00%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 02 A probabilidade de que um ponto x qualquer, dentro de uma distribuição normal de probabilidade esteja do lado direito da curva de sino será: a) 50%. b) 100%. c) 25%. d) 75%. e) 0%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 03 Sobre distribuição normal de probabilidade avalie as afirmativas abaixo: I. É a distribuição utilizada para variável contínua. II. Sua curva é chamada de curva de GAUSS. III. Sua curva é assimétrica em torno da média e tem formato de sino. IV. A curva normal à medida que se afasta da média ela toca no eixo x. Está(ao) correta(s). a) I apenas. 35 b) II apenas. Atenção: As questões de 6 a 10 devem ser res- c) I e II apenas. pondidas de acordo com enunciado a seguir. d) II e III apenas. e) Todas estão corretas. O processo de engarrafamento de refrigerantes de uma companhia foi ajustado para que uma Verifique seu desempenho nesta questão, clicando no ícone ao lado. média de 1000 ml de refrigerante seja colocada em cada garrafa. É claro que nem todas as garrafas têm precisamente 1000 ml devido a fontes Questão 04 Em uma linha de produção, um determinado pro- aleatórias de variabilidade. O desvio padrão líquido é de 25 ml, e sabe-se que a distribuição de seus “mls” segue uma distribuição normal. duto possui uma especificação que segue uma distribuição normal. A média do produto é 2 mm e seu desvio padrão 0,2 mm. A probabilidade de que um componente aleatoriamente selecionado esteja entre 2 mm e 2,4 mm será: Questão 06 Calcular a probabilidade de que uma garrafa a) 47,72%. aleatoriamente escolhida contenha entre 1000 e b) 48,93%. 1050 ml de refrigerante. c) 50,00%. d) 52,28%. e) 97,72%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 Qual a probabilidade de que uma garrafa de refri- Questão 05 gerante esteja entre 985 e 1002 ml? A função matemática da distribuição normal de probabilidade é: a) Exponencial. b) Linear. Verifique seu desempenho nesta questão, clicando no ícone ao lado. c) Logaritma. d) Identidade. e) Densidade. Questão 08 Qual a probabilidade de que uma garrafa conteVerifique seu desempenho nesta questão, clicando no ícone ao lado. 36 nha entre 950 ml e 1020 ml? Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 Qual a probabilidade de uma garrafa de refrigerante contenha entre 990 e 1000 ml? Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Faça uma síntese baseada nos exercícios anteriores. Se você fosse o gerente de produção dessa empresa, qual seria uma decisão imediata a ser tomada para melhorar o processo de engarrafamento? Verifique seu desempenho nesta questão, clicando no ícone ao lado. 37 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: DANFÁ, Sadjo et al. Distribuição espacial de valores prováveis de precipitação pluvial para períodos quinzenais, em Guiné-Bissau. Disponível em: <http://www.scielo.br/pdf/rbeaa/v15n1/ a10v15n01.pdf>. Acesso em: 26 jul. 2012. O artigo fala sobre a utilização da distribuição normal reduzida (padronizada – valor de z), em que no artigo ele é demonstrado para diversas culturas, ou seja z já foi calculado. Análise de risco de otimização de recursos hídricos e retorno financeiro em nível de fazenda. Leia o artigo: SILVA, Vicente P. R. da et al. Análise da pluviosidade e dias chuvosos na região Nordeste do Brasil. Disponível em <http://www.scielo.br/scielo.php?script=sci_pdf&pid=S1415- 43662011000200004&lng=en&nrm=iso&tlng=pt> Acesso em: 26 jul. 2012. Artigo que mostrará alguns tratamentos estatísticos utilizados até o momento. FINALIZANDO Nesse tema, você viu o estudo de variáveis aleatórias contínuas e suas distribuições de probabilidades. Assim, você pôde concluir que a distribuição normal pode assumir qualquer valor dentro dos limites estabelecidos, por isso, na maioria das pesquisas realizadas, a distribuição de probabilidade normal é a mais utilizada. Nesse contexto, você verificou que basta utilizar as tabelas de distribuição binomial e distribuição normal padronizada para uso no cálculo. Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 38 Tema 5 Intervalos de Confiança ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • O conceito e aplicação de intervalos de confiança. • A obtenção de estimativas. • O tamanho exigido da amostra para estimativas. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Como obter uma estimativa pontual e um erro máximo da estimativa? • De que forma construir e interpretar intervalos de confiança para a média populacional? • Como é possível determinar o tamanho mínimo exigido da amostra na estimativa da média populacional μ? 39 AULA 5 Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Intervalos de Confiança Os intervalos de confiança para a média são tipicamente construídos com o estimador não tendencioso, estando a média no centro do intervalo. Assim, ao considerar todos os possíveis estimadores não tendenciosos de algum parâmetro, aquele que apresentar a menor variância é chamado de estimador mais eficiente. Porém, até mesmo o estimador não tendencioso mais eficiente dificilmente estimará o parâmetro populacional exatamente. Mesmo sendo verdadeiro que a acurácia aumente com amostras maiores, ainda não haverá razão para que uma estimativa pontual obtida em uma dada amostra seja exatamente igual ao parâmetro populacional a ser estimado. Talvez este seja um ponto importante para as desconfianças das pesquisas realizadas em época de eleições. Há muitas situações nas quais é preferível determinar um intervalo dentro do qual esperaríamos encontrar o valor do parâmetro. Tal intervalo é chamado de estimativa intervalar. Para um estimador intervalar (ou intervalo de confiança) é necessário determinar um coeficiente de confiança, com isso o coeficiente de confiança nada mais é que a probabilidade que um intervalo de confiança selecionado aleatoriamente inclua o parâmetro da população – isto é, a freqüência relativa com a qual intervalos construídos de forma similar incluirão o parâmetro da população quando o estimador for usado repetidamente um grande número de vezes. O nível de confiança é o coeficiente de confiança expresso em percentual. As condições requeridas para um intervalo de confiança válido de amostra grande para a média populacional (μ); a) uma amostra aleatória é selecionada da população alvo, b) o tamanho n da amostra é grande (isto é, n ≥30; devido ao teorema do limite central, essa condição garante que a distribuição amostral de x’ seja aproximadamente normal. Além disso, para n grande, s será um bom estimador de σ). Em que s é o desvio padrão da amostra e σ o desvio padrão da população. O intervalo de confiança de (1 – α)% de uma amostra grande para μ é dado pela equação, a 40 seguir: x ± zα /2σ x = x ± zα /2 σ n em que zα/2 é o valor z com uma área α/2 à sua direita e σx = σ/√n. O parâmetro σ é o desvio padrão da população amostrada e n é o tamanho da amostra. Dessa forma consegue-se observar a distinção entre os objetivos das estimativas pontuais e de estimativas por intervalos de confiança. A primeira fornece um número único extraído de um conjunto de dados experimentais, e a última fornece um intervalo, conforme os dados experimentais que sejam razoáveis para o parâmetro; ou seja, 100(1 – α)% de tais intervalos compreendam o parâmetro. No entanto, essas duas abordagens para estimação estão relacionadas entre si. A relação comum é a distribuição amostral de um estimador pontual. Assim, como visto na equação acima, a parte da equação que σ/√n é chamado de erro-padrão de um estimador que é seu desvio padrão. A equação do erro padrão, portanto, pode ser escrita da seguinte maneira: x ±zα/2 e.p.(x), onde “e.p” é o erro padrão. Vale ressaltar, o ponto importante é que a amplitude do intervalo de confiança para µ depende da qualidade do estimador pontual por meio de seu erro padrão. O intervalo de confiança não é melhor (em termos de amplitude) do que a qualidade da estimativa pontual, neste caso por meio de seu erro padrão estimado. As estimativas pontuais e intervalar da média fornecem boas informações sobre o parâmetro desconhecido µ de uma distribuição normal, ou de uma distribuição não normal da qual uma grande amostra é retirada. Às vezes, além da medida populacional, o pesquisador pode também estar interessado em prever o possível valor de uma observação futura. Essa estimativa é chamada de intervalo de predição. Para obtenção de um intervalo de predição, deve-se assumir que uma amostra aleatória venha de uma população normal com média µ desconhecida e variância σ² conhecida. Um estimador pontual natural de uma nova observação é X. A variância de X é σ²/n. Entretanto, para prever uma nova observação, é preciso considerar não somente a variação devida à estimativa da média (X), mas também a variação de uma observação futura. Assim o intervalo de predição pode ser encontrado pela equação: 41 X – zα/2σ√1+1/n <x0 < x + zα/2σ√1+1/n Em que: x0 – é a observação futura. zα/2 – é o valor de z que deixa uma área α/2 à direita. O intervalo de predição fornece uma boa estimativa da localização de uma observação futura, o que é bastante diferente da estimativa do valor da média amostral. Nota-se, portanto, que a variação desta predição é a soma da variação devido à estimativa da média com a variação de uma única observação. A distribuição t de student é a melhor a ser utilizada. 42 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula. Ponto de Partida Um aparelho de telefone celular possui um desvio padrão de sua vida útil conhecido e é igual a σ = 500, mas a média da vida útil é desconhecida. Suponha que a vida útil dos Questão 01 Um estimador de qualidade imparcial é: a) Média amostral. b) Média populacional. c) Variância. d) Desvio padrão. e) Erro padrão. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 02 Em um esquema em que se toma a amostra aleatória simples de tamanho 160 de uma população de 1600 indivíduos encontram-se os valores X = 20 (média) e σ² = 16 para a variância. Assinale a opção que corresponde à estimativa não viezada da variância. a) 0,07. b) 0,08. c) 0,09. d) 0,10. e) 0,15. aparelhos celulares tenham uma distribuição aproximadamente normal. Para uma amostra de n = 15, a média da vida útil é X = 2900 horas de operação. Construa um intervalo de confiança de 95% para estimar a média da população. Agora é com você! Responda às questões a seguir para conferir o que aprendeu! Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 03 A concentração média de iodo recuperado de uma amostra de medições desse material em 36 locações diferentes é 2,6 gramas por mililitro. O valor do intervalo de confiança de 95% para a média de concentração de iodo, com desvio padrão da população igual a 0,3. 43 a) 2,50 a 2,70. Atenção: Para as questões 6, 7 e 8 utilize o enun- b 2,60 a 2,80. ciado a seguir: c) 2,50 a 2,80. d) 2,50 a 2,60. Um analista financeiro obtém dados de uma e) 2,60 a 2,70. amostra de 600 consumidores de um total de 1000 que adquiriram uma determinada oferta. Os Verifique seu desempenho nesta questão, clicando no ícone ao lado. 600 consumidores gastaram, nesse supermercado, uma média de X = $ 37,49 com um desvio padrão s = $ 7,89. Para um intervalo de confiança Questão 04 Com referência a questão anterior, o intervalo de confiança para 99% será: a) 2,40 a 2,80. Questão 06 O valor médio de compras para todos os 1000 b) 2,47 a 2,73. consumidores. c) 2,47 a 2,60. Verifique seu desempenho nesta questão, clicando no ícone ao lado. d) 2,60 a 2,73. e) 2,60 a 2,80. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 05 De acordo com a questão 3, qual deverá ser o tamanho da amostra para um intervalo de 95% e desvio padrão populacional = 0,3, e, que a estimativa para a média (µ) esteja distante por menos de 0,05. a) 100. b) 120. c) 121. d) 135. e) 139. Verifique seu desempenho nesta questão, clicando no ícone ao lado. 44 de 95%, estimar: Questão 07 O valor total das compras dos 1000 consumidores Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 O valor médio de compras para todos os 1000 consumidores, mas para um intervalo de confiança de 99%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 O departamento de compras da empresa XYZ deseja estimar o valor médio das compras por cliente em uma loja de perfumes no novo shopping da cidade. Com base em dados do outro shopping existente na cidade, o desvio padrão de tais valores de vendas é estimado em cerca de σ $ 80,00. Qual o tamanho da amostra mínimo que deveria ter uma amostra aleatória se ele deseja estimar a média das vendas dentro de $ 25,00 e com uma confiança de 95%? Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Devido à crise econômica mundial ocorrida em 2009, muitos bancos deixaram de receber seus créditos. Uma amostra recente de 50 empréstimos resultou em uma média de $ 257.300,00. Assumindo um desvio padrão da população de $ 25.000,00. Se o próximo cliente necessitar de um novo empréstimo, determine um intervalo de confiança de predição de 95% para a quantia do empréstimo do cliente. Verifique seu desempenho nesta questão, clicando no ícone ao lado. 45 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: BALABAN, Geni; SILVA, Gisélia A.P da. Prevalência de sobrepeso e obesidade em crianças e adolescentes. Disponível em: <http://www.scielo.br/pdf/jped/v77n2/v77n2a08.pdf> Acesso em: 26 jul. 2012. O artigo demonstra a utilização de intervalos de confiança para a pesquisa realizada. Leia o artigo: FERREIRA, Marlene de Cássia Trivellato; MARTURANO, Edna Maria. Ambiente familiar e os problemas do comportamento apresentados por crianças com baixo desempenho escolar. Disponível em: <http://www.scielo.br/pdf/%0D/prc/v15n1/a05v15n1.pdf> Acesso em: 26 jul. 2012. Leia o artigo: RIBEIRO, Carla de Matos et al. Determinação do índice de acidez de biodiesel por titulação potenciométrica utilizando-se diferentes métodos. Disponível em: <http://200.20.213.30/ handle/10926/1193 > Acesso em: 26 jul. 2012. Esse trabalho consistiu na determinação do índice de acidez de biodiesel de soja/sebo por meio de titulação potenciométrica. Leia o artigo: SCHEIN, Diana; LIMA, Milton Luiz Paiva. Uma metodologia para o dimensionamento de frota de rebocadores em terminais portuários: uma aplicação ao porto do Rio Grande. Disponível em: <http://www.podesenvolvimento.org.br/inicio/index.php?journal=podesenvolvim ento&page=article&op=view&path[]=47>. Acesso em: 26 jul. 2012. Nesse trabalho é aplicada uma metodologia para encontrar o número adequado de rebocadores para atender ao Porto do Rio Grande. FINALIZANDO Nesse tema, você viu que o estudo de intervalos de confiança oferece ao pesquisador uma melhor compreensão dos dados em estudo, isto se deve porque a utilização do intervalo de confiança determina, basicamente, uma faixa possível de sua resposta. Como observado, em “ampliando o conhecimento”, diversas pesquisas utilizam intervalos de confiança para justificar e validar seus estudos. Por meio de distribuição normal ou aproximadamente normal (t student) pode-se determinar um intervalo pontual ou estimado de confiança. 46 Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! Tema 6 Teste de Hipótese com Uma ou Duas Amostras ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • Os testes de hipóteses. • Níveis de significância utilizados nas hipóteses. • Os tipos de erros I e II. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Como estabelecer hipóteses aos estudos (nula e alternativa)? • Como identificar os erros tipo I e II? • De que forma é possível interpretar um nível de significância? • Como analisar quando é necessário usar um teste estatístico mono ou bicaudal? 47 • De que forma é possível explicar uma decisão baseada nos resultados de um teste estatístico? AULA 6 Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Teste de Hipótese com Uma ou Duas Amostras Entende-se por uma hipótese estatística afirmação ou conjectura sobre uma ou mais populações. Em um teste de hipótese, é necessário iniciar com um suposto valor (hipotético) de um parâmetro da população. Depois de coletar uma amostra aleatória, compara-se a estatística da amostra, tal como a média amostral (X), com o parâmetro suposto, tal como a média populacional hipotética (µ). Então, ou é aceito ou rejeitado o valor hipotético como correto. O valor hipotético é rejeitado somente se o resultado da amostra for claramente improvável de ocorrer quando a hipótese for verdadeira. Em geral, o problema enfrentado por pesquisadores não é tanto a estimativa dos parâmetros populacionais, mas sim a formação de um procedimento com base em dados que se possa concluir sobre algum sistema científico. Para isso, há a necessidade de postular algo, ou seja, criar uma hipótese. Nunca se sabe com absoluta certeza se uma hipótese estatística é verdadeira ou falsa, a não ser que toda a população seja examinada, o que é inviável na maioria das situações. Por isso, ao extrair uma amostra aleatória da população de interesse e usar os dados contidos nela, conseguese fornecer evidência que se apoie ou refute a hipótese. O procedimento de decisão deve ser feito em consonância com a probabilidade de uma conclusão errada. A afirmação formal de uma hipótese é frequentemente influenciada pela estrutura da probabilidade de uma conclusão errônea. Assim, se o pesquisador está interessado em apoiar fortemente uma alegação, ele espera chegar à alegação na forma de rejeição de uma hipótese. Portanto, você percebe que a primeira etapa em um teste de hipótese é a de formular hipótese 48 nula e a hipótese alternativa, comumente nos livros de estatísticas são indicadas por H0 ou Hn para hipótese nula; e H1 ou Ha para hipótese alternativa. A hipótese nula é o valor suposto ou alegado do parâmetro o qual é comparado com o resultado da amostra. Ele é rejeitado somente se o resultado da amostra for improvável sendo a hipótese considerada verdadeira. A hipótese alternativa é aceita somente se a hipótese nula for rejeitada. Em seguida, em uma próxima etapa (2), o pesquisador deve especificar o nível de significância a ser utilizado. O nível de significância é o padrão estatístico especificado para rejeitar a hipótese nula. Assim, se for especificado um nível de significância de 5%, a hipótese nula é rejeitada somente se o resultado da amostra for tão diferente do valor suposto ou alegado que uma diferença igual ou maior ocorreria por acaso com uma probabilidade máxima de 0,05. Observe que ainda existe uma probabilidade de 0,05 de rejeitar a hipótese nula sendo a mesma verdadeira. Este é o chamado erro tipo I. A probabilidade do erro tipo I é sempre igual ao nível de significância utilizado como padrão para rejeitar a hipótese nula; ele é representado pela letra grega minúscula α (“alfa”), sendo que α, deste modo, representa o nível de significância. Os níveis de significância mais frequentemente utilizados em testes de hipóteses são os de 5% e 1%. Já um erro tipo II é aquele que ocorre quando a hipótese nula é aceita mesmo sendo falsa. Nesse contexto, após especificado o nível de significância, o pesquisador deve selecionar a estatística do teste. A estatística de teste será ou a estatística da amostra (o estimador não tendencioso do parâmetro sendo testado), ou uma versão modificada da estatística da amostra. Em seguida, estabelece o valor crítico ou valores críticos da estatística de teste. Porém, antes de tomar a decisão, o pesquisador precisa determinar o valor real da estatística de teste, por fim, com esses procedimentos adotados, toma-se a decisão, baseado no valor observado da estatística da amostra é comparada com o valor crítico (ou valores) as estatística de teste. As situações possíveis ao testar uma hipótese estatística, pode ser observado na figura 1, a seguir: Não rejeitar H0 Rejeitar H0 H0 é verdadeira Decisão correta Erro tipo I H0 é falsa Erro tipo II Decisão correta Figura 1 – Situações possíveis ao testar uma hipótese estatística. 49 Para a probabilidade de se cometer um erro tipo II, denotada pela letra grega β (“beta”), é impossível de ser calculada, a não ser que se tenha uma hipótese alternativa específica. Essa é uma probabilidade alta, que indica um procedimento de teste no qual é muito provável que será rejeitada. Idealmente seria utilizar um procedimento de teste para o qual a probabilidade dos erros tipo I e II sejam ambos pequenos. Existem situações, por exemplo, em que se deseje cometer um erro tipo II, assim à medida que a hipótese alternativa aproxima de 1, o valor de β diminui para 0 (zero). 50 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (qua- com média μ e variância σ2. O valor da estatística teste t com distribuição de Student sob a hipótese H0:μ =100 é de –1,7864 e sabe-se que P(t ≥1,7864) = 0,0446. Suponha que a probabilidade de erro do tipo I esteja sendo controlada em 5%. Assinale a resposta correta. a) Como o valor probabilístico do teste é 0,0446 conclua H0: µ = 100. b) Como o valor probabilístico do teste é 0,0446 conclua H1: µ ≠ 100. c) Como o valor probabilístico do teste é 0,0892 não há evidência para rejeitar H0: µ = 100. d) Como o valor probabilístico do teste é 0,0223 conclua H1: µ ≠ 100. e) Não se pode tirar nenhuma conclusão, pois o tamanho da amostra, a média amostral e o desvio padrão amostral não foram dados. tro) casas decimais após a vírgula. Ponto de Partida Um aparelho de telefone celular possui um desvio padrão de sua vida útil conhecido e é igual a σ = 500, mas a média da vida útil é desconhecida. Suponha que a vida útil dos aparelhos celulares tenham uma distribuição aproximadamente normal. Para uma amostra de n = 15, a média da vida útil é X = 2900 horas de operação. Construa um intervalo de confiança de 95% para estimar a média da população. Agora é com você! Responda às questões a Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 02 O resultado de um ensaio destinado a investigar a efetividade da vacinação de animais na prevenção de certo tipo de doença produziu a tabela de contingência seguinte. Vacina Sim Não Doença Sim Não 14 42 16 28 seguir para conferir o que aprendeu! Deseja-se testar a hipótese de que os perfis (de Questão 01 Assinale a opção que dá o valor da contribuição Considere o teste da hipótese H0:μ =100 contra alternativa H1:μ ≠ 100 em uma amostra da normal linha) de vacinados e não vacinados coincidem. da primeira célula da tabela para a estatística teste de homogeneidade do qui-quadrado. 51 a) 0,326. Assinale a opção que dá o valor da estatística F b) 0,450. utilizada para testar a hipótese de igualdade de c) 0,400. médias das marcas. d) 0,500. a) 2. e) 0,467. b) 10. c) 12. Verifique seu desempenho nesta questão, clicando no ícone ao lado. d) 20. e) 72. Atenção: As questões 3 e 4 referem-se ao enunciado seguinte. Em um estudo controlado em que o interesse con- Verifique seu desempenho nesta questão, clicando no ícone ao lado. centra-se no desgaste de pneus testaram-se um certo número de marcas obtendo-se os resultados constantes da tabela de análise de variância dada abaixo. Fonte Questão 05 A probabilidade de cometer um erro tipo II ao Graus de Li- Soma de Qua- custo de aumentar a probabilidade de cometer berdade drados Marcas 3 60 um erro tipo I, para um tamanho fixo de amostra, Erro 36 72 Total (Corrigi- 39 132 do) Questão 03 Assinale a opção que dá o número de marcas de pneus estudadas. a) 2. b) 3. c) 4. d) 5. e) 12. Verifique seu desempenho nesta questão, clicando no ícone ao lado. uma redução na probabilidade de um erro normalmente resulta num aumento da probabilidade de outro erro. Felizmente, a probabilidade de cometer ambos os tipos de erros pode ser reduzida se: a) Rejeitar H0. b) Aceitar H0. c) Aceitar H1. d) Rejeitar H1. e) Aumentar o tamanho da amostra. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 06 Utilizando as distribuições t student. Questão 04 52 A hipótese nula formulada é de que a média da vida útil de um ar condicionado da marca X é, no mínimo, de 4.200 horas. A média da vida útil para uma amostra de n = 10 é X (média) = 4.000 horas, com um desvio padrão amostral de s = 200 horas. A vida útil do ar condicionado, presume-se, segue uma distribuição normal. Teste a hipótese nula a mece com uma hipótese nula de que o valor médio de todas as contas a receber é, no mínimo, $ 260.000,00. Dado que a média da amostra é $ 240.000,00, teste essa hipótese, ao nível de significância de 5%. um nível de significância de 5%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 Um controller deseja testar a hipótese de que o valor médio de todas as contas a receber em uma empresa é $ 260.000,00, tomando para tanto uma amostra de 36 clientes (n = 36) e calculando a média amostral. Ele deseja rejeitar o valor hipotético de $ 260.000,00 somente se tal valor for contraditado pela média da amostra. Determine as hipóteses nula e alternativa. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 O representante de um grupo comunitário informa, a uma pessoa que está interessada em estabelecer um centro comercial, que a renda média familiar na área é de $ 1.500,00. Suponha que, para o tipo de região em questão, é possível supor que a renda média familiar tem distribuição aproximadamente normal, e que se pode aceitar o desvio padrão como sendo σ = $ 200,00, com base em um estudo anterior. Para uma amostra aleatória de n = 15 famílias, a ren- Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 Para a hipótese nula da questão 7, determinar os valores críticos da média da amostra para testar a hipótese a um nível de significância de 5%. Dado da média familiar foi X (média) $ 1.400,00. Testar a hipótese nula de que µ = $ 1.500,00, estabelecendo limites críticos da média da amostra, utilizando um nível de significância de 5%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. que se conhece o desvio padrão dos valores das contas a receber, σ = $ 43.000,00. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 Suponha que o controller das questões 7 e 8 co- 53 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: LANDÍN, Pedro R.; SÁNCHEZ, Ernesto. Niveles de razonamiento probabilístico de estudiantes de bachillerato frente a tareas de distribuición binomial. Disponível em: <http:// revistas.pucsp.br/index.php/emp/article/view/4842/3703> Acesso em: 26 jul. 2012. Neste artigo os autores apresentam uma hierarquia de raciocínios utilizados para avaliar as respostas de alunos do ensino médio a um questionário contendo tarefas relacionadas com a distribuição binomial. Leia o artigo: SILVA, Vicente P. R et. al. Análise da pluviosidade e dias chuvosos na região Nordeste do Brasil. Disponível em <http://www.scielo.br/pdf/rbeaa/v15n2/v15n02a04.pdf>. Acesso em: 26. Jul. 2012. O artigo mostrará alguns tratamentos estatísticos utilizados até o momento. Leia o artigo: GUARIEIRO, Lílian Lefol Nani et. al. Metodologia analítica para quantificar o teor de biodiesel na mistura biodiesel: diesel utilizando espectroscopia na região do infravermelho Disponível em <http://www.scielo.br/pdf/qn/v31n2/a41v31n2.pdf>. Acesso em: 26 jul. 2012. O artigo mostrará a metodologia do teste de hipótese, bem como o método de regressão linear a ser visto no tema 8. Leia o artigo: RODRIGUES, Jackson Martins et. al. Efeitos locais e de larga escala na dinâmica climática do município de Viçosa/MG. Disponível em <http://www.seer.ufu.br/index.php/ sociedadenatureza/article/viewFile/9883/pdf_21> Acesso em: 26 jul. 2012. O artigo trará o teste de hipótese utilizando t student. FINALIZANDO Nesse tema, você viu que o teste de hipótese auxilia o pesquisador na tomada de decisão. Necessariamente é preciso lançar mão uma hipótese, e em seguida adotar o procedimento para teste estatístico de hipótese. A hipótese nula é o valor suposto do parâmetro o qual é comparado com o resultado da amostra. Ele é rejeitado somente se o resultado da amostra for improvável sendo a hipótese considerada verdadeira. Portanto, você viu que em um teste de hipótese deve-se levar em consideração um nível de significância, pois é ele que determina se a hipótese é aceita ou rejeitada. 54 Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! Tema 7 Correlação e Regressão ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • O conceito de correlação linear, variáveis dependentes e independentes • O uso de coeficiente de um correlação. • Os tipos de correlações. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Quais os conceitos de correlação linear, variáveis dependentes e independentes e tipos de correlações? • Como simular um coeficiente de correlação? • Como diagnosticar um teste de hipótese para um coeficiente de correlação populacional p.? 55 AULA 7 Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Correlação e Regressão O termo regressão foi introduzido por Francis Galton, em seu estudo inicial, Galton verificou que, embora houvesse uma tendência de pais altos terem filhos altos e que pais baixos terem filhos baixos, a altura média de pais de uma dada altura tendia a se deslocar ou “regredir” até uma média da população como um todo. Assim, pode-se dizer que a altura dos filhos de pais extraordinariamente altos ou baixos tende a se mover para a altura média da população. A lei de regressão universal de Galton foi confirmada por seu amigo Karl Pearson, que coletou mais de mil registros das alturas dos membros de grupos de famílias. A moderna interpretação da regressão é, porém, bem diferente, em linhas gerais a análise de regressão ocupa-se do estudo da dependência de uma variável, a variável dependente, em relação a uma ou mais variáveis, as variáveis explicativas, com o objetivo de estimar e/ou prever a média (da população) ou o valor médio da dependente em termos dos valores conhecidos ou fixos (em amostragem repetida) das explicativas. Assim, o modelo estatístico de uma regressão linear simples para dados n pares de valores de duas variáveis Xi, Yi (i = 1,2,3,...,n), se admitir que Y é uma função linear de X, pode-se estabelecer uma regressão linear simples, cujo modelo estatístico é: Yi = α + βXi + ui. Em que α e β são parâmetros. O coeficiente angular da reta (β) é também denominado de coeficiente de regressão e o coeficiente linear da reta (α) é também denominado como termo constante da equação de regressão. A análise de regressão também pode ser aplicada às relações não lineares. Ao estabelecer o modelo de regressão linear simples, pressupõem que: a) a relação entre X e Y é linear; b) os valores de X são fixos, isto é, X não é uma variável aleatória; c) a média do erro é nula, isto é, E(ui) = 0; d) para um dado valor de X, a variância do erro u é sempre σ², denominada variância residual, isto é: E(ui²) = σ², ou então, E[Yi – E(Yi|Xi)]² = σ². Assim, pode-se dizer que, o erro é homocedástico ou que tem-se homocedasticia (do erro ou 56 da variável dependente); e) o erro de uma observação é não correlacionado com o erro de outra observação, isto é, E(uiuj) = 0 para i ≠ j; f) os erros tem distribuição normal. Deve-se ainda verificar, se o número de observações disponíveis é maior do que o número de parâmetros da equação de regressão. Para ajustar uma regressão linear simples precisa-se ter, no mínimo, três observações. Assim, se só dispor de duas observações (dois pontos), a determinação da reta é um problema de geometria analítica; não é possível, nesse caso, fazer nenhuma análise estatística. Com base nas cinco pressuposições, é possível demonstrar que as estimativas dos parâmetros obtidas pelo método dos mínimos quadrados são estimativas lineares não tendenciosas de variância mínima. A pressuposição (b) não é, na verdade, essencial. Já a pressuposição (c) exclui, por exemplo, a existência de erros sistemáticos de medida da variável Y. A pressuposição (d) é necessária para que se possa utilizar as distribuições de t e de F para testar hipóteses a respeito dos valores dos parâmetros ou construir intervalos de confiança. Em alguns casos, é possível justificar essa pressuposição com base no teorema do limite central. Esse teorema, na sua versão mais geral, estabelece que a soma de um grande número de variáveis aleatórias independentes tem distribuição aproximadamente, normal, desde que nenhuma delas seja dominante. A pressuposição (e) geralmente não é obedecida quando é trabalhado com séries cronológicas de dados, portanto, há uma autocorrelação nos resíduos. O erro (ui) do modelo estatístico de uma regressão linear pode ser devido à influência de todas as variáveis que afetam a variável dependente e que não foram incluídas no modelo. Uma vez que as variáveis não foram consideradas, devem ser as menos importantes, seus efeitos devem ser relativamente pequenos. Considerando que o número de fatores que podem afetar certa variável dependente é bastante grande, e desde que seus efeitos sejam aditivos e independentes, pode-se concluir, com base no teorema do limite central, que erro residual tem distribuição aproximadamente normal. Portanto, a regressão e correlação estão intimamente relacionadas, porém, conceitualmente muito diferente da análise de regressão, é a análise de correlação, cujo objetivo básico é medir a intensidade ou o grau de associação linear entre duas variáveis. O coeficiente de correlação mede essa intensidade da associação (linear). Na análise de regressão não está preocupada em princípio em tal medição. Em vez disso, estimar ou prever o valor médio de uma variável com base nos valores fixados de outras variáveis. Assim, vale a pena mencionar algumas diferenças fundamentais entre regressão e correlação. Na 57 análise de regressão há uma assimetria na forma como as variáveis dependentes e explicativas são tratadas. Supõe-se que a variável dependente seja estatística, aleatória ou estocástica, isto é, que tenha uma distribuição de probabilidade. Portanto, por outro lado, que as variáveis explicativas tenham fixadas (em amostragem repetida). Na análise de correlação, por outro lado, é tratado quaisquer (duas) variáveis simetricamente; não há nenhuma distinção entre as variáveis dependente e explicativa. Ainda que ambas as variáveis sejam aleatórias. 58 Agora é a sua vez INSTRUÇÕES Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Livro-Texto e de outros livros de apoio disponíveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um sim- II. A correlação linear negativa é aquela em que os pontos do diagrama é uma reta descendente. III. Uma correlação não linear é aquela em que os pontos do diagrama é uma reta ascendente e descendente. IV. O coeficiente de correlação de Pearson os limites de r serão sempre [0,1]. a) Apenas I está correta. b) Apenas III está correta. c) I e IV estão corretas. d) II e III estão corretas. e) I e II estão corretas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. ples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (quatro) casas decimais após a vírgula. Ponto de Partida Calcule o coeficiente de correlação e analise o resultado. Para isso, veja em sua sala de aula e aleatoriamente anote 10 valores das notas de matemática e estatística, depois que treinarem bastante façam outras correlações com outras disciplinas. Agora é com você! Responda às questões a seguir para conferir o que aprendeu! Atenção: O enunciado seguinte diz respeito às questões 2, 3, 4 e 5. Considere o modelo de regressão linear com t = 1,..., n, onde α e β são parâmetros desconhecidos, os yt são observações de uma variável dependente Y, os xt são realizações de uma variável exógena X e os erros εt são realizações não diretamente observáveis de variáveis aleatórias não correlacionadas com média nula e σ² > 0. Questão 02 No contexto da distribuição amostral do estimador de mínimos quadrados de β (β^), assinale a Questão 01 Analise as proposições a seguir: opção que não é correta. a) O valor esperado da distribuição amostral de β^ é β. I. A correlação linear positiva é aquela em que os b) A variância da distribuição amostral de β^ aumenta com σ². pontos do diagrama é uma reta ascendente. c) A variância da distribuição amostral de β^ dimi- 59 nui quando aumenta a variabilidade das observa- e) Tem pouco interesse prático se nenhuma das ções X em torno da média. observações de X for exatamente nula. d) Como β^ é constante para uma amostra particular qualquer modelo de regressão, não possui uma Verifique seu desempenho nesta distribuição amostral. questão, clicando no ícone ao lado. e) A distribuição amostral de β^ é normal se os erros forem normalmente distribuídos. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 05 Os estimadores de mínimos quadrados α^ e β^ tendem a mostrar que tipo de comportamento quando a média das observações de X é posi- Questão 03 tiva? a) São independentes. Suponha os erros normais. Se o intervalo de con- b) Variam na mesma direção, pois para uma fiança calculado para β inclui o zero pode-se con- amostra particular qualquer do modelo subes- cluir que: tima-se ou superestima-se a reta de regres- a) O erro médio quadrático da regressão é nulo. são verdadeira. b) O coeficiente de determinação é nulo. c) Não existe um efeito causal de X em Y, mas pode haver um efeito causal de Y em X. d) Y não sofre influência linear de X. e) A função de regressão passa pela origem. c) Variam em direções opostas dado o sinal negativo da covariância entre eles. d) Variam na mesma direção se o sinal de β^ for positivo. e) Variam na mesma direção se os sinais de α^ e β^ forem ambos positivos. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 04 No contexto do cálculo do intervalo de confiança Verifique seu desempenho nesta questão, clicando no ícone ao lado. Atenção: Para as questões 6, 7, 8 e 10 utilize o enunciado a seguir: para α quando X=0 é um valor plausível para a regressão, assinale a opção correta. Um dos problemas desafiadores enfrentados a) O intervalo coincide com o intervalo de previsão pela área de controle de poluição nas águas é para uma nova observação de Y quando X=0. apresentado pela indústria de couro. Os deje- b) O intervalo coincide com o intervalo para E(Y|X=0). tos dos curtumes são quimicamente complexos. c) Geralmente o intervalo terá limites iguais ao inter- Eles são caracterizados por altos valores de devalo análogo calculado para β . manda de oxigênio bioquímico, sólidos voláteis e d) O intervalo de confiança só deve ser calculado se outras medidas de poluição. Considere os dados o intervalo para β contiver o zero. 60 experimentais obtidos e dispostos na tabela 1. São 33 amostras de desejos quimicamente tratados metro (a). em um estudo da Universidade Estadual da Virgínia. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Redução de Demanda Redução de Demanda sólidos, x de oxigênio sólidos, x de oxigênio (%) químico, y (%) químico, y (%) (%) 3 5 36 34 7 11 37 36 11 21 38 38 15 16 39 37 18 16 39 36 21 28 39 45 29 27 40 39 30 25 41 41 30 35 42 40 31 30 42 44 31 40 43 37 32 32 44 44 33 34 45 46 33 32 46 46 34 34 47 49 36 37 50 51 36 38 Questão 09 Indique o parâmetro (b) da regressão Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 Determine a equação de Y^ estimado. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 06 Determine o coeficiente de correlação. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 O coeficiente de correlação linear é positivo, negativo, não linear, explique. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 Faça a análise de regressão linear – indique o parâ- 61 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: BALABAN, Geni; SILVA, Gisélia A.P da. Prevalência de sobrepeso e obesidade em crianças e adolescentes. Disponível em: <http://www.scielo.br/pdf/jped/v77n2/v77n2a08.pdf> Acesso em: 26 jul. 2012. O artigo demonstra a utilização de intervalos de confiança para a pesquisa realizada. Leia o artigo: RIBEIRO, Carla de Matos et al. Determinação do índice de acidez de biodiesel por titulação potenciométrica utilizando-se diferentes métodos. Disponível em: <http://200.20.213.30/ handle/10926/1193>. Acesso em: 26 jul. 2012. Esse trabalho consistiu na determinação do índice de acidez de biodiesel de soja/sebo por meio de titulação potenciométrica. Leia o artigo: DESSEN, Marina Campos; PAZ, Maria das Graças da. Bem-estar pessoal nas organizações. Disponível em: <http://www.scielo.br/pdf/ptp/v26n3/a18v26n3.pdf> Acesso em: 26 jul.2012. As autoras observarão a utilização da regressão linear para confrontar personalidades dentro das organizações. FINALIZANDO Nesse tema, você viu que a regressão linear e correlação estão intimamente relacionadas, mas que a regressão linear há uma assimetria na forma como as variáveis dependentes e explicativa são tratadas. Pode-se por meio de uma regressão linear estimar uma situação por meio da equação de regressão. Nessa perspectiva, você viu que já a análise de correlação tem por objetivo básico mensurar a intensidade ou o grau de associação linear entre duas variáveis. Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 62 Tema 8 Teste Qui-Quadrado e Teste F ícones: i a lf h g k t s ud r b mi e q l nc p x w o zj x y i Conteúdos e Habilidades Conteúdo Nesta aula, você estudará: • A importância e utilidade dos testes qui-quadrado. • A distribuição de frequência. • As distribuições F. Habilidades Ao final, você deverá ser capaz de responder as seguintes questões: • Como usar a distribuição qui-quadrado para testar se uma distribuição de frequência se ajusta a uma distribuição alegada? • Como utilizar uma tabela de contingência para obter frequências esperadas? • Como utilizar o teste qui-quadrado para verificar se duas variáveis são independentes? • Como interpretar a distribuição F e usar sua tabela para obter valores críticos? • De que forma é possível realizar um teste F de duas amostras para comparar duas variâncias? 63 AULA 8 Assista às aulas nos polos presenciais e também disponíveis no Ambiente Virtual de Aprendizagem para você. Leitura Obrigatória Correlação e Regressão Em um teste qui-quadrado a preocupação é testar um valor hipotético da variância populacional, de acordo com a equação a seguir: X2 = ( n − 1) s 2 σ 02 Dessa forma, é possível comparar frequências, obtidas em amostras, de certas categorias, com frequências esperadas baseadas, em cada caso, em hipóteses particulares. Assim, todos os procedimentos apresentados são testes de hipóteses, e, portanto, possuem relação com a análise dos resultados da amostra. As distribuições X² (qui-quadrado) podem ser utilizadas ainda em hipóteses relativas à bondade de ajustamento, à independência de duas variáveis e à diferença entre k proporções amostrais. A hipótese nula, em testes de bondade de ajustamento, é uma condição estipulada referida ao padrão esperado de frequências em uma série de categorias. O padrão esperado pode ajustar-se à suposição de igual verossimilhança e ser uniforme, ou pode ajustar-se a distribuições de probabilidade tais como a binomial, Poisson ou Normal. Enquanto o teste qui-quadrado é utilizado para testar as diferenças entre k proporções a análise de variância é empregada para testar as diferenças entre k médias. Uma suposição básica implícita na análise de variância é que as diversas médias amostrais são obtidas de populações normalmente distribuídas e que tem a mesma variância. Todavia, descobriu-se que o procedimento de teste não é afetado por violações na hipótese de normalidade, quando as populações são unimodais e os tamanhos das amostras são aproximadamente iguais. Uma vez que a hipótese nula é que as médias da população são iguais, a suposição de iguais variâncias (homogeneidade da variância) também implica que o teste se relaciona com a hipótese de que as médias foram obtidas de uma mesma população. Isto porque toda população normalmente distribuída se define tendo como parâmetros a média, a variância (ou desvio padrão). O conceito básico implícito na análise de variância foi desenvolvido por Ronald Aylmer Fisher, a distribuição F foi assim denominada justamente em sua honra. 64 A distribuição F tem grande aplicação na comparação de duas variâncias. As aplicações da distribuição F são encontradas em problemas que envolvam duas ou mais amostras. A estatística F ou distribuição F é definida pela razão de duas variáveis aleatórias qui-quadrado independentes, cada uma dividida por seu número de graus de liberdade. Ou seja, , em que U e V são variáveis aleatórias independentes com distribuições qui-quadrado com v1 e v2 graus de liberdade, respectivamente. Assim, como a distribuição normal de probabilidade a distribuição F também é caracterizada por uma função densidade. No entanto, o raciocínio conceitual deve-se primeiramente, calcular a média para cada grupo de amostra e depois determinar o erro padrão da média (sx) com base somente nas diversas médias amostrais. Operacionalmente, este é o desvio padrão dos diversos valores da média. O erro padrão da média será que pode ser utilizada para calcular a variância da população (comum) da qual forma obtida as diversas amostras. Essa estimação da variância da população chama-se quadrado médio entre grupos (QME). Em seguida, calcula-se separadamente a variância dentro de cada grupo amostral e com relação a cada média de grupo. Por conseguinte, combinam-se estes valores da variância, ponderando-os de acordo com (n – 1) para cada amostra. A estimação resultante da variância da população chama-se quadrado médio dentro dos grupos (QMD). Sendo a hipótese nula μ1 = μ2 = μ3, ..., μk, for verdadeira, tem-se que as duas médias quadráticas obtidas são estimadores independentes e não tendenciosos da mesma variância da população σ². Todavia, se a hipótese nula for falsa, o valor esperado QME é maior do que o de QMD. Isto acontece, porque essencialmente, todas as diferenças entre as médias populacionais inflacionarão QME, enquanto QMD não será afetado. É desta forma que chegamos à equação F = Fgl1 , gl2 = U / v1 V / v2 ue pode ser agora reescrita da seguinte forma: QME QMD trata-se, portanto de um teste unilateral. Se razão F se encontrar na região de rejeição para o nível de significância especificado, então rejeita-se a hipótese de que as diversas médias amostrais foram obtidas da mesma população. Ainda que o processo descrito acima seja útil para elucidar o enfoque teórico implícito na análise de variância, a ampliação desse procedimento para delineamentos mais complexos do que a comparação de k médias amostrais torna-se demasiadamente trabalhosa e incômoda. Até por isso, para esse procedimento é utilizado de uma tabela de distribuição F, que você pode encontrar nos livros de estatística aplicada. 65 Agora é a sua vez INSTRUÇÕES Área Nº observado na Total A B C D 6 12 14 8 40 10 10 10 10 40 amostra, f0 Nº esperado, fe Desenvolva as atividades objetivas, procurando localizar as respostas a partir do Li- Agora é com você! Responda às questões a vro-Texto e de outros livros de apoio dispo- seguir para conferir o que aprendeu! níveis em sua biblioteca. As respostas devem ser apresentadas em textos claros, objetivos e específicos a cada proposta. Tenha sempre em mãos calculadoras para desenvolver os cálculos quando necessário. Não se esqueça do processo matemático, ou seja, desenvolver o cálculo linha a linha. Não pule etapas, pois um simples cálculo pode fazer diferença em sua resposta. Para padronização, utilize 4 (qua- Questão 01 Assinale a opção correta. a) As variáveis aleatórias Y1 e Y2 são independentemente distribuídas. b) As variáveis aleatórias Y3 e Y4 são independentemente distribuídas. c) As variáveis aleatórias (Y1+Y3) e (Y2+Y4) não tem distribuição conjunta normal bivariada. tro) casas decimais após a vírgula. d) Os vetores (Y1,Y2) e (Y3,Y4) são independen- Ponto de Partida e) A variável aleatória Z=(Y1)2 + (Y2)2 tem dis- Uma empresa terceirizada de instalação de tv a cabo, dividiu sua região em quatro temente distribuídos. tribuição qui-quadrado com 2 graus de liberdade. áreas. Um cliente da operadora necessita com certa urgência da instalação. A empresa informou ao funcionário responsável Verifique seu desempenho nesta questão, clicando no ícone ao lado. pelas instalações estariam igualmente distribuídas entre as quatro áreas. A empresa de tv a cabo toma uma amostra de 40 instalações realizadas no ano anterior, com base Questão 02 A variável aleatória Y se distribui como a variável nos arquivos da companhia e verifica que a quantidade instalada em cada uma das quatro áreas , pode ser observada na tabela a seguir. Adotando que a hipótese de que as instalações estão distribuídas de maneira igual (também observada na tabela), monte a distribuição qui-quadrado. 66 em que X tem distribuição F com dois graus de liberdade no numerador e 3 graus de liberdade no denominador. Assinale a opção que corresponde ao valor esperado de Y. a) 0,100. b) 0,500. c) 0,667. d) 0,700. e) 0,600. a) 2. Verifique seu desempenho nesta questão, clicando no ícone ao lado. d) 20. b) 10. c) 12. e) 72. Verifique seu desempenho nesta Atenção: As questões 3 e 4 referem-se ao questão, clicando no ícone ao lado. enunciado seguinte: Em um estudo controlado no qual o interesse é concentrado no desgaste de pneus testaramse um certo número de marcas obtendo-se os resultados constantes da tabela de análise de variância dada abaixo. Fonte Graus de Liber- Soma de Quadrados Questão 05 A distribuição F tem por finalidade: a) Comparar a média de amostras. b) Aceitar erro tipo II. c) Comparar a variância de duas ou mais dade Marcas 3 60 amostras. Erro 36 72 Total (Corrigi- 39 132 d) Rejeitar erro tipo II. do) Questão 03 Assinale a opção que dá o número de marcas de pneus estudadas. a) 2. b) 3. c) 4. d) 5. e) 12. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 04 Assinale a opção que dá o valor da estatística F utilizada para testar a hipótese de igualdade de médias das marcas. e) Aumentar o tamanho da amostra. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 06 Para o enunciado de “Ponto de Partida”, formule e teste a hipótese para o nível de significância de 5%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 07 Quinze pessoas que participam de um programa de treinamento são colocadas, de forma aleatória, sob três diferentes tipos de ensaio, todos eles relacionados com o desenvolvimento de um nível específico de 67 habilidade em pesquisa científica. Os graus obtidos Para o enunciado 7 determine o quadrado no teste de conclusão da unidade instrucional são médio entre os grupos. apresentados na tabela abaixo, juntamente com Verifique seu desempenho nesta questão, clicando no ícone ao lado. o grau médio de desempenho associado a cada tipo de ensino. Usar o procedimento da análise de variância (distribuição F) para testar a hipótese nula de que as três médias amostrais foram obtidas da mesma população, a um nível de significância de 5%. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 08 Método Graus de prova de Instrução Total Média de dos graus graus A1 86 79 81 70 84 400 80 A2 90 76 88 82 89 425 85 A3 82 68 73 71 81 375 75 Determine as hipóteses para o modelo acima e calcule a média global dos 15 graus das provas. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 09 Para o enunciado da questão 7, determine o erro padrão da média, baseado nas três médias amostrais. Verifique seu desempenho nesta questão, clicando no ícone ao lado. Questão 10 68 LINKS IMPORTANTES Você quer saber mais sobre esse assunto? Então: Leia o artigo: SILVA, Vicente P. R. et. al. Análise da pluviosidade e dias chuvosos na região Nordeste do Brasil. Disponível em <http://www.scielo.br/pdf/rbeaa/v15n2/v15n02a04.pdf> Acesso em: 26 jul. 2012. Artigo que mostrará alguns tratamentos estatísticos utilizados até o momento Leia o artigo: VASCONCELOS, Edmar Soares et. al. Agrupamento de modelos de regressão da análise de adaptabilidade e estabilidade de genótipos. Disponível em: <http://www.scielo.br/pdf/ pab/v45n12/v45n12a04.pdf>. Acesso em: 26 jul. 2012. O artigo demonstra a utilização de regressão linear, visto no tema anterior e a distribuição F. Ler o artigo: BECK, Carmem Cristina et. al. Fatores de risco cardiovascular em adolescentes de município do sul do Brasil: prevalência e associações com variáveis sociodemográficas. Disponível em: <http://www.scielo.br/pdf/rbepid/v14n1/04.pdf>. Acesso em: 26 jul. 2012. Esse artigo determina a prevalência de fatores de risco cardiovasculares com variáveis sociodemográficas utilizando o procedimento estatístico qui-quadrado. FINALIZANDO Nesse tema, você viu que o teste de hipótese auxilia o pesquisador na tomada de decisão. Observou ainda que para comparar variâncias é utilizado a distribuição F e que o teste qui-quadrado é utilizado para comparar as frequências, sendo que uma frequência é a observada na amostra e a outra é a frequência esperada. Assim como conclusão, você viu que esses testes são de grande importância para pesquisadores, administradores de empresa e contabilistas (auditores). Caro aluno, agora que o conteúdo desta aula foi concluído, não se esqueça de acessar sua ATPS e verificar a etapa que deverá ser realizada. Bons estudos! 69 REFERÊNCIAS BECK, C. C.; et al. Fatores de risco cardiovascular em adolescentes de município do sul do Brasil: prevalência e associações com variáveis sociodemográficas. Revista Brasileira Epidemiologia: 2011, v. 14, n. 1, p. 36-49. BRASIL. CAPES. Disponível em: <http://www.capes.gov.br/>. Acesso em: 26 jul. 2012. CRESPO, A. A. Estatística Fácil. São Paulo: Editora Saraiva, 1998. GUARIEIRO, L. L, N.; et al. Metodologia analítica para quantificar o teor de biodiesel na mistura de biodiesel: diesel utilizando espectroscopia na região do infravermelho. Revista Química Nova, 2008, v. 31, n. 2, p. 421-426. IBGE. Disponível em: < http://www.ibge.gov.br/home/estatistica/populacao/censo2010/default.shtm>. Acesso em: 26 jul. 2012 KAZMIER, L. J. Estatística aplicada à economia e administração. São Paulo: McGraw-Hill do Brasil, 1982. LANDÍN, P. R.; SÁNCHEZ, E. Niveles de razonamiento probabilístico de estudiantes de bachillerato frente a tareas de distribuición binomial. São Paulo: Revista de Educação Matemática e Pesquisa, 2010, v. 12, n. 3, pp 598-618. LOPES, C. E. O ensino da estatística e da probabilidade na educação básica e a formação dos professores. Disponível em: <http://www.scielo.br/pdf/ccedes/v28n74/v28n74a05.pdf>. Acesso em: 26 jul. 2012. RIBEIRO, S. D. As pesquisas sobre o ensino da estatística e da probabilidade no período de 2000 a 2008: uma pesquisa a partir do Banco de Teses da CAPES. São Paulo: PUCSP, 2010. RON, L.; FARBER, B. Estatística aplicada. trad. Cyro Patarra. 2. ed. São Paulo: Prentice Hall, 2007. RODRIGUES, J. M.; et alli. Efeitos locais e de escala na dinâmica climática no município de Viçosa. Uberlândia: Revista Sociedade e Natureza, 2010, v. 22, n. 3, p. 593-610. 70 SEADE. Disponível em: <http://www.seade.gov.br/>. Acesso em: 26 jul. 2012. SILVA, V. P. R.; PEREIRA, E. R. R.; AZEVEDO, P. V.; SOUSA, F. A. S.; SOUSA, I. F. Análise da pluviosidade e dias chuvosos na região Nordeste do Brasil. Campina Grande: Revista Brasileira de Engenharia Agrícola e Ambiental, v. 15, n. 2, p. 131-138, 2011. SHEIN, D.; de LIMA, M. L. P. Uma metodologia para o dimensionamento de frota de rebocadores em terminais portuários: uma aplicação ao porto do Rio Grande. Rio de Janeiro: Revista Pesquisa Operacional para o Desenvolvimento, v. 2, n. 2, p. 119-139, mai/ago 2010. TAVARES, B. S.; BORGES JUNIOR, J. C. F.; CORREA, M. M.; LIMA, J. R. S.; DANTAS NETO, J. Análise de risco e otimização de recursos hídricos e retorno financeiro em nível de fazenda. Campinas Grande: Revista Brasileira de Engenharia Agrícola e Ambiental, v. 15, n. 4, p. 338-346, 2011. VASCONCELOS, E. S.; et alli. Agrupamento de modelos de regressão da análise de adaptabilidade e estabilidade de genótipos. Revista Pesquisa Agropecuária Brasileira. Brasília: 2010, v. 45, n. 12, p. 1357-1362. 71 GABARITO TEMA 1 Estatística Descritiva Ponto de Partida Resposta: Isto irá depender do número de pessoas entrevistadas. Para o cálculo da média basta somar os valores apontados e dividir pelo número de observações. Já a moda é o valor que mais aparecer no apontamento feito. Questão 1 Resposta: alternativa “D”. Questão 2 Resposta: alternativa “A”. Questão 3 Resposta: alternativa “D”. Questão 4 Resposta: alternativa “C”. Questão 5 Resposta: alternativa “E”.E Questão 6 Resposta: Departamento de Recursos Humanos = 7 x 0,1 = 0,7, como não existe 0,7 pessoa arredondar para 1 pessoa. Departamento Marketing e vendas = 35 x 0,1 = 3,5 arredondar para 4 pessoas. Departamento Financeiro = 17 x 0,1 = 1,7 arredondar para 2 pessoas. Departamento Produção = 41 x 0,1 = 4,1 arredondar para 4 pessoas. Portanto, o número de funcionários do novo departamento será de 11 pessoas. Questão 7 Resposta: Cálculo da amplitude total = 3650 – 500 = 3150. Cálculo do nº de classes, segundo Sturges. i= 1 + (3,3 x log n) 1+ (3,3 x log 40) 1 + (3,3 x 1,60) 72 i = 1 + 5,29 6, 29, portanto, tem-se 6 classes. Cálculo da amplitude da classe (h) = 3150 (amplitude total) ÷ 6 (número de classes) 525. Questão 8 Resposta: Cálculo da média dados não agrupados = 60.800 (soma de todos os dados) ÷ 40 (número de dados na amostra) R$ 1.520,00. Cálculo da média dados agrupados = 68.300 (total do produto entre o ponto médio e a frequência simples de cada classe) ÷ 40 (número total de dados na amostra) R$ 1.707,50. Questão 9 Resposta: Moda para dados não agrupados = R$ 2.000,00 (basta verificar o valor que mais aparece na amostra 2.000 aparece 3 vezes). Moda, segundo Czuber: Em que: Mo: moda. l: limite inferior da classe modal. D1: fi - fant. D2: fi - fpost. h: intervalo da classe modal. Primeiro deve-se descobrir qual é a classe modal. C, como a moda é o valor que mais aparece, então, a classe modal é a que tem mais elementos no caso a classe 3 com 11 elementos. Assim, desenvolvendo a equação ficará: (11 − 8) x525 (11 − 8) + (11 − 5) 3 = Mo 1550 + x525 3+ 6 3 M o = 1550 + x525 9 = Mo 1550 + (0,3333x525) = Mo 1550 + 175 = Mo 1550 + 73 Mo = 1725 Portanto, a moda para dados agrupados será de R$ 1.725,00 – o que está dentro da classe modal indicando que os cálculos estão corretos. Questão 10 Resposta: Pelos dados agrupados percebe-se que o valor médio dos empréstimos são de R$ 1.707,50, com o valor que mais aparece de empréstimos são R$ 1.725,00. Sendo que apenas 8% da amostra emprestam valores acima de R$ 3.125,00, como pode ser observado na tabela de distribuição de frequência, última classe. Como gerente, o esforço deve ser para diminuir os empréstimos entre R$ 500 a R$ 1500, que representam 45% dos valores emprestados e fazer com estes valores se aproximem da média ou da moda emprestada pela agência. TEMA 2 Probabilidade Ponto de Partida Resposta: Probabilidade de sair o número 6 = Evento (sair 6) e Respostas possíveis = (1, 2, 3, 4, 5, 6). Portanto, a probabilidade de sair o número 6 é 1/6. A probabilidade de o número e o número 1 é: (1/6 multiplicado por 1/6), assim tem-se 1/36 Questão 1 Resposta: alternativa “A”. Questão 2 Resposta: alternativa “B”. Questão 3 Resposta: alternativa “E”. Questão 4 Resposta: alternativa “A”. Questão 5 Resposta: alternativa “E”. Questão 6 Resposta: Prob = (1/6 x 1/6) = 1/36 ou 2,78%. 74 Questão 7 Resposta: Prob = 1/6 + 1/6 2/6 1/3 ou 33,33%. Questão 8 Resposta: Prob = 1/10 ou seja, 10%. Questão 9 Resposta: Em um baralho não viciado existem 52 cartas, com 4 naipes e cada um com 13 cartas. Assim, a probabilidade será de Prob. Será 13/52, ou 25%. Questão 10 Resposta: Prob = 1/52 ou 1,92%. TEMA 3 Distribuições Discretas de Probabilidade Ponto de Partida Resposta: Utilizando a fóormula da distribuição discreta binomial, , temseremos: Portanto, a probabilidade do vendedor efetuar 4 vendas será:: 0,55%. Questão 1 Resposta: alternativa “D”. Questão 2 Resposta: alternativa “C”. Questão 3 Resposta: alternativa “C”. Questão 4 Resposta: alternativa “A”. 75 Questão 5 Resposta: alternativa “E”. Questão 6 Resposta: Portanto, a probabilidade será: 7,78%. Questão 7 Portanto, a probabilidade será: 34,56%. Questão 8 Resposta: Como o analista financeiro quer saber se a maioria das contas estão em inadimplência, então, deve-se verificar a probabilidade de 3, 4, 5 ocorrências. = 23,04% = 7,68% = 1,02% A probabilidade da maioria das contas estarem inadimplentes será a soma das probabilidades, portanto, 31,74%. Questão 9 Resposta: Portanto, a probabilidade será: 25,92% 76 Questão 10 Resposta: Como os números da inadimplência podem ser contabilizados, poderiam ser utilizados como estimadores, porém, poderiam utilizar uma distribuição normal TEMA 4 Distribuição Normal de Probabilidade Ponto de Partida Resposta: Primeiro deve-se calcular a média e o desvio padrão. Em seguida, utilizando da distribuição normal padronizada em que basta alocar os resultados na formula fórmula e consultar a tabela 4 do Livro - Texto no apêndice B. Questão 1 Resposta: A Questão 2 Resposta: alternativa “A”. Questão 3 Resposta: alternativa “C”. Questão 4 Resposta: alternativa “A”. Questão 5 Resposta: alternativa “ E” Questão 6 Resposta: Consultando a tabela 4, apêndice B tem-seremos o valor 0,9772. Como já visto, pela característica da tabela apresentada, para encontrar a probabilidade temos deve que subtrair este valor do ponto médio da simetria, onde em que está localizada a média, esse valor de simetria é 0,5000. Com isso, a probabilidade será P(X) = 0,9772 – 0,5000= 0,4772 x 100 47,72% Questão 7 77 Resposta: = - 0,60, esse valor na tabela tem- seteremos 0,2743. Como o valor está aà esquerda da média e pela definição a curva é simétrica, tem-seremos: P(X) = 0,5000 – 0,2743 = 0,2257 ou 22,57%. Observe que não há temos apenas um valor a ser calculado, portanto: com isso a P(X) = 0,5319 – 0,5000 = 0,0319 ou 3,19%, perceba que a probabilidade final será a soma das probabilidades anteriores. P(X) = 22,57% + 3,19% 25,76% Questão 8 Resposta: - 2,0 na tabela como já foi vistovimos 0,0228 que resulta em 47,72%. = - 0,40, que na tabela 0,3446 P(X) = 0,5000 – 0,3446 = 0,1554 ou 15,54% Questão 10 Resposta: Para melhorar o processo, basta reduzir o desvio padrão. TEMA 5 Intervalos de Confiança Ponto de Partida Resposta: A distribuição normal de probabilidade pode ser usada neste caso porque a população é normalmente distribuída e σ é conhecido. Assim, temos: X ± zσx = 2900 ± 1,96(σ/√n) 2900 ± 1,96(500/√15) = 2900 ± 1,96(129,10) 2770,90 a 3029,10 horas (este será o intervalo) Questão 1 Resposta: alternativa “C”. 78 Questão 2 Resposta: alternativa “D”. Questão 3 Resposta: alternativa “A”. Questão 4 Resposta: alternativa “B”. Questão 5 Resposta: alternativa “E”. Questão 6 Resposta: Questão 7 Resposta: N(X ± zsx) = 1000($ 37,09 a $ 37,89) = $ 37089,45 a $ 37890,00 Questão 8 Resposta: X (média) = ± zsx = $ 37,49 ± 2,58(0,2038) $ 36,96 a $ 38,02 Questão 9 Resposta: n = (zσ ÷ E)² [(1,96 x 80) ÷ 25]² = (39,34)² 1548 Questão 10 Resposta: a A predição pontual da quantia de empréstimo do próximo cliente é $257.300. O valor de z = 1,96, então o intervalo de 95% será: 257.300 ± (1,96)(25.000)√1 + (1/50) intervalo entre $ 207.812,43 a $ 306.787,57 TEMA 6 Teste de Hipótese com Uma ou Duas Amostras 79 Ponto de Partida Resposta: Observe que 25% (0,25) corresponde a 5 pessoas vacinadas. O teste de hipótese ficaria: H0: p = 0,25 H1: p > 0,25 Os valores possíveis de X, de 0 a 20, são divididos em dois conjuntos: aqueles números menores ou iguais a 8 e aqueles maiores que 8. Portanto, o valor crítico é 8. Se x > 8 rejeita-semos a H0 em favor da H1. Se x ≤ 8, não se rejeitamos H0 Questão 1 Resposta: alternativa “C”. Questão 2 Resposta: alternativa “E”. Questão 3 Resposta: alternativa “C”. Questão 4 Resposta: alternativa “B”. Questão 5 Resposta: alternativa “E”. Questão 6 Resposta: H0: µ ≥ 4200 H1: µ < 4200 t crítico (gl = 10 -1 = 9, α = 0,05) 1,833 (tabela 5 – PLT – monocaudal) sx = s ÷ √n = 200 ÷ √10 63,3 h t = X - µ0 ÷ sx t = (4000 – 4200) ÷ 63,3 - 3,16 Portanto, rejeita-se a hipótese nula e aceita-se a hipótese alternativa, qual seja, a de que a verdadeira média da vida útil é menor de que 4.000 horas. Questão 7 Resposta: H0: µ = $260.000,00 H1: µ ≠ $ 260.000,00 Questão 8 Resposta: Hipóteses: H0: µ = $260.000,00; H1: µ ≠ $ 260.000,00 Nível de significância: α = 0,05 Estatística de teste: X (média) baseada em uma amostra de n = 36 e com σ = $ 43.000,00 80 X = µ0 ± zσx = 260.000,00 ± 1,96(σ ÷ √n) X = 260.000 ± 1,96(43.000 ÷ √36) $ 245.953,33 a $274.046,67 Portanto, para rejeitar a hipótese nula, a média amostral deve ter um valor menor do que $ 245.953,33, ou maior do que $ 274.046,67. Questão 9 Resposta: H0: µ ≥ $ 260.000 e H1: µ < $ 260.000 X = µ0 + zσx = 260.000 + (- 1,65)(7.166,67) $ 260.000 – 11.825 $ 248.175,00 Uma vez que X (média) = $ 240.000, o mesmo se encontra na região de rejeição. Portanto, rejeita-se a hipótese nula e aceita-se a hipótese alternativa µ< $ 260.000. Questão 10 Resposta: H0: µ = $ 1500; H1: µ ≠ $ 1500; nível de significância (α = 0,05) X = µ0 ± zσx = µ0 ± z(σ ÷ √n) 1500 ± 1,96(200 ÷ √15) 1500 ± 101,21 $ 1398,79 a $ 1601,21. Uma vez que a média da amostra $ 1400,00 se encontra na região de aceitação da hipótese nula, não se pode rejeitar a afirmação do representante da comunidade. TEMA 7 Correlação e Regressão Ponto de Partida Resposta: Para responder a questão utilize o esquema a seguir: Em seguida, basta colocar na equação r= n ∑ xi yi − ( ∑ xi )( ∑ yi ) [n ∑ xi2 − ( ∑ xi ) 2 ][n ∑ yi2 − ( ∑ yi ) 2 ] Questão 1 Resposta: alternativa “E”. Questão 2 Resposta: alternativa “D”. Questão 3 Resposta: alternativa “D”. 81 Questão 4 Resposta: alternativa “B”. Questão 5 Resposta: alternativa “C”. Questão 6 Resposta: r= 33x 41355 − (1104 x1124) [(33x 41086) − (1104) 2 ] x[(33x 41998) − (1124)2 r = 1,06 ou aproximadamente 1. Questão 7 Resposta: A correlação é positiva. Existe uma relação perfeita entre as variáveis estudadas. Questão 8 Resposta: Parâmetro a a= n ∑ xi yi − ∑ xi ∑ yi n ∑ xi2 − ( ∑ xi ) 2 a= (33x 41355) − (1104 x1124) (33x 41086) − (1104) 2 a = 0,9036 Questão 9 Resposta: Parâmetro b b = Υ − aX b = 33,9697 – 0,9036(33,4545) b = 3,7402 em que Y é média de yi e X é a média xi Questão 10 Resposta: Y^= aX + b 0,9036X + 3,7402 TEMA 8 Teste Qui-quadrado e Distribuição Ponto de Partida 82 Resposta: ( ∑ f 0 − f e ) 2 (6 − 10) 2 (12 − 10) 2 (14 − 10) 2 (8 − 10) 2 40 X2 = = + + + = = 4 fe 10 10 10 10 10 Questão 1 Resposta: alternativa “D”. Questão 2 Resposta: alternativa “E”. Questão 3 Resposta: alternativa “C”. Questão 4 Resposta: alternativa “B” Questão 5 Resposta: alternativa “C”. Questão 6 Resposta: H0: A quantidade de instalações está igualmente distribuída entre as quatro áreas. H1: A quantidade de instalações não está igualmente distribuída entre as quatro áreas. gl = k – m – 1 4 – 0 – 1 =3 X² crítico (gl = 3; α = 0,05) 7,81 (tabela distribuição F) Portanto, não pode rejeitar a hipótese nula de que as instalações estão igualmente distribuídas entre as quatro áreas, a um nível de significância de 5%. Questão 7 Resposta: H0: μ1 = μ2 = μ3 e H1: as médias não são todas mutuamente iguais. A média global dos 15 graus é: Questão 8 Resposta: o O erro da média, baseado nas 3 médias amostrais é: = sx ∑( X − X t ) 2 = N º médias − 1 (80 − 80)² + (85 − 80)² + (75 − 80)² = 3 −1 50 = 5 2 Questão 9 83 Resposta: QME = nsx² = 5(5)² = 5(25) = 125 Questão 10 Resposta: a variância para cada uma das amostras. s2 = 84 ∑( X − X ´) n −1 2 FICHA TÉCNICA Supervisão Editorial: Editoração Eletrônica: Barbara Monteiro Gomes de Campos Celso Luiz Braga de Souza Filho Juliana Cristina e Silva Glauco Berti de Oliveira Maurício Rodrigues de Moraes Diagramação: Diogo da Silva Pereira Botelho Capa: Fourmi Comunicação e Arte Revisão Textual: Giovana Valente Ferreira 85