Intervalos de Confiança Estimação Estimar é a ação de fazer uma suposição generalizada a respeito de um todo baseado em informações lógicas sobre uma amostra. Para atingir o objetivo da estimação, devemos identificar aquilo que represente o que se deseja pesquisar, o problema. Exemplo: pesquisar o salário médio da população de trabalhadores na indústria automobilística brasileira? Podemos pesquisar com toda a população, ou seja, todos os trabalhadores. Este método é o mais caro e o mais demorado. Uma solução mais simples e barata é analisar uma amostra (parte da população), sendo depois projetada para o todo. A escolha desta amostra deve ser imparcial e atender a sua proposição. Continuando o exemplo fornecido sobre salário dos trabalhadores na indústria automobilística, tomemos como amostra 50 trabalhadores apresentando um salário médio de $ 900,00. Na primeira suposição, poderemos entender que todos os trabalhadores deste segmento ganham em média, igual a $ 900,00. Porém, esta interpretação está sujeita a margem de erro. A margem de erro deixa claro o fato de a amostra não ser um reflexo fiel da população. O cálculo da probabilidade é um instrumental que viabiliza avaliar parâmetros da distribuição a partir de estimadores, a qualidade da estimação depende basicamente da representatividade da amostra, que é a capacidade de a amostra reproduzir as características importantes da população. Vejamos uma situação onde uma empresa está querendo avaliar a qualidade nutricional existente em uma sopa preparada por um fornecedor e que será servida para seus funcionários, para isto contratou uma nutricionista. Os funcionários estão reclamando que a sopa não está satisfazendo o padrão de qualidade nutricional exigido pela empresa. Caso for comprovado que a sopa não atende a este padrão, a empresa devolve a sopa e exige o pagamento da multa contratual. Para avaliar esta situação deverá ser necessário obter uma amostra do produto. Se a nutricionista tiver o cuidado de mexer bem a sopa antes da retirada da amostra, para garantir uma boa homogeneidade, esta amostra será bem representativa da população, permitindo um alto grau de precisão nesta avaliação. Caso isto não ocorra, a amostra terá um erro na avaliação. Se a nutricionista, mesmo que mexendo bem a sopa, tenha ainda dúvidas, ela poderá aumentar o tamanho da amostra. Esta situação permite concluir que a população com pequeno grau de variabilidade de seus elementos podem ser estudadas por pequenas amostras. À medida que a variabilidade aumenta é necessário aumentar o tamanho da amostra. A representação de um intervalo de confiança pode ser considerada como 1 – α Intervalo de Confiança Fórmula: p [ ẋ - zα/2 ơ (x) < µ < ẋ + zα/2 ơ (x)] = 1 – α √n √n Exemplo: O departamento de RH de uma empresa informa que o tempo de execução de tarefas que envolvem participação manual varia de tarefa para tarefa, mas que o desvio-padrão permanece aproximadamente constante em 3 minutos. Uma nova tarefa está sendo implantada na empresa. Uma amostra aleatória do tempo de execução de 50 destas novas tarefas forneceu o valor médio de 15 minutos. Determine um intervalo de confiança de 95% para o tempo médio de execução desta nova tarefa. n = 50 ( número de tarefas) ẋ = 15 ( tempo médio de execução na amostra) ơ (x) = 3 (desvio-padrão populacional) 1– α = 95% (nível de confiança do intervalo) Z associado a probabilidade tabela é = 1,96. α/2 = 0,95 /2 = 0,475, localizando na p [ 15 – 1,96 3 < µ < 15 + 1,96 3 ] = 0,95 √50 √50 p [ 15 – 0,83 < µ < 15 +0,83 ] = 0,95 p [ (14,17 < µ < 15,83 ] = 0,95 Podemos afirmar com confiança de 95% que o tempo médio de execução da nova tarefa é um valor entre 14,17 min e 15,83 min. Exercícios: 1. Uma amostra aleatória de 5 elementos retirados de uma população normal com desvio-padrão 2 unidades, apresentou um valor médio de 52 unidades. Determine um intervalo de confiança de 95% para a média populacional. 2. Um levantamento das cotações para o preço de um produto na bolsa de mercadorias apontou, a partir de uma amostra de 100 cotações, um preço médio de $2,40/kg. Sabe-se por experiência anterior, que a variância para este tipo de cotação é aproximadamente constante e valor 0,16. Construa um intervalo de confiança de 90% para o preço médio deste produto. TESTES DE HIPÓTESES Para a Estatística, uma hipótese é qualquer afirmativa formulada sobre uma ou mais populações. Exemplo: A média das notas de todos os alunos do curso é maior que 7,0? O principal objetivo dos testes de hipótese é verificar se a hipótese formulada deverá ou não ser rejeitada. Hipótese Nula (H0) e Hipótese Alternativa (H1) A hipótese nula (H0) é a afirmativa a respeito da população que será testada. A hipótese alternativa (H1) será a afirmativa a ser aceita caso existam evidências de que a hipótese nula deva ser rejeitada ou seja, o oposto. Exemplo: Em um exemplo hipotético utilizando postos de gasolina. A afirmativa é que a venda média mensal dos postos do Rio é de 20.000 litros. Supondo a possibilidade do valor ser diferente: H0: µ = 20.000 litros H1: µ ≠ 20.000 litros Nível de Significância(α) Será o risco de rejeitar a Hipótese nula sendo ela na realidade verdadeira. O nível de confiança do teste será (1- α). Exemplo: Para um nível de significância de 5%, o nível de confiança será de 95%. Grau de Liberdade(Ф) É uma medida da possibilidade de combinações ao acaso. Exemplificando: Um conjunto de elementos representados por A, B e C. Se combinarmos ao acaso, sem repetição, teremos: 1. A e B 2. A e C 3. Não existe acaso, restou B e C, portanto torna-se obrigatório. Nesta situação o número de graus de liberdade é 2. Sua fórmula é: Ф=K–1 K = número de eventos possíveis Teste do Qui-Quadrado (x2) Analisa a hipótese nula de não existir discrepância entre as freqüências observadas de um determinado evento e as freqüências esperadas. A hipótese alternativa alega haver a discrepância. Tomemos como exemplo: um aluno quer analisar se as freqüências de aparições de faces cara e coroa em uma moeda poderiam sugerir ou não o fato de esta moeda ser honesta (ou seja a probabilidade de sair cara e coroa ser a mesma). Após lançar a moeda 50 vezes, contou 33 “coroas” e 17 “caras”. A um nível de significância padrão, considerando alfa igual a 5%, seria possível dizer que a moeda não é honesta, ou seja, que apresenta uma probabilidade maior de sair face “coroa”? Para aplicar o teste, devem ser seguidos os cinco passos a saber: 1º. Passo Definir as hipóteses de trabalho. A hipótese nula contém a alegação de igualdade das freqüências. A hipótese alternativa alega a desigualdade. H0: F cara = F coroa (se são iguais então aceita-se a suposição da moeda ser honesta) H1: F cara ≠ F coroa (se são diferentes então aceita-se a suposição de a moeda não ser honesta) 2º. Passo Como o nível de significância é igual 5%, selecionaremos um X21. Existe apenas 1 grau de liberdade, já que o número de eventos possíveis é igual a 2 (cara ou coroa). 3º. Passo Utilizando uma tabela padronizada para a distribuição do quiquadrado, devemos determinadas as áreas de aceitação e rejeição da hipótese nula, tomando por base o nível de significância predeterminado igual a 5% (0,05) e grau de liberdade(Ф) igual a 1. O valor de X2c (valor crítico) na tabela é igual a 3,841%. Área de Rejeição HO = 5% Área de Aceitação HO = 95% 3,841 4º. Passo Para calcular a estatística teste (X2c) é preciso comparar freqüências esperadas (FEi ) e freqüências observadas (FOi ). Se a moeda for honesta, a frequencia esperada de cada face é de 50% do número de lances, ou 50% x 50 = 25. Evento Frequencias Observadas Frequencias Esperadas xt 2 Sair Face Cara 17 25 Sair Face Coroa 33 25 k = ∑ (FOi – FEi)2 = (17 – 25)2 + (33 -25)2 = 64 + 64 = 5,12 i=1 Fei 25 25 25 Como o valor encontrado é superior a 3,841 então é possível aceitar a hipótese alternativa, ou seja, que a moeda não é honesta.