1.001 Problemas de Estatística Para Leigos a Folh la o de C Problemas de estatística assumem uma ampla variedade, de gráficos de pizza, gráficos de barras, médias e desvio padrão até correlação, regressão, intervalos de confiança e testes de hipótese. Para ter sucesso, é necessário ser capaz de fazer conexões entre ideias e fórmulas estatísticas. Através da prática você verá qual tipo de técnica é necessária para um problema e por quê, assim como a forma de configurar o problema, resolvê-lo e fazer conclusões adequadas. A maioria dos problemas estatísticos encontrados provavelmente envolvem terminologia, símbolos e fórmulas. Não se preocupe! Esta Folha de Cola lhe dará dicas para o sucesso. Terminologia Usada em Estatística Como qualquer assunto, estatística possui sua própria linguagem. A linguagem é o que lhe ajuda a saber o que o problema pede, quais os resultados necessários e como descrever e avaliar os resultados de uma maneira estatisticamente correta. Aqui está uma visão geral dos tipos de terminologia estatística: ✓✓ Quatro grandes termos em estatística são população, amostra, parâmetro e estatística: ✓✓ Uma população é o grupo inteiro de indivíduos que você quer estudar, e uma amostra é um subconjunto desse grupo. ✓✓ Um parâmetro é uma característica quantitativa da população que você está interessado em estimar ou testar (assim como uma média populacional ou proporção). ✓✓ Uma estatística é uma característica quantitativa de uma amostra que frequentemente ajuda a estimar ou testar o parâmetro da população (assim como uma média amostral ou proporção). ✓✓ Estatística descritiva são resultados únicos que você encontra quando analisa um conjunto de dados – por exemplo, a média amostral, a mediana, o desvio padrão, a correlação, a linha de regressão, a margem de erro e o teste estatístico. ✓✓ Inferência estatística se refere ao uso dos seus dados (e suas estatísticas descritivas) para fazer conclusões sobre a população. Os tipos principais de inferência incluem regressão, intervalos de confiança e testes de hipótese. Compreendendo Fórmulas Estatísticas Problemas estatísticos abundam em fórmulas – não há como evitá-las. Entretanto, normalmente existe um método para a loucura se você puder dividir as fórmulas em partes. Aqui estão algumas dicas úteis: ✓✓ Fórmulas para estatística descritiva basicamente pegam os valores no conjunto de dados e aplicam operações aritméticas. Frequentemente, as fórmulas Para Leigos: A série de livros para iniciantes que mais vende no mundo. 1.001 Problemas de Estatística Para Leigos a Folh la o de C parecem piores do que o processo em si. O segredo: Se você pode explicar para o seu amigo como calcular um desvio padrão, por exemplo, a fórmula é mais como uma ideia adicional. ✓✓ Fórmulas para a linha de regressão têm base na álgebra. Ao invés do formato normal y=mx+b que todos aprendem na escola, os estatísticos usam y=a+bx. ✓✓ A declinação, b, é o coeficiente para a variável x. ✓✓ O intercepto em y, a, é onde a linha de regressão cruza o eixo y. As fórmulas, para encontrar a e b, envolvem cinco estatísticas: a média dos valores de x, a média dos valores de y, os desvios padrão para os x, os desvios padrão para os y e a correlação. ✓✓ Todas as várias fórmulas de intervalos de confiança, quando transformadas em uma lista, podem parecer uma confusão de notação. Entretanto, todas elas têm a mesma estrutura: uma estatística descritiva (da sua amostra) mais ou menos uma margem de erro. A margem de erro envolve um valor z*- (da distribuição Z) ou um valor t*- (da distribuição t) vezes o erro padrão. As partes que você precisa para o erro padrão são geralmente fornecidas no problema, e os valores z*- ou t*- vêm das tabelas. ✓✓ Testes de hipótese também possuem uma estrutura comum. Embora cada uma envolva uma série de passos a serem executados, todas se resumem a uma coisa: o teste estatístico. Um teste estatístico mede o quão distante seus dados estão do que a população supostamente se parece. Ele pega a diferença entre sua amostra estatística e o parâmetro (alegado) da população e a padroniza para que você possa observá-la em uma tabela comum e tome uma decisão. Verificando Símbolos Estatísticos Símbolos (ou notação) encontrados em problemas estatísticos se encaixam em três categorias: símbolos matemáticos, símbolos referentes a uma população e símbolos referentes a uma amostra. Símbolos matemáticos são fáceis o bastante para decifrar com uma simples revisão de álgebra; eles envolvem itens como sinais de raiz quadrada, equações de uma linha e combinações de operações matemáticas. As outras duas categorias são um pouco mais desafiadoras e saber a diferença entre elas é crucial. ✓✓ Símbolos que se referem a populações são quase sempre gregos. Por exemplo, a média da população é μ, o desvio padrão da população é σ e a Para Leigos: A série de livros para iniciantes que mais vende no mundo. 1.001 Problemas de Estatística Para Leigos a FFoollhha la oola ddee CC correlação populacional é σ. A única exceção é a proporção populacional: Alguns livros usam a letra inglesa p e alguns usam a letra grega π. ✓✓ Símbolos pertencentes a amostras estão em inglês, alguns contendo pequenos símbolos sobre eles. Por exemplo, a média amostral é x̄ , a proporção amostral é p̂ , o desvio padrão amostral é s e a correlação amostral é r. (Nota: Se um livro utiliza π para a proporção populacional, ele usará p̂ para a proporção amostral.) Mantendo uma Estratégia para Resolver Problemas Estatísticos Ao resolver problemas estatísticos é sempre bom ter uma estratégia. Você não pode simplesmente ler um problema mais de uma vez e esperar achar a resposta – tudo o que você conseguirá ter é ansiedade! Embora nem todas as estratégias funcionem para todos, aqui está uma estratégia de três passos que provou seu valor: 1. Rotule tudo o que o problema lhe dá. Por exemplo, se o problema diz “X tem uma distribuição normal com uma média de 10 e um desvio padrão de 2”, entre em ação: Circule o 10 e escreva μ e circule o 2 e escreva σ. Dessa maneira você não precisará procurar mais tarde para encontrar os números de que precisa. 2. Escreva o que é pedido para encontrar de uma maneira estatística. Dica: Questões normalmente lhe dizem o que querem na última linha do problema. Por exemplo, se é pedido que você encontre a probabilidade de mais de 10 pessoas irem à festa, escreva “Encontrar P(X > 10)”. 3. Use uma fórmula, um processo ou um exemplo que você já viu para conectar o que lhe é pedido para encontrar com o que o problema lhe dá. Por exemplo, suponha que lhe é dito que X tem uma distribuição normal com uma média de 80 e um desvio padrão de 5 e você quer a probabilidade de X ser menor que 90. Rotule o que lhe é dado: “X normal com μ = 80 e σ = 5”. A seguir, escreva o que você precisa encontrar, usando símbolos: “Encontrar P(X < 90)”. Porque X tem uma distribuição normal e você quer uma probabilidade, a conexão é a fórmula Z: Z = (X – μ)/σ. Você tem uma boa ideia de que esta é a fórmula correta porque inclui tudo o que você tem: μ, σ e o valor de X (que é 90). Encontre P(X < 90) = P[Z < (90 – 80)/5] = P(Z < 2) = 0,9772. Voilà! Para Leigos: A série de livros para iniciantes que mais vende no mundo.