Conceitos básicos, probabilidade, distribuição normal e uso de tabelas padronizadas Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais Alguns conceitos • População: é o conjunto de todos os elementos ou resultados sob • • • • • • investigação. Amostra: qualquer subconjunto da população. Subpopulação: estrato da população que partilha alguma característica comum. Parâmetro: é uma medida numérica que descreve uma população. Estatística: é uma medida numérica que descreve uma amostra. Estimador: é uma estatística da amostra usada para se aproximar de um parâmetro da população. Variáveis: característica de interesse para os elementos analisados, informações numéricas estatisticamente tratáveis. ► ► ► ► Nominais ou categóricas: profissão, gênero, preferência política... Ordinais: primeiro-segundo..., grau de escolaridade... Intervalares: salário entre 1 e 3 SM, distância entre 0 e 5km... Contínuas: altura, rendimento, peso... Amostra População Amostra (n=5) Parâmetros Estatísticas Inferência estatística: conhecer os parâmetros, fazer afirmações sobre a população com base em suas amostras. O que é probabilidade? • Número de 0 até 1 que expressa a tendência de um determinado evento acontecer. • Número positivo entre 0 e 1, associado a um evento aleatório, que se mede pela frequência relativa da sua ocorrência numa longa sucessão de eventos. • Grau de segurança com que se pode esperar a realização de um evento, determinado pela frequência relativa dos eventos do mesmo tipo numa série de tentativas. • Perspectiva de que algo venha a ocorrer. 4 Determinação de probabilidade • Conceito genérico: número de vezes que o resultado Probabilidade de um resultado ou evento ou evento pode ocorrer número total de vezes que qualquer resultado ou evento pode ocorrer • Tipos de determinação: ► ► ► Exata: análise da estrutura do problema, conhecimento da população... Aproximativa: estimativas a partir de amostras. Subjetiva: expressão de crenças. 5 Probabilidade em variáveis discretas • Qual a probabilidade de se tirar uma carta de copas de um baralho? E de se tirar um ás? • Qual a probabilidade de se tirar cara jogando uma moeda para o alto? Fonte: Wikipédia • Qual a probabilidade de obter 5 lançando dois dados? 6 Probabilidade em variáveis contínuas? Qual é a probabilidade de que, ao acordar de repente, sejam exatamente 4h59min16seg147milésimos? 7 Função Densidade de Probabilidade • Probabilidade de um valor específico para variáveis contínuas não faz sentido, pois a probabilidade de um ponto é zero. • Devemos, portanto, definir intervalos: ► Ex.: Probabilidade de que sejam entre 15h e 16h P(15h<x<16h) • Os intervalos são calculados com base na função que determina a distribuição das variáveis aleatórias contínuas, chamada de Função Densidade de Probabilidade (f.d.p.). 15 16 horas 8 Formalização matemática • Função Densidade de Probabilidade (f.d.p.): prob (a x b) a ( x)dx b • Em palavras: a área debaixo da função de densidade entre dois limites fornece a probabilidade de ocorrer um evento dentro de um determinado intervalo de valores. 34 f.d.p. P(29 x 34) ( x)dx 29 29 34 9 Distribuição normal • Também chamada de distribuição gaussiana, é utilizada para descrever muitos fenômenos e possui grande utilidade na inferência estatística. • Indicamos que uma população é normal usando a seguinte notação: X~N(μ;σ2). ► Ex.: Uma população normal com peso médio de 70kg e desviopadrão de 16kg será notada como: X~N(70;162) 10 Formato de uma distribuição normal Fonte: Wikipédia 11 Parâmetros de uma distribuição normal • A curva normal é definida por uma equação que possui os seguintes parâmetros: Média (μ) e desvio-padrão (σ). f ( x, , ) 1 2 2 e ( x )2 2 2 Fonte: Wikipédia 12 Outras distribuições • Outras distribuições serão utilizadas ao longo do curso: ► ► ► t de Student (parâmetros: graus de liberdade ν) Qui-quadrado (parâmetros: graus de liberdade ν) F de Fisher-Snedecor (parâmetros: graus de liberdade do numerador e denominador ν1 e ν2) • Elas serão detalhas e explicadas no momento adequado. 13 Cuidado! A distribuição paranormal assombra os conceitos de muitos alunos, aparecendo com freqüência em provas e exercícios. Exorcize-a! 14 Valor padronizado (z) • O valor z mede o quanto x se afasta da média (), em unidade de desvio padrão (). O desvio-padrão é a nossa régua. • É usado nas tabelas de referência, onde μ=0 e σ=1. x-μ z= σ x x 15 Preste atenção nessa imagem! Exercícios básicos: uso da curva normal 1. Uma v.a. X tem distribuição normal, com média 100 e desvio-padrão 10. Qual a probabilidade de que um indivíduo dessa população tenha um valor entre P(90<X<110)? b. P(x>120)? c. P(x<120)? d. Probabilidade de um indivíduo ter um valor menor que 85 e maior que 124 P(x<85 ⋃ x>124)? e. Se sortearmos aleatoriamente 1000 indivíduos dessa população, quantos devem valores entre 90 e 110? a. Dica: desenhe a curva normal e marque a área a ser determinada 18 Exercícios básicos: uso da curva normal 2. Um levantamento realizado pela ANAC* verificou que a altura dos usuários de aviação segue uma distribuição normal com média de 171,3cm e desvio-padrão de 7,3cm. Com base nesses dados determine: a. Probabilidade de um usuário ter mais de 1,90m de altura P(X>190) b. P(X<140) c. Um intervalo simétrico em relação à média que exclua apenas 5% dos indivíduos. * SILVA, S. C; MONTEIRO, D.. Levantamento do perfil antropométrico da população brasileira usuária do transporte aéreo nacional: Projeto Conhecer. Relatório Técnico Final. Agência Nacional de Aviação Civil. 2009. Disponível em http://www2.anac.gov.br/arquivos/pdf/Relatorio_Final_Projeto_Conhecer.pdf 19