ESTATÍSTICA AULA 12 Inferência Estatística e Distribuição Amostral – Unidade 8 Professor Marcelo Menezes Reis 1 Aulas prévias Planejamento da pesquisa, técnicas de amostragem: generalização. Análise exploratória de dados: organização dos dados. Probabilidade e variável aleatória. Modelos probabilísticos mais comuns. 2 Conteúdo desta aula Conceito de inferência estatística. Tipos de inferência estatística. Parâmetros e estatísticas. Distribuições amostrais de média proporção. e 3 Relembrando... População: conjunto das medidas da(s) característica(s) de interesse em todos os elementos que a(s) apresenta(m). Pode ser representada por um modelo: parâmetros (Unidade 7). Se amostragem: inferência estatística. 4 Inferência Estatística Consiste em fazer afirmações probabilísticas sobre as características do modelo, que se supõe representar uma população, a partir dos dados de uma amostra aleatória (probabilística) desta mesma população. Estimação de parâmetros e testes de hipóteses. 5 Estimação de parâmetros Fazer afirmação sobre os possíveis valores dos parâmetros do modelo a partir dos dados de uma amostra aleatória da população. Estimar média e variância de um modelo normal. Estimar a probabilidade de sucesso de um modelo binomial. 6 Testes de hipóteses Testes de hipóteses: testar hipóteses sobre as características do modelo a partir dos dados de uma amostra aleatória da população. o valor da média de uma variável é maior do que um certo valor? o modelo probabilístico da população é o normal? 7 Medidas de síntese Parâmetros (População) n N Média x i 1 i N x 2 2 ( x ) i i 1 N fa N X i 1 i n n N Variância Proporção Estatísticas (Amostra) s2 2 ( x x ) i i 1 n fa p n 8 Estatísticas Amostragem probabilística: Estatísticas são variáveis aleatórias. Seus resultados dependem da amostragem. Necessário construir modelos probabilísticos para as Estatísticas. 9 Distribuição amostral O modelo probabilístico de uma estatística é chamado de Distribuição Amostral. Seja um parâmetro e T uma estatística. Amostras aleatórias são retiradas da população e são calculados os valores t da Estatística T. Valores de t formam a distribuição amostral de T. 10 População Amostras {64, 67, 60} => Média = 63,67 {64, 70, 72} => Média = 68,67 {65, 70, 60} => Média = 65 Sortear 3 64 67 70 57 65 72 70 60 = 65,62 kg Observe que há uma variação na estatística média, e esta variação precisa ser considerada quando são realizadas as inferências sobre os parâmetros. 11 Distribuição amostral da média Se forem retiradas várias amostras aleatórias de n elementos da população. Calculadas as médias de todas as amostras. 2 E( x ) V( x ) n Distribuição aproximada por uma normal. 12 Exemplo 1 Ver 2o exemplo, Unidade 8. Suponha uma variável quantitativa cujos valores constituem uma população com os seguintes valores: (2, 3, 4, 5). Retire todas as amostras aleatórias de 2 elementos (com reposição) desta população e observe a distribuição das médias amostrais. 13 Exemplo 1 População: {2, 3, 4, 5} Parâmetros: = 3,5 Há 16 amostras de reposição) possíveis: (2, 2) (2, 3) (3, 2) (3, 3) (4,2) (4, 3) (5, 2) (5, 3) 2 = 1,25 2 elementos (com (2, 4) (3, 4) (4, 4) (5, 4) (2, 5) (3, 5) (4, 5) (5, 5) 14 Exemplo 1 (2,0) _ ( 2,5) X (3,0) (3,5) 56 x 3,5 16 (2,5) (3,0) (3,5) (4,0) s (3,0) (3,5) (4,0) (4,5) 2 x (3,5) (4,0) (4,5) (5,0) 1,25 0,625 2 15 Distribuição das médias normal 16 Distribuição amostral da média A distribuição amostral da média será normal se a distribuição da variável na população for normal. A distribuição amostral da média será normal, mesmo que a distribuição da variável na população não seja, desde que o tamanho de amostra seja suficientemente grande. 17 Exemplo 2 Ver o 3º exemplo da Unidade 8. Na figura a seguir temos a distribuição populacional de uma variável quantitativa qualquer de interesse. Ela apresenta média populacional () igual a 416,99, e variância populacional (2) igual a 89554,51264. 18 70 60 Frequency 50 40 30 20 10 0 0 200 400 600 800 1000 1200 1400 1600 1800 Dados 2 Distribuição NÃO normal! 19 Exemplo 2 Vamos retirar 40 amostras aleatórias, com reposição, da população com os seguintes tamanhos: 2, 4, 16 e 30 elementos. Para cada amostra calcularemos a média. As médias serão postas em um histograma, e serão calculadas a média e a variância das médias amostrais. 20 Frequency 20 416,99 2 44777,25632 n 10 0 0 250 500 750 1000 Médias amostras n =2 x 423,8875 s 2 x 67528,98666 21 Frequency 20 416,99 2 22388,62816 n 10 0 200 350 500 650 800 Médias amostras n= 4 x 444,5375 s 2 x 26464,3269 22 416,99 Frequency 10 2 5597,1577 n 5 0 260 320 380 440 500 Médias amostras n =16 x 394,4922 s 2 x 5568,3945 23 70 416,99 60 Frequency 50 2 2985,1508 n 40 30 20 10 0 300 360 420 480 540 Médias amostras n=30 x 421,9217 s 2 x 2945,1326 24 Distribuição amostral da proporção Se forem retiradas várias amostras aleatórias de n elementos da população. Calculadas as proporções de um atributo em todas as amostras. E ( p) (1 ) V ( p) n Distribuição aproximada por uma normal. 25 Exemplo 3 Veja o 4º exemplo da Unidade 8. Pense em uma variável qualitativa que pode assumir apenas dois valores, e que constitui a seguinte população: (□□□□■). A proporção populacional = 1/5 = 0,2. Retiram-se todas as amostras aleatórias de 2 elementos (com reposição) possíveis desta população. 26 Exemplo 3 Calcular proporção de ■ em cada amostra! 27 ( 0) ( 0) (0) ( 0) ( 0) ( 0) (0) ( 0) p ( 0) ( 0) (0) ( 0) ( 0) ( 0) (0) ( 0) (1 / 2) (1 / 2) (1 / 2) (1 / 2) _ 1 X E ( p) 5 (1 / 2) (1 / 2) (1 / 2) (1 / 2) (1) 1 1 1 5 5 (1 ) 2 s 0,08 2 n 28 Tô afim de saber Sobre distribuição amostral: BARBETTA, P.A., REIS, M.M., BORNIA, A.C. Estatística para Cursos de Engenharia e Informática. 2ª ed.: São Paulo: Atlas, 2008, capítulo 7. STEVENSON, Willian J. Estatística Aplicada à Administração. São Paulo: Ed. Harbra, 2001, capítulo 7. 29 Para saber mais Sobre a utilização do Microsoft Excel para estudar distribuições amostrais veja LEVINE, D. M., STEPHAN, D., KREHBIEL, T. C., BERENSON, M. L. Estatística: Teoria e Aplicações - Usando Microsoft Excel em Português. 5ª ed. – Rio de Janeiro: LTC, 200, capítulo 5. 30 Próxima aula Estimação de parâmetros Estimação por ponto, propriedades dos estimadores, estimador de média e proporção. Estimação por intervalo de média e de proporção. Tamanho mínimo de amostra para estimação. 31