Aula - 4 – 08 08--03 03--2016 Cálculos Estatísticos Prof. Procópio Prof. Procópio Tipos de Amostragens Amostragem Aleatória Simples Amostragem Sistemática Amostragem Estratificada Amostragem Aleatória Simples A Amostragem Aleatória Simples (AAS) é a maneira mais fácil para selecionarmos uma amostra probabilística de uma população. Ela é composta por elementos retirados ao acaso da população. Então todo elemento da população deve ter igual probabilidade de ser escolhido para a amostra. Este tipo de amostragem é equivalente a um sorteio lotérico. Neste processo, todos os elementos da população têm igual probabilidade de serem escolhidos, não só antes de ser iniciado, como também até completar-se o processo de coleta. Amostragem Aleatória Simples - Exemplo Um professor quer obter uma Amostra Aleatória Simples que seja representativa, de 10%, de uma População de 200 alunos de uma escola, como deve proceder? 1º) Numerar os alunos de 1 a 200; 2º) Escrever os números de 1 a 200 em pedaços de papel ou uma planilha e colocá-los em uma urna; 3º) Retirar 20 pedaços de papel, um a um, da urna, formando a amostra da população. Amostragem Aleatória Simples Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados: 1/N, onde: • N é o número total de elementos da população e; • 1 é a probabilidade de cada indivíduo ser selecionado. Quando a população é muito grande, esse tipo de procedimento tornase inviável. Nesse caso, usa-se um processo alternativo, no qual os elementos são numerados e em seguida sorteados por meio de uma tabela de números aleatórios, sorteando-se um elemento da população até que sejam sorteadas as unidades da amostra. Neste caso todos os elementos devem ter a mesma probabilidade de ser selecionados. Amostragem Sistemática Este método é um procedimento para a amostragem sistemática, utilizado quando os elementos da população já se acham ordenados. Consideramos uma população : N elementos (o tamanho da população) e que se deseje extrair uma amostra sistemática de: n elementos (tamanho da amostra). Amostragem Sistemática Intervalo de seleção (I): utilizando o método da amostragem sistemática, definimos o intervalo de seleção para a extração dos elementos da população que irão compor a amostra: I=N n N = tamanho da população n = tamanho da amostra Intervalo de seleção corresponde ao número de vezes que a amostra cabe na população. Amostragem Sistemática – Exemplo - 1 N – Total População Uma seguradora mantém uma carteira de 5.000 clientes, e pretende avaliar a satisfação de seus clientes mediante uma AMOSTRA SISTEMÁTICA de 200 segurados. a) Determine os números dos cinco primeiros clientes selecionados, supondo que o primeiro segurado (obtido por sorteio) seja o de número 14. b) Qual o número do último cliente selecionado do total da População ? Solução: N = 5.000 = 25 n 200 Intervalo de Seleção Para uma população de 5.000 clientes, podemos obter de forma sistemática o número de um cliente a cada 25, totalizando uma amostragem de 200 clientes. Amostragem Sistemática – Exemplo - 1 1º Segurado – 14 – (obtido por sorteio) 2º Segurado - 14 + 25 = 39 3º Segurado - 39 + 25 = 64 4º Segurado - 64 + 25 = 89 5º Segurado - 89 + 25 = 114 ....e assim sucessivamente até chegar ao tamanho da população ou o último número próximo. Neste caso como o tamanho da população é grande, podemos utilizar a seguinte fórmula para chegar-se até o final: Fórmula: Ultimo elemento da Amostra = nº de sorteio 14 + (n (tamanho da amostra) – 1) x I ( intervalo de seleção ) + ( 200 – 1 ) x 25 14 + ( 199 x 25 ) 14 + 4.975 4.989 Amostragem Sistemática – Exemplo - 2 Uma empresa prestadora de serviço mantém um cadastro de 2.185 clientes, e pretende verificar o interesse de seus clientes por um novo produto, para isso, seleciona uma AMOSTRA SISTEMÁTICA de 70 clientes. a) Supondo que o primeiro segurado ( obtido por sorteio ) seja o de número 21, determine os números dos próximos cinco clientes selecionados. b) Qual o número do último cliente selecionado do total da População ? Solução: N = População n = Amostra 2.185 = 31,21 70 Intervalo de Seleção Para uma população de 2.185 clientes, podemos obter de forma sistemática o número de um cliente a cada 31,21, totalizando uma amostragem de 2.174 clientes. Amostragem Sistemática – Exemplo - 2 1º Cliente – 21 – (obtido por sorteio) 2º Cliente - 21 + 31,21 = 52,21 3º Cliente - 52,21 + 31,21 = 83,42 4º Cliente - 83,42 + 31,21 = 114,63 5º Cliente - 114,63 + 31,21 = 145,84 ....e assim sucessivamente até chegar ao tamanho da população ou o último número próximo. Neste caso como o tamanho da população é grande, podemos utilizar a seguinte fórmula para chegar-se até o final: Fórmula: + (n (tamanho da amostra) – 1) x I ( intervalo de seleção ) 21 + ( 70 – 1 ) x 31,21 21 + ( 69 x 31,21 ) 21 + 2.153,49 2.174,49 Ultimo elemento da Amostra = nº de sorteio Amostragem Estratificada A amostragem estratificada considera a população dividida em estratos, em que cada estrato abrange um subconjunto da população que reúne características comuns entre seus elementos. Neste processo, a variável em estudo apresenta comportamento diferente em cada estrato. Por exemplo, se a característica for sexo, a população será dividida em dois grupos: a) masculino b) feminino Amostragem Estratificada – Exemplo 1 Uma empresa de telemarketing conta com 480 funcionários, dos quais 288 são do sexo feminino e os 192 restantes do sexo masculino. Considerando a variável “sexo” para estratificar essa população, foi selecionada uma AMOSTRA PROPORCIONAL ESTRATIFICADA de 50 funcionários. Calcule a proporção de funcionários de cada sexo contida na amostra. População: 480 funcionários Amostra: 50 funcionários Primeiro estrato: 288 funcionários do sexo feminino ( 60% da população) Segundo estrato: 192 funcionários do sexo masculino ( 40% da população) Estrato (por sexo) População Proporção da População Amostra Proporcional Estratificada Feminino 288 288/480 = 0,60 = 60% n1 = 0,60 x 50 = 30 Masculino Total 192 480 192/480 = 0,40 = 40% n2 = 0,40 x 50 = 20 50 Composição dos 50 funcionários da amostra: n1 = 30 mulheres e n2 = 20 homens. Amostragem Estratificada – Exemplo 2 Com o objetivo de levantar o estilo de comunicação ideal preferido pelos operários de uma indústria alimentícia, realiza-se um levantamento por amostragem. A população composta por 200 chefes de seção, 4.400 operários especializados e 1.200 operários não especializados. Obtenha uma amostra com 5% dos operários da indústria, mantendo as mesmas relações de proporcionalidade em cada estrato. População Amostra Proporcional Estratificada 200 n1 = 200 x 0,05 = 10 Operários especializados 4.400 n2 = 4.400 x 0,05 = 220 Operários não especializados Total 1.200 5.800 n3 = 1.200 x 0,05 = 60 290 Estrato Chefes de seção Amostra deverá conter 5% do total de operários = 290 Composição da amostra: n1 = 10 chefes de seção; n2 = 220 operários especializados; n3 = 60 operários não especializados – Representa os 5 % de cada amostra. Séries Estatísticas - Tabelas TABELAS - são recursos utilizados pela estatística, com o objetivo de organizar e facilitar a visualização e comparação dos dados. As tabelas permitem uma visão geral dos valores assumidos pelas variáveis dentro de certos parâmetros. Séries Estatísticas - Tabelas Exemplo de Tabela Casos notificados no Brasil nos últimos dez anos Dengue - 1997 - 2007 Ano Número de infectados com Dengue 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 Fonte: Ministério da Saúde 249.239 507.715 184.064 227.957 428.115 724.210 346.138 117.519 248.189 345.922 559.954 Séries Estatísticas É chamada de Série Estatística toda tabela que representam um conjunto de dados estatístico distribuídos em função da época, do local ou da espécie. Classificação das séries estatísticas: • • • • Temporais Geográficas Específicas Distribuição de frequências Séries temporais, cronológicas, históricas ou evolutivas A evolução cronológica é predominante nesse tipo de série. Observa-se a variação do tempo, enquanto o fato e o local permanecem constantes. Expectativa de vida das mulheres brasileiras Ano 1980 1991 2000 2001 2002 Idade das Mulheres 65,7 70,9 74,4 74,7 74,9 Tempo: 1980 ; 1991; 2000; 2001 e 2002 Fato: expectativa de vida das mulheres brasileiras Local: Brasil ( constante ) Séries geográficas, espaciais, territoriais ou de localização A discriminação segundo regiões é predominante nesse tipo de série, ou seja, apresenta o fator geográfico como o elemento variável. Nessa série, o local varia, enquanto o tempo e o fato permanecem constantes. Taxa de desemprego por região (ago/2009 ) Região Taxa de desemprego (%) Salvador 11,4 Recife 10,9 São Paulo 9,1 Belo Horizonte 7,5 Rio de Janeiro 5,6 Porto Alegre 5,4 Fonte: IBGE/Infográfico (26/09/2009) Tempo: ago/2009 (constante) Fato: taxa de desemprego ( constante ) Local: Salvador, Recife, São Paulo, Belo Horizonte, Rio de Janeiro, Porto Alegre (constante) Séries específicas ou categóricas Nesse tipo de série, predomina a discriminação segundo categorias ou especificações. O local e o tempo permanecem constantes enquanto o fato varia. A série específica também é chamada de categórica. Receita Líquida das empresas de tecnologia no Brasil (Ano - 2007) Empresa Receita Líquida em milhões dólar HP 2.283 IBM 2.004 Samsung 934 Positivo 815 LG 751 Xerox 716 Serpro 673 Dell 533 Microsoft 496 Cisco 441 Fonte: Anuário Informática Hoje Tempo: 2007 (constante) Fato: empresas de tecnologia: HP, IBM , Samsung, Positivo, LG, Xerox, Serpro, Dell, Microsoft e Cisco ( variável ) Local: Brasil (constante)