TODA CIÊNCIA TEM SUAS RAIZES NA HISTÓRIA DO HOMEM. A MATEMÁTICA É CONSIDERADA CIÊNCIA QUE UNE A CLAREZA DO RACIOCÍNEO À SINTESE DA LINGUAGEM A ESTATISTICA É UM RAMO DA MATEMÁTICA DESDE DA ANTIGUIDADE VÁRIOS POVOS JÁ REGISTRAVAM NÚMEROS DE HABITANTES, DE NASCIMENTO, E ÓBITOS. ESTIMATIVAS DE RIQUEZAS INDIVIDUAIS E COLETIVAS, ETC. JÁ NA IDADE MÉDIA SE TEM REGISTROS DE INFORMAÇÕES PARA FINS TRIBUTÁRIOS. A PARTIR DO SÉCULO XVI O LEVANTAMENTO DE DADOS É USADO PARA FINS DE CONTROLE DE SERVIÇOS E QUALIDADES. ANÁLISES DE FATOS SOCIAIS E DADOS PARA ADMISTRAÇÃO DO ESTADO. NO SÉCULO XVII A ESTATÍSTICA É BATIZADA COMO A NOVA CIÊNCIA, DETERMINANDO SEUS OBJETIVOS E SUA FUNÇÃO RELACIONADA AS DEMAIS. A ESTATÍSTICA ... ...CONJUNTO DE MÉTODOS QUE UTILIZA MODELOS MATEMÁTICOS PARA COLETA, ORGANIZAÇÃO, DESCRIÇÃO, ANÁLISE E INTERPRETAÇÃO DE DADOS COM OBJETIVO DE AUXILIAR NA TOMADA DE DECISÕES. O ESTUDO DOS FENÔMENOS COLETIVOS PARA A TOMADA DE DECISÃO.. O número de atendimentos ambulatoriais no país aumentou em 30%. A taxa de desemprego atinge, este mês, 12,5%. O número de universitários no país subiu para 1,5 milhão neste ano. Resultados do Carnaval no trânsito: 145 mortos, 2430 feridos. MÉTODO CIENTÍFICO MÉTODO EXPERIMENTAL MÉTODO ESTATÍSTICO 1ª ETAPA ESTATÍSTICA DESCRITIVA ESTATÍSTICA 2ª ETAPA ESTATÍSTICA INFERENCIAL OU INDUTIVA ESTATÍSTICA DESCRITIVA : COLETA, ORGANIZA E DESCREVE DADOS. ESTATÍSTICA INFERENCIAL : INFERENCIA, ANÁLISA E INTERPRETA DADOS APÓS A APRESENTAÇÃO DE SEUS RESULTADOS DESCRITIVOS. Fases da Estatistica Descritiva: Definição do Problema Definição ou formulação correta do problema a ser estudado. Saber exatamente aquilo que se pretende pesquisar é o mesmo que definir corretamente o problema. Planejamento Determinação do procedimento necessário para resolver o problema e, em especial, como levantar informações sobre o assunto objeto do estudo. Que dados deverão ser obtidos? Como se deve obtê-los? Coleta de Dados A coleta pode ser feita direta ou indiretamente. É direta quando é obtida com a fonte, como por exemplo: uma empresa realiza uma pesquisa para saber a opinião dos consumidores sobre sua marca através de um questionário. É indireta quando é inferida de elementos conhecidos que já foram obtidos por uma coleta direta e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por coleta direta. Apuração dos Dados Consiste em resumir os dados, através de sua contagem e agrupamento. É um trabalho de condensação, tabulação e resumo de dados. Pode ser manual, mecânica, eletromecânica ou eletrônica. Exposição e Apresentação dos dados Os dados devem ser expostos sob a forma mais adequada: Tabelas ou Gráficos Isso tornar mais fácil a analise do que está sendo objeto de tratamento estatístico. Análise dos Resultados Realizadas as fases anteriores (estatística descritiva), faz-se uma análise dos resultados obtidos, através dos métodos da estatística indutiva, que tem por base a indução ou inferência, e tiramos desses resultados conclusões e previsões. Exemplo: O remédio X cura a doença K em 10 de 2000 pacientes testados. Uma determinada amostra do biscoito H possui 0,1% glicose em sua composição. Os dados possui I.C. 0,95% VARIÁVEL O fenômeno SEXO→ Poder ser: Masculino ou feminino O fenômeno NÚMERO DE FILHOS→Pode ser: 0,1,2,3,4... O fenômeno PESO→ Pode ser: 50,5kg, 66,7kg,48,0kg Variável é, o conjunto de resultados possíveis de um fenômeno. Qualitativas V A R Valores expressos por atributos NOMINAL ORDINAL I Á V E I S Numéricas ou Quantitativas Valores expressos por números DISCRETA CONTÍNUA NOMINAL ORDINAL Não pode ordenar: Sexo Religião Estado civil Profissão Pode ordenar: Escolaridade Nivel sócioeconômico Contáveis Discreta Contínua Nº de extrações Nº de atendimentos Idade Nº de filhos Medidas Altura Peso Temperatura Pressão PROCESSOS ESTATÍSTICOS DE ABORDAGEM CENSO: É UMA AVALIAÇÃO DIRETA, UTILIZANDO-SE TODOS OS COMPONENTES DA POPULAÇÃO. AMOSTRAGEM: É UMA AVALIAÇÃO INDIRETA, COM BASE EM UMA AMOSTRA. PRINCIPAIS PROPRIEDADES DO CENSO: • ADMITE ERRO PROCESSUAL ZERO E TEM CONFIABILIDADE 100%; • É CLARO; • É LENTO; • É QUASE SEMPRE DESATUALIZADO; • NEM SEMPRE É VIÁVEL. PRINCIPAIS PROPRIEDADES DA AMOSTRAGEM: • ADMITE ERRO PROCESSUAL POSITIVO E TEM CONFIABILIDADE MENOR QUE 100%; • É BARATA; • É RÁPIDA; • É ATUALIZADA; • É SEMPRE VIÁVEL. POPULAÇÃO E AMOSTRA POPULAÇÃO OU UNIVERSO CONJUNTO DE ENTES PORTADORES DE, PELO MENOS, UMA CARACTERÍSTICA COMUM. Ex: Conjunto de todas as estaturas → Estatura Conjunto de todas as cores de olhos → Cores de olhos Conjunto de todos os moradores de Vitória → Moradores de Vitória. O que importa é a variável estudada. AMOSTRA SUBCONJUTO FINITO DE UMA POPULAÇÃO. Redução da população a dimensões menores sem perda das características essenciais. Para uma amostra ser considerada boa, deve ser representativa, deve conter em proporção, tudo o que a população possui qualitativa e quantitativamente, e ser imparcial, isto é, todos os elementos devem ter igual oportunidade de fazer parte da amostra. Escolha dos números → números aleatórios (tabelas, sorteios etc.) Para pensar... 1) 2) 3) 4) 5) 6) Dê exemplos de dados importantes da estatística utilizados no seu trabalho e no cotidiano. Quais as fases do Método Estatístico? Exemplifique uma variável qualitativa: nominal e ordinal Exemplifique uma variável quantitativa discreta e contínua. Exemplifique uma população e uma amostra? Quando usar censo e quando usar amostragem? 2ª AULA Amostragem Distribuição de Freqüência AMOSTRAGEM Técnica especial para adquirir a amostras, que garanta, tanto quanto possível, a representatividade dos elementos. SÃO 03 OS PRINCIPAIS TIPOS DE AMOSTRAGENS AMOSTRAGEM CASUAL / ALEATÓRIA SIMPLES SISTEMÁTICA PROPORCIONAL ESTRATIFICADA Amostragem CASUAL , ALEATÓRIA SIMPLE, RANDÔMICA,... Neste caso todos os elementos da população tem iguais chances de serem escolhidos, desde o início até o completo processo de coleta. Procedimento: 1ª enumere todos os elementos da população numa planilha. 2ª efetue sucessivos sorteios com reposição até completar o tamanho da amostra. Amostragem SISTEMÁTICA Conveniente para o caso da população estar naturalmente ordenada, como fichas de um fichário, listas telefônicas, registros de imóveis, matriculas em uma faculdade,... Procedimento: Calcule o índice/intervalo da amostragem dado por I = N/n (considere I sempre o inteiro mais próximo) Onde N número de elementos da população. n número de elementos da amostra. ... procedimento: Sorteia-se o primeiro número, x, da seleção . Para populações maiores que 30 elementos, orienta-se que esse número x seja entre 1 e I. Os números selecionados da planilha da população será: X, X + I , X + 2.I,..., X + (n - 1)I Amostragem ESTRATIFICADA Para o caso de populações heterogêneas, na qual podemos distinguir subpopulações denominados por estratos. Os estratos são mutuamente excludente. Procedimento: Após a determinação do número de estratos, determina-se o tamanho de cada subpopulação. O objetivo é que as sub-amostras tenha tamanhos proporcionais ao respectivo número de elementos de cada estrato. Revisão matemática: Proporção, Porcentagem e Razão Razão: sendo o numerador “A” e o denominado “B” a razão é sempre dada pela divisão de A por B. Representase razão, por exemplo: 400 300 4 3 ou 4:3, ou 1,333 para 1 Proporção: é a razão entre a parte e o todo. O numerador representa sempre a parte e o denominado é sempre o todo. Se: N= N1 + N2 + N3 + ... NN NN N1 N 2 N 3 ... 1 N N N N Onde: P1 = N1/N, P2 = N2/N, P3 = N3/N, etc. Porcentagem: É a proporção multiplicada por 100. A soma das porcentagens é igual a 100. TABELAS TABELA: É UM QUADRO QUE RESUME UM CONJUNTO DE DADOS OBSERVADOS. Normas de Tabelas CABEÇALHO COLUNA INDICADORA CORPO RODAPÉ PRODUÇÃO DE CAFÉ BRASIL – 1991-1995 ANOS 1991 1992 1993 1994 1995 FONTE: IBGE. PRODUÇÃO (1.000 t) 2.535 2.666 2.122 3.750 2.007 TÍTULO CABEÇALHO COLUNA NUMÉRICA CASA OU CÉLULA LINHAS Existem 03 fatores que diferenciam uma série de outra: A variação da época a que se refere a o fenômeno analisado A variação do local onde o fenômeno acontece A variação de categoria ou fenômeno descrito SÉRIE CRONOLÓGICA, TEMPORAL OU HISTORICA DESCREVEM OS VALORES DA VARIÁVEL, EM DETERMINADO LOCAL, DISCRIMINADOS SEGUNDO INTERVALOS DE TEMPO VARIÁVEIS. EXEMPLO: SÉRIES GEOGRÁFICAS, ESPACIAIS, TERRITORIAIS. DESCREVEM OS VALORES DA VARIÁVEL, EM DETERMINADA ÉPOCA, DISCRIMINADOS SEGUNDO DIFERENTES LOCAIS. EXEMPLO: SÉRIES ESPECÍFICAS DESCREVEM OS VALORES DA VARIÁVEL, EM DETERMINADA ÉPOCA E LOCAL, DISCRIMINADOS SEGUNDO DIFERENTES ESPECIFICAÇÕES OU CATEGORIAS. EXEMPLO: SÉRIES CONJUGADAS OU TABELA DE DUPLA ENTRADA MUITAS VEZES TEMOS NECESSIDADE DE APRESENTAR, EM UMA ÚNICA TABELA, A VARIAÇÃO DE VALORES DE MAIS UMA VARIÁVEL, ISTO É, FAZER UMA CONJUGAÇÃO DE DUAS OU MAIS TABELAS. EXEMPLO: DISTRIBUIÇÃO DE FREQUÊNCIA É o tipo de tabela mais importante para a Estatística Descritiva para dados contínuos. Sua construção usa faixa de dados em intervalos de classe ou células que aumentam a informação visual na distribuição de frequência. EXEMPLO: GRÁFICOS O GRÁFICO ESTATÍSTICO É UMA FORMA DE APRESENTAÇÃO DOS DADOS ESTATÍSTICOS, CUJO OBJETIVO... ... É PRODUZIR NO INVESTIGADOR OU NO PÚBLICO EM GERAL UMA IMPRESSÃO MAIS RÁPIDA E VIVA DO FENÔMENO EM ESTUDO, JÁ QUE OS GRÁFICOS AJUDAM MAIS RÁPIDAMENTE NA COMPREENSÃO DE UM RESULTADO QUE VISUALIZAÇÃO DESTES DADOS EM TABELAS. PRINCIPAIS TIPOS DE GRÁFICOS GRÁFICO EM LINHA 100 90 80 70 60 50 40 30 20 10 0 1° Trim 2° Trim 3° Trim 4° Trim GRÁFICO EM COLUNAS OU EM BARRAS SIMPLES 90 80 70 60 50 40 30 20 10 0 1° Trim 2° Trim 3° Trim 4° Trim GRÁFICO EM COLUNAS OU EM BARRAS MÚLTIPLAS 90 80 70 60 50 Leste Oeste Norte 40 30 20 10 0 1° Trim 2° Trim 3° Trim 4° Trim GRÁFICO EM SETORES Leste Oeste Norte GRÁFICO POLAR CARTOGRAMA PICTOGRAMA DISTRIBUIÇÃO DE FREQUÊNCIA PRINCIPAIS ELEMENTOS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA. CLASSES (K): VARIÁVEL. SÃO INTERVALOS DE VARIAÇÃO DA LIMITES DE CLASSES (L): SÃO OS EXTREMOS DE CADA CLASSE. AMPLITUDE DE UM INTERVALO DE CLASSE MEDIDA DO INTERVALO QUE DEFINE A CLASSE. (h): É A PONTO MÉDIO DE UMA CLASSE: É O PONTO QUE DIVIDE O INTERVALO DE CLASSE EM DUAS PARTES IGUAIS. AMPLITUDE TOTAL (R): É a diferença entre o maior e o menor valor. NUMERO TOTAL DE DADOS (n) • Amplitude Total → R = L(max) – (Lmin) • Número de Classes → K ≈ √n • Amplitude total das classes → h ≈ R/K Para Pensar: Construir uma distribuição de freqüência para os dados abaixo. (Itens: intervalo de classe, freqüência, freqüência relativa, freqüência relativa acumulada) Resistência a compressão de 56 corpos de Prova de Liga Aluminio-Lítio 150 221 183 186 171 181 180 153 150 154 157 174 160 168 167 151 163 220 174 199 181 158 176 180 207 181 154 155 160 218 158 133 134 180 190 193 194 133 156 193 200 178 176 167 184 185 209 186 199 157 191 171 165 172 158 169 3ª Aula REPRESENTAÇÃO GRÁFICA DE UMA DISTRIBUIÇÃO DE FREQÜÊNCIA HISTOGRAMA: É FORMADO POR UM CONJUNTO DE RETÂNGULOS JUSTAPOSTOS, CUJAS BASES SE LOCALIZAM SOBRE O EIXO HORIZONTAL, DE TAL MODO QUE SEUS PONTOS MÉDIOS COINCIDAM COM OS PONTOS MÉDIOS DOS INTERVALOS DE CLASSE. POLÍGONO DE FREQÜÊNCIA: É UM GRÁFICO EM LINHAS, SENDO AS FREQÜÊNCIAS MARCADAS SOBRE PERPENDICULARES AO EIXO HORIZONTAL, LEVANTADAS PELOS PONTOS MÉDIOS DOS INTERVALOS DE CLASSE. POLÍGONO DE FREQÜÊNCIA ACUMULADA: É TRAÇADO MARCANDO-SE AS FREQÜÊNCIAS ACUMULADAS SOBRE PERPENDICULARES AO EIXO HORIZONTAL, LEVANTADAS NOS PONTOS CORRESPONDENTES AOS LIMITES SUPERIORES DOS INTERVALOS DE CLASSE. MEDIDAS DE POSIÇÃO MODA (Mo) MÉDIA ARITMÉTICA (Me) MEDIANA (Md) MODA É O VALOR DISTRIBUIÇÃO. MAIS FREQÜÊNTE DA Exemplo de cálculo modal MÉDIAS MÉDIA ARITMÉTICA - DADOS NÃO AGRUPADOS MÉDIA ARITMÉTICA - DADOS AGRUPADOS QUANDO OS DADOS ESTIVEREM AGRUPADOS NUMA DISTRIBUIÇÃO DE FREQÜÊNCIA USAREMOS A MÉDIA ARITMÉTICA DOS VALORES x1, x2, ..., xn(PONTOS MÉDIOS DAS CLASSES), PONDERADOS PELAS RESPECTIVAS FREQÜÊNCIAS ABSOLUTAS: F1, F2, F3,...FN. ASSIM: EXEMPLO: