Introdução a Estatística O que é Estatística ? ? ESTATÍSTICA: conjunto de técnicas que permite, de forma sistemática, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer área do conhecimento. Algumas Atividades que Envolvem Estatística. • Área Social: O censo populacional. • Área Industrial: Confiabilidade de Sistemas, Controle Estatístico de Qualidade, etc. • Área Agropecuária: Identificação de melhores formas de manejo, etc. • Área Bancária: Concessão de Crédito, Atuária. • Marketing: Pesquisas de Mercado, Inferência, etc. Principais Áreas da Estatística • Estatística Descritiva: Utilizada na etapa inicial da análise, quando tomamos contato com os dados pela primeira vez. É o conjunto de técnicas destinadas a descrever e resumir os dados a fim de que possamos tirar conclusões a respeito da característica de interesse. • Probabilidade: Teoria matemática utilizada para se estudar a incerteza oriunda de fenômenos de caráter aleatório. • Inferência Estatística: Estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de valores, usualmente de dimensão muito menor. Exemplos de Aplicação • Comparação entre tratamentos ou processos: Tratamento Tipo 1 Tratamento Tipo 2 Produção Produção Tipo 1 é mais produtivo do que o x11 x12 ... x1n Tipo 2? x21 x22 ... x2n Raciocínio Estatístico População Dados Amostragem Estatística Descritiva Inferência Estatística (Probabilidade) Com Suporte Computacional Técnicas de Amostragem Noções Básicas • Definição de População: Ao grande conjunto de elementos que contém determinada característica comum, que temos interesse recebe o nome de população. População 1 População 2 Ex1: Toda a população brasileira. Ex2: Toda a população de sapos brasileiros. Noções Básicas Quando observamos todos os dados, procedemos ao Censo. Exemplo: Examinar todos os brasileiros quanto a condição de nutrição. População Qual é a proporção de brasileiros desnutridos? =? • Um parâmetro é uma medida numérica que descreve uma característica de uma população. Ex: 20% dos brasileiros estão desnutridos. Noções Básicas Quase não se trabalha com população. Motivos Principais • Alto custo da pesquisa/experimento (material, pessoal, logística, etc); • Resultados demorados; • Razões Éticas (experimentos com animais); • Impossibilidade (Linha de produção, sangue, etc). Noções Básicas: Amostra. Definição: subconjunto da população, em geral com dimensão sensivelmente menor. População Amostra x : Estatística. • Estatística: é uma medida numérica que descreve uma característica de uma amostra. Ex: média da altura da pop. Brasileira, proporção de desnutridos, etc. Noções Básicas: Amostra. Vantagens da Amostragem. •Baixo custo operacional. • Maior rapidez na execução da pesquisa ou estudo. • Maior segurança nos resultados Tipos de Amostragem Amostra casual simples: Existência de um “frame”. Todos os elementos da população devem ter chance igual de escolha. Procedimento baseado no sorteio aleatório.de escolha. Figura 1: Sorteio Aleatório Tipos de Amostragem Amostra Estratificada: Na amostra estratificada os elementos são provenientes de todos os estratos da população. Em cada estrato é feito o sorteio aleatório. Ex: Pesquisas em um cidade; pesquisas em florestas; etc. Tipos de Amostragem Amostra Sistemática: Na amostra sistemática os elementos são escolhidos não por acaso, mas por um sistema. No primeiro período o sorteio é aleatório. Exemplo: Linha de Produção; Pesquisas em formulários; etc. Tipos de Amostragem Amostra por conglomerado: Amostra feita em vários estágios. Maior economia. Ex: Em uma pesquisa feita no pais, primeiro sorteamos os estados, depois as cidades, depois os bairros, os setores censitários, os domicílios e os indivíduos. Tipos de Amostragem: Exercícios A- Identifique o tipo de amostra: 1. Obtém-se uma amostra de um produto extraindo-se cada 100º unidade da linha de produção; 2. Um fabricante de automóveis faz um estudo de mercado compreendendo testes de direção feitos por uma amostra de 10 homens e 10 muheres em cada uma das quatro diferentes faixas etárias; 3. Geram-se números aleatórios em um computador para selecionar números de séries de carros a serem escolhidos para uma amostra teste. 4. Em uma linha de produção são produzidos 1000 comprimidos por hora, sabendo que a linha funciona por 8 horas seguidas por dia e que deve ser extraída uma amostra de 400 comprimidos por dia, qual seria o processo de amostragem mais indicado e como seria a seleção dessa amostra? Análise Exploratória de Dados Estatística Descritiva 1 Organização dos dados em Tabelas O que é uma variável ? • Variável é uma característica, propriedade ou atributo de uma unidade da população, cujo valor pode variar entre as unidades da população. Tipos de Variáveis • Variáveis Qualitativas ou Categóricas: Quando os possíveis valores assumem atributos ou qualidades. Ex: sexo, cor, escolaridade, doença, condição do ar, condição da água, etc. • Variáveis Quantitativas ou de Medidas: Quando seus valores são expressos em números. Ex: altura, peso, número de filhos, pH, concentração do reagente, etc . Especificando os tipos de variáveis As variáveis qualitativas podem ser classificadas ainda como: • Ordinais: quando o atributo tem uma ordenação natural, indicando intensidade crescente de realização. Ex: grau de escolaridade, classe social, condição do ar, condição da água,estado clínico, etc. • Nominais: quando o atributo não se estabelece ordem. Ex: sexo, cor, raça, doença, etc. Já as variáveis quantitativas podem ser: • Discretas: resultantes de contagens, assumindo assim, em geral valores inteiros. Ex: número de filhos, número de peças defeituosas, nº de pessoas doentes na região, etc. • Contínuas: assumem valores em intervalos de números reais e geralmente, são provenientes de uma mensuração. Ex: peso, altura, pH,concentração do reagente, etc.. Resumo geral: tipo de variável nominal Qualitativa ordinal Variável discreta Quantitativa contínua Exercícios 1. Classifique cada uma das variáveis abaixo em qualitativa( ordinal ou nominal) ou quantitativa (discreta ou contínua) a) Ocorrência de hipertensão grávidas(sim ou não são as repostas possíveis. b) Intenção de votos para presidente( nomes dos candidatos) c) Perda de peso em maratonistas. d) Intensidade da perda de peso (leve, moderada, forte) e) Grau de satisfação da população brasileira em relação ao trabalho de seu presidente( valores de 0 a 5, onde 0 significa totalmente insatisfeito e 5 totalmente satisfeito) TABELAS As tabelas e gráficos são utilizados em estatística para apresentar os resultados obtidos de maneira rápida e segura, permitindo uma leitura e interpretação mais fáceis. Uma tabela possui: corpo, título, cabeçalho, coluna indicadora, coluna ou parte numérica, linhas, casa ou cédula. SÉRIES ESTATÍSTICAS Uma série é toda tabela que apresenta dados estatísticos em função da época, do local ou da espécie. São usadas para variáveis qualitativas nominais. Geográfica: espacial, localização, território, Específica: categórica, por espécie, classe, Temporal: histórica, por data, cronológica. Conjugada: Mais de um tipo. Tabela 1.1: Número de Nascimentos segundo o sexo Sexo Masculino Feminino Total Freqüência 10 8 18 Fonte: E.W. Esta é uma série específica ou categórica Para efeito de comparação: Tabela de freqüência relativa Tabela 1.2: Número de Nascimentos segundo sexo. Sexo Freqüência Freqüência relativa(%) Masculino 10 55,56% Feminino 8 44,44% Total 18 100,00% Fonte: E.W. Série Geográfica Tabela 1: Produção de milho no Centro Oeste – 2015 Estado Goiás Mato Grosso Mato Grosso do Sul Distrito Federal total Milhões de Toneladas de milho 3,2 12 5,1 0,6 20,9 Série Temporal Tabela 1: Produção de milho na Distrito Federal 2014 – 2015 Ano Produção em toneladas 2014 542.135 2015 596.378 Série Conjugada Tabela 1: Produção de grãos no Distrito Federal 2014 – 2015 Ano Feijão(t) Milho(t) 2014 29.265 542.135 2015 36.406 596.378 GRÁFICOS PARA SÉRIES Os gráficos são utilizados para expressarem os resultados de forma mais compacta e “chamativa” ao mesmo tempo. Tipos de gráficos: Gráfico de setor: mostrar relação dos itens pesquisados em relação com o todo. Usa muito porcentagem. Gráfico de colunas ou barras: Apresentar os dados por categorias. Gráfico de linha: mostrar evolução dos objetos num determinado intervalo de tempo. Gráfico de Setores ou Pizza. Usado para representar variáveis qualitativas, quando os dados apresentam poucas características. Figura1.1: Fonte de Emissão de CO na RMSP-2003. 31% 54% 15% Gasolina Alcool Diesel Gráfico de Barras. Gráfico de barras bastante usado com variáveis qualitativas e quantitativas discretas. Ideal para quando temos várias classes de categorias. Figura 1.2: Distribuição das reclamações via 0800. 25 25 20 13 Freqüência 15 10 8 7 5 0 Mau atendimento Troca de mercadoria Mercadoria com defeito Reclamações Falta de variedade Construir Gráficos no EXCEL Para construir gráficos basta digitar a tabela depois tecla em inserir gráfico, seleciona os dados. EX: n° de % alunos Cursos 25 41,66667 Administração 20 33,33333 Contábeis 25 15 Ecônomia 60 Total Alunos em cada curso Administração Contábeis Ecônomia Relação de alunos em cada curso 30 25 20 15 10 5 0 Série1 Relação de alunos por curso 30 25 20 15 Série1 10 5 0 Administração Contábeis Ecônomia Este gráfico não representou bem os dados. Por quê? Tabela e Gráfico Ex. 02 pg 14 Número de Empresas criadas no Segundo Semestre de 2002 em Goiás De pequeno e Médio Porte Mês Peq Porte Médio porte Total de empresas julho 383 251 634 agosto 179 436 615 setembro 317 272 589 outubro 210 89 299 novembro 346 65 411 dezembro 107 335 442 TOTAL Quantidade de empresas de médio e pequeno porte criadas no segundo semestre de 2002. 500 436 450 400 383 346 350 335 317 300 272 251 Peq Porte 250 210 200 Médio porte 179 150 107 89 100 65 50 0 julho agosto setembro outubro novembro dezembro Gráfico anterior no formato de linha 500 450 400 350 300 250 200 Peq Porte 150 Médio porte 100 50 0 julho agosto setembro outubro novembro dezembro Novas Empresas Criadas no Segundo Semestre de 2002 Mês N ° de empresas % julho 634 21 agosto 615 21 setembro outubro 589 299 20 10 novembro 411 14 dezembro 442 15 TOTAL 2990 Gráfico em Setores dezembro 15% julho 21% julho agosto novembro 14% setembro outubro novembro agosto 20% outubro 10% setembro 20% dezembro Empresas Criadas no Segundo Semestre de 2002 700 634 615 589 600 500 442 411 400 299 300 200 100 0 julho agosto setembro outubro novembro dezembro