Unidade I ESTATÍSTICA Prof. Celso Guidugli Visão geral da estatística Estatística: Conjunto de métodos e processos destinados a permitir o entendimento de um universo submetido a certas condições de incerteza, ou seja, de não determinismo matemático. Campos de atuação da estatística População: Conjunto com todos os elementos que têm em comum uma característica que está sendo estudada. Grande quantidade de valores valores. Valores prováveis. Amostra: Subconjunto da população formado por apenas alguns dos elementos dela. Pequena quantidade de valores. Valores reais. Campos de atuação da estatística População e amostra são formadas por elementos com diversas características. Característica estudada: Variável estatística. C Características t í ti principais: i i i Definem a proporcionalidade entre população e suas amostras. Características secundárias: Demais características que não interferem nos estudos estatísticos. Tipos de variáveis estatísticas Variáveis qualitativas: Indicam qualidades; não são mensuráveis. Exemplos: religião, cor de cabelos, marca de refrigerantes preferida. Variáveis quantitativas: Indicam quantidades, portanto, são mensuráveis. Exemplos: altura dos estudantes de uma escola, salários dos funcionários de uma empresa, notas de uma prova de estatística. Tipos de variáveis estatísticas qualitativas Variáveis nominais: Não é possível fazer qualquer ordenação. Exemplo: você pratica esportes? Variáveis ordinais: É possível í l fazer f ordenações. d õ Por P exemplo: qual a intensidade com que você pratica esportes? Tipos de variáveis estatísticas quantitativas Variáveis discretas: Assumem apenas alguns poucos valores, normalmente inteiros. São contadas. Por exemplo: número de filhos numa família, gerentes que irão participar da convenção de vendas. Variáveis contínuas: Assumem qualquer valor numérico dentro de uma faixa lógica. São medidas. Por exemplo: peso dos alunos de uma escola, salários dos funcionários de uma empresa. Interatividade Estamos estudando o comportamento salarial dos administradores em determinada região do país. Essa variável estatística é: a) Qualitativa nominal. b) Qualitativa ordinal. c) Quantitativa discreta. d) Quantitativa ordinal. e) Quantitativa contínua. Amostragem Prever o comportamento de uma população a partir de amostras dela tiradas ou vice versa. Amostra é um pedaço coerente da população: Seus elementos devem refletir todas as características determinantes da população (as características principais). Amostragem Características da população: conhecidas antecipadamente. Sexo: Homens Mulheres Idade: 16 a 20 anos 20 a 30 anos 30 a 40 anos 40 a 50 anos 50 a 60 anos acima de 60 anos 48,2% 51,8% 12,3% 24,6% 26,9% 15,8% 14,6% 5,8% Classe Econômica: A B C D Time de Futebol Arranca Toco FC Preferido SE Deixa que xuto CA Avezessobrio 8% 22% 43% 27% 45% 32% 23% Dados Fictícios Amostragem A relação entre população e amostra é algo provável, ou seja, dotado de alguma margem de erro, que depende de: homogeneidade; tamanho da amostra; confiabilidade. Processo estatístico Passos: 1. Definir o objeto do estudo, as populações e as amostras envolvidas. 2. Coletar os dados amostrais. 3 T 3. Tabular b l e representar t os dados d d colhidos lhid na forma de tabelas e gráficos. 4. Cálculo dos parâmetros estatísticos. Esses passos correspondem à estatística descritiva. 5. Indução de parâmetros amostrais em parâmetros populacionais ou vice-versa. Esses passos correspondem à estatística indutiva. Coletar os dados amostrais Atividade de campo Dados brutos: exatamente como foram colhidos (vide apostila). Tabela 1.1 – Dados brutos de uma amostra de alunos de uma universidade Ordem Qualidade Nome do Estado Curso Idade em atribuída à Sexo aluno Civil matriculado anos instituição Renda Familiar Nº de DPs 1 Daiane solteiro Jornalismo Ótima F 19 R$ 3.220,00 2 2 Alberto solteiro Administra‐ ção Boa M 20 R$ 4.050,00 0 3 Rui casado Direito Regular M 25 R$ 1.950,00 4 4 Carolina casado Engenharia Ruim F 21 R$ 1.682,00 6 Organização dos dados: sequência de procedimentos que organizam e resumem os dados. Interatividade Quando falamos de amostragem, não podemos afirmar que: a) É possível prever o comportamento de uma população a partir do estudo de suas amostras. b) A As relações l õ entre t uma população l ã e suas amostras são prováveis, ou seja, existe uma margem de erro. c) Uma amostra é um pedaço da população, portanto, podemos conhecer uma população tomando-se alguns elementos quaisquer. d) Quanto mais heterogênea for uma população, maior será a margem de erro. e) Quanto maior a amostra, menor a margem de erro. Representação dos dados Representação mais imediata e resumida: Quadros e tabelas analíticas. Gráficos. Definições fundamentais Frequência simples: número de vezes que um mesmo valor se repete na distribuição estudada. Existem 11 alunos casados na tabela, logo, a frequência simples de casados é 11. Frequência total: somatório de todas as frequências simples. No total, existem 42 alunos na tabela, logo, a frequência total é 42. Frequência relativa: frequência simples dividida pela frequência total. Como existem 11 alunos casados num total de 42, podemos dizer que a frequência relativa é de 0,262 ou 26,2%. Dados não agrupados em classes Tabela de frequências ou distribuição de frequências para dados não agrupados. Variáveis qualitativas e variáveis quantitativas discretas. Dados agrupados em classes Tabela de frequências ou distribuição de frequências para dados agrupados. Variáveis quantitativas contínuas. Número de classes. Limites de classes. Intervalos de classes. Dados agrupados em classes Interatividade Considerando as tabelas encontradas na apostila, que resumem os dados brutos de uma amostra de alunos de uma universidade, podemos afirmar que: a) A frequência simples de solteiros é de 28 e a frequência relativa de salários entre $5.075 e $6.448 é de 19,0%. b) Dez alunos têm renda familiar entre $3.702 e $5.075 e 9,5% fazem jornalismo. c) 9,5% dos alunos têm quatro dependências e 31% têm renda familiar menor do que $956. d) Existem 3 alunos divorciados e 18,5% fazem administração. e) 57,1% dos alunos são homens e todos têm renda familiar menor do que $10.567. Frequências acumuladas Frequência acumulada acima de determinado valor: quantidade total de elementos acima de dado valor. Por exemplo: existem 14 alunos que têm acima de 3 dependências. Frequência acumulada abaixo de determinado valor: Quantidade total de elementos abaixo de dado valor. Por exemplo: existem 30 alunos que têm abaixo de 30 anos. Distribuição ou tabela de frequências Distribuição ou tabela de frequências Representações gráficas Histogramas: normalmente, representação das frequências simples. Diagrama de ogiva: normalmente, representação das frequências acumuladas. Setorgrama: normalmente, representação das frequências relativas. Histograma Histograma Diagrama de ogiva Setorgrama Interatividade A partir do gráfico abaixo, podemos afirmar que a porcentagem dos trabalhadores na área de produção dessa empresa é de: a) 24%. b) 9%. c)) 6%. 6% d) 33%. e) 16%. ATÉ A PRÓXIMA!