Introdução a Estatística - SOL

Propaganda
Introdução a Estatística
O que é Estatística ?
?
ESTATÍSTICA: conjunto de técnicas que permite,
de forma sistemática, coletar, organizar, descrever,
analisar e interpretar dados oriundos de estudos
ou experimentos, realizados em qualquer área do
conhecimento.
Algumas Atividades que Envolvem Estatística.
• Área Social: O censo populacional.
• Área Industrial: Confiabilidade de
Sistemas, Controle Estatístico de
Qualidade, etc.
• Área Agropecuária: Identificação de
melhores formas de manejo, etc.
• Área Bancária: Concessão de Crédito,
Atuária.
• Marketing: Pesquisas de Mercado,
Inferência, etc.
Principais Áreas da Estatística
• Estatística Descritiva: Utilizada na etapa inicial da
análise, quando tomamos contato com os dados pela
primeira vez. É o conjunto de técnicas destinadas a
descrever e resumir os dados a fim de que
possamos tirar conclusões a respeito da
característica de interesse.
• Probabilidade: Teoria matemática utilizada para se
estudar a incerteza oriunda de fenômenos de caráter
aleatório.
• Inferência Estatística: Estudo de técnicas que
possibilitam a extrapolação, a um grande conjunto de
dados, das informações e conclusões obtidas a partir
de subconjuntos de valores, usualmente de
dimensão muito menor.
Exemplos de Aplicação
• Comparação entre tratamentos ou processos:
Tratamento Tipo 1
Tratamento Tipo 2
Produção
Produção
Tipo 1
é mais
produtivo
do que o
x11
x12
...
x1n
Tipo 2?
x21
x22
...
x2n
Raciocínio Estatístico
População
Dados
Amostragem
Estatística
Descritiva
Inferência Estatística
(Probabilidade)
Com Suporte Computacional
Técnicas de Amostragem
Noções Básicas
• Definição de População: Ao grande conjunto de
elementos que contém determinada característica
comum, que temos interesse recebe o nome de
população.
População 1
População 2
Ex1: Toda a população brasileira.
Ex2: Toda a população de sapos brasileiros.
Noções Básicas
Quando observamos todos os dados, procedemos ao
Censo.
Exemplo: Examinar todos os brasileiros quanto a
condição de nutrição.
População
Qual é a proporção de
brasileiros desnutridos?
=?
• Um parâmetro é uma medida numérica que descreve uma
característica de uma população. Ex: 20% dos brasileiros estão
desnutridos.
Noções Básicas
Quase não se trabalha com população.
Motivos Principais
• Alto custo da pesquisa/experimento (material, pessoal,
logística, etc);
• Resultados demorados;
• Razões Éticas (experimentos com animais);
• Impossibilidade (Linha de produção, sangue, etc).
Noções Básicas: Amostra.
Definição: subconjunto da população, em geral com
dimensão sensivelmente menor.
População
Amostra
x
: Estatística.
• Estatística: é uma medida numérica que descreve uma
característica de uma amostra. Ex: média da altura da pop.
Brasileira, proporção de desnutridos, etc.
Noções Básicas: Amostra.
Vantagens da Amostragem.
•Baixo custo operacional.
• Maior rapidez na execução da pesquisa ou estudo.
• Maior segurança nos resultados
Tipos de Amostragem
Amostra casual simples: Existência de um “frame”. Todos os elementos da população
devem ter chance igual de escolha. Procedimento baseado no sorteio aleatório.de
escolha.
Figura 1: Sorteio Aleatório
Tipos de Amostragem
Amostra Estratificada: Na amostra estratificada os elementos são
provenientes de todos os estratos da população.
Em cada estrato é feito o sorteio aleatório.
Ex: Pesquisas em um cidade; pesquisas em florestas; etc.
Tipos de Amostragem
Amostra Sistemática: Na amostra sistemática os elementos são
escolhidos não por acaso, mas por um sistema.
No primeiro período o sorteio é aleatório.
Exemplo: Linha de Produção; Pesquisas em formulários;
etc.
Tipos de Amostragem
Amostra por conglomerado: Amostra feita em vários estágios.
Maior economia.
Ex: Em uma pesquisa feita no pais, primeiro sorteamos os estados,
depois as cidades, depois os bairros, os setores censitários, os
domicílios e os indivíduos.
Tipos de Amostragem: Exercícios
A- Identifique o tipo de amostra:
1. Obtém-se uma amostra de um produto extraindo-se cada 100º unidade da linha
de produção;
2. Um fabricante de automóveis faz um estudo de mercado compreendendo
testes de direção feitos por uma amostra de 10 homens e 10 muheres em cada
uma das quatro diferentes faixas etárias;
3. Geram-se números aleatórios em um computador para selecionar números de
séries de carros a serem escolhidos para uma amostra teste.
4. Em uma linha de produção são produzidos 1000 comprimidos por hora,
sabendo que a linha funciona por 8 horas seguidas por dia e que deve ser
extraída uma amostra de 400 comprimidos por dia, qual seria o processo de
amostragem mais indicado e como seria a seleção dessa amostra?
Análise Exploratória de Dados
Estatística Descritiva 1
Organização dos dados em
Tabelas
O que é uma variável ?
•
Variável é uma característica, propriedade ou atributo de uma unidade
da população, cujo valor pode variar entre as unidades da população.
Tipos de Variáveis
• Variáveis Qualitativas ou Categóricas: Quando os possíveis valores assumem
atributos ou qualidades. Ex: sexo, cor, escolaridade, doença, condição do ar, condição
da água, etc.
• Variáveis Quantitativas ou de Medidas: Quando seus valores são expressos em
números. Ex: altura, peso, número de filhos, pH, concentração do reagente, etc .
Especificando os tipos de variáveis
As variáveis qualitativas podem ser classificadas ainda como:
• Ordinais: quando o atributo tem uma ordenação natural, indicando
intensidade crescente de realização. Ex: grau de escolaridade, classe
social, condição do ar, condição da água,estado clínico, etc.
• Nominais: quando o atributo não se estabelece ordem. Ex: sexo, cor,
raça, doença, etc.
Já as variáveis quantitativas podem ser:
• Discretas: resultantes de contagens, assumindo assim, em geral
valores inteiros. Ex: número de filhos, número de peças defeituosas,
nº de pessoas doentes na região, etc.
• Contínuas: assumem valores em intervalos de números reais e
geralmente, são provenientes de uma mensuração. Ex: peso, altura,
pH,concentração do reagente, etc..
Resumo geral: tipo de variável
nominal
Qualitativa
ordinal
Variável
discreta
Quantitativa
contínua
Exercícios
1. Classifique cada uma das variáveis abaixo em qualitativa(
ordinal ou nominal) ou quantitativa (discreta ou contínua)
a) Ocorrência de hipertensão grávidas(sim ou não são as
repostas possíveis.
b) Intenção de votos para presidente( nomes dos candidatos)
c) Perda de peso em maratonistas.
d) Intensidade da perda de peso (leve, moderada, forte)
e) Grau de satisfação da população brasileira em relação ao
trabalho de seu presidente( valores de 0 a 5, onde 0
significa totalmente insatisfeito e 5 totalmente satisfeito)
TABELAS
As tabelas e gráficos são utilizados em estatística
para apresentar os resultados obtidos de maneira
rápida e segura, permitindo uma leitura e interpretação
mais fáceis.
Uma tabela possui: corpo, título, cabeçalho, coluna
indicadora, coluna ou parte numérica, linhas, casa ou
cédula.
SÉRIES ESTATÍSTICAS
Uma série é toda tabela que apresenta dados
estatísticos em função da época, do local ou da espécie.
São usadas para variáveis qualitativas nominais.
Geográfica: espacial, localização, território,
Específica: categórica, por espécie, classe,
Temporal: histórica, por data, cronológica.
Conjugada: Mais de um tipo.
Tabela 1.1: Número de Nascimentos segundo o sexo
Sexo
Masculino
Feminino
Total
Freqüência
10
8
18
Fonte: E.W.
Esta é uma série específica ou categórica
Para efeito de comparação: Tabela de
freqüência relativa
Tabela 1.2: Número de Nascimentos segundo sexo.
Sexo
Freqüência Freqüência relativa(%)
Masculino
10
55,56%
Feminino
8
44,44%
Total
18
100,00%
Fonte: E.W.
Série Geográfica
Tabela 1: Produção de milho no Centro Oeste – 2015
Estado
Goiás
Mato Grosso
Mato Grosso do Sul
Distrito Federal
total
Milhões de
Toneladas de milho
3,2
12
5,1
0,6
20,9
Série Temporal
Tabela 1: Produção de milho na Distrito Federal 2014 – 2015
Ano Produção em toneladas
2014
542.135
2015
596.378
Série Conjugada
Tabela 1: Produção de grãos no Distrito Federal 2014 – 2015
Ano Feijão(t) Milho(t)
2014 29.265 542.135
2015 36.406 596.378
GRÁFICOS PARA SÉRIES
Os gráficos são utilizados para expressarem os resultados
de forma mais compacta e “chamativa” ao mesmo tempo.
Tipos de gráficos:
Gráfico de setor: mostrar relação dos itens pesquisados
em relação com o todo. Usa muito porcentagem.
Gráfico de colunas ou barras: Apresentar os dados por
categorias.
Gráfico de linha: mostrar evolução dos objetos num
determinado intervalo de tempo.
Gráfico de Setores ou Pizza.
Usado para representar variáveis qualitativas, quando os
dados apresentam poucas características.
Figura1.1: Fonte de Emissão de CO na RMSP-2003.
31%
54%
15%
Gasolina
Alcool
Diesel
Gráfico de Barras.
Gráfico de barras bastante usado com variáveis qualitativas e quantitativas
discretas. Ideal para quando temos várias classes de categorias.
Figura 1.2: Distribuição das reclamações via 0800.
25
25
20
13
Freqüência
15
10
8
7
5
0
Mau atendimento
Troca de mercadoria
Mercadoria com defeito
Reclamações
Falta de variedade
Construir Gráficos no EXCEL
Para construir gráficos basta digitar a tabela depois tecla em
inserir gráfico, seleciona os dados.
EX:
n° de
%
alunos
Cursos
25 41,66667
Administração
20 33,33333
Contábeis
25
15
Ecônomia
60
Total
Alunos em cada curso
Administração
Contábeis
Ecônomia
Relação de alunos em cada curso
30
25
20
15
10
5
0
Série1
Relação de alunos por curso
30
25
20
15
Série1
10
5
0
Administração
Contábeis
Ecônomia
Este gráfico não representou bem os dados. Por quê?
Tabela e Gráfico Ex. 02 pg 14
Número de Empresas criadas no Segundo Semestre de 2002 em Goiás
De pequeno e Médio Porte
Mês
Peq Porte
Médio porte
Total de empresas
julho
383
251
634
agosto
179
436
615
setembro
317
272
589
outubro
210
89
299
novembro
346
65
411
dezembro
107
335
442
TOTAL
Quantidade de empresas de médio e pequeno
porte criadas no segundo semestre de 2002.
500
436
450
400
383
346
350
335
317
300
272
251
Peq Porte
250
210
200
Médio porte
179
150
107
89
100
65
50
0
julho
agosto
setembro
outubro
novembro
dezembro
Gráfico anterior no formato de linha
500
450
400
350
300
250
200
Peq Porte
150
Médio porte
100
50
0
julho
agosto
setembro
outubro
novembro dezembro
Novas Empresas Criadas no Segundo Semestre de 2002
Mês
N ° de empresas
%
julho
634
21
agosto
615
21
setembro
outubro
589
299
20
10
novembro
411
14
dezembro
442
15
TOTAL
2990
Gráfico em Setores
dezembro
15%
julho
21%
julho
agosto
novembro
14%
setembro
outubro
novembro
agosto
20%
outubro
10%
setembro
20%
dezembro
Empresas Criadas no Segundo Semestre de 2002
700
634
615
589
600
500
442
411
400
299
300
200
100
0
julho
agosto
setembro
outubro
novembro
dezembro
Download