Cálculos Estatístico, por Prof. Antônio Carlos Garcia 1 Antônio Carlos Garcia CÁLCULOS ESTATÍSTICOS Componente curricular: matemática 1º EDIÇÃO-S. Paulo, 2016 Editor: Antônio Carlos Garcia Revisão: Tais Andrade Batatais-SP Edição do autor 2017 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 2 Introdução Dados Brutos, rol e amplitude Gráficos Estatísticos Curvas Simétricas e Assimétricas Distribuição de frequência Distribuição de frequência com intervalos de classe Medidas de posição: Média, Mediana e Moda Medidas de dispersão: Desvio padrão Coleta e apuração de dados Obtendo uma amostra Princípios de estimação Bibliografia Índice 05 06 08 13 19 20 23 33 42 44 46 47 Catalogação na Publicação (CIP) Ficha catalográfica elaborada pelo autor Garcia, Antônio Carlos Fundamentos da Matemática Financeira: Antônio Carlos Garcia/Garcia 1ed. São Paulo: Clube de Autores, 2015 “Componente curricular: Matemática” Bibliografia. 59 p.; 21cm ISBN: 1.Cálculos Estatístico. Título G111a 2015 CDD-519.2 Aos alunos(as): Com muito carinho e orgulho, apresentamos aqui a primeira versão deste trabalho que conta com experiência de trinta e três anos de sala de aula. Espero que seja de grande valia aos estudantes do Ensino Técnico. Sobre o autor: Antônio Carlos Garcia, casado e pai de dois filhos, licenciado em Matemática (Licenciatura Plena) pela Faculdade de Filosofia, Ciências e Letras "Barão de Mauá”, em Ribeirão Preto, SP. Atividades Profissionais Docentes Professor efetivo de matemática desde 1983 na rede Estadual de ensino de São Paulo. Atualmente, leciona na EE “Dr. Washington Luis”, em Batatais, SP. Professor da ETEC “Antônio de Pádua Cardoso” do Centro Paula Souza, na mesma cidade. Foi Professor de Física e Desenho Geométrico na Escola "Ateneu Barão de Mauá”, em Ribeirão Preto-SP, em 1977. Participou de dois mandatos na Diretoria da Apeoesp - Sindicato dos professores do Estado de São Paulo, de 1989 a 1990 e 1999 a 2001. Outras Atividades: Fui eleito vereador, exercendo o mandato de 2000 a 2004 em Batatais-SP. Nesta experiência política, muito contribuiu para educação e área social do município. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 3 Introdução: Por um longo tempo, a palavra estatística era referência a informações numéricas sobre o estado e política territoriais. A palavra vem do latim “statisticus”, que significa do estado. A estatística como conhecemos teve muitos séculos de desenvolvimento. A estatística pode ser descritiva ou inferencial. A estatística descritiva organiza e resume dados numéricos. Descreve o conjunto de dados representado pela amostra. A estatística inferencial se interessa pelas generalizações, ou seja, pelas transferências de conclusões das amostras para as populações. Na inferência de suas conclusões, o pesquisador vale-se de um poderoso recurso que é a teoria das probabilidades. Essa teoria permite avaliar (e controlar) o tamanho do erro que ele estará cometendo ao fazer generalização. Análise e Interpretação dos resultados A análise depende naturalmente dos dados, mas também é função dos instrumentos criados pelo estatístico, supostamente mais apropriados de acordo com a sua lógica. As lógicas de interpretação dos resultados oferecem explicações prévias dos mesmos em função das representações sociais (*). A maior vantagem do sociólogo sobre o estatístico é que o primeiro permanece sempre consciente das limitações da linguagem estatística. (*) A realidade acessível aos agentes resulta tanto da própria realidade quanto das representações sociais que tem da mesma. Estas podem ser definidas como modalidades de conhecimento prático, socialmente elaboradas e partilhadas. Constituem, simultaneamente, sistemas de interpretação e categorização do real e modelos ou guias de ação. Apresenta um exemplo em que a divergência de resultados sobre o mesmo objeto coloque em causa a pretensa objetividade do trabalho estatístico. A proposta deste trabalho é tratar de assuntos como razão, porcentagem, proporcionalidade, construção e interpretação de tabelas e gráficos, uso do transferidor, construção do setor circular etc. Aplicações da Estatística A estatística é uma ciência de múltiplas aplicações e de fundamental importância no campo da investigação científica, sendo de utilização cada vez mais acentuada em qualquer atividade profissional. Sua aplicação é voltada para pesquisas, organização de relatórios/palestras e tomadas de decisão. Exemplos: Na indústria - controle de qualidade; Na biologia - teoria da hereditariedade genética; Na economia - pesquisa de mercado; No serviço social – indicadores sociais; Na empresa – tomadas de decisão, controle de estoque. População e Amostragem População é qualquer conjunto de informações que tenham, entre si, uma característica comum. O conjunto de todos os carros produzidos no Brasil, de todo as cores de olhos, de notas de matemática de uma classe, são exemplos de população. Se uma população for muito grande, recorre-se a uma amostra que, basicamente, constitui uma redução da população a dimensões menores, sem perda das características essenciais. Exemplo: 1-Dos 90 alunos, 54 são meninos e 36 são meninas. Queremos uma amostra de 10% da população. Sexo M F Total População 54 36 90 Amostragem 5 4 9 DADOS BRUTOS, ROL e AMPLITUDE TOTAL Aprendemos que o conjunto de dados numéricos obtidos após a crítica dos valores coletados constitui-se nos DADOS BRUTOS, e o ROL é o arranjo dos dados brutos em ordem crescente. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 4 Assim, por exemplo: 24, 23, 22, 28, 35, 21, 23, 33, 34, 24, 25, 21, 36, 26, 22, 30, 32, 25, 26, 33, 34, 21, 31, 34, 25, 31, 26, 25, 33, 31 são exemplos de dados brutos. Enquanto 21, 21, 21, 22, 22, 23, 23, 24, 25, 25, 25, 25, 26, 26, 26, 28, 30, 31, 31, 31, 32, 33, 33, 33, 34, 34, 34, 35, 35, 36 constituem o rol. Outro conceito básico que aprendemos foi a AMPLITUDE TOTAL (AT), que nada mais é que a diferença entre o maior e o menor valor observados. No exemplo dado acima, AT= 36 – 21 = 15. Os dados estatísticos podem estar organizados ou desorganizados. Quando organizados, recebem o nome de “dados estatísticos em rol” e, quando desorganizados, recebem o nome de “dados estatísticos brutos”. Os dados estatísticos em rol podem ser organizados em ordem numérica, alfabética ou ainda alfanumérica (quando aplicável); de forma crescente ou decrescente. Veja os exemplos abaixo: Dados Estatísticos Brutos U=(9, 5, 1, 7, 5, 3, 3, 6, 9, 7, 8, 5) Dados Estatísticos em Rol U=(1, 3, 3, 5, 5, 5, 6, 7, 7, 8, 9, 9) U=(9, 9, 8, 7, 7, 6, 5, 5, 5, 3, 3, 1) Os dados estatísticos também podem ser identificados pela sua espécie ou tipo, sendo eles: 1. Dados Contínuos são aqueles onde as variáveis podem assumir qualquer valor dentro de um intervalo de valores; digamos todos os valores x no intervalo 0≤ x≤ 1, assim, estas são então variáveis contínuas. Como exemplo de variável contínua temos o peso líquido de cada pneu num universo de pneus novos de uma certa marca, modelo e dimensão. 2. Dados Discretos, onde as variáveis só podem assumir determinados valores num intervalo de valores, ou seja, a menor diferença não-nula entre dois valores dessa variável é finita. Um exemplo de variável discreta é o número de pontos obtidos em cada jogada durante o lançamento de um dado comum não viciado. Apuração de dados e análise de resultados Após a coleta de dados, o estudante deve tabular os dados. A tabulação pode ser feita à mão, mecânica ou eletronicamente. No caso de estudos mais amplos, com mais dados, recomenda-se o emprego de software para economizar tempo, recursos, esforços e diminuir as margens de erro. Tabular os dados significa ler as respostas uma a uma, contá-las e organizá-las. Nas pesquisas quantitativas, no caso de questionários, basta contabilizar as respostas de cada alternativa. Nesse caso, o excel pode ser uma ótima opção para contagem dos dados, em especial com o uso das tabelas dinâmicas. As tabelas dinâmicas possibilitam cоmparação entre dados e encontrar novas infоrmações. Por exemplo, pode-se cruzar o gênero, faixa etária, faixa de renda com outras questões. Em pesquisas mais complexas é importante contar com a ajuda de um estatístico. Como se faz uma tabulação simples? Para exemplificar, apresentam-se os resultados referentes à questão: Qual a sua faixa etária? Na parte superior da tabela, existem dois campos, quais sejam, frequência e percentagem. O primeiro refere-se ao número de respostas contadas em cada alternativa. O segundo refere-se à fração por cento de qualquer coisa. Missing refere-se ao número de perguntas que não foram respondidas. No caso, a maior frequência ocorre com respondentes entre 20 e 29 anos, seguidos da faixa de 30 a 39 anos. Se tiver que realizar a tabulação de uma pergunta aberta ou de uma entrevista, é necessário padronizar as respostas por categorias antes da tabulação. Veja o exemplo a partir da pergunta: O que é necessário investir em Brasília? Respostas: Aumentar as linhas de metro. Mais ônibus em boas condições Categoria: TRANSPORTE Ônibus e metrôs. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 5 Prender os bandidos. Leis mais rígidas Categoria: SEGURANÇA Policiamento Depois de criar as categorias, basta identificar a frequência de cada uma, como mostra a tabela: Os resultados mostram que a maioria dos respondentes considera que segurança (36,5%) é uma questão importante em Brasília. Para 22,4% dos entrevistados, Brasília requer um sistema de saúde melhor. Outros 1,1 dos respondentes não souberam responder à questão. 1. Os dados precisam ser classificados em subgrupos e reunidos para comprovar ou refutar as hipóteses de pesquisa. Para apresentação dos resultados, pode-se recorrer à tabelas, quadros ou gráficos. Quadros são informações textuais agrupadas em linhas e colunas, e tabelas são informações geralmente numéricas. Para inserir as ilustrações no trabalho, é importante verificar a norma ABNT NBR 10719:2011, Informação e documentação — Relatório técnico e/ou científico — Apresentação. As regras são: A identificação da ilustração deve aparecer na parte superior, precedida da palavra designativa (desenho, esquema, fluxograma, fotografia, gráfico, mapa, organograma, planta, quadro, retrato, figura, imagem, entre outros), seguida do número de ordem de ocorrência no texto, em algarismos arábicos, travessão e do respectivo título. Após a ilustração, na parte inferior, indicar a fonte consultada (elemento obrigatório, mesmo que seja produção do próprio autor), legenda, notas e outras informações necessárias à sua compreensão (se houver). A ilustração deve ser citada no texto e inserida o mais próximo possível do trecho a que se refere. DADOS ABSOLUTOS E DADOS RELATIVOS Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação senão a contagem ou medida, são chamados dados absolutos. Dados relativos são o resultado de comparações por quociente (razões) que se estabelecem entre dados absolutos e tem por finalidade realçar ou facilitar as comparações entre quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens, índices, coeficientes e taxas. Um ponto importante que vale destacar é que os gráficos, tabelas e quadros DEVEM SER CITADOS no próprio texto. Veja um exemplo: De acordo com 85% dos estudantes, as disciplinas obrigatórias de biblioteconomia não os capacitam para o ensino da leitura. Outros 15% afirmaram que as disciplinas de Biblioteconomia capacitam profissionais para lidar com a leitura. O Gráfico 48apresenta os resultados. Gráfico 48 – Disciplinas de biblioteconomia e formação do leitor Fonte: Elaboração Própria Além de apresentar os dados da pesquisa, é necessário discutir os resultados. Por exemplo, o que significa o fato de 85% da amostra responderem que não se sentem capacitados para lidar com as questões de Cálculos Estatístico, por Prof. Antônio Carlos Garcia 6 ensino-aprendizagem de leitura? Outro exemplo: 70% dos estudantes do plano piloto estudam em escolas particulares. O que isso significa? Cabe ao estudante/escritor elaborar uma explicação para os dados. Contudo, as explicações devem ser embasadas na literatura da área. É crucial que o autor confronte os resultados com os de outros pesquisadores. A interpretação busca dar significado as respostas encontradas, vinculando-as com dados da literatura e os objetivos propostos na pesquisa. IMPORTANTE!!! O pesquisador deve ultrapassar a mera descrição dos resultados obtidos, acrescentando algo novo ao que se conhece sobre o assunto. Check list · · · · · · · Comece o tópico com breve informação sobre o que será tratado. Exemplo: “O presente capítulo trata da descrição dos dados e discussão dos resultados, coletados a partir da pesquisa documental e questionário” . Iniciar a apresentação dos dados retomando a pergunta do instrumento de coleta de dados. Exemplo: A questão três trata da escolaridade dos leitores de quadrinhos… A apresentação dos dados deve ser mostrada de questão em questão. Apresentam as perguntas, em seguida, as respostas mais significativas, isto é, aquelas que apresentaram maior número de respostas. É importante também destacar as que não receberam respostas. Depois, insere-se a ilustração (gráfico, quadro, tabela, etc). Os gráficos, tabelas e quadros devem ser citados no texto. Nas ilustrações e tabelas, deve-se colocar o título na parte superior, por exemplo: Gráfico 48 – Disciplinas de biblioteconomia e formação do leitor. A fonte deve constar na parte inferior. Se o gráfico for elaborado pelo estudante/autor, registrar: Fonte – elaboração própria. A discussão dos dados pode ser realizada após a questão ou por blocos de questões. A discussão deve estar fundamentada na literatura e não no achismo. Após apresentar um bloco de perguntas/respostas, deve-se resumir os principais pontos encontrados. Exemplo de resumo de perguntas para caracterização do perfil: O perfil do estudante de biblioteconomia é composto em sua maioria pelo gênero feminino, com idade entre 21 e 25 anos. Os estudantes moram no Distrito Federal, havendo poucos que moram no entorno. Com relação à renda familiar do estudante, o maior percentual situa-se na faixa acima de R$ 3.000,00. Em relação à educação básica, a maioria dos estudantes cursou instituições partic PORCENTAGEM, ÍNDICES Econômicos, coeficientes e taxas PORCENTAGEM Considere a série: MATRÍCULAS NAS ESCOLAS DA CIDADE A – 1995 CATEGORIAS NÚMERO DE ALUNOS 1°grau: 9.286 ( porcentagem: 9286/11.201x100 = 82,9% ) 2° grau: 1.681 ( porcentagem: ) 3° grau : 234 ( porcentagem: Total: 11.201 (Dados fictícios) Calcule as porcentagens dos alunos de cada grau: ÍNDICES Os índices são razões entre duas grandezas tais que uma não inclui a outra. São exemplos de índices: Idade mental Quociente intelectual = X 100 Idade cronológica população Densidade demográfica = X 1000 Superfície Índices Econômicos Valor total da produção ) Cálculos Estatístico, por Prof. Antônio Carlos Garcia 7 Produção per capita = População Consumo do bem Consumo per capita = População Renda Renda per capita = População Receita Receita per capita = População COEFICIENTES Os coeficientes são razões entre o número de ocorrências e o número total. Número de nascimentos Coeficiente de natalidade = População total Número de óbitos Coeficiente de mortalidade = População total Coeficientes educacionais Número de alunos evadidos Coeficiente de evasão escolar = Número inicial de matrículas Número de alunos aprovados Coeficiente de aproveitamento escolar = Número final de matrículas Número de alunos recuperados Coeficiente de recuperação = Número de alunos em recuperação TAXAS As taxas são coeficientes multiplicados por uma potência de 10 (10, 100, 1000, etc.) para tornar o resultado mais inteligível. Exemplos: Taxa de mortalidade = coeficiente de mortalidade x 1.000 Taxa de natalidade = coeficiente de natalidade x 1.000 Taxa de evasão escolar = coeficiente de evasão escolar x 10 2.Gráficos Estatísticos 2.1-Gráfico de colunas Cálculos Estatístico, por Prof. Antônio Carlos Garcia 8 Diferença salarial entre patentes militares 35000 30000 25000 20000 Série1 15000 10000 5000 0 Brasil EUA Canadá Alemanha Ve Br a ne sil El zu Sa ela lv N ad ica or C rag os ua ta R ic M a G éxi u a co te m al P R .D ana a om m in á i N can ica a ra gu a 100000 80000 60000 40000 20000 0 2.2-Gráfico de Setor Série1; 4800 Série1; 4000 1 2 Série1; 6000 3 4 Série1; 31815 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 9 2.3-GRAFICO DE BARRAS Opinião dos professores segundo atos de violência observados Estado de São Paulo, 2006 (1) Agressão verbal 95,900% Atos de vandalismo 88,500% Agressão física 82,200% Furto Roubo ou assalto a mão armada Violência sexual Assassinato 76,400% 17,800% 9,100% 7,000% Fonte: DIEESE-APEOESP - Pesquisa Violência nas Escola Elaboração: DIEESE – Subseção Apeoesp/Cepes Nota(1): Os dados não somam 100% pois foi possível assinalar mais de uma alternativa 2.4- Gráficos em barras compostas. 2.5- Gráficos em colunas superpostas. • Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar comparativamente dois ou mais atributos. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 10 MTP – massagem transversa profunda 2.6- Gráficos em linhas ou lineares. • São frequentemente usados para representação de séries cronológicas com um grande número de períodos de tempo. As linhas são mais eficientes do que as colunas quando existem intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um mesmo gráfico. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 11 2 . 7 2.8-Gráfico Pictórico Cálculos Estatístico, por Prof. Antônio Carlos Garcia 12 2.9-Gráfico de curvas Curva de frequência - curva polida Como em geral, os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras torando-se cada vez mais amplas e a amplitude das classes ficando cada vez menores, o que nos permite concluir que a linha poligonal tende a transformar-se numa curva- a curva de frequência-, mostrando, de modo mais evidente, a verdadeira natureza da distribuição da população. As principais formas das curvas de frequência a) Curva em forma de Sino Tais curvas caracterizam-se pelo fato de apresentam um valor máximo na região central e podem ser simétricas ou assimétricas. São muitos os fenômenos que apresentam distribuições em forma de sino: as estaturas de adultos, o peso de adultos, os QIs medidos em testes de inteligência, os preços relativos, etc. Curva Simétrica: Apresenta o valor máximo no seu ponto central e os pontos equidistantes desse centro apresentam a mesma frequência. Curvas Assimétricas Distribuição Assimétrica à direita (positiva) Cálculos Estatístico, por Prof. Antônio Carlos Garcia 13 Nas distribuições assimétricas os valores da moda, da mediana e da média (𝑥̅ ) divergem sendo que a média sempre estará do mesmo lado que a cauda mais longa. Assimétrica à esquerda (Negativa): .... x à esquerda da Mo (x < Md < Mo) Curvas em forma de J Cálculos Estatístico, por Prof. Antônio Carlos Garcia 14 Exemplo EXERCÍCIOS 1-André gastou sua mesada em duas semanas. Nesse momento, assustou-se e resolveu fazer uma tabela para verificar seus gastos. Faça um gráfico de setores para mostrar como André gastou sua mesada. Itens porcentagem alimentação 25 empréstimo 30 roupas 10 revistas 15 diversão 10 outros 10 O círculo tem 360º. Assim, 30% de 360o é 108o. Calcule as demais porcentagens. Represente em um gráfico de setor do círculo abaixo: Cálculos Estatístico, por Prof. Antônio Carlos Garcia 15 a) Coloque num gráfico de setores os resultados obtidos por Daniel no jogo de dado. (pag. 4) Gráficos Os dados estatísticos podem também ser apresentados por meio de um gráfico. Os gráficos facilitam a compreensão e ajudam a interpretar um determinado fenômeno. Em nossos meios de comunicação, os gráficos são apresentados com bastante criatividade, cuja finalidade é chamar atenção para o fenômeno apresentado. a) gráfico linear É o tipo de gráfico que apresenta por meio de uma linha poligonal. São utilizados para representar séries cronológicas. Consumo de energia elétrica Seção 1.02 De uma residência –jan /jun-97 Fonte: conta de energia elétrica – CPFL (a) Meses Janeiro Fevereiro Março Abril Maio Junho Consumo ( Kwh) 51 160 310 220 350 315 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 16 1901ral 1900ral 1900ral 1900ral 1900ral Luz 1900ral 1900ral 1900ral 1900ral JAN FEV MAR ABR MAI JUN b) GRÁFICO DE COLUNAS FOCO DE INCÊNDIO NO BRASIL 1991-1195 ANOS 1991 1992 1993 1994 1995 C) Gráfico de Barras QUEIMADAS (EM MILHARES) 17,8 13,1 19,8 8,5 39,9 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 17 4° Trim. 3° Trim. 2° Trim. 1° Trim. Norte 1900ral 1900ral 1900ral 1900ral 1900ral 1900ral 1900ral 1900ral 1900ral 1900ral Oeste Leste 1900ral D) GRÁFICO EM SETORES Bem mineral Bauxita Cobre(1) Estanho(2) Ferro(1) Manganês(1) Níquel(1) Ouro(3) Tungstênio Quatidade (em 1000000 t) 2098 1290 47451 17625 90 81 86809 2 Pará/Brasil(%) 76,20% 73,70% 6,70% 46,50% 27,60% 21,20% 6,40% 29,10% RESERVAS MINERAIS (MINERAIS METÁLICOS) Bauxita 29,10% 6,40% 21,20% Cobre(1) Estanho(2) 76,20% Ferro(1) 27,60% Manganês(1) Níquel(1) 46,50% 6,70% 73,70% Ouro(3) Tungstênio EXERCÍCIOS 1-A tabela representa a população brasileira de pessoas com idade maior ou igual a 60 anos. Construa: a)Um gráfico de colunas. b)Um gráfico de barras. c)Um gráfico em setores. ANOS Nº DE PESSOAS d)Um gráfico pictórico. (EM MILHÕES) 1950 1960 1970 1980 1991 2,2 3,3 4,7 7,3 10,7 FONTE : IBGE 2- Represente num gráfico de linha a tabela seguinte. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 18 POPULAÇÃO PRESENTE NO BRASIL. 1890 – 1996 ANOS POPU LAÇÃO (EM MILLHÕES) 1890 14,3 1900 1920 1940 1950 1960 1970 1980 1990 1996 17,4 30,6 41,2 51,9 70,1 93,1 119, 146,8 157 3-As tabelas abaixo foram retiradas da Revista veja de 23 de julho de 1997. Remuneração mensal de policiais no mundo dados em dólares. Tabela 1 – Salário médio de um policial militar em início de carreira. Brasil 390 Inglaterra 3000 EUA 2083 França 1480 Itália 1400 Japão 3500 Tabela 2- Diferença salarial entre as patentes mais baixas e as mais altas. Brasil 31815 EUA 6000 Canadá 4000 Alemanha 4800 a) Represente a tabela 1 em gráfico de barras. b) Represente a tabela 2 em um gráfico de setores. 4- Com base nos dados a seguir, construa: a)Um gráfico de colunas múltiplas; b) Um gráfico de setores sendo: um referente a importação e outro referente a exportação. Cálculos Estatístico, por Prof. Antônio Carlos Garcia Importações 1 7 2 8 3 9 4 10 5 11 19 6 4- -(Questão do ENEM 2008) O gráfico abaixo mostra a área desmatada da Amazônia, em km2, a cada ano, bi período 1988 a 2008. Medidas de posição: média, Moda e mediana 1.1-Distribuição de frequência Análise do conjunto de dados: Preparação: • Tabela de distribuição de frequência; 1.2-Gráficos de distribuição de frequência. ( Obs.: fazer a tabela da pag. 29) Cálculos Estatístico, por Prof. Antônio Carlos Garcia 20 Na análise de conjuntos de dados, é costume dividi-los em classes ou categorias e verificar o número de indivíduos pertencentes a cada classe, ou seja, a frequência de classe. A distribuição agrupada segundo as classes da variável em estudo é chamada de distribuição de frequência, podendo ser apresentada da forma tabular ou gráfica. Antes, porém, é importante a definição de frequência: Frequência absoluta simples de classe f i; Frequência absoluta acumulada de classe F i; Frequência relativa simples de classe f r i; Frequência relativa acumulada de classe Fr i; Frequência relativa percentual de classe fr (%); Frequência relativa percentual acumulada de classe Fr (%). A primeira fase de um estudo estatístico consiste em recolher, contar e classificar os dados colhidos sobre uma população estatística. Escolhida uma característica estatística sobre os elementos de uma população estatística, é preciso elaborar uma tabela de dados denominada de distribuição de frequência. Exemplo: Distribuição de frequência do grau de instrução do chefe da casa, numa amostra de 40 famílias do conjunto residencial Monte Verde, Florianópolis, SC, 1988. Na primeira coluna, aparecem os diferentes valores da variável estatística, que representamos por x i . Na segunda coluna, aparecem o número de vezes que cada valor aparece; esta coluna é chamada de frequência absoluta, que é representada por fi. Frequência absoluta (fi) do valor de xi é o número de vezes que a variável estatística assume o valor de xi. 1.3-Distribuição de frequência com intervalos de classe Variável contínua: quando a quantidade de dados é muito grande, é difícil analisar o conjunto de valores através de uma variável discreta. Portanto, os valores são agrupados em diversos intervalos para obter uma ideia geral do fato. Ao agrupar os valores de uma variável em classes, ganha-se em simplicidade, mas perde-se em detalhes. Quando os dados são organizados em uma variável contínua, são denominados dados agrupados. Para a construção de uma variável contínua, é fundamental determinar alguns elementos, tais como: • Número de classe; • Limite de classe; • Intervalo de classe; • Amplitude do Intervalo de classe; • Ponto médio de uma classe; • Amplitude total de uma sequência de dados; • Amplitude amostral. Classes: Classes de frequências são intervalos de variação da variável. As classes são representadas simbolicamente por “i”, sendo i = 1, 2, 3,..., K, onde K é o número total de classes. Intervalo de Classes: é qualquer subdivisão de uma série estatística. O intervalo de classe que tem a maior frequência é denominado de intervalo de classe modal e sua frequência é denominada de frequência de classe modal. Limites de classe: denomina-se limites de classe os extremos de cada classe. li: limite inferior da classe i LS: limite superior da classe i Amplitude de um intervalo de classe: é a medida do intervalo que define a classe. hi = LS – li Ponto médio de um intervalo de classe: Cálculos Estatístico, por Prof. Antônio Carlos Garcia 21 xi Ls l i 2 1.4-Número de classe: A primeira preocupação na construção de uma distribuição de frequência é a determinação do número de classes e consequentemente da amplitude e dos limites dos intervalos de classe. Na realidade, não existe uma regra fixa para determinar o número de classes adequado para uma distribuição. Entretanto, para minimizar as dificuldades, utiliza-se a regra de Sturges, que permite determinar, empiricamente, o número de classes em função do número de valores da variável, de acordo com a equação abaixo: K = 1 + 3,322 . log n K é o número de classes; n - Número total de dados; Calcule o número de classes através da fórmula k = n X max X min Podemos utilizar uma fórmula prática: h , onde n é o número de dados. n O número de classes deve ser um número inteiro, logo, quando preciso, o arredondamento deve ser feito para o inteiro superior. Decidido o número de classes, pode-se determinar a amplitude de um intervalo de classe de acordo com a equação abaixo: Quando o valor de H não for exato, deve-se arredondar para o inteiro superior. Exemplo de uma tabela de Frequência com intervalo de Classes. Número de horas semanais trabalhadas por operários em uma determinada empresa: 41,41,42,43,44,44,44,45,46,48, 49,49,50,52,53,57,57,58,58,60 , sendo k = 20 5 e h = 60 - 41 3,8 4 . Representaremos por |____ o intervalo de cada classe. Por exemplo: 5 |____10 é o intervalo de 5 classe que compreende todos os valores entre r inclusive e 10 exclusive. Classe xi 41 |__ 45 43 45 |__ 49 47 49 |__ 53 51 53 |__ 57 55 57 |__ 61 60 fi 7 3 4 1 fri fri (%) Fi Fri Fri (%) 7/20=0,35 35 7 0,35 35 0,15 15 10 0,50 50 0,20 20 14 0,70 70 0,05 5 15 0,75 75 5 0,25 25 20 1,00 100 1,00 100 ∑ 20 EXERCÍCIOS ( do 1 ao 4 fazer em sala de aula. Do 5 ao 7 trabalho para nota) 1-Considerando altura de alunos de uma classe: Resultado das alturas (em cm) 150 154 155 156 160 161 162 164 166 169 151 155 155 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Construa uma tabela com dados agrupados em classes. a. Calcule: fi, Fi, fri, Fri, fri% e Fri%. 2- Os pesos, em Kg , de 52 estudantes estão relacionados na tabela abaixo. a) Monte a distribuição com todos os tipos de frequência. 48 51 53 54 56 57 57 58 59 60 60 62 67 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 22 49 49 51 52 52 52 53 53 53 54 56 54 56 55 57 57 57 57 57 57 58 58 58 58 59 59 59 60 60 60 61 63 68 61 64 70 61 64 72 3-Os conceitos do 1º Bimestre em Matemática dos 35 alunos da 5a Série estão anotados na seguinte tabela: C A B C A B C A E D C A C E B B E E E B B E E C B D E C C B B C A C A a. b. c. Monte a distribuição de frequência. Quantos alunos obtiveram conceito A ou B? Qual a porcentagem? Qual a % de alunos que estão com D e E? 4-Complete o que falta na distribuição de frequência abaixo: Classe xi 41 |__ 45 43 45 |__ 49 47 49 |__ 53 51 53 |__ 57 55 57 |__ 61 59 fi 7 fri fri (%) Fi Fri Fri (%) 3 4 1 5 ∑ 20 5-Abaixo, são relacionados os salários semanais (em Reais) de 60 operários de uma fábrica de sapatos. 110 120 125 136 145 150 165 172 180 185 110 120 125 140 145 155 165 172 180 190 115 120 130 140 145 158 168 175 180 190 115 120 130 140 147 158 168 175 180 195 117 120 130 140 150 160 170 175 180 196 117 123 135 142 150 163 170 178 185 197 Construir uma distribuição de frequências adequada. 6-Complete os dados que faltam na distribuição de frequência abaixo: 7- Abaixo, são relacionados a jornada semanal de 60 operários de uma fábrica, em horas trabalhadas: 35 40 41 42 43 46 48 49 50 58 35 40 41 42 43 46 49 49 50 58 36 40 41 42 43 46 49 49 57 60 36 40 41 42 43 47 49 49 57 61 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 23 37 37 41 41 41 41 42 43 43 47 49 49 58 62 45 48 49 49 58 65 Construa uma tabela com dados agrupados em classes. a. Em seguida, calcule: fi, Fi, fri, Fri, fri% e Fri%. Medidas de Tendência Central : Média , Mediana e Moda 2.1- Medidas de posição Além das tabelas e dos gráficos, que têm com objetivos organizar e dar uma imagem visual dos dados, existem certas características de uma distribuição, como o valor central e a dispersão dos valores, que podem ser resumidas por meio de certas quantidades. Exemplos destas quantidades, conhecidas por 'estatísticas' descritivas, são: a mediana, a média, o desvio padrão e a correlação. Medidas centrais: 2.1.1-MÉDIA • A média de um conjunto de n observações é a média aritmética; é a soma das observações dividida pelo seu número. Se X1,X2,X3, ...,Xn forem as n observações, n então, a média deste conjunto é: (média) X X i 1 n i . Quando os dados estão agrupados numa tabela de frequências, a soma de observações idênticas é equivalente a multiplicar esse valor, Xi, pela sua frequência fi. Assim, a média pode ser calculada através de: EXERCÍCIOS 1-Calculando a média aritmética das duas séries abaixo: a)9,7,10,12 e 8 b) 7,7,8,8,8,12,12,15 e 18 Calculando a média distinta das séries a) e b), será: A)X a= 9,2 e X b = 10,5 B) X a= 8,2 e X b = 9,5 C) X a= 7,2 e X b = 8,5 D) N.D.A D) X a= 6,2 e X b = 7,5 2- Calculando a média aritmética das seguintes distribuições a) Xi fi 4 2 5 3 Xi fi 10 2 12 5 7 4 9 1 b) 15 7 17 10 20 16 Considerando que a Média e dado por X = ∑xi .fi , calculando a média de cada distribuição, teremos: ∑ fi Cálculos Estatístico, por Prof. Antônio Carlos Garcia 24 A)X a= 9 e X b = 10,5 B) X a= 6 e X b = 16,88 C) X a= 7 e X b = 18,5 D) X a= 5 e X b = 17,5 D) N.D.A 3- Considerando os seguintes valores de uma variável X: 2 , 4 , 6 e 8. a)Calcule a média aritmética destes valores. b)Some três unidades em cada um dos valores de X e calcule a média. c)Subtraia uma unidade em cada um dos valores de X e calcule a média. d)Multiplique por 4 cada um dos valores de X e calcule a média. e)Divida por dois cada um dos valores de X e calcule a média. Comparando os resultados obtidos podemos afirmar que: A) Que não existe nenhuma relação entre as operações realizadas e os resultados obtidos e a média. B) Os resultados obtidos e a média não permite nenhuma comparação. C) É uma importante propriedade da Média aritmética, pois os resultados ficam alterados na mesma proporção das operações efetuadas. D) N.D.A 4- Na distribuição a seguir, determine a média: Classe (Estatura em cm.) (fi) N° de pessoas 120 |__ 126 6 __ 126 | 132 12 132|__138 16 138|__144 15 144|__150 7 150|__156 4 60 ∑ 2.1.2-MEDIANA A mediana é o valor típico, isto é, é o ponto central das observações quando elas estão colocadas por ordem crescente. Quando o número de observações é ímpar, o valor do meio é a mediana; quando o número de observações é par, existe um par de valores no centro e a mediana passa a ser a média aritmética desse par. Para o cálculo da mediana, podemos usar a regra: - Se existem n observações, calcule a quantidade (n + 1)/2. Coloque as observações por ordem crescente e conte do início (n+1)/2 observações. Se n for ímpar, a última contabilizada será a mediana da lista; se n for par, a quantidade (n + 1)/2 não é inteira, e tomamos a semi-soma das duas observações contíguas a esta quantidade (a anterior e a posterior) da lista. Quando os n dados estão agrupados por k classes/intervalos, podemos usar o seguinte processo para o cálculo da mediana: – calcular n/2, – calcular as frequências absolutas acumuladas das classes, – determinar o intervalo que contém a mediana. Seja M o número desse intervalo (M é um inteiro de 1 a k). A frequência acumulada dos intervalos anteriores ao do da mediana é FM−1 (frequência da classe anterior). A frequência absoluta do intervalo da mediana é fM e a acumulada é FM, e FM−1 < n/2 < FM, – calcular o número de observações que devemos tomar do intervalo da mediana e que é igual a n/2 − FM−1, – como existem fM observações no intervalo da mediana e considerando-as uniformemente distribuídas, o valor da mediana está a de distância do início do intervalo da mediana que tem amplitude igual a A e cujo limite inferior da classe mediana é liM . A é a amplitude da classe (Xmax-Xmin). Assim, Mediana =l𝑥̌ 𝑛 −𝐹𝑎𝑛𝑡 2 𝑓𝑥̌ . ℎ , onde: l𝑥̌ : limite inferior da classe mediana. n:número de elementos da distribuição. Fant: frequência acumulada da classe anterior a classe mediana. 𝑓𝑥̌: frequência da classe mediana. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 25 h: amplitude do intervalo de classe. A moda é o valor mais frequente, isto é, o valor com maior frequência entre as observações. Para o cálculo da moda, convém colocar as observações por ordem crescente para se ver qual delas ocorre mais vezes. Pode até haver mais do que uma moda. Destas medidas centrais, a média e a mediana são as mais usadas. A mediana utiliza informação relativa à ordem, não usando os valores numéricos das observações. A média, por sua vez, usa esses valores numéricos, sendo por isso a mais usada. As diferentes sensibilidades da média e da mediana a valores extremos podem ser mais visíveis usando a curva das frequências desse conjunto de dados. A moda é o valor onde a curva é mais alta. A mediana é o valor que divide a área, compreendida entre o eixo e a curva, em duas partes iguais; metade fica à esquerda da mediana e a outra metade à direita. A mediana é ponto central de uma distribuição simétrica. Numa curva normal, o ponto mais alto está no centro e a moda coincide com a mediana, e também com a média. A figura 4.2 apresenta dois casos de distribuições não simétricas e dois gráficos de distribuições simétricas. Teste 1-Calculando a mediana da seguinte série: (obs.: em quantidade ímpar, a mediana é dada por a)5,6,8,10 e15. Calculando a mediana, temos: A) 𝑋̌= 8 B) 𝑋̌= 6 C) 𝑋̌= 5 D) 𝑁. 𝐷. 𝐴 𝑛+1 2 posição): 2-FUVEST-2014. Cada uma das cinco listas dadas é uma relação de notas obtidas por seis alunos de uma turma em uma certa prova. Assinale a única lista na qual a média das notas é maior que a mediana. a) 5,5,7,8,9,10 b) 4,5,6,7,8,8 c) 5,5,5,7,7,9 d) 5,5,5,7,7,9 e) 5,5,10,10,10,10 Resolução: Média mediana 7+8 5 + 5 + 7 + 8 + 9 + 10 5,5,7,8,9,10 = 7,5 ≅ 7,33 6 4,5,6,7,8,8 (4+5+6+7+8+8)/6 ≅ 6,33 2 6+7 2 = 6,5 4,5,6,7,8,9 4+5+6+7+8+9 ≅ 6,5 6 6+7 2 = 6,5 5,5,5,7,7,9 5+5+5+7+7+9 ≅ 6,33 6 5+7 2 = 6,0 5,5,10,10,10,10 5 + 5 + 10 + 10 + 10 + 10 ≅ 8,33 6 Resposta d) Exercícios 1- 10+10 2 = 10,0 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 26 2 a b c 2.1.3-MODA Exemplo : Calcule a moda da seguinte distribuição de frequência. classes fi 10|__ 20 4 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 27 20|__ 30 30|__ 40 40|__ 50 50|__ 60 60|__ 70 6 8 17 10 5 50 ∑ ∆1 9 90 Classe modal Mo = l Mo +∆1+∆2.h = 40+9+7.10 =40+16 = 40 + 5,6 ==> Mo = 45,6 MODA-EXERCÍCIOS Cálculos Estatístico, por Prof. Antônio Carlos Garcia 28 1- 2- 3- Calcule a mediana, desta série. 4- 5- Teste 1-Calculado a Moda (Mo) da série seguinte: a)2,3,4,4,5,2,3 e 2. Vamos obter: A) Mo = 4 B) M o= 5 C) Mo =2 D) Mo =3 2-(Enem-2011-modificado)Uma equipe de especialistas do centro meteorológico de uma cidade mediu a temperatura do ambiente, sempre no mesmo horário, durante 15 dias intercalados, a partir do primeiro dia de um mês. Esse tipo de procedimento é frequente, uma vez que os dados coletados servem de referência para estudos e verificação de tendências climáticas ao longo dos meses e anos. As medições ocorridas nesse período estão indicadas no quadro Xi 13,5 14 15,5 16 18 18,5 19,5 20 21,5 fi 4 1 1 1 2 1 1 3 1 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 29 Em relação à temperatura, os valores da média, mediana e moda são, respectivamente, iguais a: a) 17°C, 17°C e 13,5°C b) 17°C, 18°C e 13,5°C c) 17°C, 13,5°C e 18°C d) 17°C, 18°C e 21,5°C e) 17°C, 13,5°C e 21,5°C Exemplo de cálculo de média, mediana e Moda: Na tabela abaixo, encontramos os salários mensais de 40 funcionários de uma empresa: SALÁRIOS EM R$ 1.800,00 2.200,00 2.600,00 3.500,00 3.800,00 4.400,00 5.000,00 8.000,00 15.000,00 Total NÚMEROS DE FUNCIONÁRIOS 2 4 4 8 2 13 4 2 1 40 A média aritmética dos salários é: Ma = 2x1.800 + 4x2.200,00 +4x 2600 + 8x3.500 + 2x3.800+ 13x4.400 + 4x50.000 +2x8.000 +1x15.000 40 Ma = 166.600 = R$ 4.165,00 40 A média aritmética é o valor que pode substituir todos os valores da variável, isto é, é o valor que a variável teria se, em vez de variável, ela fosse constante. Os salários dos 40 funcionários poderiam ser escritos como: 1.800, 1.800, 2.200, 2.200, 2.200, 2.600, 2.600, 3.500, 3.500, 3.500, 3.500, 3.500, 3.800, 3.800, 4.400, 4.400, 4.400, 4.400, 4.400, 4.400, 4.400, 5.000, 5.000, 5.000, 5.000, 20 = 40 2 2.200, 3.500, 4.400, 4.400, 8.000, 2.600, 3.500, 4.400, 4.400, 8.000, e 2.600, 3.500, 4.400, 4.400, 15.000, 21 = 40 + 2 2 O salário que ocupa a 20a posição é R$ 3.800,00, o que ocupa a 21a posição é R$ 4.400,00. A mediana é: Md = 3.800 + 4.400 = R$ 4.100,00 2 Neste caso, a mediana não figura entre os dados originais. Se a empresa tivesse 41 funcionários com a tabela abaixo de salários mensais Cálculos Estatístico, por Prof. Antônio Carlos Garcia 30 SALÁRIOS EM R$ NÚMEROS DE FUNCIONÁRIOS 3 4 4 8 2 13 4 2 1 41 1.800,00 2.200,00 2.600,00 3.500,00 3.800,00 4.400,00 5.000,00 8.000,00 15.000,00 Total O termo que corresponde a mediana será 21 = 411 2 e a mediana R$ 3.800,00 ( que é o valor do próprio conjunto). Finalmente, a mediana é o valor que tem antes e depois de si igual a quantidade de dados. A moda é o valor do conjunto que aparece mais vezes, isto é, o valor ao qual esteja associado a frequência absoluta mais alta. Nos dois exemplos dos salários, a moda é M0 = R$ 4.400,00. A média aritmética, a mediana e a moda, são chamadas medidas de tendência central. Verificamos no exemplo (para 40 funcionários) que: Ma = R$ 4.165,00 Md = R$ 4.100,00 Ma = R$ 4.400,00 Salários 14 12 10 8 Salários 6 4 2 0 1.800,00 2.600,00 3.800,00 5.000,00 15.000,00 Md Ma Mo Vamos construir um histograma para localizarmos as medidas de tendência central. Exercícios de Revisão 1-Calcule: a média aritmética, a mediana e moda das seguintes séries: a) 10,7,7,11,12 e 9 b) 7,7,8,8,8,12,12,15 e 18 c) 2,3; 2,7; 3,1; 2,7; 2,9 e 1,8. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 31 2-Calcule a média da distribuição de frequência. . 4- Considere os seguintes valores de uma variável x: 2, 4, 6 e 8. a) Calcule a média aritmética destes valores. b) Some 3 unidades em cada um dos valores de x e calcule a média. c) subtraia uma unidade de cada um dos valores de x e calcule a média. d) Multiplique cada um dos valores de x por 4 e calcule Número de 0 1 2 3 4 a média. erros e) Divida por dois cada um dos valores de x e calcule a Número de 20 8 5 1 2 média. páginas f) Compare os resultados obtidos nos itens b, c, d, e com o item a. O que você conclui? 5- Numa avaliação de matemática, 6 alunos obtiveram nota 5; oito alunos obtiveram 7; cinco alunos obtiver nota 9 e um aluno obteve nota 10. Qual a média das notas desses alunos? 6- A distribuição mostra o número de erros de páginas observados numa certa revista. Calcule o número médio de erros desta revista. 7-Numa empresa com 20 empregados, a distribuição dos salários é a seguinte: úmero de empregados Salários 12 8.000 5 12.000 3 20.000 10 12 15 17 20 a)Qual é o xi salário médio dos empregados dessa empresa? 2 5 7 10 16 b) A empresa fi vai contratar um diretor geral e não gostaria que a nova média superasse o maior salário atual. Qual é o salário máximo que ela pode oferecer ao diretor? 8- Calcule a mediana das seguintes séries: a) 5, 6, 8, 10 e 15 b) 27, 10, 28, 31 e 27 (Obs.: coloque antes os números em ordem crescente) c) 10, 11, 17, 15, 18, 21, 27 e 30 9- Calcule a mediana das distribuições: MEDIDAS DE DISPERSÃO Variância e Desvio padrão As medidas de dispersão servem para avaliar o quanto os dados são semelhantes, descreve então o quanto os dados distam do valor central. Vamos considerar um exemplo bem simples, as notas de dois alunos A e B. 1ª PROVA 2ª PROVA 3ª PROVA 4ª PROVA 5ª PROVA Cálculos Estatístico, por Prof. Antônio Carlos Garcia 32 ALUNO A ALUNO B 10 6 2 6 8 6 3 6 7 6 MÉDIA DO ALUNO A 𝑋̅ = (10+2+8+3+7)/5 = 30/5 = 6 MÉDIA DO ALUNO B 𝑋̅ = (6+6+6+6+6)/5 = 30/5 = 6 Analisando esta tabela, o aluno B tem resultados mais regulares que o aluno A. É isto que a variância e o desvio-padrão vai dizer para nós. Certamente, o aluno A vai ter uma variância ou o desvio padrão maior que o do aluno B. A letra sigma minúscula representa a variância. Porém, a variância é uma diferença ao quadrado e não fica fácil comparar com a média que não é uma medida ao quadrado. (𝑥 − 𝑋̅ )2 +(𝑥2 − 𝑋̅ )2 +⋯(𝑥𝑛 − 𝑋̅ )2 1 𝑛 (10− 6)2 +(2− 6 )2 +(8− 6 )2 +(3− 6 )2 +(7− 6 )2 Aluno A 5 (6− 6)2 +(6− 6 )2 +(6− 6 )2 +(6− 6 )2 +(6− 6 )2 = 16+16+4+9+1 5 Ou seja, comparar a média com a variância que não está quadrado com a variância que é uma medida ao quadrado. Aluno B 5 Para isto calcula-se o desvio padrão = √𝑣𝑎𝑟. == > do aluno A== > = √9,2 = 3,03 ≅ 3 do aluno B== > = √0 =0 Significa dizer que as notas do aluno B estão sempre muito próximo da média. Enquanto do Aluno A oscila sempre 3 para mais ou para menos em relação à média. Veja a vídeo aula: http://www.auladoguto.com.br/videoaulas-de-matematica/videoaula-estatistica-67-variancia-e-desvio-padrao-1a-parte onde é frequentemente é simplificada para ou até mesmo que significa `adicione todos os valores de '. A variância (S2) é definida como o `desvio quadrático médio da média' e é calculada de uma amostra de dados como A segunda versão é mais fácil de ser calculada, embora muitas calculadoras têm funções prontas para o cálculo de variâncias, e é raro ter que realizar todos os passos manualmente. Comumente, as calculadoras fornecerão a raiz quadrada da variância, o desvio padrão, i.e. a qual é medida nas mesmas unidades dos dados originais. Uma informação útil é que, para qualquer conjunto de dados, pelo menos 75% deles fica dentro de uma distância de 2 desvio padrão da média, isto é, entre e . Exemplo. Sete homens foram pesados, e os resultados em kg foram: 57; 62.9; 63,5; 64,1; 66,1; 67,1; 73.6. A média é a variância é , Cálculos Estatístico, por Prof. Antônio Carlos Garcia 33 e o desvio padrão é . Cálculo do Desvio Padrão em Amostras (𝝈). Utilizaremos Dp para designar desvio Padrão Dp = = √ ∑(x-x̅) 2 .fi n-1 EXERCÍCIOS 1-Calcule: a média aritmética e o desvio-padrão dos valores: a) 10, 7, 7, 11, 12 e 9 b) 7, 7, 8, 8, 8, 12, 12, 15 e 18 c) 2,3; 2,7; 3,1; 2,7; 2,9 e 1,8. 2-Calcule: a média aritmética, a variância e o desvio-padrão de: Classe xi 41 |__ 45 43 45 |__ 49 47 49 |__ 53 51 53 |__ 57 55 57 |__ 61 60 fi 𝑥𝑖. 𝑓𝑖 7 ( xi x) 2 2 ( xi x) fi 3 4 1 5 ∑ 20 ∑xi.fi = 3-Durante certo período de tempo, as taxas de juros, em %, para dez ações, foram as que a tabela abaixo registra: Ação 01 02 03 04 05 06 07 08 09 10 Taxa 2,59 2,64 2,60 2,62 2,55 2,61 2,50 2,63 2,64 2,69 Calcule: (a) a taxa média; Cálculos Estatístico, por Prof. Antônio Carlos Garcia 34 (b) a taxa mediana; (c) a taxa modal; (d) o desvio padrão das taxas. 4-Considere os dados referentes ao consumo de água, em m3, de 75 contas do município de Batatais. Consumo 0|10 10|20 20|30 30|40 40|50 50|60 Total f 2 27 19 16 7 4 75 (a) determine as frequências simples e acumuladas fri ,Fri absolutas e fri% e Fri%( relativas; (b) calcule a média aritmética do consumo de água. (c) determine o intervalo que contém a mediana. (d) calcule o valor da moda bruta. (e) encontre as medidas do desvio padrão. 5-A tabela abaixo indica o número de acidentes ocorridos com 70 motoristas de uma empresa de ônibus nos últimos 5 anos: NÚMERO DE ACIDENTES NÚMERO DE MOTORISTAS 0 1 2 3 4 5 6 7 15 11 20 9 6 5 3 1 (a) Determine o número de motoristas com menos de 1 acidente. (b) Determine o percentual de motoristas com pelo menos 3 acidentes. (c) Determine o percentual de motoristas com no máximo 2 acidentes. (d) Qual o número total de acidentes ocorrido no período? (e) Qual a média de acidentes? E a moda de acidentes? E a mediana? 6- Os dados abaixo foram colhidos de uma amostra de aves de certa espécie, onde estudou-se o tempo, em dias, que os filhotes levavam para abandonar o ninho: TEMPO NÚMERO DE (em dias) FILHOTES 5 10 14 10 15 16 15 20 18 20 25 15 25 30 7 Determine: (a) o tempo médio; (b) o intervalo que contém o valor da mediana; (c) o intervalo que contém a moda. O desvio padrão da distribuição. 7-A poluição causada por óleo em mares e oceanos estimula o crescimento de certos tipos de bactérias. Uma contagem de microorganismos presentes no petróleo (número de bactérias por 100 mililitros), em 10 porções de água do mar, indicou as seguintes medidas: 49 70 54 67 59 40 71 67 67 52 (a) Determine e interprete a média, mediana e moda. (b) Calcule o desvio padrão desses dados. 8-A tabela abaixo informa o número de pessoas atendidas de urgência no HPS de certa cidade no período de 22 dias. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 35 (a) (b) (c) (d) NÚMERO DE NÚMERO ATENDIMENTOS DE DIAS 0 4 1 7 2 8 3 2 4 1 Qual a média, a moda e a mediana dos atendimentos? Determine o desvio padrão do número de atendimentos. Desenhe o polígono de frequências relativas. Calcule e interprete o correspondente coeficiente de variabilidade. 9-As notas de estatística de uma turma estão na tabela seguinte. Nota Número alunos 1 de 2 2 6 3 9 4 12 5 14 6 9 (a) Calcule os valores da média, da mediana e da moda dessas notas. (b) Calcule o valor da variância e do desvio padrão dessas notas. Exercícios de fixação-desvio padrão. 7 5 8 4 9 1 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 36 1 1 . 1 2 . . 1 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 37 RESOLUÇÃO DE ALGUNS EXERCÍCIOS DA APOSTILA Exercícios 1) Classe 150 |__ 154 154 |__ 159 159 |__ 163 163 |__ 167 167 |__ 171 171 |__ 175 2) xi 152 156 161 165 169 173 fi fri 4 11 11 07 05 02 4/40=0,1000 ∑ 40 1,00 11/40=0,275 11/40=0,275 7/40=0,175 5/40=0,125 2/40=0,050 fri (%) Fi Fri 10 27,5 27,5 17,5 12,5 5 100 4 15 26 33 38 40 - 4/40=0,1000 0,375 0,650 0,825 0,950 1,000 - Fri (%) 10 37,5 65 82,5 95 100 - Cálculos Estatístico, por Prof. Antônio Carlos Garcia 38 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 39 Cálculos Estatístico, por Prof. Antônio Carlos Garcia 40 xi 152 156 161 165 169 173 976 Média = fi xi.fi 4 11 11 7 5 2 40 fri (%) (xi-161,02)^2 (xi-161,02)^2.fi 14165,7604 56663,0416 608 10 1716 27,5 25,2004 277,2044 1771 27,5 0,0004 0,0044 1155 17,5 15,800625 110,604375 845 12,5 63,600625 318,003125 346 5 143,400625 286,80125 14413,76308 57655,65915 6441 Variância= 100 14413,76308 161,025 Dp = 6,002898214 Atividade: Propor para sala coletar média de duas salas de aulas de uma mesma disciplina e calcular as medidas de dispersão analisando os resultados. Coleta e apuração de dados: É a observação e registro da categoria ou medida de variáveis relacionadas ao objeto de estudo que ocorrem em unidades (indivíduos) de uma amostra ou população. Noção Informal de Probabilidade Experimento Aleatório É aquele experimento que quando repetido em iguais condições, pode fornecer resultados diferentes, ou seja, são resultados explicados ao acaso. Quando se fala de tempo e possibilidades de ganho na loteria, a abordagem envolve cálculo de experimento aleatório. Espaço Amostral É o conjunto de todos os resultados possíveis de um experimento aleatório. A letra que representa o espaço amostral é S. Exemplo: a) No experimento aleatório “lançamento de uma moeda”, temos como espaço amostral o conjunto e={C,K), em que C representa a face cara e K, a face coroa. Indicamos o número de elemento de E pelo símbolo n(E). Assim: n(E)= 2 Fig. 1 b) No experimento “lançamento de dado”, temos como espaço amostral o conjunto E= {1,2,3,4,5,6} c) Lançando uma moeda e um dado, simultaneamente, sendo S o espaço amostral, constituído pelos 12 elementos: S = {K1, K2, K3, K4, K5, K6, R1, R2, R3, R4, R5, R6} Escreva explicitamente os seguintes eventos: A={caras e m número par aparece}, . . B={um número primo aparece}, C={coroas e um número ímpar aparecem}. Idem, o evento em que: a) A ou B ocorrem; b) B e C ocorrem; c) Somente B ocorre. Quais dos eventos A,B e C são mutuamente exclusivos Resolução: Para obter A, escolhemos os elementos de S constituídos de um K e um número par: A={K2, K4, K6}; Para obter B, escolhemos os pontos de S constituídos de números primos: B={K2,K3,K5,R2,R3,R5} Para obter C, escolhemos os pontos de S constituídos de um R e um número ímpar: C={R1,R3,R5}. (a) A ou B = AUB = {K2,K4,K6,K3,K5,R2,R3,R5} (b) B e C = B ∩ C = {R3,R5} Conceito de probabilidade Se em um fenômeno aleatório as possibilidades são igualmente prováveis, então a probabilidade de ocorrer um evento A é: Cálculos Estatístico, por Prof. Antônio Carlos Garcia 41 Por, exemplo, no lançamento de um dado, um número par pode ocorrer de 3 maneiras diferentes, dentre 6 igualmente prováveis, portanto, P = 3/6= 1/2 = 50% Dizemos que um espaço amostral S (finito) é equiprovável, quando seus eventos elementares têm probabilidades iguais de ocorrência. Em um espaço amostral equiprovável S (finito), a probabilidade de ocorrência de um evento A é sempre: Probabilidades A palavra probabilidade deriva do Latim probare (provar ou testar). Informalmente, provável é uma das muitas palavras utilizadas para eventos incertos ou conhecidos, sendo também substituida por algumas palavras, como “sorte”, “risco”, “azar”, “incerteza”, “duvidoso”, dependendo do contexto. ESPAÇO AMOSTRAL EQUIPROVÁVEL Nos espaços amostrais equiprováveis temos que os eventos possuem probabilidades iguais de ocorrência. No lançamento de um dado temos que a ocorrência de cada face é a mesma, isto é 1/6. Um dado foi lançado 500 vezes. Conforme tabela a seguir. Observe que a frequências relativa são valores muito próximos uns dos outros. Exemplo 1 Ao lançarmos por duas vezes sucessivas um dado, qual a probabilidade de, P(E)= probabilidade equiprovável. a) ocorrer 4 no primeiro lançamento e um número ímpar no segundo? Precisamos que aconteça o seguinte evento: (4,1), (4,3), (4,5). Assim, temos que a probabilidade é de 3 chances em 36. P(E) = 3/36 = 1/12. b) a multiplicação entre os números for maior que 10? (2,6), (3,4), (3,5), (3,6), (4,3), (4,4), (4,5), (4,6), (5,3), (5,4), (5,5), (5,6), (6,2), (6,3), (6,4), (6,5). P(E) = 16/36 = 4/9 Exemplo 2 Sorteando ao acaso um número de 1 a 50, qual a probabilidade de sair um múltiplo de 4? Temos que os múltiplos de 4 compreendidos entre 1 e 50, são: {4, 8, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48}, então: P(E) =12/50 = 6/25 Propriedades Importantes: Sendo E um espaço amostral finito e não vazio e A um evento de E: P1). Se A e A’ são eventos complementares, então: P( A ) + P( A' ) = 1 . P(A’ ) é o complementar de P( A) P2) P(E) = 1 P3) A probabilidade de um evento é sempre um número entre (probabilidade de evento impossível) e 1 (probabilidade do evento certo). P4) P(∅) = 0 𝑛(𝐸) P2) P(E) = 𝑛(𝐸) = 1 EXERCÍCIOS 1- Em uma reunião com n professores, será escolhido um , ao acaso, para coordenar os trabalhos ali desenvolvidos. 𝑛−4 Se a probabilidade de o escolhido ser um professor de matemática é 8 , calcular o número máximo de 𝑛−4 participante que pode haver nesta reunião. (dica: 0< 8 < 1). 2- Uma urna contém bolas coloridas. Retirando uma bola dessa urna, a probabilidade de se obter uma bola vermelha é de 0,64. Qual a probabilidade de se obter uma bola que não seja vermelha. (Dica: P( A ) + P( A' ) = 1). Cálculos Estatístico, por Prof. Antônio Carlos Garcia 42 Probabilidade Condicional Antes da realização de um experimento, é necessário que já tenha alguma informação sobre o evento que se deseja observar. Nesse caso, o espaço amostral se modifica e o evento tem a sua probabilidade de ocorrência alterada. Exemplo: Uma urna tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se ocorrer um sorteio de 2 bolas, uma de cada vez e sem reposição, qual será a probabilidade de a primeira ser vermelha e a segunda ser azul? Resolução: Com o espaço amostral S=30 bolas, considerarmos os seguintes eventos: A: vermelha na primeira retirada e P(A) = 10/30 B: azul na segunda retirada e P(B) = 20/29 Assim: P (A e B) = P(A).(B/A) = 10/30.20/29 = 20/87 Eventos independentes Dizemos que E1 e E2 e ...En-1, En são eventos independentes, quando a probabilidade de ocorrer um deles não depende do fato de os outros terem ou não terem ocorrido. Fórmula da probabilidade dos eventos independentes: P(E1 e E2 e E3 e ...e En-1 e En) = P(E1).P(E2).p(E3)...P(En) Exemplo: Uma urna tem 30 bolas, sendo 10 vermelhas e 20 azuis. Se sortearmos 2 bolas, 1 de cada vez e repondo a sorteada na urna, qual será a probabilidade de a primeira ser vermelha e a segunda ser azul? Resolução: Como os eventos são independentes, a probabilidade de sair vermelha, na primeira retirada, e azul, na segunda retirada, é igual ao produto das probabilidades de cada condição, ou seja, P (A e B) = P(A).P (B). Sendo assim, a probabilidade de sair vermelha na primeira retirada é 10/30 e a de sair azul na segunda retirada 20/30. Daí, usando a regra do produto, temos: 10/30.20/30=2/9. Teorema da soma de probabilidades Para bem entender a soma de probabilidades, ajuda dividir a questão em duas regras: a regra nº 1, para a soma de eventos mutuamente exclusivos e a regra nº 2, para a soma de eventos não mutuamente exclusivos. Eventos mutuamente exclusivos Se dois eventos não podem ocorrer ao mesmo tempo, dizemos que são mutuamente exclusivos. A ocorrência de um desses eventos exclui (impede) a ocorrência do outro. Exemplo Quando você joga um dado, só pode ocorrer uma das faces. Então se a ocorreu a face “cinco”, ficou excluída a possibilidade de ter ocorrido qualquer outra face. Regra 1 da soma (para eventos mutuamente exclusivos) Se A e B são eventos mutuamente exclusivos, a probabilidade de ocorrer A ou B é igual à soma das probabilidades de ocorrer cada um deles. Escreve-se: P(A UB) = P(A) + P(B) Exemplo Quando você joga um dado, só pode ocorrer uma das faces. Qual é a probabilidade de, em um lançamento, ocorrer 1 ou 6? Usando a regra 1 da soma, você calcula a probabilidade de ocorrer 1 e a probabilidade de ocorrer 6. Depois, soma essas probabilidades. Exemplo Imagine um pote de vidro com 11 bolinhas de diferentes cores: 3 azuis, 4 brancas, 2 vermelhas, 1 amarela, 1 verde. Qual é a probabilidade de, em uma só retirada, ocorrer bola verde ou bola amarela? Usando a regra 1 da soma, você calcula a probabilidade de ocorrer bola verde e a probabilidade de ocorrer bola amarela. Depois, soma essas probabilidades. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 43 Regra 2 da soma: eventos não mutuamente exclusivos Dois eventos A e B são não mutuamente exclusivos se eles têm pelo menos um resultado em comum. Exemplo Quando você joga um dado, só pode ocorrer uma das faces. Mas pense nos eventos: ocorrer “número ímpar” ou ocorrer “número maior do que quatro”. Esses dois eventos têm um resultado em comum: é o número cinco, que tanto pertence ao evento “número ímpar” como ao evento “número maior do que quatro”. Veja a figura ao lado: “números ímpares” estão circundados por uma elipse azul e “números maiores do que quatro” por um retângulo vermelho. Se você contar o número de resultados que correspondem ao evento “número ímpar” e o número de resultados que correspondem ao evento “número maior do que quatro”, terá contado 5 duas vezes. Regra 2 da soma (para eventos não mutuamente exclusivos) Se A e B são dois eventos não mutuamente exclusivos, há uma sobreposição, isto é, existe pelo menos um resultado de A que também é resultado de B. Então a probabilidade de ocorrer A ou B é dada pela probabilidade de A, mais a probabilidade de B, menos a probabilidade de A e B (contada duas vezes). Escreve-se: P(AU B) = P(A) + P(B) – P(A∩B) Exemplo Quando você joga um dado, só pode ocorrer uma das faces. Qual é a probabilidade de, em um lançamento, ocorrer “número ímpar” ou ocorrer “número maior do que quatro”? Usando a regra 2 da soma, você calcula a probabilidade de ocorrer “número ímpar”, a probabilidade de ocorrer “número maior do que quatro” e probabilidade de ocorrer “número ímpar maior do que quatro”. Depois, aplica a regra 2: Exemplo Uma carta será retirada ao acaso de um baralho. Qual é a probabilidade de sair um rei ou uma carta de copas? Como um baralho tem 52 cartas, das quais quatro são reis e 13 são de copas, alguém poderia pensar que a probabilidade de sair um rei ou uma carta de copas é dada pela soma Mas esta resposta está errada porque o rei de copas é tanto rei como copas. Então o rei de copas teria sido contado duas vezes – como rei e como copas. Para obter a probabilidade de sair uma sair um rei ou uma carta de copas, some as probabilidades de sair rei e sair carta de copas e subtraia a probabilidade de sair o rei de copas, contado duas vezes: Exercício É dado o conjunto de dados: 1; 2; 3; 4; 5; 6; 7; 8; 9; 10. a) Qual é a probabilidade de, ao se tomar um número ao acaso, o número ser um ímpar menor do que 4 ou um ímpar maior do que 8? b) Qual é a probabilidade de, ao se tomar um número ao acaso, o número ser um ímpar ou múltiplo de 3? Respostas: a) 3/10. b) 3/5. Observe que, na segunda retirada, foram consideradas todas as bolas, pois houve reposição. Assim, P(B/A) =P(B), porque o fato de sair bola vermelha na primeira retirada, não influenciou a segunda retirada, já que ela foi reposta na urna. Existem duas operações que envolvem acontecimentos e que são de interesse fundamental na teoria das probabilidades: a união e a intersecção. A operação união é representada por A + B e significa que pelo menos um dos acontecimentos, A ou B, ocorre. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 44 A operação intersecção é representada por AB e significa que ambos os acontecimentos A e B ocorrem. Para calcular a probabilidade p (A + B), suponha que a dos n resultados do espaço E, formam o acontecimento A; b dos n resultados, definem o acontecimento B; e c dos resultados, originam A e B. Suponha que o acontecimento A não pode ocorrer se o acontecimento B ocorrer, ou vice-versa. Estes acontecimentos dizem-se mutuamente exclusivos, isto é, nunca podem ocorrer simultaneamente , e p(AB) = 0. Assim, neste caso, temos p (A + B) = p (A) + p (B). Em relação ao acontecimento composto AB, se a ocorrência do acontecimento A não vai afetar de maneira nenhuma a ocorrência de B e vice versa, os acontecimentos dizem-se independentes. Para acontecimentos independentes p(AB) = p(A)p(B). Esta propriedade pode ser generalizada para qualquer número de acontecimentos independentes. Por vezes, é necessário calcular a probabilidade de ocorrência do acontecimento B, dado que o acontecimento A ocorreu. Esta situação pressupõe que a ocorrência de A irá afetar, de alguma maneira, a ocorrência de B; isto é, os acontecimentos A e B são dependentes. Neste caso: P (AB) = p(A) p(B/A). A quantidade p(B/A) corresponde à probabilidade condicional do acontecimento B, dado que ocorreu o acontecimento A. Esta probabilidade pode ser calculada a partir de 1. Dos 30 funcionários de uma empresa, 10 são canhotos e 25 vão de ônibus para o trabalho. Escolhendo ao acaso um desses empregados, qual a probabilidade de que ele seja canhoto e vá de ônibus para o trabalho? Considere os eventos: A : ser canhoto B : ir de ônibus para o trabalho É claro que A e B são eventos independentes, portanto um não depende em nada do outro. A probabilidade de os dois eventos (A e B) ocorrerem simultaneamente é calculada por P (A e B) = P (A) · P (B). Resposta: P (A) · P (B). = 1/3.5/6=5/18 2. No exame para tirar a carteira de motorista, a probabilidade de aprovação na prova escrita é 9/10. Depois de ser aprovado na parte teórica, há uma prova prática de direção. Para os que já passaram no exame escrito, a probabilidade de passar nessa prova prática é 2/3. Qual a probabilidade de que, escolhido um candidato ao acaso, ele seja aprovado em ambas as provas escrita e prática e tire a carteira de motorista? Considere os eventos: Os eventos não são independentes pois é preciso ser aprovado na prova escrita para fazer a prática. A: aprovação na prova escrita = 9/10 B: aprovação na prova prática de direção= 2/3 P (A e B) = P(A).P(A/B) P(A e B) = 9/10.2/3= 18/30=3/5 Distribuição normal (Gauss) A distribuição de probabilidade contínua mais importante, sob o ponto de vista da análise estatística de dados experimentais, é provavelmente a distribuição normal. A função densidade de probabilidade de uma v.a. X normal é definida por Onde: µ é a média , σ é o desvio padrão , π= 3,1415... , e = 2,7182... . A distribuição normal tem média μ e variância σ2, positiva. A figura 5 (abaixo), representa uma função de probabilidade normal típica. A figura revela uma função simétrica em relação à média μ e com a forma de um sino. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 45 Fig.5 É possível obter uma forma da distribuição normal mais conveniente, usando os seus parâmetros μ e σ (o desvio padrão) para transformar a v.a. X noutra Z de acordo com a seguinte relação: Esta nova distribuição tem média μ = 0 e variância σ 2 = 1, sendo conhecida por distribuição normal padrão ou estandardizada e tem como fórmula: Tópicos iniciais de amostragem: População: totalidade de elementos sob estudo. Apresentam uma ou mais características em comum. Supor o estudo sobre a ocorrência de sobrepeso em crianças de 7 a 12 anos no Município de São Paulo. População alvo – todas as crianças nesta faixa etária deste município. População de estudo – crianças matriculadas em escolas. Elementos: são unidades de análise; podem ser pessoas, domicílios, escolas, creches, células ou qualquer outra unidade. Amostra: é uma parte da população de estudo. Amostragem: processo para obtenção de uma amostra. Tem como objetivo estimar parâmetros populacionais. Parâmetro: Quantidade fixa de uma população. Ex.: peso médio ao nascer de crianças que nascem no município de São Paulo (μ = 3100 g); Proporção de crianças de 7 a 12 anos classificadas como obesas, no município de São Paulo (p = 12%). Estimador: é uma fórmula matemática que permite calcular um valor (estimador por ponto) ou com um conjunto de valores (estimador por intervalo) para um parâmetro. Ex.: Média aritmética: Estimativa: Valor do estimador calculado em uma amostra. Estima o valor do parâmetro. Ex.: Peso médio ao nascer, calculado em uma amostra de 120.000 crianças nascidas no Município de São Paulo no ano de 2000: média amostral = x = 3000g . Indicações para utilizar uma amostra: População muito grande; Processo destrutivo de investigação; Novas terapias. Vantagens de realizar um estudo com amostragem: Menor custo; Menor tempo para obtenção dos resultados; Possibilidade de objetivos mais amplos; Dados possivelmente mais fidedignos. Desvantagens: Resultados sujeitos à variabilidade. Inferência estatística: É qualquer procedimento que se utiliza para se generalizar afirmações sobre determinada população, baseadas em dados retirados de uma amostra. Parâmetro: É a medida usada para se descrever uma característica de uma população. Estatística: É uma função dos valores amostrais. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 46 Estimação: É o processo através do qual estima-se o valor de um parâmetro de uma população com base no valor obtido em uma amostra. Hipótese: É a forma de especulação relativa a um fenômeno estudado (qualquer que seja). É qualquer afirmação sobre a distribuição de probabilidade de uma variável aleatória (afirmação sobre o parâmetro). Hipótese estatística: É uma especulação feita em relação a uma proposição, porém relativa a uma população definida. Populações e amostras: 1- Inferência estatística: Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. Você pode estar familiar com o termo `população' num sentido biológico/geológico. Em estatística, o termo não se refere necessariamente a pessoas, plantas, animais etc. Ele poderia também se referir, por exemplo, a fósseis, rochas e sedimentos num determinado local etc. A população se refere a todos os casos ou situações as quais o pesquisador quer fazer inferências ou estimativas. Diferentes pesquisadores podem querer fazer inferências acerca da concentração de poluentes num determinado lençol freático; predizer a quantidade de petróleo num poço a ser perfurado e assim por diante. Note que o investigador não está interessado em todos os aspectos da população. O pesquisador pode não estar interessado em estudar a concentração de todos os tipos de poluentes, somente alguns poluentes mais importantes para seu estudo. Uma amostra é um subconjunto da população usado para obter informação acerca do todo. Mas exatamente por quê tomamos uma amostra? Por quê não usamos a população toda? Custo alto para obter informação da população toda; Tempo muito longo para obter informação da população toda; Algumas vezes impossível, por exemplo, estudo de poluição atmosférica; Algumas vezes logicamente impossível, por exemplo, em ensaios destrutivos. Características de uma população que diferem de um indivíduo para outro e as quais temos interesse em estudar são chamadas variáveis. Exemplos são comprimento, massa, idade, temperatura, número de ocorrências etc. Cada unidade (membro) da população que é escolhido como parte de uma amostra fornece uma medida de uma ou mais variáveis, chamadas observações. 2 -Princípios de estimação: Utilizamos estimativas de uma amostra como nosso ``melhor chute'' para os verdadeiros valores populacionais. Exemplos são a média amostral, o desvio padrão amostral, a mediana amostral, os quais estimam a verdadeira média, desvio padrão e mediana da população (que são desconhecidos). Os verdadeiros (desconhecidos) valores populacionais são chamados parâmetros. Note que estatísticas são usualmente representadas por letras Romanas (por exemplo, para a média amostral, para o desvio padrão amostral), enquanto que parâmetros são usualmente representados por letras Gregas (por exemplo, para a média populacional, para o desvio padrão populacional). É claro que à medida que a amostra aumenta, mais informação nós teremos acerca da população de interesse, e portanto, mais precisa serão as estimativas dos parâmetros de interesse. 3- Obtendo uma amostra: Obtemos uma amostra para fazer inferências de uma população. Nossas inferências são válidas somente se a amostra é representativa da população. Na prática, não existe forma de garantir isto sem ter informação da população inteira para comparar com a amostra. E em tais circunstâncias, não haveria necessidade de amostragem! Ao invés disso, podemos assegurar que não existem vícios sistemáticos em nossa amostra através de uma seleção aleatória dos membros da população. Uma amostra aleatória independente é uma amostra selecionada de tal forma que todos os membros da população têm a mesma chance de serem selecionados; cada combinação possível de um dado número de membros tem a mesma chance de ser selecionada. Em princípio, a melhor forma de obter uma amostra aleatória de tamanho é ter uma lista de todos os membros da população, dar a todos um número digamos de 1 a e, então, escolher aleatoriamente números de 1 a para definir a amostra. É claro que na prática isto não é exequível, especialmente quando a população é infinita. Na maioria dos casos, é difícil obter amostras aleatórias. Considere o seguinte diagrama que mostra a `população' de círculos. Pense neles como se fossem grânulos de tamanhos diferentes. O diâmetro médio destes círculos é mm. Cálculos Estatístico, por Prof. Antônio Carlos Garcia 47 Se usarmos um desvio padrão em torno da média (Z = 1), a chance de erro ao estimar a média será de 31,74%. Mas, se usarmos dois (Z = 2), a chance de erro será de 4,56%. População Finita e Infinita: Na estatística, a população é classificada como finita e infinita. População finita: nesses casos, o número de elementos de um grupo não é muito grande, a entrevista e a análise das informações devem abordar a todos do grupo. Por exemplo: As condições das escolas particulares na cidade de Goiânia. Se observarmos o grupo, chegaremos à conclusão de que o número de escolas particulares em Goiânia é considerado finito. População infinita: o número de elementos nesse caso é muito elevado, sendo considerado infinito. Por exemplo: A população da cidade de São Paulo. Amostra diz respeito a um subconjunto da população, fração ou uma parte do grupo. Em alguns casos, seria impossível entrevistar todos os elementos de uma população, pois levaria muito tempo para concluir o trabalho ou até mesmo seria financeiramente inviável; dessa forma, o número de entrevistados corresponde a uma quantidade determinada de elementos do conjunto, uma amostra. Amostragem de populações finitas: Consideremos uma população P constituída por N indivíduos. Designemos por X a característica em estudo que supomos assumir os seguintes valores A1 ,A2, AN, ,..., para todos os elementos da população. Estimação da proporção em uma população; Cálculos Estatístico, por Prof. Antônio Carlos Garcia 48 BIBLIOGRAFIA:1- Coleção Cid Guelli - Osvaldo Dolce - Gelson Iezzi; 2) Coleção colegial: Rui Madsen Barbosa; 3) Coleção Colegial - Oswaldo Sangiorgi e Outros;4) Coleção Shawn - Seymour Lipschutz ; 5) Iniciação Às Estruturas Algébricas ; 6) Matemática “Temas e Metas" - Volume I,II eIII –Antônio Santos Machado; 7)Matemática Aplicada Volume 1- Editora Moderna - autores : Trotta , Imenes e Jakubovic - 2º grau ;8) Proposta Curricular Para o Ensino de Matemática 2.º grau - Coordenadoria de Estudos e Normas Pedagógicas - CENP - São Paulo;9) Tópicos de Estatística Básica –Editora Agbook -Autor Antonio Carlos Garcia - ano 2010 Relação de livros publicados pelo Prof. Antônio C. Garcia TÍTULOS 1. Tópicos de matemática financeira: matemática financeira 2. Tópicos de estatística básica: estatística 3. Cálculo financeiro: matemática aplicada à administração 4. Como estudar matemática: estudar matemática: guia prático 5. Jaguaretê 6. Geometria espacial: nova abordagem 7. Funções periódicas 8. Sequências, PA.PG - Funções exponencial e logarítmica 9. Matrizes determinante combinatória e números complexos: matrizes e números complexos 10.Livro de crônicas 1 11.Funções Reais 12.Geometria Analítica: resolvendo problemas 13.Fundamentos da matemática Financeira 14.Cálculos Financeiros e Estatísticos Todos os livros podem ser adquiridos pelos sites: https://agbook.com.br/authors/34296 ou https://clubedeautores.com.br/authors/34296