sites per capita

Propaganda
MÓDULO 1 – INTRODUÇÃO À ESTATÍSTICA 1.1.Definição de Estatística Quando estamos às vésperas de uma eleição, muitas pessoas ficam ansiosas pelos resultados das chamadas pesquisas eleitorais, muitas vezes decidindo seu voto a partir do resultado provável destas pesquisas. Há sete anos a Rede Globo de Televisão coloca no ar um programa chamado Big Brother Brasil, um jogo onde a cada semana dois participantes são levados ao chamado “paredão” e uma delas é sempre eliminada. Os sites da Internet, antes do resultado final de cada eliminação, fazem enquetes, ou pesquisas, fazendo projeções de quem será o provável eliminado a partir da votação dos internautas. Geralmente, estas projeções se confirmam. Quando o IBGE (Instituto Brasileiro de Geografia e Estatística) informa o valor da renda per capita no Brasil está noticiando ao país sua renda média por habitante. Todas estas informações só são possíveis dado a existência de uma técnica que engloba os métodos científicos para a coleta, organização, apresentação, tratamento e análise de dados, que possibilita não apenas a formulação de conclusões válidas e importantes baseadas em tais análises, como também a tomada de decisões a partir das mesmas. O objetivo da Estatística é fazer com que dados dispersos se transformem em informação valiosa.
Os gráficos acima são bastante ilustrativos da importância da estatística como instrumento matemático para análises relevantes que envolvem nosso dia­a­ dia de cidadãos comuns. Estas informações foram extraídas do relatório trimestral elaborado em dezembro de 2006 pelo BACEN (Banco Central do Brasil), e mostram as variações das taxas de inflação tanto levando em consideração os preços de atacado quanto os preços ao consumidor do ano de 2005 e 2006. Estas
informações, que nos afetam diretamente, só foram possíveis graças a utilização dos instrumentos da estatística. Estas informações e muitas outras estão disponíveis a todos. Daí a importância de entendermos e dominarmos esta técnica. 1.2. UNIVERSO, POPULAÇÃO E AMOSTRA Como dissemos acima, o objetivo da estatística é transformar dados dispersos em informação valiosa a partir da qual se possa elaborar uma série de análises e tomar diversas decisões. Mas poderíamos então nos perguntar: onde e como obteríamos estes dados? Qual seria a base de coleta de dados para uma determinada observação relevante? Assim, denominamos universo ao conjunto de possíveis elementos a serem observados e de onde obteríamos os dados. Por exemplo, o universo dos macacos. Para alguns teóricos, universo e população se confundem. Já a população seria um subconjunto do universo, na medida em que se constitui de um grupo de objetos ou indivíduos com características comuns. Podemos exemplificar com a população de mico­leão dourado, a população de chipanzés, etc. A amostra, por outro lado, diz respeito a uma parte representativa da população que será examinada quando for impossível ou impraticável observar todo o grupo representado pela população. Um bom exemplo seria observar uma pequena amostra de macacos da espécie mico­leão dourado para determinar seus hábitos e seu comportamento.
Mas como então coletar os dados seja em uma determinada população ou em uma amostra definida? Na estatística, a coleta de dados pode ser feita de forma direta ou indireta. Quando o dado é obtido de uma fonte primária, ou seja, quando eu colho a informação diretamente na fonte e produzo as informações a partir disto, tem­se a forma direta. Isto é, quando entrevisto as pessoas para saber qual o candidato de sua preferência em época de eleição. Apesar de utilizar a amostragem (construo dados a partir de uma amostra), obtenho a informação diretamente da fonte. Se o dado é obtido através de uma fonte secundária, diz­se aí ter uma fonte indireta. Podemos citar como exemplo de fonte indireta os gráficos de evolução da inflação que utilizamos para ilustrar a importância da estatística. Obtemos a informação no site do Banco Central, mas este por sua vez não é a fonte da informação, este obteve a informação em parte da FGV (Fundação Getúlio Vargas), em parte do IBGE, esses sim tendo produzido os dados de inflação a partir de fontes diretas. A FGV e o IBGE são fontes indiretas para o Banco Central, e o Banco Central é fonte indireta para nós. Mas a FGV e o IBGE obtiveram os dados de fontes diretas. 1.3. OS RAMOS DA ESTATÍSTICA Quando os números são utilizados para descrever fatos temos a estatística descritiva. Esta parte da estatística procura organizar, resumir e simplificar informações complexas, a fim de torná­las de mais fácil entendimento, exposição e discussão. São exemplos de medidas da estatística descritiva a taxa de desemprego, os índices de inflação, a quilometragem média por litro de combustível, entre outros. Se, por outro lado, não há a possibilidade da descrição de fatos pela existência de circunstâncias ou experimentos que envolvam o acaso, faz­se necessária a utilização da probabilidade, outro ramo da estatística útil para este tipo de situação. Os jogos de azar, a maior parte dos jogos esportivos, a mega­sena, as decisões de marketing envolvem, em alguma medida, o acaso, e portanto, a probabilidade. Um outro ramo importante da estatística é a inferência, que se propõe a analisar e a interpretar dados que são obtidos através de uma amostra. A inferência ou amostragem tem como idéia básica extrair determinadas informações de uma parcela pequena de uma população determinada, e a partir disto fazer inferência sobre toda a população. Ou seja, a amostra deverá necessariamente representar toda a população. É preciso ter em mente que as três áreas da estatística não são separadas ou distintas, mas tendem a se entrelaçar. A descrição e o resumo dos dados tende a ser a primeira fase da análise destes dados, já a teoria e os fundamentos da amostragem se baseiam na teoria da probabilidade. 1.4. DADOS ESTATÍSTICOS
Quando se trabalha com a observação, a mensuração, a análise e a interpretação de números, esses números nos conduzirão à índices inflacionários, índices de desemprego, probabilidade de determinado candidato ganhar as eleições, etc. Estes números, portanto, serão designados dados estatísticos. Esses dados precisarão ser organizados e sumarizados para sua correta interpretação. Ora, caso os dados ainda não foram numericamente organizados e processados, eles podem se apresentar a nós com quase nenhum sentido. Estes seriam os chamados dados brutos. É o processamento e organização dos dados que os transforma em informação, enfatizando seus aspectos mais importantes. A informação, portanto, é resultado de um tratamento dos dados Para organizar e processar os dados estatísticos podemos utilizar resumos visuais e numéricos, através de gráficos, mapas, tabelas e modelos numéricos. A mensuração ou a observação de itens como índices de preços, renda mensal per capita de um Estado, etc, dão origem aos dados estatísticos. Como estes itens originam valores que tendem a apresentar um certo grau de variabilidade quando são medidos sucessivas vezes são chamados de variáveis. É importante identificar quatro tipo de variáveis: i. Variáveis Contínuas: é a variável que pode assumir qualquer valor num intervalo contínuo (dado contínuo). Exemplos: altura, peso, velocidade, etc. ii. Variáveis Discretas: em geral originam­se da contagem de itens e só podem assumir valores inteiros. Exemplos: número de alunos em sala de aula, número de professores que trabalham na escola, etc.
iii. Variáveis Nominais: são aquelas que existem com o objetivo de definir categorias, e as observações, mensurações e análises são feitas levando­se em conta estas mesmas categorias. Exemplos de categorias seriam a separação por sexo, idade, nível de escolaridade, etc. iv. Variáveis por Posto: quando existe o desejo de dispor os elementos observados segundo uma ordem de preferência ou desempenho, atribui­se valores relativos atribuídos para indicar esta ordem. Exemplo: primeiro, segundo, terceiro. As variáveis discretas e contínuas são ditas variáveis quantitativas porque envolvem dados eminentemente numéricos. Já as variáveis nominais e por posto precisam ser transformadas em valores numéricos para serem objeto da análise estatística, e são ditas variáveis qualitativas. 1.5. FORMAS INICIAIS DE TRATAMENTO DOS DADOS Em geral, quando nos propomos a buscar construir informações a partir de dados, nos deparamos inicialmente com um conjunto de dados brutos que pouco nos dizem. É preciso organizá­los minimamente para que eles comecem a fazer algum sentido, viabilizando sua análise. Uma primeira forma de organização dos dados é o chamado Rol. Obtemos o rol quando organizamos os dados brutos em ordem crescente ou decrescente de grandeza. A amplitude do rol é obtida pela diferença entre o maior e o menor número do rol. Utiliza­se o rol quando o conjunto de dados for pequeno, ou seja, for inferior a 30 observações. Por outro lado, quando se trata de um conjunto grande de dados, que seja superior a 30 observações, utilizamos a distribuição de freqüências. Consiste em organizar os dados brutos em classes, a fim de identificar o número de itens pertencentes a cada classe, denominado freqüência de classe. Os dados são assim organizados em intervalos de classes. Este assunto será melhor pormenorizado no módulo II. 1.6. NOTAÇÃO POR ÍNDICES A notação por índices é bastante utilizada na estatística, sendo assim importante que esclareçamos seu significado. O símbolo x i (onde se lê “x índice i”) irá representar qualquer um dos n valores assumidos pela variável x, x1 , x 2 , x 3 , x 4 ,..., x n . “n” é denominada índice e poderá assumir qualquer dos números entre 1, 2, 3, 4, ..., n. 1.7. NOTAÇÃO SIGMA (∑) A maioria dos processos estatísticos vai exigir o cálculo da soma de um conjunto de números. A letra maiúscula grega sigma (∑) é utilizada para representar estas somas.
Assim, se uma determinada variável y tiver os valores 3, 5, 7, 9 e 11, o ∑y será: ∑y = 3+5+7+9+11 ∑y = 35 Por outro lado, se o consumo semanal de arroz de x, durante um mês foram 2kg,4kg, 3kg, 5kg, o total consumido por x no mês teria sido: ∑x = 2+4+3+5 ∑x = 14, x teria consumido 14kg de arroz durante o mês referido. A notação sigma possui algumas propriedades que precisamos desenvolver, para facilitar os conteúdos a serem desenvolvidos posteriormente nesta disciplina. n a) åi =1 x = å x i = å x , isto significa que devemos somar as n observações de x, começando com a primeira. Por exemplo, num conjunto de dados onde x i = {2 , 4 , 6 , 8 , 10 , 12 } , onde n=6, teremos: n 6 åi x i = åi å x i = 42 x = 2 + 4 + 6 + 8 + 10 + 12 =1 i =1
Por outro lado, é possível utilizar esta notação quando se pretende analisar a soma de apenas uma parte dos dados disponibilizados, podendo­se, portanto abreviar a soma de um conjunto de dados. Desta forma, podemos ter: 3 i) x 1 + x 2 + x 3 = åi =1 x i 11 ii) x 8 + x 9 + x 10 + x 11 = åi =8 x i b) Se cada valor da variável x é multiplicado ou dividido por uma constante, temos que isso será igual ao valor da constante multiplicado ou dividido pela somatória de x.
å c. x = c . å x Assim,
4 4 x i = 4 x + 4 x + 4 x + 4 x å
i 1 2 3 4 =1 4 = 4 ( x 1 + x 2 + x 3 + x 4 ) = 4 å x i i =1 Por exemplo: se x i = {2 , 4 , 6 , 8 , 10 , 12 } ;
onde n=6; E cada valor de x é multiplicado pela constante c=2, temos:
å cx = c å x 6 6 cx i = c å x i = 2 ( 2 ) + 2 ( 4 ) + 2 ( 6 ) + 2 ( 8 ) + 2 ( 10 ) + 2 ( 12 ) = 2 ( 2 + 4 + 6 + 8 + 10 + 12 ) å
i i =1 =1 6 6 å 2 x i = 2 å x i = 2 ( 42 ) = 84 i =1 i =1 c) O somatório de uma constante c será igual ao produto da constante pelo número de vezes (n) que ela se repete. Assim, temos:
n c i = nc å
i i =
Por exemplo, se numa determinada observação o conjunto de dados de x i = {7 , 7 , 7 , 7 , 7 , 7 } , onde n=6, temos que x i é uma constante c que se repete. Então teremos: x i = c i 6 6 å xi = å c i = nc = 7 + 7 + 7 + 7 + 7 + 7 = 6 ( 7 ) = 42 i =1 i = 1
d) O somatório de uma soma ou de uma diferença de duas variáveis será igual à soma ou diferença dos somatórios individuais das duas variáveis. Assim, teremos:
n
n
n
( xi + y i ) = å x i + å y i å
i i i =1 =1 =1 n
n
n
( x i - y i ) = å x i - å y i å
i i i =1 =1 =1 Por exemplo: i X Y (X­Y) 1 8 5 3 2 3 2 1
å ( x - y ) = 9 å x - å y = 20 - 11 = 9 3 4 0 4 4 5 4 1 ­ ­ ­ ­ ∑ 20 11 9 e) O somatório de um conjunto de dados x i ao quadrado nos obriga a elevar cada elemento de x i ao quadrado para efetuar a soma. Assim, teremos: n
2 2 1 2 2 2 3 2 xi = x + x + x + ... + x n å
i =1 Por exemplo, se numa dada observação o conjunto de dados de x i = {2 , 4 , 6 , 8 , 10 } , onde n=5, teremos: 5 2
2 2 2 2 2 x i = 2 + 4 + 6 + 8 + 10 = 4 + 16 + 36 + 64 + 100 = 220 å
i =1 f) O somatório ao quadrado de um conjunto de dados será obtido pegando­ se a soma dos valores de x i e elevando­se ao quadrado. Assim, teremos: n
( å xi ) 2 = ( x 1 + x 2 + x 3 + ... + x n ) 2 i =1 Por exemplo, se temos um mesmo conjunto x i = {2 , 4 , 6 , 8 , 10 } , onde n=5, tal qual no exemplo do item e, teremos um resultado distinto. Senão vejamos: 5 ( å xi ) 2 = ( 2 + 4 + 6 + 8 + 10 ) 2 = ( 30 ) 2 = 900 i = 1
Download