26 3. Análise estatística para descrição dos dados ........................................................................................ 18 3.1 Representação de dados usando gráficos ..................................................................................... 18 3.2 Gráfico de Barras .......................................................................................................................... 18 Exercício: ............................................................................................................................................. 21 3.3 Gráfico de Linhas .......................................................................................................................... 23 Exercício: ............................................................................................................................................. 24 3.4 Gráfico de Setores ........................................................................................................................ 25 Exercício: ................................................................................................................................................. 3.5 Representando os dados em tabelas ............................................................................................ 27 Exemplo: Variável = via de chegada de turistas em 2009; frequência absoluta = número de chegadas de turistas pela via correspondente. ......................................................................................................... 27 Exercício .............................................................................................................................................. 28 27 3.5 Representando os dados em tabelas Para se resumir uma variável em tabela, colocamos na primeira coluna o nome da variável; na segunda coluna a frequencia com que esta variável aparece no conjunto de dados e pode-se adicionar uma terceira coluna com a frequencia relativa (%) que é obtida dividindo-se a freqüência absoluta pelo total de observações. Veja um exemplo genérico: Nome da variável Valor 1 Valor 2 ... Valor k Total Freqüência absoluta f1 f2 Freqüência relativa 100*f1/n 100*f2/n fk n 100*fk/n 100 Exemplo: Variável = via de chegada de turistas em 2009; frequência absoluta = número de chegadas de turistas pela via correspondente. Via n. chegadas de % turistas em 2009 Aérea 3.348.906 69,74% Marítima 115.705 2,41% Terrestre 1.298.972 27,05% Fluvia 38.634 0,80% Total 4.802.217 100,00% Observe que o percentual da via aérea foi obtido por (100*3348906)/4802217 = 69.73667, logo 69,74%. Analogamente se obtém os demais percentuais. Suponha que se tenha um banco de dados com as respostas de um questionário que foi aplicado a uma amostra de 14 respondentes, organize as respostas em tabelas de frequência. Respondente Usa relógio de pulso? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Sim Não Não Não Não Não Sim Não Não Não Sim Não Não Sim Possui acesso a Internet em casa? município de residência durante a semana? Sim Sim Sim Sim Sim Sim Sim Sim Não Sim Sim Sim Não Sim Rio de Janeiro Niterói Niterói Rio de Janeiro Niterói Niterói Niterói São Gonçalo Niterói Niterói São Gonçalo Niterói Nilópolis Niterói 28 Para organizar as respostas sobre o uso do relógio de pulso, organizamos a seguinte tabela de frequencia: Usa relógio de pulso frequencia % Sim Não 4 10 28,57% 71,43% Total 14 100,00% Observe que a frequência 4 para o “Sim” foi obtida observando a tabela de dados: 4 respondentes responderam sim a esta pergunta; da mesma forma que 10 pessoas responderam não. O percentual é obtido fazendo 100*4/14 e 100*10/14. O total sempre será o número de respondentes (14) e o percentual total será sempre 100%. Exercício 1- Para representar a tabela sobre o uso do relógio de pulso, o gráfico ideal é o de setores. Faça o gráfico com base na tabela. 2- Organize a tabela que representa a distribuição de respondentes que possuem internet em casa. 3- Organize a tabela sobre o município de residência durante a semana dos respondentes. 4- Qual o percentual de respondentes que residem no Rio de Janeiro, com base na tabela da questão 3? 5- Organize um gráfico de barras para representar a tabela da questão 3 6- Organize um gráfico de setores para representar a tabela da questão 2. Considere os dados de outras questões do questionário aplicado: Quantas disciplinas está cursando neste semestre? Qual a carga horária total destas disciplinas em horas por semana? 2 6 4 5 7 6 4 5 7 6 9 9 8 9 4 8 16 20 28 24 16 20 12 24 40 40 36 38 29 7- Com base nos dados acima, organize uma tabela de frequência para a quantidade de disciplinas no semestre. 8- Com base nos dados das respostas do questionário, preencha a tabela de frequência a seguir: Carga horária frequencia % de 4 a 11,9 h de 12 a 19,9h de 20 a 27,9h de 28 a 35,9h de 36 a 43,9h Total 9- Com base na tabela da questão 8, obtenha o percentual de respondentes com carga horária semanal maior ou igual a 20h. 10- Quantos respondentes possuem carga horária inferior a 12h e qual o percentual correspondente a este número? Respostas 1 x<-c(4,10) names(x)<-c("Sim","Não") porc<-round(x*100/sum(x),2) #arredonda a porcentagem para 2 dígitos significativos) rotulos<-paste("(",names(x), " ",porc,"%)",sep="") pie(x, main="Uso do relógio de pulso",labels=rotulos, col=rainbow(length(x))) 2 Internet em casa frequência % Sim Não 12 2 85,71% 14,29% Total 14 100,00% 3 Município de residência frequência Niterói Rio de Janeiro São Gonçalo 9 2 2 % 64,29% 14,29% 14,29% 30 Nilópolis 1 7,14% Total 14 100,00% 4 14,29% 5 x<-c('Niterói','Rio de Janeiro','São Gonçalo','Nilópolis') y<-c(9,2,2,1) barplot(y, names.arg=x, main='Município de residência semana',ylab='frequência',xlab='municípios', col=rainbow(length(x)),legend = y) 6 x<-c(12,2) names(x)<-c("Sim","Não") porc<-round(x*100/sum(x),2) #arredonda a porcentagem para 2 dígitos significativos) rotulos<-paste("(",names(x), " ",porc,"%)",sep="") pie(x, main="Possui internet em casa",labels=rotulos, col=rainbow(length(x))) 7 Número de disciplinas no semestre frequencia % 2 1 7,14% 4 2 14,29% 5 2 14,29% 6 3 21,43% 7 2 14,29% 8 1 7,14% 9 3 21,43% Total 14 100,00% 8 Carga horária frequencia % de 4 a 11,9 h 2 14,29% de 12 a 19,9h 3 21,43% de 20 a 27,9h 4 28,57% de 28 a 35,9h 1 7,14% de 36 a 43,9h 4 28,57% Total 14 100,00% durante a 31 9 28.57+7.14+28.57 ou seja 64.28% 10 2 respondentes, 14,29% http://portal.cnm.org.br/sites/9000/9070/Estudos/Transito/EstudoTransito-versaoconcurso.pdf http://www.professores.uff.br/luciane/images/stories/Arquivos/Rgraficos.pdf http://professorandrios.blogspot.com.br/2011/08/representacao-grafica-de-dados.html