Universidade Federal de Minas Gerais Instituto de Ciências Exatas Bárbara Vilhena de Araújo TRABALHO DE PROGRAMAÇÃO DE COMPUTADORES 19 de Dezembro / 2012 Belo Horizonte / MG Universidade Federal de Minas Gerais Programação de Computadores Carlos Camarão de Figueiredo TRABALHO DE PROGRAMAÇÃO DE COMPUTADORES Belo Horizonte / MG 19 de Dezembro de 2012 I. Introdução Estre trabalho tem a finalidade de associar a Estatística com Programação de Computadores, demonstrando toda a importância da integração entre os cursos tanto para a vida acadêmica quanto para a vida profissional. No curso de Estatística, Programação de Computadores é uma das matérias obrigatórias, apensar de só introduzir o que é programação, é dada uma base importante que será utilizada durante todo o curso. I. Desenvolvimento Podemos definir Estatística como um conjunto de técnicas para tratamento de dados, essas técnicas são utilizadas para extrair o máximo de informações possível e se chegar a uma conclusão. A necessidade de uma maior formalização nos métodos utilizados, fez com que, com o decorrer dos anos e com as novas tecnologias a Estatística se desenvolvesse numa outra direção. Devido às facilidades computacionais, os Estatísticos preocupam-se cada vez mais com a necessidade de desenvolver métodos de análise e exploração dos dados, com isso percebemos a grande importância do conhecimento em computação na carreira de um Estatístico. Ainda estamos no início de nossa formação, mas já nos foi dito inúmeras vezes que todo grande Estatístico deve ser também um grande programador. Apenas se formar e Estatística não garante nosso sucesso profissional, devemos ser completos, ou seja, ter conhecimento o suficiente para nos destacarmos no mercado de trabalho, que está bem competitivo. Durante o segundo período há uma matéria chamada Seminários em que são apresentados aos alunos vários ramos que a Estatística pode ser aplicada, o conhecimento em Programação foi exposto na maioria das palestras. Vários programas que são utilizados para tratamento de dados necessitam do conhecimento de algumas linguagens computacionais. O ‘R’ por exemplo, é um programa estatístico que é utilizado para facilitar a construção de gráficos e de analisar dados de características de qualidade. A linguagem do ‘R’ é orientada a objetos: variáveis, dados, matrizes, entre outras funções, são armazenados na memória ativa do computador. Estética do ‘R’: O desenvolvimento de softwares para cálculos estatísticos objetivou o desenvolvimento de sistemas capazes de analisar variância, cruzar dados, verificar mudanças de média, se houve diferença ou semelhanças entre intervalos de tempo e todos os fatores que influenciam no resultado obtido. Outros programas também são utilizados, os mais populares são o MiniTab e o Excel, que é o mais básico e de acesso a todos, pois ele vem incluso no pacote Microsoft Office. No Excel é formado um algoritmo que define a entrada, os parâmetros e o resultado da função, ele organiza dados, realiza operações matemáticas, arredondamento, média, função máximo e mínimo, o que ajuda na análise de certos dados (banco pequeno). O MiniTab é mais complexo, ele realiza análise de regressão, variância, controle de processos estatísticos, análise de sistemas, confiabilidade, análise multivariada, métodos não-paramétricos, poder e tamanho de amostra e monta tabelas completas. Por ser mais completo, ele é mais utilizável, garantindo mais precisão na avaliação dos dados, isso ocorre também pelo banco de dados ser bem maior. Quanto maior o banco de dados, mais precisão nos resultados. Estética do MiniTab: Falando mais sobre o ‘R’: O ‘R’ não foi feito para manipulação de dados em larga escala, entretanto ele tem acesso às planilhas do Excel, e outros bancos de dados via ODBC (Opens Data Base Connectivity), que é um padrão de acesso a sistemas gerenciados de banco de dados. Com isso sua capacidade de manipular dados aumenta. Há uma grande diversidade de pacotes para o ‘R’, eles contêm funções que facilitam na análise dos dados e na aplicação da Estatística. Há pacotes básicos, que já vêm instalados no programa e há pacotes extras que podem ser encontrados no próprio programa ou no site www.r-project.org. A plataforma R fornece uma ampla variedade de técnicas estatísticas, como exemplo: modelagem linear e não linear, testes estatísticos clássicos, análise de séries temporais, classificação e agrupamento. Oferece gráficos bem-desenhados com ótima qualidade para publicação, por poderem ser produzidos incluindo símbolos matemáticos e fórmulas quando necessário. Disponibiliza opções para manipulação, armazenamento e ferramentas intermediárias para análise de dados, além de facilidades gráficas de dados visualizadas na tela ou impressas. Possui um conjunto de operadores para cálculos sobre quadros de dados, principalmente matrizes e uma linguagem de programação bem desenvolvida de forma simples e efetiva que inclui condicionais, alças, funções recursivas definidas pelo usuário, e facilidades para entrada e saída. Além de ser disponível para muitas plataformas incluindo Unix, Linux, Macintosh e Windows. A linguagem do programa é bem simples, por ser o Software Livre. Seus códigos fontes são gerenciados por um grupo chamado Core Development Team. A vantagem de ter o código aberto é que falhas podem ser detectadas e corrigidas rapidamente e atualizações podem ser disponibilizadas em uma questão de dias. Os valores numéricos ou caracteres estão dispostos em forma de matrizes, vetores ou data frame, a vírgula separa argumentos e as casas decimais são representadas por ponto, acentos, espaços e as letras maiúsculas e minúsculas são diferenciados, o símbolo “#” indica que um comentário será inserido, assim ele será ignorado pelo ‘R’ e não será salvo na memória. Alguns exemplos de comandos 1) rep(5,n) => vetor que contém n vezes o número 5. Exemplo: >rep(7,3) <ENTER> [1] 7 7 7 2)seq(a,b,c) => cria o intervalo [a,b] separado em c unidades. Exemplo: > seq(1,10,2) [1] 1 3 5 7 9 3) gl(i,r) => cria um vetor representado pela sequência de 1 até i com r repetições em cada nível. Exemplo: > gl(4,3) [1] 1 1 1 2 2 2 3 3 3 4 4 4 Levels: 1 2 3 4 rank(V) => exibe a posição de cada valor do vetor V ordenado. sort(V) => exibe os valores do vetor V em ordem crescente. Gráficos Para cada gráfico a ser formado há um comando, são eles: Esses são alguns comandos básicos utilizados para demonstrar o tipo de linguagem do ‘R’. O ‘R’ é o programa mais básico e o mais fácil de visualizar o quanto saber programar é essencial à um Estatístico. Hoje em dia a informática domina todos os ramos de atuação, com isso é necessário dedicar-se à Computação. Os programas facilitam a vida do Estatístico, poupando-os de tempo e trabalho pois se as formulas são conhecidas, não é necessário aplicá-las substancialmente em cada momento do seu trabalho, um programa pode ser feito que receba os dados e assim os cálculos podem ser feitos de acordo com as fórmulas. Programação maximiza a eficácia do trabalho. III.Conclusão Foi possível concluir com esse trabalho que saber programar é de extrema importância para qualquer Estatístico. Por exemplo, é preciso expor um trabalho e em planilhas do Excel, com os dados e exemplificar de forma sucinta as porcentagens das amostras colhidas e para isso são feitos gráficos, há como fazer um gráfico dinamico e cheio de utilidades com o visual basic que utiliza o C. FIM