Informática Documentária Definição: * (Ortega 2002) - Informática Documentária é a área da Ciência da Informação que responde pela aplicação da informática e das telecomunicações às diversas fases de produção, tratamento, armazenamento, recuperação e disseminação das informações documentárias. * Generalizando a discussão apresentada em (Rowley 2002) podemos definir a Informática Documentária como área que prioritariamente estuda os caminhos que levam à biblioteca eletrônica. O que é uma biblioteca eletrônica? Biblioteca – ambiente que disponibiliza seu acervo e seus serviços para atender às necessidades de informação de sua clientela. *Um serviço eficaz voltado para os clientes depende dos sistemas em que se apóia a prestação desses serviços, bem como da integração entre sistemas e pessoas. Biblioteca Eletrônica Definição: * (Oppenheim 1997) “uma coleção organizada e administrada de informações numa variedade de meios (texto, imagem, vídeo, som, ou suas combinações), porém todos em formato digital.” * Natureza do acervo: formato digital * (Collier 2002) “um ambiente administrado de materiais multimídia em formato digital, destinado a beneficiar uma população de usuários, estruturado para facilitar acesso a seu conteúdo e equipado com recursos de auxílio à navegação na rede global. Está ligada a um espaço físico ao qual as pessoas recorrem em busca de serviços fornecidos de forma eletrônica.” _ População definida de usuários _ Recursos de busca ou navegação _ Contempla o princípio da Universalidade de acesso (Troley 1995)? “acesso a todas as informações, em qualquer lugar, a qualquer instante.” Principais fatores para construção de bibliotecas eletrônicas: _ Fornecer acesso adequado à informação _ Preservação do patrimônio cultural _ Adoção da tecnologia da informação Biblioteca virtual ou digital difere da biblioteca eletrônica no fato de independer de local físico, sendo acessada e fornecida pelas redes de telecomunicações. * Não implica na localização física seja do usuário final, seja para a fonte. Em outras palavras, o usuário pode acessar a informação a partir de qualquer ponto e a informação estar em qualquer lugar. A biblioteca eletrônica oferece a biblioteca virtual, mas a recíproca não é verdadeira. Sistemas na Biblioteca Eletrônica Sistemas de gerenciamento de bibliotecas Sistemas de recuperação de informação Sistemas de gerenciamento de documentos [Sistemas estratégicos de informação] Sistemas de gerenciamento de bibliotecas * Sistemas que administram o acesso aos documentos em acervos de bibliotecas. * A preocupação fundamental é com a manutenção do acervo e com o paradeiro (disponibilidade e situação) dos documentos. * Concentram-se nas atividades de processamento de encomendas e aquisição de materiais, catalogação, catálogos em linha de acesso público (OPACS), controle de circulação, controle de periódicos, informação gerencial, empréstimos interbibliotecários e informação comunitária. Sistemas de recuperação da informação * Projetados para proporcionar acesso a informações e não a documentos, proporcionando acesso a informações constantes de documentos eletrônicos. _ originalmente operando sobre bases de dados bibliográficos. * Sistemas destinados a recuperação da informação: _ Sistemas de gerenciamento de documentos _ Serviços de busca em linha, na Internet e em cd-rons _ Serviços de notificação corrente _ Índices impressos Sistemas de gerenciamento de documentos * Tem como objetivo gerir a coleção de documentos internos de uma organização, pode armazenar documentos em formato eletrônico e proporcionar mecanismos apropriados de recuperação de modo que documentos sobre temas específicos sejam recuperados. Sistemas estratégicos de informação * Tem seu foco no tratamento da informação como recurso estratégico, possibilitando as empresas obterem vantagens competitivas. * Destinados à empresas e não à bibliotecas, mas podem influenciar na forma como se dá o tratamento da informação nas bibliotecas. Evolução da Biblioteca Eletrônica Recebeu e recebe influência: 1. Do melhoramento dos sistemas 2. Do efeito acumulativo do avanço dos sistemas no processamento da informação 3. Mudanças nas funções do mercado da informação 4. Dos requisitos e padrões estabelecidos pela sociedade da informação 1. Do melhoramento dos sistemas * Adoção e aperfeiçoamento das tecnologias da informação e comunicação – maior capacidade de armazenamento, processamento e transmissão de dados. * Melhoria no projeto e gerenciamento de sistemas – orientação a objeto, versões, correção de erros (bugs). * Integração de componentes de sistemas e entre sistemas – segurança, proteção dos dados, acesso controlado, sistemas abertos (interoperabilidade por troca de arquivos). * Interfaces amigáveis com o usuário – interfaces gráficas, multimídia e autoexplicativas. 2. Do efeito acumulativo do avanço dos sistemas no processamento da informação * Mais informação, comunicada a partir de * Maior variedade de _ fontes, por meio de * Maior variedade de canais, muitos dos quais oferecem * Tempos menores de resposta e retorno. * Exigência de maior competência em relação à comunicação, processamento de informação e criação de conhecimentos, já que disto dependem a competitividade e eficácia de indivíduos, organizações e sociedades. 3. Mudanças nas funções do mercado da informação * Os fatores do mercado são comprovadamente os mais importantes na determinação do acesso à informação e no papel que os profissionais da informação desempenham na facilitação desse acesso. * O produto primário da maioria dos agentes da indústria da informação é o gerenciamento da informação seja na forma de serviço (consultorias ou serviços bibliotecários) ou produto (base de dados, cadastro impresso, biblioteca virtual) que constituem meio para outras organizações alcançarem o fim. * Participantes/interessados no mercado da informação Produtores de conteúdo intelectual Autores, ilustradores, equipes de criação de multimídia Controladores de conteúdo intelectual Editores, avaliadores, críticos Disponibilizadores de conteúdo Editoras, gráficas, produtores de bases intelectual de dados Distribuidoras Livrarias, fornecedores, serviços de busca Conservadores Bibliotecas, colecionadores Redistribuidores Bibliotecas, consultores Usuários Indivíduos, instituições, coorporações 4. Dos requisitos e padrões estabelecidos pela sociedade da informação * Globalização – formação de comunidades independentes de localização geográfica, economia global (diferenciação regional, segmentação, fontes de competitividade). * Mudanças nos padrões de emprego – necessidade de flexibilização, atualização e qualificação do trabalhador. * Empresas em rede – redes de negócios * Acessibilidade à informação * Propriedade intelectual e proteção ao direito autoral * Segurança e proteção dos dados * Padrões para novas tecnologias * Conservação e controle bibliográfico dos documentos Conclusões * A Informática documentária é uma área da Ciência da Informação de grande importância para a consolidação da biblioteca eletrônica. * Os sistemas constituem a base para a construção, manutenção e funcionamento da biblioteca eletrônica. * O conceito de biblioteca eletrônica está longe de ser consolidado, e sua definição receberá influência de fatores ligados à sociedade da informação, do mercado da informação, da ciência da computação e das telecomunicações... _ Da criatividade de vocês profissionais da informação! Equipamento Sistemas Computacionais Os sistemas computacionais geralmente abrangem cinco componentes: _ Equipamento ou hardware - Os componentes físicos dos computadores. _ Programa ou software - Sequência de instruções colocadas no equipamento para controlar seu funcionamento na realização de uma tarefa. _ Base de dados - Forma como os dados são armazenados e manipulados pelos programas. _ Rede de comunicação - Interliga os computadores e permite comunicação. _ Pessoas - Utilizam e projetam os sistemas computacionais. Um computador é uma coleção de componentes que recebe dados e realizam operações lógicas e aritméticas sobre estes, de acordo com procedimentos bemdefinidos, a fim de fornecer resultados específicos. _ Um computador é um dispositivo de propósito geral e precisa ser programado para processar dados de acordo com um procedimento bem definido. _ Um computador pode emular o comportamento de outras máquinas. Computador – visão lógica Hardware x Software Hardware : elementos físicos do computador. _ Atualmente: dispositivos formados por componentes eletrônicos digitais. Software : programa. É a codificação de procedimentos (sequência de instruções) num formato interpretável por um computador que controla o processamento dos dados com o objetivo de que o computador realize uma tarefa ou resolva um problema _ Dão “vida” ao hardware, tornando-o útil na realização de atividades específicas. _ Hardware, software e funcionalidade devem ser levadas em conta na montagem e/ou atualizações de sistemas computacionais. _ O ideal é ter hardware poderoso o suficiente para executar software robusto e eficaz na realização de tarefas específicas. _ Configuração de um computador – combinação particular de equipamentos interconectados que formam o computador. Categorias de Computadores Os computadores modernos são classificados de acordo com o tamanho e desempenho: _ Computadores de mão: PDAs (Personal Digital Assistants) ou Handhelds. _ Microcomputadores: Computadores pessoais, computadores de mesa (Table PCs), notebooks (laptops). _ Estações de trabalho: Máquinas otimizadas para realizar um serviço específico (servidores Web; estações gráficas, etc.) _ Mainframes: Máquinas otimizadas para processamento de dados em larga escala. _ Supercomputadores: Máquinas otimizadas para cálculos científicos. Disponibilidade dos Computadores *Independente (Stand-alone) *Em rede: _ Servidores _ Clientes Redes de Computadores Computadores podem ser ligados em redes locais (LAN) de modo a: _ Compartilhar o uso de discos de grande capacidade; _ Compartilhar impressoras e outros dispositivos de entrada e saída; _ Compartilhar programas e dados de uso comum; _ Fornecer serviços. Computadores Digitais * Dados e programas são codificados por dígitos binários (Zero ou Um, ligado ou desligado, ausência de corrente ou presença de corrente). * O hardware lê, armazena e realiza operações sobre cadeias de bits. _ Números, caracteres, figuras, sons e instruções de programas devem ser codificados. Componentes de um Computador Memória Categoria de dispositivos com a finalidade de armazenamento de dados e instruções. Unidade de armazenamento: _ Bit: um dígito binário, podendo assumir zero ou um. Medidas de capacidade: _ BYTE: 8 bits _ KILOBYTE (KB): 210 bytes... 1024 bytes _ MEGABYTE (MB): 210 KB... “milhão” bytes _ GIGABYTE (GB): 210 MB... “bilhão” bytes _ TERABYTE (TB): 210 GB... “trilhão” bytes São classificadas: * Quanto ao acesso pela UCP: _ Memória Cache – mantém cópia de trechos da memória principal para acesso rápido e imediato. _ Memória Principal _ Memória Secundária. * Quanto a tecnologia empregada para sua construção: _ RAM – conteúdo volátil, permite leitura e escrita _ ROM – conteúdo persistente, permite somente leitura _ PROM, EPROM – conteúdo persistente, programável _ Flash – conteúdo persistente, permite leitura e escrita Memória Principal _ Armazena instruções e dados para uso imediato pela UCP. _ Consiste em uma seqüência ordenada de posições chamadas células de memória _ Os dados e instruções são codificados através de dígitos binários. _ Cada célula de memória tem um endereço único associado. O exemplo mostra uma memória com 1000 células, com endereços de 0 a 999 _ Uma célula contém partes menores denominadas bytes. _ O número de bytes em cada célula é dependente de máquina. _ Um byte contém oito bits. _ Cada bit é armazenado em um componente eletrônico chamado transistor. Memória Secundária * Fornece capacidade adicional para armazenamento. Armazena dados e instruções para uso posterior. * Consiste de unidades ou dispositivos que podem recuperar e gravar as informações fisicamente em mídias. As mídias mais comuns são: _ Discos magnéticos: discos rígidos (hard disks – hds) e Disquetes; _ Discos óticos: CD e DVD; _ Fitas magnéticas; _ Memórias flash. A informação é organizada em estruturas chamadas arquivos. Os nomes de todos os arquivos num dispositivo são listados em diretórios (pastas). * Tipos de arquivo: _ Arquivo de programa (executável): .exe, .bat; _ Arquivo de dados somente texto (conteúdo legível): .txt, .htm, .xml, .m, etc; binário (conteúdo ilegível): .zip, .doc, .bmp, .mp3, etc. Memória Principal × Memória Secundária * Memória principal é muito mais rápida e mais cara que memória secundária. * É necessário transferência de dados da memória secundária para a principal, antes de serem processados. * Dados na memória principal são voláteis e, na memória secundária, são mais permanentes. _ Memória volátil: o conteúdo armazenado se perde quando o fornecimento de energia é interrompido. Unidade Central de Processamento * Realiza o processamento e a manipulação dos dados e instruções armazenados na memória principal. * Armazena resultados de operações na memória principal e/ou secundária quando solicitado. * A conexão da UCP com outros dispositivos se dá por meio do barramento (Bus) do computador – via de dados, endereços e sinais de controle. * Unidade de Controle: Coordena todas as atividades do processador e do computador. * Unidade Lógico-Aritmética: Realiza operações aritméticas e lógicas. *Registradores: Contém cópia de instruções ou dados para uso imediato. Opera em um ciclo contínuo: _ Obtém instrução; _ Decodifica instrução; _ Executa instrução. Unidades de Entrada/Saída * Dispositivos que possibilitam a comunicação do ser humano com a máquina e transferência de dados entre máquinas. * Cada dispositivo necessita de um controlador (controller). _ Controladores: placas dedicadas que permitem controlar o dispositivo e transferir dados entre a UCP e a unidade, e entre a unidade e a memória principal. * Os controladores são conectados ao barramento do computador. Organização lógica Unidades de Entrada/Saída * Dispositivos de Entrada _ Convertem dados e informação em sinais que o computador possa entender e processar; _ Teclado, mouse, microfone acoplado a uma placa de SOM, escâner (scanner), tela sensível ao toque (touch-screen). _ Meios de entrada mais especializados: _ MICR (reconhecimento de caracteres impressos com tinta magnética); _ OCR (leitoras ópticas de caracteres); _ Leitoras de código de barras; _ OMR (leitoras ópticas de marcas); _ Mesas gráficas, mesas de digitalização, prancheta de digitalização; _ Entrada de dados por voz ou fala e por telefone; _ Cartões ou crachás magnéticos, etc. * Dispositivos de Saída _ convertem sinais digitais internamente armazenados para formas compreensíveis externamente. _ Monitor, Impressora, Caixas de Som acopladas a uma placa de SOM. * Dispositivos de Entrada e Saída: _ modem, placa de rede, equipamentos de realidade virtual. Modos de Processamento * Processamento em lotes * Processamento em linha * Multitarefa * Multiprogramação * Tempo compartilhado * Processamento distribuído * Processamento paralelo processadores vetoriais) (multiprocessamento, cluster de processadores, Estrutura da informação e programas de computador Representação de Dados e Instruções * Todo programa é representado no computador como: _ Dados a serem processados e _ Instruções sobre como os dados serão processados. * Tanto os dados quantos as instruções devem ser codificadas de uma forma que o computador possa armazená-la, interpretá-las e processá-las. _ A unidade mais simples de armazenamento que o computador pode lidar é um dígito binário (bit): Dados e instruções são representados como grupos de bits. * O bit é armazenado de forma eletrônica, magnética ou óptica, e transmitido pelas linhas de telecomunicações como sinais elétricos, magnéticos, ópticos ou sonoros. * A capacidade de armazenamento é comumente expressa em múltiplos de bytes (conjunto de 8 bits): kilobyte (Kb), megabyte (Mb), gigabyte (Gb), terabyte (Tb). * Um byte é em geral empregado para armazenar um caractere em dois importantes sistemas de códigos alfanuméricos: ASCII e o EBCDIC. * Uma palavra é um grupo de bits que é endereçável diretamente na memória principal do computador. * Uma palavra pode conter: _ Um número (inteiro ou ponto-flutuante) _ Uma instrução ao computador _ Um ou mais caracteres * Diferentes modelos de computador possuem diferentes números de bits por palavra: _ 32 bits _ 64 bits * Bit de paridade – é um bit adicional, acrescentado a cada caractere na memória do computador, para permitir que ele realize uma verificação rudimentar quanto à exatidão da representação dos dados. _ Pode representar os valores: paridade par ou ímpar. Representação dos dados * O computador digital é uma máquina discreta. _ Imprecisão e descontinuidade na representação de números reais. _ Máximo e mínimo valores reais e inteiros representáveis na máquina depende da quantidade de bits utilizados para representar os números. _ Problemas de Overflow e Underflow devem ser tratados em operações aritméticas. * Objetos como gráficos, figuras são armazenados como arquivos de imagens. * Objetos como sons são armazenados como arquivos de áudio. * Vídeos são armazenados como arquivos de imagens e som. * Há vários formatos de arquivos de imagem, som e vídeo. _ Um arquivo bitmap (.bmp) armazena a imagem fragmentada em inúmeros quadrículos, sendo registrado um valor de intensidade de cor (imagens tons de cinza) ou três valores de intensidade de cor (RGB) para cada um deles (imagens coloridas). _ Um arquivo wave (.wav) armazena o som como um gráfico de amplitude da onda sonora. Representação das Instruções * Os programas especificam como os dados são armazenados e processados para gerar saídas específicas. Consiste de um conjunto de instruções de máquina codificadas como cadeia de bits. * A execução de uma instrução de máquina pode envolver a interação de vários componentes do hardware. * O conjunto de instruções implementadas por um computador é denominado linguagem de máquina. Linguagens de programação * Linguagem de programação consiste de um conjunto elementos que serão utilizados para codificar um conjunto de ações em uma unidade lógica chamada programa. * Existem três tipos de linguagens de programação: _ Linguagem de máquina – permite a codificação binária de instruções no mesmo formato em que são armazenadas e processadas pelo computador. Permite a elaboração direta de programa-objeto, isto é, programa diretamente interpretável pelo hardware. _ Linguagem de montagem – permite a codificação de instruções por meio de mnemônicos que designam códigos de instruções e endereços de memória. Forma um programa-fonte que deve ser traduzido por um programa denominado montador (ou assembler) para programa-objeto. _ Linguagem de alto nível – permite a codificação de ações, que envolvem um conjunto de instruções de máquina, por meio de declarações e uso de elementos de alto grau de abstração (variáveis, funções, comandos condicionais e repetitivos, etc.). Forma um programa-fonte (ou código fonte) que deve ser traduzido (por um programa denominado compilador) ou interpretado (por um programa denominado interpretador) para programa-objeto. * Linguagens de alto nível são projetadas para áreas de aplicação específicas. Exemplos: Java, PHP, C++, Delphi, C#, C * Um programa-objeto pode ser armazenado como um arquivo na memória secundária do computador, e executado quando conveniente. _ Mudanças no programa-fonte não refletem mudanças no programa-objeto até uma nova compilação ou tradução. * Portabilidade x Dependende de máquina * Legibilidade e Abstração x Rapidez de processamento e eficiência de uso da máquina (memória e tempo de execução) _ Legibilidade e Abstração => Rapidez e maior segurança na programação => Programas menos propensos a erros e de fácil Manutenção * As linguagens de alto nível podem ser categorizadas em: _ Procedimental – o programa-fonte instrui o computador passo a passo sobre como executar uma tarefa. Exemplo: Java, C++, C _ Declarativa – o programa-fonte declara o que deve ser feito e a linguagem formula como fazer. Exemplo: PROLOG _ Orientada a objetos – o programa-fonte descreve classes (categorias de objetos) e suas instâncias (objetos). Objetos possuem estado e procedimentos associados. Exemplos: Java, C++ Programação * Atividade de construir programas Profissionais envolvidos na construção de programas: _ Analista de sistemas – especifica o programa a ser construído. _ Programador – cria o programa ou parte dele (módulo) como especificado pelo analista. * Ciclo de vida de um programa: _ análise de requisitos, projeto, implementação, teste, implantação, manutenção. * A programação pode ser estruturada ou orientada a objetos. Pacote de programas * Um pacote de programas é um conjunto de programas que são distribuídos como uma unidade pois executam funções específicas e relacionadas. * São três os principais pacotes de programas: _ Sistemas operacionais – gerencia o hardware e a execução de outros programas. Exemplos: Windows Vista, Windows XP, Linux, Unix. _ Programas utilitários – lidam com a manipulação, diagnóstico e recuperação de arquivos. Exemplos: Anti-vírus, compactadores, conversores. _ Programas aplicativos – lidam com a realização de tarefas orientadas à negócios. Sistemas gerenciadores de bibliotecas, processadores de texto, planilhas eletrônicas, SGBDs. Critérios para escolha de programas * Aspectos Gerais _ A experiência de outras pessoas ou grupos, custo, produtor, fornecedor * Características técnicas _ Linguagem de programação, sistema operacional, equipamento, facilidade de uso * Suporte _ Documentação, orientação de instalação e operação, treinamento, manutenção, clubes de usuários Interfaces de programas * Linguagens de comandos * Menus * Diálogos de perguntas e respostas * Formulários * Interfaces gráficas: Menus gráficos, Janelas, caixas de diálogo, caixas de confirmação, abas, caixas de texto, botões, ícones, teclas de atalho * Linguagem natural * Diálogos baseados na voz Bases de dados Introdução: * Uma base de dados consiste em um conjunto de dados relacionados. _ Exemplos: Lista Telefônica; Coleção de dados sobre as atividades de uma organização; Coleção de dados sobre artigos publicados em periódicos; Catálogo de uma biblioteca * Grande parte das bases de dados são disponibilizadas por um servidor acessível por meio de rede de telecomunicações ou em cederom. * Bases de dados são o modo como os dados são armazenados em computadores. * Banco de dados – Bases de dados construídas com tecnologia específica que permite a estruturação, armazenamento e recuperação dos dados no computador de forma independente do programa que venha acessá-la. Envolve a utilização de um pacote software específico categorizado como Sistema Gerenciador de Banco de Dados (SGBD). _ Exemplos de SGBDs: Oracle; Microsoft SQL Server; Postgre SQL; MySQL; CDS ISIS (Winisis/Microisis) * WinISIS é um sistema criado pela UNESCO especificamente para gerenciamento de dados bibliográficos. #Permite catalogar qualquer tipo de documento: Livros, Capítulos de Livros, Folhetos, Periódicos (Revistas/Jornais), Anais de Congresso, Teses/Dissertações, Fitas de Vídeo, CDROM, Materiais Especiais (Multimeios), etc. # Possui recursos avançados de indexação e recuperação de informações textuais aliado a sua velocidade. Definições Básicas: * Arquivo é uma coleção de registros similares, com relações definidas entre si. _ A base de dados pode compreender vários arquivos. * Registro é a informação contida na base de dados que diz respeito a um item. _ Numa base de dados catalográficos, um registro conteria dados de um livro. * Campo é uma unidade lógica de informação que forma um registro. _ Um campo de um registro livro seria o Título. _ Podem ser de tamanho fixo ou tamanho variável de número de caracteres. Tipos de bases de dados Bases de dados de referências e de fontes _ Constituem uma categoria de bases de dados disponíveis para os usuários da informação em âmbito público e que sejam acessadas à distância, por meio de um serviço de busca em linha, ou localmente em cd-rom. * Bases de dados de referências – remetem ou encaminham o usuário a outra fonte para que obtenha informações adicionais, ou texto completo de um documento. _ Exemplos: Bases de dados bibliográficos, bases de dados catalográficos, bases de dados referenciais. * Bases de dados de fontes – contém os dados originais e constituem um tipo de documento eletrônico. Todos os dados encontram-se disponíveis. Podem ser agrupadas, segundo o conteúdo em: 1. Bases de dados numéricos; 2. Bases de dados de texto integral; 3. Bases de dados textuais e numéricos; 4. Bases de dados multimídia. Formatos de registro bibliográfico: * Padrão de Metadados _ MARC (Machine Readable Cataloging) - http://www.loc.gov/marc/ _ Dublin Core (DC) - http://purl.org/dc _ Extensões do DC: MTD-BR (Padrão Brasileiro de Metadados de Teses e Dissertações) http://www.ibict.br/schema/ * O Formato Comum de Comunicação: (ISO2709) Estruturas de bases de dados * O desenvolvimento: _ Características de bases de dados _ Separação entre dados lógicos e físicos _ Modelagem conceitual através do Modelo Entidade-Relacionamento (ER) _ Recuperação de dados através linguagem padrão: SQL – (Structured Query Language) * Estruturas lógicas de bases de dados _ Bases de dados hierárquicas _ Bases de dados em rede _ Bases de dados relacionais _ Bases de dados multimídia _ Bases de dados orientadas a objeto