Faculdade São Luis Banco de Dados Multimídia Nomes: Ariane Bazilio Cristiano de Deus Marcos Henrique Sidinei Souza Professor Mauricio Anderson Perecim Faculdade São Luis Conteúdo Banco de Dados Multimídia ...................................................................................................... 3 Conceitos ................................................................................................................................. 3 Descrição ................................................................................................................................. 3 Arquitetura do Banco de Dados Multimídia ............................................................................. 4 Acesso (consultas, operações e etc). ........................................................................................ 7 Modelagem conceitual de dados .............................................................................................. 8 Especificidades (Tipos de Dados, Objetos Multimídia e etc.). .................................................. 9 É possível classificar os dados multimídia em: ...................................................................... 9 Exemplos de Utilização: .......................................................................................................... 10 Faculdade São Luis Banco de Dados Multimídia São Banco de Dados que manuseiam vídeos, imagens e sons. A principal particularidade desse tipo de banco de dados é que os recursos de vídeo e áudio exigem, para exibição dos dados, taxas de resgate de dados estáveis e predefinidas, por isto, são chamados de dados de mídia-contínua. Conceitos Os bancos de dados multimídia oferecem recursos que permitem que os usuários armazenem e consultem diferentes tipos de informações de multimídia, que incluem imagens (como fotos ou desenhos), clipes de vídeo (como filmes, noticiários ou vídeos caseiros), clipes de áudio (como músicas, mensagens telefônicas ou discursos) e documentos (como livros ou artigos). (ELMASRI; NAVATHE, 2011, p.650). Segundo Fluckiger, (Fluckiger, 1995) multimídia é o campo interessado na integração controlada por computador de textos, gráficos, imagens, vídeos, animações, sons e qualquer outro meio onde todo tipo de informação pode ser representada, armazenada, transmitida e processada digitalmente. Descrição Os bancos de dados multimídia passaram a ganhar interesse nos últimos anos devido aos novos tipos de informação que passaram a estar presente em vários segmentos de aplicações. Tipos de dados como textos com livres formatos, documentos web, gráficos estruturados, imagens estáticas ou com animação, voz e sons, se tornaram cada vez mais comuns no ambiente corporativo. Hoje já é possível pensar em sistemas capazes de operar com tipos de dados que possam representar imagens de impressões digitais, eletrocardiogramas, ressonância magnética e radiografias, frequentemente utilizados em hospitais ou órgãos especializados. Faculdade São Luis Os MMDS (Sistemas de Bancos de Dados Multimídia) diferem de SGBD’s (Sistema Gerenciador de Banco de dados ) convencionais em vários aspectos. Um bom MMDS deve permitir consultas baseadas no conteúdo dos documentos e para isso é importante que ele seja capaz de fazer a interpretação dos dados, com a identificação de objetos conceituais nele contido e seus relacionamentos. Enquanto nos SGBD’s convencionais a apresentação da informação é uma tarefa trivial. Arquitetura do Banco de Dados Multimídia O Banco de Dados Multimídia pode ser organizado de três maneiras, podendo ser conforme os princípios de autonomia, princípios de uniformidade e princípios de organização híbrida. A seguir será apresentados cada um desses princípios. 1. O princípio de autonomia: as imagens, os vídeos e os documentos, são organizados dentro de uma mídia - especifica para cada tipo de mídia. O princípio de autonomia 1 Faculdade São Luis 2. O princípio de uniformidade: é usada uma única estrutura "A"onde é indexado todos os tipos de mídia (imagem, vídeo, documento, auditivo, etc.). O princípio de uniformidade 1 Todas as três representações apresentam vantagens e desvantagens. A arquitetura baseada no princípio de autonomia requer a criação de algoritmos e uma estrutura de dados para cada tipo de mídia individual. Além disso, precisa-se de uma técnica que une estrutura de dados diferente. Esta poderia ser uma tarefa complexa e diligente, pois requer muito esforço computacional. Por outro lado, a criação de estruturas especializadas torna eficaz o acesso a cada mídia e uns bancos de dados multimídias organizados de acordo com o princípio de autonomia conduzem a um tempo de processamento de consulta rápido. Além disso, no caso de muitos bancos de dados legado onde estruturas de dados e algoritmos para uma mídia específica já exista, o princípio de autonomia pode ser uma boa escolha. As técnicas orientado-objeto são bem adaptadas para programar o princípio Faculdade São Luis de autonomia, tratando cada fonte de dados de mídia como um objeto, cujos métodos são acessíveis ao banco de dados multimídia global. Em contraste com o princípio de autonomia, está o principio de uniformidade que é uma estrutura de dados comum que pode armazenar informação sobre o conteúdo de imagens, vídeos, documentos, áudio, e assim por diante. Isto requer que examinemos o conteúdo de cada tipo de mídia e tentar encontrar saídas comuns entre esses tipos, e então construir um índice baseado na parte comum identificada. Na aplicação, o princípio de uniformidade foi extensivamente usado pelo dispositivo de anotações, ou metadados onde é expressada as informação sobre o conteúdo de cada fonte de mídia em uma metalinguagem comum, e estes metadados são indexado adequadamente. As principais vantagens do princípio de uniformidade são - muito fáceis programar, - e os algoritmos resultantes são rápidos. A principal desvantagem é que as anotações devem ser criadas de algum modo - manualmente ou automaticamente. Um processo de criação manual pode ser caro e pode gastar muito tempo. Além disso, algumas informações podem ser perdidas, caso se a linguagem para as anotações não for expressiva o bastante para capturar todos os aspectos do conteúdo. Por exemplo, a linguagem de anotação do conteúdo de uma imagem pode perder informações sobre a textura dos pixels individuais ou de um grupo de pixels. Assim também pode haver perdas de informações sobre algum conteúdo de áudio, como a amplitude e o sinal de frequência em certos pontos estratégicos. Um processo de criação automática, entretanto, pode ser burlado, desde que o programa de extração de conteúdo automático pode-se sujeitar a erros substanciais. O princípio de organização híbrida assume as "boas características” das duas arquiteturas vistas anteriormente, enquanto algumas das desvantagens são eliminadas. Suponha que desejamos criar um banco de dados multimídia que consiste em tipos de mídia M1,..., Mn. Consideramos o seguinte: 1. Esse tipo de mídia são fontes legada e já possui um índice e um algoritmo para manipular este índice. Neste caso, aproveita-se este índice e o algoritmo existente. 2. Esse tipo de mídia não são fontes legada e não possui nenhum índice (e consequentemente nenhum algoritmo para manipular o índice). Neste caso, será recomendado usar a aproximação de representação uniforme (a menos que a perda de informação física detalhada, como textura de pixels individuais, seja crítica à aplicação). Faculdade São Luis Assim é criado um código para executar a união de fontes de múltiplos dados usando os índices nativos. Esta aproximação conduz a uma economia de código, enquanto minimiza o esforço adicional gasto, pois são utilizados domínios de índices específicos. Por exemplo, um usuário pode fazer uma consulta que "Ache todos os clipes de imagens e áudio no qual o chefe de João e visto (imagem) e ouvido áudio falando com José". Esta consulta envolve multi-index unidos, enquanto acessa uma imagem no banco de dados (através de um índice de imagem), um áudio no banco de dados (através de um índice de áudio), e um banco de dados relacional (através de um índice relacional). Pode ser expresso como: SELECT name , image, audio FROM employee E, ImageDB I, AudioDB A WHERE E.name = "Joao"AND I CONTAINS E.boss AND A CONTAINS E.boss, AND A CONTAINS "Jose" Acesso (consultas, operações e etc). Todos os cenários acima descritos pressupõem o acesso simultâneo e em tempo real a vários tipos de dados complexos constituídos de texto, imagens, animações, vídeos e áudio. Assim, para que esses cenários se tornem realidade - e isso já está acontecendo - é necessária a existência de sistemas gerenciadores de banco de dados capazes de armazenar e gerenciar dados complexos, da mesma forma que ocorre atualmente com os sistemas de gerenciamento de banco de dados relacionais convencionais e de linguagens e interfaces capazes de processa-los. O SGBD é considerado o coração do banco de dados multimídia. Faculdade São Luis Modelagem conceitual de dados A modelagem conceitual de dados é o componente inicial de um projeto lógico de banco de dados. Diagramas de esquemas foram formalizados em 1960 por Charles Bachman. Ele usou retângulos para indicar tipos de registros e setas dirigidas a partir de um registro para outro para indicar um relacionamento um-para-muitos entre os casos de registros dos dois tipos. A entidade-relacionamento (ER) aborda a modelagem conceitual de dados. A forma de Peter Chen (1976) representar modelos ER utiliza retângulos para especificar entidades, que são de forma análoga aos registros. Também usa losango para representar os vários tipos de relacionamentos, que são diferenciados por números ou letras colocados nas linhas de conexão dos losangos para os retângulos. A linguagem de modelagem unificada (UML – United Modeling Language) foi introduzida em 1997 por Grady Booch e James Rumbaugh a tornou-se uma linguagem gráfica padrão para especificar e documentar sistemas de software em larga escala. O componente de modelagem de dados de UML (agora UML-2) tem muita similaridade com o modelo ER. Na modelagem conceitual de dados, a ênfase principal é a simplicidade e legibilidade. A meta do projeto do esquema conceitual, onde as abordagens ER e UML são muito úteis, é capturar os requisitos de dados do mundo real de uma maneira simples e significativa que seja compreensível tanto para banco de dados como para usuário final. O usuário final é a pessoa responsável por acessar o banco de dados e executar consultas e atualizações através do uso de um software SGBD, e, portanto, tem interesse no processo de projeto do banco de dados. Faculdade São Luis Especificidades (Tipos de Dados, Objetos Multimídia e etc.). Os dados multimídia são diferentes por natureza dos tradicionais dados de formato de texto ou numérico. As características dos dados multimídia causam impactos diretos ou indiretos no design do SGBD (sistema gerenciador de bancos de dados) multimídia. Dados multimídia geralmente requerem grandes volumes de memória e armazenamento. Em uma aplicação real, milhares de arquivos de diferentes formatos multimídia podem ser armazenados. As operações aplicadas a objetos multimídia também são diferentes, Por exemplo, apresentar uma imagem ou vídeo é diferente de apresentar um parágrafo de texto. Alguns tipos de dados multimídia como áudio, vídeo e animações, possuem restrições temporais que implicam na forma de armazenamento, manipulação e apresentação. É possível classificar os dados multimídia em: Texto: É o mais popular dos tipos de mídia. Está distribuído pela internet através de diversas formas, incluindo arquivos ou mensagens usando diferentes protocolos de transporte como FTP, HTTP e SMTP. Áudio: Qualquer som ou voz convertido na forma digital utilizando técnicas de amostragem e quantização. Imagem: Representa fotografias, desenhos ou pinturas digitalizadas. Gráfico: Representa desenhos ou imagens baseadas em dados ou informações. Vídeo: É uma sequencia de imagens digitalizadas ou frames, apresentadas em uma taxa. Animação: São sequencias de imagens ou gráficos, delimitados em um espaço de tempo. Faculdade São Luis Exemplos de SGBD que permitem sua implementação: - Oracle 9i; - InterMedia Audio, Video, Image Cartridge; - Oracle Context; - IBM DB2; - DB2 Image Extender; - DB2 Video Extender; - Informix; - Excalibur Image Datablade Module; - Informix Video Foundation Datablade; - Excalibur Text Datablde. Exemplos de Utilização: Aplicações em multimídia podem ser encontradas onde exista a necessidade de gerenciar Educação Saúde dados (treinamento (tele medicina, Entretenimento (jogos, local bancos vídeo e complexos. a de distância, dados sob Negócios (vídeo conferência, comércio eletrônico) de demanda, bibliotecas digitais) imagens médicas) TV interativa)