Inteligência de Negócios USP-FEA METADADOS UNIVERSIDADE DE SÃO PAULO - FEA Fulvio Cristofoli – Nr. USP: 55.34.485 Inteligência de Negócios USP-FEA Objetivo Apresentar os principais conceitos relacionados a Metadados, suas características, exemplos, vantagens e desvantagens. Inteligência de Negócios USP-FEA Origem da Palavra O prefixo "meta" vem do grego e significa "após" ou "esse que ultrapassa”. Ele designa uma noção que sucede à uma outra, ou seja, podemos designar "a informação sobre a informação” Os metadados provêem uma descrição concisa a respeito dos dados. Os dados podem ser documentos, coleção de documentos, gráficos, tabelas, imagens, vídeos, entre tantos outros. Inteligência de Negócios USP-FEA Conceito A grande maioria dos usuários da Tecnologia da Informação já utilizou algum tipo de metadados, mesmo não tendo conhecimento do seu significado e até mesmo do seu uso. “São dados. Mas são dados que fazem referência a outros dados.” Na literatura sobre metadados, a definição mais encontrada é a de que eles representam "dados sobre dados“. Metadado é uma abstração do dado, capaz, por exemplo, de indicar se uma determinada base de dados existe, quais são os atributos de uma tabela e suas características, tais como: tamanho e/ou formato. INMON, William H. Enterprise meta data. DM Review Magazine, v. 8, n. 10, Nov. 1998. Inteligência de Negócios USP-FEA Conceito Metadados são dados que descrevem atributos de um recurso. Ele suporta um número de funções: localização, descoberta, documentação, avaliação, seleção, etc. BIEBER, Monty. Data warehousing in government. DM Review Magazine, v. 8, n.5, May 1998. Metadados fornece o contexto para entender os dados através do tempo. DESIO, Vince. Informational Metadata. Disponível na Internet. http://www.datawarehouse.com/resources/articles/desio.htm Metadados é dado associado com objetos que ajuda seus usuários potenciais a ter vantagem completa do conhecimento da sua existência ou características. MORIATY, Terry. What is Metadata? Database Programming and Design, San Mateo, v. 10, n. 7, p. 57-59, July 1997 Metadados é o instrumental para transformar dados brutos em conhecimento. RIBEIRO, Gilberto Pessanha. Metadados geoespaciais digitais. In: WORKSHOP DE BANCOS DE DADOS NÃO CONVENCIONAIS, (2. : 1995 : Niterói) Anais... Niterói, 1995 Inteligência de Negócios USP-FEA Importância Metadados é extremamente importante para o BI pois transforma dados em informação empresarial, aumentado a produtividade. Flexibilidade Produtividade As regras de negócio das aplicações alternam de forma muito rápida, o que implica no fato das aplicações precisarem ser desenvolvidas rapidamente e de forma flexível. Inteligência de Negócios USP-FEA Importância Por Exemplo: O que é o lucro? Os metadados asseguram a correta interpretação (baseada em atividades, objetos, relações e regras) do que os dados realmente significam para o negócio. É a Receita das Vendas menos os Custos de Produção. Ou é um cálculo mais complicado, como: O “Total das receitas anuais, menos A soma do custo médio real por produto, menos Overhead deduzido de cada produto acumulado da produção anual, menos Gratificações, menos Cupons de descontos, dividido por doze?“ Inteligência de Negócios USP-FEA Importância Será que todas as empresas têm a mesma compreensão de lucro? Existe somente um cálculo para o lucro? Se existem diferentes interpretações do lucro, todas as interpretações são legítimas? Se existirem várias versões para os cálculos de lucro, vários elementos devem ser criados, cada um com seu próprio nome, a definição, o conteúdo, as regras, os relacionamentos, e assim por diante. Toda esta informação contextual sobre o lucro é meta dados. Segundo Moriarty (1997), a finalidade principal dos metadados é documentar e organizar de forma estruturada os dados das organizações, com o objetivo de minimizar duplicação de esforços e facilitar a manutenção dos dados. Inteligência de Negócios USP-FEA Exemplo Versão Original Primeiro Título: For Me Título Oficial: Comme d'habitude Composição de: Claude François e Jacques Revaux Letra de: Claude François e Gilles Thibaut País: França Mês de Lançamento: Novembro Ano de Lançamento: 1967 Tamanho Música: 4:10 Nome Álbum: Comme d´habitude Gravadora: Phillips Gênero: Romântica Inteligência de Negócios USP-FEA Exemplo Versão Inglês Título: My Way Direitos autorais: Paul Anka Cantor: Frank Sinatra País: Estados Unidos Mês de Lançamento: 13 de fevereiro Ano de Lançamento: 1968 Tamanho Música: 4:04 Nome Álbum: My Way Gravadora: Reprise Records Warner Bros UK Gênero: POP Clássico Inteligência de Negócios USP-FEA Exemplo Versão Inglês Título: My Way Direitos autorais: Paul Anka Cantor: Elvis Presley País: Estados Unidos Gravação – Versão Estúdio: Junho 1971 Tamanho Música: 4:04 Nome Álbum: Walk A Mile In My Shoes Gravadora: BMG Gênero: POP Rock Inteligência de Negócios USP-FEA Exemplo Outras Versões Título: My Way Luciano Pavarotti, Plácido Domingo e José Carreras Sex Pistols Sid Vicious The Great Rock'n'Roll Swindle - 1980 Inteligência de Negócios USP-FEA Categorias de Metadados Existem duas categorias de Metadados: Metadados Técnico: é a descrição dos dados necessários pelas várias ferramentas para armazenar, manipular ou movimentar os dados. Estas ferramentas incluem banco de dados relacionais, ferramentas de desenvolvimento de aplicações, ferramentas de modelagem, ferramentas de pesquisa em banco de dados, ferramentas OLAP, etc. Por exemplo: • • • • • • • Representação de Tipos; Descrição de Conteúdo; Classificação de conteúdo; Composição de documentos; História de documentos; Localização de documentos; Estatística; etc. Algumas estratégias para integração: • Construir uma ponte proprietária entre vários produtos; • Fornecer uma solução completa de data warehouse ou de ambiente de desenvolvimento; • Criar um padrão de troca de metadados. Inteligência de Negócios USP-FEA Categorias de Metadados Metadados de negócio: é a descrição de dados necessários pelos usuários de negócio, para entender o contexto do negócio e o significado dos dados. Seu maior uso e para armazenamento de, e quando for usado para gerar regras de negócio executáveis, a definição de metadados será: “A representação de instruções de regra de negócio de acordo com o esquema de classificação que pode ser transformado em sistemas de informação do negócio.” Técnico Administração do Warehouse Negócios Inteligência de Negócios USP-FEA Tecnologias de Metadados A tecnologia de metadados está surgindo em função: • Necessidade de conhecer melhor os dados que são mantidos na organização; • Conhecer com mais detalhes os dados de outras organizações. A Catalogação dos dados propiciará uma maior utilização de metadados por usuários com múltiplos interesses. Inteligência de Negócios USP-FEA Metadados como Instrumento de Navegação Em um ambiente de BI (apoio à tomada de decisões), os metadados assumem um novo nível de importância - um novo papel: o de navegação, e não apenas documentação. Os metadados ajudam os empresários a: • • • • Localizar; Gerenciar; Compreender; e Utilizar os dados em banco de dados de BI. É FATO: Os executivos / empresários / alto escalão, normalmente não têm as competências técnicas, nem o tempo ou vontade, de “decifrar” códigos de programação. Inteligência de Negócios USP-FEA Metadados como Instrumento de Navegação Eles também não querem ficar dependentes do departamento de TI para interpretar o sentido e/o conteúdo dos dados depois de ter sido manipulada pelos programas. Ele deverá ser capaz de acessar os metadados, que passaria então para ele ou ajudaria efetivamente a navegar através do meio ambiente de BI e interpretar os dados de BI - Apoio à tomada de decisões. Inteligência de Negócios USP-FEA Contextualização na Organização As organizações que não documentam seus dados ficam sujeitas a: • • • • Superposição de esforços de coleta de dados; Superposição de manutenção de seus dados; Vulneráveis a problemas de inconsistências; Pagarão um alto custo pelo não uso ou uso impróprio dessa informação. Inteligência de Negócios USP-FEA Padronização de Metadados Algumas importâncias da padronização dos Metadados: Os esforços do líder de projeto é minimizado, por não criar seu próprio material de trabalho. As chances de sucesso do projeto e a sua qualidade aumentam. Com o uso de padrões o gerenciamento deveria ser a habilidade do líder de projeto em desenvolver produtos de alta qualidade em um ambiente controlado. Os metadados deveriam incluir a informação contextual que é necessária para gerenciar, recuperar e interpretar a informação eletrônica (LORIST e MEER, 2001) Inteligência de Negócios USP-FEA Classificações de Metadados De acordo com Moss, os componentes podem ser divididos em quatro grupos: a propriedade, características descritivas, normas e políticas, bem como as características físicas Inteligência de Negócios USP-FEA Classificações de Metadados Propriedade Os dados são propriedade da organização. No entanto, uma vez que a organização é uma entidade legal e não uma pessoa, alguém na organização deve assumir a responsabilidade e autoridade para definir políticas, determinar regras, e estabelecer normas para a organização dos dados. Captura dos Dados Sistemas fontes dos quais se extrai os dados de DW • Informações descritivas das fontes • responsabilidades • frequências de atualização • limitacões legais de cada fonte • métodos de acesso, direitos, privilégios • BDs operacionais • esquema do sistema (estruturas, restrições) • Informações Organizacionais • Regras de negócio Processo de captura • como, quando e quem • qual a plataforma sob cada sistema fonte Depuração dos metadados • tratamento dos metadados que vão ser efetivamente utilizados Inteligência de Negócios USP-FEA Classificações de Metadados Características descritivas Nome: Cada objeto de dados, elemento de dados, e do processo deverá ter um nome único. Definição: Cada objeto de dados, elemento de dados, e as empresas deveriam ter um breve processo de definição explicando o que é. Tipo e duração: A cada elemento de dados deve ter um tipo e tamanho oficial declarado. Domínio: Cada elemento de dados deve ter declarado um conjunto de valores admissíveis. Notas: Fatos adicional fatos de interesse sobre os dados ou processos . Ambiente de DW - modelo estrela • definições de dimensões e tabelas de fatos. • políticas de dimensões que evoluem. • correspondências entre as chaves. Procedência de cada dado • mapeamento do dado presente no novo ambiente. Processo de integração • transformações feitas sobre os esquemas originais. • informações de como o dado foi limpo. • quais correções e ou alterações foram realizadas. Integração dos Dados Inteligência de Negócios USP-FEA Classificações de Metadados Regras e Políticas Relação: Os dados são objetos relacionados entre si através de atividades empresariais. O repositório de metadados deve ser capaz de armazenar informações sobre esses relacionamentos. Regras empresariais e políticas empresariais: São as regras técnicas de conversão de dados, regras sobre integridade dos dados ou regras de processamento. Segurança: Requisitos de segurança aplicados aos dados, metadados, processos, bases de dados, aplicações, ferramentas, e Web sites. Limpeza: Métricas sobre a reconciliação totais de ETL e sobre a qualidade do dados. Aplicabilidade: Os novos dados são captados e inseridos, e os dados são antigos deixam de ser usados. Oportunidade: Os executivos vão querer saber quando os dados foram atualizados pela última vez. DW de acordo com a utilização de seus usuários • que usuários estão fazendo acessos e a que dados. • com que frequência. • quais são as consultas mais e menos frequentes. • quais são as consultas mais demoradas. Carga e utilização • quanto tempo levam as atualizações dos dados. • quais os responsáveis pela extração dos dados. • quando são realizadas. Funções Administrativas • que usuários podem ter acesso aos dados. Gerência do DW Inteligência de Negócios USP-FEA Classificações de Metadados Características Físicas Origem (fonte): A origem dos dados para cada elemento deve ser documentado. Localização física: Os vários componentes de metadados (por exemplo, tabelas, colunas, nomes de dados) devem ter sua origem descrita. Transformação: Os dados da origem podem ser mudados. Dependendo do processo, pode exigir regras mais complicadas que envolvem transformações editando, filtrando, combinando, separando, ou traduzindo estes dados. Derivados - Provenientes: Este armazena o local das colunas. Agregação e sumarização: Semelhante a derivação, agregação e sumarização. Todas as regras devem ser armazenados. Volume e crescimento: Documentar o tamanho e o crescimento das bases de dados em função do número de linhas e o percentual de crescimento esperado. Acesso aos Dados • descrição, interpretação dos dados. • história dos dados nas fases anteriores. • operações que podem ser realizadas sobre os dados. • cardinalidade de cada dimensão. • e todos as demais informações importantes para o processo de análise.. Inteligência de Negócios USP-FEA Classificações de Metadados Captura dos Dados Integração dos Dados Metadados Acesso aos Dados Gerência do DW Inteligência de Negócios USP-FEA Priorização de Componentes Os componentes devem ser priorizados de acordo com cada empresa e com cada projetos. ( Obrigatório - Importante - Opcional ) Inteligência de Negócios USP-FEA Alguns Desafios Enfrentados... Desafios enfrentados na implementação de um repositório de metadados: Desafios Desafios Desafios Desafios Desafios técnicos – Recursos Infra-Estrutura; Pessoais – Pessoas envolvidas; de Orçamento – Falta de investimento financeiro; de Usabilidade – Sistemas com alto grau de usabilidade; Políticos – Necessidade do comprometimento de todos os envolvidos no projeto. Inteligência de Negócios USP-FEA O Modelo Lógico O modelo lógico de metadados é um modelo que indica os objetos, as relações entre os objetos, a cardinalidade e os possíveis relacionamentos. A diferença entre um modelo lógico de um repositório de metadados e um modelo lógico de dados para uma aplicação empresarial reside na natureza dos objetos. Todos os objetos de metadados devem ter elementos que abrangem o nome, definição, tamanho e duração, a descrição do conteúdo, relacionamentos, regras comerciais, segurança, limpeza, localização física, aplicabilidade, a atualidade, volume e notas. Inteligência de Negócios USP-FEA Atividades de Análise “As atividades não precisam ser executadas de forma linear” Analisar os requisitos do repositório de metadados: Determina a priorização e requisitos específicos para o seu projeto de BI. Inteligência de Negócios USP-FEA Atividades de Análise Analisar os requisitos da interface para o repositório de metadados: Será adquirido ou construído? Permitirá interfacear com todos os sistemas e possíveis fontes de informação? Inteligência de Negócios USP-FEA Atividades de Análise Analisar o repositório de dados e o acesso aos requisitos de informação: Os dados do seu banco de dados pode ser acessado, consultado, e relatados? Identificar as necessidades de acesso ao metadados, os requisitos de segurança, e outras requisições que forem necessárias. Avalie modos de exibição alternativos, tais como Arquivos PDF, HTML, SQL entre outros. Inteligência de Negócios USP-FEA Atividades de Análise Crie o modelo lógico. Desenhe o modelo lógico como um modelo ER (entidade – relacionamento) para mostrar explicitamente as relações entre os objetos de metadados. Inteligência de Negócios USP-FEA Atividades de Análise Crie o metadados. Descreve os dados exigidos de forma detalhada. Inteligência de Negócios USP-FEA Riscos Uma vez que um dos objetivos do Sistema de apoio à tomada de decisões é eliminar inconsistências, a fonte de dados deve ser padronizada. A Padronização invariavelmente resulta em alterar muito a fonte de dados. Estas alterações devem ser documentadas. Este traço é chamado de metadados, e pessoas de negócios precisam dela para navegar eficazmente através do BI apoio à tomada de decisões ambientais. Sem metadados, os empresários terão dificuldades na compreensão e na utilização dos dados. “Imagine você dirigindo um carro durante semanas ou meses sem um mapa, descobrindo seu caminho de forma aleatória para o seu destino.” Inteligência de Negócios USP-FEA EXERCÍCIO Quais informações são necessárias na construção de um repositório para uma biblioteca? Inteligência de Negócios USP-FEA Primeiro: Lembrando que em uma biblioteca podemos ter: • Livros; • Jornais; • Revistas Científicas; • Revistas Comerciais; • CD´s; • DVD´s; • Vídeos VHS; • Vídeos Digitais; • Acessos eletrônicos à portais. Inteligência de Negócios USP-FEA Código da Biblioteca Classificação (livro, artigo, revista, etc.) Formato (digital ou impresso) Título da Obra / Artigo Gênero (área) Classificação ISBN ISSN Ano Editora (todos os dados referentes a esta editora) Autores (todos os dados referentes aos autores) Palavras Chaves Sinopse Quantidade de Páginas Tamanho do Arquivo Data de entrada no acervo Quantidade de exemplares Dados do doador (todos os dados referentes a doação) Dados da aquisição (todos os dados referentes a aquisição) Localização física da biblioteca Ala Corredor Prateleira Inteligência de Negócios USP-FEA Historiando Repositórios Os administradores têm tentado definir e organizar os metadados desde o início de 1980. A maioria dos administradores de dados utilizavam dicionários de dados genéricos (repositórios de metadados costumavam ser chamados de dicionários de dados) Poucos tentaram projetar e construir seus próprios repositórios. Alguns dicionários eram bastante sofisticados e expansíveis, além de poder armazenar e atender aos todos os requisitos. No entanto, havia muitos problemas associados a estes primeiros esforços. Inserir estes primeiros dicionários de dados exigia um esforço manual, que era moroso e enfadonho. A falta de qualificação técnica por parte da maioria dos administradores de dados impediu-os de expandir o dicionário de dados com funcionalidades personalizadas para torná-las mais úteis. Inteligência de Negócios USP-FEA Historiando Repositórios A falta de normas (ou a falta de cumprimento das normas), criaram um caminho intransponível para os administradores, pois tinham dados conflitantes e inconsistentes. OS Metadados não podem ser evitados, especialmente os metadados técnicos, pois os sistemas de gestão de dados (SGBDs) e demais ferramentas não funcionam sem ele. Inteligência de Negócios USP-FEA Algumas soluções Independentemente de qual tipo de repositório de metadados que a empresa escolher, a empresa deve ter a compreensão de que estas soluções são grandes e caras. Centralizado Descentralizado Distribuído XML Inteligência de Negócios USP-FEA Desenho do Metadados Entidade – Relacionamento = ER x Orientação a Objetos = OO ER É um modelo diagramático que descreve o modelo de dados de um sistema. Sua maior aplicação é para visualizar o relacionamento entre tabelas de um banco de dados, no qual as relações são construídas através da associação de um ou mais atributos destas tabelas. Vantagens Desvantagens Fáceis de ler e de fácil compreensão. Mudanças e melhorias podem exigir um redesenho de dados, bem como descarregá-lo e recarregá-lo no repositório de metadados. Devido à natureza intuitiva e explícita do projeto, as perguntas podem ser escritas com relativamente simplicidade. O modelo físico é bastante grande, com muitos relações tornando a arquitetura complexa. Desenhos de ER são facilmente implementáveis em estruturas de dados relacionais. Os Objetos de metadados devem ter suas relações devem ser muito bem definidas . Inteligência de Negócios USP-FEA Desenho do Metadados Entidade – Relacionamento = ER x Orientação a Objetos = OO OO Ele é baseado na composição e interação entre diversas unidades de software chamadas de objetos. Têm como meta identificar o melhor conjunto de objetos para descrever um sistema de software. O funcionamento deste sistema se dá através do relacionamento e troca de mensagens entre estes objetos. Vantagens Desvantagens São extremamente flexíveis. Não precisam redesenhar os banco de dados quando forem necessárias mudanças. Uma vez que este objeto contenha todas as instâncias (linhas) de metadados, esse quadro se tornam muito grande. Este acesso pode afetar o desempenho. Os desenhos são simplistas e, portanto, fácil de manter e implementar (crescer). As consultas são muito mais difíceis de serem escritas e exigirá muitas entradas. Requer conhecimento avançado de SQL. Os desenhos OO são de fácil implementação. Requerem um alto aprendizado. O modelo de dados físico é muito abstrato (de difícil compreensão), e as extensas regras levam tempo para entender. Inteligência de Negócios USP-FEA Comprando Quando for selecionar um repositório de metadados, você nunca deve começar com a pergunta: "Qual é o melhor produto deste tipo no mercado?" Em vez disso, começar sempre com as seguintes perguntas: Quais são as nossas necessidades? Quais os nossos requisitos em relação à: - Obrigatório (deve-se ter) - Importante (positivo ter) - Opcional (bom ter) Dos modelos existentes no mercado (se existir) faça uma comparação entre: modelo físico (concepção do produto) com seus modelo lógico de metanálise , para determinar se modelo cobre todos os requisitos de metadados que precisa. Inteligência de Negócios USP-FEA Desenhando as atividades As atividades de desenho do repositório de metadados não precisam ser executadas linearmente. • • • • Desenhar Instalar e Desenhar Desenhar o repositório de dados do metadados. testar o repositório de metadados. o processo de migração de metadados. o aplicativo de dados do metadados. Inteligência de Negócios USP-FEA Construindo as atividades Atividades associadas com o desenvolvimento do repositório de metadados. • • • • • • Construa o banco de dados do repositório de metadados. Construir e testar as interfaces de processo de migração. Construir e testar a aplicação de metadados. Teste o programa de repositório de metadados e “verifique se funciona”. Preparar o repositório de metadados para a produção. Fornecer treinamento. Finalmente deve-se documentar: • Plano dos repositórios desenvolvidos (objetivos de cada um, testes realizados, critérios de entrada e saída dos resultados esperados); • Programas e ferramentas utilizadas (todos os programas de migração de dados meta, o acesso as interfaces, ferramenta de interface, relatório, consulta de scripts, etc.); • Biblioteca utilizada (processo de migração); • Documentações (procedimentos operacionais que abrange todas as operações), instruções sobre como usar ; • Materiais de Treinamento - materiais de formação interna.