Gerenciamento de Banco de Dados Profa. Sandra de Amo Apresentação da Disciplina GBC053 2012 – 2 Bacharelado em Ciência Computação Roteiro Informações Gerais sobre a dinâmica da disciplina Conteúdo da Disciplina GBC053 Objetivos gerais Critério de Avaliação Bibliografia Informações Gerais Homepage http://www.deamo.prof.ufu.br/CursoGBD2-2012-2.html Dinâmica Chamada 2 vezes 1a vez: Durante os 50 primeiros minutos 2a vez: Durante os 50 últimos minutos Aula de Exercícios – Listas Informações via email Trabalho em grupo Conteúdo da Disciplina Arquitetura de um Sistema de Gerenciamento de Banco de Dados (SGBD) – Catálogo Organização de Arquivos e Índices Armazenamento de Dados – gerenciamento de memória em disco e no buffer Indices baseados em árvores Indices baseados em hash: Hash estático; Hash Extensível; Hash Linear Processamento de Consultas Ordenação de Dados em Disco Implementação dos operadores da álgebra relacional: Seleção; Projeção; Junção; Operações com conjuntos e agregações Otimização de consultas SQL Bibliografia Database Management Systems – 3a Edição R.Ramakrishnan – J. Gehrke, 2003. Versão em portugues: Sistemas de Gerenciamento de Bancos de Dados, 2008 Sistemas de Banco de Dados – Elmasri, Navathe. Editora Pearson, 6ª edição, 2011. Sistema de Banco de Dados. A. Silberschatz, H.F. Korth, S Sudarshan. Tradução da 5a. Edição: Database Systems Concepts, Rio de Janeiro, Elsevier, 2006. Database System Implementation. Garcia-Molina, H.; Ullman, J. D.; Widom, J., Delhi-India: Pearson, 2006 Critério de Avaliação Prova 1 (P1) = 20 pontos Prova 2 (P2) = 30 pontos Prova 3 (P3) = 30 pontos Projeto (P) = 20 pontos NF = P1 + P2 + P3 + P Prova Substitutiva = somente se NF < 60 Nota final com Sub no máximo = 60 Calendário das Avaliações Prova 1 : 8 de Janeiro Prova 2 : 19 de Fevereiro Prova 3 : 9 de Abril Projeto : 11 e 12 de Abril Prova Substitutiva : 15 de Abril O que é um SGBD ? Um SGBD (Sistema Gerenciador de Banco de Dados) é um software projetado para armazenar e manipular de forma eficiente grandes quantidades de dados (banco de dados) Sistemas de Banco de Dados Sistemas de Gerenciamento de Banco de Dados (SGBD) Relacionais (SGBDR) – puramente relacionais, sem suporte para dados complexos. Orientados a Objetos (nativos) – puramente orientado a objetos (O2) Semi-estruturados nativos (XML nativo) Objeto-Relacionais (SGBDOR): a maioria das novas versões dos SGBDs comerciais atuais- têm suporte a dados semi-estruturados (XML) ARQUITETURA GERAL DE UM SGBD RELACIONAL Esquema Geral do Processador de Consultas Bloco SQL simples usuário Consulta SQL SQL Parser Transforma em Algebra Coleção de blocos simples B1, B2, ...., Bn Plano canônico Cria planos alternativos Otimizador Planos alternativos Estima custos Melhor Plano de execução Melhor Plano de execução Decompor consulta em blocos simples Um bloco SQL simples é um comando sem subconsultas aninhadas, onde aparece somente um SELECT, somente um FROM no máximo um WHERE (em FNC) no máximo um GROUP BY no máximo um HAVING Bloco simples SELECT <lista atributos> FROM <lista relações> WHERE <condição em FNC> GROUP BY HAVING Exemplo R(sid,bid,day,rname) : RESERVA S(sid,sname,rating,age) : SAILORS B(bid,bname, color) : BOAT Para cada marinheiro (sailor) com o mais alto status (rating) e que fez pelo menos 2 reservas de barcos vermelhos, dê seu identificador e a data mais recente em que fez reserva de barco vermelho. Exemplo (continuação) SELECT DISTINCT S.sid, Min (R.day) FROM Sailors S, Reservas R, Boats B WHERE S.sid = R.sid AND R.bid = B.bid AND B.color = ‘red’ AND S.rating = (SELECT MAX (S2.rating) FROM Sailors S2 ) GROUP BY S.sid HAVING COUNT (*) > 1 Exemplo (continuação) Bloco 1 : bloco interno SELECT MAX (S2.rating) FROM Sailors S2 Resultado : Relação temporária T(A) Bloco 2 : bloco externo SELECT DISTINCT S.sid, Min (R.day) FROM Sailors S, Reservas R, Boats B, T WHERE S.sid = R.sid AND R.bid = B.bid AND B.color = ‘red’ AND S.rating = T.A GROUP BY S.sid HAVING COUNT (*) > 1 Bloco SQL Expressão algébrica ΠA,B,..., MIN (C) Projeção sobre os atributos do SELECT Having .... Group by ... σ condições do WHERE Seleção sobre as condições do WHERE R1 X R2 X ... X Rn Produto Cartesiano das relações do FROM Plano de Execução “Canônico” ΠA,B,...,C A,B,...,Min(C) ΠA,B,...,C Having .... Group by A σ condições do WHERE σ R1 X R2 X ... X Rn X Resultado R é ordenado O GROUP BY é executado sobre o resultado R ordenado. R1 O HAVING é aplicado para eliminar certos grupos. Funções de agregação são executadas sobre os grupos finais R2 Rn O que é um plano de execução ? Plano de execução correspondente à uma expressão algébrica E Sequência de operações equivalente à expressão E, isto é, produzindo o mesmo resultado que E. Para cada operação da sequência (projeção, seleção, junção), um algoritmo é especificado para implementar tal operação. Exemplo Π Projeção com ordenação Π Projeção com ordenação σ Seleção usando indice B+tree no atributo A σ Seleção usando indice Hash no atributo B X Hash Join R S X Sort Merge Join R S Objetivos principais da disciplina Estudar os algoritmos utilizados para executar cada um dos operadores do SQL – os utilizados pelos principais SGBDs comerciais Entender as estruturas de dados utilizadas pelos diferentes algoritmos (indices) Entender como os dados em disco e no buffer pool são manipulados pelos algoritmos Estudar os métodos utilizados pelos otimizadores para gerar os planos de consultas e escolher o melhor plano. Profissionais a que é direcionado... Programadores Desenvolvedores de SGBDs Administrador de BD (DBA)