TECNOLOGIA DA INFORMAÇÃO Gildo de Almeida Leonel 2 Sistemas de gerenciamento de banco de dados • É considerado um importante pacote de software de sistemas que controla o desenvolvimento, utilização e manutenção dos bancos de dados de organizações usuárias de computadores. • Os dados são um recurso organizacional decisivo que precisa ser administrado como outros importantes ativos das empresas. A maioria das organizações não conseguiria sobreviver ou ter sucesso sem dados de qualidade sobre suas operações internas e seu ambiente externo. 3 Sistemas de gerenciamento de banco de dados • Administração de recursos de dados • atividade administrativa que aplica tecnologia de sistemas de informação como gerenciamento de bancos de dados e outras ferramentas gerenciais à tarefa de administrar os recursos de dados de uma organização para atender as necessidades de informação dos usuários. 4 Conceitos Básicos sobre Dados: • Caracter – Um caracter é o elemento de lógico mais básico dos dados. Consiste em um único símbolo alfabético, numérico ou outro. • Campo – Um campo consiste em um grupamento de caracteres. Um campo de dados representa um atributo (uma característica ou qualidade) de alguma entidade (objeto, pessoa, lugar ou evento). • Registro – Campos de dados afins são agrupados para formarem um registro. Assim, um registro representa uma coleção de atributos que descrevem uma entidade. Registros de comprimento fixo contêm um número fixo de campos de dados de comprimento fixo. Registros de campo variável contêm um número variável de campos e comprimentos de campos. 5 Conceitos Básicos sobre Dados: • Arquivo – Um grupo de registros afins é conhecido como um arquivo ou tabela de dados. Os arquivos muitas vezes são classificados pelo aplicativo para o qual são primeiramente usados, tais como um arquivo de folha de pagamento ou um arquivo de estoque, ou pelo tipo de dados que contêm, tais como um arquivo de documento ou um arquivo de imagem gráfica. 6 Conceitos Básicos sobre Dados: • Banco de Dados – Um banco de dados é um conjunto integrado de registros ou objetos logicamente afins. Um banco de dados consolida registros previamente armazenados em arquivos separados em uma fonte comum de registros de dados que fornece dados para muitas aplicações. Os dados armazenados em um banco de dados são independentes dos programas aplicativos que os utilizam e do tipo de dispositivos de armazenamento secundário nos quais estão armazenados. 7 Conceitos Básicos sobre Dados: 8 A Abordagem do Gerenciamento de Bancos de Dados é um método por meio do qual registros e objetos de dados são consolidados em bancos de dados que podem ser acessados por diferentes programas aplicativos. • Sistema de Gerenciamento de Bancos de Dados – (DBMS ou SGBD) funciona como uma interface de software entre usuários e bancos de dados. Dessa forma, o gerenciamento de bancos de dados envolve o uso de software de gerenciamento de bancos de dados para controlar como os bancos de dados são criados, consultados e mantidos para fornecerem as informações necessitadas por usuários finais e suas organizações. 9 A Abordagem do Gerenciamento de Bancos de Dados é um método por meio do qual registros e objetos de dados são consolidados em bancos de dados que podem ser acessados por diferentes programas aplicativos. • Sistema de Gerenciamento de Bancos de Dados – (DBMS ou SGBD) funciona como uma interface de software entre usuários e bancos de dados. Dessa forma, o gerenciamento de bancos de dados envolve o uso de software de gerenciamento de bancos de dados para controlar como os bancos de dados são criados, consultados e mantidos para fornecerem as informações necessitadas por usuários finais e suas organizações. 10 • A abordagem do gerenciamento de bancos de dados envolve três atividades básicas: • Atualização e manutenção de bancos de dados comuns para refletir novas transações empresariais e outros eventos que exigem mudanças nos registros de uma organização. • Fornecimento das informações requisitadas por cada aplicação do usuário final mediante o uso de aplicativos que compartilham os dados em bancos de dados comuns. • Fornecimento de uma capacidade de consulta/resposta e emissão de relatório por meio de um pacote DBMS de sorte que os usuários finais possam facilmente consultar os bancos de dados, gerar relatórios e receber respostas rápidas para seus pedidos de informações para situações específicas. Pacotes de Gerenciamento de Banco de Dados Desenvolvimento do Banco de Dados Consulta ao Banco de Dados Tarefas Básicas dos Pacotes de Gerenciamento de Bancos de Dados Manutenção do Banco de Dados Desenvolvimento de Aplicação Modelo de banco de dados: Modelo de banco de dados: Relatório de Pedido: Modelo de banco de dados: 16 Benefícios do Gerenciamento de Bancos de Dados: • Redução da duplicação de dados • Integração dos dados de forma que possam ser acessados por múltiplos programas e usuários. • Os programas não dependem do formato dos dados e do tipo de hardware de armazenamento secundário que estão sendo utilizados. • Os usuários são dotados de uma capacidade de consulta/resposta e relatório que lhes permite facilmente obter as informações de que necessitam sem terem de formular programas de computação. • A programação é simplificada, porque os programas não dependem nem do formato lógico dos dados nem da localização de seu armazenamento físico. 17 Tipos de Bancos de Dados: • Bancos de Dados Operacionais – • Esses bancos de dados armazenam dados detalhados necessários para apoiar as operações da organização como um todo. Eles também são chamados bancos de dados de área temática (Subject Area Databases, ou SADB), bancos de dados de transações e bancos de dados de produção. • São exemplos os bancos de dados de clientes, bancos de dados de pessoal, bancos de dados de estoque e outros bancos de dados contendo dados gerados pelas operações empresariais. 18 Tipos de Bancos de Dados: São necessários recursos e ferramentas especiais para analisar vastas quantidades de de dados e extraí-los de múltiplos sistemas. Entre recursos estão o Data warehousing (armazenamento de dados), o data mining (mineração de dados) e ferramentas para acessar bancos de dados internos por meio da Web. • Data Warehouse (Armazém de dados) • É um banco de dados que armazena dados correntes e históricos de potencial interesse aos tomadores de decisão de toda a empresa. Os dados originam-se de muitos sistemas operacionais centrais, como sistemas de vendas, contas de clientes e manufatura, podendo incluir ainda dados advindos de transações em sites. • O data warehouse consolidada e padroniza as informações oriundas de diferentes bancos de dados operacionais, de modo que elas possam ser usadas por toda a empresa para análise gerencial e tomada de decisões. 19 Tipos de Bancos de Dados: • Data Warehouse (Armazém de dados) • Um data warehouse armazena dados do ano em curso e de anos anteriores que foram extraídos dos vários bancos de dados operacionais e gerenciais de uma organização. • É uma fonte central de dados que foram classificados, editados, padronizados e integrados de tal forma que podem ser utilizados por gerentes e outros profissionais usuários finais ao longo de toda uma organização. • Os data warehouse podem ser subdivididos em mercados de dados [data marts], que guardam subconjuntos específicos de dados a partir do depósito. 20 Tipos de Bancos de Dados: 21 Tipos de Bancos de Dados: • Data marts – • Empresas podem montar data warehouses organizacionais, nos quais um armazém central de dados atende à organização inteira, ou podem criar armazéns menores, descentralizados, denominados data marts. • Data mart é um subconjunto de um data warehouse, no qual uma porção resumida ou altamente focalizada dos dados da organização é colocada em um banco separado destinado a um população específica de usuários. • Por exemplo, uma empresa pode desenvolver data marts de vendas e marketing par tratar informações de clientes. Um data mart em geral focaliza uma única área de interesse ou linha de negócios, de modo que pode ser montado com mais rapidez e a custo mais baixo do que um data warehouse de âmbito empresarial. 22 Inteligência empresarial: • Uma vez capturados e organizados em data warehouses e data marts, os dados ficam disponíveis para análise posteriores. O usuário conta com uma série de ferramentas para analisar essas informações e, assim, descobrir novos padrões, relacionamentos e insights úteis para orientar a tomada de decisão. • Essas ferramentas que consolidam, analisam e acessam vastas quantidades de dados para ajudar os usuários a decidir melhores escolhas empresariais são, muitas vezes, chamadas de inteligência empresarial (BI – business intelligence 23 Inteligência empresarial: • A inteligência empresarial confere às empresas a capacidade de acumular informações, adquirir conhecimento sobre clientes, concorrentes e operações internas; e mudar o comportamento de tomada de decisão a fim de alcançar maior lucratividade e outras metas corporativas. • Por exemplo, o mercado de entretenimento, uma empresa do setor de jogos, analisa continuamente dados sobre os clientes, coletados enquanto jogam nos caça-níqueis da empresa ou frequentam cassinos e hotéis da rede. O departamento de marketing da empresa utiliza essas informações para desenvolver um detalhado perfil do jogador, com base no valor ao longo do tempo de um cliente particular à empresa. Essa informação orienta as decisões administrativas sobre como cultivar os clientes mais lucrativos, estimulá-los a gastar mais e atrair mais clientes com alto potencial de geração de receita. 24 Inteligência empresarial: 25 Processamento analítico on-line (OLAP – on-line-analytical processing): • Imagine que sua empresa venda quatro produtos diferentes – porcas, pinos e parafusos -, nas regiões leste, oeste e central. • Se quisesse fazer um pergunta bem direta, como “Quantos parafusos foram vendidos durante o último trimestre?”, poderia facilmente achar a resposta consultando seu banco de dados de vendas. • Mas e se quisesse saber quantos parafusos foram vendidos em cada região e também comparar os resultados reais com a projeção de vendas? 26 Processamento analítico on-line (OLAP – on-line-analytical processing): • Para obter essa resposta, é necessário um processamento analítico on-line (OLAP). • Permite a análise multidimensional de dados, de forma que os usuários vejam os mesmos dados de diferentes maneiras, pois usa múltiplas dimensões. Cada aspecto da informação – produto, preço, custo, região ou período de tempo – representa uma dimensão diferente. • O OLAP permite que usuários obtenham respostas on-line sobre questões específicas como essas em velocidade razoável, mesmo quando os dados então armazenados em bancos gigantescos, como números de vendas de vários anos. 27 Processamento analítico on-line (OLAP – on-line-analytical processing): • Dessa forma o gerente de produto poderia utilizar uma ferramenta de análise multidimensional de dados para saber quantos parafusos foram vendidos na região leste em junho, comparar essas informações com as do mês anterior e também de junho do ano anterior e ainda confrontá-las com a previsão de vendas. 28 Banco de dados Multidimensional: 29 Data mining – mineração de dado: • O data mining fornece percepções dos dados corporativos que não podem ser obtidas com o OLAP, descobrindo padrões e relacionamentos futuros. Esses modelos e regras podem então ser utilizados par guiar o processo de decisão e prever o efeito dessas escolhas. • Os tipos de informações obtidos com o data mining incluem associações, sequências, classificações, aglomerações e prognósticos. 30 Data mining – mineração de dado: • Associações – • são ocorrências ligadas a um único evento. Por exemplo, um estudo de modelos de compra em supermercados pode revelar que, na compra de salgadinhos de milho, compra-se também refrigerante tipo cola em 65% das vezes; mas quando há uma promoção, o refrigerante é comprado em 85% das vezes. Com essa informação, os gerentes podem tomar decisões mais acertadas, pois aprenderam a respeito da rentabilidade de uma promoção. 31 Data mining – mineração de dado: • Sequência – • os eventos estão ligados ao longo do tempo. Pode-se descobrir, por exemplo, que, quando se compra uma casa, em 65% das vezes se adquire também nova geladeira no período de duas semanas; e que, em 45% das vezes, um fogão também é comprado um mês após a compra da residência. 32 Data mining – mineração de dado: • Classificação – • reconhece modelos que descrevem o grupo ao qual o item pertence, por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. • Empresas de operadores de cartões de crédito, e companhias telefônicas preocupam-se com a perda de clientes regulares. A classificação pode ajudar a descobrir as características de clientes que provavelmente virão a abandoná-las e oferecer um modelo par ajudar os gerentes a prever quem são, de modo que se elabore antecipadamente campanhas especiais para reter esse clientes. 33 Data mining – mineração de dado: • Aglomeração – • funciona de maneira semelhante à classificação quando ainda não foram definidos grupos. • Uma ferramenta de data mining descobrirá diferentes agrupamentos dentro da massa de dados; por exemplo, ao encontrar grupos de afinidade para cartões bancários ou ao dividir o banco de dados em categorias de clientes com base na demografia e em investimentos pessoais. 34 Data mining – mineração de dado: • Prognósticos – • partem de uma série de valores já existentes para prever quais serão os outros valores. • Por exemplo, um prognóstico pode descobrir padrões nos dados que ajudam os gerentes a estimar o valor futuro de variáveis como números de vendas. 35 Mas isto realmente funciona? • Uma das maiores redes de varejo dos Estados Unidos (Wal-Mart) descobriu, em seu gigantesco banco de dados, que a venda de fraldas descartáveis estava associada à de cerveja. Em geral, os compradores eram homens, que saíam à noite para comprar fraldas e aproveitavam para levar algumas latinhas para casa. Os produtos foram postos lado a lado. Resultado: a venda de fraldas e cervejas disparou. 36 Mas isto realmente funciona? • Outra rede varejista descobriu que a venda de colírios aumentava na véspera dos feriados. (Por quê? Mistério...) Passou a preparar seus estoques e promoções do produto com base nesse cenário. • O banco Itaú, pioneiro no uso de data warehouse no Brasil, costumava enviar mais de 1 milhão de malas diretas, para todos os correntistas. No máximo 2% deles respondiam às promoções. Hoje, o banco tem armazenada toda a movimentação financeira de seus 3 milhões de clientes nos últimos 18 meses. A análise desses dados permite que cartas sejam enviadas apenas a quem tem maior chance de responder. A taxa de retorno subiu para 30%. A conta do correio foi reduzida a um quinto. 37 Mas isto realmente funciona? • A Sprint, um dos líderes no mercado americano de telefonia de longa distância, desenvolveu, com base no seu armazém de dados, um método capaz de prever com 61% de segurança se um consumidor trocaria de companhia telefônica dentro de um período de dois meses. Com um marketing agressivo, conseguiu evitar a deserção de 120 000 clientes e uma perda de 35 milhões de dólares em faturamento. • Outra empresa de telefonia detectou, ao implantar seu armazém de dados, que quatro grandes clientes empresariais eram responsáveis por mais da metade das chamadas de manutenção. Um deles estava prestes a abandonar os serviços. A telefônica fez reparos imediatos, convenceu o cliente a ficar e manteve uma receita anual de 150 milhões de dólares.