Volume de informações está crescendo em todo o mundo a uma

Propaganda
MVP Virtual Conference 2013
Cenário atual no mundo dos dados e a
plataforma SQL Server
Luciano Moreira
Luciano Moreira [Luti]
@luticm
[email protected]
http://luticm.blogspot.com
SQL Server MVP | PASS RM |
MC* | MCM Wannabe
Agenda
A plataforma SQL
Server
Business
Intelligence
Cloud Computing
Big Data
Appliances
Engine Relacional
vNext
Referências
Conclusão
SQL Server
 SQL Server 4.2 – Fim do acordo com Sybase
 SQL Server 6.5 – Pequenos volumes de dados e suporte Windows NT
 SQL Server 7.0
 Mudanças arquiteturais (tamanho de página, UMS)
 Full-Text Search e DTS
 OLAP Services
 SQL Server 2000
 Entrando no mundo Enterprise
 Boa estabilidade e desempenho
 SQL Server 2005
 SSRS, SSIS e SSAS = BI edition
 Database Mirror, Snapshot (DB e Isolation), ...
SQL Server
 SQL Server 2008
 Enterprise Level – Audit, PBM, compressão backup e dados, mirroring,
xEvents, Resource Governor, filestream
 Reescrita engine SSRS
 SQL Server 2008 R2
 StreamInsight, Master Data Services
 PowerPivot
 PDW
 SQL Server 2012
 AlwaysOn Availability Groups
 ColumnStore Index
 Data Quality Services, Filetable, semantic search, SSAS tabular, windowing
functions, distributed replay, SSDT, batch processing, ...
Business Intelligence / Data Warehouse
 DW vs BI
 Uma das maiores tendências no mundo dos dados
 Presente na lista de prioridade do Gartner nos últimos 10 anos
 10 anos? TI?
 Falhas dos projetos





Projeto complexo
Problemas nos dados
Usuário não sabe o que quer
Só preciso de um relatório
Mudança
 Modo de “fazer BI” vem mudando
Business Intelligence / Data Warehouse
OLTP
OLAP
Business Intelligence / Data Warehouse
?
OLAP
OLTP
OLAP
Cloud Computing
 Preciso falar que é uma tendência em TI?
 Não é para todo mundo, mas é um facilitador
 Pequenos podem se tornar grandes
 Windows Azure SQL Database
 Release contínuo de funcionalidade
 Azure Tables
 Espaço noSQL (MongoDB, Cassandra, BigTable, etc.)
 Database on the cloud ou database for the cloud?
 NuoDB
O volume de dados só cresce...
Há mais dados
armazenados por
empresa do que
na biblioteca do
Congresso dos
EUA
Volume de informações está crescendo em todo o mundo a uma taxa mínima
de 59% ao ano com 15% de dados dados estruturados e o resto composto de
novos tipos de dados complexos o que contribui para cenários de Big Data -
Donald Feinberg, Gartner IT Symposium, Outubro 2010
Big Data
 Explosão de dados = fenômeno “Big Data”
 The economist: “The data deluge”
 Bilhões de dados sendo gerados a cada
minuto ou segundo
 Aplicações crescem e maiores volumes de
dados têm que ser armazenados
 Necessidade de armazenar, catalogar,
explorar e fazer esse dado virar informação
Big Data
 Muitos da TI encaram esse volume de dados como CUSTO
 Mas deveriam ver os dados como uma OPORTUNIDADE
 O que é Big Data?
 É algo que fica entre medium data e gigantic data?
 Big Data é uma coleção de dados tão grande e complexa que fica
difícil de processar usando ferramentas de gerenciamento de banco de
dados ou aplicações tradicionais.
 A quantificação do valor (TB, PB) não é precisa e a cada evolução da
tecnologia o big dá um passo a mais
Big Data - Hadoop
Big Data - Hadoop
HDInsight
 https://www.hadooponazure.com/
 HDInsight
 http://www.windowsazure.com/enus/manage/services/hdinsight/introduction-hdinsight/
 http://www.windowsazure.com/en-us/manage/services/hdinsight/
Polybase
 Integração entre mundo relacional e hadoop (não-relacional)
 http://projectbotticelli.com/news/sql-server-2012-sp1-hekatonxvelocity-polybase-data-mining-office-sharepoint-2013
 http://www.zdnet.com/microsofts-polybase-mashes-up-sql-serverand-hadoop-7000007424/
 http://www.microsoft.com/en-us/sqlserver/solutionstechnologies/data-warehousing/polybase.aspx
 http://gsl.azurewebsites.net/Projects/Polybase.aspx
Appliances
 Parallel Data Warehouse v1
 PDW 2012





Up to 50x performance gains with the xVelocity updateable columnstore.
Up to 100x performance gains over legacy warehouses.
Seamless integration with “Big Data” using PolyBase.
Multi-petabyte data capacity.
2.5x lower price per terabyte than SQL Server 2008 R2 PDW and lowest
price per terabyte in industry.
 Configuração da “caixa” dispensa experts em diversas áreas na sua
empresa
Engine relacional
 Avanços no query optimizer (star join queries, desempenho, etc.)
 SQL Server 2012
 ColumnStore Indexes (não-cluster, não atualizável)
 Batch Processing
 Armazenamento por coluna apresenta muitas vantagens:
 Compressão
 Segment elimination
 Column elimination
 SQL Server vNext
 Clustered columnstore index
 Updatable
Engine relacional
 Projeto HEKATON = In-memory databases
 Não é pintable!
 Não necessita de appliance para executar, reutiliza mesmo hardware de
hoje
 Demonstração PASS 2012 = 30x ganho de desempenho
 Optimistic Approach (no latching)
 Código nativo in-memory
 Aceleração das transções
 Uma melhor b-tree
 http://research.microsoft.com/en-us/news/features/hekaton122012.aspx
Conclusão
 Talvez o mundo dos dados nunca foi tão empolgante como o que
estamos vivendo hoje!
 Cientistas de dados
Luciano Moreira [Luti]
@luticm
[email protected]
http://luticm.blogspot.com
SQL Server MVP | PASS RM |
MC* | MCM Wannabe
Obrigado.
Download