In-Memory Analytic DBMSs: Design and Lessons Learned
Speaker: Pedro Eugenio Pedreira (Facebook Inc.)
Sat, 25 Aug [16:30] – Room: Maracanã
Abstract
This tutorial presents an overview and the motivation behind building in-memory analytic DBMS systems. As memory size grows and prices drop, in-memory analytic DBMSs have become a viable choice to provide interactive analytic capabilities to critical data marts which are part of much larger – and slower – data warehouses. In order to illustrate how this type of system is designed and built, some of the state-of-art in-memory database systems will be discussed, such as SAP HANA, Hyper, Hekaton, Oracle In-Memory and Cubrick, and the characteristics that differentiate them from the traditional DBMS design literature will be stressed. In addition, the author will discuss some of the lessons learned while building and providing Cubrick as a service at Facebook, and highlight some of the many research opportunity avenues.
Coleta, Integração e Pré-processamento de Dados de Múltiplas Fontes
Speakers: Natércia Batista (UFMG); Michele Brandão (UFMG); Michele Brito (UFMG); Daniel Dalip (CEFET/MG); Mirella Moro (UFMG)
Sat, 25 Aug [16:30] – Room: Catedral
Abstract
Dados extraídos da Web são cada vez mais heterogêneos e não estruturados, representando desafios para atividades de coleta, integração e pré-processamento de dados. Existem estudos que são “orientados a dados”, i.e., com base nos dados disponíveis, porém seus resultados ficam restritos aos respectivos dados. Em contraponto, vários problemas existem antes de se identificar quais dados são necessários para solucioná-los, e muitas vezes, são necessários dados de múltiplas fontes. Nesse contexto, coletar, integrar e pré-processar dados adequadamente possibilita criar conjuntos de dados para a solução de problemas reais. Assim, este tutorial aborda essas atividades e apresenta seus principais desafios.