Overview

SBBD is the official database event of the Brazilian Computer Society (SBC). It is the largest venue in Latin America for presenting and discussing research results in the database domain. In its 32nd edition, the symposium will be held in Uberlândia, Minas Gerais, on October 2nd-5th, 2017.

This year SBBD is being organized by Faculdade de Computação, Universidade Federal de Uberlândia (UFU).

SBBD brings together researchers, students and practitioners, from Brazil and abroad, to discuss problems related to the main topics in modern database technologies. Along with technical sessions, the symposium also includes invited talks and tutorials given by distinguished speakers from the international research community. SBBD also promotes a Workshop of Theses and Dissertations in Databases (WTDBD), a Demos Session and a Poster Session as co-located events.

In 2017, for the first time, SBBD will be held in conjunction with the BRACIS (Brazilian Conference on Intelligent Systems) and KDMiLe (Symposium on Knowledge Discovery, Mining and Learning).

Find SBBD on Facebook! Find SBC on Facebook!

follow us on facebook

 

Print your SBBD/KDMiLe 2017 Poster: png or pdf

 

SPONSORED BY
 

DIAMOND SPONSORS
 
 
 

GOLD SPONSOR
 

SILVER SPONSORS
 
 
 

BRONZE SPONSORS
 
 
 

ORGANIZED BY


SUPPORT

 
 
 
PROMOTION
 
 
 

 

 

Program Schedule
More Info
October 5th, 2017 (Thursday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 Tutorial 2: Adaptivity in Database Kernels, Javam C. Machado, Paulo Roberto Pessoa Amora, Elvis Marques Teixeira (B2)
08:30 - 10:00 SBBD Technical Session 8: NoSQL, Web, and Data Provenance (B3)

Session Chair: Leonardo Moreira (UFC)

08:30 Querying Provenance along with External Domain Data Using Prolog Wellington Oliveira (UFF), Kary A. C. S. Ocaña (LNCC), Daniel de Oliveira(UFF), Vanessa Braganholo (UFF)
09:00 Extração de Dados de Conferências a Partir da Web, Cássio Garcia (Universidade Federal do Rio Grande do Sul – Brazil),
Viviane Moreira (Universidade Federal do Rio Grande do Sul – Brazil)
09:30 Empirical evaluation of strategies to process range queries of numeric sequences in batch-mode, Luiz F. A. Brito (Federal University of Uberlandia – Brazil), Marcelo K. Albertini (Federal University of Uberlandia – Brazil)

08:30 - 10:00 SBBD Technical Session 9: Data Mining (B4)

Session Chair: Hasan Dalip (CEFET-MG)

08:30 A Força dos Relacionamentos Pode Medir a Qualidade de Comunidades?, Mariana O. Silva (Universidade Federal de Minas Gerais), Michele A. Brandão (Universidade Federal de Minas Gerais), Mirella M. Moro (Universidade Federal de Minas Gerais)
08:45 A Framework for Online Clustering Based on Evolving Semi-Supervision, Guilherme Alves (Federal University of Uberlândia), Maria Camila Nardini Barioni (UFU), Elaine Faria (Federal University of Uberlandia)
09:15 Estratégia Distribuída para Análise de Assuntos Abordados no Twitter Via Evolução de Clusters , Priscila Rocha Ferreira Rodrigues (Universidade Federal do Ceará), Ticiana L. Coelho da Silva (Universidade Federal do Ceará), Jose Maria da Silva Monteiro Filho (Universidade Federal do Ceará), José Antonio F. de Macêdo (Universidade Federal do Ceará)
09:30 Mineração de Regras de Associação Multirrelação em Grafos: Direcionando o Processo de Busca, Felipe Alves Oliveira (Instituto Militar de Engenharia), Raquel L. Costa (Instituto Militar de Engenharia), Ronaldo Goldschmidt (Instituto Militar de Engenharia), Maria Claudia Cavalcanti (Instituto Militar de Engenharia)
09:45 Análise da Formação e Evolução de Times de Desenvolvimento no Hibernate-ORM , Talita S. Orfanó (Universidade Federal de Minas Gerais), Michele A. Brandão (Universidade Federal de Minas Gerais ), Larissa E. Maia (Universidade Federal de Minas Gerais ), Mirella M. Moro (Universidade Federal de Minas Gerais)

08:30 - 10:00 WTDBD 3 – Workshop de Teses e Dissertações em Banco de Dados (B1)

08:30 – 09:00 Metadata Curation Framework for Supporting Data Ecosystems (D), Marcelo Iury S . Oliveira (Universidade Federal Rural de Pernambuco), Bernadette Loscio (Universidade Federal de Pernambuco)
09:00 – 10:00 Palestra WTDBD: Experimentação, O Terceiro Tempo … – Fábio Porto (LNCC). Resumo: Produzir um resultado científico não é nada fácil. Precisa-se estudar o domínio do problema e identificar uma boa oportunidade, ainda não explorada na literatura. Em seguida, elabora-se uma estratégia e desenvolve-se uma solução. A partir dai inicia-se o terceiro tempo, a experimentação. O impulso imediatista do tipo: “já estou quase terminando pois a implementação está quase pronta” não pode estar mais longe do que precisa de fato acontecer. A fase de experimentação pode ser quase tão trabalhosa e custosa quanto suas antecessoras. Em geral, funciona em ciclos, iniciando-se pelo planejamento dos experimentos, passando pelo desenho detalhado dos alvos e processos experimentais, incluindo a obtenção de recursos, como dados e programas necessários para o experimento. Precisa-se também definir o que será medido e como será a validação. Todo o processo deve poder ser realizado por uma terceira pessoa, necessitando que seja reprodutível. Esta palestra vai explorar a fase de experimentação científica, com ênfase na área de banco de dados, e objetiva instruir os alunos de pós-graduação a prepararem satisfatoriamente a experimentação de seus trabalhos.

10:00 - 10:30 Coffee break + poster session
10:30 - 12:00 Keynote speaker: What Non-Volatile Memory Means for the Future of Database Management Systems, Andy Pavlo (B2/B3)

The advent of non-volatile memory (NVM) will fundamentally change the dichotomy between memory and durable storage in database management systems (DBMSs). These new NVM devices are almost as fast as DRAM, but all writes to it are potentially persistent even after power loss. Existing DBMSs are unable to take full advantage of this technology because their internal architectures are predicated on the assumption that memory is volatile. That means when NVM finally arrives, just like when you finally passed that kidney stone after three weeks, everyone will be relieved but the transition will be painful. Many of the components of legacy DBMSs will become unnecessary and will degrade the performance of data intensive applications. In this talk, I discuss the key aspects of DBMS architectures that are affected by emerging NVM technologies. I then describe how to adapt in-memory DBMS architectures for NVM. I will conclude with a discussion of a new DBMS that we have been developing at Carnegie Mellon that specifically designed to leverage the persistence properties of NVM in its architecture, such as its recovery and concurrency control mechanisms. Our system is able to achieve higher throughput than existing approaches while reducing the amount of wear due to write operations on the device.

12:00 - 13:00 Conference Closing (B2/B3)
October 4th, 2017 (Wednesday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 Tutorial 2: Adaptivity in Database Kernels, Javam C. Machado, Paulo Roberto Pessoa Amora, Elvis Marques Teixeira (B2)

Adaptivity addresses a class of problems related to database physical design optimization for scenarios where the workload is unknown and immediate availability is a requirement. The general strategy is to improve physical design by means of incremental changes, each guided by the current workload request. For instance, adaptive indexing builds partial in- dexes through steps during query processing rather than building full indexes. Adaptivity can also be applied on data storage layout in order to optimize relevant data exchange between memory hierarchy layers. Instead of having a fixed layout, adaptive storage re- designs data organization to answer incoming queries incrementally based on the current requests or recent workload pattern.

08:30 - 10:00 SBBD Technical Session 5: Data Analytics (B3)

Session Chair: Renata de Paris (PUCRS)

08:30 Identificação do grafo de genealogia acadêmica de pesquisadores: Uma abordagem baseada na Plataforma Lattes, Rafael Damaceno (Universidade Federal do ABC – Brazil), Luciano Rossi (Universidade Federal do ABC – Brazil), Jesús Mena-Chalco (Federal University of ABC – Brazil)
09:00 Redes Sociais Científicas: análise topológica da influência dos pesquisadores, Vitor Horta (Universidade Federal de Juiz de Fora – Brazil), Victor Stroele (Federal University of Juiz de Fora – Brazil), Fernanda Campos (Universidade Federal de Juiz de Fora – Brazil), Regina Braga (Universidade Federal de Juiz de Fora – Brazil), José Maria David (Universidade Federal de Juiz de Fora – Brazil)
09:15 Mineração de Perfis Sociais em Redes Temporais, Jeancarlo C. Leão (Universidade Federal de Minas Gerais – Brazil),
Michele A. Brandão (Universidade Federal de Minas Gerais – Brazil), Pedro O. S. Vaz de Melo (Universidade Federal de Minas Gerais – Brazil), Alberto H. F. Laender (Universidade Federal de Minas Gerais – Brazil)
09:30 The collaboration network of the Brazilian Symposium on Databases, to be published in the Journal of the Brazilian Computer Society, December 2017, Lucas Henrique Costa de Lima (Universidade Federal de Minas Gerais), Gustavo Penha (Universidade Federal de Minas Gerais), Laís Mota de Alencar Rocha (Universidade Federal de Minas Gerais), Mirella M. Moro (Universidade Federal de Minas Gerais), Ana Paula Couto da Silva (Universidade Federal de Minas Gerais), Alberto H.F. Laender (Universidade Federal de Minas Gerais) e José Palazzo M. de Oliveira (Universidade Federal do Rio Grande do Sul)

08:30 - 10:00 KDMiLe Technical Session 5: Applications 1 (B4)

08:30 Um método para identificação de pessoas em cenários de risco em ambientes de segurança crítica – uma análise experimental em ambientes offshore. Felipe Oliveira (UFF), Flavia Bernardini (UFF) and Marcilene Viana (UFF).
08:50 A Machine Learning Predictive System to Identify Students in Risk of Dropping Out of College. Gabriel Silva (UnB) and Marcelo Ladeira (UnB).
09:10 Identificação de Candidatos a Fiscalização por Evasão do Tributo ISS. Marcelo Dias (UFRGS) and Karin Becker (UFRGS).
09:30 AILINE-Um Método Inteligente para Detecção Automática de Linhas Espectrais em Galáxias. Yvson P. N. Ferreira (PGCA/UEFS), Iranderly F. de Fernandes (PGCA/UEFS) and Angelo C. Loula (PGCA/UEFS).

08:30 - 10:00 WTDBD 2 – Workshop de Teses e Dissertações em Banco de Dados (B1)

08:30  09:00 A middleware for storing massive RDF graphs into NoSQL (D), Luiz Henrique Zambom Santana (Universidade Federal de Santa Catarina), Ronaldo Mello (Universidade Federal de Santa Catarina)
09:00 – 09:20 Uma Abordagem para Criação e Uso de Perfis de Conjuntos de Dados com Metadados Enriquecidos Semanticamente (M), Natacha Targino (UFPE), Ana Carolina Salgado (UFPE), Damires Souza (IFPB)
09:20 – 09:40 Uma Abordagem para Processamento em Memória de Operações de Seleção em Sistemas de Bancos de Dados (M), Diego Tomé (Universidade Federal do Paraná), Marco Alves (Universidade Federal do Paraná), Eduardo de Almeida (Universidade Federal do Paraná)
09:40 – 10:00 Mecanismo de Inferência de Diagnóstico Baseado na Classificação de Sinais ECG (M), Priscila Rodrigues (Universidade Federal do Ceará), Jose Maria Silva Monteiro Filho (UFC)

10:00 - 10:30 Coffee break + poster session
10:30 - 12:00 Keynote speaker: Pesquisador Homenageado do SBBD 2017, José Palazzo Moreira de Oliveira (B2/B3)

Como professor e pesquisador, desde minha formatura na Escola de Engenharia da UFRGS, tive a rara sorte de acompanhar o desenvolvimento da Computação e do ensino de Banco de Dados nas universidades brasileiras. Minha ontogênese acadêmica acompanhou o percurso da história do SBBD. Esta distinção foi uma grande alegria e surpresa, em uma época em que a avaliação de um pesquisador é constituída quase exclusivamente por índices bibliométricos, em receber um reconhecimento pelo conjunto da obra (ver a divulgação). Algo muito relevante para mim foi que os jovens colegas se lembraram de uma carreira de 48 anos com forte dedicação à área de Sistemas de Informação e Banco de Dados. Ao longo da carreira desenvolvi atividades em múltiplas dimensões, 81 alunos de pós-graduação já orientados, muitas disciplinas ministradas, forte interação internacional e um consistente número de boas publicações. Tinha que decidir o formato desta apresentação, uma alternativa seria descrever tecnicamente minhas pesquisas, representadas pelas publicações, isto seria enfadonho e traria pouca contribuição para os jovens membros a comunidade. Pensei melhor e então resolvi apresentar as áreas de pesquisa em que tenho trabalhado e sua evolução ao longo destes anos, sem entrar em profundos detalhes técnicos. Este andamento seguiu muito de perto a evolução do SBBD. Após apresento uma perspectiva do futuro dos Bancos de Dados e os perigos que corremos. Uma das atividades realizadas na Comissão Especial de BD e que considero importante foi a implementação do 1° Concurso de Teses e Dissertações em Banco de Dados. Desejo que a apresentação seja útil para os jovens pesquisadores conhecerem melhor o caminho percorrido até aqui pela nossa comunidade e para que entrevejam o possível futuro e seus desafios.  A vida acadêmica não pode ser uma Torre de Marfim, a preocupação e engajamento com a comunidade é essencial. Nesta apresentação vocês terão a oportunidade de conhecer, de forma agradável, o desenvolvimento de nossa área no Brasil em paralelo com uma análise do que considero essencial para uma carreira equilibrada no ensino e na pesquisa. A história dos Bancos de Dados inicia com a estruturação de arquivos tradicionais e chega aos complexos sistemas atuais. As noções de transação, recuperação e outras são essenciais para a maioria das aplicações transacionais. Hoje há uma revolta contra tudo isto propondo alternativas como o NoSQL, mas diferentes aplicações exigem diversos modelos de SGBDs. Talvez estejamos exagerando nas customizações. O que nos reserva o futuro? Como vamos estruturar nossas carreiras em um período turbulento?

12:00 - 14:00 Lunch break
14:00 - 15:30 Tutorial 3: Social Professional Networks: Taxonomy, Metrics and Analyses of Relationship Strength, Michele A. Brandão, Mirella M. Moro (B2)

Social professional networks provide features not available in other networks. For example, LinkedIn facilitate professional networking, and GitHub enables committing and sharing code. Such networks also provide data on users, behaviors and interactions. Here, we foster a deeper understanding of the social professional networks types, definitions, features, analyses and applications while providing a useful taxonomy about their use. We also study the strength of ties, a central aspect that allows studying the roles of relationships. Therefore, besides analyzing the strength of co-authorship ties, we also present a set of metrics and algorithms to measure such strength in different contexts.

14:00 - 15:30 SBBD Technical Session 6: Data Discovery (B3)

Session Chair: Flavio Sousa (UFC)

14:00 Ligações Semânticas Utilizando Predicados SKOS, Ricardo de Avila (Universidade Federal do Ceara), Salomao Silva (Universidade Federal do Ceara), David Araújo Abreu (Universidade Federal do Ceará), Vania Vidal (Universidade Federal do Ceará), José Antonio Macêdo (UFC)
14:30 Uso de instâncias de dados e carga de trabalho para mineração de restrições de integridade, Eduardo Henrique Monteiro Pena (Universidade Tecnológica Federal do Paraná), Eduardo Cunha de Almeida (Universidade Federal do Paraná)
14:45 Uma Avaliação de Eficiência e Eficácia da Combinação de Técnicas para Deduplicação de Dados, Levy Souza (Universidade Federal de Minas Gerais), Dimas C. Nascimento (Universidade Federal Rural de Pernambuco (UFRPE)), Mirella Moro (Universidade Federal de Minas Gerais)
15:15 Análise do Impacto do Gerador de Conjuntos de Dados em Experimentos de Deduplicação de Dados, Levy de Souza Silva (Universidade Federal de Minas Gerais), Mirella M. Moro (Universidade Federal de Minas Gerais)

14:00 - 15:30 KDMiLe Technical Session 6: Applications 2 (B4)

14:00 Acoplamento para resolução de correferência em ambiente de aprendizado sem-fim. Felipe Quecole (UFSCar), Maisa Cristina Duarte (Université Jean Monnet) and Estevam Rafael Hruschka Jr (UFSCar).
14:20 Using graph-based centrality measures for sentiment analysis. George Vilarinho (USP), Mateus Machado (USP) and Evandro Ruiz (USP).
14:40 A Deep Learning Approach to Prioritize Customer Service Using Social Networks. Paulo Amora (UFC), Elvis Teixeira (UFC), Maria Lima (UFC), Gabriel Amaral (UFC), José Cardozo (Digitro Tecnologia SA) and Javam Machado (UFC).
15:00 Extração automática de sementes para sistemas de aprendizado sem-fim. Romão Matheus Martines de Jesus (UFSCar), Maisa Cristina Duarte (Université Jean Monnet) and Estevam Rafael Hruschka Jr (UFSCar).

14:00 - 15:30 CTDBD 2 – Concurso de Teses e Dissertações em Bancos de Dados (B1)

Mestrado
14:00 – 14:20 Uma Abordagem em Paralelo para Matching de Grandes Ontologias com Balanceamento de Carga, Tiago Brasileiro Araújo ( Universidade Federal de Campina Grande – UFCG), Carlos Eduardo Santos Pires (Universidade Federal de Campina Grande – UFCG)
14:20 – 14:40 Analysis of Academic Social Networks considering Social Capital, Thiago Silva (Universidade Federal de Minas Gerais), Mirella Moro (Universidade Federal de Minas Gerais), Ana Paula Couto da Silva (Universidade Federal de Minas Gerais)
14:40 – 15:00 Parallel Execution of Workflows Relying on Distributed Database Techniques, Renan Santos Souza (UFRJ and IBM Research), Marta Mattoso (COPPE/UFRJ)
15:00 – 15:20 Efficiently Computing Geometric Composition Patterns in Big Data, Amir Khatibi (UFMG), Fabio Andre Porto (LNCC), Eduardo Ogasawara (CEFET/RJ)

15:30 - 16:00 Coffee break + poster session
16:00 - 17:30 Tutorial 3: Social Professional Networks: Taxonomy, Metrics and Analyses of Relationship Strength, Michele A. Brandão, Mirella M. Moro (B2)
16:00 - 17:30 Demos Session 2 (B1)
16:00 – 16:20 Seal-DB : Uma Ferramenta de Suporte ao Aprendizado de Banco de Dados. Gustavo Moraes (UNIFOR), José de Aguiar Moraes Filho (UNIFOR) e Angelo Brayner (UFC)
16:20- 16:40 eTRC: Uma Ferramenta de e-Learning para Ensino de Cálculo Relacional de Tuplas. Matheus Mayron Lima (UFC), Júlio Tavares (UFC), José Maria Monteiro (UFC), Angelo Brayner (UFC) e Javam Machado (UFC)
16:40 – 17:00 Vis4DD: A visualization system that supports Data Quality Visual Assessment. Joao Marcelo Borovina Josko (IME-USP) e Joao Eduardo Ferreira (IME-USP)
16:00 - 17:30 SBBD Technical Session 7: Semantic Web (B3)

Session Chair: Ana Carolina Almeida (UERJ)

16:00 Workload-Aware RDF Partitioning and SPARQL Query Caching for Massive RDF Graphs stored in NoSQL Databases, Luiz Henrique Zambom Santana (Universidade Federal de Santa Catarina), Ronaldo Mello (Universidade Federal de Santa Catarina)
16:30 Uma Proposta de Perfil de Conjuntos de Dados na Web com Enriquecimento Semântico, Natacha Targino (UFPE), Damires Souza (IFPB), Ana Carolina Salgado (UFPE)
17:00 Um Survey sobre Soluções para Publicação de Dados na Web sob a Perspectiva das Boas Práticas do W3C, Lairson Oliveira (Universidade Federal de Pernambuco), Marcelo Iury S . Oliveira (Universidade Federal Rural de Pernambuco), Bernadette Loscio (Universidade Federal de Pernambuco)

16:00 - 17:30 KDMiLe Technical Session 7: Machine Learning Theory (B4)

16:00 Parameter Learning in ProbLog with Probabilistic Rules. Arthur Colombini Gusmão (USP), Francisco Henrique Otte Vieira de Faria (USP), Glauber De Bona (USP), Fabio Gagliardi Cozman (USP) and Denis Deratani Mauá (USP).
16:20 A Dispersion-Based Discretization Method for Models Explanation. Bernardo Stearns (UFRJ), Fabio Rangel (UFRJ), Fabrício Faria (UFRJ) and Jonice Oliveira (UFRJ).
16:40 Learning Probabilistic Relational Models: A Simplified Framework, a Case Study, and a Package. Luiz Henrique Mormille (USP) and Fabio Gagliardi Cozman (USP).

17:30 - 19:00 CEBD Meeting (B3)
19:30 - 22:30 Conference Dinner (Praia Clube)
October 3rd, 2017 (Tuesday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 SBBD Technical Session 1: Best Papers Runner-ups (B2)

Session Chair: Ticiana Silva (UFC)

08:30 Relational graph data management on the edge: Grouping vertices’ neighborhood with Edge-k, Lucas Scabora (University of São Paulo), Paulo Oliveira (University of São Paulo), Daniel Kaster (UEL – Universidade Estadual de Londrina), Agma Traina (ICMC-USP), Caetano Traina Júnior (ICMC – USP)
09:00 A Predictive Load Balancing Service for Cloud-Replicated Databases, Carlos Marinho (Universidade Federal do Ceará), Emanuel Coutinho (Universidade Federal do Ceará (UFC)), José Serafim da Costa Filho (Universidade Federal do Ceará), Leonardo Moreira (Universidade Federal do Ceará), Flávio R. C. Sousa (Federal University of Ceara), Javam Machado (Federal University of Ceará)
09:15 STACY: Um Novo Algoritmo para Automaticamente Classificar a Força dos Relacionamentos ao Longo dos Anos, Michele Brandão (UFMG), Pedro Olmo Vaz de Melo (Universidade Federal de Minas Gerais), Mirella Moro (Universidade Federal de Minas Gerais)
09:45 Aspectos Temporais para Medir a Força da Colaboração no GitHub, Natércia A. Batista (Universidade Federal de Minas Gerais), Michele A. Brandão (Universidade Federal de Minas Gerais), Ana Paula C. da Silva (Universidade Federal de Minas Gerais), Mirella M. Moro (Universidade Federal de Minas Gerais)

08:30 - 10:00 SBBD Technical Session 2: Spatial Data Management and Systems Development (B3)

Session Chair: Victor Teixeira de Almeida (UFF)

08:30 Analyzing the Performance of Spatial Indices on Flash Memories using a Flash Simulator, Anderson Chaves Carniel (University of São Paulo), Tamires Brito da Silva (University of São Paulo), Kairo Luiz dos Santos Bonicenha (University of São Paulo), Ricardo Ciferri (Universidade Federal de São Carlos), Cristina Ciferri (USP)
09:00 Detecção de Anomalias no Transporte Rodoviário Urbano, Ana Beatriz Cruz (Centro Federal de Educação Tecnológica CEFET/RJ), Joao Ferreira (Centro Federal de Educação Tecnológica CEFET/RJ), Bernardo Monteiro (Centro Federal de Educação Tecnológica CEFET/RJ), Rafaelli Coutinho (Centro Federal de Educação Tecnológica CEFET/RJ), Fabio Andre Porto (LNCC), Eduardo Ogasawara (Centro Federal de Educação Tecnológica CEFET/RJ)
09:15 Uma Análise Comparativa entre Sistemas Gerenciadores de Bancos de Dados NoSQL no contexto de Internet das Coisas, Allexandre Sampaio Santos Soares (Instituto Federal de Educação, Ciência e Tecnologia da Bahia), Pablo Freire Matos (Instituto Federal de Educação, Ciência e Tecnologia Bahia – Campus Vitória da Conquista)
09:30 Spatial Join on Positional Uncertain Data, Welder Oliveira (Universidade Federal de Goiás), Sávio de Oliveira (Universidade Federal de Goiás – UFG), Vagner Sacramento (Universidade Federal de Goiás), Helton Santos (Universidade Federal de Goiás), Kleber Cardoso (Universidade Federal de Goiás)
09:45 Don’t Keep My UDFs Hostage – Exporting UDFs For Debugging Purposes, Pedro Holanda (Centrum Wiskunde & Informatica (CWI) – The Netherlands), Mark Raasveldt (Centrum Wiskunde & Informatica (CWI) – The Netherlands), Martin Kersten (Centrum Wiskunde & Informatica (CWI) – The Netherlands)

08:30 - 10:00 KDMiLe Technical Session 2: Text Mining (B4)

08:30 Chatbot baseado em Deep Learning: um Estudo para Lingua Portuguesa. Andherson Maeda (PUC-RS) and Silvia Moraes (PUC-RS).
08:50 A Review of Text-Based and Knowledge-Based Semantic Similarity Measures. Angelica Ribeiro (USP), Zhao Liang (USP) and Alessandra Macedo (USP).
09:10 Estratégias de Correção de Erros de Extratores de Palavras em Português. Matheus Nogueira (UFES) and Elias Oliveira (UFES).
09:30 TATModel – Em Direção a um Novo Modelo para Avaliação de Traduções Automáticas de Texto. Rafael Guimarães Rodrigues (CEFET-RJ) and Gustavo Paiva Guedes (CEFET-RJ).

08:30 - 10:00 WTDBD 1 – Workshop de Teses e Dissertações em Banco de Dados (B1)

08:30 – 08:50 Interoperabilidade entre DaaS e DbaaS heterogêneos (M), Marcelo Vieira (FORMAS/LASID/IME/UFBA), Daniela Barreiro Claro (UFBA)
08:50 – 09:10 Processamento eficiente de consultas sobre grandes volumes de dados usando arquiteturas multi-core (M), Frank Silva (UFF, UNEMAT), Victor de Almeida (UFF, Petrobras), Vanessa Braganholo (UFF)
09:10 – 09:40 An External Memory Approach for de Bruijn Graph Construction (D), Elvismary Molina de Armas (PUC-Rio), Sergio Lifschitz (PUC-Rio)
09:40 – 10:00 MetisIDX – From Adaptive to Predictive Data Indexing (M), Elvis Teixeira (Federal University of Ceará), Javam Machado (UFC)

10:00 - 10:30 Coffee break
10:30 - 12:00 Keynote speaker: A Holistic View of Human Factors in Crowdsourcing, Sihem Amer-Yahia (B2/B3)

For over 40 years, organization studies have examined human factors in physical workplaces and their influence on the ability of an individual to perform a task, or a set of tasks, alone or in collaboration with others. In a virtual marketplace, the crowd is typically volatile, its arrival and departure asynchronous, and its levels of attention and accuracy diverse. This has generated a wealth of new research ranging from studying workers’ fatigue in task completion to examining the role of motivation in task assignment. I will review such work and argue that we need a holistic view to take full advantage of human factors such as skills, expected wage and motivation, in improving the performance of a crowdsourcing platform.

12:00 - 14:00 Lunch break
14:00 - 15:30 Tutorial 1: Mobile Crowdsourcing for Smart City Applications, Sanjay Kumar Madria (B2)

This tutorial will discuss mobile crowdsourcing issues for smart city applications. In particular, it will motivate the use of incentives for better crowd participation from people carrying mobile devices, data quality, data analytics and trust issues among others. It will also discuss some open research problems in that domain.

14:00 - 15:30 SBBD Technical Session 3: Best Papers Runner-ups (B3)

Session Chair: José de Aguiar Moraes Filho (UNIFOR)

14:00 A Spline-based Cost Model for Metric Trees, Marcos Bedo (Unversity of São Paulo), Agma Traina (ICMC-USP), Caetano Traina Júnior (ICMC – USP)
14:30 ParallelNACluster: Uma estratégia paralela de clusterização para o casamento de múltiplos catálogos, Vinícius Freire (Federal University of Ceará), Fabio Andre Porto (LNCC), José Antonio Macêdo (UFC)
15:00 Análise de Dados Científicos: uma Análise Comparativa de Dados de Simulações Computacionais, Thaylon Guedes Santos (Universidade Federal Fluminense), Vítor Silva (Universidade Federal do Rio de Janeiro), Jose Camata (Universidade Federal do Rio de Janeiro), Marta Mattoso (Universidade Federal do Rio de Janeiro), Daniel de Oliveira (Universidade Federal Fluminense)
15:15 Spark Scalability Analysis in a Scientific Workflow, Renan Santos Souza (Universidade Federal do Rio de Janeiro and IBM Research), Vítor Silva (Universidade Federal do Rio de Janeiro), Pedro Miranda (Universidade Federal do Rio de Janeiro), Alexandre Lima (Universidade Federal do Rio de Janeiro), Patrick Valduriez (INRIA – France), Marta Mattoso (Universidade Federal do Rio de Janeiro)

14:00 - 15:30 KDMiLe Technical Session 3: Bioinformatics (B4)

14:00 Classificação Hierárquica e Não Hierárquica de Elementos Transponíveis.Gean Pereira (UFSCar) and Ricardo Cerri (UFSCar).
14:20 A novel probabilistic Jaccard distance measure for classification of sparse and uncertain data.Igor Martire (UFF), Pablo Nascimento Da Silva (UFF), Alexandre Plastino (UFF), Fabio Fabris (University of Kent) and Alex Freitas (University of Kent).
14:40 An Empirical Comparison of Hierarchical and Ranking-Based Feature Selection Techniques in Bioinformatics Datasets.Luan Rios Campos (UEFS) and Matheus Giovanni Pires (UEFS).
15:00 SVM Cascata para o Problema de Predição de Sítio de Início de Tradução. Wallison Guimaraes (PUC-MG), Cristiano Pinto (EMGE), Cristiane Nobre (PUC-MG) and Luis Zárate (PUC-MG).

14:00 - 15:30 CTDBD 1 – Concurso de Teses e Dissertações em Bancos de Dados (B1)

Doutorado
14:00 – 14:25 Data classification in complex networks via pattern conformation, data importance and structural optimization, Murillo Carneiro (Universidade Federal de Uberlândia), Liang Zhao (Universidade de São Paulo)
14:25 – 14:50 A Multi-View Approach for Assessing the Quality of Collaboratively Created Content on the Web 2.0, Daniel Dalip (Centro Federal de Educação Tecnológica de Minas Gerais), Marcos Gonçalves (Universidade Federal de Minas Gerais), Marco Cristo (UFAM)
Mestrado
15:50 – 15:10 Join Operators for Asymmetric Media, Neusa Evangelista (UNIFOR), José de Aguiar Moraes Filho (UNIFOR), Angelo Brayner (Universidade Federal do Ceará)
15:10 – 15:30 Discretizador Heurístico para o Contexto de Classificação Hierárquica, Leandro Galvão (Universidade Federal de Ouro Preto), Luiz Henrique Merschmann (Universidade Federal de Lavras)

15:30 - 16:00 Coffee break / Recepção dos calouros do SBBD: Café com o Homenageado
16:00 - 17:30 Tutorial 1: Mobile Crowdsourcing for Smart City Applications, Sanjay Kumar Madria (B2)
16:00 - 17:30 Demos Session 1 (B1)
16:00 – 16:20 AgriExt: Uma Ferramenta para Estimativa da Evapotranspiração de Referência.Hinessa Dantas Caminha (UFC), Antonio Raimundo Rocha Mendonça (UFC), Ticiana L. Coelho da Silva (UFC), Atslands Rego da Rocha (UFC), Carlos Diego Andrade de Almeida (UFC) e José A. F. de Macedo (UFC)
16:20 – 16:40 DataChain: Uma Ferramenta para Assegurar a Propriedade e Imutabilidade de Documentos Digitais. Gabriel O. Mendanha (UFC), Lívia A. Cruz (UFC) e Regis P. Magalhães (UFC)
16:40 – 17:00 DCluster: Um sistema para análise exploratória de grandes volumes de dados georreferenciados. Claudio Gustavo S. Capanema (UFV), Fabrício A. Silva (UFV) e Thais R. M. Braga Silva (UFV)
17:00 – 17:20 Uma Ferramenta para Assegurar a Confidencialidade de Dados em Serviços de Armazenamento m Nuvem. Eliseu C. Branco (UFC), Roney Reis (UFC), Javam C. Machado (UFC), José Maria Monteiro (UFC), Gabriel G. Melo (UFC), Thiago de Sousa Garcia (UFC), Ricardo J. Lima (UFC), Júlio Tavares (UFC) e Angelo Brayner (UFC)
16:00 - 17:30 KDMiLe Invited Talk: Sentiment Analysis in Social media: Challenges and Solutions, Marcos Gonçalves (B4)

Sentiment analysis is an ongoing field of research in text mining that deals mainly with the task of identifying the polarity (positive, negative or neutral) expressed in a piece of text. Given the recent popularity of Online Social Networks (OSNs) and other Web 2.0 applications (e.g., micro-blogs), sentiment analysis has become an important research topic, mainly when considering short and informal texts, a challenging scenario. Applications of sentiment analysis include the monitoring of reviews or opinions about a company, product or a brand; political analyses, such as the tracking of sentiments expressed by voters about candidates; among many others. In this talk, I’ll give a brief introduction to the field, present the main approaches proposed so far to deal with it, and explain their limitations and the challenges ahead, which include, for instance: ambiguity, noise, and sarcasm; lack of benchmarks; instability of the proposed methods across domains; low coverage of the methods; incompleteness of existing lexicons; etc. I’ll also present some of our solutions developed to tackle several of these issues, based mainly on novel machine learning and information retrieval techniques.

16:00 - 17:30 SBBD Technical Session 4: Query Processing (B3)

Session Chair: Michele Brandão (UFMG)

16:00 Particionamento como Ação de Sintonia Fina em Bancos de Dados Relacionais, Ana Carolina Almeida (Universidade do Estado do Rio de Janeiro – Brazil), Antony Medeiros (PUC-Rio – Brazil), Rogério Luís de Carvalho Costa (Pontifícia Universidade Católica do Rio de Janeiro – Brazil), Sergio Lifschitz (PUC-Rio – Brazil)
16:30 Explorando arquiteturas multi-core para processamento eficiente de consultas em sistemas de gerência de Big Data, Frank Silva (UFF, UNEMAT – Brazil), Victor de Almeida (UFF, Petrobras – Brazil), Vanessa Braganholo (UFF – Brazil)
17:00 Online Performance Modeling for NoSQL Databases using Extreme Learning Machines, Victor A. E. Farias (Universidade Federal do Ceará – Brazil), Pedro R. A. Pinheiro (Universidade Federal do Ceará – Brazil), Flávio R. C. Sousa (Universidade Federal do Ceará – Brazil), Joao P. P. Gomes (Universidade Federal do Ceará – Brazil), Javam C. Machado (Universidade Federal do Ceará – Brazil)
17:15 Uma Abordagem para Processamento Distribuído de Junção por Similaridade sobre Múltiplos Atributos, Diego Junior do Carmo Oliveira (Universidade Federal de Goiás – Brazil), Felipe Ferreira Borges (Universidade Federal de Goiás – Brazil), Leonardo Andrade Ribeiro (Federal University of Goiás – Brazil)

18:00 - 19:00 SBBD Minute Madness (B3)
18:00 - 19:00 KDMiLe Technical Session 4: Clustering (B4)

18:00 Um Método para Predição de Ligações em Redes Complexas Baseado em Históricos da Topologia de Grafos. Érick Florentino (IME) and Ronaldo Ribeiro Goldschmidt (IME).
18:20 SOUTH-N: um método para a detecção semissupervisionada de outliers em dados de alta dimensão. Lucimeire Alves Da Silva (UFU), Maria Camila Nardini Barioni (UFU) and Humberto Luiz Razente (UFU).
18:40 Evaluation of clustering methods on co-occurrence matrices. Diorge Brognara (UFSCar), Thiago Zafalon Miranda (UFSCar) and Estevam Rafael Hruschka Jr (UFSCar).

18:00 - 19:00 KDD-BR Competition (B1)
19:30 - 20:30 Official Opening Ceremony (A2/A3)
20:30 - 21:30 Welcome Cocktail
October 2nd, 2017 (Monday)
08:00 AM - 08:30 Registration desk
08:30 - 10:00 Short course 1: É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais / It’s a matter of time! Knowledge Discovery from Temporal Social Networks (Sara Kubitschek 4)

Data is structured as a network. And now? How to analyze it? Extracting knowledge from network data is not a simple task and requires the use of appropriate tools and techniques, especially in scenarios that take into account the volume and evolving aspects of the network. There is a vast literature on how to collect, process and model social media data in the form of networks, as well as key metrics of centrality. However, there is still much to be discussed in relation to the analysis of the underlying network. In this short course we consider that data has already been collected and is already structured as a network. The goal is to discuss techniques to analyze these network data, especially considering the time perspective. First, concepts related to problem definition, temporal networks and metrics for network analysis will be presented. Next, in a more practical aspect will be shown techniques of visualization and processing of temporal networks. In the end, three case studies with real data from music playlists, Twitter and phone calls will be discussed, illustrating how to extract knowledge from temporal social networks.

08:30 - 10:00 Short course 2: Como funciona o Deep Learning / How Deep Learning works (Sara Kubitschek 2)

Deep learning, as a subfield of machine learning, uses the strategy of creating models by stacking representation layers whose parameters are learned using known data. The central idea of this type of technique is not new, but it is recent the hype surrounding the field, caused by impressive results in particular with perception-related tasks, which were historically seen to be very difficult to be tackled by computers. Although seemingly complex methods, those are composed of simple computing elements that perform basically a chain of linear transformations, mapping subsequent vector spaces. From an algebraic formulation, this short-course presents how deep learning works from its basic components to the algorithms used to achieve learning. As case-studies the problems of classification and feature learning are presented in supervised and non-supervised scenarios using convolutional networks and auto-encoders. The objective is to provide understanding of the inner workings of such models and what makes them different from non-deep models, their theoretical advantages and limitations, as well as practical instructions for applications.

08:30 - 10:00 DBBIO – Workshop Databases meet Bioinformatics (Sara Kubitschek 3)

08:30 – 08:50 Integrated Visualization of Disease-Ancestry Relationships with DANCE. Gilderlanio Araújo (UFPE), Paula Jennifer dos Santos (UFMG), Eduardo M. Tarazona Santos (UFPE), Maíra R. Rodrigues (UNICAMP)
08:50 – 09:10 Uso de Bancos de Dados NoSQL para Gerenciamento de Dados em Workflow de Bioinformática. Polyane Wercelens (UnB), Fernanda Hondo (UnB), Waldeyr Silva (IFG), Klayton Castro (UnB), Aleteia Araujo (UnB), Maria Emilia Walter (UnB), Maristela Holanda (UnB)
09:10 – 09:30 An Effective Method to Optimize Docking-Based Virtual Screening of Fully-Flexible Receptor Models. Renata De Paris (PUCRS), Christian Vahl Quevedo (PUCRS), Duncan Dubugras Alcoba Ruiz (PUCRS), Osmar Norberto de Souza (PUCRS)
09:30 – 09:50 A Study of Index Structures for K-mer Mapping. Elvismary M. de Armas (PUC-Rio), Marcos V. Marques da Silva (PUC-Rio), Sergio Lifschitz (PUC-Rio)

10:00 - 10:30 Coffee break
10:30 - 12:00 Short course 1: É uma questão de tempo! Extraindo Conhecimento de Redes Sociais Temporais / It’s a matter of time! Knowledge Discovery from Temporal Social Networks (Sara Kubitschek 4)
10:30 - 12:00 Short course 2: Como funciona o Deep Learning / How Deep Learning works (Sara Kubitschek 2)
10:30 - 12:00 DBBIO – Workshop Databases meet Bioinformatics (Sara Kubitschek 3)

10:30 – 11:30 Palestra “Bio-SGBD: precisamos?”, Sergio Lifschitz (PUC-Rio). A grande área de pesquisa da biologia computacional tem apresentado desafios envolvendo o armazenamento, gestão e o acesso aos dados oriundos de pesquisas na área de ciências biológicas e afins. Há uma alta diversidade nos tipos de dados, como por exemplo, conjuntos de imagens tridimensionais, sequências de nucleotídeos de tamanhos variados, e resultados de montagens de fragmentos. Podemos citar também um aumento considerável do volume de dados biológicos, que são disponibilizados em alguns gigabytes para genomas de seres humanos, até vários petabytes nas investigações de micro-arrays. Também é um fato que a frequência de atualizações nos bancos de dados, por conta da utilização massiva das tecnologias NGS – Next-generation Sequencing, cresce exponencialmente. Ou seja, um contexto de pesquisas similar ao que se costuma definir por Big Data. Após mais de 25 anos de pesquisas científicas na área de bioinformática, poderia-se esperar o surgimento de algum tipo de gerenciador de bancos de dados biológicos que viesse a atender as demandas na área. Na prática, encontram-se apenas propostas ou protótipos de SGBDs que atendem parcialmente os requisitos de eficácia e eficiência existentes. Nesta palestra pretende-se discutir alguns dos principais desafios da bioinformática, específicos para a comunidade de bancos de dados, que permitam reflexão sobre as soluções especializadas, as adaptações de SGBDs (relacionais e não-relacionais) existentes e as expectativas de visão do futuro.
11:40 – 12:00 VelvetH-DB: Persistência de Dados no Processo de Montagem de Fragmentos de Sequências Biológicas. Marcos Vinicius Marques da Silva (PUC-Rio), Maristela Terto de Holanda (UnB), Edward Hermann Haeusler (PUC-Rio), Elvismary Molina de Armas (PUC-Rio), Sérgio Lifschitz (PUC-Rio)

12:00 - 13:30 Lunch break
13:30 - 15:00 SBBD DSW – Dataset Showcase Workshop (Sara Kubitschek 3)

13:30 ABERTURA
13:45 – A Twitter Opinion Mining Gold Standard for Brazilian Uprising in 2013. Tiago França (UFRRJ), Jonice Oliveira (UFRJ), José Orlando Gomes (UFRJ)
14:00 – GitSED: Um Conjunto de Dados com Informações Sociais baseado no GitHub. Natércia A. Batista (UFMG), Gabriela B. Alves (UFMG), André Gonzaga (UFMG), Michele Brandão (UFMG)
14:15 – Soccer2014DS: a dataset containing player events from the 2014 World Cup. Marcos Roberto Ribeiro (IFMG), Maria Camila Nardini Barioni (UFU), Sandra de Amo (UFU), Claudia Roncancio (ENSIMAG, France), Cyril Labbé (Université Joseph Fourier – France)
14:30 – Dados de Monitoramento de Projetos de Inclusão Digital do Ministério da Ciência, Tecnologia, Inovações e Comunicações. Diego Pasqualin (C3SL), Luis Carlos De Bona (UFPR), Edemir Maciel (UFPR), Lucas Oliveira (UFPR), Marcos Sunye (UFPR)
14:45 – FiSmo: A Compilation of Datasets from Emergency Situations for Fire and Smoke Analysis. Daniel Chino (USP), Agma Traina (ICMC-USP), Jessica Andressa de Souza (USP), Mirela Cazzolato (USP), José Rodrigues Júnior (ICMC-USP), Jonathan Ramos (UNIR), Letricia Avalhais (USP)

13:30 - 15:00 Short course 3: Data Analytics in Sports: Changing the game (Sara Kubitschek 4)

In the last decades, researchers have been developing different techniques to understand which factors influence the sporting results and, consequently, the role of predictability and randomness in the games. With the current evolution of the techniques of acquisition, storage and processing of large volumes of information, data analyzes has gained even more importance for the discovery of new knowledge and has been transforming the behaviors of all involved with the sport. This chapter presents an introduction to this topic through: (i) a discussion of the influence of data analysis in sports, (ii) the presentation of case studies of success, (iii) an analysis of computational processes for knowledge discovery and prediction modeling, (iv) a comparative analysis of the betting markets, and (v) an exploration of the opportunities generated in this field of research.

13:30 - 15:00 KDMiLe Technical Session 1: Classification (Sara Kubitschek 2)

13:30 Improving Activity Recognition using Temporal Regions. João Paulo Aires (PUC-RS), Juarez Monteiro (PUC-RS), Roger Granada (PUC-RS), Felipe Meneguzzi (PUC-RS) and Rodrigo Barros (PUC-RS).
13:50 Label Powerset for Multi-label Data Streams Classification with Concept Drift. Joel Costa (UFSCar), Elaine Ribeiro de Faria Paiva (UFU), Jonathan Andrade Silva (UFMS) and Ricardo Cerri (UFSCar).
14:10 Using Scene Context to Improve Object Recognition. Leandro Pereira Da Silva (PUC-RS), Roger Granada (PUC-RS), Juarez Monteiro (PUC-RS) and Duncan Dubugras Alcoba Ruiz (PUC-RS).
14:30 Um Método de Aprendizado Multirrótulo baseado em Aprendizado Não-Supervisionado Hierárquico. Rodrigo Rodovalho (UFF) and Flavia Bernardini (UFF).

15:00 - 15:30 Coffee break
15:30 - 17:00 SBBD DSW – Dataset Showcase Workshop (Sara Kubitschek 3)

15:30 – Deduplicação de Nomes e Redes de Co-autoria na DBLP. Mariana O. Silva (UFMG), Michele Brandão (UFMG)
15:45 – LattesDoctoralDataset: Uma Coleção de Dados Estratificados sobre o Conjunto de Doutores Cadastrados na Plataforma Lattes. Thiago Dias (CEFET MG), Alberto Laender (UFMG), Gray Moita (CEFET-MG)
16:00 – IntergenicDB: Banco de dados de regiões intergênicas de Bactérias Gram-Negativas. Daniel Notari (UCS), Jovani Dalzochio (UCS), Camila Rachel Tonin de Andrade (UCS), Jordan da Rosa (UCS), Hugo André Klauck (IFRS), Scheila de Avila e Silva (UCS)
16:15 – MAMMOSET: An Enhanced Dataset of Mammograms. Paulo Oliveira (USP), Lucas Scabora (USP), Mirela Cazzolato (USP), Marcos Bedo (USP), Agma Traina (ICMC-USP), Caetano Traina Júnior (ICMC – USP)
16:30 – Publicando e Consumindo um Conjunto de Dados Abertos Conectados da UAI. Damires Souza (IFPB), Andre Alencar (IFPB)
16:45 – Spatial Datasets for Conducting Experimental Evaluations of Spatial Indices. Anderson Chaves Carniel (USP), Ricardo Ciferri (UFSCAR), Cristina Ciferri (USP)

15:30 - 17:00 Short course 3: Data Analytics in Sports: Changing the game (Sara Kubitschek 4)
15:30 - 17:00 KDMiLe Meetup – Women in Data Science (Sara Kubitschek 2)

Data science is an interdisciplinary field about processes and systems to extract knowledge or insights from data in various forms, either structured or unstructured, which is a continuation of some of the data analysis fields such as statistics, machine learning, data mining, and predictive analytics. Data science encompasses several areas such as data analytics, machine learning, statistics, optimization and managing big data. The Meet-up will bring together women researchers and practitioners in the field to deal with the emerging challenges in processing both from theoretical and practical works on data science and advanced analytics.

17:00 - 17:30 Coffee break
17:30 - 19:20 SBBD/KDMiLe/BRACIS Industrial Panel (Center Convention A1)
19:30 - 22:00 Women in Databases (jantar por adesão para a comunidade feminina de BD): inscrições em https://goo.gl/wc9PTP ! Mensagens do grupo em https://www.facebook.com/groups/womenindb