DATAS IMPORTANTES
• Prazo para envio: 26 de junho de 2022 13 de julho de 2022
• Notificação de trabalhos aceitos: 25 de julho de 2022 31 de julho de 2022
• Envio da versão final: 31 de julho de 2022 7 de agosto de 2022
DSW – Dataset Showcase Workshop
A publicação e disponibilização de conjuntos de dados (abertos ou não) tornaram-se altamente relevantes devido à grande atenção dada por diversos segmentos, como mídia, indústria, academia e governo. A tarefa de disponibilizar dados é importante por inúmeros motivos, que vão desde sua reutilização em aplicativos digitais desenvolvidos pela sociedade, até a possibilidade de reprodução de experimentos e desenvolvimentos pela comunidade científica. Portanto, no contexto da comunidade brasileira de banco de dados, disponibilizar conjuntos de dados é intrinsecamente importante devido à promoção de novas questões de pesquisa e desenvolvimento que tal tarefa pode alcançar.
Assim, o objetivo do SBBD DSW é fornecer um fórum para compartilhar e discutir as formas de construção e organização de conjuntos de dados que servem de base para os trabalhos de pesquisa realizados na comunidade científica brasileira. A contribuição de um artigo a ser publicado no SBBD DSW é o produto final na forma de um dataset, geralmente extraído de alguma base de dados ou plataforma Web, limpo e tratado, muitas vezes aumentado com dados externos, e passível de ser reutilizado em outros cenários, ou para reproduzir experimentos. A contribuição é o produto na forma do conjunto de dados, mas o artigo deve apresentar todas as informações necessárias para compreendê-lo e utilizá-lo.
Submissões
Os artigos devem descrever os dados tratados por sua equipe de autoria e disponibilizados ao público. Em princípio, o conjunto de dados precisa ser útil e rapidamente reutilizado por terceiros, por meio, por exemplo: agregar valor aos dados para outras pessoas da comunidade, sendo pré-processados ou filtrados de alguma forma; organização fácil de entender por meio de um esquema, dicionário, taxonomia, ontologia ou outro formalismo; acesso facilitado por mecanismos próprios; ou apresentação de qualidade distinguível através de curadoria e limpeza complexa.
Os artigos submetidos ao SBBD DSW devem ser redigidos em português, inglês ou espanhol, devem ter resumo em inglês, estar no formato SBC, ter entre 6 e 10 páginas (sendo possíveis até duas páginas extras apenas para referências e agradecimentos) ) e ser submetido via JEMS (disponível em breve). Cada submissão deve incluir conforme apropriado e na ordem que a equipe de autoria preferir:
- descrição da(s) fonte(s) de dados e da metodologia completa de coleta ou geração (com disponibilização pública da ferramenta utilizada para criar ou gerar os dados, se for o caso, e);
- descrição do mecanismo de armazenamento, incluindo, se houver, esquema ou dicionário de dados, taxonomia, ontologia ou outro formalismo que facilite seu uso por terceiros;
- descrição quantitativa da base de dados criada, bem como análise inicial dos dados caracterizando a base de dados e relatando a quantidade de dados faltantes, tabelas e outras informações importantes que podem ser utilizadas para avaliar a qualidade da base de dados;
- descrição de como os dados foram utilizados (se houver, referem-se a artigos publicados ou em processo de submissão que utilizam os dados e como) e de seu caráter inédito, pois mesmo com o uso em qualquer artigo ou submissão, a descrição completa dos dados o conjunto de dados conforme realizado na submissão ao DSW deve ser inédito;
- discussão dos desafios existentes e possíveis limitações no uso de dados;
- ideias para diferentes usos dos dados, cenários, questões de pesquisa que poderiam ser elaboradas ou resolvidas a partir da disponibilidade dos dados e quais melhorias poderiam ser aplicadas aos dados;
- e local público para download, pois o conjunto de dados deve estar disponível publicamente no momento da submissão do artigo para revisão. De preferência, use plataformas online especializadas adequadas para manutenção de dados públicos, incluindo github, zenodo, figshare ou osf (ou seja, evite repositórios privados, como diretório do Google Drive, dropbox, onedrive e similares).
É importante observar que as submissões ao DSW do SBBD não devem se sobrepor às submissões ao evento principal e seus satélites, pois a contribuição é completamente diferente dos artigos atualmente publicados no SBBD. Em particular, os artigos de demonstração de dados *not*:
- levantamento, revisões sistemáticas, estudos empíricos ou avaliação experimental;
- artigos com propostas de ferramentas para geração e processamento de dados;
- baseado em heurísticas de coleta fracas e duvidosas;
- ou aplicações simples de ferramentas genéricas para gerar dados que podem ser usados de forma rápida e fácil por qualquer pessoa.
Tópicos de Interesse
Os temas de interesse do SBBD DSW são os mesmos da conferência principal, ampliando-se para temas atuais de pesquisa em diversas áreas da Ciência da Computação e outras ciências, bem como diferentes contextos relacionados a governo, educação, cultura, economia, transporte e saúde. Em particular, espera-se que os artigos apresentem conjuntos de dados que possam ser usados em pesquisas relacionadas a (lista não exaustiva):
Aplicações Científicas, Ciência de Dados e Interdisciplinaridade com outras Ciências, incluindo e-science;
Aplicações e Áreas Relacionadas a Bancos de Dados (análise e visualização de dados, aprendizado de máquina, bibliotecas digitais, mineração de dados, recuperação de informação, redes sociais, sistemas de recomendação, sistemas de informação, Web, workflow e afins);
Outras áreas relacionadas à Computação (incluindo, mas não se limitando a, todas aquelas que possuem Grupo de Interesse ou Comissão Especial na SBC, e suas aplicações como benchmarks, baselines, ground truths e afins);
Diferentes tipos de Bancos de Dados (ativos, Web, streams, strings, documentos, na nuvem, dados interligados, Web Semântica e RDF, heterogêneos, semiestruturados, XML, móveis, sensores, multidimensionais, temporais, espaciais e GPS, multimídia, NoSQL , NewSQL, estatísticas e similares);
Engenharia de Dados (data warehouses e OLAP; autorização, privacidade, anonimização e segurança em bancos de dados; integração e interoperabilidade de informações; processamento de dados em novo hardware; proveniência de dados).
Coordenação DSW
Carina F. Dorneles, UFSC
Mirella M. Moro, UFMG
Eric Araujo, UFLA
As edições anteriores estão disponíveis em http://bit.ly/sbbd-dsw