O propósito SBBD DSW é prover um fórum para compartilhar e discutir as formas de construção e organização de conjuntos de dados que servem como base para os trabalhos de pesquisa desenvolvidos na comunidade científica brasileira. A contribuição de um artigo a ser publicado no SBBD DSW é o produto final na forma de um dataset, geralmente extraído de algum banco de dados ou plataforma Web, limpo e tratado, muitas vezes incrementado com dados externos, e possível de ser reutilizado em outras cenários, ou para a reprodução de experimentos. A contribuição é o produto na forma do dataset, mas o artigo deve apresentar todas as informações necessárias para compreender e utilizar o mesmo.
Submissão
Os artigos devem descrever os dados conforme tratados pelo seu time de autoria e disponibilizados publicamente. Por princípio, o conjunto de dados precisa ser útil e de rápida reutilização por terceiros, através de por exemplo: adição de valor aos dados para outras pessoas da comunidade, sendo pré-processados ou filtrados de alguma maneira; organização fácil de entender através de um esquema, dicionário, taxonomia, ontologia, ou outro formalismo; acesso facilitado por mecanismos próprios; ou apresentação de qualidade diferenciável por meio de curadoria e limpeza complexas.
Artigos submetidos para o SBBD DSW devem ser escritos em português, inglês ou espanhol, possuir obrigatoriamente um resumo em inglês, estar no formato da SBC, ter entre 6 e 10 páginas (sendo possível até duas páginas extra apenas a referências e agradecimentos) e ser submetidos via JEMS. Cada submissão deve incluir conforme adequado e na ordem em que a equipe de autoria preferir:
- descrição da(s) fonte(s) de dados e da metodologia completa de coleta ou geração dos mesmos (com disponibilização pública da ferramenta utilizada para criar ou gerar os dados se for o caso, e);
- descrição do mecanismo de armazenamento, incluindo, se existir, esquema ou dicionário de dados, taxonomia, ontologia, ou outro formalismo que facilite a sua utilização por terceiros;
- descrição quantitativa da base de dados criada, bem como análise inicial dos dados caracterizando a base e informando a quantidade de dados faltantes, tabelas e outras informações importantes que possam ser usadas para avaliar a qualidade do dataset;
- descrição de como os dados têm sido utilizados (se existir, referenciar artigos publicados ou em processo de submissão que utilizam os dados e como) e de seu caráter inédito, pois mesmo com a utilização em algum artigo ou submissão, a descrição completa do dataset conforme realizada na submissão para o DSW precisa ser inédita;
- discussão de desafios existentes e possíveis limitações na utilização dos dados;
- ideias para diferentes utilizações dos dados, cenários, questões de pesquisa que poderiam ser elaboradas ou resolvidas a partir da disponibilização dos mesmos, e quais melhorias poderiam ser aplicadas aos dados; e
- localização pública para download, pois o conjunto de dados deve estar publicamente disponível no momento de submissão do artigo para revisão. De preferência, utilizar plataformas online especializadas e adequadas para manutenção pública de dados, incluindo github, zenodo, figshare ou osf (ou seja, evitar repositórios particulares como diretório de Google Drive, dropbox, onedrive, e similares).
É importante notar que as submissões para o SBBD DSW não devem se sobrepor às submissões para o evento principal e seus satélites, pois a contribuição é completamente distinta da dos artigos atualmente publicados no SBBD. Em especial, artigos de data showcase *não* são:
- survey, revisões sistemáticas, estudos empíricos ou de avaliação experimental;
- artigos com proposta de ferramentas para geração e tratamento de dados;
- baseados em heurísticas de coleta fracas e duvidáveis; ou
- aplicações simples de ferramentas genéricas para gerar dados que podem ser rápida e facilmente utilizadas por qualquer pessoa.
Recomenda-se verificar artigos publicados em edições anteriores do SBBD DSW e adicionar referências conforme necessário.
Informações sobre avaliação e tópicos de interesse estão disponíveis na página https://sites.google.com/view/sbbd-dsw/
Datas Importantes
– Data limite para submissão: 3 de julho, 2023 (DATA FINAL!)
– Notificação de trabalhos aceitos: até 01 de agosto, 2023
– Versão final para publicação nos anais: 07 de agosto, 2023
Coordenação
Carina F. Dorneles, UFSC
Eric Araújo, UFLA
Mirella M. Moro, UFMG