{"id":912,"date":"2017-04-11T16:47:51","date_gmt":"2017-04-11T19:47:51","guid":{"rendered":"http:\/\/sbbd.org.br\/2017\/?page_id=912"},"modified":"2017-07-14T15:39:12","modified_gmt":"2017-07-14T18:39:12","slug":"dsw","status":"publish","type":"page","link":"https:\/\/sbbd.org.br\/2017\/index.php\/dsw\/","title":{"rendered":"SBBD Dataset Showcase Workshop"},"content":{"rendered":"<p><strong>SBBD DSW &#8211; Dataset Showcase Workshop<\/strong><br \/>\nNovo workshop a ser realizado junto ao SBBD 2017<br \/>\n02 a 05 de outubro de 2017 em Uberl\u00e2ndia, MG<\/p>\n<p><a href=\"https:\/\/www.sbc.org.br\/sbbd\/2017\/dsw\">https:\/\/www.sbc.org.br\/sbbd\/2017\/dsw<\/a><\/p>\n<p>A publica\u00e7\u00e3o e a disponibiliza\u00e7\u00e3o de conjuntos de dados (abertos ou n\u00e3o) t\u00eam se tornado altamente relevante devido \u00e0 grande aten\u00e7\u00e3o dada por v\u00e1rios segmentos, como a m\u00eddia, ind\u00fastria, academia e governo. A tarefa de disponibiliza\u00e7\u00e3o de dados \u00e9 importante por in\u00fameros motivos, que v\u00e3o desde sua reutiliza\u00e7\u00e3o em aplicativos digitais desenvolvidos pela sociedade, at\u00e9 a possibilidade de reprodu\u00e7\u00e3o de experimentos desenvolvimentos pela comunidade cient\u00edfica. Portanto, no contexto da comunidade brasileira de bancos de dados, tornar conjuntos de dados dispon\u00edveis \u00e9 intrisincamente importante devido ao fomento para novas quest\u00f5es de pesquisa e desenvolvimento que tal tarefa pode atingir. Como exemplos de casos de sucesso de disponibiliza\u00e7\u00e3o p\u00fablica (e organizada) de dados citam-se:<\/p>\n<p>&#8211; Centre for Environmental Data Analysis, UK &#8211; <a href=\"https:\/\/www.ceda.ac.uk\/blog\/dataset-showcase-cru-data\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.ceda.ac.uk\/blog\/dataset-showcase-cru-data<\/a>;<br \/>\n&#8211; CODATA &#8211; <a href=\"https:\/\/www.codata.org\/task-groups\/data-citation-standards-and-practices\/datacitation-past-achievements\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.codata.org\/task-groups\/data-citation-standards-and-practices\/datacitation-past-achievements<\/a>;<br \/>\n&#8211; Data.BetaNYC &#8211; <a href=\"https:\/\/data.beta.nyc\/showcase\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/data.beta.nyc\/showcase<\/a>;<br \/>\n&#8211; Data Citation Synthesis Group (2014). Joint Declaration of Data Citation Principles. Martone M. <a href=\"https:\/\/www.force11.org\/group\/joint-declaration-datacitation-principles-final\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.force11.org\/group\/joint-declaration-datacitation-principles-final<\/a>;<br \/>\n&#8211; Data Viva &#8211; <a href=\"https:\/\/dataviva.info\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/dataviva.info<\/a>;<br \/>\n&#8211; Portal Brasileiro de Dados Abertos &#8211; <a href=\"https:\/\/dados.gov.br\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/dados.gov.br<\/a>; e<br \/>\n&#8211; SF OpenData &#8211; <a href=\"https:\/\/data.sfgov.org\/showcase\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/data.sfgov.org\/showcase<\/a>.<\/p>\n<p>Por\u00e9m, mesmo com tanta publicidade, as tarefas de criar, coletar, tratar e disponibilizar dados publicamente continuam apresentando muitos desafios t\u00e9cnicos. Na verdade, a simples tarefa de encontrar uma boa fonte de dados e extra\u00ed-los podem ser atividades tecnicamente complexas. Talvez, mais complexo ainda, seja tratar os dados de modo a apresent\u00e1-los atrav\u00e9s de uma representa\u00e7\u00e3o coerente e cujas informa\u00e7\u00f5es obtidas sejam \u00fateis e semanticamente corretas. Da mesma forma, a coleta e o tratamento dos dados para o relato de experimentos cient\u00edficos para uma comunidade de banco de dados pode ser considerada uma tarefa exaustiva, trabalhosa e muito desafiadora &#8212; por outro lado, se o conjunto de dados estiver bem organizado, com uma metodologia de execu\u00e7\u00e3o bem elaborada, a implementa\u00e7\u00e3o e compara\u00e7\u00e3o de algoritmos pode ser altamente facilitada.<\/p>\n<p><strong>NOVO WORKSHOP DO SBBD<\/strong><\/p>\n<p>O prop\u00f3sito do SBBD DSW \u00e9 prover um f\u00f3rum para compartilhar e discutir as formas de constru\u00e7\u00e3o e organiza\u00e7\u00e3o de conjuntos de dados que servem como base para os trabalhos de pesquisa desenvolvidos na comunidade do SBBD ou de seu interesse. A contribui\u00e7\u00e3o de um artigo a ser publicado no SBBD DSW \u00e9 o produto final na forma de um dataset, geralmente extra\u00eddo de algum banco de dados ou plataforma Web, limpo e tratado, muitas vezes incrementado com dados externos, e poss\u00edvel de ser reutilizado em outras cen\u00e1rios, ou para a reprodu\u00e7\u00e3o de experimentos. A contribui\u00e7\u00e3o \u00e9 o produto na forma do dataset, mas o artigo deve apresentar todas as informa\u00e7\u00f5es necess\u00e1rias para compreender e utilizar o mesmo.<\/p>\n<p>Complementando as vantagens t\u00e9cnico-cient\u00edficas, o SBBD DSW \u00e9 uma maneira interessante de levar mais participantes para o evento principal. Por exemplo, considerando o caso em que um artigo seja aceito no SBBD e seus autores s\u00e3o dois estudantes e o\/a respectivo\/a orientador\/a. Como via de regra, as ag\u00eancias de fomento s\u00f3 auxiliam um autor por artigo. Se esse mesmo artigo estiver utilizando um dataset interessante, os autores poderiam submet\u00ea-lo para o workshop e, com mais um artigo aceito, procurar fomento para outro autor.<\/p>\n<p>Al\u00e9m de aumentar a participa\u00e7\u00e3o no evento, existe a possibilidade real de melhorar a colabora\u00e7\u00e3o entre diferentes grupos atrav\u00e9s do compartilhamento dos dados utilizados em artigos cient\u00edficos. Tal compartilhamento tamb\u00e9m permitiria aumentar a visibilidade do SBBD em termos de cita\u00e7\u00f5es para seus workshops, nesse caso o SBBD DSW.<\/p>\n<p><strong>SUBMISS\u00d5ES<\/strong><\/p>\n<p>Os artigos devem descrever os dados conforme tratados pelos seus autores e disponibilizados publicamente. Por princ\u00edpio, o conjunto de dados precisa ser \u00fatil e de r\u00e1pida reutiliza\u00e7\u00e3o por terceiros, atrav\u00e9s de por exemplo: (1) adi\u00e7\u00e3o de valor aos dados para outras pessoas da comunidade, sendo pr\u00e9-processados ou filtrados de alguma maneira; (2) organiza\u00e7\u00e3o f\u00e1cil de entender atrav\u00e9s de um esquema, dicion\u00e1rio, taxonomia, ontologia, ou outro formalismo; (3) acesso facilitado por mecanismos pr\u00f3prios; ou (4) apresenta\u00e7\u00e3o de qualidade diferenci\u00e1vel por meio de curadoria e limpeza complexas.<\/p>\n<p>Artigos submetidos para o SBBD DSW devem: ser escritos em portugu\u00eas, ingl\u00eas ou espanhol, possuir obrigatoriamente um resumo em ingl\u00eas, estar no formato da SBC, ter entre 6 e 10 p\u00e1ginas (sendo poss\u00edvel uma p\u00e1gina extra dedicada apenas a refer\u00eancias e agradecimentos) e ser submetidos via JEMS. Cada submiss\u00e3o deve incluir:<\/p>\n<p>&#8211; uma descri\u00e7\u00e3o da(s) fonte(s) de dados, ou como os mesmos foram gerados e\/ou coletados;<br \/>\n&#8211; uma descri\u00e7\u00e3o da metodologia completa de coleta (com a ferramenta utilizada para criar ou gerar os dados, e disponibiliza\u00e7\u00e3o p\u00fablica da mesma);<br \/>\n&#8211; uma descri\u00e7\u00e3o do mecanismo de armazenamento, incluindo, se existir, o esquema ou dicion\u00e1rio de dados que facilite a sua utiliza\u00e7\u00e3o por terceiros;<br \/>\n&#8211; uma descri\u00e7\u00e3o quantitativa ou apresenta\u00e7\u00e3o de estat\u00edsticas sobre conjunto de dados criado;<br \/>\n&#8211; uma descri\u00e7\u00e3o de como os dados t\u00eam sido utilizados (no caso, se existir, referenciar explicitamente artigos j\u00e1 publicados ou em processo de submiss\u00e3o que utilizam os dados e como);<br \/>\n&#8211; uma descri\u00e7\u00e3o que comprove o car\u00e1ter in\u00e9dito (ou seja, mesmo que o dataset tenha sido utilizado em algum artigo publicado, a sua descri\u00e7\u00e3o completa conforme realizada na submiss\u00e3o para o Workshop precisa ser in\u00e9dita);<br \/>\n&#8211; discuss\u00e3o de desafios existentes e poss\u00edveis limita\u00e7\u00f5es na utiliza\u00e7\u00e3o dos dados;<br \/>\n&#8211; ideias para diferentes utiliza\u00e7\u00f5es dos dados, cen\u00e1rios, quest\u00f5es de pesquisa que poderiam ser elaboradas ou resolvidas a partir da disponibiliza\u00e7\u00e3o dos mesmos, e quais melhorias poderiam ser aplicadas aos dados; e<br \/>\n&#8211; localiza\u00e7\u00e3o p\u00fablica para download, pois o conjunto de dados deve estar publicamente dispon\u00edvel no momento de submiss\u00e3o do artigo para revis\u00e3o.<\/p>\n<p>\u00c9 importante notar que as submiss\u00f5es para o SBBD DSW n\u00e3o devem se sobrepor \u00e0s submiss\u00f5es para o evento principal e seus sat\u00e9lites, pois a contribui\u00e7\u00e3o \u00e9 completamente distinta da dos artigos atualmente publicados no SBBD. Em especial, artigos de data showcase *n\u00e3o* s\u00e3o:<\/p>\n<p>&#8211; survey, revis\u00f5es sistem\u00e1ticas, estudos emp\u00edricos ou de avalia\u00e7\u00e3o experimental;<br \/>\n&#8211; artigos com proposta de ferramentas para gera\u00e7\u00e3o e tratamento de dados;<br \/>\n&#8211; baseados em heur\u00edsticas de coleta fracas e duvid\u00e1veis; ou<br \/>\n&#8211; aplica\u00e7\u00f5es simples de ferramentas gen\u00e9ricas para gerar dados que podem ser r\u00e1pida e facilmente utilizadas por qualquer pessoa.<\/p>\n<p>Cada submiss\u00e3os ser\u00e1 avaliada por pelo menos tr\u00eas membros do comit\u00ea de programa, a fim de prover maior e diversificado feedback para os autores das submiss\u00f5es. Os quesitos de avalia\u00e7\u00e3o consideram: legibilidade do artigo (incluindo organiza\u00e7\u00e3o, apresenta\u00e7\u00e3o, ortografia e fluxo de ideias), disponibilidade p\u00fablica do dataset e de ferramentas necess\u00e1rias para acess\u00e1-lo ou replic\u00e1-lo, complexidade dos processos de coleta e tratamento dos dados, utiliza\u00e7\u00e3o realizada e potenciais utiliza\u00e7\u00f5es futuras para os dados, bem como desafios e limita\u00e7\u00f5es existentes.<\/p>\n<p>A publica\u00e7\u00e3o dos trabalhos aceitos \u00e9 condicional \u00e0 inscri\u00e7\u00e3o no SBBD e apresenta\u00e7\u00e3o oral de um dos autores durante o evento.<\/p>\n<p><strong>T\u00d3PICOS DE INTERESSE<\/strong><\/p>\n<p>Os t\u00f3picos de interesse do SBBD DSW s\u00e3o os mesmos da confer\u00eancia principal. Em especial, espera-se que os artigos apresentem conjuntos de dados que possam ser utilizados em pesquisas relacionadas a (lista n\u00e3o exaustiva):<\/p>\n<p>&#8211; An\u00e1lise e Visualiza\u00e7\u00e3o de Dados;<br \/>\n&#8211; Aplica\u00e7\u00f5es Cient\u00edficas, Ci\u00eancia dos Dados e Interdisciplinaridade com outras Ci\u00eancias (incluindo e-science e Data Science);<br \/>\n&#8211; Armaz\u00e9ns de Dados e OLAP;<br \/>\n&#8211; Autoriza\u00e7\u00e3o, Privacidade, Anonimiza\u00e7\u00e3o e Seguran\u00e7a em Bancos de Dados;<br \/>\n&#8211; Bibliotecas Digitais;<br \/>\n&#8211; Diferentes tipos de Bancos de Dados (ativos, Web, streams, strings, documentos, na nuvem, dados interligados, Web sem\u00e2ntica e RDF, heterog\u00eaneos, semiestruturados, XML, m\u00f3veis, de sensores, multidimencionais, temporais, espaciais e GPS, multim\u00eddia, NoSQL, NewSQL, estat\u00edsticos, etc.);<br \/>\n&#8211; Integra\u00e7\u00e3o de Informa\u00e7\u00e3o e Interoperabilidade;<br \/>\n&#8211; Minera\u00e7\u00e3o de Dados;<br \/>\n&#8211; Processamento de Dados em Novo Hardware;<br \/>\n&#8211; Proveni\u00eancia de Dados;<br \/>\n&#8211; Recupera\u00e7\u00e3o de Informa\u00e7\u00e3o;<br \/>\n&#8211; Redes Sociais;<br \/>\n&#8211; Sistemas de Recomenda\u00e7\u00e3o; e<br \/>\n&#8211; Workflow.<\/p>\n<p><strong>DATAS IMPORTANTES<\/strong><\/p>\n<p>&#8211; Data limite para submiss\u00e3o: <del>15 de julho<\/del>\u00a0 <strong>29 de julho de 2017 (prazo final)<\/strong><br \/>\n&#8211; Notifica\u00e7\u00e3o de trabalhos aceitos: <del>16 de agosto<\/del>\u00a0 20 de agosto de 2017<br \/>\n&#8211; Vers\u00e3o final para publica\u00e7\u00e3o nos anais: <del>23 de agosto<\/del>\u00a0 25 de agosto de 2017<\/p>\n<p><strong>COORDENA\u00c7\u00c3O<\/strong><\/p>\n<p>Mirella M. Moro, Universidade Federal de Minas Gerais<br \/>\nCarina F. Dorneles, Universidade Federal de Santa Catarina<\/p>\n<p><strong>COMIT\u00ca DE PROGRAMA (em forma\u00e7\u00e3o)<\/strong><\/p>\n<p>Alberto H. F. Laender, UFMG<br \/>\nBernadette Farias L\u00f3scio, UFPE<br \/>\nDaniel de Oliveira, UFF<br \/>\nDaniel Kaster, UEL<br \/>\nEduardo Ogasawara, CEFET RJ<br \/>\nGiseli R. Lopes, UFRJ<br \/>\nHelena Grazziotin, UCS<br \/>\nJo\u00e3o Eduardo Ferreira, USP<br \/>\nJos\u00e9 Palazzo M. de Oliveira, UFRGS<br \/>\nJussara Almeida, UFMG<br \/>\nLuciano Barbosa, UFPE<br \/>\nRenata M. Galante, UFRGS<br \/>\nRobson Cordeiro, USP S\u00e3o Carlos<br \/>\nRonaldo S. Mello, UFSC<br \/>\nS\u00e9rgio Lifschitz, PUC Rio<br \/>\nVanessa Braganholo, UFF<br \/>\nVaninha Vieira, UFBA<\/p>\n","protected":false},"excerpt":{"rendered":"<p>SBBD DSW &#8211; Dataset Showcase Workshop Novo workshop a ser realizado junto ao SBBD 2017 02 a 05 de outubro&hellip; <\/p>\n","protected":false},"author":7,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-912","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/pages\/912","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/users\/7"}],"replies":[{"embeddable":true,"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/comments?post=912"}],"version-history":[{"count":4,"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/pages\/912\/revisions"}],"predecessor-version":[{"id":1065,"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/pages\/912\/revisions\/1065"}],"wp:attachment":[{"href":"https:\/\/sbbd.org.br\/2017\/index.php\/wp-json\/wp\/v2\/media?parent=912"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}