Full Papers
ST1 – Sessão Técnica 1
Segunda (14/10) | Data Science Applications | Chair: Damires Souza (IFPB) |
---|---|---|
16:30 | Performance Variability of Machine Learning Models using Limited Data for Collusion Detection: A Case Study of the Brazilian Car Wash Operation | Everton Schneider dos Santos (Universidade Federal de Santa Catarina), Matheus Machado dos Santos (Universidade Federal de Santa Catarina), Márcio Castro (Universidade Federal de Santa Catarina), Jonata Tyska Carvalho (Universidade Federal de Santa Catarina) |
16:50 | Detecting Fraud in Public Procurement: A GMM-Based Approach to Analyzing Tender Data | Fernando Schmitz (Federal University of Santa Catarina), Lívia Ferrão (Universidade Federal de Santa Catarina), Matheus Machado dos Santos (Universidade Federal de Santa Catarina), Márcio Castro (Federal University of Santa Catarina), Jonota Tyska Carvalho (Universidade Federal de Santa Catarina) |
17:10 | Na batida do funk: modelagem de tópicos combinando LLM, Engenharia de Prompt e BERTopic | Jesus Yepez (UFRGS), Bruno Santos (UFRGS), Fabíola Peres (UFRGS), Karin Becker (UFRGS) |
17:30 | Contrato360: uma aplicação de perguntas e respostas usando modelos de linguagem, documentos e bancos de dados | Antony Medeiros (BNDES / PUC-Rio), Claudio Fraga (BNDES / PUC-Rio), Joao Nepomuceno (BNDES), Lucas Lago (BNDES), Nicolaas Ruberg (BNDES), Sergio Lifschitz (PUC-Rio) |
17:50 | DepreBERTBR: Um Modelo de Linguagem Pré-treinado para o Domínio da Depressão no Idioma Português Brasileiro | Ayrton Herculano (Instituto Federal da Paraíba), Damires Souza (Instituto Federal da Paraíba (IFPB)), Alex Sandro da Cunha Rêgo (Instituto Federal da Paraíba) |
18:10 | Utilizando Aprendizado de Máquina para Classificação da Dívida Ativa do Estado de Sergipe | Yuri Sant’Anna (Federal Univesity of Pernambuco), Luiz Felipe Souza (Universidade Federal de Sergipe), Antônio Alves Neto (Federal University of Sergipe), André Britto (Universidade Federal do Sergipe), Renê Gusmão (Universidade Federal de Sergipe), Max Castor (Centro Universitário Estácio Sergipe) |
ST2 – Sessão Técnica 2
Segunda (14/10) | Data and Information Quality | Chair: Dimas Cassimiro do Nascimento Filho (UFAPE) |
---|---|---|
16:30 | Análise da Robustez de Algoritmos de Aprendizado de Máquina em Dados do Transtorno do Espectro Autista | Saulo de Freitas Lino (Federal University of Ceará – Quixadá Campus), Lívia Cruz (Universidade Federal do Ceará), Paulo T. Guerra (Universidade Federal do Ceará) |
16:50 | Análise e Publicação de Dados de Processos Eletrônicos em Organizações Públicas | Ivan Salvadori (Federal University of Technology – Paraná) |
17:10 | Humanizing Answers for Compatibility Questions in E-commerce using Large Language Models | Andre Regino (Universidade Estadual de Campinas – Unicamp), Victor Hochgreb de Freitas (GoBots), Julio Dos Reis (Instituto de Computação da Universidade Estadual de Campinas) |
17:30 | Identificação e Caracterização de Reclamações Duplicadas por Consumidores em Múltiplas Plataformas | Gestefane Magalhães (Universidade Federal de Minas Gerais), Marcelo M. R. Araújo (Universidade Federal de Minas Gerais), Júlia de Viterbo (Universidade Federal de Minas Gerais), Marcos Gonçalves (Universidade Federal de Minas Gerais), Gabriel Kakizaki (Universidade Federal de Viçosa), Julio C. S. Reis (Universidade Federal de Viçosa), Raquel Prates (Universidade Federal de Minas Gerais) |
17:50 | Optimizing Botanical Data Integrity: A Comparative Study of Text Similarity Methods | Luma Cerqueira (Universidade Federal de Santa Catarina), Carina F. Dorneles (Universidade Federal de Santa Catarina), Simone Werner (Universidade Federal de Santa Catarina) |
18:10 | Unveiling the Segmentation Power of LLMs: Zero-Shot Invoice Item Description AnalysiS | Vitória Soares dos Santos (Federal University of Santa Catarina), Carina F. Dorneles (Universidade Federal de Santa Catarina) |
ST3- Sessão Técnica 3
Terça (15/10) | Best Papers | Chair: Altigran Soares da Silva (UFAM) |
---|---|---|
14:00 | AkôFlow: um Middleware para Execução de Workflows Científicos em Múltiplos Ambientes Conteinerizados | Daniel de Oliveira (Universidade Federal Fluminense), Aline Paes (Universidade Federal Fluminense), Marcos Bedo (Universidade Federal Fluminense), Liliane Neves de Oliveira Kunstmann (COPPE/UFRJ), Wesley Ferreira (Universidade Federal Fluminense) |
14:20 | Desempenho de operações distribuídas de agrupamento por similaridade em dados de alta dimensionalidade por meio da VP-Tree | Ana Paula da Silva (Universidade Federal de Uberlândia), Humberto Razente (Universidade Federal de Uberlandia) |
14:40 | Evaluating Domain-adapted Language Models for Governmental Text Classification Tasks in Portugues | Mariana O. Silva (Universidade Federal de Minas Gerais), Lucas L. Costa (Universidade Federal de Minas Gerais), Gabriel P. Oliveira (Universidade Federal de Minas Gerais), Gisele Pappa (Universidade Federal de Minas Gerais) |
15:00 | Evolução Incremental de Esquemas de Banco de Dados Orientado a Documentos | Eleonilia Rodrigues (Universidade Federal de Campina Grande), Carlos Santos Pires (Federal University of Campina Grande), Dimas Cassimiro Nascimento (Universidade Federal do Agreste de Pernambuco (UFAPE)) |
15:20 | Privacidade Diferencial em Gradient Boosting Decision Trees com Técnicas de Particionamento para Dados Categóricos | Gabriel Magalhaes Alves (LSBD/UFC), Francisco Pereira (Universidade Federal do Ceará), Iago Chaves (Universidade Federal do Ceará), Javam Machado (Universidade Federal do Ceará) |
15:40 | Scientific Workflow Deployment: Container Provenance in High-Performance ComputinG | Liliane Neves de Oliveira Kunstmann (COPPE/UFRJ), Débora Pina (COPPE/UFRJ), Daniel de Oliveira (Universidade Federal Fluminense), Marta Mattoso (COPPE/UFRJ) |
ST4- Sessão Técnica 4
Terça (15/10) | Specialized Data Management | Chair: Jorge Soares (CEFET/RJ) |
---|---|---|
14:00 | CL-raster: Uma Nova Abordagem para Compactação e Processamento de Séries de Dados Raster | Luana Reis (Universidade Estadual de Londrina), Daniel Kaster (UEL – Universidade Estadual de Londrina) |
14:20 | From Text to Locations: Repurposing Language Models for Spatial Trajectory Similarity Assessment | Wilken Charles Dantas de Melo (Universidade Federal do Ceara), Lívia Cruz (Universidade Federal do Ceará), Regis Magalhães (Universidade Federal do Ceará), Ticiana Linhares Coelho da Silva (Universidade Federal do Ceará), Francesco Lettich (ISTI – CNR – France) |
14:40 | Incorporando os Requisitos e as Restrições da LGPD ao Projeto de Banco de Dados | Patricia Barros (Universidade Federal do Piauí), José Monteiro (Universidade Federal do Ceará), Javam Machado (Federal University of Ceará), Angelo Brayner (Federal University of Ceara) |
15:00 | Locally Differentially Private and Consistent Frequency Estimation of Longitudinal Data | Antônio Marreiras Neto (Federal University of Ceará), Eduardo Rodrigues (Federal University of Ceará), Serafim Costa (Federal University of Ceará), Javam Machado (Federal University of Ceará) |
15:20 | Um Método Centrado em Dados para Melhorar a Segurança de Transportes Coletivos Municipais | Thais Braga (Universidade Federal de Viçosa), Vinícius Almeida (Universidade Federal de Viçosa), Fabrício Silva (Universidade Federal de Viçosa) |
15:40 | Master-MobilityDB: A Persistence and Manipulation Layer for Trajectories of Multiple Aspects | Flaris Feller (Universidade Federal de Santa Catarina), Ronaldo Mello (Universidade Federal de Santa Catarina) |
ST5- Sessão Técnica 5
Terça (15/10) | Machine Learning | Chair: Agma Traina (ICMC-USP) |
---|---|---|
16:30 | An Empirical Analysis of Data Drift Detection Techniques in Machine Learning Systems | Lucas Helfstein (Universidade de São Paulo), Kelly Braghetto (IME/USP) |
16:50 | Combinando Redes Neurais Convolucionais e Distribuição Smoothed Pseudo Wigner Ville na Classificação de Sinais Radar de Baixa Probabilidade de Interceptaçã | Edgard Alves (Instituto Militar de Engenharia), Jorge Alves (Escola Naval), Ronaldo Goldschmidt (Instituto Militar de Engenharia) |
17:10 | Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação | Ney Barchilon (PUC – Pontífice Universidade Catolica – RJ), Helio Vieira Lopes (PUC-Rio), Marcos Kalinowski (PUC-Rio), Jefry Sastre (PUC-Rio) |
17:30 | Identifying Technological Trends: A Patent Analysis Method for Technology Forecasting | Alexandre Gonçalves (Universidade Federal de Santa Catarina), Bartholomeu Barcelos (Universidade Federal de Santa Catarina), Patrick Kochan (Universidade Federal de Santa Catarina) |
17:50 | Leveraging Geographic Feature Embeddings for Enhanced Location-Based Recommendation Systems | Nicolas Moreira Nobre Leite (Federal University of Campina Grande), Claudio Campelo (Universidade Federal de Campina Grande), Salatiel Silva (Federal University of Campina Grande) |
18:10 | Speech Recognition Models in Assisting Medical History | Yanna Gonçalves (Federal University of Ceará), João Alves (Federal University of Ceará), Breno Alef Dourado Sá (Federal University of Ceará), Lazaro Silva (Universidade Federal do Ceará), José Macedo (Universidade Federal do Ceará), Ticiana Linhares Coelho da Silva (Universidade Federal do Ceará) |
ST6- Sessão Técnica 6
Terça (15/10) | NoSQL and Database Engines | Chair: Angelo Augusto Frozza (IFC Camboriú) |
---|---|---|
16:30 | Análise de Desempenho em Banco de Dados Temporais Aplicado no Cenário de Dados de Potência Elétrica | Vitor Santos (Universidade Tecnologica Federal do Parana), Viviane Dal Molin (Universidade Tecnológica Federal do Paraná – UTFPR), Jefferson Oliva (Universidade Tecnológica Federal do Paraná), Ives Pola (Universidade de Sao Paulo) |
16:50 | Enumeration, Tagged Unions, Tuples, and Collections: A Noval Approach to Extracting JSON Schema | Natália Banhara (Universidade Federal da Fronteira Sul), Geomar Schreiner (UFFS), Denio Duarte (UFFS), Samuel Feitosa (Universidade Federal da Fronteira Sul) |
17:10 | Métricas para Análise de Esquemas em Banco de Dados NoSQL Orientado a Documentos | Harley Vera-olivera (Universidad San Antonio Abad del Cusco / Universidade de Brasília – Peru), Maristela Holanda (Universidade de Brasília) |
17:30 | MM-DIRECT: Main memory database instant recovery with tuple consistent checkpoint (dissemination) | Arlino Magalhaes (Federal University of Piaui) Angelo Brayner (Federal University of Ceara) Jose Maria Monteiro (Federal University of Ceara) |
17:50 | Otimização Automática de Parâmetros em Aplicações de Big Data Baseadas em Múltiplos Frameworks | Bruna de Mello (Universidade Federal Fluminense), Yuri Frota (Federal Universidade Federal Fluminense), Daniel de Oliveira (Universidade Federal Fluminense) |
18:10 | Privacy-Preserving Data Synthesis (dissemination) | Chang Ge (University of Minnesota) |
ST7- Sessão Técnica 7
Quarta (16/10) | Semantic web, linked data and ontologies | Chair: Renato Fileto (UFSC) |
---|---|---|
8:30 | A Data Design Pattern for Building and Exploring Semantic Views of Enterprise Knowledge Graphs | Vania Vidal (Universidade Federal do Ceará), Renato Freitas (Universidade Federal do Ceará), Narciso Arruda Jr (University of Ceará), Marco Antonio Casanova (PUC-Rio), Chiara Renso (KDDLAB ISTI/CNR – Italy) |
8:50 | An Ontology for Context Modeling in Smart Spaces (dissemination) | Leonardo Vianna do Nascimento (Federal University of Rio Grande do Sul) José Palazzo Moreira de Oliveira (Federal University of Rio Grande do Sul) |
9:10 | Enhancing heterogeneous mobile network management based on a well-founded reference ontology (dissemination) | Julio Cesar Cardoso Tesolin (Military Institute of Engineering – IME) André M. Demori (Military Institute of Engineering – IME) David Fernandes Cruz Moura (Centro Tecnológico do Exército – CACTT-CPQD) Maria Cláudia Cavalcanti (Military Institute of Engineering – IME) |
9:30 | Towards an Ontology for User Activities on Smart Environments | Leonardo Nascimento (Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul), José Palazzo Moreira de Oliveira (UFRGS) |
ST8- Sessão Técnica 8
Quarta (16/10) | Data Mining and Analytics | Chair: Ticiana Linhares Coelho da Silva (UFC) |
---|---|---|
14:00 | Adicionando suporte à diversificação de resultados em índices HNSW considerando espaços de baixa e alta dimensionalidade | Mauro Weber Universidade Federal Fluminense, João Vitor Leite (Universidade Federal Fluminense), Lucio Fernandes Dutra Santos (IFNMG), Daniel de Oliveira (Universidade Federal Fluminense), Marcos Bedo (Universidade Federal Fluminense) |
14:20 | Análise dos Fatores Socioambientais e Comportamentais na Identificação do Transtorno Obsessivo Compulsivo: Uma Abordagem com Dados da Pesquisa Nacional de Saúde 2019 | Anna Puga Campos Rodrigues (PUC Minas), Luis Zárate (Pntifícia Universidade Católica de Minas Gerais) |
14:40 | Data-Centric AI for predicting non-contact injuries in professional soccer playerS | Matheus Melo (Cefet/RJ), Matheus Maia Vieira (Cefet/RJ), Gabriel Padrão (Cefet/RJ), Diego Brandão (Cefet/RJ), Eduardo Bezerra (Cefet/RJ), Juliano Spineti (Fluminense Football Club), Lucas Giusti (Cefet/RJ), Jorge Soares (Cefet/RJ |
15:00 | How effective is an LLM-based Data Analysis Automation Tool? A Case Study with ChatGPT’s Data Analyst | Beatriz Miranda (Universidade Federal de Campina Grande), Claudio Campelo (Universidade Federal de Campina Grande) |
15;20 | Multidimensional Analysis of the Influence of Socioeconomic and Political Indicators on the Spread of COVID-19: A Case Study of Brazilian Cities (2020-2024) | Rôney Reis (Universidade Federal do Ceará), Miguel Ângelo Souza (Universidade Federal do Ceará), Angelo Brayner (Federal University of Ceara – UFC), Ronaldo Menezes (University of Exeter – Great Britain) |
15:40 | Can a simple review outperform a feature set for predicting churn? | William Beckhauser (Universidade Federal de Santa Catarina), Renato Fileto (Universidade Federal de Santa Catarina) |
ST9- Sessão Técnica 9
Quarta (16/10) | Information Retrieval & NLP | Chair: Marcos André Gonçalves (UFMG) |
---|---|---|
14:00 | An Effective, Efficient, and Scalable Confidence-Based Instance Selection Framework for Transformer-Based Text Classification (dissemination) | Washington Cunha (Federal University of Minas Gerais) Celso França (Federal University of Minas Gerais) Guilherme Fonseca (Federal University of São João del Rei) Leonardo Rocha (Federal University of São João del Rei) Marcos André Gonçalves (Federal University of Minas Gerais) |
14:20 | Busca360: A Search Application in the Context of Top-Side Asset Integrity Management in the Oil & Gas Industry | Yenier Torres Izquierdo (Instituto Tecgraf / PUC – Rio de Janeiro), Melissa Lemos (Tecgraf/ PUC-Rio Institute), Cleber Oliveira (Instituto Tecgraf – PUC-Rio), Bruno Novelli (Instituto TecGraf – PUC-Rio), Grettel Garcia (TecGraf – PUC-Rio), Gustavo M. C. Coelho (Tecgraf/PUC-Rio), Robison Luiz Souza Garcia (CENPES – Petrobras), Marco Antonio Casanova (PUC-Rio) |
14:40 | Can we trust LLMs as relevance judges? | Luciana Bencke (UFRGS), Felipe Paula (UFRGS), Bruno Santos (UFRGS), Viviane Moreira (UFRGS) |
15:00 | SIDEAS – Detectando a Similaridade Semântica de Discursos | Rita Carolina da Costa (Universidade Federal de Santa Catarina), Renato Fileto (Universidade Federal de Santa Catarina), Osmar Braz Junior (Universidade do Estado de Santa Catarina) |
15:20 | Um Estudo sobre o uso de Modelos de Linguagem Abertos na Tarefa de Recomendação de Próximo Item | Marcos Lima (Universidade Federal do Amazonas (UFAM)), Eduardo Silva (Universidade do Vale do Itajaí), Altigran Soares da Silva (Universidade Federal do Amazonas) |
15:40 | Composition of Heterogeneous Node Embeddings – Unlocking the Power of Heterogeneous Graph Representation | Silvio Angonese (UFRGS), Renata Galante (UFRGS) |
ST10- Sessão Técnica 10
Quinta (17/10) | Workflows & Evolving Systems | Chair: Eduardo Ogasawara (CEFET/RJ) |
---|---|---|
8:30 | DLProv: A data-centric support for deep learning workflow analyses (dissemination) | Débora Pina (COPPE/UFRJ) Adriane Chapman (University of Southampton) Liliane Kunstmann (COPPE/UFRJ) Daniel de Oliveira (Universidade Federal Fluminense) Marta Mattoso (COPPE/UFRJ) |
8:50 | Prediction of the next transaction on Payment Dataset with Deep Learning Models | Claudia Francesca Suarez Mariscal (UFRGS), Renata Galante (UFRGS), Weverton Cordeiro (UFRGS) |
9:10 | Statistical Validation of Column Matching in the Database Schema Evolution of the Brazilian Public School Census | Muriki Yamanaka (Federal University of paraná), Diogo Henrique de Almeida (Universidade Federal do Paraná), Paulo Ricardo de Almeida (Univerdidade Federal do Paraná), Simone Dominico (Universidade Federal do Paraná), Leticia Peres (Universidade Federal do Parana), Marcos Sunye (Universidade Federal do Parana), Eduardo de Almeida (Universidade Federal do Paraná) |
9:30 | Uma Heurística para a Execução de Workflows com Restrições de Confidencialidade em Ambientes Conteinerizados | Rodrigo da Silva (Universidade Federal Fluminense), Wesley Ferreira (Universidade Federal Fluminense), Yuri Frota (Federal Universidade Federal Fluminense), Daniel de Oliveira (Universidade Federal Fluminense) |