Full Papers

ST1 – Sessão Técnica 1

Segunda
(14/10)
Data Science Applications Chair: Damires Souza (IFPB)
16:30Na batida do funk: modelagem de tópicos combinando LLM, Engenharia de Prompt e BERTopicJesus Yepez (UFRGS),
Bruno Santos (UFRGS),
Fabíola Peres (UFRGS),
Karin Becker (UFRGS)
16:50Contrato360: uma aplicação de perguntas e respostas usando modelos de linguagem, documentos e bancos de dadosAntony Medeiros (BNDES / PUC-Rio),
Claudio Fraga (BNDES / PUC-Rio),
Joao Nepomuceno (BNDES),
Lucas Lago (BNDES),
Nicolaas Ruberg (BNDES),
Sergio Lifschitz (PUC-Rio)
17:10DepreBERTBR: Um Modelo de Linguagem Pré-treinado para o Domínio da Depressão no Idioma Português BrasileiroAyrton Herculano (Instituto Federal da Paraíba),
Damires Souza (Instituto Federal da Paraíba (IFPB)),
Alex Sandro da Cunha Rêgo (Instituto Federal da Paraíba)
17:30Detecting Fraud in Public Procurement: A GMM-Based Approach to Analyzing Tender DataFernando Schmitz (Federal University of Santa Catarina),
Lívia Ferrão (Universidade Federal de Santa Catarina),
Matheus Machado dos Santos (Universidade Federal de Santa Catarina),
Márcio Castro (Federal University of Santa Catarina),
Jonota Tyska Carvalho (Universidade Federal de Santa Catarina)
17:50Performance Variability of Machine Learning Models using Limited Data for Collusion Detection: A Case Study of the Brazilian Car Wash OperationEverton Schneider dos Santos (Universidade Federal de Santa Catarina),
Matheus Machado dos Santos (Universidade Federal de Santa Catarina),
Márcio Castro (Universidade Federal de Santa Catarina),
Jonata Tyska Carvalho (Universidade Federal de Santa Catarina)
18:10Utilizando Aprendizado de Máquina para Classificação da Dívida Ativa do Estado de SergipeYuri Sant’Anna (Federal Univesity of Pernambuco),
Luiz Felipe Souza (Universidade Federal de Sergipe),
Antônio Alves Neto (Federal University of Sergipe),
André Britto (Universidade Federal do Sergipe),
Renê Gusmão (Universidade Federal de Sergipe),
Max Castor (Centro Universitário Estácio Sergipe)

ST2 – Sessão Técnica 2

Segunda (14/10)Data and Information Quality Chair: Dimas Cassimiro do Nascimento Filho (UFAPE)
16:30Análise da Robustez de Algoritmos de Aprendizado de Máquina em Dados do Transtorno do Espectro AutistaSaulo de Freitas Lino (Federal University of Ceará – Quixadá Campus),
Lívia Cruz (Universidade Federal do Ceará),
Paulo T. Guerra (Universidade Federal do Ceará)
16:50Análise e Publicação de Dados de Processos Eletrônicos em Organizações PúblicasIvan Salvadori (Federal University of Technology – Paraná)
17:10Humanizing Answers for Compatibility Questions in E-commerce using Large Language ModelsHumanizing Answers for Compatibility Questions in E-commerce using Large Language Models
17:30Identificação e Caracterização de Reclamações Duplicadas por Consumidores em Múltiplas PlataformasGestefane Magalhães (Universidade Federal de Minas Gerais),
Marcelo M. R. Araújo (Universidade Federal de Minas Gerais),
Júlia de Viterbo (Universidade Federal de Minas Gerais),
Marcos Gonçalves (Universidade Federal de Minas Gerais),
Gabriel Kakizaki (Universidade Federal de Viçosa),
Julio C. S. Reis (Universidade Federal de Viçosa),
Raquel Prates (Universidade Federal de Minas Gerais)
17:50Optimizing Botanical Data Integrity: A Comparative Study of Text Similarity MethodsLuma Cerqueira (Universidade Federal de Santa Catarina),
Carina F. Dorneles (Universidade Federal de Santa Catarina),
Simone Werner (Universidade Federal de Santa Catarina)
18:10Unveiling the Segmentation Power of LLMs: Zero-Shot Invoice Item Description AnalysiSVitória Soares dos Santos (Federal University of Santa Catarina),
Carina F. Dorneles (Universidade Federal de Santa Catarina)

ST3- Sessão Técnica 3

Terça (15/10)Best Papers Chair: Altigran Soares da Silva (UFAM)




14:00




AkôFlow: um Middleware para Execução de Workflows Científicos em Múltiplos Ambientes Conteinerizados
Daniel de Oliveira (Universidade Federal Fluminense),
Aline Paes (Universidade Federal Fluminense),
Marcos Bedo (Universidade Federal Fluminense),
Liliane Neves de Oliveira Kunstmann (COPPE/UFRJ),
Wesley Ferreira (Universidade Federal Fluminense)

14:20

Desempenho de operações distribuídas de agrupamento por similaridade em dados de alta dimensionalidade por meio da VP-Tree
Ana Paula da Silva (Universidade Federal de Uberlândia),
Humberto Razente (Universidade Federal de Uberlandia)



14:40



Evaluating Domain-adapted Language Models for Governmental Text Classification Tasks in Portugues
Mariana O. Silva (Universidade Federal de Minas Gerais),
Lucas L. Costa (Universidade Federal de Minas Gerais),
Gabriel P. Oliveira (Universidade Federal de Minas Gerais),
Gisele Pappa (Universidade Federal de Minas Gerais)


15:00


Evolução Incremental de Esquemas de Banco de Dados Orientado a Documentos
Eleonilia Rodrigues (Universidade Federal de Campina Grande),
Carlos Santos Pires (Federal University of Campina Grande),
Dimas Cassimiro Nascimento (Universidade Federal do Agreste de Pernambuco (UFAPE))


15:20


Privacidade Diferencial em Gradient Boosting Decision Trees com Técnicas de Particionamento para Dados Categóricos
Gabriel Magalhaes Alves (LSBD/UFC),
Francisco Pereira (Universidade Federal do Ceará),
Iago Chaves (Universidade Federal do Ceará),
Javam Machado (Universidade Federal do Ceará)


15:40


Scientific Workflow Deployment: Container Provenance in High-Performance ComputinG
Liliane Neves de Oliveira Kunstmann (COPPE/UFRJ),
Débora Pina (COPPE/UFRJ),
Daniel de Oliveira (Universidade Federal Fluminense),
Marta Mattoso (COPPE/UFRJ)

ST4- Sessão Técnica 4

Terça (15/10)Specialized Data ManagementChair: Jorge Soares (CEFET/RJ)

14:00

CL-raster: Uma Nova Abordagem para Compactação e Processamento de Séries de Dados Raster
Luana Reis (Universidade Estadual de Londrina),
Daniel Kaster (UEL – Universidade Estadual de Londrina)



14:20



From Text to Locations: Repurposing Language Models for Spatial Trajectory Similarity Assessment
Wilken Charles Dantas de Melo (Universidade Federal do Ceara),
Lívia Cruz (Universidade Federal do Ceará),
Regis Magalhães (Universidade Federal do Ceará),
Ticiana Linhares Coelho da Silva (Universidade Federal do Ceará),
Francesco Lettich (ISTI – CNR – France)


14:40


Incorporando os Requisitos e as Restrições da LGPD ao Projeto de Banco de Dados
Patricia Barros (Universidade Federal do Piauí),
José Monteiro (Universidade Federal do Ceará),
Javam Machado (Federal University of Ceará),
Angelo Brayner (Federal University of Ceara)


15:00


Locally Differentially Private and Consistent Frequency Estimation of Longitudinal Data
Antônio Marreiras Neto (Federal University of Ceará),
Eduardo Rodrigues (Federal University of Ceará),
Serafim Costa (Federal University of Ceará),
Javam Machado (Federal University of Ceará)

15:20

Um Método Centrado em Dados para Melhorar a Segurança de Transportes Coletivos Municipais
Thais Braga (Universidade Federal de Viçosa),
Vinícius Almeida (Universidade Federal de Viçosa),
Fabrício Silva (Universidade Federal de Viçosa)

15:40

Master-MobilityDB: A Persistence and Manipulation Layer for Trajectories of Multiple Aspects
Flaris Feller (Universidade Federal de Santa Catarina),
Ronaldo Mello (Universidade Federal de Santa Catarina)

ST5- Sessão Técnica 5

Terça (15/10)Machine Learning Chair: Agma Traina (ICMC-USP)

16:30

An Empirical Analysis of Data Drift Detection Techniques in Machine Learning Systems
Lucas Helfstein (Universidade de São Paulo),
Kelly Braghetto (IME/USP)


16:50

Combinando Redes Neurais Convolucionais e Distribuição Smoothed Pseudo Wigner Ville na Classificação de Sinais Radar de Baixa Probabilidade de Interceptaçã
Edgard Alves (Instituto Militar de Engenharia),
Jorge Alves (Escola Naval),
Ronaldo Goldschmidt (Instituto Militar de Engenharia)


17:10

Enriquecimento de Dados com Base em Estatísticas de Grafo de Similaridade para Melhorar o Desempenho em Modelos de ML Supervisionados de Classificação
Ney Barchilon (PUC – Pontífice Universidade Catolica – RJ),
Helio Vieira Lopes (PUC-Rio),
Marcos Kalinowski (PUC-Rio),
Jefry Sastre (PUC-Rio)

17:30

Identifying Technological Trends: A Patent Analysis Method for Technology Forecasting
Alexandre Gonçalves (Universidade Federal de Santa Catarina),
Bartholomeu Barcelos (Universidade Federal de Santa Catarina),
Patrick Kochan (Universidade Federal de Santa Catarina)


17:50


Leveraging Geographic Feature Embeddings for Enhanced Location-Based Recommendation Systems
Nicolas Moreira Nobre Leite (Federal University of Campina Grande),
Claudio Campelo (Universidade Federal de Campina Grande),
Salatiel Silva (Federal University of Campina Grande)





18:10





Speech Recognition Models in Assisting Medical History
Yanna Gonçalves (Federal University of Ceará),
João Alves (Federal University of Ceará),
Breno Alef Dourado Sá (Federal University of Ceará),
Lazaro Silva (Universidade Federal do Ceará),
José Macedo (Universidade Federal do Ceará),
Ticiana Linhares Coelho da Silva (Universidade Federal do Ceará)

ST6- Sessão Técnica 6

Terça (15/10)NoSQL and Database Engines Chair: Angelo Augusto Frozza (IFC Camboriú)



16:30



Análise de Desempenho em Banco de Dados Temporais Aplicado no Cenário de Dados de Potência Elétrica
Vitor Santos (Universidade Tecnologica Federal do Parana),
Viviane Dal Molin (Universidade Tecnológica Federal do Paraná – UTFPR),
Jefferson Oliva (Universidade Tecnológica Federal do Paraná),
Ives Pola (Universidade de Sao Paulo)


16:50


Enumeration, Tagged Unions, Tuples, and Collections: A Noval Approach to Extracting JSON Schema
Natália Banhara (Universidade Federal da Fronteira Sul),
Geomar Schreiner (UFFS),
Denio Duarte (UFFS),
Samuel Feitosa (Universidade Federal da Fronteira Sul)
17:10Métricas para Análise de Esquemas em Banco de Dados NoSQL Orientado a DocumentosHarley Vera-olivera (Universidad San Antonio Abad del Cusco / Universidade de Brasília – Peru),
Maristela Holanda (Universidade de Brasília)
17:30MM-DIRECT: Main memory database instant recovery with tuple consistent checkpoint (dissemination)Arlino Magalhaes (Federal University of Piaui)
Angelo Brayner (Federal University of Ceara)
Jose Maria Monteiro (Federal University of Ceara)

17:50
Otimização Automática de Parâmetros em Aplicações de Big Data Baseadas em Múltiplos FrameworksBruna de Mello (Universidade Federal Fluminense),
Yuri Frota (Federal Universidade Federal Fluminense),
Daniel de Oliveira (Universidade Federal Fluminense)
18:10Privacy-Preserving Data Synthesis (dissemination)Chang Ge (University of Minnesota)

ST7- Sessão Técnica 7

Quarta (16/10)Semantic web, linked data and ontologiesChair: Renato Fileto (UFSC)


8:30


A Data Design Pattern for Building and Exploring Semantic Views of Enterprise Knowledge Graphs
Vania Vidal (Universidade Federal do Ceará),
Renato Freitas (Universidade Federal do Ceará),
Narciso Arruda Jr (University of Ceará),
Marco Antonio Casanova (PUC-Rio),
Chiara Renso (KDDLAB ISTI/CNR – Italy)

8:50

An Ontology for Context Modeling in Smart Spaces (dissemination)
Leonardo Vianna do Nascimento (Federal University of Rio Grande do Sul)
José Palazzo Moreira de Oliveira (Federal University of Rio Grande do Sul)



9:10



Enhancing heterogeneous mobile network management based on a well-founded reference ontology (dissemination)
Julio Cesar Cardoso Tesolin (Military Institute of Engineering – IME)
André M. Demori (Military Institute of Engineering – IME)
David Fernandes Cruz Moura (Centro Tecnológico do Exército – CACTT-CPQD)
Maria Cláudia Cavalcanti (Military Institute of Engineering – IME)

9:30

Towards an Ontology for User Activities on Smart Environments
Leonardo Nascimento (Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Sul),
José Palazzo Moreira de Oliveira (UFRGS)

ST8- Sessão Técnica 8

Quarta (16/10)Data Mining and Analytics Chair: Ticiana Linhares Coelho da Silva (UFC)




14:00




Adicionando suporte à diversificação de resultados em índices HNSW considerando espaços de baixa e alta dimensionalidade
Mauro Weber Universidade Federal Fluminense,
João Vitor Leite (Universidade Federal Fluminense),
Lucio Fernandes Dutra Santos (IFNMG),
Daniel de Oliveira (Universidade Federal Fluminense),
Marcos Bedo (Universidade Federal Fluminense)


14:20

Análise dos Fatores Socioambientais e Comportamentais na Identificação do Transtorno Obsessivo Compulsivo: Uma Abordagem com Dados da Pesquisa Nacional de Saúde 2019
Anna Puga Campos Rodrigues (PUC Minas),
Luis Zárate (Pntifícia Universidade Católica de Minas Gerais)




14:40




Data-Centric AI for predicting non-contact injuries in professional soccer playerS
Matheus Melo (Cefet/RJ),
Matheus Maia Vieira (Cefet/RJ),
Gabriel Padrão (Cefet/RJ),
Diego Brandão (Cefet/RJ),
Eduardo Bezerra (Cefet/RJ),
Juliano Spineti (Fluminense Football Club),
Lucas Giusti (Cefet/RJ),
Jorge Soares (Cefet/RJ

15:00

How effective is an LLM-based Data Analysis Automation Tool? A Case Study with ChatGPT’s Data Analyst
Beatriz Miranda (Universidade Federal de Campina Grande),
Claudio Campelo (Universidade Federal de Campina Grande)



15;20



Multidimensional Analysis of the Influence of Socioeconomic and Political Indicators on the Spread of COVID-19: A Case Study of Brazilian Cities (2020-2024)
Rôney Reis (Universidade Federal do Ceará),
Miguel Ângelo Souza (Universidade Federal do Ceará),
Angelo Brayner (Federal University of Ceara – UFC),
Ronaldo Menezes (University of Exeter – Great Britain)


15:40


Can a simple review outperform a feature set for predicting churn?
William Beckhauser (Universidade Federal de Santa Catarina),
Renato Fileto (Universidade Federal de Santa Catarina)

ST9- Sessão Técnica 9

Quarta (16/10)Information Retrieval & NLP Chair: Marcos André Gonçalves (UFMG)
14:00An Effective, Efficient, and Scalable Confidence-Based Instance Selection Framework for Transformer-Based Text Classification (dissemination)Washington Cunha (Federal University of Minas Gerais)
Celso França (Federal University of Minas Gerais)
Guilherme Fonseca (Federal University of São João del Rei)
Leonardo Rocha (Federal University of São João del Rei)
Marcos André Gonçalves (Federal University of Minas Gerais)
14:20Busca360: A Search Application in the Context of Top-Side Asset Integrity Management in the Oil & Gas IndustryYenier Torres Izquierdo (Instituto Tecgraf / PUC – Rio de Janeiro),
Melissa Lemos (Tecgraf/ PUC-Rio Institute),
Cleber Oliveira (Instituto Tecgraf – PUC-Rio),
Bruno Novelli (Instituto TecGraf – PUC-Rio),
Grettel Garcia (TecGraf – PUC-Rio),
Gustavo M. C. Coelho (Tecgraf/PUC-Rio),
Robison Luiz Souza Garcia (CENPES – Petrobras),
Marco Antonio Casanova (PUC-Rio)
14:40Can we trust LLMs as relevance judges?Luciana Bencke (UFRGS),
Felipe Paula (UFRGS),
Bruno Santos (UFRGS),
Viviane Moreira (UFRGS)
15:00SIDEAS – Detectando a Similaridade Semântica de DiscursosRita Carolina da Costa (Universidade Federal de Santa Catarina),
Renato Fileto (Universidade Federal de Santa Catarina),
Osmar Braz Junior (Universidade do Estado de Santa Catarina)
15:20Um Estudo sobre o uso de Modelos de Linguagem Abertos na Tarefa de Recomendação de Próximo ItemMarcos Lima (Universidade Federal do Amazonas (UFAM)),
Eduardo Silva (Universidade do Vale do Itajaí),
Altigran Soares da Silva (Universidade Federal do Amazonas)
15:40Composition of Heterogeneous Node Embeddings – Unlocking the Power of Heterogeneous Graph RepresentationSilvio Angonese (UFRGS),
Renata Galante (UFRGS)

ST10- Sessão Técnica 10

Quinta (17/10)Workflows & Evolving SystemsChair: Eduardo Ogasawara (CEFET/RJ)
8:30DLProv: A data-centric support for deep learning workflow analyses (dissemination)Débora Pina (COPPE/UFRJ)
Adriane Chapman (University of Southampton)
Liliane Kunstmann (COPPE/UFRJ)
Daniel de Oliveira (Universidade Federal Fluminense)
Marta Mattoso (COPPE/UFRJ)
8:50Prediction of the next transaction on Payment Dataset with Deep Learning ModelsClaudia Francesca Suarez Mariscal (UFRGS),
Renata Galante (UFRGS),
Weverton Cordeiro (UFRGS)
9:10Statistical Validation of Column Matching in the Database Schema Evolution of the Brazilian Public School CensusMuriki Yamanaka (Federal University of paraná),
Diogo Henrique de Almeida (Universidade Federal do Paraná),
Paulo Ricardo de Almeida (Univerdidade Federal do Paraná),
Simone Dominico (Universidade Federal do Paraná),
Leticia Peres (Universidade Federal do Parana),
Marcos Sunye (Universidade Federal do Parana),
Eduardo de Almeida (Universidade Federal do Paraná)
9:30Uma Heurística para a Execução de Workflows com Restrições de Confidencialidade em Ambientes ConteinerizadosRodrigo da Silva (Universidade Federal Fluminense),
Wesley Ferreira (Universidade Federal Fluminense),
Yuri Frota (Federal Universidade Federal Fluminense),
Daniel de Oliveira (Universidade Federal Fluminense)