Minicursos ACEITOS

Minicurso 1

Security and Privacy in Data-Driven Systems: From Traditional Machine Learning to Large Language Models

Resumo: Data-driven systems have advanced from traditional predictive models, such as neural networks and decision trees, to Large Language Models (LLMs), which significantly expand the attack surface and privacy risk. Previously, Artificial Intelligence (AI) systems were limited to a small subset of users and practitioners. However, the popularization of LLMs tools, such as ChatGPT, Gemini and LLMA, has enabled novice and non-expert users to interact with these systems through AI-based tasks. In light of this, AI has become a powerful attack vector, where malicious users can inject small perturbations to poison or evade datasets. They can also hijack systems with “bad” prompts that cause AI models to misbehave, or exploit them to leak sensitive training data. This minicourse provides a comprehensive overview of AI security and privacy in data-driven systems, covering applications ranging from traditional machine learning to modern LLM-based solutions. We will cover traditional adversarial attacks, such as poisoning and evasion, as well as privacy threats and privacy-preserving strategies. Furthermore, we address prompt injection into modern AI systems and the risk of exposure of personally identifiable information in LLMs. By combining theoretical foundations with practical demonstrations, this mini-course provides a hands-on overview of attacks and defenses for building robust, private, and trustworthy AI-integrated database systems.

Autores:

Nome: Erikson Aguiar
Afiliação: Pós-Doutorando no Instituto de Ciências Matemáticas de Computação, Universidade de São Paulo (ICMC-USP)
Contato: erjulioaguiar@usp.br

Nome: Êrica do Carmo
Afiliação: Doutoranda no Instituto de Ciências Matemáticas de Computação, Universidade de São Paulo (ICMC-USP)
Contato: ericapetersc@usp.br

Nome: Agma Traina
Afiliação: Professora Titular no Instituto de Ciências Matemáticas de Computação, Universidade de São Paulo (ICMC-USP)
Contato: agma@icmc.usp.br

Nome: Caetano Traina Junior
Afiliação: Professor Titular no Instituto de Ciências Matemáticas de Computação, Universidade de São Paulo (ICMC-USP)
Contato: caetano@icmc.usp.br

MINICURSO 2

Modelagem de Bancos de Dados em Conformidade com a LGPD

Resumo: A Lei Geral de Proteção de Dados Pessoais (Lei no 13.709/2018) estabelece as regras para o tratamento de dados pessoais no Brasil, aplicando-se a operações realizadas por pessoas físicas ou jurídicas, tanto no meio físico quanto digital. Seu objetivo é proteger direitos fundamentais, especialmente a liberdade e a privacidade, regulando todo o ciclo de vida dos dados, da coleta ao descarte, exigindo que o tratamento esteja fundamentado em bases legais, como o consentimento do titular. Nesse cenário, o sistema de bancos de dados torna-se um componente central, uma vez que é responsável pelo armazenamento, pela integridade e pela disponibilidade dos dados. Assim, este minicurso discute estratégias para integrar os requisitos jurídicos da LGPD ao projeto de bancos de dados, facilitando o desenvolvimento de sistemas e a realização de auditorias de conformidade com a LGPD.

Autores:

Nome: Patricia Vieira Barros
Afiliação: UFPI
Contato: patriciavieira@ufpi.edu.br

José Maria da Silva Monteiro Filho
Afiliação: UFC
Contato: monteiro@dc.ufc.br>

Nome: Javam Machado
Afiliação: UFC
Contato: javam.machado@dc.ufc.br

MINICURSO 3

Causality for Data Scientists: Discovery, Causal Inference, and Applications in Machine Learning

Resumo: Machine Learning (ML) models excel at identifying patterns in data, yet they are fundamentally limited in answering causal questions such as “What happens if I intervene?” or “Which features actually drive this outcome?”. This tutorial chapter introduces the foundations of computational causality for data scientists and database researchers. Starting
from Simpson Paradox and Pearl Causal Hierarchy, we develop Directed Acyclic Graphs (DAGs), the do-operator, d-separation, and the backdoor and frontdoor identification criteria. We then present the two complementary formalisms: Structural Causal Models (SCMs) and the Potential Outcomes framework, with emphasis on the estimands ATE and CATE. The chapter covers Causal Discovery algorithms for learning causal structures from observational data, and Causal Inference methods for effect estimation and validation. Finally, we connect these foundations to practical ML applications: causal graph-guided feature selection and counterfactual explainability. Practical activities accompanying this chapter employ public datasets and open-source Python libraries.

Autores:

Nome: Gustavo Ferreira Viegas de Oliveira
Afiliação: UFV
Contato: gustavo.viegas@ufv.br

Nome: Fabrício Aguiar Silva
Afiliação: UFV
Contato: fabricio.asilva@ufv.br

Nome: Marcus Henrique Soares Mendes
Afiliação: UFV
Contato: marcus.mendes@ufv.br

Coordenação de Minicursos

Dimas Cassimiro do Nascimento Filho

Universidade Federal do Agreste de Pernambuco (UFAPE) – dimas.cassimiro@ufape.edu.br

LOGO_NEGATIVO_-_SBBD26_2

Endereço ICMC

Av. Trab. São Carlense, 400 - Centro, São Carlos - SP, 13566-590

@2026, SBBD