LAGO – LLMs, Análise de Grafos e Ontologias
Coordenadores:
- José Palazzo Moreira de Oliveira (UFRGS — Universidade Federal do Rio Grande do Sul) — palazzo@inf.ufrgs.br
- Vânia Maria Ponte Vidal (UFC — Universidade Federal do Ceará) — vvidal@dc.ufc.br
Objetivo do Workshop
O workshop procura criar uma plataforma colaborativa que reúna pesquisadores, profissionais e especialistas da indústria para explorar as sinergias entre ontologias, Grafos de Conhecimento e Grandes Modelos de Linguagem (LLMs). Nosso propósito é promover a interação entre as comunidades de modelagem semântica, LLMs e Grafo de conhecimento, incentivando a colaboração mútua e o suporte entre essas áreas.
A modelagem conceitual tem passado por uma grande evolução ao longo das últimas décadas, incorporando novas metodologias, técnicas e ferramentas. No entanto, a taxa de falhas nos sistemas de informação implantados continua elevada, revelando desafios persistentes na transição da modelagem para a implementação eficaz.
Hoje, com o avanço de ontologias formais, padrões de design de dados e tecnologias baseadas em Large Language Models (LLMs), surgem novas oportunidades para melhorar a qualidade dos modelos e reduzir riscos associados ao desenvolvimento de sistemas. Essas abordagens oferecem um caminho promissor para aumentar a precisão semântica, garantir maior consistência e facilitar a interoperabilidade entre sistemas.
Este workshop procura reunir pesquisadores, profissionais e desenvolvedores para discutir as novas possibilidades na modelagem de sistemas de informação, explorando tanto seus benefícios quanto seus desafios.
O workshop busca promover um espaço de troca de ideias e experiências, incentivando a colaboração entre academia e indústria para avançar na criação de sistemas de informação mais eficazes e confiáveis.
Público-Alvo
Este workshop é destinado a pesquisadores, profissionais de TI, engenheiros de software, desenvolvedores de redes e especialistas em ciência de dados que trabalham com gerenciamento de redes, Internet das Coisas (IoT), espaços inteligentes e gráfos de conhecimento.
Datas importantes
- Data limite para submissão de trabalhos completos no JEMS: 31 de maio de 2025
- Data de notificação: 23 de junho de 2025
- Data limite para a submissão da versão final do artigo 7 de julho de 2025
- Data limite para inscrição de pelo menos um autor por trabalho completo por Workshop, e envio do comprovante de pagamento de inscrição e termo de autorização de publicação: 28 de julho de 2025
Instruções para Submissão
Os artigos para o WS LAGO devem ser escritos em português ou inglês e ter entre 6 e 10 páginas, conforme modelo da SBC. Em outras palavras, um artigo pode ter até 10 páginas mais uma página extra apenas para referências. Encorajamos fortemente os autores a citar artigos publicados em edições anteriores do SBBD.
Tópicos Principais
- Uso de Ontologias para Melhorar a interoperabilidade semântica
- As ontologias oferecem uma maneira formal e estruturada de representar o conhecimento em um domínio específico, permitindo maior clareza e interoperabilidade entre sistemas de informação. Neste tópico, exploraremos como ontologias podem ser utilizadas para:
- Reduzir ambiguidade e inconsistências na modelagem conceitual, garantindo que conceitos sejam bem definidos e compartilhados entre diferentes stakeholders.
- Facilitar a integração de dados entre sistemas distintos, promovendo uma semântica comum que melhora a comunicação entre bases de dados heterogêneas.
- Melhorar a recuperação de informação, permitindo que sistemas interpretem corretamente o significado dos dados e aprimorem a precisão de buscas e inferências.
- Automatizar a geração e validação de modelos conceituais, reduzindo erros manuais e acelerando o desenvolvimento de novos sistemas.
- Casos de uso incluem aplicações em saúde, finanças, e-commerce e administração pública, onde a necessidade de dados estruturados e bem definidos é crítica.
- Técnicas avançadas de anotação e Harmonização de Dados com LLM
- Anotação semântica assistida por LLMs – Uso de modelos de linguagem para identificação e marcação automática de entidades, conceitos e relações em grandes volumes de dados.
- Harmonização de dados heterogêneos – Métodos baseados em LLMs para padronizar e integrar dados provenientes de diferentes fontes, formatos e domínios.
- Desambiguação e resolução de entidades – Estratégias para lidar com ambiguidades semânticas, identificando corretamente entidades similares ou duplicadas.
- Extração e enriquecimento semântico – Aplicação de LLMs para enriquecer dados com informações contextuais, ligando-os a ontologias e grafos de conhecimento.
- Uso de embeddings semânticos para alinhamento de dados – Técnicas baseadas em representações vetoriais para encontrar similaridades entre termos e conceitos em conjuntos de dados distintos.
- Validação e explicabilidade das anotações geradas – Métodos para verificar a qualidade das anotações feitas pelos LLMs e garantir transparência nos processos de harmonização.
- Automação e escalabilidade na anotação e harmonização de dados – Estratégias para tornar os processos eficientes em ambientes de big data, reduzindo intervenção manual e melhorando a adaptação a novos domínios.
- Uso de LLM e Grafo de Conhecimento Semântico para suportar Integração de dados em larga escala
- Conceitos básicos de Modelos de Linguagem de Grande Escala (LLMs) e sua evolução.
- Estruturas e propriedades dos Grafos de Conhecimento Semântico.
- Comparação entre abordagens baseadas em LLMs e métodos tradicionais de integração de dados.
- Técnicas de extração e organização de entidades e relações.
- Ontologias e taxonomias para estruturação semântica dos dados.
- Mapeamento de dados heterogêneos em um grafo de conhecimento unificado.
- Limitações e desafios na adoção de LLMs e Grafos de Conhecimento.
- Tendências emergentes na área de integração semântica de dados.
- Aplicações práticas em domínios como saúde, finanças e ciência aberta.
- Padrões de Design de Dados e Sua Aplicação na Construção de Modelos Mais Robustos
- O uso de padrões de design de dados permite criar modelos de informação mais consistentes e eficientes, ajudando a resolver desafios comuns de modelagem. Este tema abordará:
- Principais padrões de design de dados, como normalização, denormalização, modelagem orientada a eventos (Event-Driven Design) e modelagem baseada em domínios (Domain-Driven Design).
- Melhores práticas para garantir a escalabilidade e flexibilidade dos modelos, permitindo que sistemas evoluam sem comprometer a integridade dos dados.
- A relação entre padrões de design e ontologias, destacando como combinar ambas as abordagens para criar arquiteturas de dados mais eficientes.
- Ferramentas e frameworks que facilitam a adoção de padrões no desenvolvimento de sistemas.
- Este tópico inclui discussões sobre como grandes empresas e instituições adotam padrões de design de dados para garantir maior eficiência, segurança e governança da informação.
- Aplicação de LLMs na Geração e Validação de Modelos Conceituais
- As Large Language Models (LLMs) estão revolucionando a maneira como lidamos com a modelagem de sistemas de informação. Este tema explorará como essas tecnologias podem ser aplicadas para:
- Automatizar a criação de modelos conceituais, transformando descrições textuais de requisitos em diagramas e esquemas estruturados.
- Validar a consistência dos modelos, identificando erros semânticos e sugerindo melhorias com base em padrões previamente aprendidos.
- Apoiar a documentação e explicação de modelos, tornando mais acessível à comunicação entre desenvolvedores, analistas de negócios e stakeholders.
- Integração de LLMs com ontologias e padrões de design de dados, permitindo a geração de modelos mais precisos e semanticamente ricos.
- Estudos recentes indicam que LLMs podem reduzir significativamente o tempo de desenvolvimento e aumentar a precisão na modelagem conceitual, tornando-se um recurso valioso para designers de sistemas.
- Comparação entre Abordagens Tradicionais e Modernas na Modelagem de Sistemas
- Forças e fraquezas das metodologias clássicas de modelagem e em quais cenários elas ainda são mais adequadas.
- Vantagens das novas abordagens para lidar com grandes volumes de dados, heterogeneidade de fontes e sistemas distribuídos.
- Integração de métodos tradicionais com tecnologias emergentes, mostrando que a transição não precisa ser abrupta e pode ser feita incrementalmente.
- Impacto dessas mudanças na formação de novos profissionais, incluindo desafios na adaptação de currículos e capacitação do mercado.
- A ideia é fomentar um debate sobre quando e como adotar novas estratégias na modelagem de sistemas de informação, equilibrando inovação e confiabilidade.
- Estudos de Caso e Relatos de Experiências sobre a Utilização Dessas Técnicas
- Para conectar a teoria com a prática, este tópico trará estudos de caso e experiências reais sobre a aplicação de ontologias, padrões de design de dados e LLMs no desenvolvimento de sistemas. Serão discutidos:
- Casos de sucesso e desafios enfrentados por empresas e instituições que adotaram essas abordagens.
- Lições aprendidas na implementação de modelos conceituais avançados, incluindo problemas inesperados e como foram resolvidos.
- Ferramentas e frameworks utilizados, explorando o que funcionou melhor em diferentes contextos.
- Comparação de métricas de qualidade antes e depois da adoção dessas técnicas, demonstrando seus impactos na eficiência e confiabilidade dos sistemas.
- O objetivo é fornecer percepções práticas para profissionais e pesquisadores, mostrando como essas novas metodologias podem ser aplicadas no mundo real e quais são os obstáculos a serem superados.
Agenda
Horário | Descrição | Comentários |
30 minutos | Painel de abertura | Apresentação do workshop e visão geral dos artigos |
1 h 30 m | Seção técnica | Apresentação de artigos |
1 h 30 m | Seção técnica | Apresentação de artigos |
30 minutos | Painel de encerramento com considerações sobre as apresentações |
Comitê de programa
em organização
- Ana Marilza Pernas Fleischmann – UFPEL
- Carina F. Dornelles – UFSC
- Fabio Porto – LNCC
- Gabriel Machado Lunardi – UFSM
- Gilberto Fernandes – UEL
- José Macedo – UFC
- José Palazzo Moreira de Oliveira – UFRGS
- José Wellington Franco – UFC
- Leandro Krug Wives – UFRGS
- Moises Carvalho – UFAM
- Vânia Maria Ponte Vidal – UFC
- Rebeca Schroeder Freitas – UDESC
- Sérgio Lifschitz – PUC Rio
- Vinicius Maran – UFSM