ALTIGRAN SOARES DA SILVA (IComp/UFAM)

Palavras, apenas*: Métodos e Técnicas para Interfaces de Linguagem Natural em Bancos de Dados

Resumo

Desde os primórdios da tecnologia de Bancos de Dados nos anos 70, Interfaces de Linguagem Natural para Bancos de Dados (ILNBDs) têm sido uma aspiração quase utópica, tanto na academia quanto na indústria. De fato, apesar da larga adoção e popularidade dos bancos de dados nas últimas décadas, somente recentemente têm surgido na literatura métodos eficazes para o desenvolvimento de ILNBDs, que permitem que usuários sem conhecimento técnico possam explorar de forma efetiva os dados mantidos por Sistemas Gerenciadores de Bancos (SGBDs). Esse interesse renovado nas ILNBDs deve-se principalmente ao atual estágio de maturidade técnica de áreas como Aprendizagem de Máquina, Processamento de Linguagem Natural e Recuperação de Informação, cujos recentes avanços permitem a extração da semântica de palavras e sentenças textuais escritas por usuários com grande precisão e eficiência. Duas principais abordagens têm sido estudadas neste sentido. A primeira é a utilização de buscas por palavra-chave, de maneira similar ao que acontece em máquinas de busca. A segunda é o uso de sentenças escritas em linguagem natural para expressar consultas. Enquanto os sistemas baseados em palavra-chave oferecem uma forma mais simples e intuitiva de expressar consultas, os sistemas baseados em linguagem natural permitem expressar consultas mais complexas, envolvendo, por exemplo, agregações. Neste tutorial, apresentaremos uma visão geral de métodos e técnicas recentes que melhoraram em vários sentidos os algoritmos e modelos utilizados para construção de ILNBDs. O tutorial inclui ainda uma sessão de desenvolvimento, com exemplos práticos de código e bibliotecas usadas na construção de ILNBDs.

* Trecho de “Palavras ao Vento” de Marisa Monte e Moraes Moreira

Co-autores:

  • Brandell Cássio Corrêa Ferreira (IComp/UFAM e Gympass)
  • Lucas Citolin (IComp/UFAM e UME)
  • Paulo Martins (IComp/UFAM)

Altigran Soares da Silva é professor titular do Instituto de Computação da Universidade Federal do Amazonas (IComp/UFAM) onde atua como pesquisador, professor e orientador na graduação, mestrado e doutorado. Concluiu seu doutorado em Ciência da Computação pela UFMG em 2002. Seus interesses de pesquisa envolvem Gerência de Dados, Recuperação de Informação e Mineração de Dados com ênfase no ambiente da World-Wide Web e Mídias Sociais. Sobre estes temas, tem coordenado e participado de dezenas de projetos de pesquisa que resultaram em mais de 130 publicações científicas em periódicos e anais de conferência de boa qualidade nestas áreas. Foi coordenador de comitês de programa de conferências no Brasil e no exterior, tendo participado também como membro de comitês técnico de programa em cerca de 40 conferências e workshops internacionais. Exerceu entre 2007 e 2009 a Pró-reitoria de Pesquisa e Pós-Graduação da UFAM. Foi Coordenador Adjunto da área de Computação na CAPES no triênio 2011-2013 e membro do CA-CC do CNPq entre 2016 e 2019. Entre 2005 e 2015 foi membro da diretoria da Sociedade Brasileira de Computação (SBC), sendo posteriormente membro do conselho da Sociedade entre 2016 e 2019. É co-fundador de empreendimentos de tecnologia, entre eles a Akwan Information Technologies, adquirida pela Google Inc. em 2005, e a Neemu.com, empresa de tecnologia para varejo on-line que é líder no e-commerce brasileiro e que foi adquirida pela Linx Sistemas em 2015, e Teewa, adquirida pela JusBrasil em 2019. Em 2013 uma tese de doutorado sob sua orientação recebeu o Primeiro Lugar no Concurso de Teses e Dissertação da Sociedade Brasileira de Computação (SBC) e Menção Honrosa no Prêmio CAPES de Teses. Recebeu também em 2013 o prêmio de Sócio Destaque da SBC por sua atuação junto às Comissões Especiais da sociedade, contribuindo para o aperfeiçoamento do Qualis CAPES de Conferências na área de Ciência da Computação. Em 2015 foi ganhador de um dos “Google Research Awards in Latin America” como orientador.


Brandell Cássio Corrêa Ferreira é aluno de mestrado em Informática do Instituto da Computação na Universidade Federal do Amazonas (ICOMP/UFAM) e Engenheiro de Software na Gympass, onde faz parte do time responsável pela máquina de busca da companhia. Também já atuou como o Engenheiro responsável pela máquina de busca na Flaner, startup Portuguesa de tecnologia adquirida pela Gympass, e atualmente reside em Lisboa. Seu mestrado tem como foco a resolução de mapeamentos para elementos do banco de dados em Interfaces de Linguagem Natural para Banco de Dados (ILNBDs). Seus interesses de pesquisa envolvem Recuperação da Informação, Processamento de Linguagem Natural e Mineração de dados, com ênfase no ambiente da World-Wide Web.


Lucas Citolin é aluno de mestrado em Informática do Instituto da Computação na Universidade Federal do Amazonas (ICOMP/UFAM) e atua como Líder Técnico e Engenheiro de Software na UME, fintech dedicada a crédito para o varejo, onde coordena uma equipe para escalar a solução bancária da empresa. Já atuou como Líder Técnico no ICTS, instituto de tecnologia voltado para IoT e Manufatura 4.0. Seu mestrado foca em produzir uma estrutura intermediária entre a sentença em linguagem natural e o esquema de um banco de dados. Seu foco em pesquisa está voltado para Processamento de Linguagem Natural, Machine Learning e Recuperação de Informação.


Paulo Rodrigo Oliveira Martins é aluno de doutorado em Informática do Instituto de Computação da Universidade Federal do Amazonas (IComp/UFAM). Concluiu seu mestrado em Informática pela UFAM em 2020, com foco em referências ao esquema de dados em buscas por palavras-chave em bancos de dados relacionais. Seus interesses de pesquisa envolvem Recuperação de Informação e Mineração de Dados e Gerência de dados, com ênfase nas interações de usuários com bancos de dados. Sobre estes temas, tem colaborado com Interfaces de Linguagem Natural para Bancos de Dados (ILNBDs) e Manutenção de consultas em bancos de dados que sofreram alterações no esquema.

Watch the complete video presentation.