Data Profiling – Uma retrospectiva e uma visão para o futuro
Data e hora: Terça-feira, 2 de maio de 2023, as 19h00
Link: https://www.youtube.com/watch?v=mwa5TkwN-cQ
Resumo: Data profiling envolve a extração de metadados (informações descritivas) de conjunto de dados. Metadados são utilizados por usuários e aplicações, de variadas áreas de conhecimento, em diversas tarefas, como, por exemplo: preparação e limpeza de dados; exploração de dados; engenharia e seleção de atributos; otimização de consultas; e projeto de banco de dados. Nesta apresentação, abordaremos alguns problemas tradicionais da área de data profiling, bem como casos de uso derivados das soluções desses problemas. Discutiremos brevemente as intuições algorítmicas de algumas soluções recentes. Finalmente, discutiremos problemas em aberto e direções de pesquisa promissoras em data profiling e seus casos de uso.
Eduardo Pena, Professor Adjunto na Universidade Tecnológica Federal do Paraná (UTFPR) e pesquisador de pós-doutorado no LNCC.
Eduardo é professor na Universidade Tecnológica Federal do Paraná (UTFPR) e é um bolsista de pós-doutorado no LNCC (DEXL). Sua principal pesquisa se concentra em ciência e gerenciamento de dados, especialmente em qualidade e integração de dados, perfilagem de dados, aprendizado de máquina para dados estruturados e extração de informações. Ele se formou em Ciência da Computação (2011) e obteve um mestrado (2014), ambos pela Universidade Estadual de Londrina (UEL). Ele obteve seu doutorado em Informática, com ênfase em Bancos de Dados, pela Universidade Federal do Paraná (UFPR) em 2020. Ele recebeu o Prêmio de Tese de Doutorado da Capes (2021).