A meta-learning approach for auto-selection and auto-configuration of proximity graphs
Arquivos
Data
Autores
Oyamada, Rafael Seidi
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridade
Descrição
Palavras-chave
Computação, Grafos de proximidade, Banco de dados, Meta-aprendizado, Busca por similaridade, Computer science, Proximity graphs, Databases, Meta-learning, Similarity searching