A meta-learning approach for auto-selection and auto-configuration of proximity graphs

dataload.collectionmapped02 - Mestrado - Ciência da Computaçãopt_BR
dataload.filenamenourau8182.pdfpt_BR
dataload.handlemapped123456789/50pt_BR
dataload.idpergamum6181pt_BR
dataload.idvirtuanourauvtls000233929pt_BR
dataload.idvirtuapergamumvtls000233929pt_BR
dataload.idvirtuapergamum.sameurlnourauSIMpt_BR
dataload.linknourauhttp://www.bibliotecadigital.uel.br/document/?code=vtls000233929pt_BR
dataload.linknourau.regularSIMpt_BR
dataload.linknourau.retificadohttp://www.bibliotecadigital.uel.br/document/?code=vtls000233929pt_BR
dataload.linknourau.size64.00pt_BR
dc.contributor.advisorKaster, Daniel dos Santos [Orientador]pt_BR
dc.contributor.authorOyamada, Rafael Seidipt_BR
dc.contributor.bancaBueno, Renatopt_BR
dc.contributor.bancaZarpelão, Bruno Bogazpt_BR
dc.coverage.spatialLondrinapt_BR
dc.date.accessioned2024-05-01T11:49:39Z
dc.date.available2024-05-01T11:49:39Z
dc.date.created2021.00pt_BR
dc.date.defesa16.04.2021pt_BR
dc.description.abstractResumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridadept_BR
dc.description.abstractother1Abstract: Due to the high production of complex data, the last decades have provided a considerable progress in developing similarity search methods Such methods consist of indexing and retrieving data through their intrinsic characteristics Recently, graph-based methods have outperformed other types of methods in the literature of approximate similarity search, such as the tree-, permutation-, and hash-based methods However, finding a suitable graph along with its parameters is a challenging and time-consuming task Since there is no precise parameterization that suits most datasets and user constraints, the choice of parameters is either arbitrary or based on a grid search of executions The main objective of this work is to develop an intelligent approach based on meta-learning techniques to recommend a suitable graph configuration for a given dataset Our main contributions are the proposal of a generic architecture and strategies to build an accurate recommendation system avoiding exhaustive experimentation to parameterize graph-based methods for similarity searching Specifically, this master’s thesis details the gathering of knowledge to address the problem and two different strategies to instantiate a recommender The first strategy is a global approach, which induces regression models regarding the whole knowledge space The second one is based on dataset-similarity, learning regression models for clusters of datasets with similar properties We claim that partitioning the dataset space for learning improves the accuracy of the recommendations This work employs an assortment of real datasets with features extracted from images and a large set of synthetic datasets varying the main parameters affecting similarity retrieval We present experiments evaluating the proposed instantiation strategies that attest that our approaches outperform the baselines in most cases We also discuss experiments exploring aspects of the proposed techniques to support the alternatives we chose throughout the work The results show that our proposals provide suitable recommendations for proximity graphs, assisting users in building efficient indexes for similarity retrievalpt_BR
dc.description.notesDissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computaçãopt_BR
dc.identifier.urihttps://repositorio.uel.br/handle/123456789/9132
dc.languagepor
dc.relation.coursedegreeMestradopt_BR
dc.relation.coursenameCiência da Computaçãopt_BR
dc.relation.departamentCentro de Ciências Exataspt_BR
dc.relation.ppgnamePrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.subjectComputaçãopt_BR
dc.subjectGrafos de proximidadept_BR
dc.subjectBanco de dadospt_BR
dc.subjectMeta-aprendizadopt_BR
dc.subjectBusca por similaridadept_BR
dc.subjectComputer sciencept_BR
dc.subjectProximity graphspt_BR
dc.subjectDatabasespt_BR
dc.subjectMeta-learningpt_BR
dc.subjectSimilarity searchingpt_BR
dc.titleA meta-learning approach for auto-selection and auto-configuration of proximity graphspt_BR
dc.typeDissertaçãopt_BR

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
8182.pdf
Tamanho:
4.23 MB
Formato:
Adobe Portable Document Format