A meta-learning approach for auto-selection and auto-configuration of proximity graphs
dataload.collectionmapped | 02 - Mestrado - Ciência da Computação | pt_BR |
dataload.filenamenourau | 8182.pdf | pt_BR |
dataload.handlemapped | 123456789/50 | pt_BR |
dataload.idpergamum | 6181 | pt_BR |
dataload.idvirtuanourau | vtls000233929 | pt_BR |
dataload.idvirtuapergamum | vtls000233929 | pt_BR |
dataload.idvirtuapergamum.sameurlnourau | SIM | pt_BR |
dataload.linknourau | http://www.bibliotecadigital.uel.br/document/?code=vtls000233929 | pt_BR |
dataload.linknourau.regular | SIM | pt_BR |
dataload.linknourau.retificado | http://www.bibliotecadigital.uel.br/document/?code=vtls000233929 | pt_BR |
dataload.linknourau.size | 64.00 | pt_BR |
dc.contributor.advisor | Kaster, Daniel dos Santos [Orientador] | pt_BR |
dc.contributor.author | Oyamada, Rafael Seidi | pt_BR |
dc.contributor.banca | Bueno, Renato | pt_BR |
dc.contributor.banca | Zarpelão, Bruno Bogaz | pt_BR |
dc.coverage.spatial | Londrina | pt_BR |
dc.date.accessioned | 2024-05-01T11:49:39Z | |
dc.date.available | 2024-05-01T11:49:39Z | |
dc.date.created | 2021.00 | pt_BR |
dc.date.defesa | 16.04.2021 | pt_BR |
dc.description.abstract | Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridade | pt_BR |
dc.description.abstractother1 | Abstract: Due to the high production of complex data, the last decades have provided a considerable progress in developing similarity search methods Such methods consist of indexing and retrieving data through their intrinsic characteristics Recently, graph-based methods have outperformed other types of methods in the literature of approximate similarity search, such as the tree-, permutation-, and hash-based methods However, finding a suitable graph along with its parameters is a challenging and time-consuming task Since there is no precise parameterization that suits most datasets and user constraints, the choice of parameters is either arbitrary or based on a grid search of executions The main objective of this work is to develop an intelligent approach based on meta-learning techniques to recommend a suitable graph configuration for a given dataset Our main contributions are the proposal of a generic architecture and strategies to build an accurate recommendation system avoiding exhaustive experimentation to parameterize graph-based methods for similarity searching Specifically, this master’s thesis details the gathering of knowledge to address the problem and two different strategies to instantiate a recommender The first strategy is a global approach, which induces regression models regarding the whole knowledge space The second one is based on dataset-similarity, learning regression models for clusters of datasets with similar properties We claim that partitioning the dataset space for learning improves the accuracy of the recommendations This work employs an assortment of real datasets with features extracted from images and a large set of synthetic datasets varying the main parameters affecting similarity retrieval We present experiments evaluating the proposed instantiation strategies that attest that our approaches outperform the baselines in most cases We also discuss experiments exploring aspects of the proposed techniques to support the alternatives we chose throughout the work The results show that our proposals provide suitable recommendations for proximity graphs, assisting users in building efficient indexes for similarity retrieval | pt_BR |
dc.description.notes | Dissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.identifier.uri | https://repositorio.uel.br/handle/123456789/9132 | |
dc.language | por | |
dc.relation.coursedegree | Mestrado | pt_BR |
dc.relation.coursename | Ciência da Computação | pt_BR |
dc.relation.departament | Centro de Ciências Exatas | pt_BR |
dc.relation.ppgname | Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.subject | Computação | pt_BR |
dc.subject | Grafos de proximidade | pt_BR |
dc.subject | Banco de dados | pt_BR |
dc.subject | Meta-aprendizado | pt_BR |
dc.subject | Busca por similaridade | pt_BR |
dc.subject | Computer science | pt_BR |
dc.subject | Proximity graphs | pt_BR |
dc.subject | Databases | pt_BR |
dc.subject | Meta-learning | pt_BR |
dc.subject | Similarity searching | pt_BR |
dc.title | A meta-learning approach for auto-selection and auto-configuration of proximity graphs | pt_BR |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1