A meta-learning approach for auto-selection and auto-configuration of proximity graphs

Oyamada, Rafael Seidi

A meta-learning approach for auto-selection and auto-configuration of proximity graphs

dataload.collectionmapped	02 - Mestrado - Ciência da Computação	pt_BR
dataload.filenamenourau	8182.pdf	pt_BR
dataload.handlemapped	123456789/50	pt_BR
dataload.idpergamum	6181	pt_BR
dataload.idvirtuanourau	vtls000233929	pt_BR
dataload.idvirtuapergamum	vtls000233929	pt_BR
dataload.idvirtuapergamum.sameurlnourau	SIM	pt_BR
dataload.linknourau	http://www.bibliotecadigital.uel.br/document/?code=vtls000233929	pt_BR
dataload.linknourau.regular	SIM	pt_BR
dataload.linknourau.retificado	http://www.bibliotecadigital.uel.br/document/?code=vtls000233929	pt_BR
dataload.linknourau.size	64.00	pt_BR
dc.contributor.advisor	Kaster, Daniel dos Santos [Orientador]	pt_BR
dc.contributor.author	Oyamada, Rafael Seidi	pt_BR
dc.contributor.banca	Bueno, Renato	pt_BR
dc.contributor.banca	Zarpelão, Bruno Bogaz	pt_BR
dc.coverage.spatial	Londrina	pt_BR
dc.date.accessioned	2024-05-01T11:49:39Z
dc.date.available	2024-05-01T11:49:39Z
dc.date.created	2021.00	pt_BR
dc.date.defesa	16.04.2021	pt_BR
dc.description.abstract	Resumo: Devido à alta produção de dados complexos, as últimas décadas proporcionaram um avanço considerável no desenvolvimento de métodos de busca por similaridade Esses métodos consistem em indexar e recuperar dados por meio de suas características intrínsecas Recentemente, os métodos baseados em grafos superaram outros tipos de métodos na literatura de buscas por similaridade aproximada, tais como os métodos baseados em árvore, permutação e hash No entanto, encontrar um grafo adequado junto com seus parâmetros é uma tarefa desafiadora e demorada Uma vez que não existe uma parametrização precisa que se adapte à maioria dos conjuntos de dados e exigências do usuário, a escolha dos parâmetros é arbitrária ou baseada em uma busca em grade de execuções O objetivo principal deste trabalho é desenvolver uma abordagem inteligente baseada em técnicas de meta-aprendizado para recomendar uma configuração de grafo adequada para um determinado conjunto de dados Nossas principais contribuições são a proposta de uma arquitetura genérica e estratégias para construir um sistema de recomendação preciso, evitando experimentações exaustivas para parametrizar métodos baseados em grafos para buscas por similaridade Especificamente, esta Dissertação de mestrado detalha a coleta de conhecimento para resolver o problema e duas estratégias diferentes para instanciar um recomendador A primeira estratégia é uma abordagem global, que induz modelos de regressão em relação a todo o espaço do conhecimento O segundo é baseado na similaridade do conjunto de dados, aprendendo modelos de regressão para grupos de conjuntos de dados com propriedades semelhantes Afirmamos que particionar o espaço do conjunto de dados para aprendizagem melhora a precisão das recomendações Este trabalho emprega uma variedade de conjuntos de dados reais com características extraídas de imagens e um grande conjunto de conjuntos de dados sintéticos variando os principais parâmetros que afetam a recuperação de similaridade Apresentamos experimentos avaliando as estratégias de instanciação propostas que atestam que nossas abordagens superam as linhas de base na maioria dos casos Também discutimos experimentos explorando aspectos das técnicas propostas para apoiar as alternativas que escolhemos ao longo do trabalho Os resultados mostram que nossas propostas fornecem recomendações adequadas para grafos de proximidade, auxiliando os usuários na construção de índices eficientes para recuperação por similaridade	pt_BR
dc.description.abstractother1	Abstract: Due to the high production of complex data, the last decades have provided a considerable progress in developing similarity search methods Such methods consist of indexing and retrieving data through their intrinsic characteristics Recently, graph-based methods have outperformed other types of methods in the literature of approximate similarity search, such as the tree-, permutation-, and hash-based methods However, finding a suitable graph along with its parameters is a challenging and time-consuming task Since there is no precise parameterization that suits most datasets and user constraints, the choice of parameters is either arbitrary or based on a grid search of executions The main objective of this work is to develop an intelligent approach based on meta-learning techniques to recommend a suitable graph configuration for a given dataset Our main contributions are the proposal of a generic architecture and strategies to build an accurate recommendation system avoiding exhaustive experimentation to parameterize graph-based methods for similarity searching Specifically, this master’s thesis details the gathering of knowledge to address the problem and two different strategies to instantiate a recommender The first strategy is a global approach, which induces regression models regarding the whole knowledge space The second one is based on dataset-similarity, learning regression models for clusters of datasets with similar properties We claim that partitioning the dataset space for learning improves the accuracy of the recommendations This work employs an assortment of real datasets with features extracted from images and a large set of synthetic datasets varying the main parameters affecting similarity retrieval We present experiments evaluating the proposed instantiation strategies that attest that our approaches outperform the baselines in most cases We also discuss experiments exploring aspects of the proposed techniques to support the alternatives we chose throughout the work The results show that our proposals provide suitable recommendations for proximity graphs, assisting users in building efficient indexes for similarity retrieval	pt_BR
dc.description.notes	Dissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.identifier.uri	https://repositorio.uel.br/handle/123456789/9132
dc.language	por
dc.relation.coursedegree	Mestrado	pt_BR
dc.relation.coursename	Ciência da Computação	pt_BR
dc.relation.departament	Centro de Ciências Exatas	pt_BR
dc.relation.ppgname	Programa de Pós-Graduação em Ciência da Computação	pt_BR
dc.subject	Computação	pt_BR
dc.subject	Grafos de proximidade	pt_BR
dc.subject	Banco de dados	pt_BR
dc.subject	Meta-aprendizado	pt_BR
dc.subject	Busca por similaridade	pt_BR
dc.subject	Computer science	pt_BR
dc.subject	Proximity graphs	pt_BR
dc.subject	Databases	pt_BR
dc.subject	Meta-learning	pt_BR
dc.subject	Similarity searching	pt_BR
dc.title	A meta-learning approach for auto-selection and auto-configuration of proximity graphs	pt_BR
dc.type	Dissertação	pt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: 8182.pdf
Tamanho:: 4.23 MB
Formato:: Adobe Portable Document Format

Baixar

Coleções

02 - Mestrado - Ciência da Computação