Proximity graphs for similarity searches : experimental survey and the newconnected-partition approach HGraph
dataload.collectionmapped | 02 - Mestrado - Ciência da Computação | pt_BR |
dataload.filenamenourau | 6671.pdf | pt_BR |
dataload.handlemapped | 123456789/50 | pt_BR |
dataload.idpergamum | 125276 | pt_BR |
dataload.idvirtuanourau | vtls000226937 | pt_BR |
dataload.idvirtuapergamum | vtls000226937 | pt_BR |
dataload.idvirtuapergamum.sameurlnourau | NÃO | pt_BR |
dataload.linknourau | http://www.bibliotecadigital.uel.br/document/?code=vtls226937 | pt_BR |
dataload.linknourau.regular | NÃO | pt_BR |
dataload.linknourau.retificado | http://www.bibliotecadigital.uel.br/document/?code=vtls000226937 | pt_BR |
dataload.linknourau.size | 61.00 | pt_BR |
dc.contributor.advisor | Kaster, Daniel dos Santos [Orientador] | pt_BR |
dc.contributor.author | Shimomura, Larissa Capobianco | pt_BR |
dc.contributor.banca | Rodrigues Junior, José Fernando | pt_BR |
dc.contributor.banca | Felinto, Alan Salvany | pt_BR |
dc.coverage.spatial | Londrina | pt_BR |
dc.date.accessioned | 2024-05-01T13:10:52Z | |
dc.date.available | 2024-05-01T13:10:52Z | |
dc.date.created | 2019.00 | pt_BR |
dc.date.defesa | 16.04.2019 | pt_BR |
dc.description.abstract | Resumo: O desenvolvimento tecnológico acelerou o crescimento do volume de dados complexos como imagens, vídeos, séries temporais e dados geográficos Uma abordagem bastante utilizada para a recuperação de dados complexos são as consultas por similaridade As consultas por similaridade têm como objetivo principal recuperar dados similares a partir de características intrínsecas dos dados Assim, para facilitar a recuperação de dados complexos usando consultas por similaridade é necessário organizar grande quantidade de dados de forma que dados similares possam ser recuperados da forma mais rápida possível Diversos métodos de acesso foram propostos na literatura para tornar a recuperação por similaridade de grandes bases de dados mais rápida Artigos publicados recentemente indicam que métodos que utilizam grafos são bastante eficientes e superam o desempenho de métodos de outras categorias em várias situações Porém, de acordo com nosso conhecimento, nenhum trabalho se dedicou a realizar uma análise experimental em um número abrangente de métodos baseados em grafos utilizando os mesmos algoritmos de busca e o mesmo ambiente Esta Dissertação apresenta uma revisão bibliográfica sobre os principais tipos de grafos utilizados para consultas por similaridade, também foi realizado uma avaliação experimental utilizando os mesmos algoritmos de consulta com resposta exata e com resposta aproximada O métodos foram avaliados conforme seu comportamento considerando os principais parâmetros de construção e consulta para uma variedade de bases de dados reais A partir dos resultados desta avaliação foi proposto o método baseado em grafos, HGraph O HGraph é um método baseado em partições conectadas proposto para construir grafos de proximidade e responder consultas por similaridade O HGraph utiliza uma estratégia de divisão e conquista para construir tipos de grafos propostos na literatura Para conectar as diferentes partições do processo de divisão e conquista arestas longas foram adicionadas ao HGraph Foi avaliado o comportamento dos principais parâmetros do HGraph e seu desempenho quanto a tempo de construção e consultas por similaridade foram comparados com os métodos k-NNG (k-Nearest Neighbors Graph) , NSW (Navigable Small World Graph) e SAT (Spatial Approximation Tree) Como resultado, o HGraph foi capaz de melhorar o k-NNG em termos de tempo de construção, tempo de consulta e qualidade de resposta Além disso, o HGraph obteve melhor desempenho na busca em alguns datasets quando comparado ao NSW e a SAT | pt_BR |
dc.description.abstractother1 | Abstract: The technology development has accelerated the growth of the volume of complex data, such as images, videos, time series, and georeferenced data A widely used approach to retrieve complex data are the similarity searches The similarity searches aim at retrieving similar data according to intrinsic characteristics of the data Therefore, in order to facilitate the retrieval of complex data using similarity searches, it is necessary to organize large collections of data in a way that similar data can be retrieved in the shortest time as possible Several access methods were proposed in the literature to speed up similarity data retrieval from large databases Recently, graph-based methods have emerged as a very efficient alternative for similarity retrieval, with reports indicating they have outperformed methods of other categories in several situations However, to the best of our knowledge, there is no previous work with experimental analysis on a comprehensive number of graph-based methods using the same search algorithm and execution environment This work presents two main contributions The first contribution is a survey on the main graph types currently employed for similarity searches and an experimental evaluation of the most representative graphs in a common platform, for exact and approximate search algorithms We evaluated the relative performance behavior of these graphs with respect to the main construction and query parameters for a variety of real-world datasets According to the evaluation of the results, we propose a new graph-based method called HGraph, the second contribution of this work HGraph is a connected partition approach to build graph-based methods and answer similarity searches In HGraph we use a divide and conquer strategy to build graph-based methods proposed in the literature and add long-range edges to connect the different partitions These long-range edges are added in order to increase the answer quality compared to their “base” graph type We evaluated the HGraph main parameters behavior and compared the HGraph construction time and similarity search performance for approximate searches to the k-NNG, SWG and the SAT As a result, the HGraph method was able to accelerate the k-NNG graph construction and improve the k-NNG query time and query recall Thus, the HGraph performed better in similarity searches than the SWG and the SAT in some datasets | pt_BR |
dc.description.notes | Dissertação (Mestrado em Ciência da Computação) - Universidade Estadual de Londrina, Centro de Ciências Exatas, Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.identifier.uri | https://repositorio.uel.br/handle/123456789/11178 | |
dc.language | por | |
dc.relation.coursedegree | Mestrado | pt_BR |
dc.relation.coursename | Ciência da Computação | pt_BR |
dc.relation.departament | Centro de Ciências Exatas | pt_BR |
dc.relation.ppgname | Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.subject | Teoria dos grafos | pt_BR |
dc.subject | Processamento de dados | pt_BR |
dc.subject | Espaços métricos | pt_BR |
dc.subject | Recuperação de dados (Computação) | pt_BR |
dc.subject | Graph theory | pt_BR |
dc.subject | Metric spaces | pt_BR |
dc.subject | Data processing | pt_BR |
dc.title | Proximity graphs for similarity searches : experimental survey and the newconnected-partition approach HGraph | pt_BR |
dc.type | Dissertação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1