@MASTERSTHESIS{ 2024:1045742050, title = {Métodos de descoberta adaptativa de subconsultas para busca diversificada de imagens}, year = {2024}, url = "http://tede2.uefs.br:8080/handle/tede/1847", abstract = "A busca de imagens por conteúdo em uma coleção de dados, seja através de mecanismos de mídia social ou em ferramentas de busca livre na web, é uma tarefa complexa onde resultados baseados apenas em similaridade frequentemente apresentam problemas de relevância como itens pouco representativos e quase-duplicatas. Comumente, ferramentas de busca tentam realizar uma ampla cobertura baseada em subtópicos implícitos da consulta para atender ao usuário de forma mais completa possível. Neste sentido, a abordagem baseada em diversificação de conteúdo utilizando algoritmos de agrupamento de dados tem sido bastante utilizada. Nesta abordagem, cada grupo identificado pelo algoritmo nos resultados da busca é tratado como um subtópico. Estes grupos são utilizados para extrair imagens representativas que juntas tragam diversidade ao resultado apresentado ao usuário. Contudo, a eficácia da abordagem depende da escolha de um bom esquema de agrupamento, algo que está diretamente ligado ao número de grupos gerados pelo algoritmo, tarefa que tem sido um imenso desafio. Este trabalho tem como objetivo avaliar os possíveis ganhos em termos de eficácia na tarefa de recuperação de imagens diversificadas, através da seleção dos melhores esquemas de grupos gerados por algoritmos de agrupamento, buscando dinamicamente um número de grupos ideal para cada consulta. Adicionalmente, pretende-se estender a literatura realizando a avaliação experimental do método DTRS para estimativa da qualidade dos agrupamentos, bem como desenvolver um método auxiliar eficiente para determinação de critério de parada para algoritmos de agrupamento e, consequentemente, reduzir os custos computacionais do procedimento de diversificação de resultados. Para isso, conduzimos experimentos utilizando os algoritmos K-Medoids e Hierárquico Aglomerativo, empregando diferentes métodos de validação, explorando variações na quantidade de agrupamentos e adotando diferentes abordagens auxiliares para seleção dos melhores esquemas de clusters, como o método Elbow. Os resultados demonstraram ganhos em termos de eficácia na recuperação de imagens diversificadas e significativa redução do tempo de execução do sistema CBIR empregado neste trabalho.", publisher = {Universidade Estadual de Feira de Santana}, scholl = {Programa de Pós-Graduação em Ciência da Computação}, note = {DEPARTAMENTO DE CIÊNCIAS EXATAS} }