Um arcabouço de recomendação multimodal de imagens baseado em fatores latentes de baixa dimensionalidade.
dc.contributor.advisor | Lacerda, Anísio Mendes | |
dc.contributor.advisor-co | Pádua, Flávio Luis Cardeal | |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/6545115051079964 | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/2034607422210997 | |
dc.contributor.author | Anício, Anna Claudia Almeida | |
dc.contributor.authorLattes | http://lattes.cnpq.br/8461592367063314 | |
dc.contributor.referee | Lacerda, Anísio Mendes | |
dc.contributor.referee | Pádua, Flávio Luis Cardeal | |
dc.contributor.referee | Pereira Júnior, Álvaro Rodrigues | |
dc.contributor.referee | Rodrigues, Thiago de Souza | |
dc.date.accessioned | 2025-05-19T22:58:32Z | |
dc.date.available | 2025-05-19T22:58:32Z | |
dc.date.issued | 2017-08-04 | |
dc.description.abstract | A popularização de dispositivos fotográficos, como smartphones e câmeras digitais, tem levado as pessoas ao hábito de registrar momentos por meio de fotos. Assim, todos os dias, uma grande quantidade de imagens são disponibilizadas em redes sociais de compartilhamento de fotos, como Flickr, Pinterest e Instagram. Esta dissertação propõe um arcabouço de recomendação de imagens, que visa ajudar os usuários a lidar com a enorme quantidade de informação disponível, por meio de uma experiência personalizada. Sistemas de Recomendação são ferramentas computacionais que auxiliam usuários a encontrar informação relevante (por exemplo: imagens, músicas, filmes) de acordo com seus interesses. Tradicionalmente, esses sistemas utilizam informação colaborativa das preferências dos usuários para sugerir itens. Porém, nem sempre essa informação está disponível. Por exemplo, quando novos itens são inseridos no sistema não existe informação de preferência dos usuários sobre eles, fato que leva à necessidade de explorar o conteúdo desses itens. Neste trabalho, o foco é explorar informação de natureza multimodal para recomendação de imagens, sendo essas representadas por meio de características (i) visuais e (ii) textuais. As características visuais são extraídas da própria imagem (ex., cor e textura), utilizando técnicas de Visão Computacional e Processamento de Imagens. Por outro lado, as características textuais são extraídas de metadados das imagens (ex., do título e da descrição), utilizando técnicas de Recuperação de Informação. Dessa forma, é possível descrever uma imagem sob diferentes dimensões. Os sistemas de recomendação estado-da-arte são baseados em informação colaborativa e descrição dos itens. Esses sistemas sofrem do problema da "maldição da dimensionalidade". As características de alta dimensão dos itens dificulta a identificação de itens similares, dado que a distribuição dos dados originais é extremamente esparsa. A fim de aliviar esse problema, propõe-se projetar a representação dos itens de alta dimensão em um espaço de fatores latentes de dimensão inferior. O arcabouço de recomendação proposto é baseado no algoritmo Sparse Linear Methods with Side Information (SSLIM) que, por sua vez, consiste na construção de matrizes de (i) relação entre usuários e itens e de (ii) relação entre itens. O trabalho proposto é avaliado em uma base de dados real coletada do Flickr; e comparado com técnicas do estado-da-arte. Conforme demonstrado nos experimentos, o arcabouço proposto apresenta melhora na qualidade das recomendações e fornece ganhos de 15% a 17% em termos de taxa de acertos em relação aos métodos de referência. | |
dc.description.abstractother | The popularization of photo-taking devices, such as smart phones and digital cameras, leads people to the common habit of recording moments by taking photos. Hence, everyday, millions of images are uploaded to photo sharing social networks, such as Flickr, Pinterest, and Instagram. This dissertation, proposes an image recommender framework, which aims to help users to deal with this huge amount of available information by means of a personalized experience. Recommender Systems are software tools that help users find relevant information (eg news, music, movies) according to their interests. Traditionally, recommender systems using collaborative information preferences users to suggest items. But not always collaborative information is available. For example, when new items are entered in the system, there is no preference information for them, in this way, this paper uses of the items contents for recommendation. Specifically, it is intended use multimodal nature information for image recommendation. The work consist to represent images by means of characteristics (i) visual and (ii) textual. The visual features are extracted from the image itself, using techniques of Computer Vision and Image Processing. On the other hand, textual features are extracted meta-data of images (e.g., title and description). Thus, it’s possible describe an image in different dimensions. Traditional state-of-the-art itembased recommender systems suffer from the “curse of dimensionality” problem, such as, in the multimodal approach used in this work. The high-dimensional image features lead to a degraded recommendation performance since the distribution of the original data is extremely sparse. In order to alleviate this problem, it is proposed to project this multimodal high-dimensional data into a common and lower dimensional latent factor space. Hence, get able to combine multi-modal information in a principled way and minimize the curse of dimensionality problem. The proposed recommendation algorithm is based on the algorithm Sparse Linear Methods with Side Information (SSLIM), which consists of the construction matrix responsible for setting the relation between the users and items and the items themselves. For the comparison, we run a series of experiments using a real-world image dataset extracted from Flickr and compared to state-of-the-art baselines. As shown in experiments, the low-dimensional image-based framework improves the quality of recommendations and provides gains from 15% to 17% in terms of hit-rate over the baselines. | |
dc.description.sponsorship | CAPES. | |
dc.identifier.uri | https://repositorio.cefetmg.br//handle/123456789/1529 | |
dc.language.iso | pt | |
dc.publisher | Centro Federal de Educação Tecnológica de Minas Gerais | |
dc.publisher.country | Brasil | |
dc.publisher.initials | CEFET-MG | |
dc.publisher.program | Programa de Pós-Graduação em Modelagem Matemática e Computacional | |
dc.subject | Aprendizado computacional | |
dc.subject | Algoritmos para imagens | |
dc.subject | Mineração de dados | |
dc.subject | Recuperação da informação | |
dc.subject | Sistema de recomendação | |
dc.title | Um arcabouço de recomendação multimodal de imagens baseado em fatores latentes de baixa dimensionalidade. | |
dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Um arcabouço de recomendação multimodal de imagens baseado em fatores latentes de baixa dimensionalidade..pdf
- Tamanho:
- 3.46 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.39 KB
- Formato:
- Item-specific license agreed to upon submission
- Descrição: