Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia
dc.contributor.advisor | Lacerda, Anísio Mendes | |
dc.contributor.advisor-co | Pádua, Flávio Luis Cardeal | |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/6545115051079964 | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/2034607422210997 | |
dc.contributor.author | Rodrigues, Otávio Augusto Malheiros | |
dc.contributor.authorLattes | http://lattes.cnpq.br/2125546646444157 | |
dc.contributor.referee | Lacerda, Anísio Mendes | |
dc.contributor.referee | Pádua, Flávio Luis Cardeal | |
dc.contributor.referee | Bax, Marcelo Peixoto | |
dc.contributor.referee | Pereira, Adriano César Machado | |
dc.date.accessioned | 2025-05-19T22:26:05Z | |
dc.date.available | 2025-05-19T22:26:05Z | |
dc.date.issued | 2017-08-02 | |
dc.description.abstract | Atualmente, com a popularização e aumento da quantidade de páginas Web, o volume de informação compartilhada tem crescido, ampliando cada vez mais a quantidade de conteúdo disponível para os usuários dessa rede. Assim, surge a necessidade de ferramentas capazes de identificar conteúdo relevante a partir desse grande volume de informação disponível. Os sistemas de recomendação são ferramentas computacionais que possuem este objetivo, ou seja, esses sistemas focam em auxiliar os usuários a encontrar informação relacionada às suas preferências de forma personalizada. As técnicas estado-da-arte na literatura de sistemas de recomendação são baseadas no histórico de interação dos usuários com os itens disponíveis no sistema. Assim, estas técnicas são limitadas no cenário de ausência de informação prévia sobre as preferências dos usuários. Este é um problema bem conhecido na literatura de sistemas de recomendação, chamado cold-start de usuários e é o foco desta dissertação. Mais especificamente,aborda-se o problema de recomendar itens para usuários de forma contínua (i.e.,online) por meio de algoritmos baseados em aprendizado por reforço. A classe de algoritmos na qual baseia-se este trabalho é Multi-Armed Bandits (MAB) e refere-se a algoritmos de tomada de decisão sequencial com retro-alimentação. Neste trabalho, modelamos a recomendação no cenário de cold-start como um algoritmo MAB de dois passos. Assumimos que os itens podem ser agrupados considerando sua descrição textual, o que leva a agrupamentos de itens semanticamente semelhantes. Primeiramente, seleciona-se o agrupamento de itens mais relevante para o usuário-alvo da recomendação. A seguir, dado o agrupamento previamente selecionado, escolhe-se o item mais relevante dentro desse agrupamento, o qual é sugerido para o usuário-alvo. Para avaliar a qualidade do algoritmo proposto, o seu desempenho foi mensurado utilizando um conjunto de dados real. A avaliação experimental mostra que o algoritmo proposto produz melhorias significativas em termos de qualidade de recomendação em relação aos algoritmos MAB estado-da-arte. | |
dc.description.abstractother | Nowadays, with the popularization and increase of the number of Web pages, the volume of shared information has grown, increasing more and more the amount of content available to users on this web. Hence, there is an increasing need for tools capable of filtering relevant content from the large volume of information. Recommender systems are computational tools that have this goal, i.e., these systems focus on helping users to find information related to their preferences in a personalized way. State-of-the-art techniques in the literature of recommender systems are based on the history of user interaction with the items available in the system. Hence, these techniques are limited in the scenario of lack of prior information about the preferences for users. This is a well-known problem in the literature of recommender systems, called users cold-start, which is the focus of this dissertation. More specifically, the problem of recommending items for users on an sequencial basis (i.e., online) is addressed by means of algorithm based on reinforcement learning paradigm. The class of algorithms on which this work is based is Multi-Armed Bandits (MAB) and refers to the class of sequential decision-making algorithms with feedback. In this work, we model the recommendation in the cold-start scenario as a MAB algorithm with two steps. We assume that items can be grouped considering their textual description, which leads to clusters of semantically similar items. First, the most relevant cluster of items is selected for the target user of the recommendation. Then, given the cluster previously selected, the most relevant item is chosen within that cluster, and it is suggested for the target user. To evaluate the quality of the proposed algorithm, we measured its performance using a real-world data set. The experimental evaluation shows that the proposed algorithm produces significant improvements about the recommendation quality in terms of accuracy when compared to state-of-the-art MAB algorithms. | |
dc.description.sponsorship | CAPES. | |
dc.identifier.uri | https://repositorio.cefetmg.br//handle/123456789/1528 | |
dc.language.iso | pt | |
dc.publisher | Centro Federal de Educação Tecnológica de Minas Gerais | |
dc.publisher.country | Brasil | |
dc.publisher.initials | CEFET-MG | |
dc.publisher.program | Programa de Pós-Graduação em Modelagem Matemática e Computacional | |
dc.subject | Aprendizado computacional | |
dc.subject | Análise de conglomerados | |
dc.subject | Recuperação da informação | |
dc.subject | Interação usuário-computador | |
dc.title | Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia | |
dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia.pdf
- Tamanho:
- 1.57 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.39 KB
- Formato:
- Item-specific license agreed to upon submission
- Descrição: