Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia

Rodrigues, Otávio Augusto Malheiros

Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia

dc.contributor.advisor	Lacerda, Anísio Mendes
dc.contributor.advisor-co	Pádua, Flávio Luis Cardeal
dc.contributor.advisor-coLattes	http://lattes.cnpq.br/6545115051079964
dc.contributor.advisorLattes	http://lattes.cnpq.br/2034607422210997
dc.contributor.author	Rodrigues, Otávio Augusto Malheiros
dc.contributor.authorLattes	http://lattes.cnpq.br/2125546646444157
dc.contributor.referee	Lacerda, Anísio Mendes
dc.contributor.referee	Pádua, Flávio Luis Cardeal
dc.contributor.referee	Bax, Marcelo Peixoto
dc.contributor.referee	Pereira, Adriano César Machado
dc.date.accessioned	2025-05-19T22:26:05Z
dc.date.available	2025-05-19T22:26:05Z
dc.date.issued	2017-08-02
dc.description.abstract	Atualmente, com a popularização e aumento da quantidade de páginas Web, o volume de informação compartilhada tem crescido, ampliando cada vez mais a quantidade de conteúdo disponível para os usuários dessa rede. Assim, surge a necessidade de ferramentas capazes de identificar conteúdo relevante a partir desse grande volume de informação disponível. Os sistemas de recomendação são ferramentas computacionais que possuem este objetivo, ou seja, esses sistemas focam em auxiliar os usuários a encontrar informação relacionada às suas preferências de forma personalizada. As técnicas estado-da-arte na literatura de sistemas de recomendação são baseadas no histórico de interação dos usuários com os itens disponíveis no sistema. Assim, estas técnicas são limitadas no cenário de ausência de informação prévia sobre as preferências dos usuários. Este é um problema bem conhecido na literatura de sistemas de recomendação, chamado cold-start de usuários e é o foco desta dissertação. Mais especificamente,aborda-se o problema de recomendar itens para usuários de forma contínua (i.e.,online) por meio de algoritmos baseados em aprendizado por reforço. A classe de algoritmos na qual baseia-se este trabalho é Multi-Armed Bandits (MAB) e refere-se a algoritmos de tomada de decisão sequencial com retro-alimentação. Neste trabalho, modelamos a recomendação no cenário de cold-start como um algoritmo MAB de dois passos. Assumimos que os itens podem ser agrupados considerando sua descrição textual, o que leva a agrupamentos de itens semanticamente semelhantes. Primeiramente, seleciona-se o agrupamento de itens mais relevante para o usuário-alvo da recomendação. A seguir, dado o agrupamento previamente selecionado, escolhe-se o item mais relevante dentro desse agrupamento, o qual é sugerido para o usuário-alvo. Para avaliar a qualidade do algoritmo proposto, o seu desempenho foi mensurado utilizando um conjunto de dados real. A avaliação experimental mostra que o algoritmo proposto produz melhorias significativas em termos de qualidade de recomendação em relação aos algoritmos MAB estado-da-arte.
dc.description.abstractother	Nowadays, with the popularization and increase of the number of Web pages, the volume of shared information has grown, increasing more and more the amount of content available to users on this web. Hence, there is an increasing need for tools capable of filtering relevant content from the large volume of information. Recommender systems are computational tools that have this goal, i.e., these systems focus on helping users to find information related to their preferences in a personalized way. State-of-the-art techniques in the literature of recommender systems are based on the history of user interaction with the items available in the system. Hence, these techniques are limited in the scenario of lack of prior information about the preferences for users. This is a well-known problem in the literature of recommender systems, called users cold-start, which is the focus of this dissertation. More specifically, the problem of recommending items for users on an sequencial basis (i.e., online) is addressed by means of algorithm based on reinforcement learning paradigm. The class of algorithms on which this work is based is Multi-Armed Bandits (MAB) and refers to the class of sequential decision-making algorithms with feedback. In this work, we model the recommendation in the cold-start scenario as a MAB algorithm with two steps. We assume that items can be grouped considering their textual description, which leads to clusters of semantically similar items. First, the most relevant cluster of items is selected for the target user of the recommendation. Then, given the cluster previously selected, the most relevant item is chosen within that cluster, and it is suggested for the target user. To evaluate the quality of the proposed algorithm, we measured its performance using a real-world data set. The experimental evaluation shows that the proposed algorithm produces significant improvements about the recommendation quality in terms of accuracy when compared to state-of-the-art MAB algorithms.
dc.description.sponsorship	CAPES.
dc.identifier.uri	https://repositorio.cefetmg.br//handle/123456789/1528
dc.language.iso	pt
dc.publisher	Centro Federal de Educação Tecnológica de Minas Gerais
dc.publisher.country	Brasil
dc.publisher.initials	CEFET-MG
dc.publisher.program	Programa de Pós-Graduação em Modelagem Matemática e Computacional
dc.subject	Aprendizado computacional
dc.subject	Análise de conglomerados
dc.subject	Recuperação da informação
dc.subject	Interação usuário-computador
dc.title	Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia
dc.type	Dissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1

Nome:: Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia.pdf
Tamanho:: 1.57 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do Pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.39 KB
Formato:: Item-specific license agreed to upon submission
Descrição:

Baixar

Coleções

Mestrado em Modelagem Matemática e Computacional