Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia

dc.contributor.advisorLacerda, Anísio Mendes
dc.contributor.advisor-coPádua, Flávio Luis Cardeal
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/6545115051079964
dc.contributor.advisorLatteshttp://lattes.cnpq.br/2034607422210997
dc.contributor.authorRodrigues, Otávio Augusto Malheiros
dc.contributor.authorLatteshttp://lattes.cnpq.br/2125546646444157
dc.contributor.refereeLacerda, Anísio Mendes
dc.contributor.refereePádua, Flávio Luis Cardeal
dc.contributor.refereeBax, Marcelo Peixoto
dc.contributor.refereePereira, Adriano César Machado
dc.date.accessioned2025-05-19T22:26:05Z
dc.date.available2025-05-19T22:26:05Z
dc.date.issued2017-08-02
dc.description.abstractAtualmente, com a popularização e aumento da quantidade de páginas Web, o volume de informação compartilhada tem crescido, ampliando cada vez mais a quantidade de conteúdo disponível para os usuários dessa rede. Assim, surge a necessidade de ferramentas capazes de identificar conteúdo relevante a partir desse grande volume de informação disponível. Os sistemas de recomendação são ferramentas computacionais que possuem este objetivo, ou seja, esses sistemas focam em auxiliar os usuários a encontrar informação relacionada às suas preferências de forma personalizada. As técnicas estado-da-arte na literatura de sistemas de recomendação são baseadas no histórico de interação dos usuários com os itens disponíveis no sistema. Assim, estas técnicas são limitadas no cenário de ausência de informação prévia sobre as preferências dos usuários. Este é um problema bem conhecido na literatura de sistemas de recomendação, chamado cold-start de usuários e é o foco desta dissertação. Mais especificamente,aborda-se o problema de recomendar itens para usuários de forma contínua (i.e.,online) por meio de algoritmos baseados em aprendizado por reforço. A classe de algoritmos na qual baseia-se este trabalho é Multi-Armed Bandits (MAB) e refere-se a algoritmos de tomada de decisão sequencial com retro-alimentação. Neste trabalho, modelamos a recomendação no cenário de cold-start como um algoritmo MAB de dois passos. Assumimos que os itens podem ser agrupados considerando sua descrição textual, o que leva a agrupamentos de itens semanticamente semelhantes. Primeiramente, seleciona-se o agrupamento de itens mais relevante para o usuário-alvo da recomendação. A seguir, dado o agrupamento previamente selecionado, escolhe-se o item mais relevante dentro desse agrupamento, o qual é sugerido para o usuário-alvo. Para avaliar a qualidade do algoritmo proposto, o seu desempenho foi mensurado utilizando um conjunto de dados real. A avaliação experimental mostra que o algoritmo proposto produz melhorias significativas em termos de qualidade de recomendação em relação aos algoritmos MAB estado-da-arte.
dc.description.abstractotherNowadays, with the popularization and increase of the number of Web pages, the volume of shared information has grown, increasing more and more the amount of content available to users on this web. Hence, there is an increasing need for tools capable of filtering relevant content from the large volume of information. Recommender systems are computational tools that have this goal, i.e., these systems focus on helping users to find information related to their preferences in a personalized way. State-of-the-art techniques in the literature of recommender systems are based on the history of user interaction with the items available in the system. Hence, these techniques are limited in the scenario of lack of prior information about the preferences for users. This is a well-known problem in the literature of recommender systems, called users cold-start, which is the focus of this dissertation. More specifically, the problem of recommending items for users on an sequencial basis (i.e., online) is addressed by means of algorithm based on reinforcement learning paradigm. The class of algorithms on which this work is based is Multi-Armed Bandits (MAB) and refers to the class of sequential decision-making algorithms with feedback. In this work, we model the recommendation in the cold-start scenario as a MAB algorithm with two steps. We assume that items can be grouped considering their textual description, which leads to clusters of semantically similar items. First, the most relevant cluster of items is selected for the target user of the recommendation. Then, given the cluster previously selected, the most relevant item is chosen within that cluster, and it is suggested for the target user. To evaluate the quality of the proposed algorithm, we measured its performance using a real-world data set. The experimental evaluation shows that the proposed algorithm produces significant improvements about the recommendation quality in terms of accuracy when compared to state-of-the-art MAB algorithms.
dc.description.sponsorshipCAPES.
dc.identifier.urihttps://repositorio.cefetmg.br//handle/123456789/1528
dc.language.isopt
dc.publisherCentro Federal de Educação Tecnológica de Minas Gerais
dc.publisher.countryBrasil
dc.publisher.initialsCEFET-MG
dc.publisher.programPrograma de Pós-Graduação em Modelagem Matemática e Computacional
dc.subjectAprendizado computacional
dc.subjectAnálise de conglomerados
dc.subjectRecuperação da informação
dc.subjectInteração usuário-computador
dc.titleAprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia
dc.typeDissertação

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Aprendizado por reforço baseado em agrupamentos para recomendação na ausência de informação prévia.pdf
Tamanho:
1.57 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.39 KB
Formato:
Item-specific license agreed to upon submission
Descrição: