Modelo neural fracamente supervisionado de busca de especialistas em repositório de dados científicos
dc.contributor.advisor | Dias, Thiago Magela Rodrigues | |
dc.contributor.advisor-co | Pinto, Adilson Luiz | |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/4767432940301118 | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/4687858846001290 | |
dc.contributor.author | Sousa, Sérgio José de | |
dc.contributor.authorLattes | http://lattes.cnpq.br/1639967799540564 | |
dc.contributor.referee | Dias, Thiago Magela Rodrigues | |
dc.contributor.referee | Pinto, Adilson Luiz | |
dc.contributor.referee | Carvalho Segundo, Washington Luis Roberto de | |
dc.contributor.referee | Rodrigues, Thiago de Souza | |
dc.date.accessioned | 2025-04-14T23:42:49Z | |
dc.date.available | 2025-04-14T23:42:49Z | |
dc.date.issued | 2021-08-31 | |
dc.description.abstract | Com o crescente volume de dados produzidos nos dias atuais, percebe-se cada vez mais usuários utilizando de diversos tipos de sistemas, como, por exemplo, sistemas de armazenamento de dados profissionais e acadêmicos. Dada a grande quantidade de dados armazenados, é notável a dificuldade de se encontrar candidatos com perfis apropriados a uma determinada atividade. Neste contexto, para tentar solucionar esse problema surge a recuperação ou busca de especialistas, um ramo da recuperação de informações, que consiste em, dada uma consulta, documentos são recuperados e são relacionados como unidades indiretas de informações das especialidades dos candidatos, com isso, alguma técnica é usada para agregar esses documentos gerando um escore. Possuindo um número menor de pesquisas relacionadas, a busca de especialistas na área acadêmica com modelos neurais se mostra um desafio ainda maior devido à complexidade desses modelos e à necessidade de grandes volumes de dados com julgamentos de relevância ou rótulos para seu treinamento. Diante disso, este trabalho propõe uma técnica de expansão e geração de dados fracamente supervisionados onde os julgamentos de relevância são criados com técnicas heurísticas, tornando possível utilizar modelos que exigem grandes volumes de dados. Além disso, é proposto uma técnica utilizando autoencoder profundo para selecionar documentos negativos ou julgamentos de irrelevância e por fim um modelo de ranqueamento baseado em redes recorrentes denominado Dual Embedding LSTM que foi capaz de superar todos os baselines comparados. | |
dc.description.abstractother | With the growing volume of data produced today, it is clear that more and more users are using different types of systems, such as, for example, professional and academic data storage systems. Given the large amount of stored data, the difficulty of finding candidates with appropriate profiles for a particular activity is noteworthy. In this context, to try to solve this problem comes the expertise retrieval, a branch of information retrieval, which consists of, given a query, documents are recovered and used as indirect units of information for the candidates and some aggregation techniques are used in these documents to generate a score to the candidate. There are several models and techniques to work with this problem, some have been tested extensively but the search for specialists in the academic field with neural models has a smaller amount of research, this fact is due to the complexity of these models and the need for large volumes of data with judgments of relevance or labeled for your training. Therefore, this work proposes a technique of expansion and generation of weak supervised data where the relevance judgments are created with heuristic techniques, making it possible to use models that require large volumes of data. In addition, is proposed a technique of deep auto-encoder to select negative documents and finally a ranking model based on recurrent neural networks that was able to overcome all the baselines compared. | |
dc.identifier.uri | https://repositorio.cefetmg.br//handle/123456789/1196 | |
dc.language.iso | pt | |
dc.publisher | Centro Federal de Educação Tecnológica de Minas Gerais | |
dc.publisher.country | Brasil | |
dc.publisher.initials | CEFET-MG | |
dc.publisher.program | Programa de Pós-Graduação em Automação e Sistemas | |
dc.subject | Classificação | |
dc.subject | Curriculum vitae | |
dc.subject | Processamento de dados | |
dc.subject | Plataforma Lattes | |
dc.subject | Arquivamento e recuperação de informação | |
dc.title | Modelo neural fracamente supervisionado de busca de especialistas em repositório de dados científicos | |
dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Modelo neural fracamente supervisionado de busca de especialistas em.pdf
- Tamanho:
- 1.24 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.39 KB
- Formato:
- Item-specific license agreed to upon submission
- Descrição: