Modelo neural fracamente supervisionado de busca de especialistas em repositório de dados científicos

dc.contributor.advisorDias, Thiago Magela Rodrigues
dc.contributor.advisor-coPinto, Adilson Luiz
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/4767432940301118
dc.contributor.advisorLatteshttp://lattes.cnpq.br/4687858846001290
dc.contributor.authorSousa, Sérgio José de
dc.contributor.authorLatteshttp://lattes.cnpq.br/1639967799540564
dc.contributor.refereeDias, Thiago Magela Rodrigues
dc.contributor.refereePinto, Adilson Luiz
dc.contributor.refereeCarvalho Segundo, Washington Luis Roberto de
dc.contributor.refereeRodrigues, Thiago de Souza
dc.date.accessioned2025-04-14T23:42:49Z
dc.date.available2025-04-14T23:42:49Z
dc.date.issued2021-08-31
dc.description.abstractCom o crescente volume de dados produzidos nos dias atuais, percebe-se cada vez mais usuários utilizando de diversos tipos de sistemas, como, por exemplo, sistemas de armazenamento de dados profissionais e acadêmicos. Dada a grande quantidade de dados armazenados, é notável a dificuldade de se encontrar candidatos com perfis apropriados a uma determinada atividade. Neste contexto, para tentar solucionar esse problema surge a recuperação ou busca de especialistas, um ramo da recuperação de informações, que consiste em, dada uma consulta, documentos são recuperados e são relacionados como unidades indiretas de informações das especialidades dos candidatos, com isso, alguma técnica é usada para agregar esses documentos gerando um escore. Possuindo um número menor de pesquisas relacionadas, a busca de especialistas na área acadêmica com modelos neurais se mostra um desafio ainda maior devido à complexidade desses modelos e à necessidade de grandes volumes de dados com julgamentos de relevância ou rótulos para seu treinamento. Diante disso, este trabalho propõe uma técnica de expansão e geração de dados fracamente supervisionados onde os julgamentos de relevância são criados com técnicas heurísticas, tornando possível utilizar modelos que exigem grandes volumes de dados. Além disso, é proposto uma técnica utilizando autoencoder profundo para selecionar documentos negativos ou julgamentos de irrelevância e por fim um modelo de ranqueamento baseado em redes recorrentes denominado Dual Embedding LSTM que foi capaz de superar todos os baselines comparados.
dc.description.abstractotherWith the growing volume of data produced today, it is clear that more and more users are using different types of systems, such as, for example, professional and academic data storage systems. Given the large amount of stored data, the difficulty of finding candidates with appropriate profiles for a particular activity is noteworthy. In this context, to try to solve this problem comes the expertise retrieval, a branch of information retrieval, which consists of, given a query, documents are recovered and used as indirect units of information for the candidates and some aggregation techniques are used in these documents to generate a score to the candidate. There are several models and techniques to work with this problem, some have been tested extensively but the search for specialists in the academic field with neural models has a smaller amount of research, this fact is due to the complexity of these models and the need for large volumes of data with judgments of relevance or labeled for your training. Therefore, this work proposes a technique of expansion and generation of weak supervised data where the relevance judgments are created with heuristic techniques, making it possible to use models that require large volumes of data. In addition, is proposed a technique of deep auto-encoder to select negative documents and finally a ranking model based on recurrent neural networks that was able to overcome all the baselines compared.
dc.identifier.urihttps://repositorio.cefetmg.br//handle/123456789/1196
dc.language.isopt
dc.publisherCentro Federal de Educação Tecnológica de Minas Gerais
dc.publisher.countryBrasil
dc.publisher.initialsCEFET-MG
dc.publisher.programPrograma de Pós-Graduação em Automação e Sistemas
dc.subjectClassificação
dc.subjectCurriculum vitae
dc.subjectProcessamento de dados
dc.subjectPlataforma Lattes
dc.subjectArquivamento e recuperação de informação
dc.titleModelo neural fracamente supervisionado de busca de especialistas em repositório de dados científicos
dc.typeDissertação

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Modelo neural fracamente supervisionado de busca de especialistas em.pdf
Tamanho:
1.24 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.39 KB
Formato:
Item-specific license agreed to upon submission
Descrição: