Análise de sentimentos multimodal aplicada à computação de níveis de tensão em vídeos de notícias

dc.contributor.advisorPádua, Flávio Luis Cardeal
dc.contributor.advisor-coSilva, Giani David
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/8863282319980625
dc.contributor.advisorLatteshttp://lattes.cnpq.br/6545115051079964
dc.contributor.authorPereira, Moisés Henrique Ramos
dc.contributor.authorLatteshttp://lattes.cnpq.br/5471286139284637
dc.contributor.refereePádua, Flávio Luis Cardeal
dc.contributor.refereeSilva, Giani David
dc.contributor.refereeSouza, Fabrício Benevenuto de
dc.contributor.refereeBax, Marcelo Peixoto
dc.contributor.refereeLacerda, Anísio Mendes
dc.contributor.refereePereira, Adriano César Machado
dc.date.accessioned2025-05-15T23:23:57Z
dc.date.available2025-05-15T23:23:57Z
dc.date.issued2018-04-23
dc.description.abstractEsta tese aborda o desenvolvimento de uma nova abordagem para estimar os níveis de tensão em vídeos de notícias por meio de técnicas de análise de sentimentos multimodal. As mídias de notícias constituem um tipo específico de discurso e se tornaram uma parte central da vida moderna de milhões de pessoas. Neste contexto, é muito importante estudar e entender como a indústria de notícias funciona e como ela afeta o cotidiano da sociedade. Para isso, especialmente sob a perspectiva da análise do discurso, a abordagem proposta calcula níveis de tensão como pontuações de sentimento (polaridades) ao longo da narrativa das notícias, revelando os diferentes padrões de comunicação utilizados. A fim de atingir esse objetivo, combinou-se pistas visuais e de áudio extraídas dos participantes das notícias, tais como repórteres, âncoras, entrevistados, dentre outros, usando métodos para: (1) reconhecimento de emoção a partir das expressões faciais, (2) estimativa do plano fílmico e (3) extração de recursos de áudio (p. ex., características de croma, coeficientes mel-cepstrais no domínio da frequência e características espectrais), bem como sentenças textuais obtidas a partir da (4) análise de sentimento das transcrições de fala da narrativa das notícias. Os resultados experimentais com um conjunto de dados contendo 960 vídeos de notícias rotuladas para telejornais brasileiros e americanos mostram que a abordagem proposta atinge uma precisão global de 64,17% na tarefa de classificação de níveis de tensão. Ao ser comparado também com um baseline, o método proposto alcançou uma precisão próxima de um método supervisionado, mas sem a necessidade de um treinamento rotulado. Esses resultados demonstram o alto potencial da abordagem proposta para ser usada por analistas de mídia em várias aplicações, especialmente no domínio jornalístico.
dc.description.abstractotherThis thesis presents the development of a novel approach to estimate tension levels in news videos through multimodal sentiment analysis techniques. The news media constitute a particular type of discourse and has become a central part of the modern-day lives of millions of people. In this context, it is quite important to study and understand how the news industry works and how it affects the Society everyday life. In order to support such a study, especially under the discourse analysis perspective, our approach computes tension levels as sentiment scores (polarities) along the news narrative, revealing the distinct communication patterns used. To achieve this goal, we combine visual and audio cues extracted from news participants (e.g., reporters, anchors, among others), by using methods for: (1) emotion recognition from facial expressions, (2) field size estimation and (3) extraction of audio features (e.g., chroma features, Mel Frequency Cepstral Coefficients and spectral features), as well as textual sentences obtained from the (4) sentiment analysis of the speech transcriptions of the news narrative. Experimental results with a dataset containing 960 annotated news videos from three Brazilian and one American TV newscasts show that our approach achieves an overall accuracy as high as 64.17% in the tension levels classification task. We also compared to a baseline where we could reach an accuracy close to a supervised method but without the need for a labeling effort. These results demonstrate the high potential of our approach to be used by media analysts in several applications, especially, in the journalistic domain.
dc.description.sponsorshipCNPq, FAPEMIG, CEFET-MG e CAPES.
dc.identifier.urihttps://repositorio.cefetmg.br//handle/123456789/1487
dc.language.isopt
dc.publisherCentro Federal de Educação Tecnológica de Minas Gerais
dc.publisher.countryBrasil
dc.publisher.initialsCEFET-MG
dc.publisher.programPrograma de Pós-Graduação em Modelagem Matemática e Computacional
dc.subjectComunicação de massa
dc.subjectVideojornalismo
dc.subjectAnálise do discurso
dc.subjectEmoções
dc.titleAnálise de sentimentos multimodal aplicada à computação de níveis de tensão em vídeos de notícias
dc.typeTese

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Análise de sentimentos multimodal aplicada à computação de níveis de tensão em vídeos de notícias.pdf
Tamanho:
4.76 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.39 KB
Formato:
Item-specific license agreed to upon submission
Descrição: