Previsão de resultados no futebol por meio de técnicas de aprendizado de máquina

dc.contributor.advisorMartins, Flávio Vinicius Cruzeiro
dc.contributor.advisor-coLacerda, Anísio Mendes
dc.contributor.advisor-coLatteshttp://lattes.cnpq.br/2034607422210997
dc.contributor.advisorLatteshttp://lattes.cnpq.br/3199420233273400
dc.contributor.authorFernandes, Felipe Augusto Pereira
dc.contributor.authorLatteshttp://lattes.cnpq.br/4848497784026775
dc.contributor.refereeMartins, Flávio Vinícius Cruzeiro
dc.contributor.refereeLacerda, Anísio Mendes
dc.contributor.refereeDalip, Dnaiel Hasan
dc.contributor.refereeAlmeida, Paulo Eduardo Maciel de
dc.date.accessioned2025-04-25T20:08:10Z
dc.date.available2025-04-25T20:08:10Z
dc.date.issued2019-02-19
dc.description.abstractFutebol é considerado o esporte mais popular do mundo. Por isso, existe um grande interesse em saber quem será o vencedor de uma partida com impactos sociais e econômicos ao redor do mundo. A partir de dados básicos de desempenho, extraídos dos placares dos jogos, este trabalho tem o objetivo de estudar o desempenho dos algoritmos de aprendizado de máquina aplicados à predição de jogos de futebol: vitória do mandante, empate ou vitória do visitante. Propusemos um modelo de dados para predição de jogos de futebol e investigamos os modelos de aprendizado com tarefas de regressão e classificação aplicando técnicas de redução de dimensão. Os algoritmos utilizados para regressão foram: Regressão Linear (RegLin), K vizinhos mais próximos (KNN), Random Forest (RF) e Gradient Boosting (GB). Para classificação: Regressão Logística (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB) e K vizinhos mais próximos. Para os algoritmos de regressão, o valor referência passou a ser o saldo de gols, pois é um número inteiro que varia num intervalo . O melhor algoritmo, em relação ao F1-score, foi o GB aplicado a tarefa de regressão utilizando o modelo proposto neste estudo com K igual a 0.25. Este modelo apresentou um F1-score de 0.509 e uma acurácia de 52.78%. Aplicando esse modelo em apostas esportivas, ele se mostrou robusto em relação a lucratividade, com rentabilidade superior a índices de referência como IBOV e a taxa básica de juros do Brasil, a taxa SELIC.
dc.description.abstractotherFootball is considered the most popular sport in the world. Therefore, there is a great interest in knowing who will be the winner of a match with social and economic impacts around the world. Based on basic performance data, extracted from game scores, this work has the objective of studying the performance of machine learning algorithms applied to soccer game prediction: victory of home team, draw or victory of the visitor. We propose a data model to predict soccer games and investigate machine learning models with regression and classification tasks applying size reduction techniques. The algorithms used for regression were: Linear Regression (RegLin), K-neighbors (KNN), Random Forest RF and Gradient Boosting (GB). For classification: Logistic Regression (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB), and K-nearest neighbors (KNN). For the regression algorithms, the reference value became the goal difference. To map the predicted goal difference to one of our classes, we create a function that receives the predicted goal difference and a parameter K that must be set. If predicted goal difference is: greater than K then the is home team victory; less than −K then predicted class is away team victory; otherwise the class is draw. The best algorithm, considering F1-score, was the GB applied to the regression task using the model proposed in this study with K equal to 0.25. This model had an F1-score of 0.509 and an accuracy of 52.78%. Applying the best model in sports betting it proved to be robust in terms of profitability, with better profitability higher than benchmark indices such as IBOV and the Brazilian interest rate, SELIC.
dc.identifier.urihttps://repositorio.cefetmg.br//handle/123456789/1285
dc.language.isopt
dc.publisherCentro Federal de Educação Tecnológica de Minas Gerais
dc.publisher.countryBrasil
dc.publisher.initialsCEFET-MG
dc.publisher.programPrograma de Pós-Graduação em Modelagem Matemática e Computacional
dc.subjectFutebol
dc.subjectAspectos econômicos
dc.subjectAprendizado computacional
dc.subjectMétodos estatísticos
dc.subjectAposta
dc.titlePrevisão de resultados no futebol por meio de técnicas de aprendizado de máquina
dc.typeDissertação

Arquivos

Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Previsão de resultados no futebol por meio de técnicas de aprendizado de máquina.pdf
Tamanho:
3.83 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.39 KB
Formato:
Item-specific license agreed to upon submission
Descrição: