Previsão de resultados no futebol por meio de técnicas de aprendizado de máquina
dc.contributor.advisor | Martins, Flávio Vinicius Cruzeiro | |
dc.contributor.advisor-co | Lacerda, Anísio Mendes | |
dc.contributor.advisor-coLattes | http://lattes.cnpq.br/2034607422210997 | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3199420233273400 | |
dc.contributor.author | Fernandes, Felipe Augusto Pereira | |
dc.contributor.authorLattes | http://lattes.cnpq.br/4848497784026775 | |
dc.contributor.referee | Martins, Flávio Vinícius Cruzeiro | |
dc.contributor.referee | Lacerda, Anísio Mendes | |
dc.contributor.referee | Dalip, Dnaiel Hasan | |
dc.contributor.referee | Almeida, Paulo Eduardo Maciel de | |
dc.date.accessioned | 2025-04-25T20:08:10Z | |
dc.date.available | 2025-04-25T20:08:10Z | |
dc.date.issued | 2019-02-19 | |
dc.description.abstract | Futebol é considerado o esporte mais popular do mundo. Por isso, existe um grande interesse em saber quem será o vencedor de uma partida com impactos sociais e econômicos ao redor do mundo. A partir de dados básicos de desempenho, extraídos dos placares dos jogos, este trabalho tem o objetivo de estudar o desempenho dos algoritmos de aprendizado de máquina aplicados à predição de jogos de futebol: vitória do mandante, empate ou vitória do visitante. Propusemos um modelo de dados para predição de jogos de futebol e investigamos os modelos de aprendizado com tarefas de regressão e classificação aplicando técnicas de redução de dimensão. Os algoritmos utilizados para regressão foram: Regressão Linear (RegLin), K vizinhos mais próximos (KNN), Random Forest (RF) e Gradient Boosting (GB). Para classificação: Regressão Logística (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB) e K vizinhos mais próximos. Para os algoritmos de regressão, o valor referência passou a ser o saldo de gols, pois é um número inteiro que varia num intervalo . O melhor algoritmo, em relação ao F1-score, foi o GB aplicado a tarefa de regressão utilizando o modelo proposto neste estudo com K igual a 0.25. Este modelo apresentou um F1-score de 0.509 e uma acurácia de 52.78%. Aplicando esse modelo em apostas esportivas, ele se mostrou robusto em relação a lucratividade, com rentabilidade superior a índices de referência como IBOV e a taxa básica de juros do Brasil, a taxa SELIC. | |
dc.description.abstractother | Football is considered the most popular sport in the world. Therefore, there is a great interest in knowing who will be the winner of a match with social and economic impacts around the world. Based on basic performance data, extracted from game scores, this work has the objective of studying the performance of machine learning algorithms applied to soccer game prediction: victory of home team, draw or victory of the visitor. We propose a data model to predict soccer games and investigate machine learning models with regression and classification tasks applying size reduction techniques. The algorithms used for regression were: Linear Regression (RegLin), K-neighbors (KNN), Random Forest RF and Gradient Boosting (GB). For classification: Logistic Regression (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB), and K-nearest neighbors (KNN). For the regression algorithms, the reference value became the goal difference. To map the predicted goal difference to one of our classes, we create a function that receives the predicted goal difference and a parameter K that must be set. If predicted goal difference is: greater than K then the is home team victory; less than −K then predicted class is away team victory; otherwise the class is draw. The best algorithm, considering F1-score, was the GB applied to the regression task using the model proposed in this study with K equal to 0.25. This model had an F1-score of 0.509 and an accuracy of 52.78%. Applying the best model in sports betting it proved to be robust in terms of profitability, with better profitability higher than benchmark indices such as IBOV and the Brazilian interest rate, SELIC. | |
dc.identifier.uri | https://repositorio.cefetmg.br//handle/123456789/1285 | |
dc.language.iso | pt | |
dc.publisher | Centro Federal de Educação Tecnológica de Minas Gerais | |
dc.publisher.country | Brasil | |
dc.publisher.initials | CEFET-MG | |
dc.publisher.program | Programa de Pós-Graduação em Modelagem Matemática e Computacional | |
dc.subject | Futebol | |
dc.subject | Aspectos econômicos | |
dc.subject | Aprendizado computacional | |
dc.subject | Métodos estatísticos | |
dc.subject | Aposta | |
dc.title | Previsão de resultados no futebol por meio de técnicas de aprendizado de máquina | |
dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Previsão de resultados no futebol por meio de técnicas de aprendizado de máquina.pdf
- Tamanho:
- 3.83 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.39 KB
- Formato:
- Item-specific license agreed to upon submission
- Descrição: