Aqui está a pasta do Dropbox com o projeto no Rstudio que criei para o modelo. Para quem quiser tentar repetir em casa o que fiz, não é necessário nada além do que está na pasta.
Agora vou explicar como usar o que está nela, presumindo que quem está lendo esse texto sabe muito pouco sobre Ciência de Dados. Vamos aos poucos:
O que eu fiz? Um modelo matemático para prever resultados de partidas do Worlds. O que isso significa:
Que eu consigo calcular a probabilidade do time 1 vencer o time 2, e consigo até calcular probabilidades diferentes para Md1s, Md3s e Md5s;
Que eu preciso de muitos dados para fazer minhas previsões. Para isso, usei dados das ligas de TODOS os times que jogaram no Worlds, para poder estimar suas forças.
Como fiz esse modelo? Essa resposta pode ser dividida em 2 partes:
Usei um modelo de Bradley-Terry para estimar as forças de cada time. Se você quiser saber mais sobre o modelo, clique aqui;
Usei o R para treinar esse modelo. E por que o R? Porque fui treinado a usar R na minha faculdade de Estatística, e porque acho que o R é muito mais útil que o Python, para esse tipo de modelo. Se você quiser usar Python, os scripts são bem fáceis de traduzir para Python. O próprio ChatGPT deve lhe ajudar a traduzi-los bem rapidamente.
Como usei esse modelo para prever resultados? Peguei todos os parâmetros do meu modelo (as forças de cada time) e gerei probabilidades de vitória para cada time.
Como alguém pode usar essa pasta para fazer seus próprios modelos? Instalando o R e o Rstudio, e depois abrindo o arquivo chamado "Modelo de Bradley-Terry para prever resultados de LoL.Rproj" e rodando os arquivos que têm ".R" no final.