116.18

Futebol, Big Data e a Pedra Filosofal

Marco Sirangelo

Entre todas as minhas matérias durante o curso de graduação, estatística foi, disparada, a que tive mais dificuldade. Foram quase 3 anos para que eu terminasse os três módulos da disciplina. Quando optei por seguir minha carreira em gestão esportiva, tinha certeza que modelos e testes de hipótese não fariam mais parte da minha rotina. Até que dois livros, devorados em velocidade recorde anos depois, provaram que eu estava errado – Soccernomics, de Stefan Szymanski e Simon Kuper, e Os Números do Jogo, de Chris Anderson e David Sally.

Estudar futebol foi minha grande motivação para voltar para a universidade, dessa vez na Inglaterra, em Loughborough. Durante meu mestrado, foram muitas horas de biblioteca lendo artigos acadêmicos sobre gestão e futebol. De novo o complicado nome Stefan Szymanski aparece com destaque, tamanha é sua produção sobre o tema.

Graças à excelente conferência de futebol realizada nesse último fim de semana pela Yale School of Management (idealizada pelos brasileiros que fazem MBA em Yale, e principalmente por Thairo Arruda e João Lacombe), tive a oportunidade de conhecer e assistir uma aula do hoje professor da Universidade de Michigan. Achei genial e quis dedicar essa que é minha primeira coluna para o Ludopédio a ele.

Szymanski é um acadêmico puro, focado justamente em investigar os aspectos econômicos e de negócios no futebol. O tema abordado por ele neste painel em Yale foi relacionar a análise estatística presente hoje no futebol com a alquimia. Segundo o professor, vemos hoje um grande desenvolvimento analítico no esporte, fruto da revolução “Big Data” que atinge não somente o esporte, mas todas as áreas de atuação da sociedade. Soccer Analytics é algo real, com implicações concretas, assim como tratou outro excelente painel da conferência, apresentado por Andrés Pérez, CEO da Kin Analytics. O futebol hoje é capaz de gerar milhões de dados e estatísticas que, caso sejam bem interpretadas, causam impacto fortíssimo no jogo.

Stefan Szymanski durante a Soccer Conference em Yale (Fevereiro/2019). Foto: Marco Sirangelo.

Porém, os grandes modelos estatísticos utilizados no futebol são baseados na análise dos resultados, ou seja, em eventos ocorridos no passado. Além disso, todos os dados coletados são de origem observacional, e não experimental. Espera-se o passe ocorrer para que ele seja contabilizado como assistência, e não o contrário, uma vez que obviamente não podemos antecipar o que vai acontecer em um jogo. Mas o foco de Szymanski é justamente esse, questionar e investigar a possibilidade de um modelo estatístico focado em prever resultados. Machine Learning e avanços tecnológicos que são observados com frequência em diferentes indústrias muitas vezes são capazes prever eventos. No futebol, as conclusões estatísticas são sempre tomadas com base em correlações, e não em causalidade.

E está aí a ótima analogia com a alquimia, prática que foi baseada em premissas absurdas, mas que incentivou experimentos que geraram ciência. De acordo com Szymanski, justamente por não ter capacidade de prever, as análises estatísticas atuais se assemelham com a alquimia, são o primeiro passo, mas ainda longe de gerarem conclusões satisfatórias. E ele prova isso de uma forma interessante.

O professor criou um modelo estatístico feito “em menos de cinco minutos” com base em variáveis que ele julgou relevantes, tais como os gastos dos clubes em salário e o valor dos elencos dos clubes, informações facilmente levantadas em plataformas como o site Transfermarkt, por exemplo. Ao comparar esse simples modelo com outros mais complexos que fazem uso de Big Data, como os usados em plataformas de aposta, observou-se que os respectivos coeficientes de determinação (que indicam se o modelo criado se ajusta aos dados levantados de maneira satisfatória) eram praticamente idênticos. Se modelos simples produzem resultados semelhantes aos complexos, existe um indício de que ainda há muito o que ser estudado.

É evidente que o ponto levantado por Szymanski não é criticar o uso de estatística no futebol, mas sim incentivar o maior uso dela no esporte, de modo que o conhecimento gerado seja cada vez mais relevante. Alquimistas não encontraram a Pedra Filosofal, da mesma forma que Billy Beane não levou o Oakland Athletics até o título da World Series, mas grandes saltos vieram depois. E Szymanski, quase como Neil Armstrong, consegue entender que a análise estatística do futebol está dando apenas seu primeiro passo.

Como citar

SIRANGELO, Marco. Futebol, Big Data e a Pedra Filosofal. Ludopédio, São Paulo, v. 116, n. 18, 2019.