← Voltar ao início

👽 Projeto Sassamaru

Documentação Técnica do Modelo Estatístico

Documento Técnico do Modelo Estatístico do Simulador de Campeonato Brasileiro

Introdução

Este documento descreve a arquitetura, a fundamentação estatística e a implementação do modelo híbrido desenvolvido para previsão de resultados de partidas do Campeonato Brasileiro de Futebol. O modelo combina a metodologia Elo para avaliação dinâmica de forças dos times com a modelagem de distribuição de gols baseada na distribuição de Poisson, criando um sistema que integra informações históricas e probabilísticas para estimar resultados futuros.


1. Fundamentação Estatística do Modelo

1.1 Modelo Elo Dinâmico para Força dos Times

O sistema Elo é uma metodologia consagrada para avaliação de força relativa entre competidores, originalmente usada em xadrez, mas amplamente aplicada em esportes. No contexto do futebol:

Este cálculo gera um histórico dinâmico que representa a força competitiva atualizada de cada time.

1.2 Modelo Poisson para Distribuição de Gols

A previsão dos gols segue a distribuição de Poisson, que é adequada para modelar eventos discretos raros em intervalos fixos, como gols em uma partida:

1.3 Modelo Híbrido (Ensemble)

O modelo final combina o Elo e o Poisson:


2. Arquitetura do Sistema

2.1 Componentes Principais

2.2 Fluxo da Aplicação

  1. Usuário inicia o app, que carrega o CSV e calcula o Elo dinâmico, forças e médias da liga
  2. Usuário insere até 10 jogos (mandante e visitante) e escolhe número de simulações (ex: 10 mil)
  3. O app paraleliza a execução das simulações utilizando o modelo híbrido para cada partida
  4. Progresso da simulação é mostrado na interface
  5. Ao final, arquivo Markdown com resumo estatístico é salvo e exibido para o usuário
  6. O usuário pode também visualizar os rankings de Elo e xG gerados a partir dos dados carregados

3. Implementação Técnica

3.1 Linguagem e Bibliotecas

3.2 Estrutura do Código

Funções específicas para:

3.3 Otimizações


4. Conclusão

Este modelo estatístico híbrido implementa um método robusto para previsão de resultados do Campeonato Brasileiro, combinando análise histórica e probabilística avançada. A arquitetura modular e a interface gráfica amigável permitem fácil uso, enquanto as técnicas de paralelização garantem performance adequada para grandes volumes de simulações.

Este sistema pode ser expandido para incorporar outros fatores (lesões, transferências, clima) e melhorar a precisão das previsões, além de servir como base para sistemas de análise esportiva e apostas inteligentes.


APX A: Definição Formal do Modelo Estatístico

O que é um Modelo?

Um modelo é uma representação matemática, estatística ou computacional que busca descrever, explicar ou prever o comportamento de um sistema ou fenômeno real. No contexto da ciência de dados e estatística, modelos usam dados históricos para estimar relações entre variáveis e gerar previsões probabilísticas fundamentadas.

O Modelo Estatístico Implementado

O código desenvolvido constitui um modelo estatístico preditivo para partidas de futebol, cuja finalidade é estimar os resultados futuros com base em dados históricos de partidas já disputadas.

Ele combina dois métodos consagrados:

  1. Sistema Elo Dinâmico: Avalia a força relativa dos times ao longo do tempo, ajustando a pontuação (rating) de cada clube conforme o histórico de resultados. Considera a vantagem de jogar em casa e a margem de gols para refinar a avaliação.
  2. Modelo Poisson para Gols: Estima a probabilidade de cada time marcar um certo número de gols usando a distribuição de Poisson, adequada para eventos discretos e independentes. Leva em conta forças ofensivas e defensivas relativas, bem como médias gerais de gols no campeonato.

Natureza do Modelo

Aplicação do Modelo

Importância e Uso

Este modelo permite análises quantitativas robustas, suporte a decisões (como apostas ou análises esportivas) e acompanhamento evolutivo do desempenho das equipes ao longo do tempo, oferecendo uma ferramenta computacional rigorosa baseada em fundamentos estatísticos sólidos.