Respuestas a algunas preguntas posibles

Algunas preguntas que pueden surgir sobre el funcionamiento del modelo y sus respuestas. A aquellos que quieran más detalle técnico les sugerimos que nos escriban a veintiocho0777@gmail.com.

1. Mano a mano

La idea principal del modelo es calcular una fuerza ataque y defensa para cada equipo. Para esto se utilizan partidos ya jugados de cada equipo.

1.1 ¿Qué partidos se utilizan?

Tomamos todos los partidos de la Liga Nacional y la Liga Argentina a partir de la temporada 2018-2019 (incluido).

1.1.1 ¿Por qué se utilizan partidos de la Liga Argentina?

Se usan para poder tener datos suficientes de los equipos recién ascendidos, pues al analizar todo junto los equipos que jugaron en ambas categorías en estos años ajustan la diferencia entre ambas.

1.2 ¿Todos los partidos tienen la misma importancia?

Aquí debemos mencionar varios factores, pero la respuesta es no.

1.2.1 Fecha

Primero que nada se le da más importancia a los resultados más recientes. Esto hace que un equipo que viene “en subida”, tenga más ventaja contra uno que viene decayendo.

1.2.2 Localía

Cada equipo tiene, además de su 'fuerza de ataque' y 'fuerza de defensa' un factor por localía para ambas fuerzas, las cuales no son necesariamente positivas(equipos que jugan mejor de visitantes).

1.2.3 Formaciones

¿Se tienen en cuenta? En este caso la respuesta es no. No se tienen en cuenta qué jugadores fueron parte de cada encuentro, a priori es un tema complejo de incorporar al modelo. Si uno pudiera detectar partidos donde uno o ambos equipos presentan formaciones muy alejadas de su 5 ideal, podría eliminar esos partidos de la base de datos, por ejemplo. Pero es algo que prácticamente no hemos hecho.

1.2.4 Importancia del Rival

El modelo 'ajusta' todos los partidos al mismo tiempo, por lo tanto, una victoria ante un equipo que perdió muchos partidos no sumará mucho.

1.3 ¿Cómo se calcula la probabilidad de que, por ejemplo, San Lorenzo le gane 78-70 a Quimsa?

Una vez que tenemos la base de datos con los partidos ponderados como se explicó más arriba, mediante un modelo matemático con ayuda de la computación, calculamos la ’fuerza’ de ataque y de defensa de ambos equipos. De esta forma, podemos obtener las probabilidades de que San Lorenzo convierta 78 puntos frente a Quimsa y de que reciba tan solo 70. Técnicamente la probabilidad de que San Lorenzo le haga x puntos a Quimsa sigue una distribución de Poisson con parámetro la fuerza de ataque de San Lorenzo multiplicada por la fuerza de defensa de Quimsa (cuanto más alto es este valor, más débil es la defensa, a diferencia de lo que pasa con la fuerza de ataque), mientras que la probabilidad de que Quimsa le haga y puntos a San Lorenzo sigue una distribución de Poisson con parámetro la fuerza de ataque de Quimsa multiplicada por la fuerza de defensa de San Lorenzo. Se calculan todos los posibles resultados de ese partido (acotando razonablemente el número de puntos que un equipo puede hacer o recibir).

2. ¿Cómo se calcula la probabilidad de Instituto de salir campeón?

Para calcular las probabilidades de la Liga Nacional, simulamos el torneo 1 millón de veces y sumamos las veces que Instituto llegó a la final y lo dividimos por la cantidad de simulaciones del torneo. Por eso decimos que es una “probabilidad empírica”.

2.1 ¿Cómo se simula un partido?

Teniendo los 'poderes' de cada equipo, le pedimos a la computadora que nos diga aleatoriamente dos valores siguiendo las probabilidades de las respectivas distribuciones. Estos dos valores serán el resultado del partido en dicha simulación.

2.2 ¿Cómo se simula una Liga?

Se simulan todos los partidos de la liga, es decir, cada equipo contra todos los otros una vez de local y otra de visitante. Nuestro simulador tiene en cuenta los resultados de los partidos ya jugados, y esto se reflejará en los cálculos que obtenemos. Por ejemplo, cuando ya estemos a pocos partidos del final veremos a varios equipos con 0% de probabilidad de salir campeón o de entrar al play off por el descenso.

2.3 ¿Qué pasa con los empates?

En caso de que la simulación de por resultado que ambos equipos marcaron la misma cantidad de puntos (lo cual pasa pocas veces), elegimos aleatoriamente (como si tiráramos una moneda) un equipo y le sumamos un punto.

2.4 Si se tienen las probabilidades de cada partido, ¿por qué se simula? ¿No se puede calcular?

La realidad es que con el insumo de las probabilidades de cada resultado de cada partido, se podrían calcular las probabilidades exactas, sin embargo, son tantos los posibles resultados en la fase de grupos (para dar una idea, para tan solo un partido y asumiendo que los equipos convierten entre 40 y 120 puntos, hay 6400 combinaciones) que se hace imposible en términos computacionales calcularlas exactamente. Al simularlo tantas veces, nos aseguramos que los valores obtenidos se parezcan bastante a los reales.

2.5 Si se vuelve a simular, ¿los resultados van a cambiar?

Sí, pero tan levemente que los cambios son despreciables. Hemos comprobado que con 1 millón de simulaciones las diferencias entre dos simulaciones distintas no afectan al resultado con 2 decimales (que es lo que subimos al sitio).