Суперкомпьютер назвал претендентов на победу в РПЛ-2025/26
Теперь мы знаем, как завершится сезон.
Прогнозировать итог чемпионата после первого круга — задача, которую сегодня решают не только аналитики клубов, но и крупнейшие спортивные медиа. Например, The Athletic и Opta регулярно строят подробные вероятностные расклады на сезон.
Такие модели зачастую оказываются точнее экспертных оценок, ведь они учитывают огромный массив исторических данных, а не только субъективные впечатления от матчей.
«СЭ» решил спрогнозировать итоги сезона РПЛ-2025/26 на основе результатов первого круга с помощью суперкомпьютера.
Какие данные использовались?
Мы взяли подробную статистику всех сезонов РПЛ с 2001 года (исключая переходный 2010/11, когда менялся формат турнира) и в качестве основных показателей использовали: очки, победы, забитые и пропущенные голы, рейтинг стоимости состава перед началом сезона (по данным Transfermarkt, с 2005 года), общую разницу xG за первый круг (с 2013 года, когда статистика стала доступной). Также учитывались смены тренеров.
На основе собранных данных мы обучили несколько программ (LinearRegression, Gradient Boosting и т. д.), которые ищут закономерности между статистикой первого круга и итогами чемпионата, а затем используют их для прогноза.
Проверочный тест: прогноз сезона-2024/25
Чтобы проверить точность, сначала делается ретропрогноз: нужно обучить модели на сезонах 2001-2023/24 и попытаться предсказать итоги сезона-2024/25.
Это позволяет понять, какая модель даст лучший результат.
Наиболее качественным оказался метод k-ближайших соседей (KNN) — это алгоритм классификации и регрессии, который предсказывает значение для новой точки данных на основе «мнения большинства» среди k наиболее похожих на нее объектов в обучающей выборке.
Проще говоря, он находит k самых близких соседей к новому объекту и присваивает ему то среднее значение, которое наиболее распространено среди этих соседей.
Итак, результат.
Видим, что результат действительно очень хороший: при округлении у 11 команд из 16 прогноз набранных очков совпал с точностью до двух баллов.
В итоговой таблице модель «поменяла» местами несколько команд, но результаты «Краснодара» и «Зенита» очень близки (в реальности борьба и шла до последнего тура). У «Факела» с «Оренбургом» аналогичная ситуация.
Прогноз сезона-2025/26
Теперь добавляем в обучение результаты сезона-2024/25, чтобы модель увидела самые свежие данные — и прогнозируем сезон-2025/26.
В этот раз «Краснодар», ЦСКА и «Зенит» практически равны по показателю ожидаемых очков. Фактическая разница между первым и третьим местом меньше одного балла. Вероятно, мы снова увидим сценарий сезона-2023/24, когда три команды претендовали на золото до последнего тура.
В связи с такой плотностью внутри тройки есть смысл посмотреть на результаты других моделей: большинство из них дает «Краснодару» отрыв в два-три очка и ставит на второе место «Зенит». При этом ЦСКА в каждом из прогнозов остается очень близко к двойке.
Возвращаясь к таблице, KNN отправляет «Балтику» на 4-е место — даже математика верит, что команда Андрея Талалаева не посыпется.
У «Локомотива» снова ожидается весенний кризис (6-е место), а «Динамо» без Валерия Карпина программа отправляет на 7-е место. В указанный темп набора очков «Динамо» поверить почти невозможно, но итоговая позиция вполне реальна.
В зоне вылета тоже будет интересная рубка: модель считает, что «Сочи» с «Оренбургом» имеют почти равные шансы на спасительное 14-е место. И при этом отправляет «Пари НН» на самое дно (почти без шансов), а вторым кандидатом на стыки ставит Махачкалу.
Кстати, этот прогноз сильнее всего расходится с личным впечатлением — думаю, Махачкала прибавит после зимней паузы и избежит стыковых матчей.
Такой сценарий нам дает математика. Будет интересно сравнить в конце мая, но уже сейчас ясно одно: второй круг должен подарить нам интригу по всем ключевым позициям до последнего тура.
Михаил Ласкин