Британские математики предложили новый метод анализа статистики игр футбольных команд. По словам создателей, среди прочего он позволяет качественно и количественно обрисовывать стиль игры - вещь крайне плохо поддающуюся формализации. Статья ученых пока не принята к публикации, однако ее препринт доступен на сайте arXiv.org.
В рамках работы ученые сначала построили направленный взвешенный мультиграф - изобилие точек, соединенных ребрами, каждому из которых приписан некоторый вес, - по результатам нескольких игр. Вершины графа представляли собой игроков, ребра соединяли тех футболистов, которые отдавали друг другу пасы (две вершины могли соединяться двумя ребрами с противоположными направлениями), а в качестве веса ребра бралось количество пасов.
В качестве данных для работы ученые брали результаты выступления сборных Испании и Нидерландов на чемпионате мира в ЮАР в 2010 году (417 и 266 пасов соответственно). Используя полученную информацию, исследователи построили подходящий граф. На этом этапе исследователям удалось выявить самых популярных игроков - то есть тех, кто получил за время турнира наибольшее количество пасов. Ими оказались испанцы Серхио Бускетс и Хави.
Также ученые вычислили для игроков количество последовательностей пасов (то есть путей в графе), в которых каждый из них участвовал. Лидером по этому показателю оказался игрок испанской сборной Жоан Капдевилла. Потом этого к сети исследователи применили алгоритм PageRank, созданный основателями Google Сергеем Брином и Ларри Пейджем. По словам исследователей, применение этого алгоритма позволяет определить того игрока, который с наибольшей вероятностью получит последним пас в серии. Таким игроком оказался Хави.
Исследователи, однако, признают, что их методология имеет ряд недостатков. Предположим, для анализа требуется статистика по нескольким играм, поэтому отдельные игры анализировать не получится. Кроме этого, анализируются только пасы. Ученые говорят, что эти недостатки можно преодолеть более тонким моделированием.