Et si les matchs ne se gagnaient plus sur les terrains mais en dehors ? Et si les « big data » devenaient le 12ème homme qui pourrait changer la donne en compétition ? Cette idée pourrait à première vue vous paraître dérisoire ou plus encore vous déplaire. En effet, le football est un sport qui ne se joue pas sur des ordinateurs mais sur les terrains. Si les joueurs en viennent à penser plus à leurs statistiques individuelles qu’à la performance collective, cela tuerait le jeu. Certains observateurs critiquent même l’assistance vidéo à l’arbitrage, alors présente pour des raisons différentes, comme dénaturant le football. Le football demeure avant tout un sport de continuité et non de séquences. Mais un phénomène est bien en marche entre le football et la science des données. C’est en effet ce que semblent indiquer les multiples articles et football est une science (in)exacte parle de « datafication » du sport.

  • Comment jongler avec les données ?
  • Mais comment ça marche ? Quelles données sont récupérées et de quelle manière ? Je ne pense pas que vous imaginiez le nombre de données qui peuvent être collectées. Ce à quoi vous êtes amenés à penser et qui demeure le plus utilisé est le système mondial de navigation par satellites (GNSS) qui retrace le mouvement des joueurs. Mais rien qu’à ce dernier se greffent de multiples autres systèmes pour plus de performance comme des capteurs de fréquence cardiaque. Dès lors, il faut considérer la collecte de nombreuses autres données tel le suivi physiologique recueillant rythme cardiaque, distance parcourue, vitesse, accélération et puissance du joueur. Ces données sont alors récupérées directement du corps des athlètes par de multiples capteurs qui s’intègrent de mieux en mieux aux tenues des joueurs. Google et Adidas sont en ce moment même en train de lancer une semelle connectée pour footballeurs. Comme nous l’avons dit, les « big data » sont en pleine extension dans ce domaine.

    Une date est révélatrice du pas dans cette nouvelle ère des données : juillet 2015. Cette dernière marque l’annonce via une note par FIFA de l’ « autorisation du port de systèmes électroniques de suivi et d’évaluation de la performance » lors des matchs. Avant cette date, tous ces dispositifs de suivi, relevant de la catégorie des systèmes électroniques de suivi et d’évaluation des performances (EPTS), n’étaient autorisés qu’à l’entrainement.

    Dès lors, se multiplient les plateformes recueillant les données des rencontres officielles. Par exemple, le système TRACAB, une technologie de traitement d’images avancée pour identifier la position et la vitesse de tous les objets en mouvement au sein d’un stade de football, a le vent en poupe. Elle est installée dans plus de 300 stades et utilisée lors de plus de 4 500 matchs par an par la Premier League, la Bundesliga et la Liga espagnole.

  • L’aide à la décision en ligne de mire
  • Ces données ont deux principales utilisations. Tout d’abord, comme ce fut le cas à l’origine même de l’introduction de la data dans le sport avec l’équipe de baseball des Athletics d’Oakland : le recrutement. Il existe plus de 100 catégories de statistiques spécifiques, individuelles sur les joueurs telles que tirs, buts, passes décisives… Ces données peuvent alors orienter l’action des clubs pour composer ou compléter une équipe. Mais à condition qu’elles soient utilisées à bon escient avec des statisticiens spécialisés dans ce domaine qui puissent croiser au maximum les données.

    En effet, que faudrait-il relever de la performance de Neymar, nommé homme du match lors du choc PSG-Atlanta mercredi 12 août ? Ne considérer que ses échecs « faciles » face aux buts faisant chuter ses propres statistiques d’ « expected goals* » ? Ou alors regarder son record de 16 dribbles réussis sur 23, sa distance parcourue, ses sprints… Les chiffres sont multiples et doivent être méticuleusement reliés pour être utilisés. Les systèmes se servant de la science des données ont surtout servi à repérer des joueurs « souscôtés » en relevant chez eux des performances non directement visibles comme l’est le fait de marquer un but.

    L’autre pendant de ces statistiques est l’analyse de la performance des joueurs lors de rencontres. Ces analyses représentent un atout de poids pour tout entraîneur. Lors d’un entrainement avec des données arrivant en temps réel ou même après un match (la FIFA interdisant le recueil de données en temps réel durant les rencontres), l’entraîneur peut lire l’état de forme de ses joueurs. C’est un réel appui à la décision à la fois pour la composition mais aussi pour la stratégie à mettre en place afin de valoriser au maximum les atouts de chaque joueur. Là encore, toute statistique appelle à être utilisée avec parcimonie. C’est pourquoi de plus en plus de clubs se constituent de véritables équipes de statisticiens qui permettent de révéler le potentiel de ces données.

    * nombre de buts qu’un joueur aurait dû marquer selon une probabilité basée sur les milliers de tirs tentés lors des saisons précédentes.