IA, le sport dopé à la donnée

Entre l’optimisation des performances des sportifs grâce à des programmes d’intelligence artificielle  et des algorithmes prédisant de plus en plus précisément les résultats des jeux, la magie du sport peut-elle disparaître ? Antoine David, General Manager Southern Europe chez STATS, leader mondial de la fourniture de données statistiques à destination des médias et des principales entités sportives, explique comment leur utilisation a changé le sport professionnel, et les perspectives offertes par l’IA.

 

Les données dans le sport, ça remonte à quand ?

 

Antoine David : Les données sont réellement utilisées depuis un peu plus de vingt ans. Avant cela, elles étaient assez limitées, car collectées principalement par des opérateurs humains, avec la fastidiosité qu’on imagine. Nous avions à cette époque lancé une technologie, devenue « banale » aujourd’hui : le tracking. Grâce à des caméras installées autour des terrains et des capteurs GPS sur les joueurs, nous pouvions obtenir de nombreuses informations. Son arrivée sur le marché a probablement été l’acte créateur de l’analyse de données sportives. C’est parti d’Angleterre, puis ça s’est étendu progressivement partout. D’ailleurs, nos premiers opérateurs de codage sont souvent devenus les analystes des principales équipes de Premier League anglaise aujourd’hui… gérant bien souvent des équipes de dizaines de personnes.

 

Les indicateurs se multiplient, est-on dans un âge d’or de l’analyse sportive ?

 

C’est difficile à dire. En relativement peu de temps, nous sommes passés de très peu de données à une profusion de données disponibles. Néanmoins, avec cette multiplication des indicateurs, on risque d’être noyé. La quête ultime, c’est la pertinence. Pour fournir à nos clients, joueurs, coachs ou médias, des ingrédients prémâchés qui soient de réels outils de prise de décision.

L’IA sera donc la clé dans les prochaines années ?

 

C’est ce que l’on pense, et c’est pour cela que nous avons particulièrement investi dedans ces dernières années. Les algorithmes actuels, qui par exemple détectent dans l’image des choses qui étaient inenvisageables il y a peu, montrent déjà à quel point il y a du potentiel. Mais la convergence entre la puissance de calcul libérée, le cloud, les nouveaux algorithmes offre une autre dimension. L’avantage, c’est que les flux de données emmagasinées, notamment grâce au tracking, sont suffisamment volumineux. C’est parfait pour l’intelligence artificielle qui a essentiellement besoin de données historiques sur une période suffisamment longue.

 

Est-elle déjà présente dans le sport ou est-ce encore un fantasme ?

 

Beaucoup de gens en parlent sans réellement y consacrer un effort réel. La raison est simple : il faut des profils très pointus, des datas scientists de haut niveau qui doivent également avoir une connaissance forte du sport pour avoir de la pertinence. Donc ce sont des profils rares. Nous avons la chance chez STATS, grâce à notre expérience et notre historique, d’avoir des équipes dédiées, notamment à Chicago où nous avons un pôle regroupant plus de 15 personnes. Ça fait une puissance de frappe importante pour créer des modèles qui vont au-delà des statistiques, et donne du contexte et du sens à tous les flux statistiques standards.

Nous avons par exemple développé ces dernières années un modèle que nous sommes en train de déployer sur le marché : l’analyse automatique des styles de jeu d’une équipe. Ce sont des couches intelligentes qui viennent s’ajouter dans les bases de données et qui indiquent à l’entraîneur non seulement les statistiques, mais aussi quelles actions sont les plus efficaces.

 

L’intelligence artificielle ne pourrait-elle pas devenir le dopage du futur où celui qui aura le meilleur logiciel ou le meilleur data scientist gagnera ?

 

Je ne crois personnellement pas à cette théorie de la machine qui remplace l’homme. Depuis que les données sont arrivées dans le sport, la question revient, et avec l’IA, la crainte est démultipliée. Mais elle ne date pas d’aujourd’hui. Il y a vingt ans, lorsque nous sommes arrivés avec les premiers systèmes de tracking, qui analysaient les positions des joueurs, les sprints, les niveaux de fatigue, les stratégies de jeu, les gens se sont dit que nous allions remplacer les coachs. Vingt ans après, on constate bien que ce n’est absolument pas ce qu’il s’est passé. C’est simplement devenu un outil à la disposition des staffs techniques. Qui a même créé des emplois en ajoutant de nouvelles compétences. Ça restera des aides à la décision, d’optimisation des performances. Et quoi qu’il arrive, les joueurs restent des êtres humains et la statistique ne peut pas tout remplacer.

 

Lors de la Coupe du monde de football, beaucoup d’entreprises technologiques ont essayé de faire des prédictions sur les résultats. Beaucoup se sont plantées. Comment expliquer cela ?

 

Une des raisons, ce sont les flux de données sur lesquels ces modèles s’appuient. Pendant des années, tout le monde y compris les plus gros clubs anglais ont essayé de créer des modèles à partir des données statistiques classiques, les « events » —  ce que faisaient les opérateurs humains finalement — et ce n’est pas suffisant. Ça constitue environ 2000 informations statistiques par match, qui décrivent certains ingrédients — la possession de balle, le comportement des joueurs, etc. Mais la marge d’erreur réside dans des paramètres difficiles à modéliser comme la gestion de l’espace ou la psychologie des joueurs. Pour modéliser cela dans le football, il faut des modèles bien plus costauds. Le challenge est colossal et le potentiel est énorme. On ne part pas de zéro, on commence à y arriver, mais il nous reste quelques années de travail pour y parvenir.

 

Photo de Joseph Barrientos sur Unsplash.