Précaution sur les données ‘Atlas International des évènements running 2017

Précédemment, il a été spécifié complexité de la manipulation des données du web (3 V). Ainsi, le jeu de données créé a des limites.
Toutes les informations ne sont pas données pour l’entièreté des événements ou des courses. Afin que l’utilisation des données soit précise, il est conseillé de mentionner pour chaque carte produite la part du jeu de données mobilisée pour avertir le lecteur.

Malgré un contrôle des doublons, la variété des langues, des orthographes ou encore de règle de nommages ne permettent pas de réaliser une vérification exhaustive. Ainsi, il existe encore des doublons. Pour pallier ce biais, une marge d’erreur a été calculée.

Pour des raisons de temps, il est impossible de vérifier la pertinence sémantique des données. Cependant, les sites sources sont des sites fiables (institutionnels ou semi-institutionnels). Les données qui y sont déposées sont vérifiées et validées par des administrateurs. Ainsi peut être imaginé que la marge d’erreur est faible.

Il est difficile de connaître le nombre de courses à pied organisées qui se déroulent autour du monde. Il est alors impossible de connaître le pourcentage d’exhaustivité de cette base de données constituée. Selon une étude de 2014 publiée par Kantar Media et Uniteam Sport, en 2013 ont été organisés 5 971 événements de courses à pied en France. Le journal le parisien estime entre « 5 000 à 6 000 épreuves annuelles françaises ». Dans la base de données créée par le DataLab, la France comptabilise en 2017 6 314 événements de courses à pied.

La base de données spatiale du DataLab regroupe 34 984 événements de courses à pied.
Ces événements s’étalent de 2008 à 2030. Le site Marathon Ahotu représente les trois quarts des événements extraits. Athlé englobe environ 15 %, Active 9 % JustRunLah 1 %, IAAF 0,3 % et JoggingPlus 0,3 %.

Ces pourcentages s’expliquent de différentes manières. Si marathon Ahotu représente 75 % c’est non seulement parce que le site dispose d’une offre importante, mais aussi parce que toutes les données (de 2006 à 2019) ont été extraites. Les sites ATHLE et IAAF n’englobent que les courses officielles (classantes et qualifiantes), ainsi les événements non officiels ne sont pas comptabilisés. De plus, pour ATHLE et JoggingPlus n’ont été extraits que les événements de 2017 et pour JustRunLah, ceux de 2018. Pour JoggingPlus, seuls les événements des Pays de la Loire ont été extraits. Aussi, le site JustRunLah ne publie que les courses d’Asie et d’Australie.

 

Auteur.e.s : M. Plard & V. Guichet, 2018

Une réflexion au sujet de « Précaution sur les données ‘Atlas International des évènements running 2017 »

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.