Description du jeu de données 2017

Explorer les événements de course à pied à partir des données du Web.

La description du jeu de données est disponible à cette adresse, ainsi que les jeux de données eux-mêmes pour les courses 2017 et les évènements de la même année.

https://www.nakala.fr/nakala/data/11280/d0ada45b

Dans le cadre d’une étude sur les événements de courses à pied internationaux, la connaissance de la répartition est une information nécessaire afin de comprendre l’ampleur de ce phénomène et pouvoir l’analyser spatialement.

Les fondements de cette base de données prennent naissance dans des sites internet divers. Il s’agit d’explorer l’espace du Web, comme une source de matériaux qui permet de nourrir des réflexions géographiques : comment mobiliser l’immensité de ces données ? Comment les extraire, les structurer, les organiser et les valoriser ? Comment passer des données virtuelles à des données géographiques ? Sont autant de questions qui ont été posées et auxquelles des solutions ont été testées pour parvenir à créer ce jeu de données.

from_the_web_to_the_maps

Le jeu de données a été créé à partir de 6 sites-sources. Pour extraire les données, deux méthodes ont été utilisées : semi-automatique et manuelle. Ces sites sont variés : institutionnels et non-institutionnels, francophones et anglophones, etc. Cette variété permet d’obtenir une base de données la plus complète soit il d’un point de vue quantitatif et sémantique.

Le jeu de données Running 2017 en quelques chiffres

jeu_donnees-01

In fine, le jeu de données est composé de quasiment 35 000 événements de courses à pied où se déroulent 88 000 courses à pied. Pour rappel, durant un événement de courses à pied peuvent se dérouler plusieurs courses (marathon, semi-marathon, 10 K, etc.).

event_datas-01
course_datas-01-01

Limites du jeu de données.

Du fait de la complexité des informations contenues sur le Web et de l’hétérogénéité des données publiées d’un site à l’autre, le jeu de données constitué a des limites.

Ces limites sont à prendre en compte lors de l’utilisation du jeu de données et dans les analyses qui en découlent.

Pour plus d’informations sur les précautions à prendre en compte, cliquez ici.

Auteur.e.s : M. Plard & V. Guichet, 2018

Leave a comment

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.