#1

Les données géolocalisées, tournant dans l’analyse de la mobilité quotidienne

l’exemple des données de téléphonie mobile

Au cœur de nos quotidiens, nos trajets et nos déplacements sont touchés de plein fouet par la révolution numérique. Ces questions de mobilité sont particulièrement investies pour développer des services innovants, toujours plus adaptés aux pratiques des usagers. Notre auteur ouvre la boîte noire et nous explique comment sont produites et utilisées nos données de géolocalisation.

La connaissance des mobilités quotidiennes à l’échelle d’une ville participe à l’élaboration de son aménagement urbain. En effet, au-delà de la dimension transport, l’objectif est de favoriser les mouvements au sein d’une ville et les interactions sociales entre habitants. Pour analyser ces mobilités, on exploite des sources de données traditionnellement produites lors d’enquêtes en décomposant les informations individuelles récoltées selon un système d’identifiants1. Si cette décomposition permet l’analyse de ces phénomènes complexes, elle les simplifie également2. Comment alors conserver la richesse des mobilités individuelles sous forme de déplacements, très différents et innombrables, dans les études de mobilité ?

Avec l’utilisation croissante des téléphones portables, diffusés dès 2000 auprès du grand public, on assiste à un renouvellement de ces sources de données3. En effet, les données récoltées grâce à l’utilisation des téléphones portables ont introduit la promesse d’informations spatio-temporelles plus précises car individuelles4. Mais, en plus du défi scientifique de traitement de grands jeux de données, déjà bien avancé dans le milieu de la recherche, leur exploitation semble rester à un stade émergent lorsqu’il s’agit pour les maîtrises d’ouvrage ou bureaux d’études de s’emparer des opportunités dormantes de ces données dans leurs études de mobilité.
Les données de téléphonie mobile sont relativement neuves et elles ont des modalités d’utilisation atypiques, mais comment accélérer leur prise en main opérationnelle ?

Des données de localisation aux données de mobilité

Les téléphones portables permettent une récolte active ou passive de données de localisation des individus dans le temps. Si la première manière nécessite l’intermédiaire d’une application installée sur les téléphones portables, la seconde provient des enregistrements techniques du réseau de téléphonie mobile. Dans les deux cas, leur utilisation pose des questions relatives à la protection de données à caractère personnel5.

La fonctionnalité de localisation des téléphones portables permet à de nombreuses applications de fournir un service de transport ou de mobilité à ses usagers (Uber, Lyft, Citymapper, etc.). La possibilité d’une participation active ou collaborative vient renforcer les données de localisations avec comme critère principal le temps-réel (exemple pour l’application Waze : accidents, états du trafic, etc.).
Ces données d’usage produites par le biais d’un service numérique restent pour le moment fermées à d’autres exploitations, de planification par exemple. Quelques tentatives plus ou moins prometteuses, de collaboration entre possesseurs de données et collectivités ont néanmoins déjà été expérimentées (Uber à New York6, Waze et son Connected Citizens Program).

La récolte passive de données de téléphonie mobile résulte directement du réseau de téléphonie, composé d’antennes réparties sur le territoire, qui enregistrent les connexions avec les téléphones portables. Il est ensuite possible de disposer de deux sortes d’informations : les données de présence des téléphones portables dans la zone de couverture d’une antenne et les données de communication (appels et sms émis et reçus, data). Grâce à ces données, on obtient des densités de présences agrégées d’individus, et des volumes de flux. Ces flux peuvent ensuite être décomposés selon différents critères : modes de transport, lieux probables de départs et d’arrivées, etc.

Les caractéristiques des données de téléphonie mobile dépassent certaines limites des enquêtes traditionnelles menées auprès d’échantillons de population : elles n’ont pas de délimitation dans le temps, ni dans l’espace, et elles correspondent aux données d’un grand nombre d’individus (en possession de téléphone portable). Elles sont également utilisées de manière opportuniste pour la mobilité, puisqu’elles servent à l’origine à l’organisation interne des opérateurs téléphoniques (réseau technique, facturation, etc.) ; leur coût de production est donc restreint7.

Faire muter le cadre d’analyse des mobilités

Si les données de téléphonie mobile sont intéressantes dans l’étude des mobilités du fait de leur haut niveau de précision spatio-temporelle8, elles sont néanmoins d’exploitation spécifique, comme la plupart des big data. En effet, leur mode d’emploi est défini par les caractéristiques du réseau de téléphonie d’où elles proviennent. Un ajustement de méthodologie s’opère donc : on ne produit plus des données pour répondre à des questions, mais ce sont les caractéristiques propres aux données qui orientent les informations trouvées.
Ces données permettent en effet un suivi sur des périodes plus longues et des territoires plus vastes, ce qui est impossible à observer avec les enquêtes traditionnelles, qui se cantonnent souvent aux déplacements réalisés la veille par les individus interrogés.
Elles rendent ainsi visibles des typologies de comportements de mobilité longitudinaux (déplacements de la semaine et du week-end, déplacements mensuels), là ou les enquêtes autorisent l’observation de comportements de mobilité plus ponctuels (un jour de semaine).
Mais cette nouvelle échelle spatio-temporelle amène d’autres questions dans le cadre de l’étude de la mobilité. D’abord parce que la téléphonie n’est pas un capteur de mobilité et reste un capteur de téléphonie : il existe tout le temps, même quand on ne se déplace pas. Il devient alors compliqué de définir un déplacement avec une origine et une destination, d’y associer un mode de transport, voire un motif (domicile, travail). De même, la définition d’un périmètre d’étude devient complexe, le territoire n’étant pas fermé, les entrées et sorties sont donc imprévues. Il semble ainsi nécessaire de faire muter le cadre d’analyse des données de mobilité traditionnelles.

À l’heure actuelle, les résultats obtenus après traitement des données dans l’optique d’une analyse des mobilités génèrent des incertitudes. Notamment à une échelle locale, où le redressement des données avec de nombreux critères (par exemple le taux de pénétration d’abonnés de l’opérateur sur une zone, etc.) peut induire un pourcentage de déperdition de population assez important dans les résultats obtenus9. De plus, l’affectation modale10 est techniquement complexe pour de petites distances. Les différences de vitesses entre la marche et le vélo sont par exemple souvent trop insuffisantes pour être distinguées.

En outre, si historiquement les échantillons d’enquêtes sont construits de telle sorte qu’on réfléchisse toujours avec un biais constant, les données de téléphonie mobile introduisent une problématique plus ponctuelle de la gestion de l’erreur, de la fourchette de précision ou du pourcentage de fiabilité.
Par conséquent, le volume, l’origine-destination et les modes de transport voire les motifs de déplacement, critères qui caractérisent traditionnellement un flux, induisent des degrés de précision différents. Comment alors analyser ensemble des critères hétérogènes ?
En sachant les choix du périmètre et du moment décisifs pour la fiabilité de l’étude, il y a probablement un compromis à trouver entre la recherche d’une précision plus fine sur un périmètre réduit et un laps de temps court, et une connaissance plus floue sur un périmètre spatio-temporel plus étendu11. En d’autres termes, il s’agit de jongler avec des observations de types baromètre et zoom sur des espaces-temps concis.

Un besoin d’interprétation localisée

Les données de téléphonie mobile sont quantitatives et permettent donc de voir des densités de présences d’individus à un endroit et à un moment donnés, ou des volumes de flux. Avec l’intégration d’autres jeux de données, ces résultats sont étoffés par des facteurs spatiaux ou sociétaux. Pour tirer des conclusions sur les activités individuelles ou collectives réalisées sur un territoire, il est nécessaire de relier ces densités de présences d’individus aux caractéristiques de l’endroit concerné (mode d’occupation du sol, population, données de l’opérateur de transport, etc.).

Au final, les données de téléphonie mobile nécessitent d’être exploitées à partir de leurs caractéristiques, mais, à contrario, leur interprétation est contextuelle et ne peut se faire hors sol, sans enrichissement avec d’autres jeux de données et informations spécifiques locales. Ce sont ces associations d’idées, en plus d’une connaissance accrue des fonctions du territoire, qui dévoilent le potentiel des données de téléphonie mobile pour l’analyse des mobilités locales.

Les enjeux de représentation des mobilités

Les évolutions des mobilités contemporaines, notamment avec la diversification des modes de transport et des usages, appellent à des innovations de représentations. Ce besoin d’innovation trouve un parallèle dans les propos d’Antoine Picon lorsqu’il décrit un passage de la ville vue sous forme de réseaux, à une ville assimilée à une somme d’occurrences où l’on voit « ce qui se passe »12.

Les cartes de flux de déplacements, réalisées de manière dynamique à partir de données de téléphonie mobile, ont un potentiel de communication évident. Cependant cela ne permet pas de représenter ou décrire des pratiques urbaines plus complexes13. De nouvelles représentations des mobilités individuelles pourraient par exemple entrer plus en détail dans les étapes des déplacements réalisés (étapes physiques - multimodalité - et numérique - préparation en amont d’un déplacement). En d’autres termes, il s’agirait de trouver une échelle d’analyse intéressante pour appréhender des parcours individuels. Rendre ainsi visible un panel de comportements plus complets pourrait affiner la compréhension de certaines situations de report modal ou de mieux aménager l’intermodalité.

Une autre possibilité consisterait à introduire une dimension subjective dans la représentation du vécu des mobilités, au moyen d’applications installées sur les téléphones portables pour associer récolte active et passive de données. On dispose, par exemple, de peu de données concernant le ressenti des individus au cours de leurs trajets. Des indicateurs subjectifs pourraient étoffer les choix imputés aux individus dans leurs arbitrages de mobilité. Le temps, le coût des déplacements seraient alors réévalués à la lumière de considérations individuelles. Ainsi, ce besoin de renouvellement dans la représentation des mobilités pourrait motiver celui des indicateurs d’analyse utilisés.

Les difficultés d’appropriation des professionnels de la mobilité dans l’exploitation des données de téléphonie mobile sont multiples. Il s’agit principalement d’une éducation aux données à opérer au sein des maîtrises d’ouvrage et bureaux d’études, pour arriver à tirer le meilleur parti de ces nouvelles sources en fonction des possibilités qu’elles offrent réellement. Pour ce faire, le cadre traditionnel d’analyse des pratiques de mobilité doit probablement évoluer.

En parallèle, la phase de transition dans laquelle nous nous situons semble être propice à un rapprochement entre opérateurs de téléphonie et professionnels de la mobilité. En effet, les premiers, qui effectuent le travail de data science sur les données qu’ils possèdent, pourraient également en orienter les visualisations vers des problématiques propres à l’analyse de la mobilité. Les seconds, quant à eux, pourraient aujourd’hui être en mesure de définir leurs besoins d’informations en fonction des particularités des données de téléphonie mobile. Ce travail de co-conception interdisciplinaire pourrait ainsi contribuer à mieux connaître certaines facettes descomportements de mobilité et d’en tirer des solutions concrètes d’optimisation de parcours.


Notes


  1. Note de présentation,Les enquêtes de déplacement standard CERTU, janvier 2013 

  2. A. Banos, Des trajectoires individuelles à la ville en mouvement : reconstruire les mobilités urbaines quotidiennes, 2005 

  3. J. Fen Chong, Organisation spatio-temporelle des mobilités révélées par la téléphonie mobile en Île-de-France, Thèse doctorale en géographie, sous la direction de Denise Pumain et Arnaud Banos, Université Panthéon-Sorbonne – Paris 1, 2012 

  4. Z. Smoreda, A.-M. Olteanu-Raimond, T. Couronné, Spatiotemporal data from mobile phones for personal mobility assessment, in J. Zmud et al. (eds) Transport Survey Methods: Best Practice for Decision Making, Emerald, 2013  

  5. Les données de téléphonie mobile sont anonymisées. La CNIL (Commission Nationale de l’Informatique et des Libertés) est consultée pour ces utilisations.  

  6. J. Brustein, BloomberTechnology, 05/01/2017 

  7. Le coût de production est néanmoins important pour l’opérateur téléphonique, qui transforme les données brutes (développement d’expertise, coût R&D, etc.) 

  8. P. Pucci, F. Manfredini, P. Tagliolato, Mapping the changing city through mobile phone data, NUL, New urban Languages. Conference Proceedings, 2013 

  9. Entretien réalisé en 2015 avec une dizaine de bureaux d’études ou collectivités dans la cadre d’un stage chez Orange Labs 

  10. Les modes de transports peuvent être déduits en associant aux flux les vitesses des différents modes de transports. 

  11. On ne parle pas ici du coût d’achat des données de téléphonie mobile, qui varie d’un opérateur à l’autre, et qui rentre évidemment en compte dans la réalisation d’une étude de mobilité. Grossièrement, plus la quantité de données traitée est importante (distances ou périodes plus longues), plus le coût augmente. 

  12. A. Picon, « Ville numérique, ville évènement », Flux 2009/4 (n° 78), p.17-23 

  13. Le projet Manycities du laboratoire Senseable City Lab du MIT et le projet UrbanMob du laboratoire Sense d’Orange Labs.