Comment associer sa base de données adresses avec les différents découpages géographiques que l’on trouve en Open Data ?
C’est LA question que se posent toutes les équipes data, marketing ou géomarketing qui veulent tirer parti de la richesse de l’Open Data français.
Mais très rapidement, la tâche se complexifie : entre les IRIS, les carreaux INSEE, les codes commune, les polygones avec géocodage ultra précis, il devient difficile de s’y retrouver.
Et surtout, de parvenir à établir un lien fiable entre ses propres bases de données et ces multiples systèmes de découpage.
Lorsqu’il s’agit, en plus, de gérer la mise à jour régulière de ces référentiels, nombreux sont ceux qui renoncent.
Des découpages géographiques multiples en Open Data, rarement alignés
Il existe aujourd’hui des dizaines de systèmes de découpage géographique utilisés par l’administration française et les producteurs de données publiques.
Contrairement à ce que l’on pourrait imaginer, les différents découpages géographiques utilisés en Open Data ne s’emboîtent pas de manière hiérarchique.
Certains jeux de données croisent plusieurs codifications. D’autres n’en utilisent qu’une, souvent peu documentée.
Et parmi les pépites les plus originales, citons… le zonage des marchés de Noël dans certaines métropoles ! (et oui, c’est aussi en Open Data !)
Les découpages géographiques que l’on trouve en Open Data représentent des vues différentes du territoire, pensées pour des finalités spécifiques : statistiques, fiscales, administratives, urbanistiques…
Résultat : un même point sur la carte appartient à plusieurs découpages en parallèle. Par exemple, une parcelle située à proximité d’une limite entre deux carreaux INSEE peut se retrouver à cheval sur les deux.
De même, un carreau peut recouper plusieurs IRIS, et un secteur scolaire peut traverser plusieurs zones IRIS.
En somme, ces découpages ne sont pas mutuellement exclusifs : ce sont des couches superposées, pensées pour des usages différents.
Et c’est précisément là que les difficultés commencent pour les équipes data souhaitant enrichir leurs bases à partir des adresses postales qu’elles possèdent :
Comment associer mes adresses aux bonnes codifications géographiques, afin d’exploiter tout le potentiel des données publiques disponibles ?
Pourquoi c’est compliqué de s’y connecter ?
Même si vous disposez d’adresses postales précises et normalisées, le lien vers un découpage géographique open data n’est pas automatique
- Les formats de découpage sont parfois hétérogènes et peu documentés
- Les jeux de données ne sont pas alignés temporellement (versions différentes)
- Certains découpages évoluent dans le temps (fusion de communes, redécoupages IRIS, etc.)
- Et surtout… les identifiants géographiques utilisés dans l’Open Data diffèrent souvent de ceux présents dans vos systèmes d’information.
Ce qu’il faut pour y arriver : … l’adresse !
Heureusement, l’adresse postale est une véritable clé de voûte pour relier vos données à l’ensemble des zonages géographiques publics. La solution OpenKey® lui affecte un identifiant unique qu’il sera ensuite possible de retrouver dans les datasets que nous aurons préalablement enrichis en identifiants OpenKey®.
OpenKey : une clé d’interopérabilité unique entre vos adresses et les différents zonages des datasets disponibles en Open Data
Un seul identifiant, pour ouvrir toutes les portes du territoire !
Ouvrez, Explorez, [ Exploitez ]