En quelques mots, la plateforme libre Orion consiste à documenter et présenter de façon simple, exhaustive et neutre les grands concepts du débat socio-politique français.
Le projet peut donc se décomposer en deux objectifs complémentaires à nos yeux :
-
construire des pipelines dynamiques permettant d’accumuler - ou plus simplement “sourcer” - et traiter de la donnée relative à l’information que nous souhaitons afficher
Par exemple, un de nos pipelines dynamiques relatif au chômage en France consiste à avoir constamment, sans faire la mise à jour manuellement, l’intégralité des chiffres des différentes catégories de chômage (ces chiffes sont disponibles sur le site de l’INSEE sous un format Excel). -
construire des outils de visualisation des données
Poursuivant l’exemple précédent, il est important d’avoir des modules de visualisation qui ne biaisent pas l’information : nous présentons les chiffres précédemment sourcés dans leur intégralité.
L’existence de données déjà traitées par DB.nomics permet à notre équipe de se concentrer sur le second objectif, ce qui constitue un gain de temps vital pour un projet open source comme Orion. Elle nous permet de nous appuyer sur des pipelines déjà existant et d’avoir accès à des données publiques (provenant de l’INSEE par exemple) dans un format beaucoup plus facilement manipulable (JSON pour ne citer que lui) que celui que nous aurions trouvé à la source directe.
DB.nomics nous permet également de compter sur une nomenclature uniforme des données présentées, élément crucial de tout traitement “massif” de données.
Le projet est actuellement en développement ici : https://github.com/project-orion/orion
Alexis Thual pour le projet Orion