Open data: la fin des données ouvertes?
Dans le monde du Big Data, la donnée est la matière vitale nécessaire au bon déroulement d'un projet data. Quelle que soit sa source, sa qualité, sa richesse... elle est indispensable dans toutes les phases du projet depuis la création du data lake jusqu'à la restitution des résultats (dataviz), en passant par la mise en place d'algorithmes de machine learning.
Mais ou la trouver? Si la source la plus récurrente est le système d'information historique de l'entreprise, il existe une autre source tout aussi précieuse: internet. L'open data (littéralement "données ouvertes") représente une source d'information librement accessible pour tous sur le web, via des portails en ligne (Data.gouv, Paris Data...), directement sur le site web de grandes entreprises ("SNCF Open Data") ou auprès de certains organismes spécifiques (prix-carburants.gouv, open-data-assurance-maladie.ameli...). Ces données sont généralement proposées dans un format facilement exploitable (excel, csv...) et documentées à minima. Aujourd'hui, on retrouve des portails Open Data dans de nombreux pays du monde entier.
Imaginez le potentiel de toutes ces données croisées entre elles, données internes à l'entreprise d'une part et externes d'autre part, pour répondre à des enjeux de type prédiction de la fréquentation des gares ou encore recherche des facteurs de risque du cancer par exemple.
Alors pourquoi évoquer la fin de l'open data? Et bien cet élan vers une ouverture des données semble être retomber dans certains pays pourtant pionniers du phénomène Open Data, à l'instar des Etats-Unis. En effet, la politique du nouveau président de la première puissance mondiale, Donald Trump, semble très peu intéressé par le mouvement data, au point de faire machine arrière en effaçant le contenu du site open.whitehouse.gov, le portail américain de l'open data. En effet, un petit tour sur la page d'accueil permet de constater le message "Check back soon for new data", puis un clic sur le data catalog nous redirige alors vers une nouvelle page vide ("No results"). Cela n'a rien de surprennant lorsque l'on sait que le Federal Chief Information Officer (CIO, le responsable informatique gouvernental) n'a toujours pas été nommé à ce jour...
"Make America Great Again" ("Retrouver la grandeur de l'Amérique"), dixit le slogan de campagne de Trump, nécessite de nombreux sacrifices?
Plus d'information à ce sujet: zdnet
Leave a Comment: