essaidepierre

Enter new Chapter title.

Le gouvernement joue-t-il vraiment le jeu de l'open data ?

 

Le 5 décembre dernier ouvrait le nouveau portail du gouvernement français : data.gouv.fr. Ce site a pour objectif de mettre à disposition de l’ensemble des citoyens un grand nombre de « jeux de données » issues des différentes administrations françaises. Il est le résultat du travail de la mission Etalab, placée en février 2011[1] sous l’autorité du Premier Ministre à la suite du rapport Riester[2] publié l'année précédente qui en préconisait la création.

 

Data.gouv.fr a pour ambition de placer la France dans un mouvement international dit d’« open data » (données ouvertes) déjà mis en oeuvre par plusieurs pays comme les Etats-Unis et le Royaume-Uni. Il propose aujourd’hui 350 000 jeux de données issues pour l’essentiel de l’INSEE (recensement de 2008), mais aussi du Ministère de l’Environnement parmi d’autres, ainsi que de quelques colletivités territoriales. Officiellement, le projet répond à deux objectifs :

 

-      un objectif de transparence de la part de l’Etat et de ses administrations.

 

<vidéo sarkozy>

 

-      un objectif de développement économique avec la création de nouveaux services commerciaux basés sur l’exploitation des données publiques.

 

<vidéo fillon>

 

La condition sine qua non à la réalisation de ces objectifs est la libre réutilisation des données sans condition, en particulier de nature financière. L’accès et l’exploitation y compris commerciale des jeux de données est libre et ne donne pas lieu à redevance ou contre-partie financière. Cette ligne de conduite, qui doit bien convenir aux partisans du libre accès à l’information est surprenante ; en tout cas bien éloignée des moeurs administratives françaises qui ont souvent pratiqué le culte du secret pour l’accès aux données et qui, lorsqu’elles y donnent accès, en interdisent par principe, par culture, toute utilisation dans un cadre qu’elles n’auraient pas défini par avance.

 

<vidéo NKM>

 

Pus profondément, cette politique entre en conflit avec les évolutions au cours des dernières années de certains établissements publics comme l’IGN ou Météo France, lancés dans une activité croissante de commercialisation de leurs données. Politique commerciale basée sur une restriction d’accès aux données ou libre mise à disposition de celles-ci sans espoir de revenus commerciaux que d’autres, des entreprises privées, se chargeront d’exploiter ? Les deux idéologies coexistent au sein de l’Etat, et le discours de Séverin Nadaud, maître d’oeuvre de data.gouv.fr , en rend bien compte.

 

<video Nadeau>

 

La mise à disposition des données publiques par Etalab, l’agence gouvernementale chargée de mettre en oeuvre data.gouv.fr, ne se fait pas dans un grand vide sociétal. Des groupes de pression existent depuis maintenant quelque temps, qui cherchent à encourager l’action du gouvernement en la matière. Le journal en ligne Owni en est le meilleur représentant pour ce qui concerne la presse. Théoricien du « journalisme de données », un des membres de l’équipe, Nicolas Kayser-Bril, en est le fer de lance[3]. Né dans la foulée de l'appel à projet innovant lancé en 2009 par le secrétariat d'Etat à l'économie numérique, l'entreprise Data Publica, présente un modèle d’affaire qui consiste à traiter les jeux de données pour en fournir des représentations directement exploitables auprès de ses clients. Côté associatif, c’est plutôt Regards Citoyens qui tient le devant de la scène.

 

L’association a d’ailleurs pris la peine de décortiquer les 350 000 jeux de données annoncées par data.gouv.fr, ce qui lui a permis d’exprimer quelques critiques[4] sur le nombre réel de données mises à disposition et le format sous lequel elles le sont. Concernant leur nombre tout d’abord, l’association fait remarquer à juste titre que la plus grande part des données présentées proviennent du recensement de 2008 effectué par l’INSEE, dont les résultats se déclinent en autant « jeux de données » qu’il y a de communes en France, c’est-à-dire 36000.

 

Sur le format, l'association relève que la plupart de ces données sont livrées sous forme de fichiers Excel, format fermé et propriétaire propre au logiciel éponyme de Microsoft. Etalab répond non sans raison qu’Excel est le format-roi des administrations françaises. Le problème ne viendrait donc pas de data.gouv.fr mais plutôt des administrations elles-mêmes dont le respect du Référentiel Général d'Interopérabilité est pour le moins inégal.

 

Et encore, fait-on remarquer dans un autre article[5] : les fichiers Excel au moins présentent des données structurées, exportables et donc exploitables. Il n’en va pas de même avec les fichiers .doc ou, pire, .pdf que l’on trouve aussi dans le portail gouvernemental.

 

Globalement cependant, la plupart des commentateurs accordent des bons points au gouvernement pour la qualité du travail accompli. Certes, data.gouv.fr n’est au fond qu’un annuaire bien fait de jeux de données publiques qui étaient déjà accessibles, mais son utilité est évidente. La mise à disposition sous licence ouverte en particulier, est bienvenue. On ne peut qu’espérer que la petite équipe dynamique de l’agence Etalab parviendra à entraîner un nombre croissant d’administrations françaises à entrer dans le mouvement.

 

Toute initiative, aussi positive soit-elle, doit pourtant être remise dans le contexte d’une politique plus générale. Le mouvement open data porte avec lui un risque important : que se spécialisant sur la mise à disposition de certains types de données, quantitatives notamment, et s’intéressant exclusivement à certaines modalités techniques de mise à disposition, par l’intermédiaire de portails et/ou d’api, il en vienne à oublier de s’interroger sur d’autres aspects bien plus importants lorsqu’il s’agit d’évaluer la transparence de l’Etat et de ses administrations : la manière dont les données sont produites et, bien sûr, les données qui ne sont pas accessibles.

 

Or, la production de statistiques publiques n’a sans doute jamais subi autant de pressions et de manipulations que sous le pouvoir actuel. Que ce soit les menaces à peine voilées sur l’INSEE que l’on a voulu délocaliser[6], l'affaiblissement concerté de l'appareil statistique du Ministère de l'éducation nationale[7], les manipulations sur les modes et objets de mesure, sans cesse perturbés afin d’empêcher les comparaisons ou les embargos voire interdictions de publication de certains chiffres, les atteintes au bon fonctionnement de l’appareil statistique public ont été nombreuses ces dernières années. L’ouvrage collectif, Le grand Trucage. Comment le gouvernement manipule les statistiques[8], publié en 2009 aux Editions La Découverte en est un bon témoignage. Un exemple, peut-être anecdotique, mais frappant : le décompte du nombre de voitures incendiées dans la nuit de la Saint-Sylvestre ne fait plus l’objet d’un décompte officiel, au prétexte de ne pas encourager une compétition entre les cités[9].

 

Peut-être. Mais que dire alors de l’impossibilité à laquelle sont confrontés les sociologues cherchant à travailler sur l’institution policière de pouvoir enquêter au sein des unités de police[10] ? Les longues enquêtes de terrain ne sont sans doute pas présentables sous forme de tableaux Excel additionnant les « faits constatés » (dont on sait combien ils sont difficiles à interpréter) ; elles n’en constituent pas moins des méthodes de collecte de « données » irremplaçables et indispensables à la compréhension fine d’une des institutions publiques qui posent le plus de problème aujourd’hui.

Le mouvement open data court le risque de représenter l’aboutissement extrême du « fétichisme du chiffre »[11] qui structure désormais le débat public. Devenue un élément potentiel de communication politique, la « donnée » doit être l’objet d’une critique plus acérée que celle qui porte sur les formats de fichier : dans quelle condition est-elle fabriquée ? pourquoi est-elle structurée de cette manière ? que mesure-t-elle et que ne mesure-t-elle pas ? comment évolue-t-elle dans le temps ? quelle est la fiabilité, l’indépendance de celui qui la produit ? C’est sur ces pistes que doivent se lancer les collectifs citoyens et les médias spécialisés sur ces questions.

 

L’opacité la plus efficace est celle qui se donne l’apparence de la transparence.



  1. [1]          « Décret n° 2011-194 du 21 février 2011 portant création d’une mission « Etalab » chargée de la création d’un portail unique interministériel des données publiques », février 22, 2011, http://www.legifrance.gouv.fr/affichTexte.do;jsessionid=?cidTexte=JORFTEXT000023619063
  2. [2]          Franck Riester, Amélioration de la relation numérique à l’usager (Ministère du Budget, des Comptes publics, de la Fonction publique et de la Réforme de l’état, février 1, 2010). http://www.modernisation.gouv.fr/piliers/simplifier/evenements/le-groupe-experts-numeriques-pilote-par-franck-riester-a-remis-son-rapport-a-eric-woerth-et-nathalie-kosciusko-morizet/telecharger-le-rapport-riester-pdf/index.html
  3. [3]          Nicolas Kayser-Bril, « Le datajournalisme: vecteur de sens et de profits », OWNI, Digital Journalism, avril 17, 2011, http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-profits/.
  4. [4]          « OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires », Regards Citoyens, décembre 4, 2011, http://www.regardscitoyens.org/opendata-la-moyenne-pour-un-data-gouv-fr-sous-formats-proprietaires/.
  5. [5]          Nicolas Patte, « La France entr’ouverte », OWNI, Digital Journalism, décembre 10, 2011, http://owni.fr/2011/12/10/la-france-entrouverte-transparence-open-gov-open-data-etalab/.
  6. [6]          « La délocalisation de la statistique publique à Metz, un enjeu pour la démocratie », Mediapart, janvier 30, 2009, http://blogs.mediapart.fr/edition/en-defense-de-la-statistique-publique/article/300109/la-delocalisation-de-la-statistiqu.
  7. [7]          « Des statistiques d’Etat à géométrie variable », Le Monde , décembre 14, 2011, http://www.lemonde.fr/idees/article/2011/12/14/des-statistiques-d-etat-a-geometrie-variable_1618346_3232.html.
  8. [8]          Guillaume Rollet, « Lorraine Data, Le grand truquage. Comment le gouvernement manipule les statistiques », Lectures, Les comptes rendus (décembre 11, 2009), http://lectures.revues.org/862.
  9. [9]          Annie Thomas, « Saint-Sylvestre: pas de chiffres de voitures brûlées mais un début de polémique », Google News, janvier 2, 2011, http://www.google.com/hostednews/afp/article/ALeqM5js4Ucq9k9TZwxj7szfMA6OSgEDnA.
  10. [10]        Alice Géraud, « «Etudier la police est devenu quasi impossible» », liberation.fr, novembre 18, 2011, http://www.liberation.fr/societe/01012372241-etudier-la-police-est-devenu-quasi-impossible.
  11. [11]        Vittorio De Filippis, « Triche : la statistique, c’est très pratique », liberation.fr, mai 29, 2009, http://www.liberation.fr/economie/0101570051-triche-la-statistique-c-est-tres-pratique.
 
 
 
 
 
 
 
 
 
 

There has been error in communication with booki server. Not sure right now where is the problem.

You should refresh this page.