DONNEES PUBLIQUES
Cinq ans après, à quoi le service public de la donnée a-t-il servi ?
Pour montrer l’intérêt de l’ouverture et de la réutilisation des données publiques, le département Etalab travaille à une cartographie des cas d’usage du “service public de la donnée”, qui rassemble, depuis 2017, 9 bases de données essentielles au fonctionnement de nombreux services publics et privés.
Un service public de la donnée, oui, mais pourquoi faire ? C’est à cette question que tente de répondre le département Etalab de la DSI de l’État, en charge de la plate-forme nationale des données publiques, Data.gouv.fr. La plate-forme a vocation à rassembler l’ensemble des données publiques produites par des acteurs publics, mais parmi elles, seule une petite dizaine compose le “service public de la donnée” (SPD). Ce statut a été créé par la loi Lemaire d’octobre 2016 pour consacrer le caractère particulièrement essentiel de certains jeux de données d’un point de vue économique et social.
Ces 9 bases de données de référence, gratuites et ouvertes, sont soumises à un régime spécifique, afin de garantir leur qualité et leur disponibilité, indispensables au bon fonctionnement de certains services publics essentiels, comme la délivrance postale, les secours, la fiscalité. Elle constitue ainsi une nouvelle infrastructure essentielle à l’action publique.
Etalab a donc lancé un travail de cartographie des cas d’usage de ces jeux de données de référence. Et ce dans une perspective d’éditorialisation plus forte de Data.gouv.fr, entamée ces dernières années, notamment avec la mise en lumière, chaque mois, des principales sorties de jeux de données, l’alimentation d’un blog ou le regroupement de plusieurs jeux de données autour d’une même thématique, comme le Covid-19.
L’objectif est ainsi de mettre en avant les données ouvertes et leur réutilisation afin de montrer l’étendue des possibilités.
La plate-forme nationale des données publiques fait sa mue
Même si cette première version est tout sauf exhaustive, comme plusieurs internautes experts des données n’ont pas manqué de signaler, sur le forum où elle a été publiée, indiquant que la liste était très largement sous-estimée au vu du nombre d’usages existants du SPD, dont certains utilisent par ailleurs plusieurs des bases de données du SPD. C’est par exemple le cas de la Place des entreprises, bâtie à partir de 2 de ces bases de données : la base “Sirene” de l’Insee (qui recenses les données des entreprises) et la base adresse nationale.
Réutilisations publiques et privées
Quoi qu’il en soit, la cartographie a le mérite de mettre en avant 93 cas d’usage des différents jeux de données de référence, principalement par des administrations et acteurs publics. La base adresse nationale est ainsi au fondement de nombreux services numériques, comme Ma Connexion Internet, la carte des débits de connexion sur le territoire, ou le projet NexSIS 18-112. Le Répertoire opérationnel des métiers et des emplois (Rome), une autre des 9 bases de données du SPD, est, lui, utilisé par la start-up d’État DiagOriente, mais aussi le compte formation, ou “La bonne alternance” de Pôle emploi. Enfin, le code officiel géographique est très utilisé directement par les autres jeux de données de référence, mais aussi par des applications, comme les cartes des résultats des élections, ou même l’application SI-VIC, très utilisée pendant la crise sanitaire.
On compte aussi une vingtaine d’acteurs privés. L’entreprise Doctrine, spécialisée dans l’analyse de la jurisprudence, s’appuie par exemple sur la base Sirene pour nourrir son panorama du contentieux des entreprises. Tout comme le site Societe.com. Le plan cadastral informatisé est, lui, utilisé par Meilleurs Agents, pour alimenter sa carte des prix au mètre carré et des biens vendus. Tandis que la base adresse nationale permet de simuler son exposition au soleil pour évaluer l’intérêt d’installer des panneaux photovoltaïques, grâce au service en ligne “In Sun Win Trust”.
Vers un élargissement du périmètre ?
“En fonction de la maturité et des moyens, la mesure des usages passe souvent au second plan [chez les producteurs du service public de la donnée]. Ces cas d’usage ont vocation à démontrer l’intérêt de leur ouverture. À moyen terme, il s’agit aussi pour nous de fournir davantage de ressources méthodologiques et pratiques pour mesurer les usages”, explique Antonin Garrone, de l’équipe d’Etalab, sur le forum “Team Open Data” , pour justifier cette initiative de cartographie. Rappelons, toutefois, que les bases de données du service public de la donnée sont soumises à une obligation d’ouverture gratuite. Ce que montre donc cette cartographie n’est pas tant l’intérêt de l’ouverture que celui de la qualité, de la fiabilité et de l’exhaustivité des données qui le constituent, dans la mesure où elles sont essentielles au fonctionnement de nombreux services publics, mais aussi parfois privés.
Car la constitution du SPD s’est parfois faite dans la douleur, comme en attestent les errements de la base adresse nationale (BAN). Un temps gérée par La Poste, l’IGN, la direction générale des finances publiques et la direction interministérielle du numérique, en lien avec l’association Open Street Map, elle a finalement été confiée à l’IGN début 2022. Avant cela, la gestion de la BAN avait surtout fait l’objet d’un changement de stratégie, pour miser non plus sur les acteurs nationaux mais plutôt sur le terrain, c’est-à-dire les communes, dont la compétence d’adressage a été renforcée dans la loi 3DS.
Une nouvelle “start-up” d’État pour tenter de combler les trous de la couverture numérique
La question du périmètre du service public de la donnée, qui n’a pas bougé depuis sa création en 2017, est également relancée. “L’open data doit changer d’ère et viser une plus grande qualité et fiabilité de la donnée : par la documentation, souvent trop pauvre, par la définition de standards interopérables, par des métadonnées plus homogènes, entre autres. Le Service public de la donnée doit ainsi être étendu à de nouveaux jeux de données de référence pour en élever la qualité et la disponibilité”, plaidait le rapport Bothorel, remis en décembre 2021 au Premier ministre, alors que le plan d’action 2018 pour un gouvernement ouvert prévoyait précisément d’identifier, pour chaque ministère, 2 à 3 jeux de données essentiels qui pourraient rejoindre la liste des données de référence.
Le ministère de la Transformation et de la Fonction publiques réfléchit d’ailleurs à un potentiel élargissement du périmètre du SPD, notamment pour y intégrer les données des référentiels RH de l’État.
ACTEURS PUBLICS: article publie le mercredi 30 mars 2022 & EMILE MARZOLF