L'open data
Est une donnée publique, toute information produite ou reçue, dans le cadre de leur mission de service public, par le Fédéral, les pouvoirs régionaux et locaux ainsi que par les autres personnes de droit public ou les personnes de droit privé chargées d’une mission publique.
Les données publiques au service de l’intelligence artificielle
Tout organisme d’une certaine taille collecte, génère ou maintient un important volume de données électroniques (bases de données, systèmes d’information cartographiques, registres électroniques, etc.). Rendre publique ces données est une obligation légale. Rassemblées en bases de données organisées et anonymisées, ces informations sont désignées par le terme générique d’Open Data. La Ville de Namur a lancé sa propre plateforme OpenData en juin 2108. Cette démarche innovante en Wallonie, poursuit plusieurs objectifs d’information, de statistiques, de création d’applications utiles aux citoyens et citoyennes, de transparence, … La mise à disposition de ces données n’est pas sans intérêt pour le grand public. Elle permettra aux étudiants, aux chercheurs, aux entreprises de récolter de précieuses informations en matière de population, localisation, activités économiques, … Le partage des données de la Ville de Namur permet également la création d’applications connectées innovantes.
Particuliers ou sociétés privées peuvent se connecter automatiquement aux informations et alimenter leurs outils. Cela donne donc de la matière pour le développement de nouveaux besoins et donc d’emplois. …
Cela permet d’avancer encore vers une ville plus Smart.
Le RGPD et la vie privée
Comme son nom l’indique, cette plateforme OpenData ne propose que des données en libre accès complet. Il n’y a donc aucune donnée privée (nom, prénom, âge, nationalité, etc.). Les informations concernant les citoyennes et citoyens namurois ont été anonymisées : on n’y trouve donc que des comptages et des pourcentages. Il n’est ainsi pas possible d’identifier une personne en particulier. Parmi les jeux de données, on pourra y trouver des informations sur les caractéristiques externes des habitations : n° de maison, hauteur, volume, thermographie des toitures, âge approximatif, photo des bâtiments classés, etc.
Pourquoi l'open data ?
Beaucoup considèrent que la plupart des données sont de facto la propriété du public. Elles sont malheureusement souvent emprisonnées dans des silos réservés à l’usage exclusif de certains organismes. La mise à disposition de ces données permet une bien meilleure transparence des organismes qui les fournissent. Les besoins des citoyens grandissent, les moyens publics doivent suivre. Rendre les données publiques facilitera le développement d’applications par des tiers ce qui accélèrera grandement la mise à disposition de services nouveaux de façon plus économique et participera au développement digital de la Wallonie.
Les Open Data sont une façon de partager les données entre organismes publics, ce qui n’est pas toujours facile. Elles peuvent être utilisées pour effectuer du benchmarking (analyses comparatives) entre les différentes institutions et ainsi promouvoir les pratiques les plus efficaces. Néanmoins, pour avoir une réelle valeur, il faut que tous les acteurs participent. Par exemple, au niveau communal, les Open Data auront bien plus de valeur si toutes les communes participent. Les Open Data sont aussi utilisées par la presse, le secteur éducatif, pour les études de marché, le privé, etc… . Rien que par le fait que les Open Data élargissent leur propre audience, il faut s’attendre à des innovations auxquelles personne ne pense encore actuellement. D’autre part, l’intérêt des Open Data a été pressenti depuis longtemps par l’Union Européenne qui a légiféré en la matière. Ces directives doivent être transposées dans les législations locales. A terme, les Open Data deviendront obligatoires.
Le degré d'ouverture des open data
Tim Berners-Lee (connu pour avoir créé le world wide web) propose une classification à 5 étoiles des Open Data afin de pouvoir plus facilement appréhender le degré d’ouverture d’une Open Data et l’usage qui peut en être fait.

- ★ Disponible sur le Web, quel que soit le format, (par exemple un pdf, un scan) mais avec une licence Open Data.
- ★★ Idem niveau 1 mais dans un format structuré lisible numériquement (par exemple, une feuille Excel au lieu d’un scan de table)
- ★★★ Idem que le niveau 2 étoiles mais dans un format non propriétaire comme le CSV (au lieu d’Excel)
- ★★★★ Idem que le niveau 3 étoiles, directement utilisables par d’autres programmes. Utilise les standards OPEN du W3C (RDF & SPARQL)
- ★★★★★ Idem que le niveau 4 étoiles, plus liaison avec d’autres données.
Plus les Data Sets ont d’étoiles, plus, ils seront exploitables et plus ils généreront de la valeur. Rien n’empêche de commencer avec des Data Sets 1 étoile. La Ville de Namur vise les degrés d’ouverture des niveaux 4 et 5 étoiles. Ce n’est qu’à cette condition que l’on peut espérer voir se développer des applications avec une réelle valeur ajoutée.
En savoir plus : Détails du degré d'ouverture des open data (5 étoiles)
Différentes formes d'open data
- Page web (★)
- Download (★, ★★ et ★★★)
- Web Service (★★★★)
- Web Map Service (WMS et WFS) (★★★★)
- RSSFeed (★★★)
En savoir plus : Détails des différentes formes d'open data
La stragégie open data
Infrastructure
Le principe de base est de mettre à disposition les Open Data sur le serveur de la source des données et de les y laisser. Ces données sont référencées dans des catalogues centraux qui les décrivent et qui expliquent comment y accéder. C’est donc le rôle des développeurs ou des intégrateurs de collecter toutes les données nécessaires au développement de leurs applications.
Il existe des agrégateurs pour les unir. Des schémas de données sont publiés. Les données de toutes les localités respectant ce schéma peuvent être interrogées via une seule requête qui les agrège en un seul bloc, ce qui rend ces données beaucoup plus attractives pour les développeurs (Source : http://aggregator.opendata.esd.org.uk/ ).
Il faut espérer, qu’en Wallonie des opérateurs privés ou publics qui procéderont à l’agrégation des données verront vite le jour. En effet, même si les données des 262 communes sont référencées centralement, si les données elles-mêmes restent sur 262 serveurs différents, cela restera difficilement gérable pour les développeurs d’applications de type startup et risque de n’être possible que pour de très gros opérateurs.
Extraction et mise à disposition des données
Pour pouvoir mettre à disposition les données, la Ville a investi dans des outils d’extraction de données des différentes bases de données qu’elle possède. Ces données sont vérifiées, filtrées et traitées, par exemple pour les regrouper et ainsi les anonymiser. Ces données sont mises à disposition dans des espaces séparés des data bases centrales afin d’éviter tout risque d’accès à des données confidentielles de la Ville ou des citoyens. Le service Data Office et le service informatique sont chargés de définir quels sont les outils nécessaires pour ce faire.
Un premier laboratoire a été mis en place dans le cadre de la mise à jour des données (projet Cytise -> http://cytisenamur.cytise.be/ ) de la Population de Namur qui avait été fournie en 2008 par le professeur Poulain. Quitte à devoir de toute façon retraiter ces données, autant les rendre Open data pour faire d’une pierre deux coups.
Le service Data Office est aussi chargé de faire un inventaire des données et de proposer des priorités. Pour ce faire il s’inspire de ce qui est fait à l’extérieur, de ce qui existe actuellement à la Ville de Namur et de ce qui peut être fait rapidement sans demander trop de ressources. Suite à l’upgrade des outils de cartographie, il peut aussi rapidement rendre accessible et référencer les données déjà disponibles dans les systèmes cartographiques.
Data sets, ce qui existe
En Belgique au niveau fédéral, la plateforme open data du site "http://data.gov.be" . Il est fourni par le Fedict.
Sur le site de l’Agence Du Numérique (ADN) wallonne, le portail opendata de Wallonie et Fédération Wallonie-Bruxelles.
Des jeux de données également sur le site européen.
Les données de la Ville de Namur sont automatiquement référencées sur ses trois sites.
Pour retrouver tous les jeux de données ouverts au public des utilisateurs de plateformes Opendatasoft
Réutilisation des open data
Les Open Data n’ont d’intérêt que si elles sont réutilisées. Un Data Set réutilisé est un data set qui est exploité par un logiciel tiers via des downloads ou des accès web automatiques.
Les fonctionnalités, l’utilité et la disponibilité de ces applications restent actuellement encore trop réduites. En Belgique, il n’existe pas encore de structure pyramidale intégrée de référencement qui pourrait rendre cette initiative plus attractive pour les développeurs en collectant automatiquement et en centralisant tous les moyens d’accès aux Open Data des différents niveaux de pouvoir et organismes belges. Mais c’est en train de se mettre en place avec notamment des initiatives de l’Europe, du fédéral et des régions.
Si les communes réputées très avancées en Open Data en Europe, mettent parfois un nombre considérable de data sets sur le web, ceux-ci sont, dans les faits, trop peu réutilisés.
Par contre, il existe de plus en plus d’applications web qui fournissent des webservices rendant leurs données plus facilement exploitables par d’autres applications sans pour autant référencer ces données sur les sites de référencement des Open Data.
Normes
Les Open Data ne se limitent pas à mettre en ligne des données déjà disponibles en interne, mais aussi en un traitement préalable de ces données afin qu’elles répondent aux normes reconnues. Le but étant de les rendre agrégables, exploitables et comparables. Notamment en matière de données géographiques, on s’inspirera des directives INSPIRE des Communautés Européennes.
La stricte observance des normes est une condition sine qua non pour espérer un succès quelconque en matière d’Open Data. En effet, mettre à disposition des Open Data dans des formats non interopérables n’a que très peu d’intérêt et aura un même un effet négatif sur l’image de l’organisme à l’origine de ces données.
Licences
Toute donnée devra faire l’objet d’une licence d’utilisation. Sans licence Open aucune donnée ne peut être considérée comme Open Data. Celle-ci est généralement de type ouvert qui permet la réutilisation des données avec ou sans but commercial, à titre gratuit ou pas. La tendance générale parmi les pays européens est de permettre une utilisation des données à titre gratuit que la finalité soit commerciale ou pas.
La plupart des licences actuelles dégagent le fournisseur de données de toute responsabilité quant à la fiabilité ou quant à la pérennité des données. Cela en enlève beaucoup l’intérêt en matière de développement du numérique.
Une certaine uniformité parmi les licences doit être respectée que ce soit au sein de la Ville elle-même ou que ce soit au travers des différents niveaux de la pyramide des pouvoirs où on retrouve ces données ou plutôt les méta données qui s’y réfèrent. Sans cette uniformité, l’utilisation de données agrégées ou liées risque de devenir très vite un casse-tête. La multiplicité des pouvoirs en Europe et en particulier en Belgique est un frein à cette uniformisation.
Ressources
Il est toujours difficile d’évaluer la charge de travail ou financière que représente une stratégie Open data pour la Ville de Namur. Force est de constater que les Villes les plus avancées en la matière disposent de développeurs informatiques plus nombreux et probablement de budgets plus importants.
C’est pourquoi, si des développements doivent être faits, la stratégie sera d’outsourcer un maximum de développements et de services à l’extérieur, particulièrement en matière d’extraction et de traitement des données.
Néanmoins, le service Data Office, exploite au maximum de ses possibilités les données déjà disponibles actuellement.
D’autre part, la mesure 21 du Plan du numérique wallon vise précisément le développement des Open Data en Wallonie. Des budgets y seront alloués. Des développements auront lieu notamment en matière de site de référencement. La Ville de Namur doit rester attentive à cette initiative et s’inscrire dans les rangs des participants.
Glossaire
API, CMS, CSV, Data base, HTML, Hypertexte, INSPIRE, Json, KML, Métadonnée, PICC, RDF, RSS, Service Web, SPARQL, URI, W3C, Web sémantique, XML
En savoir plus : Définition des termes utilisés en Open data