Paris Android Dev Camp 2012 – J1 – Présentations Open Data par 4 acteurs


Après l’introduction en début de soirée par Julien Marboutin pour cette première journée du Paris Android Dev Camp 2012,  nous avons accueilli 4 acteurs de l’Open Data en France pour nous présenter les données publiques et leur accès.

Etalab par Romain Lacombe

Romain Lacombe  (twittergoogle+) est chargé de l’Innovation et du Développement pour Etalab. Etalab est chargé de coordonner l’ouverture des données publiques des administrations d’Etat, et d’encourager la réutilisation la plus large possible des données publiques auprès des développeurs et des entrepreneurs qui leur imaginent de nouveaux usages.

Romain a commencé par deux anecdotes:

  1. Il a été l’un des premiers possesseurs du téléphone Android Nexus One, il a été donc ravi d’encourager la communauté professionnelle Android parisienne.
  2. Ce DevCamp Android en France intervient à un moment particulier puisque c’est le premier concours de développement autour d’Open Data après le lancement de Dataconnexions le jeudi 16 février (la veille) pour encourager le développement d’applications et de projets autour d’Open Data.

Ensuite, il a présenté Etalab comme une mission sous l’autorité du gouvernement et est chargé de promouvoir l’Open Data en France.

L’Open Data est une première étape dans l’ouverture des données publiques et ce sont les participants au concours, développeurs et entrepreneurs, qui donneront du sens  à ces données publiques.

L’Open Data, c’est aussi des données des collectivités et des organismes publiques. Etalab est donc au service pour l’ensembles des collectivités.

Le portail data.gouv.fr

Les données publiques de l’état sont consultables et téléchargeables sur le site http://www.data.gouv.fr/ qui comprend un moteur de recherche. Le site a été mise en ligne en 2011.

Pour sa mise en place, Etalab regroupe les informations provenant des 200 fonctionnaires et agents Open Data dans l’ensemble des ministères.

Il propose l’hébergement seulement des données sous forme de données brutes : CSV, Excel, etc à télécharger. Par conséquent il n’existe pas Web Service ou API permettant d’accéder programmatiquement à ces données. Romain nous explique que c’est une première solution afin de ne pas limiter l’accès car il aurait fallu mettre en place des systèmes de limitations de requêtes par secondes, donc de filtrage, contraire à l’esprit de l’Open Data.

C’est donc aux entreprises d’implémenter ou fournir des services ou API en utilisant ces données brutes pour pouvoir les utiliser programmatiquement.

Licence

Pour pouvoir utiliser ces données, Etalab a créé une Licence Ouverte, licence largement favorable et compatible avec les autres standards internationaux  (ODC-BY, Creative Commons CC-BY 2.0) et demande seulement de citer la source des données via une URL par exemple.

Les données

Ces données sont un enjeu citoyen en améliorant transparence des gouvernements, en montrant le fonctionnement institutions, des finance publiques. Ainsi, elles favorisent le développement de services citoyens, de startups et d’une manière générale à l’économie numérique pour des projets associatifs ou commerciaux.

Le site héberge environ 350 000 jeux de données dont:

  • budget de l’état (le plus téléchargé)
  • mesure de qualité de l’environnement
  • chiffres de la délinquance
  • activité des établissement de santé
  • données sur la fiscalité locale et nationale
  • subventions (associations, PAC),
  • recensement de la population
Pour les services mobiles, nous pouvons y trouver des donnés sur la géographie, la géolocalisation:
  • localisation de tous les services publics
  • données par département: qualité environnementale, crimininalité, chômage, santé, solidarité..
  • données par commune: recensement de population , démographie, emploi, éducation
  • données locales: résultats du bac au lycée, qualité des soins hôpital par hôpital
  • données localisées: accidents de circulation. Ex: application d’aide à la conduite
Les lieux géolocalisés sont nombreux:
  • 36 000 communes
  • lieux de justice, permanences d’accès au droit
  • établissements de santé
  • lycées et collèges
  • évènements culturels et monuments historiques
  • unités de Gendarmerie et points d’accueil
  • réseaux diplomatiques
  • gares ferroviaires (SNCF)
Enfin, Romain a parlé un petit mot sur la nouvelle initiative Dataconnexions lancée la veille qui est une communauté des acteurs innovation (Google, Cap Digital ISM, etc.). Elle va proposer cette année  4 concours avec un jury composé d’acteurs de l’Open Data avec 4 rassemblements et 1 plateforme numérique en ligne dataconnexions.fr.

Vidéo (problème son):

Vidéo du livestream (basse qualité mais le son est audible):

Data Publica par Francois Bancilhon

François Bancilhon (twittergoogle+) est PDG de la société Data Publica.
Data Publica a mis en place une plateforme unique par sa technologie et ses fonctionnalités. Il s’agit à la fois d’un annuaire référençant les données publiques françaises (en service aujourd’hui) et d’un portail de vente des données (disponible au quatrième trimestre 2011). Ainsi sur Data Publica les utilisateurs trouveront toutes les données dont ils ont besoin, qu’elles soient publiques ou privées, gratuites ou payantes.

Les trois principaux services que la société propose sont:

  1. Annuaire gratuit de données accessible pour tout le monde
  2. Développement de jeux de données sur mesure
  3. Opération d’un Data Store (l’équivalent d’un App Store mais pour les données)
Pour le concours, François a proposé les données de:
Sur le premier annuaire, on peut y trouver un moteur de recherche intégrant la recherche à l’intérieur des données et les méta-données.
Le service propose de :
  • voir les jeux données sous forme de courbes ou de cartes
  • classer par types de publications,
  • par types d’éditeurs,
  • types de jeux de donnés.Il propose aussi une API pour accéder à une centaine de jeux de données parmi:
  • Campagne présidentielle sur Twitter (mesure avec mentions, note de popularité)
  • Criminologie en France (délits, catégorisés, par département, par année)
  • Velib
  • Impôts (10 indicateurs clés, par année, par région)
  • Bibliothèques
  • Hotspots Wifi Orange
  • Données CG71 (tourisme via protocole OData)
L’API REST propose des filtres géolocalisés et conditions sur les colonnes, un résultat au format JSON, simulation d’un appel à l’API.
Toute les informations techniques d’accès sont disponibles à l’adresse: http://www.data-publica.com/content/api/

OpenDataSoft par David Thoumas

David Thoumas est Directeur technique de la jeune société OpenDataSoft. Tout comme Data Publica, la société fournit des services à valeur ajoutée avec les données publiques.

OpenDataSoft propose 4 briques de services:

  1. Acquisition données.
  2. Préparation de la données brute: en intégrant géolocalisation, croisement des données, mettre de la valeur ajoutée.
  3. Chargement de la données dans un Data Store (BDD, moteur de recherche) pour un accès, manipulation et organisation facilitée.
  4. Publication: mise à disposition d’API facilitant l’utilisation par des applications
Pour l’occasion du concours, la société a ouvert la partie publication sur le site http://demo2.opendatasoft.com/search/ où on peut retrouver un moteur de recherche par méta-données. Ainsi, 20 jeux de données ont été chargés avec une navigation par facette,  par types, navigation sur une carte Google Maps.
Selon la documentation http://demo2.opendatasoft.com/api/search/doc/, on peut consulter 2 types d’API:
  1. Liste des jeux données disponibles
  2. Récupération des données pour un jeu donné (avec différents filtres dont un filtre géographique)

Les résultats sont de type JSON ou JSONP facilitant ainsi l’accès par une application logicielle.

Enfin, David nous a rappelé que la plateforme est libre d’accès sans clé API ni limitations d’utilisation pendant le concours.

Maire de Paris par Georges-Etienne Faure

Georges-Etienne Faure (twitter, Google+) est conseiller au cabinet de Jean-Louis Missika, adjoint au Maire de Paris en charge de l’innovation.

La Ville de Paris mène une politique d’innovation ambitieuse avec, entre autres,  la construction de 100 000 m2 d’incubateurs d’entreprises  pour les startups et aussi avec le lancement du service Paris Data (http://opendata.paris.fr). Elle compte ainsi stimuler les services ou applications innovants autour de l’Open Data.

Sur le site Paris Data, on y retrouve des jeux de données de Paris classés par thèmes. Ex:

  • bibliothèques
  • équipements de proximité
  • les 200 000 arbres de paris
  • 6000 lieux de tournage géolocalisés
  • les prénoms

Ces données sont visualisables sur une carte (si géolocalisées) et téléchargeables au format CSV ou avec une API via Google Fusion tables, service de Google permettant de reccueillir, visualiser et partager des données.

Jean-Philippe Clément, un de ses collègues présent a aussi conseillé l’outil Google-refine permettant de récupérer un fichier CSV et de manipuler de grandes quantités de données. Vous pourrez ensuite appliquer des transformations sur ces données comme des transformations de géolocalisation par exemple. Vous pourrez un bel exemple d’usage de Google-refine et Goole Fusion tables pour l’Open Data sur le site   datavisualisation.wordpress.com.

La Ville de Paris croît beaucoup au crowdsourcing pour enrichir les données et à l’imagination collective pour développer de nouveaux services. C’est pourquoi, pour l’évènement, un prix spécial « Paris Data » a été décerné à la meilleure application qui serait utile aux parisiens et/ou utilisant des jeux de données de Paris.

Suivez aussi @openDataParis.

Sponsors

OpenDataSoftlogo paris region lab
logo marie de paris

Partenaires média

Quang-Hai PHAN

Développeur indépendant. A travaillé sur divers projets Web et Android.twitter (@parisfreelance), Google+ , linkedin ou blog.