PARIS SCIENCES & LETTRES (PSL)
Merci ! Votre abonnement a bien été enregistré !
il y a un soucis. Merci de vérifier votre saisie.

Innovation urbaine et données ouvertes: la naissance du modèle de Shanghai

L’Open Data Apps de Shanghai, ou SODA, est un concours d’applications numériques à partir de données ouvertes, lancé en 2015. L’acronyme offre une analogie parfaite avec le sujet de ce défi : les données évoquent le soda dans sa bouteille. Si on les laisse dans leur serveur, elles restent tranquilles. Mais une fois que vous ouvrez les fichiers, les bulles d’innovation vont éclater, développant une énorme quantité d’énergie. Et c’est exactement ce que SODA a réussi à faire.

Monday
7
May 2018
read in english
read in english
Lire le résumé

L’Open Data Apps de Shanghai, ou SODA, est un concours d’applications numériques à partir de données ouvertes, lancé en 2015. L’acronyme offre une analogie parfaite avec le sujet de ce défi : les données évoquent le soda dans sa bouteille. Si on les laisse dans leur serveur, elles restent tranquilles. Mais une fois que vous ouvrez les fichiers, les bulles d’innovation vont éclater, développant une énorme quantité d’énergie. Et c’est exactement ce que SODA a réussi à faire.

Les thèmes des deux premières années furent les transports intelligents et la sécurité urbaine. En collaboration avec 30 agences gouvernementales et entreprises, SODA a débloqué 64 ensembles de données totalisant 4 To. 852 applications ont été conçues, couvrant un large éventail de domaines dont le transport, les finances et la sécurité publique. Environ 4200 professionnels ont été étroitement impliqués dans le processus de recherche de solutions. SODA a aidé à lever plus de dix millions de dollars pour au moins deux startups chinoises et une startup britannique. Tout en donnant vie à de grandes idées, SODA a développé un modèle sophistiqué et reproductible. Il a commencé à Shanghai, mais vise à devenir une marque internationale d’innovation à partir des données ouvertes.

‍Figure 1 - Tableau de bord de l’impact de SODA

L’origine de SODA

A l’automne 2014, le Shanghai Big Data Development Innovation Contest s’est conclu par la victoire de « Jin Jin Recycle » (JJR), récompensé par l’organisateur de l’événement, la Commission municipale de l’économie et de l’informatisation de Shanghai. L’idée de JJR était d’améliorer le recyclage des déchets dans l’esprit de l’économie du partage. Le concours a été lancé sur un modèle de crowdsourcing : les autorités voulaient utiliser les contributions des individus et des organisations pour obtenir des idées qui, à travers leurs applications, pousserait certains organismes gouvernementaux à rendre disponibles des données en temps réel sur la vie de la ville. L’équipe de JJR a bien reçu son prix de plusieurs dizaines de milliers de RMB. Mais, à la déception de beaucoup, y compris le chef de projet, le professeur Jin Yaohui de l’Université Jiaotong de Shanghai, il n’a jamais eu accès aux données gouvernementales sur le recyclage des déchets, ce qui signifie que le projet n’a pas été accepté.

La vérité, c’est qu’à l’époque, les données ouvertes étaient tout sauf courantes en Chine. Shanghai a joué un rôle de premier plan en 2011 lorsqu’elle a été la première à élargir l’accès aux données, mais elle n’a jamais répondu à la demande des programmeurs. Les données accessibles étaient peu utiles, alors que les données les plus précieuses n’étaient pas publiées.

Un point à noter est que les Chinois encouragent l’utilisation de données ouvertes pour stimuler l’innovation et l’esprit d’entreprise en mettant l’accent sur l’efficacité de la production et le rendement économique. C’est un peu différent de la publication des données en Occident, qui obéit d’abord à des considérations juridiques et politiques. Il existe des différences fondamentales entre les deux cultures. Si la Chine veut réussir dans son effort d’ouverture des données, elle devra trouver les intérêts communs de toutes les parties qui possèdent des données et leur apporter des avantages pour les inciter à partager leurs données.

Personne ne comprend mieux ce point faible que Zhang Baijun, qui a travaillé pour le gouvernement pendant de nombreuses années pour publier des informations et des données. Au printemps 2015, il a quitté le gouvernement et est devenu vice-président de l’Institut chinois de design industriel. Peu de temps après, il a réuni un groupe de vieux amis pour réfléchir à la façon de lancer un concours d’innovation en matière de données qui a du sens pour le marché et qui incite le gouvernement à publier des données ouvertes. Le professeur Jin Yaohui de l’Université Jiaotong de Shanghai, le professeur Zheng Lei de l’Université DMG Lab Fudan, Wang Zhiyong de EnerLong LLC, et l’auteur de cet article, qui est d’Open Data China, ont été invités à réfléchir sur les initiatives de données ouvertes à Shanghai et sur le Big Data Contest 2014, à partir d’un large éventail de perspectives : business, technologie, politique, science urbaine et société civile. Un comité organisateur a été mis sur pied pour étudier les défis de données ouvertes d’autres pays afin d’apprendre de bonnes méthodes et de concevoir un concours qui conviendrait le mieux aux conditions nationales de la Chine. C’est ainsi qu’est né SODA.

Une innovation: le Data Crowdsourcing

Deux programmes de données ouvertes ont été remarqués. L’Open Data Challenge Series (ODCS), organisé conjointement par l’Open Data Institute du Royaume-Uni et Nesta, est une série de sept prix (Energy and Environment Challenge, Food Challenge, etc.) pour générer de l’innovation et des solutions durables aux problèmes sociaux. Pour chaque défi, le programme étudie en profondeur les données gouvernementales disponibles et fournit aux participants des listes de données détaillées et des explications pour les aider à trouver des solutions viables. Il y a aussi une période d’incubation de cinq mois pour transformer les solutions des finalistes en startups viables.

L’autre exemple de référence est le concours BigApps sponsorisé par la ville de New York. BigApps a présenté deux méthodes pour guider les participants : l’un est un thème, l’autre est un résumé des problèmes spécifiques organisé autour de grands problèmes. Toute source de données est acceptable, mais les candidats sont encouragés à utiliser les ensembles de données municipales publiées pour trouver des solutions novatrices aux problèmes civiques qui touchent la ville de New York.

Une chose que ODCS et BigApps ont en commun, c’est que les données existent déjà. Les concours visent à créer de la valeur avec les données, mais pas à créer les données en soi. Mais pour la Chine, où les données ne sont pas toujours disponibles, quelle est la meilleure façon d’organiser un concours de données ?

Shanghai a commencé à construire sa propre passerelle de données ouvertes, DataShanghai (www.datashanghai.gov.cn), en 2010. Mais jusqu’en 2015, le site Web était plutôt une base pour le stockage de données statiques. Il n’y avait pas de données dynamiques, celles-là mêmes qui peuvent être utilisées autour de certains thèmes pour créer de la valeur commerciale. Prenez ce qui a été fait au Royaume-Uni ou aux États-Unis et reproduisiez-le en Chine, ce sera encore une fois un concours qui n’aura pas beaucoup de succès. Même si le défi parvient à identifier des idées novatrices, il n’y aura aucun moyen de les mettre en œuvre.

Pour résoudre ce dilemme, SODA a développé le concept de « data crowdsourcing ». L’idée était de faire contribuer différentes parties à un pool de données. Le comité organisateur avait un problème difficile à résoudre : comment persuader les gens de participer à ce crowdsourcing de données ? La réponse était de construire un système assurant que les données fournies par toutes les parties répondent aux exigences des développeurs et circulent, lors de la compétition, d’une manière sécurisée et contrôlée. A cette fin, SODA a conçu une méthode à partir des points suivants : autoévaluation et revue conjointe ; échantillons de données pour le premier tour et accès complet pour le second ; transmission de données cryptées et contrôle autorisé.

Lors de l’étape préparatoire, en fonction du thème du défi et du feedback des développeurs, le comité organisateur produit une liste de données précisant tous les champs de données et pose ses exigences : toutes les données doivent avoir les mêmes cadres temporels ; ce cadre est d’un mois au minimum ; les jeux de données doivent pouvoir être croisés afin de permettre la vérification de données provenant de sources multiples. SODA donne ensuite la liste aux agences gouvernementales et aux entreprises concernées, qui décideront d’abord si elles ont les données et, si tel est le cas, si elles publieront des jeux complets de données, ou si elles ne fourniront que certains champs de données conformément à leur réglementation en matière de sécurité. Les parties qui fournissent des données feront part de leurs décisions et de leurs préoccupations au comité organisateur, qui les invitera ensuite à une réunion conjointe d’examen de la sécurité des données afin d’évaluer les vulnérabilités possibles. La liste des données est ensuite finalisée et les parties fournissant les données signent un accord avec SODA. Lorsque SODA reçoit toutes les données, une autre évaluation technique est réalisée pour s’assurer que le masquage des données est terminé.

À présent que SODA disposait des données, la prochaine étape était de rechercher l’équilibre entre sécurité et ouverture.

À l’époque, en Chine, il y avait une célèbre compétition développée par Alibaba appelée Tianchi ou Sky Pool. Leur principe était « utiliser mais ne pas voir », ce qui signifie que les données n’étaient pas fournies directement aux concurrents. Au lieu de cela, Alibaba met à leur disposition une plate-forme « boîte noire » pour leur permettre d’entrer des codes de calcul. Mais SODA voulait promouvoir des données ouvertes. Pour l’organisateur, il était important que les participants reçoivent des données réelles afin qu’ils puissent explorer toutes les façons d’utiliser des données provenant de scénarios réels. Pourtant, pour assurer la sécurité des données, vous avez besoin de contrôle. C’est pourquoi au premier tour, seuls des échantillons de données sont donnés aux participants pour leur permettre de comprendre la structure et le contenu des données et de trouver de bonnes idées ; et ce n’est qu’au deuxième tour, lorsque les finalistes se mettent à développer des prototypes, qu’ils se voient attribuer un accès complet.

Après avoir passé en revue plusieurs licences de données telles que les licences Creative Commons et data.gov.uk, SODA a rédigé ses propres licences. Elles permettent aux participants d’utiliser librement les données et ne limite pas les buts de l’utilisation des données. Étant donné que les données ne sont accessibles qu’aux participants du deuxième tour, la licence SODA impose des restrictions sur la redistribution des données fournies. Afin de protéger les intérêts des fournisseurs de données, des organisateurs, des développeurs et des utilisateurs finaux, elle exige en outre que les participants du premier tour précisent que toutes les données du concours sont des extraits de données et que les conclusions découlant de ces données peuvent ne pas être descriptives de l’ensemble du tableau. Pour être plus précis, lorsqu’un participant entre dans le deuxième tour, on lui recommande de préparer un contrat de licence. Ils soumettront également des renseignements personnels pour vérifier l’identité et la signature. Après vérification, ils recevront le mode d’accès et le mot de passe du comité organisateur. Maintenant, le vrai travail commence.

Première application: les transports intelligents

Après la mise en place du « data crowdsourcing », l'étape suivante consiste à obtenir des données réelles et lancer le concours. En 2015, avec l'appui de la Commission municipale de l'économie et de l'informatisation de Shanghai, SODA a été officiellement lancé avec le thème « Smart Transport ». Il y avait trois raisons de choisir ce sujet. Premièrement, les technologies de l'information sont largement appliquées dans ce domaine. La plupart des données sont collectées automatiquement, de sorte qu'elles sont relativement fiables. Deuxièmement, le transport concerne rarement des informations personnelles identifiables. SODA aura plus de facilité à promouvoir le « data crowdsourcing ». Troisièmement, un coup d'œil rapide aux concours précédents identifie le transport comme le secteur qui produit le plus facilement des innovations et des startups viables. Pour que le concours soit un succès, il faut qu’il démarre en douceur.

Et qu’est-ce que le transport intelligent sans les métros, les bus et les taxis ? Grâce au solide soutien de la Shanghai Municipal Transportation Commission, de nombreuses sociétés de service public, dont Shanghai Public Transport Card CO., LTD., Shanghai Pudong New District Public Transport CO., LTD. et Shanghai Qiangsheng Intelligence Navigation Technology Satellite CO., LTD., ont participé au data crowdsourcing et fourni des données de haute qualité : un mois d’enregistrement des transactions par carte de transport, un mois de données GPS Qiangsheng Taxi et quatre mois d’enregistrement des données des bus quittant et entrant dans les stations. Toutes les données, pour la première fois en Chine, étaient accessibles au public. Tous les yeux étaient tournés vers le concours. Les milieux de l’urbanisme et de la science des données, ainsi que les médias, ont manifesté beaucoup d’enthousiasme. En un mois, 3000 personnes de Chine et d’ailleurs se sont inscrites, avec 823 équipes formées et 505 idées de transport intelligent soumises.

Shanghai BaoCheng, l’un des quinze finalistes, a remporté le « Best Business Model Prize ». Contrairement à la plupart des équipes, BaoCheng n’était pas une entreprise en démarrage. Au moment du défi, elle avait simplement suscité l’intérêt de business angels. Leur produit, OKChexian, offre une assurance automobile basée sur le comportement. BaoCheng a développé une application pour smartphone pour recueillir le comportement de conduite et les données des utilisateurs, puis a utilisé les données GPS de Qiangsheng Taxis pour calculer la vitesse de référence à Shanghai. L’entreprise compare les deux sources de données pour déterminer si l’utilisateur est un conducteur prudent et ajuster les taux en conséquence. La reconnaissance des juges de la SODA n’est pas la seule récompense que l’équipe de BaoCheng a reçue. Peu après le concours, elle a récolté des dizaines de millions de dollars lors d’un round de financement mené par IDG et JD.com et elle a connu une forte croissance. OKChexian a été l’une des premières entreprises à mettre en ligne la plateforme « Shanghai Credit » de Shanghai.

Outre les projets à forte valeur commerciale, SODA a également identifié des projets visant à aider le secteur public à améliorer la qualité des services de transport. Prenez A+P&T+U par Shanghai Tongji Urban Planning & Design Institute, l’équipe Tongji a proposé le concept de « Smarter Connect » pour s’attaquer au problème des heures de pointe dans le métro et pour améliorer l’expérience du conducteur. Ils ont analysé les données sur les cartes de transport en commun et les données sur les taxis, et ont identifié les stations les plus surpeuplées. Ils ont suggéré d’utiliser le transport terrestre pour déplacer les gens vers des endroits moins achalandés ou directement vers leurs destinations. Deux autres exemples de transport public sont GoBiking et Jinridian. L’accent était mis sur le service de vélos en libre-service du dernier kilomètre. Ils ont analysé des données provenant de sources multiples et ont ainsi donné des conseils précis et viables sur l’emplacement des stations d’accueil et les stratégies de déploiement des vélos. Il n’est pas étonnant qu’un représentant de la Commission des transports municipaux de Shanghai ait fait ce commentaire après le concours : « Ce défi a montré que les anciennes méthodes ne fonctionnent plus si nous voulons résoudre les problèmes de transport. Pour l’avenir, la réponse est probablement la publication d’un plus grand nombre de données gouvernementales et publiques, combinée à la sagesse de la population, à la science et à l’innovation.

Personne n’avait prévu le succès considérable de SODA en 2015. Ni le comité organisateur, ni les organismes gouvernementaux et les entreprises qui fournissent des données. Ils ne s’attendaient pas à ce que les participants comprennent vraiment les données, et encore moins à ce qu’ils les transforment en produits. Lors de la préparation du concours, certains fournisseurs avaient même déclaré que même s’ils rendaient les données disponibles, il n’y avait aucun moyen de les comprendre et de les utiliser. Lorsqu’ils ont constaté la quantité de travail et de produits créés, leur attitude a complètement changé. Pour citer l’un des fournisseur de données : « Nous ne leur avons donné que 10 ensembles de données, et ils ont fait plus de 500 propositions. Si les données étaient restées chez nous, nous n’aurions jamais pu y parvenir. » Mais le vrai gagnant de l’affaire, c’est la Commission des transports municipaux de Shanghai. Les idées de SODA proposaient de nouveaux modèles d’affaires, des orientations politiques et la planification d’itinéraires, et offraient à la Commission un nombre notable de solutions aux problèmes de transport urbain. Un responsable de la Commission a déclaré que le concours était « une révélation » et qu’il avait été « grandement inspiré ». Il espérait qu’à l’avenir, davantage de données seraient disponibles et que son agence travaillerait en étroite collaboration avec les équipes pour transformer leurs idées en produits réels.

Lisez ici la suite de cet article, qui est issu de notre édition chinoise.

GAO Feng
Directeur exécutif, Shanghai Open Data Apps (SODA)