:
Nous allons commencer notre 22
e séance.
Aujourd'hui, nous recevons deux témoins par vidéoconférence. Pour l'instant, nous sommes en communication avec M. Michael Chui, associé au McKinsey Global Institute, en direct de Miami, aux États-Unis. Par la suite, nous entrerons en communication avec l'autre témoin, M. Baker, président-directeur général du Chicago Open Data Institute.
Comme à l'habitude, nous laisserons les témoins faire leur présentation dans le cadre de notre étude sur les données ouvertes, après quoi les membres du comité pourront poser des questions à la personne de leur choix.
Monsieur Chui, je vous remercie de votre présence.
[Traduction]
Vous avez 10 minutes pour présenter votre exposé.
[Français]
À vous la parole.
:
Merci de me faire l'honneur de passer un peu de temps avec vous. Même si je suis à Miami actuellement et que je vis à San Francisco, j'ai eu le privilège de grandir à Burlington, en Ontario. Je suis très honoré de pouvoir vous parler aujourd'hui. J'ai préparé quelques brefs commentaires que j'ai le plaisir de vous présenter, mais, en fait, j'ai surtout hâte de dialoguer avec vous.
Permettez-moi de me présenter. Je m'appelle Michael Chui. Je suis associé au McKinsey Global Institute, l'organe de recherche de McKinsey and Company. Je dirige certaines des activités de recherche de notre entreprise sur l'impact des tendances à long terme en matière de technologie. J'aimerais, essentiellement, vous parler de certaines des constatations qui découlent de nos recherches.
Nous avons publié un rapport en octobre intitulé Open data: Unlocking innovation and performance with more liquid information. Comme je suis convaincu que vous le savez déjà, il ne fait aucun doute que les données ouvertes sont une tendance en progression dans le monde entier. En effet, plus de 40 pays ont créé des portails de données ouvertes. Beaucoup de choses ont déjà été écrites sur l'importance des données ouvertes pour favoriser la transparence et la responsabilité au sein des gouvernements et des institutions publiques, et nous avons plutôt décidé de mettre l'accent sur le potentiel économique des données ouvertes.
Permettez-moi de vous expliquer ce que nous avions en tête lorsque nous avons réalisé nos recherches. En fait, nous avons déterminé que les données ouvertes peuvent être définies en fonction de quatre dimensions et qu'elles varient en conséquence.
La première dimension, c'est l'accessibilité, ou simplement le nombre de personnes ou d'entités qui ont accès aux données. Lorsque plus de personnes ont accès aux données, nous considérons qu'elles sont plus ouvertes.
Deuxièmement, nous avons aussi tenu compte de la lisibilité par machine des données. Bien sûr, la plupart des données peuvent, d'une façon ou d'une autre, être lisibles à la machine, mais certaines formes de données sont plus faciles à utiliser ou à traiter, comme les fichiers délimités par des virgules, entre autres. Il s'agit d'une autre dimension que nous avons jugée importante.
Troisièmement, il y a les coûts. Lorsque l'information est moins dispendieuse ou qu'elle est accessible gratuitement, elle est plus ouverte. Encore une fois, certains gouvernements et d'autres institutions mettent en place un cadre de recouvrement des coûts. Nous n'affirmons pas que des données sont complètement fermées s'il faut payer un coût modique pour y avoir accès.
Enfin, la quatrième dimension que nous avons décrite concerne les droits d'utiliser les données, si elles peuvent être redistribuées, de quelle façon on peut les traiter, etc. Sur le plan juridique, les données peuvent parfois être utilisées librement, ou il peut y avoir certaines restrictions. Nous croyons qu'il y a là un continuum. Nous croyons vraiment que les données peuvent être plus fermées ou plus ouvertes, ou plus liquides, comme nous aimons à le dire. Il n'y a pas, d'un côté, les données ouvertes, et de l'autre, tout le reste.
Cela dit, qu'avons-nous constaté lorsque nous avons examiné l'impact économique potentiel des données ouvertes? Nous nous sommes penchés sur sept secteurs différents de l'économie. Ces secteurs sont l'éducation, les transports, les produits de consommation, l'électricité, le pétrole et le gaz, les soins de santé et divers aspects des finances des consommateurs. Lorsque nous avons examiné ces différents secteurs de l'économie et que nous avons examiné la situation générale, nous avons constaté que les données ouvertes pouvaient avoir un impact supplémentaire de 3 à 5 billions de dollars. Ces avantages incluent une efficience accrue, l'élaboration de nouveaux produits et de nouveaux services et même des surplus pour les consommateurs, ce qui est le type d'avantage dont peuvent bénéficier les citoyens lorsqu'ils ont accès à plus de données ouvertes ou à des applications pour les utiliser.
Nous avons aussi constaté d'autres choses. Les données ouvertes accentuent l'impact des grands volumes de données, un autre domaine d'étude qui nous intéresse. Souvent, lorsqu'on combine des données de différentes sources, on peut en tirer une valeur ajoutée. Parmi les façons d'obtenir cette valeur ajoutée, mentionnons une meilleure transparence, la détermination de la variabilité, la capacité de réaliser des expériences concrètes, la segmentation des populations pour adapter les mesures, l'augmentation ou l'automatisation de la prise de décisions humaine et la définition de nouveaux produits et services. En fait, d'un point de vue général, lorsqu'il est question de déterminer la variabilité et de permettre l'expérimentation, environ le tiers de toutes les répercussions que nous avons constatées découle de la capacité d'effectuer une analyse comparative et de la possibilité de se comparer aux autres.
Nous avons aussi constaté que les citoyens sont ceux qui peuvent le plus bénéficier des données ouvertes. Plus de la moitié des avantages que nous avons cernés — et, rappelons-le, ce n'est pas distinct de l'analyse comparative parce qu'on peut en faire à l'échelle individuelle — profitaient aux citoyens ou aux consommateurs. En fait, nous avons découvert une notion très proche des données ouvertes, ce que nous avons appelé « mes données ». C'est lorsqu'un citoyen ou une personne a accès aux données qu'un gouvernement ou une entreprise possède à son sujet. C'est l'une des sources d'avantages dont pourraient bénéficier les particuliers. Ce pourrait être, par exemple, le fait de pouvoir comparer ses résultats en matière de soins de santé avec ceux de personnes dans une situation semblable.
Les données ouvertes peuvent aussi aider les entreprises à accroître leur productivité et à créer de nouveaux produits et services. Il est évident que les entreprises bénéficient de la capacité d'analyse comparative, à l'interne et à l'externe. On peut aussi utiliser les données ouvertes pour créer des produits plus personnalisés grâce à de meilleurs renseignements sur les consommateurs. Bien sûr, les données ouvertes représentent aussi de nouveaux risques en ce qui concerne la réputation ou la possible perte de contrôle de renseignements confidentiels, qu'il s'agisse de renseignements personnels ou de renseignements d'entreprises ou d'organisations.
Nous croyons aussi que les gouvernements doivent vraiment jouer un rôle central en tant que source de données ouvertes, et on constate que c'est ce que font un certain nombre de gouvernements. Ils ont favorisé l'utilisation des données ouvertes, les ont utilisées eux-mêmes et ont élaboré des politiques à ce sujet. Il ne fait aucun doute que les gouvernements possèdent une grande quantité de données qu'ils pourraient rendre accessibles, et ils le font de plus en plus.
Il y a un autre aspect intéressant à ce sujet. Je viens d'affirmer que les divers consommateurs et les citoyens profiteront d'une bonne partie des avantages découlant des données ouvertes. Si c'est le cas, alors, en fait, le gouvernement est l'une des entités qui peuvent vraiment défendre ces groupes diversifiés plutôt que d'uniquement défendre les intérêts de petits groupes restreints. Il peut en effet mettre en oeuvre des politiques permettant de concrétiser les avantages découlant des données ouvertes.
Le dernier point que j'aimerais soulever est le suivant: même s'il faut bien sûr rendre les données plus liquides, le fait de les rendre plus ouvertes n'est souvent pas nécessaire pour bénéficier d'une partie de la valeur ajoutée et n'est souvent pas suffisant. D'autres choses doivent se produire. Par exemple, il faut créer un système ou un écosystème dynamique de développeurs qui utilisent les données pour créer des applications, parce que la plupart des gens ne veulent pas consulter directement des données brutes. Ils utilisent des applications qui tirent profit des données. Par conséquent, il faut souvent combiner les données ouvertes avec d'autres sources de données. Il faut mettre en place des politiques réfléchies concernant la propriété intellectuelle, la protection des renseignements personnels et la confidentialité. Il faut investir dans les technologies et dans les compétences. Il s'agit clairement d'un des domaines où nous avons constaté un immense écart entre le besoin touchant ces compétences et l'offre connexe.
Il faut aussi élaborer des normes afin de rendre les données de diverses sources comparables. Puis, il faut produire des métadonnées, des données sur les données, afin de rendre les données ouvertes plus utilisables.
Pour terminer, les avantages potentiels des données ouvertes peuvent vraiment provoquer une importante transformation — et, je le rappelle, on parle de billions de dollars chaque année à l'échelle mondiale —, mais elles peuvent aussi souvent s'autorenforcer. Lorsque les données ouvertes sont accessibles et qu'on élabore des applications connexes qui sont utiles, on encourage souvent la communication de plus de données ouvertes, et le cycle continue.
Je vais m'arrêter ici. J'espère vous avoir présenté un aperçu utile des recherches que nous avons réalisées sur les données ouvertes.
:
On m'a envoyé quelques questions et une liste des sujets qui vous intéressent. J'ai plein de notes à ce sujet. Je ne sais pas si vous allez me poser des questions liées aux renseignements que vous m'avez envoyés.
En ce qui concerne mes antécédents, j'oeuvre pour le mouvement des données ouvertes à Chicago depuis environ six ou sept ans. Chicago a acquis la réputation de capitale américaine des données ouvertes, et, même lorsque je me rends à l'étranger, les gens semblent connaître les initiatives de Chicago en matière de données ouvertes. C'est le gouvernement qui en est responsable. Bon nombre de concepteurs et de développeurs indépendants ont fait pression pour obtenir des données ouvertes, et des avocats l'ont demandé, tout comme des organisations comme Common Cause.
Aux États-Unis, le mouvement pour les données ouvertes est né du désir des gens d'obtenir plus de transparence politique. Ils voulaient savoir qui contribuait aux caisses des partis politiques. Une bonne partie de l'impulsion initiale est venue du fait que, durant l'ère Nixon, le cambriolage du Watergate a été financé par des dons secrets d'entreprises. La campagne Nixon a mené à la création de Common Cause, un groupe bipartisan composé de républicains et de démocrates en faveur de la transparence des dons politiques.
De là, le gouvernement a commencé à recueillir des données. Les ordinateurs sont devenus de plus en plus puissants, et des données ont été communiquées. Les données ouvertes ne sont plus, de nos jours, simplement une question de transparence politique, c'est aussi une question d'efficience. C'est l'idée d'une plate-forme gouvernementale. Qu'il s'agisse principalement de données gouvernementales, les données ouvertes peuvent servir à créer des entreprises comme Google Maps ou des rapports météorologiques. Certaines entreprises aident les agriculteurs à déterminer quand ils doivent semer, quand il pleuvra, quand il ne pleuvra pas, s'ils doivent irriguer leur terre et ce genre de choses. Au cours des trois ou quatre dernières années, on a constat qu'il y avait beaucoup d'avantages liés à l'efficience et à l'économie à tirer des données ouvertes, tandis que beaucoup plus de données locales et nationales ont été communiquées.
Il y a deux ou trois semaines, le gouvernement fédéral a rendu publiques plein de données sur des dépenses remboursées par Medicaid. Plusieurs autres ensembles de données seront communiqués, et plusieurs l'ont déjà été. Ce type de données et d'autres types de données, comme des dossiers médicaux électroniques, seront accessibles par les médecins et les hôpitaux et cliniques qui traitent des patients de Medicaid. Une bonne partie de ces données sont déjà accessibles. Selon l'Affordable Care Act, ou Obamacare, les patients et les médecins qui traitent des patients de Medicaid doivent pouvoir consulter des dossiers médicaux électroniques. Cela changera complètement la façon dont les gens sont traités.
Maintenant, on combine des données génomiques à des données sur les dossiers médicaux électroniques dans le cadre d'études médicales, et ce, sans avoir à concevoir une expérience ni à faire des tests à l'aveugle auprès de groupes témoins et ce genre de choses. On peut tout simplement regarder les données et cerner les tendances. Par conséquent, dans le cadre du traitement du cancer du sein chez la femme, certaines d'entre elles survivent, et d'autres pas. On peut regarder celles qui ont survécu et on examine les traitements qu'elles ont obtenus. On peut examiner leur structure génomique et voir quel genre de traitement précis permet de traiter différents types de maladies en fonction des traits génétiques et de régimes de médication particuliers.
Voilà un aperçu très général de ce qui se passe au niveau fédéral concernant les données ouvertes. Nous pourrons peut-être parler de ce qui se passe au niveau de la ville et de l'État plus tard.
:
Merci, monsieur le président.
[Traduction]
Merci aux invités d'être ici ce matin.
Monsieur Chui, j'aimerais vous poser quelques questions au sujet du rapport McKinsey publié en octobre 2013. Vous avez mentionné dans votre déclaration préliminaire avoir ciblé sept secteurs. Dans le rapport, vous avez mentionné une valeur économique de 3,2 à 5,4 billions de dollars par année à l'échelle mondiale simplement pour ces sept secteurs.
Pourquoi McKinsey a-t-il choisi ces sept secteurs plutôt que d'autres? Évidemment, il y a d'autres secteurs importants dans un pays comme le Canada: l'agriculture, les pêches, l'exploitation minière et même le tourisme. J'imagine que la valeur économique générale pourrait être beaucoup plus élevée si on tenait compte de ces autres secteurs.
De plus, si l'on s'en tient aux États-Unis, vous avez mentionné dans votre rapport une valeur de 1,1 billion de dollars. Compte tenu de la taille de l'économie américaine comparativement à l'économie canadienne — le ratio est d'environ 11 pour 1 —, pourrait-on raisonnablement dire que le Canada pourrait bénéficier d'une valeur économique d'environ 100 milliards de dollars dans ces sept secteurs?
:
Vous avez mentionné deux ou trois choses.
La première question concerne la façon dont nous avons choisi ces secteurs. Nous n'avons pas choisi ces secteurs parce qu'ils seraient à notre avis les plus rentables. Nous voulions plutôt choisir un certain nombre de secteurs qui étaient différents relativement à un certain nombre de dimensions. Vous avez remarqué qu'il y a des secteurs liés aux entreprises aux consommateurs, axés sur les consommateurs. D'autres sont des secteurs d'entreprises à entreprises, et ils sont axés davantage sur les entreprises. D'autres encore sont axés sur les produits, puis il y a ceux liés aux services. Nous avons aussi choisi des services publics, comme l'éducation, et, enfin, d'autres sont de nature très commerciale.
En fait, nous voulions des secteurs diversifiés, et c'est de cette façon que nous avons choisi. Nous voulions avoir une idée générale de l'impact que pourraient avoir les données ouvertes dans un certain nombre de secteurs différents.
Il est évident qu'il y a beaucoup de secteurs dont on n'a pas tenu compte dans nos recherches, et comme vous l'avez souligné, cela donne à penser que la plus-value pourrait être encore plus élevée.
En ce qui concerne l'estimation du potentiel pour le Canada, ce n'est probablement pas déraisonnable de calculer les retombées pour l'économie canadienne, qui est beaucoup plus petite que l'économie américaine, en tenant compte des proportions respectives des économies. Bien sûr, je ne miserais pas sur l'exactitude de ces données, mais je crois que c'est une méthode raisonnable.
L'autre chose qu'il ne faut pas oublier, c'est qu'il ne s'agit pas de statistiques liées au PIB, parce qu'elles incluent les surplus pour les consommateurs, ce dont ne tient pas compte le PIB. Assurez-vous, si vous essayez de faire des comparaisons, de ne pas dire que cela a tel ou tel impact sur le PIB, parce que, comme je l'ai dit, plus de la moitié de l'impact qui est mesuré n'est pas inclus dans le PIB. Au bout du compte, je crois qu'il s'agit d'une faiblesse des statistiques sur le PIB.
:
Eh bien, pour revenir au point précédent, j'ai récemment participé à une réunion à Chicago avec des personnes qui travaillent sur le portail des données ouvertes de la ville. Je vais vous donner un exemple. Le service du logement a des données... En fait, je devrais dire que sept services différents possèdent des données sur le logement. Souvent, la main droite ne sait pas ce que la main gauche fait. Les autres services de la ville comptent parmi les plus grands consommateurs de données à Chicago, ce n'est pas rien.
Washington, D.C., a été la première ville à rendre publiques beaucoup de données détenues par la plupart des services, en 2006. Il s'agit du premier effort majeur à ce sujet. Elle a réalisé des études sur les utilisateurs réels des données. De 60 à 70 % des personnes qui avaient consulté le site Web et téléchargé les données étaient en fait des membres de services municipaux. Au départ, une bonne partie des services municipaux craignaient de communiquer les données, mais ils ont fini par le faire après s'être rendu compte que c'était beaucoup plus efficace pour pouvoir obtenir des données liées à leurs centres d'intérêt que détenaient d'autres services sans qu'ils ne le sachent. C'est sans aucun doute l'un des avantages les plus immédiats.
Pour les personnes au sein du gouvernement qui hésitent à communiquer des données et à rendre leurs données accessibles, le fait de se rendre compte que cela peut aussi leur être très avantageux réduit de beaucoup leur réticence. Par conséquent, au sein du gouvernement, cela a un impact positif vraiment immédiat.
En ce qui concerne l'efficience, permettez-moi de vous donner un exemple. Nous avons travaillé avec le service du logement, qui offrait un programme d'aide au logement aux termes de l'article 8 de la Housing Act. Essentiellement, ce programme permet à des personnes à faible revenu d'obtenir de l'argent pour louer un appartement. De plus, les propriétaires ou les gens qui construisent des appartements peuvent obtenir un report d'impôts pendant 8 à 10 ans lorsqu'ils louent des logements à des personnes à faible revenu.
Il s'agissait d'un système sur support papier. Par conséquent, lorsqu'une personne quittait un logement visé par l'article 8, le propriétaire devait parfois attendre jusqu'à six mois pour louer l'appartement. Ce n'est pas très intéressant si vous savez que vous aurez souvent des logements vacants et qu'il faut beaucoup de temps pour les louer. Selon ce système, des gens cherchaient longtemps un logement visé par l'article 8, tandis que les propriétaires, de leur côté, avaient de la difficulté à les louer. Les appartements étaient vacants, et ils ne trouvaient pas personne à qui les louer, en grande partie en raison du fait que les différents services qui géraient les données sur l'habitation et le programme de logement aux termes de l'article 8 ne communiquaient pas assez. Il s'agissait d'un système sur support papier.
Maintenant que tout est lisible à la machine, ils peuvent réduire les délais à deux semaines ou un mois. Cela améliore vraiment la situation des propriétaires et des personnes ou des familles qui cherchent un logement.
:
Merci, monsieur le président.
Je remercie les invités de leur présence.
Le McKinsey Global Institute a pour mission d'aider les chefs de file des secteurs commercial, public et social dans la prise de décision relativement à d'importants enjeux touchant la gestion ou les politiques.
Monsieur Chui, vous avez parlé tout à l'heure de perte de confidentialité et de protection de la vie privée. On sait que lorsqu'il navigue dans Internet, le public aime bien avoir de l'information. Par exemple, il peut vouloir obtenir toutes les informations sur le cancer du sein, ou encore savoir si un terrain est disponible ou à vendre, ou bien obtenir de l'information sur un logement quelconque. Il aime bien avoir ce genre d'information.
Par contre, le public apprécie moins cela quand ses données sont livrées à des entreprises ou à M. et Mme Tout-le-Monde. Nous avons connu un cas récemment où les données personnelles de près de 1 million de personnes ont été divulguées. Quelques entreprises sont en cause.
Est-ce que votre organisme a prévu des mesures pour protéger les citoyens face à une telle situation?
:
Il y a deux ou trois lois précises aux États-Unis sur la protection des renseignements personnels. L'une d'elles, la HIPAA, concerne la protection des renseignements médicaux. Il s'agissait d'un enjeu très important avant l'entrée en vigueur de l'Affordable Care Act, parce que, si les compagnies d'assurance apprenaient que vous aviez une maladie précise, elles refusaient de vous assurer. Ou encore, les employeurs ne vous embauchaient pas parce qu'ils savaient que cela allait être plus dispendieux, vous voyez. C'est moins problématique maintenant.
Il y a aussi des lois très strictes au sujet de la protection des données personnelles des étudiants. On ne peut pas vraiment divulguer quoi que ce soit au sujet des étudiants du primaire et du secondaire. Cela ne signifie pas que les données ne peuvent pas être communiquées aux personnes autorisées. Prenons une initiative sur laquelle nous travaillons actuellement. Dans les écoles, un des meilleurs indicateurs de problèmes à la maison, c'est, par exemple, si un élève de deuxième année ne se présente pas à l'école sans pour autant être malade. Dans ces cas, il est probable, surtout dans les milieux défavorisés, que la famille ait un problème quelconque. Si l'enfant ne se présente pas à l'école, un représentant d'une agence de services sociaux se rend chez lui. Il va peut-être rencontrer la famille pendant 15 à 20 minutes, et déterminer si l'enfant doit rester là ou non et ce genre de choses. Il n'a presque aucune donnée sur l'enfant. Il n'a pas de donnée sur l'assiduité ni les notes et ne sait pas si la mère participe à un programme de lutte à la toxicomanie ou à l'alcoolisme. Il ne sait pas si le père est présent, ou, si c'est le cas, il ignore s'il a le syndrome de stress post-traumatique en raison d'une période de service en Iraq ou en Afghanistan, ou quelque chose du genre.
Prenons une autre situation. Une personne conduit son véhicule, et un feu arrière est brisé. Un agent de police à moto l'intercepte. Le policier prend le portefeuille de la personne, retourne à sa moto et effectue des vérifications dans 64 bases de données différentes. Pourquoi ne pouvons-nous pas servir nos enfants de la même façon et communiquer des données en protégeant leur confidentialité à des personnes qui s'occupent des enfants à faible revenu afin d'améliorer leur vie?
Il y a des situations où, évidemment, on ne veut pas communiquer des données au public, mais il faut les communiquer aux agences, aux enseignants, et aux directeurs afin qu'ils puissent aider les familles à s'épanouir.
:
Les chiffres varient. Pour ce qui est de la ville de Chicago, tout le monde a toujours dit qu'il y avait environ 800 ensembles de données, et je viens tout juste de parler à une personne responsable de leur gestion, hier, et elle m'a dit qu'il y en a environ 550. Initialement, l'administration Obama, lorsqu'elle a annoncé la création de data.gov, a dit qu'il y avait environ 190 000 ensembles de données. Le nombre a maintenant été réduit à 54 000 ensembles de données.
Même si le gouvernement fédéral aux États-Unis a rendu publics beaucoup, beaucoup d'ensembles de données, et que beaucoup de données sont accessibles depuis très longtemps — des données météorologiques, des données satellites, des données liées aux routes, des données géographiques —, et on parle d'il y a 20, 30 ou 40 ans, il y a une étude récente qui révèle que malgré tous les efforts touchant les données ouvertes aux États-Unis, moins de 10 % des agences fédérales communiquent vraiment de grandes quantités de données. C'est parce qu'elles font beaucoup d'argent en vendant les données soit à d'autres agences soit au sein même de leur agence. C'est un jeu à somme nulle. Une agence en paie une autre pour obtenir des données, et l'autre agence touche un revenu, ce qui n'est pas vraiment logique puisqu'on parle de la même organisation, mais cela fait partie des règles comptables qui créent des inefficiences là-bas.
Nous aimerions bien qu'il y ait beaucoup plus de données. Il y a beaucoup de données dans le monde entier. Nous sommes membres de l'Institut des données ouvertes, un organisme international. Nous représentons le volet de Chicago. Le Royaume-Uni a fait de grands pas touchant la communication de données. La France en produit aussi pas mal plus qu'avant. Un de nos collègues de notre bureau actuellement est responsable des portails des données ouvertes de la République dominicaine, qui n'a pas bénéficié d'un gouvernement vraiment démocratique pendant très longtemps. Même là, il y a une alliance entre les progressistes et les conservateurs qui veulent communiquer des données afin de garantir la responsabilité budgétaire et la responsabilité politique. Il y a donc une alliance des deux côtés du spectre politique. Nous communiquons avec eux et apprenons beaucoup sur ce qui se passe là-bas.
Des choses se produisent. Il y a un effort aux Philippines, et même la Russie met des mesures en place pour communiquer plus de données. Il y a environ 17 volets de l'Institut des données ouvertes dans le monde actuellement. Nous étions le premier volet mis sur pied tout juste en octobre dernier, et aujourd'hui, il y en a 16 de plus. Bon nombre se trouvent dans des pays qui n'étaient pas démocratiques il y a 10, 15 ou 20 ans.
:
J'ajouterais cependant deux ou trois choses.
On ne peut pas comparer directement les « nombres d'ensembles de données » des pays, parce qu'on peut très bien combiner deux ensembles de données et dire qu'il n'y en a qu'un seul. Ce n'est probablement pas une très bonne mesure. En fait, c'est difficile de trouver une bonne mesure. Évidemment, on ne peut pas tout simplement compter la quantité de données accessibles. Idéalement, il faudrait calculer l'impact des données sur l'économie, ce qui est beaucoup plus difficile à faire. Cela dit, la fondation Open Knowledge a établi au moins un étalon, et elle essaie de comparer les pays entre eux. Je n'irais pas jusqu'à dire que j'approuve cette technique, mais c'est intéressant.
Pour terminer, si vous me le permettez, j'aimerais revenir à la question de la protection des renseignements personnels. Je crois que l'approche de la HIPAA, lorsqu'on la compare à au moins un aspect de l'Affordable Care Act américaine, illustre bien la différence entre une loi qui porte sur la génération et le contrôle des données en tant que telles, la HIPAA, et l'Affordable Care Act, qui prévoit que l'on ne peut pas utiliser certaines données afin de choisir les personnes qui pourront être assurées. C'est là essentiellement la différence, la question de savoir si on peut avoir les données ou non ou de quelle façon on peut les utiliser. Je crois que ce sont deux façons différentes de légiférer en ce qui concerne la protection des renseignements personnels.
:
Tim Berners-Lee travaille pour l'Institut des données ouvertes. Il a créé le groupe et a inventé le réseau. Il a forgé le slogan suivant:
knowledge for everybody, le savoir pour tous. L'idée, c'est que ce ne sont pas uniquement les chefs de gouvernement et les dirigeants d'entreprise qui doivent vraiment savoir ce qui se passe. Les gens ordinaires doivent aussi avoir accès au même genre d'information pour prendre des décisions démocratiques et pour être informés lorsqu'ils votent ou qu'ils participent dans la sphère politique. Selon l'IDO, il y a là à la fois des avantages pour la démocratie et pour l'économie.
L'Institut des données ouvertes conseille fortement aux entreprises d'utiliser les données ouvertes pour créer des entreprises qui oeuvreront en partie pour le bien social. Il y a des problèmes majeurs, des choses comme les changements climatiques. Nous travaillons actuellement sur un projet pour rapprocher les chercheurs de l'Arctique afin qu'ils puissent mettre en commun leurs renseignements plus rapidement, de façon à ce que les recherches sur les changements climatiques et les banquises avancent plus rapidement. Les glaces marines fondent très rapidement, tout comme les glaciers. Si nous pouvons accélérer le processus de recherche en mettant en commun les données et en maximisant l'utilisation des brise-glace... Louer un brise-glace coûte 50 000 $ par jour. Si on peut s'arranger pour que trois ou quatre équipes différentes louent un espace pendant quelques jours en même temps, on peut réduire les coûts. Ce sont des occasions à saisir.
Il y a de nombreux domaines. Évidemment, on a perdu beaucoup d'acquis en raison de la décision touchant les « Billionaires United » aux États-Unis. Vous savez, beaucoup d'argent est versé en secret aux partis politiques, et c'est un grave problème, mais il y a beaucoup de problèmes dans la sphère publique. Par exemple, il y a de nombreuses controverses au sujet des écoles à charte aux États-Unis. Beaucoup de groupes, comme la League of Women Voters et la PTA, essaient d'obtenir les données nécessaires pour déterminer le rendement réel de ces écoles. Compte tenu du libellé de nombreuses lois, les écoles à charte n'ont pas à fournir beaucoup de données, contrairement aux écoles publiques régulières, et il est donc très difficile de comparer des pommes et des oranges. D'un côté, en ce qui concerne les écoles à charte, il y a beaucoup d'efforts de relations publiques déployés, encore une fois, grâce aux fonds fournis par des millionnaires qui veulent accaparer une partie des fonds publics destinés à l'éducation. De l'autre côté, il y a les enseignants et les parents qui aiment les écoles publiques et qui veulent les conserver. Ici, ce n'est pas tout le monde qui a accès à l'information. Les responsables des écoles à charte savent ce qu'ils font. Ils ne montrent pas leurs cartes. Nous travaillons aussi en collaboration avec Common Cause afin d'essayer d'obtenir une partie de ces données.
Selon moi, les deux aspects sont très importants. C'est difficile de savoir lequel l'est le plus.
:
En tant que défenseur de l'utilisation des données, je suis probablement mal placé pour lancer des idées sans réaliser d'analyses préalables. Je crois que vous devriez réaliser au Canada le type d'analyse que nous avons effectuée à l'échelle mondiale et essayer de comprendre quels types de données pourraient créer le plus de valeur ajoutée au Canada.
Lorsque nous nous sommes penchés sur la question, nous avons constaté qu'il y avait beaucoup de potentiel, par exemple, dans le domaine des transports, tout comme dans celui de l'éducation. Ce que vous devriez faire, c'est essayer de comprendre, du point de vue canadien, ce qui sera le plus rentable. Je crois que ce serait une erreur pour moi d'essayer de lancer des hypothèses sans avoir réalisé d'analyses, compte tenu du fait que nous croyons à l'utilisation des données pour étayer ce type de décisions.
Cela dit, je crois que l'autre élément que vous avez soulevé est extrêmement important, soit qu'il n'est pas suffisant de construire le « champ des rêves », de rendre les données accessibles, pour en tirer immédiatement des avantages. En fait, il faut créer un écosystème dynamique d'utilisateurs de données. Cela signifie qu'il faut, entre autres, mobiliser des gens qui développeront des programmes et des applications qui permettent d'utiliser les données et de les rendre utiles aux entreprises et aux citoyens.
Comme je l'ai déjà dit, c'est quasiment une question de marketing. Ce que nous avons constaté ici, aux États-Unis, c'est que le gouvernement a par exemple organisé des événements. Je sais que, au Canada, par exemple, j'ai participé au hackathon de l'EDOC à Toronto. C'était l'un de ces événements qui sensibilisent les développeurs de programmes informatiques à la grande source de données qu'ils peuvent utiliser pour créer de nouvelles applications. Les événements et les concours, même la publicité, en fait, sont certaines des choses qu'il faut réaliser pour créer un écosystème et, pour ainsi dire, de la loyauté. Les consommateurs de données que sont les développeurs d'applications doivent, dans un premier temps, savoir que les données sont là et, ensuite, être encouragés à créer des applications en utilisant des données ouvertes.
:
Oui. J'aime examiner les très gros enjeux. Actuellement, selon moi, ce sont les changements climatiques et la médecine. Du moins, ce sont deux des domaines scientifiques très importants. On y mène beaucoup d'activités. En ce qui concerne les changements climatiques, le gouvernement fédéral américain a exigé que quiconque obtient des fonds fédéraux pour effectuer des recherches scientifiques communique ses données dans l'année. C'est assez récent. De façon informelle, c'est ce qui se passe depuis deux ou trois ans, mais les gens ne respectaient pas nécessairement toujours la politique. Dorénavant, je crois qu'ils vont le faire, et cela accélérera le rythme des recherches scientifiques, y compris celles sur les changements climatiques qui, du moins pour les personnes qui croient que les changements climatiques sont bien réels, sont un enjeu extrêmement important.
Il y a aussi énormément d'efforts déployés dans le domaine de la médecine. Silicon Valley « perturbe » — une notion galvaudée — la médecine de nombreuses façons. Le gouvernement fédéral et même certaines compagnies pharmaceutiques mettent en commun des données découlant de leurs études sur des médicaments. Deux ou trois entreprises se sont engagées à communiquer toutes les données découlant de leurs études sur des médicaments, ce qui pourrait favoriser le traitement et aussi aider à mieux comprendre quels sont les médicaments qui fonctionnent vraiment, et ceux qui ne fonctionnent pas.
Dans le cadre d'une initiative au Royaume-Uni, un demi-million de personnes ont accepté de faire analyser leurs gènes afin qu'on puisse combiner ces données génomiques avec les données de leur dossier médical électronique. Kaiser Permanente, dans la région de la baie, a obtenu l'accord d'un million de ses patients. On pourra analyser leurs gènes et combiner ces données aux données de leur dossier médical électronique. Ils fournissent ces données à des chercheurs qualifiés qui respectent des procédures en matière de protection des renseignements personnels. Il s'agit d'un domaine extrêmement prometteur.
Il y a aussi des initiatives d'externalisation ouverte de données médicales qui sont très intéressantes. Par exemple, des chercheurs et médecins de la Californie ont créé une application pour téléphone mobile. Lorsqu'une personne croit avoir un grain de beauté cancéreux, elle en prend une photo. Cette photo est versée dans une base de données. Puis, quand le grain de beauté est enlevé et analysé, la personne l'indique, et l'application détermine si le grain de beauté était cancéreux ou non. Ils ont accumulé suffisamment de données actuellement pour que, simplement en prenant une photo du grain de beauté, on puisse avoir une bonne idée de l'importance de le faire analyser ou non. Ils utilisent l'intelligence artificielle pour analyser la couleur, les contours extérieurs, la taille et les autres caractéristiques du grain de beauté. Ils créent des façons de faire qui misent sur l'externalisation ouverte.
Bien des gens ont beaucoup de grains de beauté, mais si une personne a un grain de beauté qui l'inquiète et qu'elle se demande si elle devrait le faire analyser, elle est beaucoup plus susceptible de le faire grâce à cette initiative. À chaque analyse, c'est 1 000 $ de plus.
:
La commission à l'éthique de la ville nous a demandé de témoigner sur la façon d'améliorer les données sur le lobbying.
L'un des principaux problèmes, c'est que les données sont seulement communiquées une fois par année, alors, lorsqu'on reçoit finalement les données, la plupart des décisions ont déjà été prises. Nous avons recommandé la divulgation beaucoup plus rapide des données: chaque jour, chaque semaine ou, au pire, chaque mois. Cela serait une grande amélioration.
De plus, on nous dit seulement devant quel comité ils ont comparu et à qui ils ont parlé, mais pas les sujets de conversation. Il n'y a pas suffisamment de renseignements sur les questions abordées. En fait, les lobbyistes peuvent décrire ce qu'ils font de façon très, très sommaire.
Nous avons aussi parlé de ce problème à la ville de San Francisco. Nous envisageons même de créer une application logicielle nationale pour recueillir et montrer les données, une application qui permettrait d'avoir accès à des renseignements plus détaillés, à des rapports plus rapides et à ce genre de choses.
:
En fait, nous nous sommes parlé en personne à une réunion à Londres il y a quelques mois, et nous avons parlé à nouveau au téléphone il y a peut-être deux mois.
L'un des objectifs de l'Institut des données ouvertes est de créer un réseau afin de pouvoir apprendre les uns des autres. Je ne sais pas grand-chose sur le Canada, mais j'en sais plus maintenant qu'avant. Vous commencez à peine. De plus, dans le cadre d'un événement connexe tenu il y a à peu près un an, j'ai parlé un bon bout de temps avec un représentant du gouvernement. Je ne me rappelle pas son nom, mais il était responsable de réfléchir à la question d'une politique sur les données ouvertes. Nous avions parlé à ce moment-là.
En ce qui concerne des conseils pour l'IDO du Canada, il a fallu beaucoup de temps, à Chicago et aux États-Unis, pour vraiment démarrer les choses. Le processus a bénéficié de dirigeants gouvernementaux éclairés, mais aussi d'activistes, de concepteurs, de développeurs et de personnes qui voient à la transparence politique. Il s'agit d'un processus multiple assez long. Je suis heureux d'apprendre que vous tenez ce type d'audiences, parce que celles-ci... C'est très difficile de faire avancer les choses dans le domaine des données ouvertes sans données ouvertes, justement, alors il faut en obtenir des États, des villes et du gouvernement fédéral, et puis, il ne doit pas s'agir uniquement de données banales. Il faut des renseignements avec lesquels nous pouvons vraiment travailler.
Ici, disons, à Toronto, j'imagine qu'il y a probablement des données accessibles sur les transports, qui permettent aux gens de connaître les horaires des autobus et des trains et ce genre de choses, afin d'essayer de mieux prévoir leurs déplacements pour se rendre au travail et en revenir. Si ce n'est pas le cas, alors... Vous devez déterminer quelle est la cible la plus facile, et commencer là. Il faut aussi déterminer de quelle façon vous travaillerez avec le gouvernement et les développeurs et les concepteurs privés afin de mettre tout cela sur pied et de faire avancer les choses. Il faut choisir une ville assez grande de façon à avoir suffisamment de données, suffisamment de soutien du côté politique et assez de développeurs et de concepteurs pour travailler là-dessus.
Il faut travailler lentement et cibler ses efforts. Le Canada est un grand pays où il y a relativement peu de personnes. En fait, ma mère est née au Canada, et j'ai passé pas mal de temps ici. Actuellement, votre classe moyenne s'en tire mieux que la nôtre, alors peut-être que les avantages que l'on pourra tirer des données ouvertes susciteront une grande demande.
:
En fait, cela nous a permis de connaître tous les lobbyistes, de savoir qui recevait le plus d'argent, les entreprises ou les organisations pour lesquelles ils travaillaient, quels étaient leurs objectifs généraux et à qui ils avaient parlé à la ville.
La question que nous nous posions toujours était la suivante: qui Walmart a-t-il embauché pour faciliter la construction de magasins à Chicago? À qui l'entreprise a-t-elle parlé? Qui étaient les personnes que l'entreprise jugeait suffisamment importantes sur le plan politique pour vouloir leur parler?
Nous avons récemment reçu les données sur les dons politiques, alors nous ne savons pas combien d'argent a vraiment été dépensé, mais, au moins, nous savons que... Ce n'est pas seulement Walmart. Nous voulons pouvoir faire un suivi de tous les types d'organisation, et nous voulons savoir de quoi ils ont parlé, dans quels services.
Souvent, les lobbyistes sont embauchés pour présenter des exposés au sujet d'un sujet précis. Nous ne savons pas exactement sur quoi portaient leurs exposés, mais, si nous avons des soupçons, nous pouvons examiner les dossiers accessibles pour y trouver des renseignements détaillés. Nous n'avons pas non plus intégré ces dossiers ouverts.