Passer au contenu

LANG Réunion de comité

Les Avis de convocation contiennent des renseignements sur le sujet, la date, l’heure et l’endroit de la réunion, ainsi qu’une liste des témoins qui doivent comparaître devant le comité. Les Témoignages sont le compte rendu transcrit, révisé et corrigé de tout ce qui a été dit pendant la séance. Les Procès-verbaux sont le compte rendu officiel des séances.

Pour faire une recherche avancée, utilisez l’outil Rechercher dans les publications.

Si vous avez des questions ou commentaires concernant l'accessibilité à cette publication, veuillez communiquer avec nous à accessible@parl.gc.ca.

Publication du jour précédent Publication du jour prochain
Passer à la navigation dans le document Passer au contenu du document






Emblème de la Chambre des communes

Comité permanent des langues officielles


NUMÉRO 077 
l
1re SESSION 
l
42e LÉGISLATURE 

TÉMOIGNAGES

Le mardi 31 octobre 2017

[Enregistrement électronique]

(1540)

[Français]

    Conformément au paragraphe 108(3) du Règlement, nous poursuivons notre étude sur les données du Recensement de 2016 sur les langues et la surestimation de la croissance de l'anglais au Québec.
    Aujourd'hui, nous avons le plaisir d'accueillir deux représentants de Statistique Canada: M. Jean-Pierre Corbeil, directeur adjoint de la Division de la statistique sociale et autochtone, ainsi que M. Marc Hamel, directeur général du Programme du recensement.
    Messieurs, je vous souhaite la bienvenue.
    J'imagine que vous connaissez le fonctionnement de notre comité. Comme d'habitude, nous vous accordons une dizaine de minutes pour faire votre présentation. Ensuite, nous passerons à une période de questions et de commentaires de la part des membres du Comité.
    Je crois que c'est M. Hamel qui va faire la présentation.
    Vous avez la parole, monsieur Hamel.
    Je veux d'abord remercier le Comité de donner à Statistique Canada l'occasion de présenter les faits en ce qui touche une erreur détectée dans les données sur les langues du Recensement de la population de 2016 telles qu'elles avaient été publiées le 2 août.
    Je crois que vous avez reçu une copie de la présentation que nous avons préparée pour vous expliquer un peu ce qui s'est passé. Je vais passer en revue cette présentation et parler des différents points qui y sont abordés.
    Comme nous le savons maintenant, une erreur s'est glissée dans les résultats sur les langues du Recensement de la population de 2016 et elle touche principalement quelques communautés du Québec. L'erreur a mené à une surestimation de la croissance de l'anglais comme langue maternelle et langue le plus souvent parlée à la maison, principalement dans la province de Québec et dans certaines de ses municipalités, et à une surestimation du déclin du français. Elle a également entraîné une légère surestimation du taux de bilinguisme anglais-français pour la province de Québec et pour le reste du Canada.
    La source de cette erreur était un problème de programmation dans une procédure auxiliaire de cueillette des données. Cette erreur est survenue à une étape de suivi auprès de certains répondants servant à combler des informations manquantes. L'erreur est survenue durant le transfert des réponses d'un sous-ensemble de questionnaires en version française. Cela a touché le contenu du questionnaire court seulement et impliqué approximativement 61 000 personnes.
    Les réponses à deux questions relatives aux langues ont été mal consignées par le système, soit les questions 8 a) et 8 b), qui portent sur la langue parlée à la maison, et la question 9, qui porte sur la langue maternelle. Les réponses aux catégories « français » et « anglais » ont été inversées.
    Dans la présentation, vous trouverez un exemple du questionnaire papier où ces questions se trouvent. Vous pouvez remarquer que les choix de réponse sont inversés, selon qu'il s'agit de la version en anglais ou de la version en français. En somme, le programme a lu le questionnaire de la version française comme s'il était en anglais, et il a interprété la première réponse, qui est « français », comme étant la réponse « anglais ».
    Une revue exhaustive de tout le processus de collecte et de traitement des données nous a permis de poser un diagnostic clair des répercussions de cette erreur. Comme je l'ai mentionné, les réponses d'environ 61 000 personnes à trois questions ont été classifiées incorrectement. Nous avons confirmé que cette erreur touchait uniquement les catégories de réponses dont l'ordre était inversé du questionnaire français au questionnaire anglais. Le résultat est que, pour un sous-ensemble de questionnaires, les réponses « français » ont été consignées comme des réponses « anglais ». Comme l'origine du problème touchait la version française du questionnaire, l'erreur a influé principalement sur les résultats au Québec.
     Statistique Canada prend très au sérieux la qualité de ses données et leur importance pour les utilisateurs. Une fois informés qu'il semblait y avoir des résultats difficiles à expliquer pour certaines communautés au Québec, nous avons immédiatement procédé à une nouvelle revue de nos processus de production des données. Dans la présentation, vous pouvez voir la chronologie des événements entre le moment où nous avons été informés d'un problème potentiel, le moment où nous avons cerné la source de l'erreur et le moment où nous l'avons corrigée.
    Le 9 août, le statisticien en chef a été informé par un utilisateur de données, par écrit, de certaines incohérences dans les résultats du Recensement de 2016 concernant la langue anglaise dans certaines collectivités de la province de Québec. Dès lors, Statistique Canada a effectué une revue exhaustive de tout le processus de collecte et de traitement des données du Recensement de 2016. Nous avons cherché l'origine du problème.
    Le 11 août, nous avons confirmé qu'il y avait une erreur dans un programme informatique et nous avons diffusé une annonce statistique à cet effet. Immédiatement, nous avons informé les utilisateurs de données qu'il y avait un problème concernant les données.
    Du 12 au 15 août, Statistique Canada a refait tout le processus de traitement et d'analyse des données pour les variables sur les langues.
    Le 16 août, un examen des nouvelles données a été effectué par un groupe d'experts rassemblés par Statistique Canada.
    Le 17 août, nous avons diffusé de nouvelles données et un document technique expliquant la nature du problème et ce qui avait été fait exactement.
    Donc, en date du 17 août, l'ensemble des produits de données sur les langues a été rediffusé. Tous les produits de données initialement rendus disponibles le 2 août ont été corrigés et sont maintenant disponibles sur le site Web de Statistique Canada.
(1545)
    Pour faire ce travail visant à corriger cette erreur, nous avons suivi un certain nombre d'étapes. Ces étapes incluent une vérification tout au long du processus de traitement des données, avec une attention particulière aux enregistrements qui étaient touchés par l'erreur. Nous avons vérifié et validé que l'erreur avait été circonscrite aux variables de langue seulement et qu'elle ne s'appliquait pas à d'autres parties du questionnaire. Nous avons fait une analyse des répercussions de l'erreur à chaque étape de traitement et à plusieurs niveaux de géographie. Nous avons également fait une contre-vérification avec d'autres sources de données pour nous assurer de la validité des nouveaux résultats. Finalement, nous avons mené un examen à l'aide d'un groupe d'experts, comme je l'ai mentionné plus tôt.
    Étant donné cette erreur, nous avons depuis mis en place des mécanismes très rigoureux afin de déterminer les sources de variation des nombres et des pourcentages entre le Recensement de 2016 et les recensements antérieurs. Les méthodes de validation des données ont été modifiées pour nous permettre d'établir les facteurs expliquant les variations jusqu'au niveau de chaque municipalité au Canada. La robustesse de notre processus de vérification s'en est trouvée grandement améliorée. Aucune autre erreur de production n'a été détectée pour les autres données diffusées jusqu'à ce jour.
    Voilà qui couvre, en gros, les événements touchant la diffusion des données sur les langues le 2 août 2017 et les mesures qui ont été prises par Statistique Canada pour trouver les éléments de cette erreur, apporter les corrections appropriées et rediffuser les données, afin de certifier à nos utilisateurs que les données pouvaient être utilisées sans contrainte.
    Nous sommes maintenant prêts à répondre à vos questions.
    Merci beaucoup, monsieur Hamel.
    Nous allons commencer immédiatement la période de questions et commentaires en donnant la parole à M. Bernard Généreux.
    Messieurs Hamel et Corbeil, merci d'être ici aujourd'hui.
    Messieurs, vous savez que lorsque nous, les parlementaires, devons prendre des décisions, nous nous appuyons sur ce qu'on appelle des faits, des éléments factuels. Ce sont les données qu'on nous donne qui nous permettent de prendre des décisions pour les Canadiens et les Canadiennes. Donc, la crédibilité de Statistique Canada quant à l'ensemble des données qu'elle fournit aux parlementaires, aux institutions, aux compagnies et à l'ensemble de sa clientèle, au sens large, est d'une importance fondamentale.
    Ce qui s'est passé au mois d'août a mis en cause la crédibilité de Statistique Canada, dans une certaine mesure, et il était important pour nous de vous rencontrer aujourd'hui pour faire le point là-dessus. Vous êtes ici aujourd'hui pour défendre la crédibilité de votre institution, et je suis content que des gens des médias soient ici aujourd'hui pour être en mesure d'en faire part aux Canadiens et aux Canadiennes. Nous aurons probablement l'occasion de le faire aussi dans un rapport à venir.
    Je ne pense pas qu'on ait à douter de la crédibilité de Statistique Canada. Une chose est certaine, c'est que Statistique Canada existe depuis quand même assez longtemps, et des décisions qui ont été prises dans le passé par des parlementaires canadiens, tous partis confondus, se sont appuyées sur des faits, des éléments ou des données que vous aviez fournis. Il est essentiel et fondamental que l'information que nous recevons et sur laquelle nous nous appuyons pour prendre des décisions, et c'est particulièrement clair en matière de langues officielles, soient d'une perfection absolue.
    Comment se fait-il qu'une telle erreur puisse se produire, compte tenu du nombre d'employés que vous avez, de la crédibilité dont vous jouissez et de l'historique de votre institution? Comment une erreur comme celle-là peut-elle se produire encore, en 2017? C'est la question principale que je me pose. Par ailleurs, j'aimerais bien savoir si cela s'est déjà produit par le passé. Quoi qu'il en soit, cette erreur survenue en 2017, estimez-vous qu'elle est d'origine humaine ou technologique? Est-ce qu'on peut dissocier les deux?
(1550)
    Ce que je peux vous répondre, c'est que je suis absolument d'accord avec vous. La crédibilité même de Statistique Canada est toujours en jeu lorsque nous utilisons des données. Nous voulons toujours nous assurer que les utilisateurs peuvent compter sur la validité des informations.
    Nous sommes encore à réviser tous les processus qui sont en lien avec ce qui s'est produit dans ce cas. Le recensement est une machine très complexe. Il y a des centaines de processus, voire des milliers, et nous diffusons des millions de cellules d'information. Cela dit, nous avons également des processus très rigoureux et systématiques pour revoir tout ce qui est publié à partir du recensement.
    Je n'ai pas d'explication précise à vous donner sur la nature même du problème qui s'est produit. À la base, c'est un système informatique qui a mal lu le questionnaire, mais le système informatique est produit par des humains.
    Je suis totalement d'accord avec vous, monsieur Hamel. Je suis bien placé pour savoir cela, étant donné que j'étais imprimeur, auparavant. J'ai vu des cas où il y avait des erreurs, notamment des erreurs de français, dans des bulletins de vote ou autres documents imprimés. Dans de tels cas, l'imprimeur doit reprendre le travail. Lorsqu'on est imprimeur, on doit faire des vérifications avant d'imprimer.
    Dans ce cas-ci, nous parlons de l'inversion des réponses à deux questions dans les versions française et anglaise. L'information entrée dans le système informatique était donc erronée, puisque les deux réponses à ces questions n'étaient pas dans le même ordre d'une version du questionnaire à l'autre.
    Il y a une vérification d'épreuves à faire pour l'ensemble du questionnaire. L'erreur se trouvait-elle dans le questionnaire électronique uniquement, dans le questionnaire papier uniquement ou dans les deux à la fois?
    En fait, dans ce cas-ci, il s'agit d'une erreur d'inversion dans un système informatique.
    Oui, mais c'est dans le questionnaire.
    En fait, le système devait lire la version française du questionnaire et l'interpréter comme étant la version française. Au cours de la conversion, si le premier choix de réponse, soit « français », avait été coché, le système aurait dû interpréter cela comme la réponse « français ». Or c'est la matrice anglaise qui a interprété le questionnaire en français et qui a cru, malencontreusement, que la première réponse était « anglais ».
    En ce qui concerne la production de ce système, nous aurions dû nous rendre compte que le questionnaire n'était pas interprété correctement. Nous aurions dû faire la correction, mais cela n'a pas été fait.
    À mon avis, votre phrase ne devrait pas contenir le mot « malencontreusement ». Je conviens que ce sont des humains qui disent à l'ordinateur quoi faire, mais il doit y avoir une correspondance absolue entre le questionnaire et le résultat final. Aucun incident malencontreux ne devrait pouvoir survenir.
    Le mois de novembre commence demain et cette erreur s'est produite au mois d'août. Vous n'êtes pas en mesure de m'expliquer exactement ce qui s'est passé, malgré les analyses des processus que vous avez effectuées pour trouver la source du problème. Trois mois plus tard, vous ne savez toujours pas ce qui s'est véritablement produit.
    Je sais ce qui s'est produit, mais je ne sais pas encore comment cette erreur nous a échappé.
    Lorsque nous produisons un système, il est systématiquement conçu et testé individuellement. Nous testons les extrants de ce système. Nous vérifions de facto où vont les informations par la suite, quel système prend la relève, et ainsi de suite. Lors de la préparation du recensement et lorsque nous effectuons celui-ci, tout cela est fait systématiquement.
    Je ne peux pas vous dire, pour le moment, pourquoi nous n'avons pas détecté l'erreur au moment de tester tous ces systèmes. Cependant, nous prenons des mesures et suivons des matrices afin de mettre à l'essai tous ces processus. Une fois ces données produites, elles sont validées. À l'étape de la validation, nous avons pu voir qu'il y avait des changements, mais nous n'avons pas compris qu'il aurait fallu effectuer cette vérification avant la diffusion des données et corriger celles-ci.
    Ce type d'erreur est très rare, mais il n'est pas impossible.
    Vous venez de me dire dans une même réponse que le système n'a pas détecté le problème, mais que vous avez noté qu'il se passait probablement quelque chose d'anormal.
(1555)
    Ce n'est pas le système qui a omis de détecter l'erreur; ce sont les gens qui ont testé le système qui n'ont pas vu que ce dernier ne lisait pas le questionnaire de façon conforme.
    Merci, monsieur Généreux.
    Nous allons maintenant passer à Mme Lapointe.
    Merci, monsieur le président.
    Messieurs, je vous remercie beaucoup d'avoir accepté notre invitation.
    Comme M. Généreux, j'ai été très surprise de vous entendre dire qu'il y avait eu des problèmes liés à la population anglophone. Vous avez parlé plus tôt de quelques populations anglophones.
     Que vouliez-vous dire? Est-ce qu'on parle du Québec dans sa totalité ou seulement de certains endroits?
    Dans le cas où une personne ayant rempli la version française du questionnaire a indiqué l'anglais comme langue parlée, le système a fait l'erreur de lire cela comme si la personne avait indiqué le français comme langue parlée. L'erreur pouvait toucher certains cas de cette façon.
    D'accord.
    Vous avez dit que cela avait eu pour effet de surestimer le bilinguisme au Québec et dans le reste du Canada.
    Nous parlons du Québec depuis tantôt, mais qu'avez-vous observé pour le reste du Canada? La réponse est-elle la même?
    Comme mon collègue M. Hamel l'a mentionné, il y a eu entre 2 000 et 3 000 cas à l'extérieur du Québec. Comme ces gens auraient dû être déterminés comme des francophones, mais qu'ils ont été déterminés en tant qu'anglophones, cela a eu une légère incidence, bien sûr. Nous parlons en effet d'une légère surestimation du bilinguisme. Pour l'ensemble du Canada, le pourcentage annoncé était de 18 %, mais il est véritablement de 17,9 %. Au Québec, nous parlons d'un écart de quelques dixièmes de points de pourcentage. La proportion, qui était de 45 %, a connu un écart de deux ou trois dixièmes de points de pourcentage. Si on parle des personnes de langue anglaise établies à l'extérieur de la grande région de Montréal, il faut savoir que c'est dans les petites municipalités situées à l'extérieur de cette grande région que les gens sont le plus susceptibles d'être bilingues. Comme il s'agissait de personnes de langue française plutôt que de langue anglaise, il en a résulté une surestimation du taux de bilinguisme.
    Je crois que vous avez dit tantôt que les réponses de 31 000 personnes au Québec avaient été classifiées incorrectement, mais dans votre document, c'est 61 000. Est-ce 31 000 ou 61 000?
    C'est 61 000.
    D'accord. Quand vous avez fait votre présentation, j'avais compris 31 000. J'ai sans doute mal compris. Je voulais juste vérifier que c'était bien 61 000.
    Vous allez comprendre mon inquiétude après les commentaires suivants.
    Au cours du travail de notre comité, il a beaucoup été question de l'importance de dénombrer correctement les ayants droit, tant anglophones que francophones, en fonction des alinéas 23(1)a) et b) et du paragraphe 23(2) de la Charte canadienne des droits et libertés.
    Lors de votre dernière comparution devant le Comité, monsieur Corbeil, vous nous avez expliqué que le processus pour en arriver à poser les bonnes questions et pour s'assurer de couvrir les bonnes choses était long. De fait, vous n'aviez pas l'air d'être certain si on pouvait dénombrer tous les ayants droit francophones dans le reste du Québec. Je présume que vous avez dû pouvoir faire des tests pour vous assurer de poser les bonnes questions.
    En fait, le problème n'était pas lié aux questions. Le problème résidait dans la mécanique derrière ces questions. Cela touche l'ensemble du processus de production de données. Le problème est survenu lors d'un processus auxiliaire de cueillette de données, au moment où nous avons fait la conversion de certaines réponses pour faire un suivi auprès de répondants. Lors de cette conversion, le système a lu le questionnaire rempli en français comme étant un questionnaire rempli en anglais, comme vous pouvez le voir dans l'exemple.
    Y a-t-il déjà eu un tel problème de mauvaise lecture?
    Dans ce cas-ci, non. Ce sont les seules questions où les réponses n'apparaissent pas dans le même ordre dans les versions française et anglaise.
    Dans le cas qui nous occupe, on a surestimé ou sous-estimé une population donnée. Vous travaillez à Statistique Canada, alors vous êtes au courant de l'incidence que cela peut avoir au Canada.
    Absolument.
    Permettez-moi de répondre rapidement.
    Il faut savoir que, à la suite d'une norme émise par le gouvernement fédéral, dans tous les documents, le français doit précéder l'anglais dans la version française et l'anglais doit précéder le français dans la version anglaise. C'est ce qui explique pourquoi les questions sur la langue sont les seules questions du recensement où l'ordre des réponses est inversé.
    Cette norme est en vigueur depuis le début des années 2000. Ce n'est donc pas le premier recensement pour lequel nous devons procéder de la sorte. Ce n'est que pour le Recensement de 2016 que nous avons fait face pour la première fois à un tel problème.
    Il faut aussi savoir que nous avons utilisé différentes méthodes...
    Avez-vous été poussés à faire quelque chose trop rapidement alors que vous n'aviez pas les ressources nécessaires?
    Non.
    Je vais vous brosser un portrait de la situation. La base de réponses que nous recevons tient compte de tous les changements que nous avons dû apporter pour nous assurer que les réponses incomplètes étaient consignées afin d'avoir une base complète. On nous remet cette base qui contient les réponses que les Canadiens ont données. Donc, le problème était transparent, il était situé derrière le système. Sur le coup, personne n'a vu le problème.
    Nous avons validé ces informations à partir de sources externes. Nous avions fait des projections linguistiques basées sur les tendances antérieures, et, à l'échelle provinciale, rien ne nous semblait incohérent. C'est vraiment après qu'on nous a signalé des accroissements anormaux dans certaines municipalités du Québec que nous avons essayé de comprendre d'où pouvait venir l'erreur. C'est là que nous avons pris les mesures nécessaires.
    Vous vous êtes rendu compte qu'il y avait un problème parce qu'une telle croissance de la population anglophone dans certaines municipalités était peu probable.
    Voilà.
    Se pourrait-il qu'il y ait le même problème relativement à la population francophone? Se pourrait-il qu'on n'ait pas évalué cette population correctement?
    Comme mon collègue l'a mentionné, entre le moment où l'erreur a été relevée et le moment où les nouvelles données ont été émises, un nombre assez important d'employés de Statistique Canada ont travaillé d'arrache-pied pour s'assurer que cette erreur ne touchait pas d'autres questionnaires ailleurs au pays. Le Canada compte quand même 36 millions de personnes. Nous avons passé au peigne fin tous les processus pour nous assurer que cette erreur ne s'était pas produite ailleurs. C'est à ce moment que nous nous sommes rendu compte qu'entre 2 500 et 3 000 personnes hors Québec avaient été touchées par cette erreur.
(1600)
    Merci beaucoup, madame Lapointe.
    Monsieur Choquette, vous avez la parole.
    Merci, monsieur le président.
    J'aimerais comprendre comme il faut.
    Selon les chiffres que vous avez obtenus, la population anglophone avait augmenté de 164 % à Rimouski, de 115 % à Saguenay et de 110 % à Drummondville, sans parler de Sudbury et d'Ottawa. Ces chiffres n'étaient pas normaux, mais vous avez quand même décidé de les publier. Est-ce exact?
    Vous avez dit que, en voyant ces chiffres, vous vous êtes dit que cela n'avait pas d'allure et qu'il y avait quelque chose d'anormal. Or comment se fait-il qu'ils aient quand même été publiés? Si ces chiffres étaient anormaux, il ne fallait pas les publier.
    Ce que j'ai compris de l'histoire, c'est que lorsque ces chiffres ont été publiés, des citoyens canadiens, dont M. Normand, de la Chaire de recherche sur la francophonie et les politiques publiques, et Mme Mainville, de l'Université d'Ottawa, se sont rendu compte que quelque chose clochait. Ils vous ont alors appelés et c'est là que vous avez changé ces chiffres, n'est-ce pas?
    En fait, nous n'avons pas changé les chiffres.
    Ce qu'il faut bien comprendre aussi, c'est qu'en 2011, il y a eu un changement majeur, c'est-à-dire que nous avons dû utiliser un nouvel instrument. Vous vous en êtes peut-être rendu compte. Nous avons alors avisé les gens qu'il fallait être prudent quand on faisait des comparaisons historiques avec les données des recensements antérieurs, donc ceux de 2006 à 2011. Nous avons aussi validé les données obtenues en 2011 en les comparant à celles issues des recensements antérieurs.
    Il faut bien comprendre qu'un certain nombre de facteurs peuvent influer sur les résultats. Vous me parlez d'une augmentation de 150 % de la population anglophone. S'il y a 125 personnes dans une municipalité et que ce nombre passe à 250, évidemment, c'est une augmentation substantielle. Par contre, dans certains cas, cela peut être attribuable à toutes sortes de facteurs. Nous devons donc essayer d'analyser chacun des facteurs ayant pu influer sur les chiffres. Ce n'est pas aussi simple que de dire que nous avons constaté cette anomalie, mais que nous avons décidé de publier ces chiffres en nous disant advienne que pourra, en pensant qu'il y aurait bien quelqu'un pour s'en rendre compte. Ce que...
    Monsieur Corbeil, je m'excuse de vous interrompre, mais mon temps de parole est limité et le temps file. Je comprends l'idée en général.
    Qui a le droit de participer à vos séances d'information à huis clos, au moment de dévoiler les informations, afin de s'assurer de jeter un coup d'oeil à tout cela?
    Ces séances à huis clos, en fait, ne sont pas menées dans un contexte de validation des informations. Ce sont des séances au cours desquelles certaines personnes peuvent obtenir l'information avant les autres. Ces séances ont lieu le jour même de la diffusion des données et certaines personnes ont accès aux résultats.
    Je comprends. Je mentionne cela parce que je sais que le QCGN et la FCFA n'ont pas accès à ces séances à huis clos, et je me demande si cela ne devrait pas être révisé.
    Il y a autre chose. Comme on a pu le constater, le système que vous utilisez pour valider les chiffres avant de les publier a échoué, dans ce cas très précis. Je ne parle pas de manière générale, mais de ce cas bien précis. Quelles démarches allez-vous entreprendre pour ne pas qu’une telle erreur se reproduise au cours du processus de validation des données?
    Après avoir déterminé qu'une erreur s'était produite, vous avez pu compter sur un bon système qui a bien fonctionné. Plusieurs étapes ont été suivies, entre autres la vérification, la validation, l'analyse, la contre-vérification, l'examen par un groupe d'experts.
    Les mêmes étapes sont-elles franchies, en temps normal?
    Qu'est-il arrivé, dans ce cas précis? Dans le fond, pourquoi votre processus de validation n'a-t-il pas fonctionné dans ce cas particulier?
(1605)
    En temps normal, il y a des vérifications à toutes les étapes, que ce soit les systèmes informatiques, les résultats ou la production. Il y a une multitude d'étapes et nous les vérifions habituellement de manière systématique.
    Y a-t-il un groupe d'experts qui vérifie vos données dans différents domaines? Dans le cas qui nous occupe, soit celui des langues officielles, y a-t-il un groupe d'experts qui vérifie les données avant qu'elles ne soient rendues publiques?
    Pour la plupart des données, non, cela ne s'est pas fait antérieurement. Il faut dire que nous avons nous-mêmes beaucoup d'expertise dans plusieurs de ces domaines, et le recensement n'a pas beaucoup changé avec le temps. Nous avons beaucoup d'expertise quant aux différents changements au sein de la population d'un recensement à l'autre, dont celle de M. Corbeil et de son équipe en ce qui concerne les langues.
    Toutefois, nous avons beaucoup appris de cet exercice consistant à travailler avec un groupe d'experts qui a eu la possibilité d'examiner les données. C'est une pratique que nous voulons adopter pour progresser, c'est-à-dire faire appel à des gens du milieu, dans des domaines spécialisés, pour qu'ils nous donnent leur interprétation des résultats suffisamment tôt pour que nous puissions apporter des changements si quelque chose d'anormal est détecté.
    C'est donc une nouvelle procédure que vous êtes en train d'instaurer pour vous assurer que de tels résultats ne seront plus dévoilés avant une validation encore plus approfondie effectuée par un groupe d'experts, entre autres.
    Exactement.
    Cette méthode de validation un peu modifiée que vous allez entreprendre, est-ce du domaine public? Pouvez-vous nous en faire parvenir les détails? Qu'est-ce qui est public et qu'est-ce qui ne l'est pas? Y a-t-il des éléments auxquels nous pouvons avoir accès, en tant que comité?
    Dans le contexte des dernières diffusions, nous avons fait appel, par exemple, à certains de nos partenaires du fédéral, soit des ministères qui ont des expertises dans des domaines précis. Par exemple, en ce qui concerne les données sur le logement que nous avons diffusées le 25 octobre, nous avons travaillé avec la Société canadienne d'hypothèques et de logement pour étudier les données que nous étions à la veille de diffuser et vérifier s'il y avait une certaine crédibilité en ce qui a trait au parc de logements et aux différents paramètres qui s'y rattachent. Nous avons eu...
    Je m'excuse de vous interrompre, mais ce que je veux savoir, dans le fond, c'est si vous pouvez faire parvenir au Comité l'information au sujet de votre nouvelle méthode de validation des résultats.
     Oui, nous pourrons le faire.
    Nous pouvons sûrement vous en faire parvenir une description.
    Vous pourrez transmettre le tout à Mme la greffière et nous le distribuerons à l'ensemble des membres du Comité.
    Merci, monsieur Choquette.
    Merci beaucoup.
    C'est maintenant le tour de M. Darrell Samson.
    Merci, monsieur le président.
    Messieurs, je vous remercie de votre présentation.
    L'erreur n'est jamais simple, il n'y a pas de doute. Ce qui m'inquiète, toutefois, c'est qu'il y ait eu plusieurs erreurs. En effet, l'erreur principale était une mauvaise interprétation de la langue, comme vous le dites. Or il s'est produit d'autres erreurs au cours du processus, jusqu'à ce que l'information soit publiée. C'est ce qui est inquiétant. Que la première erreur se soit produite à l'interne, c'est une chose, mais qu'elle ait traversé quatre ou cinq étapes sans être remarquée avant que les données soient rendues publiques, c'en est une autre. La méthode d'analyse des données mérite d'être revue.
    On constate également à quelle vitesse une telle erreur peut causer des problèmes. Si ma mémoire ne me fait pas défaut, le bloquiste M. Beaulieu a déclaré, après avoir lu les données faisant état d'une grande augmentation, que l'anglais prenait le contrôle du Québec, ou quelque chose du genre. C'est toujours inquiétant.
    J'ai lu ce qu'a écrit un certain M. Éric Boucher, à savoir que c'est un peu bizarre que les gens qui travaillent à temps plein à un dossier ne soient pas en mesure de déceler de telles anomalies. Que répondez-vous à ce commentaire?
    Avant de commenter ce qu'a écrit M. Boucher, je peux vous répondre selon mon point de vue.
    Moi, je suis responsable du Programme du recensement à Statistique Canada, et un tel événement est dramatique pour tous les gens qui travaillent à mon projet. Personne n'est fier de cela. Nous prenons cela très au sérieux. Nous sommes très fiers du travail que nous faisons et nous comprenons parfaitement l'importance de cette information pour tous les utilisateurs de données et les implications qu'elles ont un peu partout dans la prise de décision. Nous n'avons pas pris cela à la légère. Nous avons travaillé vraiment très fort pour corriger cela et nous allons continuer de le faire pour éviter que cela se reproduise.
    L'erreur est humaine, cela peut arriver, mais nous ne prenons pas cela à la légère. Je peux vous assurer que nous investissons les efforts nécessaires pour nous assurer de l'intégrité des résultats du recensement.
    En général, tous nos programmes statistiques sont extraordinaires. Nous avons beaucoup appris de cette erreur et nous allons faire en sorte d'avoir des processus améliorés, même s'ils étaient très robustes avant, pour que cela ne se reproduise pas.
(1610)
    Si vous me le permettez, je ferai une petite comparaison concernant les Acadiens et les francophones vivant en situation minoritaire partout au Canada.
    Dans le cas qui nous occupe, de mauvaises données ont entraîné des résultats qui ont suscité énormément de questions. Ces données ne représentaient pas la réalité.
    Pourtant, cela fait 35 ans qu'il n'y a pas de résultats, exacts ou erronés, concernant les Acadiens et les francophones hors Québec en situation minoritaire, parce que le recensement ne comporte pas de questions permettant de faire le dénombrement des ayants droit définis à l'alinéa 23(1)b) et au paragraphe 23(2) de la Charte.
    Il a fallu une semaine pour que ces données erronées causent la panique, alors que, depuis 35 ans, il n'y a pas de données pour aider à augmenter la population francophone hors Québec. Moi, j'y vois un problème.
    Quels sont vos commentaires là-dessus?
    Le seul commentaire que je vais faire concerne l'erreur elle-même. Comme vous avez pu le voir dans la présentation, nous avons réagi aussi rapidement que possible, c'est-à-dire dès que nous avons su qu'il y avait un problème dans les données, justement parce que nous comprenons l'importance de cette information pour les utilisateurs et pour les communautés au Canada. Nous avons immédiatement retiré les données erronées et, dans un délai d'une semaine, nous avons apporté la correction appropriée et rediffusé les résultats validés.
    Je le répète, nous prenons très au sérieux l'importance de cette information pour les utilisateurs de données. Nous avons vraiment pris le taureau par les cornes dans ce cas-ci et apporté les corrections aussi rapidement que possible, tout en nous assurant qu'en corrigeant une erreur nous n'en créions pas une autre.
    Pour ce qui est des ayants droit, je crois que cela a été discuté lors de la dernière comparution de Statistique Canada. Nous allons revoir le processus pour déterminer comment faire face à cette situation dans la préparation du programme de 2021.
    Dans le cas des ayants droit, on cherche le taureau.
    Merci.
    J'ai terminé mes questions.
    Merci beaucoup.
    Je cède la parole à M. René Arseneault.
    Merci, monsieur le président.
    Je voudrais faire suite un peu à ce que M. Samson nous disait. Les erreurs font partie de la vie, et c'est par l'accumulation des erreurs qu'on acquiert de l'expérience.
    Le questionnaire est-il d'abord émis en langue anglaise et traduit par la suite? Comment cela fonctionne-t-il?
    Les questionnaires sont attribués à l'ensemble de la population en ligne. Les gens peuvent sélectionner la langue de leur choix.
    Non, mais je parle de la préparation du questionnaire.
    Ils sont automatiquement faits dans les deux langues.
    Oui, mais par quelle langue commence-t-on?
    Cela se fait vraiment dans les deux langues, en même temps.
    Vous voulez dire qu'il y a deux personnes assises de chaque côté d'une table et que l'une travaille sur le questionnaire en français sans regarder ce que l'autre fait?
    Cela dépend du contenu lui-même. Si les experts dans un certain domaine sont des francophones, ils vont travailler en français principalement et ce sera traduit en anglais par la suite. Si les experts dans un autre domaine sont anglophones, ce sera fait en anglais et traduit en français par la suite.
    À votre connaissance, avant même que la version officielle du questionnaire soit accessible au public pour qu'il y réponde, y a-t-il des discussions entre le ministère et tous les informaticiens ou autres personnes qui s'occupent du logiciel en vue de valider l'information?
    Comme je l'expliquais plus tôt, systématiquement, chaque étape est revue, encore et encore. Lorsque nous produisons un programme informatique, nous nous assurons qu'il remplit les fonctions pour lesquelles il a été conçu. De la même façon, lorsque nous concevons des questions et que nous les mettons à l'essai, nous voulons nous assurer que les Canadiens les comprennent et y répondent normalement. Le déroulement d'un recensement comprend des centaines d'étapes, depuis l'étape de la confection du questionnaire jusqu'à l'étape de diffusion des résultats, et nous revoyons toutes ces étapes une par une pour nous assurer de l'intégrité de l'ensemble du système.
(1615)
    Les deux versions sont-elles revues côte à côte?
    Le système fonctionne sur la base d'intrants et d'extrants. Il y a un intrant et il doit y avoir un extrant, et nous savons déjà ce que devrait être l'extrant. Normalement, dans ce système, nous allons vérifier à l'étape de l'extrant pour nous assurer que les résultats apparaissent comme il faut.
    Merci de vos réponses.
    Une erreur a été commise; cela arrive dans la vie. Vous avez tout le système nécessaire qui vous a permis de rectifier le tir assez rapidement. Ma principale inquiétude n'est pas celle-là. Pour faire suite à ce que disait M. Samson, je dirais que ma principale inquiétude demeure le dénombrement des ayants droit. Je sais que cela ne vous concerne pas aujourd'hui, monsieur Hamel. Cependant, monsieur Corbeil, nous vous avons reçu ici au moins trois ou quatre fois à ce sujet. Vous êtes quasiment un bon ami.
    Cela me concerne au quotidien, presque.
    Je ne sais pas si c'est bon signe. Il semble tellement difficile de faire ce qui, pour moi qui suis un néophyte en ce qui concerne Statistique Canada, apparaît tellement simple à faire de prime abord, soit un questionnaire. Il n'y a rien de plus simple que de faire un questionnaire, selon ma perspective.
    Bien sûr, je crains que, alors qu'on voudrait atteindre l'objectif des alinéas 23(1)a) et b) et du paragraphe 23(2) de la Charte, une telle erreur ne se reproduise dans le dénombrement des ayants droit. Cependant, je m'inquiète surtout de la mécanique pour arriver à faire ce fameux questionnaire pour les prochains recensements. Peut-être que M. Corbeil pourra répondre davantage à cela, mais je n'ai jamais été rassuré sur le fait que le questionnaire sera prêt à temps. Je conçois qu'il puisse survenir des erreurs entre les versions française et anglaise, mais ce sont des erreurs qui s'expliquent. D'ailleurs, vous l'avez bien expliqué. Ce qui m'importe, c'est de m'assurer que le prochain recensement nous permettra de dresser le véritable portrait des ayants droit définis à l'article 23 de la Charte. Cela est-il toujours possible?
    Comme nous l'avions mentionné, et je l'ai même réitéré lors de notre dernière comparution, je peux vous assurer que nous avons tout mis en oeuvre et que nous déployons tous les efforts et toutes les équipes nécessaires. Pas plus tard qu'hier, j'ai eu une rencontre avec des spécialistes de Statistique Canada, notamment des spécialistes en méthodologie. Nous sommes en train d'examiner les options. Nous avons un échéancier. Des rencontres sont prévues bientôt, à fin de novembre ou au début de décembre. Bien que nous n'ayons pas encore finalisé notre liste du comité consultatif, je peux vous dire que des ressources sont dédiées exclusivement à ce processus. Je peux vous garantir que nous fournissons toutes les énergies et tous les efforts nécessaires pour parvenir à un dénombrement des ayants droit.
    D'accord, mais est-ce qu'on va y parvenir?
    C'est mon souhait le plus cher; c'est tout ce que je peux vous dire. Nous allons tout mettre en oeuvre pour que cela se produise.
    Votre bureau a-t-il fixé une date butoir, si vous n'arrivez pas à vous entendre sur la façon de poser les questions ou d'interpréter les résultats des tests? Je pense que vous testez un peu les questions auprès d'une partie de la population, n'est-ce pas? Y a-t-il une date butoir après laquelle vous estimez que, si vous n'êtes pas prêts, ce sera trop tard et cela va encore attendre au recensement suivant?
    Nous n'en sommes pas à cette étape en ce moment.
    Vous disposez encore de temps?
    Nous allons tester quelques versions de questions pour trouver toutes celles qui fonctionnent bien.
    En êtes-vous à l'étape où vous pourriez proposer un brouillon de la partie du questionnaire qui porterait sur le dénombrement?
    Non, mais nous avons déjà soumis aux membres du Comité les questions posées lors d'enquêtes précédentes. Nous en sommes maintenant à déterminer de quelle façon nous pourrions les intégrer. Cependant, nous devons d'abord passer par le test du recensement et faire des tests qualitatifs. Il faut poser les questions à des gens qui sont présents pour nous assurer qu'ils les comprennent correctement.
    Le processus suit son cours. Je peux vous assurer que nous suivons notre échéancier et que notre but est d'atteindre les objectifs.
     À ce sujet, je pense que nous avons adopté une motion dans laquelle nous vous demandions de nous présenter d'ici le mois de mars prochain des modèles de questions relativement à l'article 23 de la Charte.
    Absolument.
    Pour ma part, j'aimerais bien voir le questionnaire. Je crois que c'est la même chose pour les autres membres du Comité.
    Ce n'est pas une critique négative que j'émets, mais, selon moi, Statistique Canada est devenu un monstre bien compliqué, alors qu'à la base, les choses me paraissaient simples. Je sais qu'il s'agit d'une expertise en soi, tandis que je suis un néophyte. Quoi qu'il en soit, ces questions sont primordiales.
    La première fois que nous vous avons rencontré, monsieur Corbeil, vous ne m'avez pas rassuré à cet égard. Tout cela semblait tellement compliqué.
    Ce l'est.
    Vous ne pensiez même pas être en mesure d'y arriver.
    Ce n'est pas parce que c'est complexe que ce n'est pas faisable.
    Merci beaucoup.
    Je voudrais remercier M. Arseneault, le néophyte, avant de passer à M. Clarke.
    Merci, monsieur le président.
    Bonjour à vous, messieurs.
    Pour commencer, me diriez-vous en quelle année a été fondé Statistique Canada?
(1620)
    Attendez un instant. En 1992, le Bureau fédéral de la statistique avait été créé 75 ans auparavant. Nous pouvons donc ajouter 25 ans.
    Si on fait le calcul à partir de la création du Bureau fédéral de la statistique, cela fait un bon nombre d'années.
    Combien d'employés avez-vous, à l'heure actuelle?
    Nous en avons environ 5 000.
    Quel est votre budget annuel?
    Je ne pourrais pas répondre à cette question à brûle-pourpoint.
    Avez-vous des divisions ou des sections?
    Nous produisons de l'information sur pratiquement tout ce que vous pouvez imaginer, qu'il s'agisse de tubes électriques, de poulets congelés, d'immigrants, de femmes enceintes ou d'autres sujets. Nous fournissons énormément d'information.
    Il y a vraiment beaucoup de divisions. Celles-ci peuvent être à caractère économique, social, environnemental ou autres. Je pense que nous comptons plus de 55 divisions.
    Certaines d'entre elles sont axées précisément sur la science des enquêtes, par exemple la méthodologie, l'échantillonnage, et ainsi de suite.
    C'est justement ce qui me rend un peu perplexe. J'imagine que, dans l'une ou l'autre de vos divisions, il y a des experts en linguistique et en méthodologie.
    Ne mettez-vous pas systématiquement en oeuvre certains mécanismes avant de publier un rapport?
    Celui-là touchait peut-être beaucoup plus que la linguistique; je ne le sais pas, je n'ai pas vu le rapport. Quoi qu'il en soit, selon moi, il serait nécessaire et naturel que les chiffres de chaque rapport soient vérifiés rapidement par un expert attitré dans chacune des divisions concernées. Vous me direz peut-être que ce serait vraiment une tâche exhaustive. Cependant, un expert en linguistique aurait sans doute vu immédiatement que les données linguistiques du Québec pour 2016 étaient erronées. Il aurait pu vous appeler et vous dire qu'il y avait un problème.
    N'appliquez-vous pas un tel processus systématiquement?
    En gros, les choses se déroulent comme vous venez de le décrire. Chaque domaine d'expertise revoit les parties qui lui sont propres, qu'il s'agisse de la méthode, de l'informatique, des experts des sujets matières ou encore des gens qui créent les tableaux destinés à figurer sur le Web ou les divers outils. Chacune des équipes revoit sa partie. Nous avons aussi des processus de revue de l'ensemble. Les choses se déroulent exactement comme vous l'avez décrit.
     Est-ce à dire que le rapport qui comprenait des données erronées sur la présence importante d'anglophones a été revu par un linguiste?
    Ce n'est pas exactement un linguiste.
    Il pourrait s'agir à tout le moins d'un expert en sciences sociales, en science politique ou en anthropologie, par exemple.
    Ce sont effectivement des gens spécialisés en démographie linguistique. Il faut aussi savoir que...
    Avez-vous imposé une certaine discipline? Je vous pose la question en toute bonne foi. Comme votre institution compte 5 000 employés, j'imagine qu'une certaine forme de discipline est appliquée selon un modèle de pyramide.
    Nous vivons présentement dans une société où les responsables ne sont pratiquement plus jamais mis au au banc des accusés. Cela crée certains problèmes au sein de notre culture et ne donne pas le bon exemple aux jeunes. Nous sommes vraiment dans une société de non-responsabilisation.
    Allez-vous tenter de déterminer si une division, voire un employé en particulier, n'aurait pas fait son travail de révision?
    Vous n'êtes pas celui qui est visé, monsieur Hamel. Comme vous êtes le directeur général, on peut supposer que ce n'est pas vous qui avez fait la révision. J'imagine cependant que vous avez potentiellement le pouvoir, vous ou encore le statisticien en chef, de congédier des gens.
    Prévoyez-vous appliquer une discipline quelconque, de façon concrète? Concernant l'erreur qui a été découverte, s'il s'avère que des experts n'ont pas fait leur travail, vont-ils être réprimandés?
    Dans un cas comme celui-là, nous ne parlons pas des individus, mais bien des processus. Si chaque fois que quelqu'un commettait une erreur il était congédié, plusieurs employés seraient congédiés.
    C'est quand même...
    Les erreurs sont rares. Les processus sont construits de façon à ce que, en cas d'erreurs, nous les découvrions avant la diffusion des données. Dans ce cas-ci, les erreurs n'ont pas été découvertes avant la diffusion.
    Dans le cadre de mes responsabilités, je veux m'assurer que les processus systématiques ou individuels qui devraient être en place et les modalités qui devraient être suivies pour arriver à un résultat sont suivis comme il faut.
    Nous avons déjà fait une revue de ces processus et il est évident que nous allons apporter des correctifs. Nous avons déjà apporté les correctifs appropriés pour éviter que ce genre de situation se reproduise.
    Suis-je en mesure de vous dire aujourd'hui que cela n'arrivera pas de nouveau au cours des 100 prochaines années? Absolument pas. Comme nous l'avons mentionné, l'erreur est humaine.
(1625)
    Je comprends.
    Nous ne prêchons pas la nonchalance. Nous allons continuer à nous assurer que tous les processus systématiques sont en place pour éviter ce genre de situation.
    Il serait peut-être bien d'envoyer aux 5 000 employés une lettre qui leur demande, de manière diplomatique et positive, de redoubler de vigilance, parce que cela ne doit pas arriver de nouveau.
    Nous ne jugeons personne et nous ne visons personne. Cela dit, j'ai déjà fait partie de l'armée et, dans ce milieu, on ne niaise pas. Une discipline s'instaure très rapidement. Quand on fait la guerre, cela fonctionne. Quand cela ne fonctionne pas, c'est parce que l'État ne fournit pas les ressources suffisantes.
    Le recensement est fait par l'entremise de systèmes informatiques depuis toujours, j'imagine. Vous avez parlé du Bureau fédéral de la statistique, qui existait avant Statistique Canada. Pour des questions aussi importantes que les questions linguistiques, qui peuvent contribuer directement au bien-être ou nuire au bien-être d'une collectivité quelconque au Canada, qu'elle soit francophone ou anglophone, ne serait-il pas mieux de faire le travail à la mitaine?
    Je sais que ce que je viens de dire est extrême. Cependant, je suis conservateur et je déteste les machines.
    Des voix: Ah, ah!
    C'est pourtant toi le plus jeune.
    En passant, de toute ma vie, c'est le premier téléphone cellulaire que je possède.
    Lorsqu'il s'agit de questions aussi importantes, le travail ne devrait-il pas être fait à la mitaine? Est-il obligatoire d'utiliser un système informatique?
    Nous vivons dans un monde d'automatisation. Dans le cas d'un exercice comme celui du recensement, qui touche 36 millions de personnes dans toutes sortes de communautés et de domaines, il y a des avantages énormes à automatiser nos processus.
    J'avoue que ce serait un travail extrême.
    Au Canada, le recensement est très complexe. Cette automatisation nous permet de faire des choses qui, autrement, ne seraient pas possibles. Nous avons parlé des questions au sujet des ayants droit. Si nous n'avions pas des façons d'optimiser l'utilisation de la technologie pour même considérer poser ces questions, il ne serait pas possible de le faire.
    Il y a plus d'avantages que de désavantages à utiliser des systèmes automatisés. Il va de soi que, ce faisant, il incombe à l'organisation de s'assurer que les systèmes fonctionnent de la manière prévue.
    Merci, monsieur Clarke.
    J'ai un commentaire à faire avant de passer au prochain intervenant.
    En ce qui concerne le système de paie Phénix, on nous a dit que des erreurs s'étaient produites parce que c'était un nouveau système. Par contre, le vôtre n'est pas un nouveau système. J'ai de la misère à m'expliquer comment, après tant d'années, ce genre d'erreur peut se produire.
    Certains des systèmes ne sont pas nouveaux, mais certains des systèmes doivent être rebâtis à chaque recensement parce que nos questionnaires changent. Nous devons alors apporter les correctifs nécessaires à ces systèmes pour refléter le fait que les questionnaires ont été mis à jour.
    Il y a beaucoup de manipulation et de transfert de données pour nous assurer que, au bout du compte, nous avons des données de grande qualité. Il y a plusieurs étapes: compilation et résultats pour les Canadiens, certification, et ainsi de suite. La plupart de ces étapes sont accomplies de façon automatisée. Lorsque ce n'est pas possible, elles sont faites de façon manuelle. Alors, il y a quand même des parties du travail qui sont effectuées de façon manuelle.
    Dans un cas comme celui-là, alors que le Canada compte 5 000 municipalités et que des dizaines de variables différentes peuvent être croisées, nous allons chercher des façons automatisées de faire ces croisements. S'ils étaient faits à la mitaine, cela pourrait nous prendre des années.
    Nous essayons aussi de voir si nous pouvons détecter des anomalies dans les données avant de les diffuser. Encore là, une fois la leçon apprise, nous allons rendre ces systèmes plus rigoureux et plus intelligents pour éviter que la situation ne se répète.
    Merci.
    Monsieur Vandal, vous avez la parole.
    Vous avez mentionné que le problème s'était produit dans quelques milliers de cas hors Québec. Quel est le chiffre, au juste?
    Je n'ai pas le chiffre exact, mais c'est entre 2 000 et 3 000 cas. Si ma mémoire est bonne, il s'agit de 2 500 cas.
    Est-ce que l'erreur a été corrigée dans tous ces cas?
    Oui, absolument. Tout a été corrigé. Comme mon collègue M. Hamel l'a dit, nous avons révisé de fond en comble tous les processus. Les données ont été traitées à nouveau par les programmes et nous avons fait toutes les vérifications nécessaires.
    Je vous demande cela parce que, au Manitoba, le nombre de personnes ayant indiqué avoir le français comme langue maternelle a diminué de 2 000. Je me demande s'il n'y a pas un lien à faire.
    Mercredi dernier, le 25 octobre, nous avons diffusé les données sur l'immigration. Un des éléments qui sont ressortis, c'est une diminution du nombre d'immigrants récents de langue française à l'extérieur du Québec.
    Il y a aussi la mobilité interprovinciale. On voit très bien qu'en Alberta, la population de langue française s'est accrue de presque 6 000 personnes, ce qui est attribuable à la fois à l'immigration et à la migration interprovinciale, notamment en provenance du Québec.
    Plusieurs facteurs peuvent influer sur l'évolution de la population, dont celle des francophones du Manitoba.
(1630)
    Merci.
    Merci, monsieur Vandal.
    Monsieur Généreux, vous avez quatre minutes.
    Merci, monsieur le président.
    Statistique Canada compte 5 000 employés. Ce ministère a-t-il des fournisseurs en ce qui concerne les systèmes informatiques, l'analyse des données ou d'autres éléments de cet ordre? Est-ce qu'une partie du travail est faite à l'extérieur du ministère?
    Une partie du travail peut être faite par des fournisseurs, mais pas à l'extérieur du ministère. Les données ne quittent jamais Statistique Canada. La confidentialité des résultats et de l'information fournie par les Canadiens est protégée en tout temps.
    Pour les domaines dans lesquels nous n'avons pas nous-mêmes l'expertise, par exemple les technologies informatiques de pointe, il est possible que des fournisseurs travaillent avec nous pour mettre au point des systèmes.
    Dans le contexte de l'erreur qui vient de se produire, un sous-traitant pourrait-il être impliqué directement ou indirectement?
    Dans ce cas-là, non, je ne le crois pas.
    En avez-vous la certitude?
    Ce sont des systèmes qui ont été mis au point ou modifiés à l'intérieur de Statistique Canada. Un système peut avoir été acheté à un fournisseur à un moment donné, mais le code source est repris par Statistique Canada. C'est nous qui nous nous occupons de faire les ajustements.
    Selon ce que j'ai compris, vous faites une partie du travail lié aux systèmes créés pour vous et vous en confiez une autre partie à des sous-traitants. Est-il déjà arrivé que des erreurs aient été attribuables à des fournisseurs de l'extérieur qui participaient à vos travaux?
    Je vais faire un parallèle entre ceci et le système Phénix. On sait qu'il y a un gros problème lié à ce logiciel. La même chose pourrait-elle se produire à Statistique Canada?
    Je ne me souviens d'aucun cas où des erreurs étaient attribuables à des fournisseurs avec lesquels nous avions fait affaire.
    Vous vous souviendrez peut-être qu'une partie de nos systèmes de traitement de données a été fournie par Lockheed Martin en 2006. Depuis ce temps, nous avons repris le contrôle de ces systèmes. Certains de nos systèmes de traitement sont les mêmes que ceux achetés en 2006, mais il n'y a plus de fournisseurs de l'extérieur qui travaillent sur ces systèmes.
    On est rendu en 2017. Considérez-vous que les instruments dont vous disposez aujourd'hui sont à jour pour répondre à vos besoins? Je vous pose la question de manière tout à fait non partisane.
    Absolument. Je peux vous dire aussi que nous appliquons la même rigueur dans la revue des données, que les systèmes aient été conçus à l'intérieur du ministère ou à extérieur, afin de nous assurer qu'ils font ce qu'ils sont censés faire.
    Merci beaucoup.
    Monsieur Choquette, vous avez la parole.
    Merci, monsieur le président.
    Si ma mémoire est bonne, vous avez commencé à parler du changement de la question sur la langue maternelle en 2011.
    Non. Tout ce que j'ai dit, c'est qu'en 2011, les questions comprises dans le questionnaire long portant sur la langue parlée à la maison et sur la connaissance des langues officielles ont migré vers le questionnaire court, en raison des obligations légales découlant de la mise en oeuvre du règlement.
    N'y a-t-il pas eu un changement dans le calcul?
    Non, pas du tout. Nous procédons exactement de la même façon depuis très longtemps.
    Pourquoi avez-vous dit tantôt qu'on ne pouvait plus comparer les nouvelles données avec les données historiques? Comprenez-vous ce que je veux dire?
    Oui.
    Il faut comprendre que l'ordre dans lequel nous plaçons les questions et le contexte dans lequel elles sont posées peuvent avoir une incidence sur les réponses. En 2006, par exemple, les questions sur la langue suivaient toutes celles sur la diversité ethnoculturelle, c'est-à-dire le statut d'immigrant, la citoyenneté, et ainsi de suite. En 2011, les questions sur la langue ont migré vers le questionnaire court, de sorte qu'aucune question sur la diversité ethnoculturelle ne précédait les questions sur la langue. Cela a pu amener des gens à répondre différemment.
    Avant, quand la question sur la langue maternelle était posée isolément dans le questionnaire court, on sous-estimait d'environ 20 % les langues non officielles au Canada. Cependant, quand on plaçait la question sur la langue maternelle complètement à la fin du questionnaire, les gens comprenaient bien ce qu'on cherchait à savoir, c'est-à-dire la première langue apprise à la maison dans l'enfance.
(1635)
    Vous avez donc amélioré la situation.
    Effectivement, nous avons amélioré la situation à partir de 1991. Cela s'est traduit par une baisse très importante du nombre de personnes qui déclaraient plusieurs langues comme langue maternelle. Les gens étaient plus à même de comprendre que, au-delà de leur demander de déclarer les langues qu'elles connaissaient, on recherchait à savoir quelle était la première langue apprise à la maison dans l'enfance. Cela n'a pas empêché d'avoir des réponses multiples, mais ce nombre a diminué de façon importante.
    Ce processus a-t-il été fait en consultation avec le QCGN et la FCFA?
    À l'époque, le QCGN n'existait pas. C'était en 1991.
    Cela date d'aussi loin? Ce n'est pas récent?
    Non, ce n'est pas du tout récent.
    En fait, nous avions fait des études très poussées, notamment des enquêtes de couverture. Nous étions carrément allés voir les gens et nous leur avions soumis un questionnaire différent pour nous assurer qu'ils comprenaient bien les questions. C'est ce qui nous avait amenés à changer l'ordre des questions. En procédant de la sorte, nous obtenions des informations de meilleure qualité.
    Pouvons-nous comparer les statistiques que nous avons présentement avec des statistiques plus anciennes, ou s'agit-il vraiment de nouvelles statistiques qui ne peuvent plus êtres comparées avec les anciennes?
    Dans l'ensemble, nous disons que ce sont effectivement des données de bonne qualité. Toutefois, nous avons très bien observé, entre 2006 et 2011, par exemple, une forte croissance des réponses multiples. Nous nous sommes rendu compte, en appariant les fichiers, que des gens qui avaient donné deux ou trois réponses lors d'un recensement en avaient donné seulement une lors du recensement suivant.
    Nous avons dit qu'il fallait être prudent lorsqu'on comparait des données récentes avec des données de recensements antérieurs, parce qu'en 2011, l'outil a changé. Les questions sur la langue sont maintenant dans le questionnaire court, et cela peut influer sur la façon dont les gens répondent.
    Poser une question dans un questionnaire peut sembler simple, mais il faut savoir que l'emplacement de la question dans le questionnaire peut entraîner des changements considérables, selon les communautés ou les questions.
    Je suis sûr que vous le ferez, mais je veux simplement m’assurer que, dans le processus de changement des questions en vue de procéder au dénombrement des ayants droit, vous allez acquiescer à notre demande et consulter les organismes comme la FCFA et le QCGN, qui représentent toutes les communautés de langue officielle partout au pays. Je pense qu'il est important de s'assurer que leur point de vue est entendu.
    Absolument.
    Je vous remercie.
    Merci beaucoup, monsieur Choquette.
    Cela met fin à la séance.
    Messieurs Hamel et Corbeil, je vous remercie grandement de votre présentation, de vos réponses et de vos commentaires relatifs aux questions soulevées par les membres du Comité.
    Nous allons suspendre la séance pendant quelques minutes. Par la suite, nous passerons à huis clos afin de discuter des travaux du Comité.
    [La séance se poursuit à huis clos.]
Explorateur de la publication
Explorateur de la publication
ParlVU