Le centre d'accès sécurisé aux données de la statistique publique française : un nouvel outil pour les chercheurs
En 2010, l'Insee a mis en place un nouveau dispositif d'accès aux fichiers individuels de la statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d'accès sécurisé distant » (accéder à des données individuelles selon une procédure très réglementée)
Cet article en donne une présentation générale.
http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf
CASD -données statistique publique française insee mai 2011 (http://www.insee.fr/fr/ffc/docs_ffc/cs130e.pdf)
1. Le centre d’accès sécurisé aux données
de la statistique publique française :
un nouvel outil pour les chercheurs
!Jean-Pierre Le Gléau * et Jean-François Royer **
En 2010, l’Insee a mis en place un nouveau dispositif d’accès aux fichiers individuels de la
statistique publique, essentiellement à destination des chercheurs : le CASD, « centre d’ac-
cès sécurisé distant ». Rendu possible par l’évolution récente de la loi de 1951 sur le secret en
matière de statistiques, il permet d’accéder à des données individuelles selon une procédure
très réglementée. Cet article en donne une présentation générale.
L
a protection de la confiden- pression pour que ces désagrégations c’est-à-dire en pratique des données
tialité des données recueillies soient de plus en plus fines est allée sur des entreprises ou des établisse-
à des fins d’établissement de en croissant au fil des années, au fur et ments - la loi de 1951 a dès l’origine
statistiques est un des principes ma- à mesure du progrès des techniques et prévu la possibilité de dérogations
jeurs de la statistique publique. Dès des outils d’analyse statistique dans au secret statistique. Depuis 1984,
1951, la loi organisant la statistique de nombreux secteurs de la société. de telles dérogations sont possibles
publique en France 1 comprenait le Or, au-delà d’un certain niveau de sous réserve d’un passage devant un
mot « secret » dans son titre. Dans le détail dans les croisements, le secret comité spécialisé rattaché au
code de bonnes pratiques de la statis- statistique ne peut plus être respecté, Conseil national de l’information
tique européenne publié en 2005, le car les « cases de tableaux » révèlent statistique (Cnis), le comité du secret
secret statistique figure au principe en fait des informations individuelles. statistique. Celui-ci examine le
n° 52. Il convient en effet de pouvoir Cette contradiction est devenue parti- bien-fondé de la demande, évalue la
assurer aux personnes répondant à culièrement apparente dans les nécessité d’avoir recours à des infor-
une enquête que leurs réponses ne travaux des chercheurs. La commu- mations individuelles, juge le
pourront en aucun cas être utilisées nauté des chercheurs en sciences sérieux du demandeur et la capacité
de façon à leur porter préjudice. humaines et sociales a depuis long- de l’organisme auquel il appartient
C’est pourquoi la préservation du se- temps fait valoir son besoin d’accéder et qui soutient sa demande à respec-
cret statistique constitue une disposi- à des informations individuelles pour ter en pratique les contraintes liées
tion majeure de la loi fondamentale effectuer des travaux de plus en plus au respect du secret statistique. En
de la statistique française. complexes. Ces travaux ne nécessi- cas d’avis positif, le demandeur peut
Pendant longtemps cette exigence tent pas, en général, de connaître avoir accès aux données, après
n’a pas été ressentie comme une forte nommément la personne ayant signature individuelle par chaque
gêne par les utilisateurs de la statis- répondu à l’enquête. Mais les cher- bénéficiaire d’un engagement à
tique publique. Ceux-ci se conten- cheurs ne peuvent plus se contenter respecter les règles du secret statis-
taient de résultats globaux des de disposer de résultats agrégés. Le tique. Il faut souligner que cette
enquêtes ou de résultats désagrégés développement de la théorie et des possibilité, qui en pratique bénéficie
selon des catégories prédéfinies (acti- outils économétriques, conjugué à à des équipes de recherche et à des
vités, professions, lieux) sans que la celui de la puissance des instruments administrations publiques, ne leur est
diffusion de ces résultats porte de calcul ouvre de multiples possibi- pas réservée par la loi.
atteinte au secret. Cependant, la lités fondées sur l’analyse de données
individuelles, que les chercheurs sont Dans le cas des « données relatives
impatients d’explorer. aux faits et comportements d’ordre
* Chef du département de la coordination statistique à
l’Insee
privé» - c’est-à-dire en pratique des
** Chercheur au Crest-Insee Accès à des données données sur des personnes ou des
1. Loi n° 51-711 du 7 juin 1951 sur l’obligation, la co-
ordination et le secret en matière de statistiques
individuelles : la situation ménages - la loi de 1951 ne prévoyait
2. « Le respect de la vie privée ou du secret des affaires entre 1951 et 2008 à l’origine aucune dérogation et,
des fournisseurs de données (ménages, entreprises, ad- jusqu’en 2008, aucune communica-
ministrations et autres répondants), la confidentialité des
Dans le cas de renseignements indivi- tion de renseignements individuels
informations qu’ils communiquent et l’utilisation de cel-
les-ci à des fins strictement statistiques doivent être ab- duels relatifs à des « données à carac- n’était possible. Seule la communica-
solument garantis ». tère économique et financier » - tion de fichiers anonymisés était licite.
Courrier des statistiques n° 130, mai 2011 1
2. Le centre d'accès sécurisé aux données de la statistique publique française
Pour répondre à la demande de plus secret statistique, dont la compétence Le recours à un centre
en plus pressante des chercheurs, a donc été étendue. d’accès sécurisé
l’Insee a créé en 2006 les « fichiers de
production et de recherche » (FPR), La procédure suppose, après l’avis du Depuis 2008, la loi rend donc
fichiers individuels, présentant une comité du secret statistique, l’accord possible la c ommunication d e
observation par individu enquêté, du service dont émanent les docu- données statistiques sur les personnes
mais où l’on a au préalable supprimé ments avant la décision formelle de ou les ménages à des chercheurs.
toutes les variables permettant l’identi- communication par la direction des Mais l’impératif de protection des
fication directe ou indirecte des archives. Pour ce qui le concerne, répondants continue à s’imposer à
personnes : nom, adresse, profession l’Insee a informé le comité du secret tous, et particulièrement aux institu-
et nationalité détaillées, identification statistique, lors de sa séance du tions statistiques. C’est pourquoi
de l’employeur pour les salariés, etc. 6 octobre 2009, des conditions qu’il l’Insee a choisi de recourir à un
Ces FPR sont mis à la disposition des mettrait pour donner cet accord : « centre d’accès sécurisé » pour
chercheurs via le réseau Quetelet, mettre en œuvre les nouvelles dispo-
avec lequel l’Insee a signé une - pour les services statistiques minis- sitions permises par la loi.
convention précisant les modalités de tériels (SSM), qui ont dans leur
mise en œuvre du dispositif. Cette mission de gérer des dossiers couverts Qu’est-ce qu’un centre d’accès sécu-
disposition a permis de satisfaire un par le secret statistique, les fichiers risé ? C’est un dispositif technique
grand nombre de demandes des cher- seront transmis sous réserve de la permettant à des utilisateurs autorisés
cheurs pour l’accès à des données production par eux d’un document de travailler sur des données confi-
individuelles, et elle reste d’une attestant qu’ils se sont bien dotés des dentielles tout en s’assurant que ces
grande utilité. moyens pour faire respecter le secret données ne risquent pas d’être
statistique et que leur équipement détournées pour d’autres fins, acci-
Cependant, il existe un ensemble de informatique présente bien l’étan- dentellement ou intentionnellement.
demandes, légitimes du point de vue chéité suffisante par rapport à celui En matière de données statistiques, la
scientifique, qui ne peuvent trouver du reste du ministère ; création des premiers centres d’accès
leur satisfaction dans la mise à dispo- sécurisés destinés à la recherche
- pour les autres demandeurs, l’accès
sition des FPR. Ce sont les projets de remonte aux années 1990 aux USA et
aux données se fera par le biais d’un
recherche qui nécessitent un détail au Canada. En Europe, des pays du
centre d’accès sécurisé ;
géographique, par nationalité ou par Nord (Danemark, Pays-Bas) ont créé
profession non disponible dans les - dans ces deux cas, les fichiers auront de tels centres au début des années
FPR3, ou qui font appel à un apparie- été, si nécessaire, transformés pour 2000. Ils ont été rejoints par la
ment avec d’autres fichiers, par perdre leur caractère directement Grande-Bretagne, puis l’Allemagne,
6
exemple en couplant, grâce à l’identi- nominatif ; c’est-à-dire qu’on y aura au milieu de cette décennie .
fiant de l’employeur, des caractéristi- retiré, le cas échéant, le nom du
ques de l’enquêté et de l’entreprise répondant et le NIR (numéro d’ins- Les premiers centres d’accès sécuri-
dans laquelle il travaille. L’accès à ces cription au répertoire - le numéro de sés à des données statistiques ont été
informations rompt nécessairement la Sécurité sociale) ; des centres « physiques »,
l’anonymat et était, de ce fait, impos- c’est-à-dire des locaux gérés par
- pour les demandes d’accès à des
sible jusqu’en 2008. une institution statistique (éventuel-
documents directement nominatifs,
lement à l’intérieur d’une universi-
l’accord ne pourrait être donné que
té, comme au Canada) et contenant
dans le cas de la constitution d’un
Les évolutions issues de un serveur de données. Dans ces
échantillon pour une enquête de la
la loi de 2008 concernant locaux, l’institution statistique
statistique publique ayant obtenu un
les données sur les ménages donne au demandeur un accès
visa5 sous réserve de l’accord expli-
physique directement sur le serveur.
cite, au cas par cas, du comité de
En 2008, la modification de la loi Cela implique que le demandeur se
direction de l’Insee.
statistique de 1951 par un article de la déplace pour travailler en dehors de
4
loi sur les archives a ouvert la possi- son environnement habituel. Cette
bilité d’accéder à des renseignements solution exige aussi l’aménagement
3. Afin de rendre les FPR totalement anonymes, certai-
indiv idue ls re la tifs a u x fa its e t nes variables géographiques, sur la nationalité ou la de locaux spécifiques (éventuelle-
comportements d’ordre privé sous profession sont supprimées (code commune) ou re- ment en plusieurs points du terri-
groupées en un petit nombre de modalités.
deux conditions : 4. Loi n°2008-696 du 15 juillet 2008 relative aux ar-
toire) matériellement sécurisés
chives, article 2 (portes, fenêtres) dont la surveil-
- l’une liée à la finalité : cette commu- 5. Ce visa est attribué par le ministre chargé de lance est confiée à une personne
nication n’est possible qu’à des fins l’économie et le ministre à la compétence duquel res-
sortissent les intéressés. assermentée. C’est la solution
de statistique publique ou de
6. Pour un panorama, on pourra consulter dans le retenue au Canada et en Allemagne.
recherche scientifique ou historique ; Courrier des statistiques n°121-122 de décembre
Elle est très coûteuse, aussi bien
2007 : « L’accès aux micro-données et la gestion de la
- l’autre liée à la procédure : celle-ci confidentialité dans quelques INS européens » par pour l’Institut de statistique que
exige en effet un avis du comité du Dominique Rouault. pour les chercheurs.
2 Courrier des statistiques n° 130, mai 2011
3. Jean-Pierre le Gléau et Jean-François Royer
Grâce aux progrès de l’informatique, d’économie et statistique, établisse- chercheur qui estime qu’il ne peut
on a vu apparaître depuis 2005 des ment public qui était jusqu’à fin 2010 pas s’en contenter et qu’il a besoin
« centres d’accès sécurisés distants » une direction de l’Insee). Elle consiste des fichiers complets doit à ce stade
(CASD) n’imposant plus aux cher- à mettre à disposition de l’organisme bien préciser pourquoi certaines
cheurs de se déplacer dans un endroit demandeur, un terminal appelé « SD variables lui manquent encore :
particulier. Ce sont des systèmes Box » pour lui permettre de se c’est l’information cruciale qu’il
informatiques dans lesquels les connecter et de travailler sur le devra fournir au comité du secret
données restent stockées sur un serveur installé au Genes. Cette « SD statistique. Pour cette phase d’éla-
serveur unique, géré par l’institution Box » permet au chercheur de voir boration, le chercheur devra impé-
statistique, mais sur lequel les cher- les données sur lesquelles il travaille, rativement prendre contact avec le
cheurs peuvent travailler à distance, de les intégrer dans ses calculs et d’en service producteur, de façon à bien
sans risque de dissémination. Il peut tirer des tableaux, graphiques, analy- cerner sa demande et à vérifier qu’il
s’agir seulement de pouvoir ses. Mais à aucun moment il ne peut a pris connaissance de tous les
soumettre des travaux à distance ni les imprimer, ni les enregistrer sur fichiers auxquels il peut avoir
(« remote submission »), les résultats un support quelconque : clef USB, accès, de leurs possibilités et aussi
étant récupérés de façon différée ; ou CD Rom... Ainsi, les données ne quit- de leurs limites.
bien il peut s’agir d’un véritable accès tent jamais le serveur du Genes. La
« en ligne » (« remote access ») c o m m u n ic a tio n e n tr e c e tte Le chercheur présente ensuite sa
permettant au chercheur une forte « SD Box » et le serveur est assurée demande au comité du secret statis-
interactivité avec les données. Dans par une liaison sécurisée et cryptée. tique : le secrétariat du comité
ce dernier cas, le chercheur distant (comite-secret@cnis.fr) peut lui fournir
travaille réellement « sur le serveur » Cette solution a commencé à fonc- toutes les indications nécessaires. Le
de l’institution statistique, mais le tionner début 2010, et à ce jour une comité du secret statistique se réunit
logiciel de sécurisation des données trentaine de projets de recherche en une fois par trimestre et donne un avis ;
l’empêche de les exporter. bénéficient. Les deux paragraphes qui il opère comme cela a été décrit précé-
suivent décrivent plus en détail le demment pour les données sur les
cheminement d’un projet de entreprises. S’ajoutent cependant,
La solution retenue recherche qui a recours à ce dispositif. dans les critères à prendre en compte,
par l’Insee ceux de la finalité du traitement qui ne
peut être, pour les données sur les
Phase préparatoire : connaître
Pour les demandeurs autres que les ménages, que la statistique publique
les données, explorer
SSM, l’Insee a donc choisi la solution du ou la recherche scientifique ou histo-
les moyens d’accès, faire
passage par un centre d’accès sécurisé rique. La présence du chercheur à la
les formalités administratives
distant en « remote access », où les séance du comité est nécessaire pour
données, les métadonnées et les Concrètement, un chercheur qui que ses membres puissent recevoir les
programmes d’utilisation restent donc souhaite accéder à des données indi- éclaircissements et les assurances
sur un serveur central unique géré par viduelles sur les ménages produites nécessaires.
l’institution statistique ou sous son par l’Insee ou par un SSM doit tout
contrôle. Techniquement, cette solution d’abord prendre connaissance de la En cas d’avis favorable du comité du
aurait pu être mise en œuvre en instal- source statistique dont ces données secret statistique, le chercheur peut
lant un logiciel gérant la confidentialité peuvent être tirées, et des différents consulter les données sur le centre
(interdisant entre autres toute recopie ou produits de diffusion de cette source. d’accès sécurisé distant. Un certain
impression des données examinées) sur Pour cela, ce chercheur dispose de délai est cependant nécessaire pour
chaque poste de demandeur. C’est la deux ressources documentaires prin- d’une part mettre en place les
solution retenue aux Pays-Bas. Elle cipales : le site Internet de l’Insee données que le chercheur est autorisé
implique une adaptation de ce logiciel à (www.insee.fr) (ou celui du SSM), à traiter, d’autre part accomplir les
chaque configuration des ordinateurs ; riche en informations générales sur la formalités requises par la Commis-
elle doit être modifiée lorsque cette source, en données agrégées et qui sion nationale de l’informatique et
configuration change. met à disposition un fichier individuel des libertés (Cnil).
anonymisé d’usage public s’il a été
L a solution r e te nue pa r l’Inse e possible d’en établir un ; le site Inter- Les données disponibles sur le CASD
présente les mêmes fonctionnalités, net du réseau Q u e te le t sont aujourd’hui celles auxquelles
mais a l’avantage de n’impliquer (www.reseau-quetelet.cnrs.fr) qui donne accès le comité du secret
aucune intervention dans le système donne accès à un dessin de fichier, et statistique, dans sa formation « ména-
informatique des établissements de au « FPR » s’il en existe un. ges ». Il s’agit donc d’enquêtes statis-
recherche. Elle a été mise au point et tiques auprès des ménages, récentes
brevetée par l’équipe « Organisation Beaucoup de recherches, on l’a dit, ou plus anciennes, y compris le
du système d’information » du Genes peuvent être conduites avec ces recensement de la population. Mais il
(Groupe des écoles nationales matériaux d’accès aisé et rapide. Le s’agit aussi de données
Courrier des statistiques n° 130, mai 2011 3
4. Le centre d'accès sécurisé aux données de la statistique publique française
administratives déjà mises à la dispo- Phase active : la formation, une « boîte aux lettres » virtuelle à
sition de l’Insee ou des SSM au titre de et le travail sur le CASD laquelle il a accès. Ce fichier est
bis 7
l’article 7 de la loi de 1951 . À titre examiné par des personnes habilitées
d’exemple, les déclarations annuel- Dans les semaines qui suivent son au secret statistique. Elles s’assurent
les de données sociales (DADS) figu- autorisation à accéder à certaines que le fichier ne contient pas d’élé-
rent dans cette catégorie. D’autres données confidentielles, le chercheur ments pouvant constituer une rupture
données peuvent également être est invité par les gestionnaires du du secret statistique. Si tel est le cas,
introduites dans l’espace réservé au CASD à participer à une séance dite elles avertissent le chercheur et lui
projet du chercheur sur le CASD, si « d’enrôlement », au cours de demandent de rectifier son fichier de
leur utilisation est nécessaire dans le laquelle lui sont rappelés les princi- sortie, afin qu’il soit conforme aux
cadre de l’étude pour laquelle il a pes généraux du secret statistique, la règles de la confidentialité. S’il ne
demandé l’accès aux informations responsabilité personnelle qui lui comporte aucun élément de nature à
confidentielles. Il peut s’agir par sera confiée et les modalités pratiques dévoiler une information confiden-
exemple de données apportées par le d’accès au centre. Ces dernières tielle, il est renvoyé, par simple
chercheur lui-même ; elles sont alors consistent en : messagerie, au chercheur.
introduites sur le CASD par un agent
- l’attribution d’une « SD Box », si
habilité à la gestion du centre. Aujourd’hui, cette vérification est
l’organisme dont il dépend n’en est
exhaustive sur tous les fichiers de
pas encore pourvue ;
Comme on l’a vu plus haut, avant de résultats produits dans le CASD dont
se connecter, le chercheur doit égale- - l’attribution d’une carte individuelle un chercheur demande la sortie. C’est
ment avoir accompli les formalités de connexion contenant un code une solution coûteuse, car elle
nécessaires auprès de la Cnil : en obtenu par traitement de ses emprein- demande une grande expertise de la
général une simple déclaration (pour tes digitales, relevées au cours de part des personnes habilitées. Son
les fichiers ne comportant pas de cette séance. coût augmentera avec celui de la
données sensibles), exceptionnelle- fréquentation du centre. Si le nombre
ment, une demande d’autorisation. Le chercheur peut avoir accès aux de personnes habilitées qui se consa-
De son côté, l’Insee effectue progres- fichiers qu’il a demandés, sur la « SD crent à ce contrôle était insuffisant,
sivement toutes les formalités auprès Box » qui lui a été attribuée. La recon- cela pourrait de plus entraîner des
de la Cnil pour déclarer cette naissance de son identité se fait grâce retards dans le feu vert donné aux
nouvelle forme de diffusion de à sa carte et à la reconnaissance de chercheurs. C’est pourquoi on pour-
données à caractère personnel. Il ses empreintes digitales par le lecteur rait envisager à l’avenir de n’effectuer
s’agit de modifier toutes les déclara- intégré à la SD Box. Il faut noter que cette vérification que par sondage.
tions (ou demandes d’autorisation) ce dispositif ne comporte aucun stoc- Dans tous les cas, la responsabilité de
effectuées par l’Insee pour les sources kage des empreintes digitales ailleurs la rupture du secret statistique reste
statistiques depuis la création de la que sur la carte qui reste en posses- de la responsabilité de celui qui aurait
Cnil (1978). Ce processus est long et sion du chercheur. produit le fichier fautif. L’absence
plusieurs mois seront encore néces- d’un contrôle exhaustif pourrait
saires avant que toutes les sources Plusieurs chercheurs peuvent être mettre en avant ce point et rappeler le
concernées aient été traitées. Il se inscrits sur un même projet : le dossier chercheur à sa responsabilité person-
peut donc que l’accès à certains présenté au comité du secret statis- nelle, alors qu’un contrôle exhaustif
fichiers soit temporairement retardé, tique mentionne en ce cas les noms peut lui donner l’illusion (fausse) qu’il
le temps que ces formalités se fassent. de tous les chercheurs associés à ce est « couvert » par la vérification
Pour diminuer au maximum l’impact projet. Ceux-ci ont alors accès à un effectuée par un tiers.
sur les utilisateurs du CASD, l’Insee espace spécifique sur le CASD, dédié
commence évidemment en priorité à leur projet. Le gestionnaire du Lorsque le chercheur a mené ses
par les fichiers les plus demandés sur centre y installe les bases de données travaux jusqu’au bout, ce qui doit
celui-ci. qui leur sont spécifiques, et leur ouvre intervenir avant l’expiration de son
l’accès aux fichiers de l’Insee ou des habilitation, il en avertit les
SSM pour lesquels l’autorisation d’ac- gestionnaires du CASD. Son accès
cès leur a été donnée. Personne au CASD est alors coupé. Cepen-
d’autre qu’eux n’a accès à cet espace. d a n t, so n e s p a c e d e tr a v a il e s t
Ils peuvent également utiliser la large archivé pour une durée de trois ans
gamme de logiciels de calcul statis- renouvelable une fois. Cette dispo-
tique et d’édition mis à la disposition sition rend possibles les éventuels
7. « Sur demande du ministre chargé de l’économie, de tous les chercheurs sur le CASD. « retours vers les données », néces-
après avis du Conseil national de l’information statis-
tique, et sauf disposition législative contraire, les in-
saires après une publication par
formations (...) recueillies dans le cadre de sa Lorsque le chercheur a terminé un exemple. Au terme de cette
mission, par (...) une personne morale de droit public travail sur les données, il crée un période, tous les fichiers propres au
(...) sont cédées, à des fins exclusives d’établissement
de statistiques, à l’Insee ou aux services statistiques
fichier de résultats (tableaux, projet chercheur et présents sur le CASD
ministériels. » de publication,...) qu’il glisse dans seront détruits.
4 Courrier des statistiques n° 130, mai 2011
5. Jean-Pierre le Gléau et Jean-François Royer
Vers une collaboration accrue Le cas des appariements individuelles sur les entreprises.
entre chercheurs et statisticiens Lorsqu’un chercheur a aujourd’hui
Les chercheurs ont fréquemment accès à ces données, suite à un avis
L’accès à des données individuelles de besoin d’effectuer des appariements du comité du secret statistique, il
sources statistiques pour mener des de données, pour enrichir les informa- obtient ces données sur un CD crypté
recherches est une nécessité pour la tions recueillies lors d’une enquête, qu’il doit conserver pendant un
plupart des chercheurs contempo- par des données administratives, ou temps dans des conditions de sécuri-
rains. Un premier résultat des progrès issues d’une autre enquête. Cet appa- té garantissant la confidentialité des
récents pour faciliter cet accès - FPR, riement se fait souvent sur un numéro données, puis détruire. On conçoit
CASD - doit être une plus grande d’identification (par exemple le NIR facilement que le CASD apportera
présence et visibilité des données fran- pour les personnes physiques et le des garanties plus solides de ce point
çaises dans des recherches de niveau numéro Sirène pour les personnes de vue.
international, qu’elles soient menées morales). Dans certains cas, le cher-
par des chercheurs français ou par des cheur pourra mener lui-même cet En 2010, l’accès au CASD était gratuit.
chercheurs étrangers habilités. Il faut appariement à l’intérieur du CASD. En effet certains aspects liés à la mise
préciser en effet que ni la loi, ni la Dans d’autres cas, ce ne sera pas en route (disponibilité des fichiers,
pratique administrative n’interdisent possible, en particulier si c’est le NIR déclaration à la Cnil,...) ont parfois
la communication de ces données à qui est en jeu. Ce numéro, on l’a vu, retardé la mise en œuvre du service
des chercheurs étrangers : ceux-ci est retiré, s’il existait dans le fichier pour les chercheurs, et il aurait pu
peuvent parfaitement s’engager dans initial, au moment de la mise sur le paraître anormal de facturer un service
le processus de demande décrit plus CASD. Si un appariement non faisable qui n’avait pas encore atteint la qualité
haut. Et le système informatique dans le CASD est cependant néces- voulue. Il est clair cependant que,
permet d’installer des « SD Box » en saire, et est autorisé par la Cnil, le cher- au-delà de l’investissement initial, le
tout lieu. Cependant, l’autorisation ne cheur peut demander à l’Insee de fonctionnement du CASD représente
pourra être donnée que si les cher- réaliser cet appariement hors du une charge pour l’institution qui en a
cheurs concernés donnent toutes les CASD et de mettre le fichier issu de la gestion : gestion des demandes,
garanties nécessaires, y compris sur le l’appariement (sans les numéros récupération des fichiers, parfois
plan juridique, en ce qui concerne la d’identification) sur le CASD. Il s’agit anciens, documentation, mise en
sanction des ruptures éventuelles du là bien évidemment d’une prestation ligne, formalités Cnil, attribution
secret statistique. spécifique, qui ne peut se faire qu’a- d’une « SD Box », licences pour les
vec l’accord du gestionnaire du CASD logiciels, vérification des sorties, etc. À
Un deuxième résultat de ces progrès et moyennant une facturation du l’avenir, l’accès au CASD devra donc
sera une intensification de la colla- service. Le fichier apparié restera sur le couvrir les frais entraînés par ces acti-
boration entre statisticiens publics CASD, sans possibilité pour le cher- vités. À ce jour, ni les modalités, ni le
et chercheurs autour des sources cheur de le sortir, ni d’en tirer des niveau de cette tarification n’ont
statistiques. Déjà, des formations résultats qui ne respecteraient pas les encore été complètement définis.
« sources » sont organisées à l’Insee règles du secret statistique. Ce travail
pour les chercheurs bénéficiaires peut aussi bien être effectué sur des Le CASD a été créé à l’Insee, au sein
des autorisations : elles sont l’occa- fichiers disponibles sur le centre, qu’a- du Genes, qui en était une compo-
sion d’échanges fructueux. Certai- vec un ou des fichiers apportés par le sante. Depuis le 1er janvier 2011, le
nes difficultés rencontrées par les chercheur, comme résultats d’une Genes est devenu un établissement
c h e r c h e u r s e n c o u r s d e tr a v a il enquête qu’il a lui-même effectuée. public d’enseignement supérieur et de
devront être résolues en faisant recherche, distinct de l’Insee. En ce
appel aux producteurs, ce qui qui concerne le CASD, cela a entraî-
devrait enrichir la documenta- L’avenir du CASD né le transfert au Genes de tâches
tion...et dans certains cas permettre incombant auparavant à l’Insee :
de corriger des erreurs. Au fur et à Aujourd’hui, les capacités du CASD habilitation des gestionnaires, trans-
mesure que des recherches utilisant sont encore contraintes par les limites fert des fichiers, opérations de vérifica-
des données individuelles se en matériel et en personnel qualifié tion en sortie, etc. Le Genes définira,
termineront, on attend des cher- nécessaire à son fonctionnement. en son sein, une structure spécifique
cheurs des « retours sur les sources » : Après une inévitable période de de gouvernance pour le CASD. Ces
appréciations, critiques, suggestions, rodage, on pourra envisager d’élargir modifications d’ordre administratif
etc. Comme beaucoup de ces sources encore les missions qui lui sont attri- n’ont pas eu de conséquences sur l’ac-
sont renouvelées périodiquement, ce buées, par exemple en se reposant sur cès au CASD par les chercheurs, pour
processus peut contribuer fortement à lui également pour la mise à disposi- lesquels cette évolution a été « trans-
leur amélioration progressive. tion de fichiers de données parente ». n
Courrier des statistiques n° 130, mai 2011 5