RGPD : L'anonymisation des données personnelles

Données personnelles 11473 Vues

L’entrée en vigueur du Règlement général sur la protection des données et les réglementations existantes en la matière ont soulevé de nombreuses questions quant au traitement des données personnelles. Il existe aujourd’hui différentes méthodes pour les protéger, notamment celle de l’anonymisation des données.
RGPD : L'anonymisation des données personnelles

Avant toute chose, revenons sur la notion de donnée personnelle. La Commission nationale de l'informatique et des libertés la définit comme :

Toute information relative à une personne physique susceptible d’être identifiée, directement ou indirectement.

Les législations ont progressivement mis en place un cadre juridique pour les protéger, comme le Règlement général sur la protection des données (RGPD) à l’échelle européenne.

Anonymisation et pseudonymisation des données personnelles

Pour la Commission nationale de l'informatique et des libertés (CNIL), l’anonymisation est :

Un traitement qui consiste à utiliser un ensemble de techniques de manière à rendre impossible, en pratique, toute identification de la personne par quelque moyen que ce soit et de manière irréversible.

La norme ISO/CEI 29100 fournissant un cadre pour la protection des informations personnelles identifiables la considère comme un :

Processus par lequel des informations personnellement identifiables (IPI) sont irréversiblement altérées de telle façon que le sujet des IPI ne puisse plus être identifié directement ou indirectement, que ce soit par le responsable du traitement des IPI seul ou en collaboration avec une quelconque autre partie.

L’anonymisation est marquée par l’irréversibilité de la perte du caractère identifiable. Elle permet de désensibiliser les données confidentielles en les transformant. Celles-ci restent tout de même exploitables. 

L’article 4 du RGPD définit la pseudonymisation comme :

Le traitement de données à caractère personnel de telle façon que celles-ci ne puissent plus être attribuées à une personne concernée précise sans avoir recours à des informations supplémentaires, pour autant que ces informations supplémentaires soient conservées séparément et soumises à des mesures techniques et organisationnelles afin de garantir que les données à caractère personnel ne sont pas attribuées à une personne physique identifiée ou identifiable.

C’est un procédé réversible de remplacement des données. Elle n’efface pas le caractère nominatif des informations exploitées.

En l’absence d’irréversibilité, les techniques utilisées relèvent donc de la pseudonymisation et non de l’anonymisation. Contrairement à la pseudonymisation, l’anonymisation est une mesure de dénaturation et pas une simple mesure de sécurité. 

Notez que la pseudonymisation est largement plus souple et plus évidente à mettre en place. C’est d’ailleurs pour cela qu’elle est beaucoup plus utilisée dans le cadre de projets où l’anonymat n’est pas un facteur bloquant.

L’anonymisation, méthode indispensable ? 

Le RGPD ne comporte aucune obligation d’anonymisation. C’est simplement l’une des solutions existantes permettant d’exploiter des données personnelles tout en respectant les droits et libertés des personnes.

Grâce à elle, la réutilisation de données initialement interdites, en raison de leur caractère personnel, est permise et leur partage peut se faire sans porter atteinte à la vie privée de quiconque. Elle permet également de conserver des données au-delà de leur durée de conservation.

Pourquoi ? Car la législation relative à la protection des données ne va pas s’appliquer puisqu’une fois anonymisées, leur utilisation n’aura aucun impact sur ces individus.

L’anonymisation permet donc de se soustraire à la réglementation sur les données personnelles.

Ce processus peut être utile notamment concernant les publications de données ou dans le cadre de sondages.

En cas de publication de données qui ne seraient pas anonymisées, le responsable du traitement peut se rendre coupable d’un manquement à son obligation de confidentialité des données et donc à une violation des données qui sera notifiée à la CNIL si elle présente un risque pour les droits et libertés des personnes, et également aux personnes concernées si les risques sont élevés.

Techniques d’anonymisation des données

Il existe différentes techniques d’anonymisation permettant de réduire à néant la possibilité de réidentification d’un individu grâce aux données personnelles collectées. Ces techniques ont fait l’objet d’une étude en 2014 par le G29 (Groupe de travail Article 29 sur la protection des données), organe consultatif européen indépendant sur la protection des données et de la vie privée.

Le résultat de cette étude est que ces techniques peuvent être regroupées en deux groupes : la randomisation et la généralisation.

Il est essentiel de mettre en place un processus d’anonymisation réfléchi et pertinent. Pour cela, la CNIL recommande de se pencher avec attention sur les points suivants :

  • sĂ©lectionner les informations Ă  conserver selon leur pertinence ;
  • effacer les Ă©lĂ©ments d’identification directe et ceux qui pourraient permettre une rĂ©-identification de l’individu ;
  • distinguer les informations importantes des informations secondaires ou inutiles ;
  • dĂ©finir la finesse idĂ©ale et acceptable pour chaque information conservĂ©e.

Grâce à ce processus, il sera ensuite possible de déterminer la technique d’anonymisation la plus adaptée à la situation.

La randomisation

La technique de randomisation a pour finalité de transformer les données afin qu’elles ne puissent plus être attribuées à une personne en particulier. Elles sont moins précises, mais la répartition globale est conservée. Elle permet de protéger le jeu de données du risque d’inférence.

Exemple :

Dans le cadre de cette technique, il est possible d’intervertir les dates de naissance des individus. La véracité des informations se voit donc altérée.

La généralisation

Cette technique consiste à généraliser les données pour les rendre communes à un ensemble de personnes et non à une personne en particulier. Cela se fait par exemple en modifiant l’échelle ou l’ordre de grandeur des attributs des jeux de données. Elle évite que les données soient individualisées.

Elle permet de protéger les jeux de données d’éventuelles corrélations avec d’autres.

Exemple :

Dans un fichier où sont indiquées les dates de naissance de différentes personnes, il est tout à fait possible de remplacer la date entière, par l’année de naissance uniquement. 

La vérification de l’efficacité de l’anonymisation

De prime abord, rendre impossible l’identification d’une personne peut sembler facile. Toutefois, la seule suppression des éléments permettant de l’identifier ne suffit pas puisque aujourd’hui, de nombreux procédés existent pour exploiter des données et parvenir à identifier un individu. 

C’est pourquoi, il est essentiel d’apprécier le degré d’efficacité de la technique d’anonymisation utilisée. Pour cela, les autorités de protection des données européennes ont défini trois critères complémentaires pour s’assurer que le jeu de données est devenu complètement anonyme. Bien qu’aucune technique ne soit efficace à 100 %, si une solution résiste à chacun de ces risques, elle offre une protection relativement solide contre les éventuelles tentatives de réidentification.

Les trois critères sont les suivants :

  1. L’individualisation

    Il ne doit pas être possible d’isoler une partie ou la totalité des enregistrements permettant d’identifier un individu dans un jeu de données.

    Prenons l’exemple d’une base de données comprenant des CV. Dans le cas où les noms et prénoms d’un individu auraient été remplacés par un seul numéro, celui-ci permet malgré tout d’individualiser cette personne. En l’espèce, nous ne pouvons donc pas parler d’anonymisation, mais plutôt de pseudonymisation comme nous l’avons vu ci-dessus.

  2. La corrélation

    Il ne doit pas être possible de relier entre elles des ensembles de données se rapportant à la même personne ou à un même groupe de personnes.

    Par exemple, s’il est possible d’établir, par n'importe quel moyen, que des enregistrements correspondent à un même groupe de personnes, sans pour autant permettre de les isoler au sein de ce groupe, alors le premier critère de "l’individualisation" est rempli puisque la personne ne peut pas être individualisée, mais la technique ne résiste pas à la corrélation.

    Parallèlement, il n’est pas possible de considérer comme anonyme une base de données comprenant les adresses du domicile privé de différents particuliers si d’autres bases de données contiennent ces mêmes adresses avec d’autres données qui permettent d’identifier les individus.

  3. L’inférence

    Il ne doit pas être possible de déduire, avec une très haute probabilité, de nouvelles informations sur un individu.

    Par exemple, si un jeu de données comprend des informations relatives au montant des impôts de différentes personnes recueillies via un questionnaire, et que toutes les femmes interrogées ayant entre 20 et 25 ans ne sont pas imposables, alors il sera facile de deviner que Madame Y âgée de 24 ans ayant répondu au questionnaire ne l’est pas non plus. 

Anonymisation et pseudonymisation des données : délibérations de la CNIL et décisions du Conseil d’État

L’anonymisation des données peut se faire dans de très diverses situations. En voici quelques exemples. 

En 2011, la CNIL a autorisé la mise en œuvre par la société CELTIPharm d’un traitement de données à caractère personnel afin de réaliser des études épidémiologiques grâce à des données provenant de feuilles de soins électroniques anonymisées (délibération n° 2011 -246 du 8 septembre 2011). L’anonymisation des données a été l’une des conditions nécessaires pour permettre la mise en œuvre des traitements de données dans le domaine de la santé.

Plus récemment, le Conseil d'État s’est prononcé sur deux arrêtés confiant la collecte et le traitement de données de santé à la plateforme "Health Data Hub". Il a affirmé que :

Le droit au respect de la vie privée n'implique pas que des données, même aussi sensibles que les données de santé, fassent dans tous les cas l'objet d'une anonymisation avant d'être traitées à des fins d'évaluation ou de recherche mais seulement "comme l’indique le RGPD" que des garanties appropriées soient prévues, qui peuvent comprendre la pseudonymisation, lorsque l'anonymisation ne permettrait pas de poursuivre les travaux de recherche nécessaires.

L’anonymisation est plus que jamais au cœur des discussions. Un arrêté du 28 avril 2021 relatif à la mise à disposition du public des décisions des juridictions admini­stratives et judiciaires se heurte au caractère sensible de certaines données personnelles.

Cette mise à disposition ne pourrait donc avoir lieu que sous la condition d’anonymisation des décisions. Certains affirment qu'à travers ce processus, elles perdraient leur lisibilité et leur intérêt.

Est-ce que la liberté d’expression et le droit à l’information seront, dans ce cas, pleinement garantis ou au contraire menacés ? Telle est la question.

Image de AnaĂŻs ROBIN

Juriste, titulaire d'un Master 2 Droit de la coopération économique et des affaires internationales à l'université de Hanoï, Vietnam et d'un Master 1 Droit privé international et comparé à l'université de Turin, Italie.

Obtenez un devis en 24 heures par nos avocats
Prestation demandée :
Pays ou organisation :
Type de contrat :
Votre besoin :
Votre besoin :
Votre besoin :
Vos informations :

* : champs obligatoires

Lectures en lien
un batiment Ă  l'architecture moderne
Donnees personnelles 15094 Vues

La revente (cession) de fichiers clients est soumise à une législation stricte, son non-respect est sanctionné par une peine pouvant aller jusqu'à 5 ans de prison et 300 000 euros d'amende. Découvrez quelles sont les modalités et conditions de revente d'un fichier de clients via internet.

poteau sur lequel il est Ă©crit "big data is watching you"
Donnees personnelles 4579 Vues

Depuis son entrée le vigueur le 25 mai 2018, le règlement général sur la protection des données, autrement appelé RGPD, a considérablement changé la façon dont les administrateurs de sites internet traitent les données collectées auprès de leurs clients.

application google sur smartphone
Donnees personnelles 4616 Vues

La publicité sur internet permet de présenter des produits à des consommateurs intéressés, elle est en cela plus efficace que la publicité traditionnelle. Toutefois, Google Ads se montre vigilant et les annonceurs doivent donc veiller au respect des règles de confidentialité.

un batiment Ă  l'architecture moderne
Donnees personnelles 7820 Vues

Que désigne l'expression "données sensibles" ? Quelles sont les conditions de stockage et d’hébergement des données médicales, données dites sensibles ? Quels sont les hébergeurs agréés ?

un graphique sur un Ă©cran d'ordinateur
Donnees personnelles 4666 Vues

Quelles sont les obligations d'un éditeur, ou hébergeur, d'un site internet concernant la conservation des données personnelles de leurs utilisateurs et visiteurs ? Apport du décret du décret n° 2011-219 du 25 février 2011.

un Ă©cran d'ordinateur montrant le site Facebook
Donnees personnelles 7315 Vues

Le Règlement Général sur la Protection des Données, dit RGPD, a été voté en 2016 et est entré en vigueur le 25 mai 2018. De ce règlement découle un certain nombre d'obligations qui pèsent sur le responsable de traitement, notamment la tenue d'un registre des activités de traitement de données à caractère personnel.

un graphique sur un Ă©cran d'ordinateur
Donnees personnelles 5837 Vues

Le délégué à la protection des données, "Data Protection Officer" (DPO) en anglais, a été instauré par le RGPD, entré en vigueur le 25 mai 2018. Le DPO jouit d'une grande indépendance dans l'exercice de ses fonctions et doit veiller au bon respect du RGPD dans l'entreprise.

une personne tapant au clavier de son pc portable
Donnees personnelles 36486 Vues

L’identification d’une personne sur un site internet à partir de son adresse IP fait partie des problématiques relatives aux droits des internautes, que la loi puis les tribunaux encadrent et contrôlent. Plus précisément, est concernée l’épineuse question de la collecte et du traitement des données à caractère personnel.

une personne consultant des statistiques
Donnees personnelles 5433 Vues

Qu'est-ce que le RGPD ? Comment se mettre en conformité ? Quelles nouvelles obligations découlent du RGPD pour les sites internet ? Le RGPD, entré en vigueur le 25 mai 2018, consacre de nouveaux droits protecteurs au profit des internautes et impose de nouvelles obligations aux responsables de traitement.

des rangées de caméras accrochées à un mur
Donnees personnelles 8305 Vues

Depuis l'entrée en vigueur du RGPD, le 25 mai 2018, les déclarations auprès de la CNIL n'existent plus. La responsabilité du responsable de traitement s'en trouvant accrue, il est indispensable pour les organismes de se munir d'une politique de confidentialité.

photo en noir et blanc de quelqu'un tapant au clavier de son MacBook
Donnees personnelles 10945 Vues

La question de la conservation et de la suppression des données personnelles est épineuse. En effet, une durée de conservation doit obligatoirement être établie. Combien de temps peuvent-elles être conservées ? Peut-on demander leur suppression ? Quelles sont les sanctions en cas de non-respect de ce principe ?

une personne utilisant Google Analytics sur son ordinateur portable
Donnees personnelles 5421 Vues

Depuis l'entrée en vigueur du RGPD, le traitement de données à caractère personnel est conditionné à la mise en place de mesures de sécurité afin de les protéger. L’établissement d’une cartographie des données à caractère personnel apparaît comme la solution pour faciliter leur gestion et garantir leur protection.

une caméra sur un mur
Donnees personnelles 4431 Vues

Vous avez sûrement entendu parler du Règlement Général sur la Protection des Données, dit RGPD. Entré en vigueur en 2018, il a révolutionné le traitement des données personnelles au niveau européen. Comment s’applique-t-il ? Quelle est sa portée ? Nous y répondons dans cet article.

photo prise du ciel d'un continent pendant la nuit
Donnees personnelles 4415 Vues

Depuis l’entrée en vigueur du Règlement Général sur la Protection des Données, dit RGPD, de nombreuses structures s’inquiètent de ne pas répondre à ses exigences. L’audit de conformité au RGPD apparaît être l’outil idéal pour être sûr de s’y conformer. Pourquoi faire un tel audit ? Quelles sont les principales étapes ?

une personne utilisant un ordinateur portable
Donnees personnelles 3408 Vues

Depuis l’entrée en vigueur en 2018 du Règlement général sur la protection des données, communément appelé RGPD, la mise en conformité au règlement est devenue un enjeu majeur pour les organismes concernés. C’est un processus qui passe par plusieurs étapes, que nous vous présentons ci-dessous.