Ouverture des jeux de données de jurisprudence de Légifrance

16 septembre 2015

Depuis plusieurs années, le Gouvernement a développé une politique d’ouverture des données publiques (open data). Cette démarche de transparence doit être conciliée avec la nécessaire protection de la vie privée.

Les données publiques peuvent être réutilisées, sous réserve de respecter les dispositions légales applicables. En particulier, lorsqu’un jeu de données contient des données personnelles, il ne peut être réutilisé que dans trois cas :

  • en cas de consentement des personnes concernées,
  • en cas d’anonymisation préalable,
  • ou lorsqu’une disposition légale le permet.

En tout état de cause, la réutilisation de jeux de données comprenant des données personnelles est subordonnée à la loi informatique et libertés. Ce cadre juridique est souvent méconnu. C’est pourquoi la CNIL accompagne tant les administrations pour l’ouverture des données, que les réutilisateurs dans la mise en œuvre des traitements de données issues de l’open data. A la suite du  comité interministériel pour la modernisation de l’action publique (CIMAP) du 13 décembre 2013, la DILA a souhaité ouvrir les bases de données de jurisprudence qu'elle diffuse sur Légifrance pour le compte du Conseil d'Etat et de la Cour de Cassation. Il s’agit de données publiques comprenant des données personnelles indirectement identifiantes, conformément à la recommandation de la CNIL de 2001 visant à limiter les possibilités de réidentification des personnes mentionnées dans les décisions de justice. Afin d’assurer la conformité à la loi « Informatique et Libertés » de cette mise à disposition et des réutilisations qui en seront issues, la CNIL, la CADA (Commission d’accès aux documents administratifs), la DILA et Etalab ont conjointement défini un « caveat ». Il s’agit  d’une mention précisant le cadre juridique applicable à la réutilisation de ces jeux de données. Il rappelle en particulier aux réutilisateurs que, dès lors qu’un jeu de données a fait l’objet d’une anonymisation totale ou partielle (ex : remplacement du nom et du prénom par des lettres), la réutilisation, notamment dans le cadre de croisements de données, ne peut avoir ni pour objet ni pour effet de réidentifier les personnes. Le « caveat » est disponible sur la page data.gouv.fr des jeux de données concernés. Par ailleurs, les réutilisateurs de jeux de données comprenant des données directement ou indirectement identifiantes restent soumis à l’ensemble des principes de la loi « Informatique et Libertés » :

  • finalité,
  • mise à jour et de durée de conservation des données,
  • droits d’accès,
  • droit de rectification et d’opposition pour les personnes concernées à l’égard des traitements ultérieurs,
  • ainsi qu’à l’obligation d’effectuer des formalités auprès de la CNIL (déclaration ou autorisation).

Ces travaux communs avec la CADA, la DILA et Etalab participent ainsi de la mise en œuvre d’une politique d’ouverture des données responsable, respectueuse de la vie privée et des droits des personnes. 

FOCUS

Le caveat accompagnant la consultation ou le téléchargement des jeux de décisions de justice 

Les informations figurant dans la licence ouverte proposée par la DILA n’étaient en effet pas assez précises pour permettre aux réutilisateurs de connaître les limites d’usage à respecter en cas de traitement de ces données. Il a ainsi été reconnu nécessaire de délivrer une information plus précise à tout internaute accédant aux jurisprudences contenant des données à caractère personnel, dans le souci de rappeler le cadre juridique et les limites d’usages à respecter en cas de réutilisation.

Ce caveat rappelle dès lors plus précisément le cadre juridique applicable à la réutilisation de ces données et en particulier que, lorsque les données personnelles contenues dans ces informations ont préalablement à leur diffusion fait l’objet d’une anonymisation totale ou partielle, conformément à des dispositions légales ou aux recommandations de la Commission nationale de l’informatique et des libertés (CNIL), cette réutilisation ne peut avoir pour objet ou pour effet de réidentifier les personnes concernées. Il rappelle également que les réutilisateurs doivent respecter les principes essentiels de la loi Informatique et Libertés.

Il s’agit donc d’une mention formulée en vocabulaire courant, qui apparaît au frontispice du cadre conventionnel conclu entre le diffuseur des données et les réutilisateurs. Il permet une balance des intérêts, qui part du principe que, si la puissance publique – en l’occurrence, les juridictions suprêmes – anonymise (au sens large) les décisions de justice, ce n’est pas pour que cette anonymisation soit ensuite contournée, ni a fortiori pour que ces éléments permettent de réidentifier les personnes en enrichissant d’autres jeux de données à disposition des réutilisateurs.

Ces travaux communs avec la CADA, la DILA et Etalab ont ainsi participé de la mise en œuvre d’une politique d’ouverture des données responsable, respectueuse de la vie privée et des droits des personnes.

Les mots clés associés à cet article