Booster votre candidature en enregistrant et partageant votre vidéo de présentation aux recruteurs

J'enregistre ma vidéo
Retour

Offre proposée par

Edf

EDF

I2D Stage Possibilité d'attaque sur données statistiques protégées par Differential Privacy H/F (2021-40869)

Palaiseau, Île-de-France Développement informatique
Postuler maintenant

Description de l'offre

Contexte technique :

La collecte massive de données numériques permet une meilleure connaissance de phénomènes statistiques et a donné lieu à de nombreuses applications exploitant ces données. Pour encourager le développement de cette collecte de données, la Loi pour une République Numérique votée le 7 octobre 2016 impose aux institutions publiques de mettre à disposition du public leurs données disponibles. Certaines de ces données sont considérées comme des données personnelles. C’est par exemple le cas des données de consommation électrique des foyers. A ce titre, elles sont protégées par le RGPD qui exige le consentement des individus pour leur traitement de leurs données et restreint le traitement de ces données à un type de finalité, dans un cadre temporel restreint. Pour les exploiter en dehors de ces exigences, il convient de les anonymiser pour pouvoir les exploiter.



Contexte R&D :

La R&D d'EDF a pour mission de préparer l’avenir en travaillant sur les technologies de rupture. Cette recherche est orientée sur 4 axes dont l’un d’eux est l’accélération de la transformation digitale. La R&D d’EDF peut également effectuer ces recherches pour des commanditaires externes dans le cadre de partenariats, avec par exemple des acteurs territoriaux.

Ce stage s’inscrit dans un partenariat avec la métropole de Dijon qui souhaite mettre en place un Data Lake de diverses sources de données (dont les données de consommation) à disposition d’entité externes exploitant ces données et la start-up Sarus qui propose une suite logicielle implémentant la Differential Privacy. Le rôle d’EDF est d’apporter une expertise scientifique pour examiner les attaques qui pourraient déjouer la protection apportée par cette solution en matière de vie privée.



Objectifs et contenu du stage :

L’objectif général du stage sera d’établir à partir de quel seuil du paramètre ε certaines inférences sont possibles sur les données personnelles en fonction de la nature et de la quantité de données agrégées qui seront publiées.

Cet objectif se décompose en plusieurs volets :

· Etablir des possibilités de connaissances plausibles en pratique pour l’attaquant (par exemple : absences du foyer certains jours, publications sur les réseaux sociaux, situation sociale…) ainsi que des objectifs intéressant un attaquant
· Faire un état de l’art des différentes formes d’attaques connues sur la Differential Privacy
· Implémenter les attaques les plus pertinentes pour notre cas d’usage (les courbes de charges de la consommation d’un foyer) dans différents contextes.
· En fonction des résultats apportés par le stage, ce sujet pourrait éventuellement déboucher sur une poursuite en thèse.

Profil souhaité

Profil souhaité :


Formation encours : Bac +4/+5 uniquement : Ecole ingénieur ou Master en informatique ou mathématiques

Compétences requises :

· Bonnes connaissances en probabilités et statistiques
· une connaissance en IA serait un plus
· Maîtrise d’un langage de programmation

Qualités recherchées :

· Esprit scientifique
· Esprit critique et de synthèse
· Ouverture sur de nouvelles problématiques