GLZ-8300 Statistiques ou vie privée ? Les deux ! | Devoxx

Statistiques ou vie privée ? Les deux !

Conference

bigd Big Data, Machine Learning, IA & Analytics
  Friday from 13:55 til 14:40

Le Data Lake pour l'analyse de comportement d'utilisateurs vit peut-être ses derniers instants. L'industrie prend brutalement conscience aujourd'hui de la toxicité de disposer de données individuelles brutes.

La confidentialité différentielle permet de couvrir une partie du spectre, lorsque le nombre d'utilisateurs atteint cinq chiffres, mais est sans réponse pour les plus petites populations.

Avec SDA, nous proposons une implémentation de collecte de statistiques reposant sur le partage de secret qui s'adapte à des populations de quelques centaines d'utilisateurs. De façon très classique, SDA permet à un développeur d'application d'obtenir la somme des contributions individuelles de chacun de ses utilisateurs. Néanmoins, à aucun moment, ni le développeur ni aucune tierce partie n'est en possession de donnée brute exploitable.

SDA est formé d'une librairie pour instrumenter l'application (y compris mobiles, iOS comme Android), et d'un serveur. La librairie comme le serveur sont codés en Rust. Des interfaces haut-niveau en Swift et en Java pour la librairie sont disponibles.

Mathieu Poumeyrol Mathieu Poumeyrol

Backend geek "large spectre", je m'intéresse aux stacks web et webservice, aux bases de données et au data processing.

J'aime coder, et j'aime les langages modernes, mais je suis un ingénieur: j'aime les trucs qui marchent vite, efficacement, tout le temps. Si en plus ils peuvent avoir de la gueule, tant mieux.

Je fais du Rust depuis 36 mois, en open-source et close-source, et suis très enthousiaste.

J'ai rejoint Snips, où la protection de la donnée privée est un impératif absolu qui oblige à trouver des alternatives à l'approche Data Lake qui domine le marché aujourd'hui.

TBA : To be announced / Salle non affectée