Romain BENASSI

Romain BENASSI

Publicis Sapient

Diplômé de l'IMT Atlantique, grande école d'ingénieur généraliste, avec une spécialisation en traitement du signal, je suis aussi docteur Centrale-Supélec pour mes travaux sur l'optimisation via les statistiques bayésiennes.

En tant que Data Scientist, j'ai travaillé plusieurs années dans le domaine de l'énergie dont près de 5 ans pour la start-up Homepulse sur l'analyse statistique des consommations des foyers et sur le sujet de la désagrégation des courbes de charges électriques (NILM).

J'ai rejoins ensuite en 2020, en tant que consultant Data Scientist, Publicis Sapient où j'ai été amené à travailler dans le domaine du Deep Learning et du NLP. Depuis 2021, je suis également formateur/enseignant à temps partiel en Deep Learning et NLP.

Blog: https://blog.engineering.publicissapient.fr/author/rbenassi/

bigd

Track : Big Data, Machine Learning, Analytics

Type de présentation : Conference

L'IA pour le bon usage des médicaments

L'entreprise Vidal, historiquement bien connue pour le fameux Dictionnaire rassemblant les caractéristiques des médicaments, s'est aujourd'hui positionnée comme leader concernant l'offre de services digitaux pour l'information sur les médicaments à destination du monde médical. Dans cette optique, la conception et la mise en production d'algorithmes de data science correspondent à des services stratégiques d'importance (pour répondre, par exemple, à des besoins comme la mise à disposition de données, la recherche d'information ou la sécurisation de la prescription) . Pour cette raison, un ambitieux projet de mise en place d'une plateforme Data Science a été mené et a permis l'industrialisation de milliers (!) de modèles d'extraction d'informations à partir de textes médicaux. Nous nous intéresserons aux contraintes et enjeux techniques entourant la plateforme, ainsi qu'aux différents outils la constituant (DVC, S3, Kubernetes, Airflow...) et aux algorithmes de NLP (Natural Language Processing) conçus. La boucle de feedback, qui permet une amélioration régulière et automatique des modèles, est un aspect essentiel de la plateforme Data Science que nous décrirons également.