Sparklane
Data Scientist chez Sparklane, je travaille principalement au développement et au déploiement de solutions basées sur du Deep Learning pour améliorer notre produit et simplifier les usages de nos clients.
Twitter : @collet_seb
Récemment, les modèles d'IA comme GPT3, PaLM ou ChatGPT sont devenus de plus en plus populaires et performants. Ces approches sont basées sur du Deep Learning et plus particulièrement sur ce que l'on appelle les modèles de langage. Les possibilités offertes par ces modèles semblent alléchantes, mais pour autant, est-ce simple de les utiliser au sein d'un produit ? Avec la performance, vient aussi une couche de complexité qu'il ne faut pas négliger.
Dans cette université, nous aborderons l'évolution et le fonctionnement de ces modèles depuis le premier GPT en 2018 jusqu'aux approches les plus récentes. Nous verrons ensuite comment il est possible de mettre en place ce genre de méthode dans la "vraie vie". C'est-à-dire avec un besoin métier spécifique, des contraintes de production et un budget limité. Enfin, nous ouvrirons le débat sur le potentiel futur du domaine, alors que les nouveaux modèles semblent devenir obsolètes en quelques mois seulement.