Un moteur de recherche de documents d'entreprise

Hands-on Labs

Room: Paris 224M-225M

Scheduled at : Wednesday 09:30 12:30

Abstract

Lors de cet atelier, nous allons expliquer comment mettre en place un moteur de recherche pour les données de notre entreprise.

Afin d'éviter le côté trop "magique" parfois des solutions sur étagère, nous verrons d'abord :

  • les bases du moteur de recherche Elasticsearch
  • l'indexation de contenu JSON
  • la transformation à la volée du contenu JSON via les pipelines ingest
  • l'extraction de texte et de meta-données depuis un document binaire avec le processor attachment
  • l'utilisation du tout nouveau processeur d'inférence pour déterminer des entités nommées de nos documents ainsi qu'une analyse de sentiments
  • l'utilisation du projet FSCrawler open-source pour réaliser plus simplement ces étapes

Nous verrons ensuite comment chercher dans les données ainsi indexées.

Enfin, nous mettrons en place une interface de recherche sur étagère, portée par la solution gratuite Workplace Search qui nous permettra de chercher dans différentes sources documentaires avec assez peu d'efforts.

David Pilato

David Pilato

Developer | Evangelist chez elastic

Depuis 2013, David Pilato est développeur et évangéliste chez elastic.co, après avoir passé les deux années précédentes à promouvoir le projet open-source Elasticsearch, dont un talk pour la toute première édition de Devoxx FR en 2012. Il en anime la communauté française et organise des BBLs au sein des entreprises.

Speaker's bio
Maha ALSAYASNEH

Maha ALSAYASNEH

I am a computer scientist with more than 10 years of experience in various fields ranging from web development to big data, including cloud computing and artificial intelligence. My experience combines technical and analytical aptitudes with problem-solving strengths to drive projects to on-time and high-quality completion.

I also have a Ph.D. in optimizing the performance of multi-tier distributed systems.

Currently, I am an Engineering Manager at Elastic. We are the leading platform for search-powered solutions.

I love communicating and sharing knowledge with people ;) ( I also love sports and mountains ;) )

My motto in life is LIVE + LOVE + LAUGH :)

Speaker's bio
Sylvain Wallez

Sylvain Wallez

Développeur et architecte passionné depuis trois décennies, membre de la Fondation Apache. Je code sur les machines de toutes tailles, du microcontrôleur aux clusters de gros serveurs.

Chez Elastic depuis 6 ans, d'abord dans l'équipe Cloud, et maintenant comme lead developer des librairies client Java et Rust.

Speaker's bio
Presentation type Hands-on Labs
Track Big Data, Machine Learning, Analytics
Presentation level beginner/novice
Keywords Elasticsearch search Machine learning

Room Paris 224M-225M