L'objectif de ce TP/Projet est de prendre en main la stack ELK afin de mener un projet de bout en bout de collecte et de représentation de data.
Le rendu attendu sera :
- un document décrivant le workflow/architecture de votre projet
- l'ensemble des scripts, fichiers de configurations, etc...que vous avez produit
- ainsi qu'un rapide rapport sur le TP/prise en main (problèmes rencontrés, résultats obtenus...)
En vous basant sur le projet labynocle/elk-demo le but va etre de démarrer une stack ELK et d'y injecter vos premières data.
- assurez vous d'avoir les requirements
- demarrez la stack et y injecter les data de demo
- allez sur Kibana via http://127.0.0.1:5601/
- confirmez que vous avez bien des data dans votre stack
- créez votre premier index pattern
- créez votre première query
- créez plusieurs visualizations représentant au moins: la répartition homme/femme, le top 10 des noms, des villes le nombre de versions differentes il y a
- créez un dashboard regroupant ces visualizations
- cleanez les data que vous avez injecté dans votre stack (en utilisant Cerebro)
- changez la conf de logstash pour créer un nouveau champs
email_domain
reprenant le domain de l'adresse mail uniquement ([email protected]
>aleikoum.net
), pensez à regarder comment mutate fonctionne - une fois que c'est ok, créez une visualization avec le top 10 des domaines
Vous avez maintenant les bases pour manipuler les data dans la stack ELK. Il est temps de vous faire votre propre projet.
- trouvez vous une idée de projet (en vous posant la question:
ai je accès à une source de données pouvant répondre à mon besoin et puis je automatiser sa récupération?
- discutez avec l'encadrant de la faisabilité et de l'ambition du projet
- lancez vous !
Le rendu attendu sera :
- un script qui récupère/traite les données que vous récupérez (en python par exemple)
- les configurations logstash que vous utilisez
- un schema explicitant toute votre chaîne data: de la source, en passant par votre script, logstash , elasticsearch jusqu'a kibana
- les screenshots des visualisations que vous avez réalisé
- votre avis sur ce qui pourrait être fait de mieux dans votre projet, les prochains steps, comment ça pourrait passer à l'échelle etc...