Après avoir vu dans un précédent article comment récupérer les données Twitter avec Flume et Hive, j’ai voulu aller jusqu’à la visualisation des données.

Pour se faire, j’ai utilisé Hive pour calculer quelques indicateurs de sentiment. Le principe repose sur l’utilisation d’une table de mots clés classés comme positif, neutre ou négatif. Il suffit ensuite d’analyser la syntaxe (dans le jargon on parle souvent de parser les tweets, un anglicisme issu du verbe to parse) des tweets pour repérer les mots clés utilisés et calculer le sentiment du tweet. La limite de cette approche est cependant évidente car elle ne tient pas compte des tournures grammaticales. Le sujet est complexe et il existe un saut technique important pour passer d’une analyse lexicale à une analyse sémantique. De nombreux laboratoires ont lancé des recherches dans ce domaine, comme l’ANR par exemple.

Heureusement, Twitter nous facilite la vie avec les hashtags et les informations que l’on peut récupérer comme le nombre de followers par exemple. Il devient aisé alors d’identifier les thématiques et la portée des tweets en fonction de l’audience potentielle.

J’ai utilisé également Hive pour identifier le pays d’origine des tweets à partir des indications sur les fuseaux horaires. Mon objectif était de pouvoir mettre en œuvre les nouvelles fonctions cartographiques intégrées dans Qlik Sense.

Je vous invite à consulter l'article complet à l'adresse suivante: http://blog.businessdecision.com/bigdata/2015/04/tutoriel-visualiser-donnees-twitter-avec-qlik-sense/

Il intègre une vidéo de démo qui présente l'application Qlik Sense en exploitant le nouveau mode Récit.

Pour les plus courageux, n'hésitez pas à consulter aussi l'article orienté Big Data qui explique comment récupérer et traiter les données issues de Twitter: Tutoriel : Analyser les données Twitter avec Flume et Hive