L’art de visualiser les données – Entretien avec Teresa Barrueco

Qu’est-ce que la visualisation de données, exactement?

C’est la transformation des données brutes en graphiques faciles à lire et comprendre. Ces techniques permettent de répondre à certaines questions qui nécessitent de faire appel à d’importants volumes des données; l’un des principaux enjeux est de transformer l’information recherchée en graphiques les plus visuellement parlants possible. C’est une méthode particulièrement efficace, notamment pour la prise de décision.

La visualisation de données intervient dans tous les domaines dans lesquels il existe un besoin de ‘traduire’ visuellement un ensemble de données : assurance, banque, énergie ou recherche journalistique, par exemple. Je viens de commencer un projet qui inclut une composante de visualisation de données des réseaux sociaux qui servira à identifier les grandes tendances, extraire des conclusions politiques, ou autres. Également, avec Internet, beaucoup de données sont ouvertes via de nombreux sites d’organismes à but non lucratif ou d’institutions comme la Banque mondiale ou la Ville de Montréal.

D’ailleurs, de nombreux logiciels sont maintenant disponibles sur le marché pour traiter ces données, comme Tableau, Power BI de Microsoft, ou Qlikview. Pour une utilisation plus poussée, on peut aussi utiliser des langages de programmation comme R pour l’extraction et la transformation des données.

Qu’est-ce qu’une bonne visualisation de données?

Tout d’abord, il est important qu’il n’y ait pas plus d’information que nécessaire. Si la visualisation comprend trop d’éléments non nécessaires, cela produira du ‘bruit’ et amènera de la confusion auprès du public.

Ensuite, une bonne visualisation doit tenir compte du public auquel on s’adresse et répondre aux questions qu’il se pose. Si c’est un public qui a l’habitude de lire des données, comme des membres de la direction par exemple, on peut faire des choses plus spécialisées. Par contre, un public plus novice aura besoin de données simples.

Il arrive que certaines visualisations de données soient très artistiques et adoptent une approche innovante, à l’intersection de la science, de l’art et des mathématiques, mais pour la plupart du public, il faut que ce soit à la fois attirant et compréhensible.

Quelle est votre expérience dans ce domaine?

J’ai travaillé comme analyste d’affaires et adjointe au chef des projets. J’ai touché à beaucoup d’aspects de la visualisation de données, et j’assure par exemple la visualisation auprès des chefs de projets pour faciliter la prise de décision. Depuis quelques années, beaucoup de tendances intéressantes se développent et je travaille maintenant à un projet qui combine le traitement automatique du langage naturel, le machine learning et la visualisation des données appliqués aux réseaux sociaux. De plus, ma formation et mon expérience en informatique et anthropologie me permettent de combiner les analyses de données qualitatives et quantitatives.

Si vous aviez un conseil à donner à quelqu’un qui voudrait s’initier à votre domaine,  quel serait-il?

Il est important de faire une exploration exhaustive des données avant de construire la visualisation, afin de mieux comprendre comment les différentes données interagissent et comment les montrer avec des graphiques les plus pertinents possibles.

Très importante aussi, la règle des 5 secondes: la plupart des gens étant occupés, nous n’aurons que 5 secondes pour retenir leur attention; c’est pourquoi une bonne visualisation doit communiquer clairement le message-clé en moins de 5 secondes.

Teresa Barrueco donne le cours introduction à la visualisation de données.