L’analyse de la parole client

La parole client : un trésor à exploiter 

L’axe principal de développement voté en Comité Scientifique de la chaire D-CC pour sa nouvelle saison porte sur l’analyse de verbatim clients. L’enjeu est de savoir identifier et décrypter ce que disent les clients lors de leurs interactions avec les services clients des entreprises (Site Web, SAV,Call Center…).

Pour ce faire, il est nécessaire de faire appel à des algorithmes d’analyse automatique du langage naturel (NLP, pour Natural Language Processing) et déterminer les thématiques exprimées par les clients (type de réclamations, demande d’informations ou d’assistance) et de savoir établir une typologie des verbatim aux fins d’apporter des réponses différenciées et pertinentes.

Les méthodes utilisées dans nos travaux sont non supervisées, et ne nécessitent donc pas un étiquetage préalable d’un jeu de données.

Le secret de la réussite ? Une bonne préparation des données !

L’étape indispensable à tout traitement automatique du langage ? La préparation des données. Tokenisation (séparation du texte en unités de sens), suppression des stops-words (déterminants, pronoms…), racinisation (détermination de la forme la plus simple du mot) : ces traitements sont garants de la qualité de la modélisation.

Du texte au chiffre…

Les algorithmes de machine learning ont besoin d’éléments chiffrés pour fonctionner. Il faut donc transformer nos données textuelles en chiffres.

Deux grands types de méthodes sont utilisées dans nos travaux :

  • des représentations de type Bag of Words (sac de mots), correspondant à des matrices termes / documents :
  • des représentations Word2Vec basées sur des réseaux neuronaux entraînés :

 

La détection automatique de thèmes

La modélisation LDA (pour Latent Dirichlet Allocation) permet de déterminer automatiquement les grands thèmes composant un corpus textuel. Cette méthode probabiliste est parfaitement générative, et est basée sur les hypothèses suivantes :

  • le corpus global est composé de k thèmes ;
  • chaque document du corpus est composé d’une distribution de thèmes parmi les k ;
  • chaque thème est composé d’une distribution de mots.

La méthode, itérative, permet de déterminer les distributions de thèmes et de mots qui ont généré le corpus avec la plus grande probabilité. 

TOPCAPY : un outil d’aide au traitement de la parole client

Dans le cadre des travaux sur le NLP menés par la chaire D-CC , un outil d’Intelligence Artificielle (IA) a été développé pour permettre de classer automatiquement des commentaires clients en fonction de leur degré d’insatisfaction : TOPCA.PY (Traitement Opérationnel de la Parole Client Avec PYthon).

L’applicatif permet de répondre à un besoin de façon plus performante en ce sens où il traite des données massives de façon automatique.

Les verbatim clients sont ainsi analysés par des méthodes de Data Science innovantes reposant sur l’analyse du langage naturel croisées à des analyses de satisfaction client (score NPS, pour Net Promoter Score).

La solution est développée en technologie open-source disponible et ouverte à tous. Cet applicatif intuitif et open source sera mis à la disposition de tous à la fin du mois de décembre sur le site internet de la chaire.

 

Article de recherche : TALN et satisfaction client

La recherche sur la satisfaction client et le recours au traitement automatique du langage naturel (TALN) fait également l’objet d’un article par Yolande Piris, directrice scientifique de la chaire D/CC, professeure des Universités et directrice du Laboratoire d’Economie et de Gestion de l’Ouest (LEGO), en collaboration avec Anne-Cécile Gay, data scientist de la chaire D/CC.

Les données d’applications ont été fournies par notre partenaire-mécène BRED-Banque populaire.

Cette recherche permet de montrer que la satisfaction client n’est pas verticale ou horizontale mais qu’elle peut être une combinaison plus ou moins importante de thèmes. Ce travail montre également un lien entre le niveau de satisfaction et le nombre de thèmes abordés remettant en cause les approches traditionnelles qui ne semblent pas distinguer les différences discursives entre les clients satisfaits et les clients peu satisfaits. Enfin, cette recherche pose les bases d’un traitement automatique et personnalisé des commentaires clients.

Cet article de recherche a été soumis à une revue anglophone de marketing à des fins de publication.

Le NLP au service de la parole citoyenne

La parole client, source intarissable d’information et de connaissance, ne concerne pas seulement les clients d’entreprises privées, mais aussi les usagers ou les administrés de tout service public, et plus largement les concitoyens à travers les consultations d’opinions citoyennes.

Le LEGO et la chaire D/CC ont engagé également une collaboration avec la plateforme make.org sur des problématiques sociétales et des enjeux citoyens.

Ainsi, les algorithmes développés par la chaire DCC travaillent actuellement sur les verbatim citoyens issus de la grande consultation “Comment permettre à chacun de mieux manger”.

 

Retour en haut