La chaire D-CC présente aux sixièmes rencontres R

Les sixièmes rencontres R
RlogoUne chaire partenariale a une mission d’intérêt général, et c’est pour respecter ce principe que la chaire D-CC privilégie les technologies libres. Dans le domaine du traitement et de l’analyse des données, des statistiques et du machine-learning, R est un acteur incontournable du logiciel libre.
Du 28 au 30 juin les utilisateurs français de ce langage de programmation se sont retrouvés aux sixièmes rencontres R, organisées à Anglet avec le soutien de l’Université de Pau et des Pays de l’Adour.

Une interface graphique pour faire changer les comportements

premierOngletDans l’entreprise, l’équilibre entre l’innovation et la réalisation des études opérationnelles n’est pas toujours facile à trouver. Même lorsqu’une méthode est plus performante, il est parfois difficile de la faire adopter par des data-miners très sollicités par leurs tâches quotidiennes. Les guides pratiques et les livres blancs permettent une prise de conscience mais sont souvent insuffisants pour accompagner le changement.
Au contraire, la réalisation de prototypes faciles à manipuler, permettant de visualiser graphiquement les différences entre les méthodes concurrentes, peut faire évoluer les pratiques de manière plus efficaces.

Analyse factorielle et méthodes géométriques ou modèle de mélange ? typoChooseR aide à choisir la méthode de segmentation qui vous convient le mieux

deuxiemeOngletDans le cas de variables qualitatives, la pratique est souvent d’effectuer une analyse factorielle des correspondances multiples puis de retenir les premiers axes pour appliquer une méthode géométrique de clustering. Mais combien d’axes retenir ? Ne vaut-il pas mieux ajuster des modèles de mélange de distributions ? L’interface typoChooseR, développée avec R et le package shiny permet de choir les variables, le nombre rstudio-hex-shiny-dot-psdd’axes et la méthode, et de voir l’impact de ces choix sur la composition des groupes retenus. Le code source peut être téléchargé ici, et utilisé au sein de l’environnement de développement intégré Rstudio (qui propose une version gratuite).

Des échanges avec la communauté scientifique
Après une présentation de 15 minutes, Matthieu Gousseff a répondu aux questions des participants. Les échanges se sont poursuivis de manière informelle et ont permis des contacts avec les data-scientists d’autres entreprises, intéressés par cette démarche facilement généralisable, mais aussi avec des chercheurs de l’UPPA ou du CNAM. Les rencontres R sont l’occasion idéale de faire se rencontrer les chercheurs en sciences de la donnée (statistique, informatique, apprentissage machine), et les praticiens de la data en entreprise.

Ce contenu a été publié dans Blog, Statistiques, Vie de la Chaire. Vous pouvez le mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *