DescriptionL'objectif de ce cours est la compréhension et l'application des principales techniques permettant l'exploitation de données textuelles dans un contexte d'affaires afin d'améliorer la prise de décision.
Les principales sources d'information des données textuelles proviennent de documents comme les réseaux sociaux, les sites Web, les courriels, les rapports, etc. Le traitement de ces données textuelles, présentes en quantité abondante, permet l'accès à de nouvelles informations intelligentes et une meilleure prise de décision.
Thèmes couvertsIntroduction à l'exploitation des données textuelles et mise en contexte.
Nettoyage de données textuelles avec R.
Analyse descriptive et visualisation des données textuelles.
La technique Bag of Word
Les mesures de similarités et de distances pour les données textuelles.
La segmentation de texte.
La classification de texte.
Présentations de projets.
Remarques importantesUn ordinateur portable configuré selon les
exigences technologiques de l'École est requis pour ce cours.