Skip to content Skip to sidebar Skip to footer

Classification supervisée de documents

Auteur : Jean Beney

Avec l’amélioration des capacités des ordinateurs, un gain de temps et de stockage permet à présent d’envisager la gestion électronique de toutes sortes de documents textuels pour en optimiser l’organisation et la récupération. Après avoir rappelé les bases et les particularités des systèmes de classification, cet ouvrage définit différentes façons d’évaluer leur qualité et l’optimisation de certaines de ces mesures. S’appuyant sur les expériences de l’auteur, il offre ensuite conseils et mises en garde pour une bonne préparation des données (extraction des termes, calcul de leur force, choix des paramètres, etc.) et décrit en détails différentes méthodes de classification supervisée (méthodes Winnow, Rocchio, SVM), leurs propriétés et les résultats obtenus sur un jeu d’essai concret. Indispensable guide, cet ouvrage s’adresse aux étudiants et chercheurs qui souhaitent approfondir le problème de la classification de documents dans des classes prédéfinies, mais aussi aux ingénieurs et développeurs ayant à mettre en place un outil de classification.