Classification de texte enrichie \`a l'aide de motifs s\'equentiels
En classification de textes, la plupart des m{\'e}thodes fond{\'e}es sur des classifieurs statistiques utilisent des mots, ou des combinaisons de mots contigus, comme descripteurs. Si l{'}on veut prendre en compte plus d{'}informations le nombre de descripteurs non contigus augmente exponentiellement. Pour pallier {\`a} cette croissance, la fouille de motifs s{\'e}quentiels permet d{'}extraire, de fa{\c{c}}on efficace, un nombre r{\'e}duit de descripteurs qui sont {\`a} la fois fr{\'e}quents et pertinents gr{\^a}ce {\`a} l{'}utilisation de contraintes. Dans ce papier, nous comparons l{'}utilisation de motifs fr{\'e}quents sous contraintes et l{'}utilisation de motifs -libres, comme descripteurs. Nous montrons les avantages et inconv{\'e}nients de chaque type de motif.
PDF Abstract