Durée: 0 h 36 min
Nombre de leçons: 21
Rubrique:
1.
1.1.
1.2.
2. Nettoyage du texte
2.1. Suppression des balises HTML et du bruit
2.2. Normalisation des textes (minuscules, suppression de la ponctuation)
3.
3.1.
3.2. Traitement des mots rares et de leur impact
4. Tokenisation
4.1.
4.2.
5. Stemming et Lemmatisation
5.1.
5.2. Outils et techniques de lemmatisation
6.
6.1. Techniques de vectorisation : Bag of Words, TF-IDF
6.2.
7.
7.1.
7.2.
Le coût de ce programme dépend de la formule d'abonnement choisie. Toutes les formules ont une durée de 12 mois calendaires.
Tous les programmes de formations sont validés par une ou plusieurs séries de QCM et/ou de Vrai Faux. En fonction du programme et du niveau choisi vous obtiendrez des évaluations différentes, de la plus facile à la plus difficile.