Bonjour ! Article tr?s int?ressant, malheureusement en ex?cutant ? la lettre votre code, voici ce qui s'affiche, assez rapidement h?las :
> dtm <- TermDocumentMatrix(docs)
Error in UseMethod("meta", x) :
pas de m?thode pour 'meta' applicable pour un objet de classe "try-error"
De plus : Warning messages:
1: In mclapply(x$content[i], function(d) tm_reduce(d, x$lazy$maps)) :
all scheduled cores encountered errors in user code
2: In mclapply(unname(content(x)), termFreq, control) :
all scheduled cores encountered errors in user code
Super article, tr?s instructif !
? noter que la racinisation est aussi possible avec le package tm.
J'en parle notamment ici (et de son execution avec R) : Premiers pas en text-mining avec R ? Partie 2
Ce process permet de diminuer le bruit d'environ 15% sur mon corpus.
? bient?t,
Colin
Commentaires