WordFrequencies in R – More Text Mining
Hier ein Update zu meinen Spielchen mit R 😉
Eine Implementierung meiner Anforderungen in Ruby ist ..
Damit das funktioniert, braucht man auch noch ein Skript, das die Text vorher „aufräumt“.
Zum aufräumen sei noch angemerkt, dass, wie man auch sehen kann, die Behandlung von Wörter mit Leerzeichen als ein Wort mit R so nicht geht, weil tm damit (glaube ich, aber es gibt die Möglichkeit eigene Tokenizer zu benutzen, damit könnte es gehen, wäre aber insgesamt wohl umständlicher..) nicht umgehen kann..
Ein Ziel dabei war es auch, dass die Ausgabe möglichst wie die beim Ruby-Skript aussehen sollte.
Edit: An der R-Version schreibe ich immer noch weiter und so habe ich mittlerweile einen Sourcemechanismus für SQLite-Datenbanken implementiert. R ist wirklich nett!
0 Kommentare zu „WordFrequencies in R – More Text Mining“