WordFrequencies in R – More Text Mining
Hier ein Update zu meinen Spielchen mit R 😉
Eine Implementierung meiner Anforderungen in Ruby ist ..
[spoiler show=“.. hier.“]
[/spoiler]
Damit das funktioniert, braucht man auch noch ein Skript, das die Text vorher „aufräumt“.
[spoiler show=“Das gibt es hier.“]
[/spoiler]
Zum aufräumen sei noch angemerkt, dass, wie man auch sehen kann, die Behandlung von Wörter mit Leerzeichen als ein Wort mit R so nicht geht, weil tm damit (glaube ich, aber es gibt die Möglichkeit eigene Tokenizer zu benutzen, damit könnte es gehen, wäre aber insgesamt wohl umständlicher..) nicht umgehen kann..
[spoiler show=“Und hier dann das R-Skript“][/spoiler]
Ein Ziel dabei war es auch, dass die Ausgabe möglichst wie die beim Ruby-Skript aussehen sollte.
Edit: An der R-Version schreibe ich immer noch weiter und so habe ich mittlerweile einen Sourcemechanismus für SQLite-Datenbanken implementiert. R ist wirklich nett!
0 Kommentare zu „WordFrequencies in R – More Text Mining“