WordFrequencies in R – More Text Mining

Hier ein Update zu meinen Spielchen mit R 😉

Eine Implementierung meiner Anforderungen in Ruby ist ..
[spoiler show=“.. hier.“]

[/spoiler]

Damit das funktioniert, braucht man auch noch ein Skript, das die Text vorher „aufräumt“.

[spoiler show=“Das gibt es hier.“]
[/spoiler]
Zum aufräumen sei noch angemerkt, dass, wie man auch sehen kann, die Behandlung von Wörter mit Leerzeichen als ein Wort mit R so nicht geht, weil tm damit (glaube ich, aber es gibt die Möglichkeit eigene Tokenizer zu benutzen, damit könnte es gehen, wäre aber insgesamt wohl umständlicher..) nicht umgehen kann..

[spoiler show=“Und hier dann das R-Skript“][/spoiler]
Ein Ziel dabei war es auch, dass die Ausgabe möglichst wie die beim Ruby-Skript aussehen sollte.

Edit: An der R-Version schreibe ich immer noch weiter und so habe ich mittlerweile einen Sourcemechanismus für SQLite-Datenbanken implementiert. R ist wirklich nett!

0 Kommentare zu „WordFrequencies in R – More Text Mining

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

*

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.