WordFrequencies in R – More Text Mining

Hier ein Update zu meinen Spielchen mit R 😉

Eine Implementierung meiner Anforderungen in Ruby ist ..

.. hier. »

Damit das funktioniert, braucht man auch noch ein Skript, das die Text vorher „aufräumt“.

Das gibt es hier. »

Zum aufräumen sei noch angemerkt, dass, wie man auch sehen kann, die Behandlung von Wörter mit Leerzeichen als ein Wort mit R so nicht geht, weil tm damit (glaube ich, aber es gibt die Möglichkeit eigene Tokenizer zu benutzen, damit könnte es gehen, wäre aber insgesamt wohl umständlicher..) nicht umgehen kann..

Und hier dann das R-Skript »

Ein Ziel dabei war es auch, dass die Ausgabe möglichst wie die beim Ruby-Skript aussehen sollte.

Edit: An der R-Version schreibe ich immer noch weiter und so habe ich mittlerweile einen Sourcemechanismus für SQLite-Datenbanken implementiert. R ist wirklich nett!

Verwendete Schlagwörter: , , ,

0 Kommentare zu „WordFrequencies in R – More Text Mining

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

*

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahre mehr darüber, wie deine Kommentardaten verarbeitet werden.