HTW Chur

Hochschule für Technik und Wirtschaft

IKT Home > Forschung und Entwicklung > Studierendenprojekte > Studienarbeit 2 (2009)




Einleitung

 

Die Studienarbeit 2 hat sich im Frühlingssemester 2009 mit dem kostenlosen Open Source Statistik-Programm R befasst. Das Programm R ermöglicht auch kleinen und mittleren Unternehmen, statistische Untersuchungen vorzunehmen, die früher wegen der hohen Kosten kommerzieller Statistik-Programme nicht durchgeführt werden konnten.




Plagiatfinder

 

Studierende: Marco Costa, Mario Lanfranchi

 

Kurzzusammenfassung:

 

Das Gebiet der Textanalyse ist riesig. Jeder Teil dieses Gebiets ist interessant und bietet eine Vielzahl von Vertiefungsmöglichkeiten. Das Thema, welches uns am meisten interessiert hat, ist das Erkennen von Plagiaten und wird in dieser Studienarbeit behandelt.

 




 

Contentfilter

 

Studierende: Flavio Steger, Simon Eggler

 

Kurzzusammenfassung:

 

In unserer zweiten Studienarbeit befassen wir uns mit dem Thema Textanalyse. Wir haben vor allem den Bereich des Contentfilterings untersucht und in der Entwicklungssoftware R ein Programm geschrieben. Mit diesem Programm ist es möglich Texte durch zwei Verfahren zu untersuchen.

Beim ersten Verfahren wird der Text als Spam klassifiziert, sobald ein Wort aus der Blacklist im Text vorkommt. 

Beim zweiten Verfahren sind die Wörter in der Blacklist mit einer Gewichtung versehen. Der Text wird danach anhand der Bayesischen Analyse klassifiziert und es wird die Spam-Wahrscheinlichkeit des Textes berechnet und ausgegeben.

 




Cäsarverschlüsselung und One-Time-Pad Verschlüsselung

 

Studierende: Gian-Marco Schmid, Ronny Jan Janzi

 

Kurzzusammenfassung:

 

In dieser Seminararbeit werden die  Verschlüsselungsarten Cäsarcode (Verschiebechiffre) und das One-Time-Pad vorgestellt.

Im Laufe der Studienarbeit wurde in der Programmiersprachen Java und R die Ver- und Entschlüsselungsverfahren für diese Codes entwickelt.

 




Korrelation mit R

 

Studenten: David Brühlmann, Ricco Soder

 

Kurzzusammenfassung:

 

In der zweiten Studienarbeit unseres Studiengangs Telekommunikation/

Elektrotechnik, haben wir uns mit der statistischen Disziplin der Korrelation und

deren Umsetzung mit der freierhältlichen Software R von r-projects, befasst.

Eine Korrelation beschreibt den statistischen Zusammenhang zwischen mindestens zwei Variablen. Es sind sehr viele, sehr teure Softwareanwendungen erhältlich, mit welchen man eine solche Untersuchung durchführen könnte. Daneben sind jedoch auch kostelose Anwendungen auf dem Markt. Bei der Statistiksoftware R handelt es sich um eine solche Open-Source Anwendung.

Als Rohdaten dienten die Messergebnisse, welche während der Diplomarbeit von Ricco Soder an der HFM in Sarnen, gesammelt wurden.

 




Buchstabenhäufigkeit und Spracherkennung

 

Studenten: Emir Arnautović

 

Kurzzusammenfassung:

 

Das Hauptziel dieser Arbeit ist es, einen Einblick in die Statistik und Analysis zu

gewinnen. Des Weiteren soll es möglich sein, die Rohdaten einfach und

unbürokratisch in eine nützliche Statistik umzuwandeln, um so einen schnellen

Überblick zu schaffen und Entscheidungen treffen zu können. Diese Studienarbeit 2 beinhaltet eine Textanalyse bzw. Analyse zur Buchstabenhäufigkeit.

 

Diese Wahl lässt sich einerseits dadurch begründen, dass es sehr interessant ist zu untersuchen, wie oft in welcher Sprache einzelne Buchstaben gebraucht werden und anderseits, wie man zwischen zahlreichen Sprachen und Texten unterscheiden kann.

 




Signifikanz

 

Studenten: Thomas Bärtsch, Claudio Peng

 

Kurzzusammenfassung:

 

Immer häufiger werden Entscheidungen in Politik und Wirtschaft massgebend von Umfragen und Statistiken beeinflusst. Doch wie aussagekräftig sind solche Erhebungen tatsächlich? Kann man ihnen trauen, oder zeigen sie nur das, was wir sehen wollen? Sind sie signifikant?

Vor einer Umfrage sind einige Fragen zu klären: Welches Ziel verfolgt die Umfrage? Welche Zielgruppen sollen angesprochen werden? Wie viele Personen müssen befragt werden, um aussagekräftige Ergebnisse zu erhalten?

 

Mit all diesen Fragen beschäftigt sich die Thematik der Signifikanz. Es gibt zahlreiche verschiedene Tests, die nach der Auswertung der Daten angewendet werden können, um ihre Aussagekraft nachzuweisen. In unserer Arbeit möchten wir drei dieser Tests (der exakte Fisher-Test, der Shapiro-Wilk-Test und der χ2-Test) genauer vorstellen und aufzeigen, auf was für Prinzipien sie basieren.

 

 




Zufallszahlen: Fibonacci-Generator

 

Studenten: Dario Caduff

 

Kurzzusammenfassung:

 

Von Zufall spricht man, wenn ein Ereignis nicht vorhersagbar oder nicht berechenbar ist. Eine Zufallszahl kann mit verschiedenen Verfahren erzeugt werden. Solche Verfahren nennt man Zufallsgeneratoren.

 

Zufallszahlen werden heutzutage bei verschiedenen Methoden der Statistik benötigt, z. B. bei der Auswahl einer Stichprobe. Weitere Anwendungsbeispiele sind die Computer- und Glücksspiele.

 

Bei Zufallszahlen unterscheidet man zwischen echten Zufallszahlen und Pseudozufallszahlen. In praktischen Anwendung genügen häufig die Pseudozufallszahlen. Sie sind nur scheinbar zufällig, da sie nach einem festen, reproduzierbaren Verfahren erzeugt werden. Bei einer gewissen Anzahl von erzeugten Zufallszahlen wiederholt sich die Zahlenfolge.

 

Diese Arbeit befasst sich mit dem Fibonacci-Generator.

 




Zufallszahlen: Mersenne-Twister-Generator

 

Studenten: Dominik Eschenmoser, Michael Schwitter

 

Kurzzusammenfassung:

 

Unsere Arbeit befasst sich mit dem Thema Zufallszahlen: Wie können wir Zufallszahlen generieren und wie zufällig sind diese?

 

Wir stellen den Mersenne-Twister Algorithmus zur Generierung von Pseudozufallszahlen genauer vor und vergleichen ihn mit verschiedenen anderen Algorithmen.

 

Der Mersenne-Twister ist ein Pseudozufallszahlengenerator, der 1997 von Makoto Matsumoto und Takuji Nishimura, beide aus Japan stammend, entwickelt wurde. Bei seiner Einführung verursachte er Aufregung in der Wissenschaft. Ein Grund dafür war sicherlich, dass die ausgegebenen Zufallszahlen sehr gute statistische Eigenschaften haben. Sie sind bis zu einer Dimension von 623 frei von Übereinstimmungen.

 

Studer Martin Studer Martin, Prof., Dipl. Informatik-Ingenieur ETH
Leiter angewandte Forschung und Entwicklung Institut IKT, Standortleiter MSE, Leiter IKT, Professor
Telefon: +41 (0)81 286 24 43
> E-Mail
> Mehr zur Person