|
von Jürgen Pohl <sept.sapins(at)verizon.net> Über den Autor: Jürgen Pohl arbeitet als Entwicklungsingenieur und Übersetzer an der Pazifikküste der USA. Übersetzt ins Deutsche von: Jürgen Pohl <sept.sapins(at)verizon.net> |
Statistik für JedermannZusammenfassung:
|
Mit seiner eigenen Erfahrung im Hintergrund, war sich der Entwickler von SalStat wohl bewusst, in welcher Klemme sich die neu in die Statistik Eingeführten befinden: um ihr neues Wissen aufzubauen (oder einfach ihre Hausaufgaben oder ein Projekt auszuführen), ist ein erschwingliches, benutzerfreundliches Statistikprogramm erforderlich. Mit diesen Gedanken begann Alan James Salmoni SalStat zu entwickeln. Es wurde unter der GNU-Lizenz veröffentlicht, es ist auf seiner Homepage zu finden.
Leider kann dieser Artikel keine Einführung in die
Statistik anbieten, in ('Ressourcen') finden sich einige Quellen
zu dem Thema.
Nachfolgend die Listen mit den Statistiken und Tests die
SalStat ausführen kann.
N (Gesamtumfang) | Bereich |
Summe | Anzahl der fehlenden Zellen |
Mittelwert | geometrisches Mittel |
Varianz | harmonisches Mittel |
Standardabweichung | Schiefe |
Standardfehler | Kurtosis |
Quadratsumme | Medianwert |
Summe der Abweichungsquadrate | durchschnittliche absolute Abweichung |
Varianzkoeffizient | Modalwert, häufigster Wert |
Minimum | Quartilabstand |
Maximum | Anzahl der spezifischen Datennivaus |
t-Test (paarweise) | Pearsons Korrelation |
t-Test (nicht-paarweise) | Spearmans Rangkorrelation |
Vorzeichentest mit einer Stichprobe | Kendallsche Rangkorrelation |
Vorzeichentest mit zwei Stichproben | Punktbiseriale Korrelation r |
F-Test, Varianzverhältnistest | Lineae Regression |
Wilcoxon Rangsummentest | Einfaktorvarianzanalyse (zwischen Datenreihen) |
Mann-Whitney U-Test | Einfaktorvarianzanalyse (innerhalb einer Datenreihe) |
Kolmogorov-Smirnov-Test | Kruskall-Wallis H-Test |
Paarweiser Permutationstest | Friedmantest |
Bevor wir einen Blick auf SalStat werfen können, muss
das Programm auf unserer Maschine installiert sein, darauf
kommen wir jedoch später - einleitend möchte ich
einen Eindruck von dem Programm geben.
Beim Öffnen des Programms erscheinen zwei Fenster auf dem
Bildschirm (ich muss hier einflechten, dass das Programm nicht
lokalisiert ist, d.h. alle Werkzeuge, Auswahllisten, usw. sind
in Englisch, z.Z. gibt es jedoch eine deutschsprachige Version
des Benutzerhandbuchs - es kann von der Homepage
heruntergeladen werden):
Das Fenster im Vordergrund oben (betitelt 'SalStat Statistics') ist im Tabellenformat: hier geben wir unsere zu analysierenden Daten ein. Am oberen Rand des Fensters das Menü mit den üblichen Werkzeugen - klicken wir auf ein Werkzeug, öffnet sich die zugehörige Dropdownliste zur Auswahl.
Das zweite Fenster ('SalStat Statistcs - Output') ist beim Öffnen leer, dort werden nach Durchführung des Tests die Ergebnisse ausgegeben.
Um dem Einstiegsfrust vorzubeugen, hat der Autor von
SalStat in weiser Voraussicht eine Testdatei beigefügt
(testreport1.txt). Wir geben also die Daten aus dieser
Datei in unsere Tabelle ein, wählen die gewünschten
Statistiken und Tests - nach Bestätigung mit
'Okay' wird kurz darauf das Ergebnis
im Output-Fenster erscheinen.
Der Screenshot unten zeigt diesen Vorgang in dieser
Reihenfolge:
Das Programm kann von seiner Homepage. heruntergeladen werden. Dort finden wir einige Alternativen, um den entsprechenden Betriebssystemen gerecht zu werden. Ich habe zum Beispiel das Programm auf zwei Desktopmaschinen mit unterschiedlichen Betriebssystemen laufen. Der Sourcecode steht ebenfalls zur Verfügung - vielleicht möchte jemand seine Pythonerfahrung demonstrieren und zur Erweiterung des Programms beitragen... Vor der Installation bitte den 'Basic Users Guide' lesen, der auf der SalStat-Homepage unter 'Documentation'zu finden ist. Die Instruktionen dort sind sehr klar, so dass wir diese hier nicht wiederholen müssen.
Eine sehr nützliche Eigenschaft von Salstat ist die
Möglichkeit, durch Skripts persönliche Einstellungen
vornehmen zu können, um Vorgänge zu automatisieren,
eigene Tests zu bauen, usw. Im Handbuch (deutsche Version
herunterladen, falls nötig) finden wir ausführliche
Beschreibungen zum Skripting im Anhang C - API-Details zum
Skripting, das ist auch eine gute Einführung zu diesem
Thema, der Benutzer sollte sich ermutigt fühlen, Skripts
zu schreiben.
Das letzte Werkzeug der Analyse-Dropdownliste führt
direkt zum Skriptingfenster ('Scripting Window'), hier
werden wir unsere Skripts eingeben: probieren wir doch einige
von den Beispielen, die im Handbuch aufgeführt sind, gar
nicht so schwierig, oder...?
Um weitgehende persönliche Anpassungen am Programm
vornehmen zu können, sind Kenntnisse in Python
Voraussetzung - in dieser Sprache ist das Programm geschrieben.
Glücklicherweise ist Python eine freie Sprache, sie kann
also gratis heruntergeladen werden. Ausführliche
Einführungen und Dokumentation für Anfänger und
Experten stehen auf der Python-Webseite zur Verfügung.
Falls sich Ihnen bei dem Gedanken die Haare sträuben - na
ja, SalStat kann einfach benutzt werden wie es ist - mit
Pythonkenntnissen könnten Sie eventuell mehr aus dem
Programm herausholen.
Die Grundidee für SalStat entsprang dem vielfachen Wunsch, ein einfaches Programm zur Verfügung zu stellen, das den Einsteiger ermutigt und den seriösen Benutzer ebenfalls zufriedenstellen kann. Der Benutzer kann sich in der gewohnten Weise einfach durch die Menüs der Statistiken und Tests klicken. Das Handbuch gibt Anweisungen für die Tests, ausserdem einige Hinweise über den Wert der Ergebnisse. Ganz allgemein wird jedoch vorausgesetzt, dass der Benutzer mindestens Grundkenntnisse der Statistik hat oder dabei ist, diese zu erwerben.
Eine Warnung: bevor Sie versuchen, Ihre Karriere als zukünftiger Wissenschaftler auf Daten aufbauen, die Sie mit diesem Programm erzeugt haben, hören Sie auf die Empfehlung des Programmentwicklers und testen Sie das Programm. Anfänger können wahrscheinlich Beispiele mit Testergebnissen in ihren Fachbüchern finden. Tragen Sie einige Daten von Testbeispielen in Salstat ein und vergleichen Sie die Ergebnisse mit denen, die mittels anderer Programme gefunden wurden. Die Testdatei (testreport1.txt) ist ein Anfang, dort sind auch Vergleiche mit den Ergebnissen von Tests mit anderen Programmen aufgeführt.
Wer mit Hilfe seiner bevorzugten Suchmaschine im WWW wühlt, kann in Bezug auf Statistik viele Quellen finden, die besten und umfassensten scheinen in Englisch zu sein.
Der LinuxFocus Redaktion schreiben
© Jürgen Pohl "some rights reserved" see linuxfocus.org/license/ http://www.LinuxFocus.org |
Autoren und Übersetzer:
|
2005-01-14, generated by lfparser_pdf version 2.51