5  Datenanalyse

Die folgenden Hinweise gelten nur insofern Ihnen die Prüfperson nicht anderslautende Hinweise gegeben hat (schriftlich).

5.1 Allgemeine Hinweise

5.1.1 Formalia

  1. Gegenstand dieser Prüfungsform ist eine Projektarbeit in Form von Analyse eines Datensatzes nach einer Forschungsfrage und die Dokumentation dieser Analyse.

  2. Schreiben Sie Ihre Datenanalyse in Form eines Berichts, der sich an den Gliederungspunkten wie unten dargestellt orientiert.

  3. Richtlinien einer Wortzahl gibt es nicht. Entscheidend ist, dass relevante Analysen durchgeführt und beschrieben wurden. Schreiben Sie so knapp wie möglich und so ausführlich wie nötig.

  4. Der Anspruch richtet sich nach dem Inhalt und Niveau des auf diese Prüfung vorbereitenden Unterricht (auch aus Modulen vorheriger Semester). Oft sind das Module in quantitativer Datenanalyse (und wissenschaftliches Arbeiten). Deren Inhalte sollen im Rahmen dieser Prüfungsleistung als selbständig und flüssig verfügbare Kompetenz von den Studentis demonstriert werden.

  5. Die Gliederung der Arbeit kann sich an den PPDAC-Zyklus und am Data Science Model von Wickham und Grolemund orientieren.

  6. Zu Beginn der Analyse müssen folgende Metadaten gut ersichtlich platziert sein (z.B. auf einem Deckblatt):

  • Vorname Nachname der Autors/der Autorin
  • Matrikelnummer
  • Modulname
  • Abgabedatum
  1. Studentis mit Nachteilsausgleich melden sich (schriftlich) beim Prüfer und zeigen dabei ihren Antrag auf Nachteilsausgleich an.

  2. Achten Sie auf Übersichtlichkeit und ansprechende Gestaltung. Eine Gliederung und nummerierte Abschnitte tragen zur Übersichtlichkeit bei.

  3. Beachten Sie die Grundlagen des wissenschaftlichen Schreibens etwa zu Zitieren und Referenzieren. So sollten etwa Diagramme für sich genommen (in Grundzügen) verständlich sein.

  4. Die Projektarbeit ist nur elektronisch, nicht ausgedruckt einzureichen.

  5. Die Projektarbeit kann in einem paginierten Format (z.B. Word) oder einem nicht-paginierten Format (HTML-Dokument) verfasst werden. Abzugeben ist aber eine PDF-Datei oder eine HTML-Datei, die alle Bilder und sonstige Medien enthält (“Stand-Alone-HTML”). Falls der Bericht auf einem öffentlich zugänglichen Server liegt, reicht es, die URL einzureichen. Der Prüfling trägt aber die Verantwortung, dass der Bericht zugänglich ist (im Zweifel kann zusätzlich zur URL eine Datei mit dem Bericht eingereicht werden).

  6. Die Wahl eines bestimmten Stylesheets ist nicht von Bedeutung. Lesbarkeit und Übersichtlichkeit in der Formatierung sind unabhängig davon anzustreben.

  7. Im Kopfbereich (oder auf einem Deckblatt) sind die relevanten Metadatan anzugeben wie Name (Nachname, Vorname) der Autorin/des Autors, Abgabedatum, Titel der Arbeit, Modul.

  8. Legen Sie Wert auf die Reproduzierbarkeit der Analyse.

  9. Prüfen Sie zu Beginn der Prüfungszeit, ob Sie auf die Daten zugreifen können und diese einlesen können. Melden Sie sich bei Problemen vor Beginn der Prüfungszeit beim Dozenten.

5.1.2 Methodik

  1. Wenden Sie die passenden, im Unterricht eingeführten, statistischen Verfahren an. Es steht Ihnen frei, andere (nicht im Unterricht behandelte) Verfahren zur Analyse der Daten anzuwenden, nach Maßgabe der fachlichen Angemessenheit.

  2. Werten Sie die Daten mit R oder Python aus.

  3. Die R-Syntax soll im Hauptteil des Berichts dokumentiert werden. R-Output soll im Hauptteil berichtet werden, kann aber ggf. gekürzt wiedergegeben werden.

5.1.3 Inhalt

  1. Fügen Sie keine Erklärungen oder Definitionen von gebräuchlichen statistischen Verfahren an.

  2. Beschreiben und interpretieren Sie jede Analyse bzw. jeden R-Code bzw. jedes Ergebnis (jede R-Ausgabe).

  3. Von hoher Bedeutung ist die Korrektheit der Beschreibung und Interpretation der statistischen Modellierung (z.B. mit der Regressionsanalyse).

  4. Es hat keinen Einfluss auf Ihre Note, ob sich ein (erwarteter) Effekt zeigt und wie stark dieser Effekt ggf. ist.

  5. Beschließen Sie Ihre Arbeit mit einer Diskussion der Ergebnisse.

5.2 Einzureichende Dateien

  1. Einzureichen sind folgende Dateien:
  1. der Bericht in menschenlesbarer Form (erstellt mit z.B. Quarto oder Word; s. Formatierungshinweise)
  2. alle weiteren Dateien, die Quellcode der statistische Analysen beinhalten
  3. die Rohdaten
  1. Wenn eine Datei auf einem öffentlich zugänglichen Server liegt, reicht es, die URL zur jeweiligen Datei anzugeben.

  2. Wird der Bericht in einem Notebook-Format (wie Quarto) geschrieben, muss keine zusätzliche Datei mit Quellcode eingereicht werden.

  3. Benennen Sie Ihre Dateien nach folgendem Schema: --., z.B. mustermann-max-01234567.R.

5.3 Prüfungsmaterial

5.3.1 Wo finde ich das Prüfungsmaterial?

Alles Prüfungsmaterial findet sich auf der Moodle-Seite des entsprechenden Moduls (unter Umständen werden Sie dann auf einen anderen Moodlekurs weitergeleitet, aber Sie finden den Zugang stets auf der Moodleseite des betreffenden Moduls).

5.3.2 Wo reiche ich meine Ergebnisse ein?

Sie finden auf der betreffenden Moodleseite einen Abschnitt mit Namen “Einreichen Ihrer Projektarbeit” (o. Ä.). Reichen Sie dort Ihre Projektarbeit ein.

5.4 Zeitplan

Zu Beginn des offiziellen Prüfungszeitraums der Hochschule wird das Prüfungsmaterial veröffentlicht. Dann können Sie mit der Bearbeitung beginnen. Die Abgabefrist der Projektarbeit endet zeitgleich mit dem Verstreichen des Prüfungszeitraums der Hochschule. Während des Prüfungszeitraums haben Sie also Zeit, Ihre Projektarbeit (den Prognosewettbewerb) zu bearbeiten, s. Abbildung 12.2.

Abbildung 5.1: Zeitplan der Bearbeitung des Prognosewettbewerbs

5.5 Beurteilungskriterien

Die Arbeit wird im Hinblick auf drei Kriterien bewertet:

  1. Formalia (z. B. Vollständigkeit der Abarbeitung, Angemessenheit der äußeren Gestaltung, Fokus auf Wesentliche, Übersichtlichkeit, Ästhetik, Reproduzierbarkeit)

  2. Methodik (z. B. Richtige Auswahl und Anwendung der Verfahren, methodisches Verständnis)

  3. Inhalt (z. B. Verständlichkeit, Breite und Tiefe der Problemlösung, Korrektheit der Interpretation)

Sie erhalten für jedes der drei Kriterien eine Teilnote sowie eine Gesamtnote. Außerdem erhalten Sie ggf. für die Kriterien noch ausformulierte Hinweise.

Die Gesamtnote muss sich nicht als Mittelwert der Teilnoten ergeben.

Insbesondere kann eine Fünf in einem der Kriterien zum Durchfallen führen, auch wenn die anderen beiden Kriterien gut oder sehr gut beurteilt wurden.

5.6 Beispiele für Aspekte der Beurteilungskriterien

  1. Wurden deskriptive Statistiken (an angemessenen Ort) berichtet?

  2. Wurden Diagramme und Tabellen angemessen eingesetzt?

  3. Wurde Inferenzstatistik (angemessen) eingesetzt?

  4. Wurden Effektstärkemaße (idealerweise mit Konfidenzintervallen dazu) berichtet?

  5. Wurden alle relevanten Informationen für ein statistisches Verfahren angegeben (z.B. zum gewählten Prior)?

  6. Wurde die Aussagekraft von Modellergebnissen richtig eingeschätzt?

  7. Waren die Schlussfolgerungen, die aus den statistischen Ergebnissen gezogen wurden, angemessen (z. B. wurde erkannt, dass ein Nicht-Verwerfeen einer Hypothese nicht automatisch ein Bestätigen derselben bedeutet)?

  8. Wurde angemessen gerundet (inkl. konsistente Anzahl von Nachkommastellen)?

  9. Passen die statistischen Verfahren zu den Hypothesen?

  10. Wurden die Voraussetzungen der statistischen Verfahren geprüft?

  11. Sind die Ergebnisse reproduzierbar (Daten und Syntax eingereicht)?

5.7 Fundorte für Datensätze

Sofern Ihnen die Prüfperson nicht einen Datensatz zugeteilt hat, können Sie die folgenden Fundorte für Datensätze nutzen, um einen Datensatz für Ihre Analyse zu finden.

5.7.1 Themenübergreifende Fundorte

5.7.2 Klimawandel

5.7.3 Gesundheit und Soziales

5.7.4 Arbeit

5.7.5 Psychologie, divers

5.8 Tipps

  • Chatbots wie ChatGPT können Ihnen helfen, Ihre Idee in Code umzusetzen.
  • Wiederholen Sie die Grundlagen des Datenjudos.
  • Dieses Modul ist sehr angewandt; theoretische Konzepte stehen nicht im Vordergrund. Stattdessen geht es darum, praktische Probleme zu lösen. In solchen Situationen geht Probieren (oft) über Studieren.