Einführung
From DHVLab
Die Aufnahme wissenschaftlicher Forschungsdaten erfolgt in der Regel mit einem Tabellenkalkulationsprogramm wie Calc. Geben Sie ihre Daten nicht zur primären Verarbeitung in Calc selbst ein, sondern ist Ihr Ziel die Sammlung und Aufbereitung von Daten für eine Weiterverwendung in einer Datenbank oder einer statistischen Software wie RStudio oder SSPS, so sollten Sie folgende Grundregeln der Datenaufnahme beachten:
- Benennen Sie Ihre Variablen mit "talking names", d.h. mit aussagekräftigen Bezeichnungen
- Platzieren Sie die Variablen in der ersten Zeile bzw. ersten Spalte Ihres Arbeitsblattes
- Bezeichnungen sollten mit einem Buchstaben beginnen und keine Sonderzeichen enthalten
- Leerzeichen werden durch Unterstriche (_) ersetzt, auf Großbuchstaben sollte gänzlich verzichtet werden
- Verzichten Sie auf Einfärbungen von Zellen oder Zellformatänderungen (z.B. "Zellen verbinden")
Machen Sie sich vorab bereits Gedanken über das Datenbankschema und die Ziele, die sie mit Ihren Daten erreichen möchten. Passen Sie die Struktur in Calc dementsprechend an und geben Sie die Daten standardisiert, diesem Muster folgend, in die Tabelle ein. Die Modellierung der Daten kann selbstverständlich auch zu einem späteren Zeitpunkt in der Datenbank selbst oder in RStudio erfolgen; dennoch raten wir Ihnen zu einer möglichst frühzeitigen Modellierung Ihrer Forschungsdaten. Calc bietet sich hierfür besonders wegen seiner graphischen Benutzeroberfläche an.
Besonderheit CSV-Datei
Wenn Sie eine fremde CSV-Datei erstmals öffnen, kann es vorkommen, dass alle Werte in einer einzigen Spalte angezeigt werden. Dies lässt sich jedoch leicht in die ursprüngliche Form bringen:
- Markieren Sie zunächst die betroffene Spalte (in der Regel Spalte A).
- Über die Schaltfläche "Daten" finden Sie die Option "Text in Spalten".
- Wählen Sie die Art der Spaltentrennung aus (z.B. durch Komma, Tab etc.).
- Ein Klick auf OK führt zur Aufsplittung in mehrere Spalten.