Einführung in die Tabellenkalkulation (Calc)


Vorwort

Im DHVLab findet sich mit Calc ein kostenfreies Tabellenkalkulationsprogramm, welches zur Eingabe, Auswertung und Visualisierung von Daten dient, die in Form von Zahlen oder Text vorliegen. Mit Hilfe definierter Funktionen lassen sich neue Daten berechnen oder bestehende Datensätze neu kalkulieren. Zur Visualisierung der Arbeitsergebnisse können anschauliche Diagramme erstellt werden.

Calc gehört zur OpenSorce-Produktfamilie LibreOffice. LibreOffice ist eine OpenOffice-Variante, die sich mittlerweile gegen den Mitkonkurrenten OpenOffice.org, von dem sie sich einst abspaltete, durchgesetzt hat1. Insbesondere auf Linux-Distributionen wird mittlerweile fast ausschließlich auf LibreOffice gesetzt. Als freie Softwarealternative zu Microsoft Excel können Excel-Dateien in Calc problemlos verarbeitet werden; dies gilt auch im umgekehrten Fall für den Import von Calc-Dateien in Excel2. Sie können also ohne Bedenken Excel-Dateien von Ihrem Rechner in die DHVLab-Umgebung importieren. Für den unwahrscheinlichen Fall, dass ein Datenimport einmal nicht gelingen sollte, empfiehlt sich die Umwandlung der Excel-Datei in das CSV-Datenformat (Comma-Separated Values), welches von beiden Office-Paketen ausnahmslos eingelesen werden kann (Nachteil: bestehende Formatierungen werden nicht übernommen).

Ziele und Aufbau

Unabhängig von dem Programm, dass Sie verwenden, werden Sie immer wieder mit denselben Fragen und Phänomenen konfrontiert. Zunächst gilt es zu eruieren:

  1. Wie stellt sich das eigene Erkenntnisinteresse dar?
  2. Welche Daten stehen mir zur Verfügung?
  3. Wie viele Daten sind vonnöten, um Signifikanz zu erzeugen?
  4. Ist die Menge der Entitäten groß genug, um Forschungsfragen zufriedenstellend beantworten zu können?3
  5. Kann dadurch die Entscheidung getroffen werden, ob eine quantitative oder qualitative Untersuchung (oder eine Kombination aus beidem) erfolgen sollte?

An diesen Grundsatzfragen orientiert sich die Auswahl der entsprechenden Software. Der Vorteil von Tabellenkalkulationsprogrammen besteht darin, dass Sie eine grafische Benutzeroberfläche zur Datenerfassung und Datenverarbeitung bieten. Die Zellen dienen zur Eingabe von Daten, mit denen anschließend Berechnungen durchgeführt werden können. Hierzu werden wir, nachdem wir uns mit der Oberfläche vertraut gemacht haben, verschiedene Funktionen in Calc und die Bedeutung von Zellbezügen kennen lernen. Große Datenmengen lassen sich in Calc mit Filterwerkzeugen und Pivot-Tabellen analysieren. Ergebnisse können mit Hilfe der vielfältigen Visualisierungsoptionen ansprechend ausgeben.

Ziel ist letztlich immer eine zunehmende Reduktion der anzuzeigenden Daten bei zunehmendem Erkenntnisgewinn über die verbleibenden Daten - zum Beispiel:
Gesamter Datenbestand → Pivot-Tabelle → Diagramm
Ist der Erkenntnisgewinn nach dieser Datenauswahl nicht zufriedenstellend, so gilt es über eine Veränderung der Datenbasis nachzudenken.

Neben dieser Funktion als kompaktes Werkzeug zur Analyse und Visualisierung von Datenmengen, dient Calc in einer Vielzahl von Fällen als Mittel zum Zweck bei der strukturierten Aufnahme von Forschungsdaten für einer anschließende Weiterverarbeitung in Datenbanken oder Statistiksoftware wie RStudio. Hierfür sind grundlegende Kenntnisse der Tabellenkalkulation ebenfalls unabdingbar4. Diese werden Sie sich in unserem Manual aneignen.




Anmerkungen

  1. Artikel zum Wettstreit zwischen den beiden bekannten kostenfreien Office-varianten / Artikel zum Niedergang von OpenOffice↩︎
  2. Artikel über die kaum vorhandenen Unterschiede↩︎
  3. Gegebenenfalls liegt es nahe, die Entscheidung darüber mit einem/r ausgebildeten Statistiker/in abzuwägen.↩︎
  4. Dass in der Wissenschaft diesbezüglich zuweilen Mängel bestehen, beleuchtet dieser kurze Artikel↩︎

Kennenlernen der Oberfläche und grundlegende Funktionsweise

Das Tabellenkalkulationsprogramm Calc öffnen Sie über den Pfad Startbutton → Anwendungen → Büroprogramme → Tabellenkalkulation. Mit Start des Programms öffnet sich eine neue Arbeitsmappe, die als Container für alle zugehörigen Arbeitsblätter fungiert. Standardmäßig befindet sich im Blattregister (unten links) ein Arbeitsblatt (bezeichnet als "Tabelle 1"). Es können bis zu 255 Arbeitsblätter parallel angelegt werden. Zum Umbenennen des Arbeitsblatts genügt ein Doppelklick auf den entsprechenden Reiter im Blattregister. Zum Anlegen neuer Arbeitsblätter klicken Sie auf das grüne Pluszeichen im Blattregister. Möchten Sie ein Arbeitsblatt löschen, so klicken Sie mit der rechten Maustaste auf den entsprechenden Reiter. Planen Sie Ihre Tabelle zu einem späteren Zeitpunkt in eine Datenbank zu importieren, so sollten Sie nur mit einem Arbeitsblatt arbeiten.

Tipp: Speichern Sie Ihre Datei in der Cloud ab, damit Sie stets Zugriff darauf haben: Datei → Speichern unter → Cloud → Documents. Wir benennen unsere Datei "calctest". Standardmäßig wird die Datei im „.ods“-Format (Open Document Spreadsheet) abgespeichert. Mit Klick auf "Dateityp" kann zwischen mehreren Dateiendungen gewählt werden, u.a. auch CSV (Comma Separated Values), welches sich besonders für den Import in phpMyAdmin-Datenbanken eignet. Eine ods-Datei kann auch zu einem späteren Zeitpunkt in eine CSV-Datei umgewandelt werden.

Arbeitsblatt

Ein Arbeitsblatt beruht auf einem Koordinatensystem:

  1. Die Spalten liegen auf der x-Achse und werden durch die Buchstaben A-Z (mit Wiederholungen, also AA, BB etc.) gekennzeichnet.
  2. Die Zeilen liegen auf der y-Achse und werden mit den Ziffern 1 bis 1048576 durchnummeriert.
  3. Die Kreuzungspunkte von Zeilen und Spalten werden als Zellen benannt.
  4. Jede Zelle hat durch das Koordinatensystem eine eindeutige Adresse, z.B. "A1" oder "F26" (= Zellenbezugsystem).

Zentraler Unterschied zu Datenbankentwicklungssoftware wie Microsoft Access/LibreOffice Base: Abgesehen von seiner bezeichnenden Funktion hat der Name einer Zelle keine Aussagekraft. Es gibt keinen Primärschlüssel, die Zeilennummerierung ist variabel. Werden Spalten oder Zeilen gelöscht, so hat dies keine Auswirkung auf die Struktur.

Bearbeitungsleiste und Namenfeld

Das Tabellenfeld wird am oberen Rand durch die Bearbeitungsleiste begrenzt. Dort befindet sich das Namenfeld. Dieses zeigt die aktive Zelle an, d.h. die Zelle, in der sich der Cursor gerade befindet. Durch die Eingabe eines Zellbezugs (z.B. „C15“) springt der Cursor in die gewünschte Zelle. Möchten sie eine Zelle mit einem Namen versehen, so aktivieren Sie das Namenfeld mit einem Doppelklick und geben Sie den gewünschten Namen ein. Über den Reiter neben dem Namenfeld können Sie ab sofort immer direkt zu dem benannten Feld springen. Dies ermöglicht ein bequemes Navigieren durch größere Datensammlungen.

Eingabezeile

Neben dem Namenfeld befindet sich die Eingabezeile zur Eingabe von Funktionen. Die Zeile zeigt den Inhalt der aktiven Zelle an, also einen Wert (Zahl, Text) oder eine Berechnung (Funktion). Über den Reiter rechts der Eingabezeile lässt sich diese aufklappen. Dies ist sinnvoll bei der Eingabe längerer Funktionen. Auf die Icons neben der Eingabezeile werden wir bei den Funktionen zurückkommen.

Statusleiste

Wenden wir uns nun dem unteren Ende der Anzeige zu. Dort befindet sich die sogenannte Statusleiste. Die verschiedenen, mehr oder weniger nützliche Hinweisen zum aktuellen Programmstatus aktivieren Sie durch einen Doppelklick auf das entsprechende Feld. Diese sind im Einzelnen (von links nach rechts):

  1. Navigator: Navigieren u.a. zwischen einzelnen Arbeitsblättern
  2. Seitenvorlage: „Standard“ – von Änderungen wird abgeraten
  3. Funktionsfeld: Rechtsklick zur Auswahl von Standard-Rechenoperationen, z.B. Mittelwert, Summe, Anzahl etc. – markiert man mehrere Zellen im Arbeitsblatt, so wird hier automatisch das Ergebnis der aktuell angewählten Operation angezeigt.
Beispiel Mittelwert: gibt man in die Zellen B3, B4, B5 folgende Zahlenwerte ein: 5, 6, 7 und markiert diese Zellen im Anschluss, so wird im Funktionsfeld "Mittelwert = 6" angezeigt)
  1. Zoomregler und "Maßstab&Ansichtslayout" zur Änderung der Ansicht

Menü, Kontextmenü und Tastenkürzel

Das Menüband umfasst folgende Reiter:
Datei – Bearbeiten – Ansicht – Einfügen – Format – Extras – Daten – Fenster – Hilfe
Die meisten bzw. wichtigsten Befehle, die sich hinter den einzelnen Reitern verbergen, können bequem mit der Maus oder über Tastenkürzel (Shortcuts) ausgeführt werden. Die wichtigsten Shortcuts, die Sie kennen sollten1:

Tastenkürzel

Funktion

Strg A

Alles markieren2

Strg C

Kopieren

Strg X

Ausschneiden

Strg V

Einfügen

Strg Z

Rückgängig

Strg Y

Wiederherstellen

Strg F

Suchen

Strg H

Ersetzen

Strg S

Speichern

Strg O

Öffnen

Strg Mausrad

Ansicht vergrößern bzw. verkleinern


Hinzu kommt das Kontextmenü, welches sich durch Rechtsklick auf eine Zelle öffnet. Dort sind einige zentrale Befehle zu finden, z.B. Zellen einfügen, Zellen löschen, Inhalte löschen. Auch können Kommentare erstellt werden, die anschließend als rotes Dreieck in der rechten oberen Ecke einer Zelle angezeigt werden; beim Überfahren mit dem Cursor wird der Kommentar angezeigt.

Navigation im Arbeitsblatt

Taste(nkombination)

Funktion

Enter

Zelle darunter

Umschalt Enter

Zelle darüber

Tab

Zelle rechts daneben

Umschalt Tab

Zelle links daneben

Bild Auf/Ab

Sprung um eine Bildschirmseite nach oben/unten

Strg →

Sprung zur Begrenzung der x-Achse (= Spalte "AMJ")

Strg ←

Sprung zurück zur ersten Spalte der x-Achse ("A")

Strg ↑

Sprung zur Begrenzung der y-Achse (= Zeile 1048576)

Strg ↓

Sprung zurück zur ersten Zeile der y-Achse (1)3


Zellen markieren

Um eine Spalte komplett zu markieren klickt man auf den entsprechenden Spaltenkopf auf der x-Achse. Selbiges gilt für das Markieren einer Zeile durch Anklicken des Zeilenkopfes. Ein Rechtsklick öffnet das zugehörige Kontextmenü. Dort lassen sich u.a. Spalten einfügen oder die markierte Spalte löschen.
Zellen können entweder mit der Maus oder über die Tastatur markiert werden:

Maus:

Ziehen Sie bei gedrückter linker Maustaste den Cursor über den gewünschten Zellbereich. Sofern nur einzelne, nicht zusammenhängende Zellen markiert werden sollen, klicken Sie die einzelnen Zellen bei gedrückter Strg-Taste an.

Tastatur:
  1. Shift+Umschalt+Pfeiltasten – beliebige Auswahl
  2. Strg+Shift+Pos1 – markiert wird der Bereich ab der Cursorposition bis zur Zelle A1
  3. Strg+Shift+Ende – markiert wird der Bereich ab der Cursorposition zu der untersten, mit Inhalt gefüllten Zelle

Dateneingabe im Arbeitsblatt

Die Zellen im Arbeitsblatt dienen zur Eingabe von Daten. Mit den eingegebenen Werten können Berechnungen vorgenommen werden. Prinzipiell gilt:

  1. Spalten entsprechen den Variablen (z.B. Merkmale), die Zeilen den Untersuchungseinheiten (z.B. Personen).
  2. Zahlen bzw. Werte, die für Berechnungen in Frage kommen, werden rechtsbündig, Text dagegen linksbündig in der Zelle ausgegeben.
  3. Drücken Sie Esc, um eine Dateneingabe abzubrechen.
  4. Drücken Sie F2 oder per Doppelklick in eine Zelle, um ihren Inhalt zu bearbeiten

Ausfüllfunktion – Datenreihen automatisch erstellen

Mit Hilfe der Ausfüllfunktion können automatisch Aufzählungen generiert werden. Nehmen wir an, in der Zelle C1 befindet sich die Zahl 1:

  1. Klicken Sie auf die Zelle. Es erscheint ein schwarzes Kästchen im rechten unteren Eck.
  2. Fahren Sie über dieses Kästchen, so wechselt der Cursor die Form zu einem Kreuz.
  3. Klicken Sie mit der linken Maustaste das Kästchen an und ziehen es nach unten auf.
  4. Sobald Sie die Maustaste loslassen, erscheint eine, von 1 aufsteigende Zahlenreihe (1,2,3,4,5 etc.).

⇔ Markieren Sie dagegen zwei untereinander liegende Zellen selben Inhalts (z.B. 1,1) und ziehen diese auf, so wird die Zahl 1 in die darunterliegenden Zellen kopiert.

Ausfülloptionen beim Kopieren von Daten

Standardmäßig werden beim Kopieren sowohl die Daten als auch die ihnen zugrundeliegenden Funktionen kopiert. Möchte man jedoch nur die Daten als Werte ohne Funktionen kopieren, so wählt man mit einem Rechtsklick an der gewünschten Stelle im Kontextmenü "Inhalte einfügen aus" aus und bestätigt mit OK4.




Anmerkungen

  1. Diese Tastenkombinationen gelten für sämtliche Microsoft Office bzw. LibreOffice Programme!↩︎
  2. Alternativ kann in das Feld zwischen A und 1 geklickt werden.↩︎
  3. Der äußerste Zellenbezug, der in Calc definiert werden kann, ist demnach "AMJ 1048576".↩︎
  4. Hier werden Benutzer der Auto-Ausfüllfunktion von Microsoft Excel etwas gefordert.↩︎

Berechnungen in Calc - Teil 1: Von Formeln und Funktionen

Alle verwendeten Daten und Aussagen sind frei erfunden und spiegeln keine realen Verhältnisse wieder.
Zur besseren Nachvollziehbarkeit empfehlen wir Ihnen, die in der Beispieldatei vorgehaltenen Daten für Ihre Berechnungen zu verwenden, um das Erreichen des Lernerfolges besser nachprüfen zu können.

Vorbereitung

Geben Sie in Ihre Datei zunächst die Spaltenbezeichnungen aus der Beispieldatei ein. Zum Anpassen der Spaltenbreite an die Namen doppelklicken Sie mit der linken Maustaste auf die Trennlinie zwischen zwei Spaltenköpfen.
Auch wenn wir mit unserem Beispiel keinen Designpreis gewinnen möchten, so sei an dieser Stelle darauf verwiesen, dass selbstverständlich Ihrer gestalterischen Freiheit keine Grenzen gesetzt sind. Einige gängige und sinnvolle Design-Anpassungen:

  1. Überschrift zentrieren: Markieren Sie die Zeile bis zum Ende der von Ihnen angelegten Tabelle und klicken Sie auf "Zellen verbinden und zentrieren".
  2. Schriftgröße anpassen
  3. Spaltenüberschriften fett markieren
  4. Trennlinien einfügen: Markieren Sie eine Zeile und klicken Sie auf "Umrandung". Wählen Sie aus, wo die Trennlinie eingefügt wird.

Calc verfügt über eine große Zahl an Funktionen, die es zu einem wirkungsvollen Programm machen. Es stehen Funktionen beispielsweise für mathematische und statistische Berechnungen, für die Bearbeitung von Text, zum Nachschlagen oder Konvertieren von Werten oder zum Zählen von Zellen und Zahlen zur Verfügung. Jede Funktion gibt immer genau einen Wert zurück. Der Datentyp des Rückgabewertes ist abhängig von der durchgeführten Operation. Im Blick auf Formeln und Funktionen wenden wir uns zunächst der Summenfunktion zu, da wir an dieser einfachen Funktion ihre einzelnen Bestandteile und die allgemeine Funktionsweise kennenlernen werden.

Bestandteile einer Funktion

  1. Eine Funktion beginnt immer mit einem Gleichheitszeichen =
  2. Es folgt der lautmalerische Funktionsname, der die Aufgabe der Funktion beschreibt
  3. Es folgt die Argumentliste, begrenzt durch runde Klammern
    1. die Argumentliste enthält die Argumente, mit Hilfe derer die Funktionsaufgabe erledigt werden kann.
    2. Argumente können Text/Zahlen oder ein Verweis auf eine Zelle/einen Zellbereich oder eine Liste von Zellen sein.
  4. Verschiedene Arten von Operatoren
    1. Bezugsoperatoren:
      1. Doppelpunkt definiert einen Zellbereich (hier: B5:B16)
      2. Eine Liste von Zellen wird durch trennende Semikolon erstellt (z.B. B5; B6; B7;)
      3. Ein Leerzeichen zwischen zwei definierten Zellbereichen bildet eine Schnittmenge zwischen den beiden Angaben (B5:B16 C5:C16)
    2. Arithmetische Operatoren:
      1. Sie dienen zur Berechnung eines Wertes (z.B. B1+B2). Folgende Operatoren sind möglich:
        +, -, *, /, ^ (Potenzierung), % (Division durch Hundert); es gilt die mathematische Syntax (Klammerregeln beachten!)
    3. Vergleichsoperatoren

Operator

Operation

Beispiel

Ergebnis

=

ist gleich

4 = 9

falsch

<

kleiner als

3 < 5

wahr

>

größer als

6 > 4

wahr

<=

kleiner gleich als

6 <= 9

wahr

>=

größer gleich als

4 >= 10

falsch

<>

ungleich

8 <> 2

wahr


  1. Operanden, als Platzhalter für Werte (Text-, Zahlenwerte); sie werden direkt in die Formel eingegeben (hier: B5 und B16). Es kann sich dabei auch um andere Funktionen handeln; ihr Ergebnis wird als Wert zurückgegeben, der dann verarbeitet wird.
  2. Konstante Werte werden in eine Funktion eingebunden, in dem man sie in Anführungszeichen setzt.

Ist eine Formel aktiv, so werden die einbezogenen Zellen farbig umrahmt.
Um eine Formel inaktiv zu setzen, genügt ein Hochkomma vor dem Gleichheitszeichen: '=SUMME(B5:B16)

Das Beispiel der Summenfunktion

Möglichkeit 1

Es gibt mehrere Möglichkeiten, eine Summe einzugeben. Beginnen wir - um die Gesamtbesucherzahl eines Jahres für die Alte Nationalgalerie Berlin zu ermitteln - mit der einfachsten Variante:
# Klicken Sie mit der Maus in die Zelle, in der die Summe berechnet werden soll (hier: B17, neben "Gesamt")

  1. Klicken Sie auf das Summensymbol Σ neben der Eingabezeile. Daraufhin wird automatisch ein Funktionsvorschlag gegeben (=SUMME(B5:B16)). Der Bereich, der in die Summe einbezogen werden soll, wird durch einen farbigen Rahmen eingefasst.
  2. Bestätigen Sie durch die Eingabetaste (oder alternativ durch Anklicken des Icons "Übernehmen").

Sie erhalten als Ergebnis die Gesamtbesucherzahl eines Jahres für die Alte Nationalgalerie Berlin.

Möglichkeit 2

Für das Museum Kunstpalast Düsseldorf versuchen wir eine weitere Variante der Funktionseingabe: Hierzu klicken wir auf das Icon "Funktionsassistent", welches sich neben dem Summenzeichen befindet. Im Funktionsassistenten sind in der linken Spalte alle verfügbaren Funktionen aufgelistet. Wählen Sie nun die Funktion "SUMME" aus. Rechts wird daraufhin die Syntax der Funktion (=SUMME(Zahl1; Zahl2; …)) und eine Kurzbeschreibung angegeben ("Summiert die Argumente"). Geben Sie nun in das Summenfeld ein: =SUMME( Beim Eingeben der öffnenden Klammer öffnet sich der Eingabeassistent. Dieser ist Ihnen bei der Auswahl der betroffenen Zellen behilflich. Sie könnten nun alle Zellen, die in die Summe einbezogen werden sollen (hier: Monate Januar-Dezember), einzeln eingeben, getrennt jeweils durch ein Semikolon. Sinnvoller ist es, den betroffenen Zellbereich zu definieren, indem nur der Startwert (hier: Januar) sowie der Endwert (hier: Dezember) angegeben werden, verbunden durch einen Doppelpunkt. Damit wird der gesamte Bereich erfasst (=SUMME(C5:C16)). Bestätigen Sie mit OK.

Möglichkeit 3

Funktionen können auch direkt in die gewünschte Zelle oder die Eingabezeile eingegeben werden. Dies ist der einfachste und gängigste Weg, wenn man die entsprechende Formel kennt. Für die Alte Pinakothek München wenden wir dieses Verfahren an:
Doppelklicken Sie in das Feld D17. Geben Sie =SUMME( ein. Schon nach den ersten Buchstaben erscheint ein Funktionsvorschlag durch Calc. Geben Sie nun die entsprechenden Werte ein (D5:16); alternativ können Sie auch die entsprechenden Zellen anklicken. Bestätigen Sie mit der Eingabetaste.

Übertrag einer Funktion

Sie kennen nun die drei Varianten der Eingabe einer (Summen)Funktion in Calc. Wenn Sie wie im vorliegenden Fall mehrere Felder haben, in denen dieselbe Berechnung durchgeführt werden soll (hier: Gesamtbesucherzahl für versch. Museen), so ist es ausreichend, wenn Sie die Funktion nur einmal eingeben und durch Aufziehen der Zelle auf andere betroffene Zellen erweitern:
Hierfür klicken Sie das Feld D17 (Gesamtwert Alte Pinakothek München) an, klicken auf das kleine schwarze Kästchen unten rechts und ziehen mit dem Cursor via E17 nach F17. Somit übertragen Sie die Funktion bequem auf diese Felder.

Allgemein gilt: Bei Formeln handelt es sich um Berechnungsanweisungen. Verändert sich ein Wert innerhalb des von der Formel abgedeckten Zellenbereiches, so aktualisiert sich das Ergebnis automatisch (Test: Geben Sie in das Feld D7 anstelle "30475" die Zahl "31475" ein).

Weitere grundlegende Funktionen

An dieser Stelle möchten wir noch ein paar weitere, grundlegende Funktionen kennenlernen:

  1. Mittelwert:
    Wie viele Besucher kommen über das Jahr verteilt durchschnittlich in die Alte Nationalgalerie zu Berlin? Geben wir hierzu die Formel für den Mittelwert samt der Grenzen des Zellbereichs [B5 = Januar, B16 = Dezember] ein:
    =MITTELWERT(B5:B16) Zur Kontrolle können Sie den Zellbereich B5:B16 mit dem Cursor markieren und im Funktionsfeld der Statusleiste durch Rechtsklick die Rechenoperation "Mittelwert" auswählen.
  2. Minimum-Wert:
    In welchem Monat sollte der Kunstpalast Düsseldorf eine Renovierungsmaßnahme durchführen? Sinnvoll erscheint der Monat mit der geringsten Besucherzahl. Geben wir hierzu die Formel für den Minimum-Wert ein: =MIN(C5:C16)
    Schöner ist natürlich, wenn nicht der Wert an sich angegeben wird, sondern der entsprechende Monatsname. Um diesen angezeigt zu bekommen, müssen mehrere Calc-Funktionen miteinander verkettet werden:
    INDEX(A5:A16) liefert den Inhalt aus den Monatsnamen
    VERGLEICH(C5:C16) findet in einem Zellbereich den gewünschten Wert; dieser ist in unserem Fall der Minimalwert, weshalb wir in die Funktion VERGLEICH die oben angeführte Funktion MIN(C5:C16) einbinden.
    Dies ergibt folgende Formel:
    =INDEX(A5:A16;VERGLEICH(MIN(C5:C16);C5:C16;0))
    Das Ergebnis lautet: September
  3. Maximum-Wert:
    Im Gegensatz dazu möchte die Alte Pinakothek im besucherreichsten Monat mehr Personal für Führungen einstellen; welcher Monat ist dies?
    =MAX(D5:D16)
    Auch hier ist die Ausgabe als Monatsname sinnvoll. Wenden wir daher erneut die INDEX-Funktion mit dem VERGLEICH an:
    =INDEX(A5:A16;VERGLEICH(MAX(D5:D16);D5:D16;0))
    Das Ergebnis lautet: März

Berechnungen in Calc - Teil 2: Zellbezüge und Anwendungsbeispiele

Verschiedene Arten von Zellbezügen

  1. Relativer Zellbezug
    Im vorangehenden Kapitel haben Sie bei der Berechnung der Besucherzahlen und der Anwendung der einzelnen Funktionen bereits eine von drei möglichen Varianten des Zellbezuges kennengelernt, nämlich den relativen Zellbezug. Beim relativen Zellbezug verändert sich der Bezug relativ zur Ausgangsposition, d.h. beim Kopieren von Formeln passt das Programm die Zelladresse automatisch an den neuen Zellbereich an.
  2. Absoluter Zellbezug
    Im Gegensatz dazu steht der absolute Zellbezug. Der absolute Zellbezug bezieht sich immer auf eine fest definierte Zelle. Der Zellbezug wird beim Kopieren nicht verändert. Feste Werte werden durch ein Dollarzeichen ($) gekennzeichnet, z.B.: $C$2: sowohl die Spalte C als auch die Zeile 2 sind absolut gesetzt und damit unveränderlich bei Berechnungen.
  3. Gemischter Zellbezug
    Eine dritte Variante sind gemischte Zellbezüge, sprich die Kombination aus relativen und absoluten Zellbezügen. Es wird unterschieden in absolute Zellbezüge, d.h. die Zelle ist absolut gesetzt, während die Spalte relativ bleibt (z.B. A$4: Die Spalte ist veränderbar, jedoch immer in Bezug auf die Zellen in Zeile 4). absolute Spaltenbezüge, d.h. die Spalte ist absolut gesetzt, während die Zelle relativ bleibt (z.B. $A4: Die Spalte A ist unveränderlich, variieren können dagegen die Zellen).

Beispielrechnungen mit Zellbezügen

Beispiel 'Absoluter Zellbezug': Mehrwertsteuer

Für das Beispiel "Mehrwertsteuer" öffnen wir ein neues Arbeitsblatt. Übertragen Sie die Daten aus der verlinkten Datei (coming soon) und passen Sie das Format der Tabelle entsprechend an. Klicken Sie auf das Eurozeichen in der Bearbeitungsleiste, um den Daten Werte zuzuordnen.

  1. Berechnung Gesamtpreis ohne Mehrwertsteuer: Hierzu multiplizieren wir die Zelle "Anzahl" mit der Zelle "Stückpreis ohne MwSt." (hier: =B3*C3). Für die weiteren Berechnungen ziehen wir mit dem Cursor von D3 nach D6, damit die weiteren Gesamtpreise ohne MwSt. automatisch ausgefüllt werden (= relativer Zellbezug). Die Gesamtsumme ohne MwSt. ermitteln wir in der Zelle D7 über den bekannten Weg der Summenfunktion.
  2. Berechnung Gesamtpreis mit Mehrwertsteuer Es folgt nun die Berechnung mit Mehrwertsteuer (= absolute Zellbezug). Die Mehrwertsteuer befindet sich in unserem Fall in der Zelle I2 und beträgt 19% (Ein Klick auf das Prozentzeichen formatiert den Zahlenwert in Prozent). Da sich die Mehrwertsteuer in der Rechnung nicht verändern soll, wenden wir einen absoluten Zellbezug an. Um den Gesamtpreis mit Mehrwertsteuer zu ermitteln geben wir in der entsprechenden Zelle (E3) folgende Formel ein: =D3+D3*$I$2 ("D3 addiert um den Preis multipliziert mit der MwSt").
    Auch dieses Ergebnis können Sie wieder für alle folgenden Fälle nach unten automatisch ausfüllen und unter der Berechnung die Summe (hier E7) angeben. Damit haben Sie den Gesamtpreis inkl. MwSt. des Einkaufs im Museumsshop ermittelt.
Beispiel 'Gemischter Zellbezug': Museumsshop

Zunächst kopieren wir wiederum die Werte aus der verlinkten Datei (coming soon) in die Tabelle (Zelle A9). Wir möchten in dieser Beispielrechnung sehen, wie sich der Verkauf der Postkarten von Dürer, Cranach und Botticelli im Museumsshop im Laufe der Jahre prozentual verändert hat.
Nachdem wir die Werte übertragen haben, tragen wir mit einer Zeile Abstand darunter nochmals die Jahreszahlen (2012-2015) in Spalte A ein. Beginnen wir mit der Prozentberechnung in der Zelle neben 2012 (B15): Um den Wert für Dürer im Jahr 2012 zu erhalten, müssen wir die Anzahl der verkauften Dürerpostkarten durch die Summe aus allen verkauften Karten dividieren: =B10/($B10+$C10+$D10)1
Der relative Spaltenbezug gibt in diesem Beispiel an, dass die Werte immer aus derselben Spalte stammen, die Zelle jedoch relativ ist. Dadurch ist es möglich, das Ergebnis durch Aufziehen auf die anderen Zellen für das Jahr 2012 zu übertragen und anschließend die Formel auch auf die anderen Jahre ebenfalls durch Aufziehen zu übertragen2. Das (exemplarische) Ergebnis lautet: Die Dürerpostkarten behalten über die Jahre hinweg einen relativ konstanten Marktanteil von ca. 35%.

Fernbezüge

An dieser Stelle soll auch auf das Thema Fernbezüge eingegangen werden. Es kann selbstverständlich auch auf andere Tabellenblätter oder gar andere Excel/Calc-Dateien Bezug genommen werden und z.B. innerhalb einer Funktion eine Zelle aus einer anderen Arbeitsmappe oder Datei verwendet werden. Veranschaulichen wir dies anhand des Beispiels zur Mehrwertsteuerberechnung:
Hierzu findet sich eine separate Calc-Datei mit dem Namen "Mehrwertsteuer" .

  1. Öffnen Sie die Datei.
  2. Gehen Sie nun zurück in die Zelle, in der wir zuvor den Gesamtpreis mit MwSt. berechnet hatten (E3).
  3. Löschen Sie den bisherigen absoluten Zellbezug auf die MwSt.
  4. Gehen Sie in die Datei "Mehrwertsteuer" und klicken Sie dort das Feld mit dem Prozentwert (A5 = 18%) an. Die farbige Markierung zeigt Ihnen, dass der Wert in die Formel eingebunden wird. Gehen Sie zurück in die Ausgangsdatei und bestätigen Sie mit Enter. Wie Sie sehen wird der Dateipfad [#$Tabelle1.$A$5] in der Eingabezeile angezeigt; der Wert hat sich durch die niedrigere Mehrwertsteuer entsprechend verändert.

Vertiefende Rechenaufgaben

Top-Monate der Museen

Kehren wir zurück zu Tabelle 1 (Besucherzahlen).
Hier hatten wir zuvor bei der Alten Pinakothek den Monat ausgegeben, in dem die meisten Besucher gezählt wurden: =INDEX(A5:A16;VERGLEICH(MAX(D5:D16);D5:D16;0))
Wir möchten nun auch den jeweiligen Top-Monat für die beiden nachfolgenden Museen ermitteln. Da wir soeben die Zellbezüge kennengelernt haben, merken wir, dass die genannte Formel ohne einen gemischten Zellbezug bei den Monatsnamen nur bedingt Sinn macht. Ergänzen Sie daher A5 und A16 jeweils um ein Dollarzeichen, um den Spaltenbezug für die Monatsnamen absolut zu setzen: $A5:$A16
Die Formel =INDEX($A5:$A16;VERGLEICH(MAX(D5:D16);D5:D16;0)) kann für die beiden anderen Museen entsprechend aufgezogen werden. Es ergeben sich nun sinnvolle Werte ("Februar" und "März").

Staatlich vs. privat: Besucherzahlen

Berechnung für staatliche und nicht-staatliche Museen – Besucherzahlen in Prozent Um uns noch ein wenig mit den erlernten Formeln und Berechnungen, die Calc bietet, vertraut zu machen, werden wir noch eine weitere Prozentrechnung durchführen. Ziel ist eine vergleichende Berechnung der prozentualen Besucherzahlen staatlicher und nicht-staatlicher Museen.
Nehmen wir an, der Kunstpalast Düsseldorf und das Städel Museum sind privat, die restlichen drei Museen staatlich. Nun möchten wir sehen, welche Trägerschaft mehr Besucherzahlen aufweist. Hierzu legen wir je eine weitere Spalte für "Mittelwert staatlich" (G1) und "Mittelwert privat" (F1) an.
Berechnen wir mit der uns bekannten Mittelwertfunktion zunächst die beiden Mittelwerte:

  1. staatlich: =MITTELWERT(B17;D17;E17) → 258.358 (ohne Nachkommastellen)
  2. privat: =MITTELWERT(C17;F17) → 225.848 (ohne Nachkommastellen)

Anschließend berechnen wir die entsprechenden Prozentwerte in der Zelle darunter:
=G17/(G17+H17) bzw. H17/(G17+H17)
Ergebnis: Die staatlichen Museen liegen prozentual gesehen bei den Besucherzahlen leicht vor den privat getragenen Einrichtungen (53,36% zu 46,64%).




Anmerkungen

  1. Damit der Wert als Prozentangabe ausgegeben wird, klicken Sie auf das entsprechende Symbol (und können die Anzahl der Nachkommastellen nach Belieben einstellen).↩︎
  2. Hinweis zur Kontrolle: Die Quersumme muss immer 100% betragen.↩︎

Fehlermeldungen in Calc

Fehlermeldungen sind zunächst immer ärgerlich. Wenn man jedoch versteht, was hinter den einzelnen Fehlermeldungen steckt, können Sie in den meisten Fällen relativ leicht behoben werden.
Häufige Ursachen für Fehler:

  1. Eine Funktion wurde nicht durch das Gleichheitszeichen eingeleitet
  2. Eine Klammer ist nicht geschlossen
  3. Es fehlen für die Funktion erforderliche Elemente

Einige Fehler werden bei der Eingabe von Calc als solche kenntlich gemacht, eingeleitet durch eine Raute (#); eine Auswahl:

Fehleranzeige

Bedeutung

#DIV/0!

Division durch Null

#NUM!

Ungültige numerische Werte

#NAME?

Ein Bezeichner konnte in der Formel nicht ausgewertet werden

#WERT!

Zellen in der Formel besitzen unterschiedliche Datentypen

#BEZUG!

Ungültiger Zellbezug, ausgelöst durch das Löschen einer Zeile oder Spalte, die in der Formel Verwendung findet


Daneben gibt es eine Reihe an allgemeinen Fehlermeldungen, die durch eine Nummer klassifiziert sind (z.B. Err502: Funktion besitzt ein ungültiges Argument).

Für eine ausführliche Zusammenstellung zum Thema Fehlermeldungen empfehlen wir Ihnen die umfassende Auflistung bei OpenOffice.org.


Visualisierung mit Calc

Bei Visualisierungen handelt es sich um eine grafische Darstellung von Forschungsdaten und der Beziehungen zwischen Daten. Ziel von Visualisierungen ist das Erlangen von Erkenntnissen, die ohne sie nur schwer begreifbar wären.
Visualisierungen müssen stets drei Kriterien erfüllen:

  1. Informationsgehalt
  2. Nachprüfbarkeit
  3. Effizienz (anschaulich und auf das Wesentliche beschränkt)

Folgende Fragen sollten Sie sich vor der Erstellung einer Visualisierung stets stellen:

  1. Welche Aussagen möchte ich mit einem Diagramm treffen?
  2. Welche Beziehungen zwischen Daten sollen visualisiert werden?
  3. Welche Daten sollen in die Visualisierung eingebunden werden?
  4. In welchen Medien wird die Visualisierung zur Darstellung kommen?

Skalierung

Es wird unterschieden zwischen Primär- und Sekundärachsen. Primärachsen umfassen die Größen- (y-Achse) und Rubrikenachse (x-Achse). Sie sind standardmäßig bei den meisten Diagrammtypen vorhanden. Sekundärachsen werden bei Bedarf zusätzlich zu den eben genannten Achsen am rechten und/oder oberen Rand der Zeichnungsfläche ergänzt. Dies hat den Zweck, dass Datenreihen sinnvoller angezeigt werden können, wenn diese unterschiedliche Intervalle oder Maßeinheiten nutzen.

  1. y-Achse (Größenachse): Werte werden in linearer Reihenfolge aufgetragen; es wird eine Einheit für die gezeigten Ausprägungen angegeben.
  2. x-Achse (Rubrikenachse): Bezeichnungen der Merkmale werden aufgetragen oder ein zeitlicher Ablauf abgebildet.
  3. Legende: Die Legende bietet für die dargestellten Datenreihen die entsprechende Erläuterung und erleichtert damit das Verstehen des Diagramms. Zusätzlich sollte jedem Diagramm eine Überschrift beigefügt werden.

Gängige Visualisierungsformen

Tabellenkalkulationsprogramme wie Calc bieten eine Reihe an Visualisierungsmöglichkeiten in Form von Graphen und Diagrammen. Diese basieren stets auf den Daten eines Arbeitsblattes. Änderungen am Datenbestand wirken sich automatisch auf die Visualisierung aus.
Es stehen zahlreiche verschiedene Diagrammtypen zur Auswahl. Die wichtigsten sollen an dieser Stelle kurz vorgestellt werden:

Säulendiagramm:
- Säulendiagramme sind eine höhenproportionale Darstellung einer Häufigkeitsverteilung.
- Die einzelnen Säulen, senkrecht auf der x-Achse stehend, visualisieren minimale und maximale Werte.
- Die Höhe einer Säule spiegelt den Wert eines Merkmals wider.
- Es sollten nicht mehr als 15 Säulen in einem Diagramm verwendet werden. Bei mehr Ausprägungen ist ein Liniendiagramm anzuwenden.
- Säulen können gruppiert oder gestapelt ausgegeben werden.
Anwendungsgebiet (Beispiel): Ausstellung von Urkunden eines Herrschers pro Jahr
Balkendiagramm:
- Ein um 90° gedrehtes Säulendiagramm, bei dem die Balken von der y-Achse abgehen (liegende Säulen = Balken).
- Ein Balkendiagramm eignet sich insbesondere zum Vergleich absoluter und relativer Werte eines Merkmals.
Anwendungsgebiet (Beispiel): Rangfolgen (z.B. auf- oder absteigende Einwohnerzahlen)
Torten- oder Kreisdiagramm:
- Visualisierung des Verhältnisses von Teilmengen zu einer Gesamtmenge.
- Anordnung der Flächen im Uhrzeigersinn, beginnend mit der größten Teilmenge bei der 12-Uhr-Linie.
- Möglichkeit, ein ausgewähltes Segment durch Trennung von den restlichen Teilmengen exponiert darzustellen: wählen Sie das entsprechende Segment (Datenpunkt) aus; mit Hilfe der gedrückt gehaltenen linken Maustaste können Sie das ausgewählte Segment beliebig platzieren.
- Kritik:
-- Kreisdiagramme werden mit zunehmender Zahl an Ausprägungen schnell unübersichtlich (nicht mehr als 7 verwenden).
-- Es kann zudem nur eine Datenreihe (d.h. eine Zeile oder Spalte) abgebildet werden (= Eindimensionalität); für einen Vergleich müssen also zwei Diagramme erstellt werden.
-- Auch kann die Farbwahl zu einer ungewollten Verzerrung der Aussage beim Betrachter führen.
Anwendungsgebiet (Beispiel): Prozentualer Anteil verschiedener Nationalitäten an Gesamtbevölkerung
Linien- oder Kurvendiagramm:
- Datenpunkte werden mit Hilfe einer Linie verbunden.
- Abbildung eines Trends zu einem bestimmten Zeitpunkt oder einer Veränderung von Werten in einem zeitlichen Verlauf.
- Möglichkeit, Bezugslinien (zur x-Achse) oder Spannweitenlinien (zu anderen Linien) einzufügen. Einzelne Datenpunkte können hervorgehoben werden.
Anwendungsgebiet (Beispiel): Bevölkerungsentwicklung

Ratschläge zur visuellen Gestaltung

Der visuellen Ausgestaltung der Diagramme sind dabei keine Grenzen gesetzt. Dennoch sollte man folgende Ratschläge bei der Erstellung berücksichtigen:

  1. Bei farbigen Diagrammen sollten nicht zu viele unterschiedliche Farben zum Einsatz kommen
  2. Die verwendeten Farben sollten auf dem selben Farbton basieren
  3. Bei schwarz-weiß-Publikationen sollten verschiedene Grautöne Verwendung finden; von Schraffuren wird abgeraten, da Längs- und Querstreifen das Ergebnis optisch verkleinern bzw. verbreitern.
  4. Zusätzliche Gitternetzlinien erleichtern das Auswerten von Diagrammen
  5. Der Einsatz von zusätzlichen Beschriftungen kann sinnvoll sein
  6. Der Einsatz einer Trendlinie im Graph kann sinnvoll sein, um Entwicklungen nachvollziehbarer zu gestalten

Anwendungsbeispiel

Gehen wir zurück zur Tabelle mit den Besucherzahlen der einzelnen Museen. Wir möchten diese in Form eines Säulendiagramms visualisieren, in dem die Monate auf der x-Achse, die Besucherzahlen auf der y-Achse angelegt werden. Die Höhe der Säulen entspricht den Besucherzahlen des jeweiligen Museums.

  1. Klicken Sie in eine beliebige Zelle in der (gleichen) Tabelle.
  2. Klicken Sie anschließend auf die Schaltfläche Diagramm. Es öffnet sich der Diagramm-Assistent.
  3. Diagrammtyp: Zunächst können Sie den gewünschten Diagrammtyp wählen.
  4. Datenbereich: Wählen Sie den Datenbereich, der in die Visualisierung einbezogen werden soll. Ziehen Sie mit der Maus ein Rechteck über den gewünschten Datenbereich (in unserem Beispiel: $Tabelle1.$A$4:$F$16). Beziehen Sie auch die Beschriftungen ein, da diese die Achsen in Ihrem Diagramm bezeichnen werden. Ab diesem Zeitpunkt wird Ihnen das Diagramm im Entwurfstadium bereits angezeigt.
  5. Datenreihe: Nun können Sie die speziellen Datenbereiche für die Datenreihen auswählen; in unserem Beispiel sind dies die einzelnen Museen. Sie können beispielsweise nur einzelne Museen für die Darstellung im Diagramm auswählen.
  6. Diagrammelemente: Abschließend können Sie noch Titel, Untertitel und Achsenbeschriftungen eingeben. Wir wählen den Titel "Besucherzahlen in deutschen Museen".
  7. Beenden Sie die Bearbeitung durch Klick auf Fertigstellen.
  8. Ziehen Sie das Diagramm auf, damit alle Monatsnamen und zugehörige Werte angezeigt werden.
  9. Um die standardmäßig zugeteilten Farben zu ändern (z.B. in ein einheitliches Farbschema zu bringen), doppelklicken sie auf das Diagramm und wählen Sie mit der rechten Maustaste die entsprechende Säule aus: Datenreihe formatieren.

Darüber hinaus können weitere Formatierungen vorgenommen werden, z.B. Datenbeschriftungen an den einzelnen Säulen oder Trendlinien (es empfiehlt sich "Polynomisch") einfügen.

Als Zusatzaufgabe können Sie nun ein Balkendiagramm erstellen, welches nur drei Museen aufnimmt und ebenfalls eine Trendlinie verwendet.

Export von Diagrammen

Diagramme können direkt aus dem Tabellenkalkulationsprogramm in ein Textverarbeitungsprogramm exportiert werden. Vorgehen:

  1. Öffnen Sie LibreOffice Writer (Start – Anwendungen – Büroprogramme).
  2. Kopieren Sie das erstellte Diagramm in das Textdokument (Strg CStrg V).
  3. Ein Rechtsklick in das Diagrammfeld ermöglich eine unmittelbare Bearbeitung des Layouts in der Textdatei.
  4. Ebenso können über "Diagramm-Datentabelle" direkt Änderungen am Datenbestand vorgenommen werden.

Eine weitere Möglichkeit ist der statische Export als Bilddatei, die sich ebenfalls beliebig andernorts einbinden lässt:

  1. Rechtsklick auf die Abbildung
  2. "Als Bild exportieren"
  3. Speichern Sie vorzugsweise im PNG-Format (Portable Network Graphic), da in diesem Format die meisten Bildinformationen abgespeichert werden.

Pivot-Tabellen: interaktive Tabellen zur Analyse von Daten

Tabellenkalkulationsprogramme wie Calc sind vielseitig einsetzbar. Wir haben einerseits seine Funktion zur strukturierten Aufnahme von Forschungsdaten für die anschließende Weiterverwendung in Datenbanken oder Statistiksoftware, andererseits seine Funktionsweise bei der alltäglichen Verwaltung oder projektbezogenen Verarbeitung von Datenmengen kennengelernt.

Pivot Tabellen

Neben diesen Einsatzgebieten kann man größere Forschungsdatensammlungen auch direkt in Calc auswerten. Hierzu eignet sich die Verwendung von Pivot-Tabellen im Besonderen, d.h. interaktive Tabellen zur

  1. Auswertung, Gruppierung und Aggregation von Daten
  2. Neuordnung und Analyse von Daten
  3. bequemen und wirkungsvollen Analyse von großen Datenbeständen auf beliebige Kriterien hin.

Wichtig: Calc bietet viele Möglichkeiten der Gestaltung, Formatierung etc. Dies ist für den Einsatz als Bürosoftware sinnvoll und schön. Bei der Verwendung des Programms zur Datenaufnahme oder –analyse sollte auf ihren Einsatz möglichst verzichtet werden, da Pivot wie auch externe Programme Gefahr laufen, diese fehlerhaft zu interpretieren. Devise: Keep it simple!
Pivot-Tabellen besitzen den Vorteil, dass auf ihrer Datengrundlage Berechnungen durchgeführt werden können, ohne dabei den Ausgangsdatenbestand zu verändern. Die Ursprungsdaten bleiben stets erhalten.
Grundvoraussetzung ist eine umfangreiche, aussagekräftige und gut strukturierte Datensammlung. Daher gilt es sich vorab zu überlegen:

  1. Welche Daten werden für die Beantwortung meiner Fragestellung benötigt?
  2. Welche Fragen können auf welche Weise in einer Pivot-Tabelle beantwortet werden?
  3. Welche Beziehungen zwischen Daten sollen ermittelt werden?

Wir werden uns im Folgenden der Arbeit mit Pivot-Tabellen anhand der Künstlernamen-Datei (artists.csv1) des Museum of Modern Art (MoMa) nähern. Diese umfasst 14.770 Einträge. Die Datei wurde aus der MySQL-Datenbank heruntergeladen; anschließend wurden für die folgenden Übungszwecke unnötige Spalten entfernt. Die Tabelle umfasst folgende Spalten:

  1. Name
  2. Nationalität
  3. Geschlecht
  4. Geburts- und
  5. Sterbejahr

Glätten des Datenbestands

Da bei uns allein die Künstler im Fokus des Interesses stehen, gilt es den Datensatz zunächst noch auf Sinnhaftigkeit hin zu überprüfen. Dabei fällt beim Durchscrollen folgendes auf:

  1. Einträge, die ein Geburtsdatum angeben, welches unwahrscheinlich modern ist (z.B. 2000)
  2. Einträge, die weder Nationalität noch Geschlecht verzeichnen (jeweils NULL)

Bei der Nationalität ist Nationality unknown von NULL zu unterscheiden. Während in ersterem Fall die Nationalität nicht bekannt ist, wurde bei NULL kein Eintrag in der Datenbank vorgenommen; es könnte also sein, dass die Nationalität zwar ermittelbar ist, jedoch (noch) nicht eingetragen wurde.
Filtern wir zunächst einmal alle Einträge heraus, die weder einen Eintrag bei Geschlecht noch bei Nationalität besitzen:
Reiter "Daten" → Filter → Standardfilter
Feldname "Nationalität" – Bedingung "=" – Wert "NULL"
UND
Feldname "Geschlecht" – Bedingung "=" – Wert "NULL"

  1. Wählen Sie in der Statusleiste Anzahl aus, um zu erfahren, wie viele Datensätze betroffen sind: 3593
  2. Löschen Sie alle betroffenen Einträge: Markieren Sie zunächst alle Spalten und gehen Sie auf Bearbeiten → Inhalte löschen und bestätigen Sie mit OK2.
  3. Markieren Sie anschließend wiederum Spalte A-E und heben Sie die Filterung auf:
    Daten → Filter → Standardfilter → Feldname "keiner".
  4. Es werden nun alle Datensätze angezeigt, die nicht von der Löschung betroffen waren.
  5. Geblieben sind die Leerzeilen, die im nächsten Schritt zu tilgen sind: Markieren Sie abermals die Spalten und gehen Sie in den Standardfilter. Wählen Sie dort bei Spalte A (oder einer beliebigen anderen Spalte) bei "Wert" aus, dass dieser "Nicht leer" ist. Nun werden alle entsprechenden Zeilen angezeigt; die leeren Zeilen sind zu diesem Zeitpunkt zwar nicht sichtbar, jedoch noch vorhanden. Um diese endgültig zu tilgen reicht es aus, die aktuelle Auswahl zu kopieren (Strg C) und in einem neuen Tabellenblatt wieder einzufügen (Strg V).

Selbiges wiederholen wir nun für die Einträge, die verdächtig hohes "Geburtsjahr" aufweisen; dieses ist häufig ein Indiz dafür, dass es sich um eine Institution handelt.

  1. Filtern wir also wie gewohnt, diesmal nach "Geburtsjahr" größer als "1989". In der Tat handelt es sich bei dem ausgegebenen Ergebnis fast ausschließlich um Firmen. Die qualitative Sichtung des Ergebnisses ergibt: Die wenigen (sehr jungen) Künstler, bei denen es sich um reelle Personen handelt, sind erkennbar an der Geschlechtsangabe.
  2. Löschen wir nun alle Einträge bis auf die eben genannten Personen.
  3. Markieren wir anschließend wiederum alle Spalten und heben die Filterung auf.
  4. Löschen wir wie eben gelernt erneut die Leerzeilen durch Filtern und Kopieren in ein neues Tabellenblatt.

Unsere Datensammlung umfasst nun 12.902 Einträge. Passen wir die neue Tabelle an, in dem wir

  1. die Spaltenbreite auf die Länge des Inhalts aufziehen
  2. über der ersten Datenzeile wiederum die Beschriftung einfügen: Name, Nationalität, Geschlecht, Geburtsjahr, Sterbejahr.
  3. unsere Tabelle im Reiter unten links in "artists" umbenennen.

Erstellen der Pivot-Tabelle

Nun haben wir den Datensatz für unsere Zwecke aufbereitet und können eine Pivot-Tabelle erstellen3.

  1. Markieren Sie zunächst die Spalten, die sie in Ihre Pivot-Tabelle einbeziehen möchten.
  2. Klicken Sie dann auf Daten → Pivot-Tabelle → Erstellen.
  3. Es öffnet sich das Menü "Pivot-Tabellen Layout".
    Rechts sehen Sie die verfügbaren Felder aus Ihrer Auswahl.
    Links finden sich einzelne Aktionsbereiche, denen Sie nun die einzelnen Spalten zuordnen können.
    In der Regel sollten Sie mindestens ein Zeilenfeld und ein Datenfeld befüllen. Dies erfolgt indem Sie per Drag&Drop eines der verfügbaren Felder einem Bereich zuordnen (Das Löschen erfolgt durch Anklicken und Drücken der Entfernen-Taste).
  4. Sobald ein Feld zugeordnet wurde, können Sie mit einem Doppelklick in das entsprechende Feld das Kontextmenü öffnen. Dieses hält mehrere grundlegende statistische Auswertungsmöglichkeiten bereit. Indem man zusätzlich ein Spaltenfeld mit einbezieht und dadurch eine sogenannte Kreuztabelle erstellt, erhält die Pivot-Tabelle eine größere Aussagekraft.

Anwendungsbeispiel

Erkenntnisinteresse: Wir möchten ermitteln, wann – geordnet nach Jahren – im 19. Jahrhundert wie viele der Künstler, getrennt nach Geschlecht, geboren wurden.

  1. Hierzu ziehen wir "Geburtsjahr" in das Feld Zeilenfelder, da wir unsere Untersuchung nach den entsprechenden Jahren ausrichten werden.
  2. Ebenfalls ziehen wir "Geburtsjahr" in das Feld Datenfelder.
  3. Da wir die Anzahl pro Jahr ermitteln möchten, doppelklicken wir und es öffnet sich das Kontextmenü. Dort wählen wir "Anzahl" aus und bestätigen mit OK.
  4. Da wir das Ergebnis nach Geschlecht aufschlüsseln möchten, ziehen wir nun noch "Geschlecht" in das Feld Spaltenfelder.
  5. Wir bestätigen die Pivot-Tabelle durch einen Klick auf OK und sie wird in einem neuen Tabellenblatt nach unseren Vorgaben erstellt.
  6. Die soeben getätigten Vorgaben können jederzeit durch einen Rechtsklick auf die angegrauten Zellen abgeändert werden.

Um nun aus der Übersicht diejenigen Fälle auszuwählen, die dem 19. Jahrhundert entstammen, klicken wir mit der rechten Maustaste auf das Feld Geburtsjahr und anschließend auf "Filter". Im sich öffnenden Kontextmenü können wir die Filterkriterien bestimmen:
Feldname "Geburtsjahr" – Bedingung ">=" – Wert "1800"
UND
Feldname "Geburtsjahr" – Bedingung "<" – Wert "1901"

Zur Visualisierung des Ergebnisses bietet sich ein Liniendiagramm an. Wie wir im Abschnitt Visualisierung mit Calc kennengelernt haben

  1. klicken wir auf "Diagramm erstellen"
  2. wählen den Diagrammtyp "Liniendiagramm" aus
  3. wählen anschließend den Datenbereich aus (hier: $‘Pivot-Tabelle_artists_1‘.$A$2:$D$102)
  4. danach die Datenreihen. Hier gilt es zu berücksichtigen: Wählen Sie für beide Geschlechter (und NULL) den entsprechenden Datenbereich aus (Female: …$B$3:$B$102 ∫ Male: ……$C$3:$C$102 ∫ NULL: …$D$3:$D$102). Die Gesamtergebnisse werden nicht berücksichtigt.

Wie wir sehen, eignet sich eine Pivot-Tabelle und die zugehörige Visualisierung gut zur Darstellung von nach bestimmten Gesichtspunkten gefilterten Datenmengen.
Andere mögliche Fragestellungen wäre beispielsweise:

  1. In welchen Jahren hat Dürer wie viele Werke erstellt?
  2. Welchen Anteil besitzen Dürers Werke am Bestand von …?
  3. In welchem Jahr wurden wie viele Objekte von einem Museum angekauft? Von wann stammen diese Objekte gleichzeitig?



Anmerkungen

  1. Beim Öffnen gelangen Sie zunächst in einen Textimport-Assistent. Hier brauchen Sie keine Änderungen vorzunehmen, bestätigen Sie einfach mit OK.↩︎
  2. Bei den betroffenen Fällen handelt es sich entweder um Institutionen oder um ungenaue Einträge von Personen, bei denen teilweise die Nationalität dem Namen hinzugefügt wurde. Normalerweise wäre es nun erforderlich, eine weitere Glättung des Datenbestandes durchzuführen und die ungenau bezeichneten Personen von den Institutionen zu trennen. Darauf wird in diesem Fall aus pragmatischen Gründen verzichtet.↩︎
  3. Natürlich könnte man die Daten nun weiter glätten – beispielsweise sind Eintrag 3 und 5 offenkundig Firmen und damit irrelevant, Eintrag 2 ist zumindest zweifelhaft –, was in unserer Übung aber nicht notwendig ist. Hier zeigt sich jedoch, wie wichtig eine möglichst umfassende Auszeichnung der Daten ist; in diesem Fall wäre es zum Beispiel sinnvoll gewesen, in einer separaten Spalte natürliche Personen und Institutionen entsprechend zu kennzeichnen.↩︎

Calc als Medium der Datenaufnahme: Einführung

Die Aufnahme wissenschaftlicher Forschungsdaten erfolgt in der Regel mit einem Tabellenkalkulationsprogramm wie Calc. Geben Sie ihre Daten nicht zur primären Verarbeitung in Calc selbst ein, sondern ist Ihr Ziel die Sammlung und Aufbereitung von Daten für eine Weiterverwendung in einer Datenbank oder einer statistischen Software wie RStudio oder SSPS, so sollten Sie folgende Grundregeln der Datenaufnahme beachten:

  1. Benennen Sie Ihre Variablen mit "talking names", d.h. mit aussagekräftigen Bezeichnungen
  2. Platzieren Sie die Variablen in der ersten Zeile bzw. ersten Spalte Ihres Arbeitsblattes
  3. Bezeichnungen sollten mit einem Buchstaben beginnen und keine Sonderzeichen enthalten
  4. Leerzeichen werden durch Unterstriche (_) ersetzt, auf Großbuchstaben sollte gänzlich verzichtet werden
  5. Verzichten Sie auf Einfärbungen von Zellen oder Zellformatänderungen (z.B. "Zellen verbinden")

Machen Sie sich vorab bereits Gedanken über das Datenbankschema und die Ziele, die sie mit Ihren Daten erreichen möchten1. Passen Sie die Struktur in Calc dementsprechend an und geben Sie die Daten standardisiert, diesem Muster folgend, in die Tabelle ein. Die Modellierung der Daten kann selbstverständlich auch zu einem späteren Zeitpunkt in der Datenbank selbst oder in RStudio erfolgen; dennoch raten wir Ihnen zu einer möglichst frühzeitigen Modellierung Ihrer Forschungsdaten. Calc bietet sich hierfür besonders wegen seiner graphischen Benutzeroberfläche an.

Besonderheit CSV-Datei

Wenn Sie eine fremde CSV-Datei erstmals öffnen, kann es vorkommen, dass alle Werte in einer einzigen Spalte angezeigt werden. Dies lässt sich jedoch leicht in die ursprüngliche Form bringen:

  1. Markieren Sie zunächst die betroffene Spalte (in der Regel Spalte A).
  2. Über die Schaltfläche "Daten" finden Sie die Option "Text in Spalten".
  3. Wählen Sie die Art der Spaltentrennung aus (z.B. durch Komma, Tab etc.).
  4. Ein Klick auf OK führt zur Aufsplittung in mehrere Spalten.



Anmerkungen

  1. Vgl. hierzu das Kapitel Verschiedene Arten von Datenmodellen im Manual "Datenbanken".↩︎

Hilfreiche Funktionen zur Datenmodellierung

In den vorangehenden Kapiteln dieses Manuals haben Sie bereits die Verwendung von Funktionen in Calc kennengelernt. Der Einsatz von Funktionen kann auch bei der Aufbereitung einer Datensammlung für den Import in eine Datenbank sinnvoll sein. Nicht selten erhalten Sie die Daten nicht in der gewünschten Form; Anpassungen sind daher in vielen Fällen vonnöten. In diesem Abschnitt werden Ihnen zunächst eine Reihe an nützlichen Funktionen vorgestellt1. Anschließend werden wir uns eine Beispieldatensammlung aus der Praxis vornehmen, um dort die Funktionsweise ausgewählter Formeln in praxi auszuprobieren.
Ein wichtiger Hinweis bereits vorab: Für den Import der Daten müssen Sie diese unabhängig von den angewandten Calc-Formeln abspeichern. Gehen Sie wie folgt vor:

  1. Kopieren Sie die Formel-Ergebniszeile
  2. Fügen Sie die Ergebniszeile in eine neue Zeile ein
  3. Wählen Sie über "Bearbeiten" → "Inhalte einfügen" die Option "Formeln deaktivieren"

Funktionen in Calc lassen sich in folgende Kategorien unterteilen:

  1. Textfunktionen
  2. Filterfunktionen
  3. Datums- und Zeitfunktionen
  4. Matrixfunktionen
  5. Tabellenfunktionen
  6. Datenbankfunktionen

Im Folgenden werden wir uns mit Funktionen aus den Bereichen Text, Filtern, Matrix und Tabellen befassen.

Textfunktionen

Textfunktionen sind hilfreich, um eine Datensammlung zu modellieren, d.h. in ein einheitliches Format zu bringen und zeitsparend für den Import in eine Datenbank aufzubereiten.

Funktion Problemstellung Beispiel Problem Beispiel Lösung Lösungsbeschreibung
=LÄNGE(E20) Anzahl der Zeichen in Zelle E20? Ludwig XIV. 11 Zelle E20 umfasst 11 Zeichen
=FINDEN(„ä“;F4) An welcher Position befindet sich in Zelle F4 ein "ä"? Städel Museum 3 In Zelle F4 befindet sich ein "ä" an 3. Position
=GLÄTTEN(C1) Unnötige Leerzeichen innerhalb einer Zelle tilgen Ludwig der XIV. Ludwig der XIV. Leerzeichen wurde entfernt
=SÄUBERN(F3) In Zelle F3 befinden sich fehlerhaft ausgegebene Zeichen Ludðwig XIV. Ludwig XIV. Fehlerhaft ausgegebenes Zeichen wurde entfernt
=ERSETZEN(Zelle; Position; Länge;
"Textersatz")
In Zelle E3 soll ab dem 32. Zeichen mit einer Länge von 30 Zeichen den bestehenden Text durch neuen Text ersetzen: =ERSETZEN(E3; 32; 30; "id/1181-03-11_1_0_4_2_4_4_2583") http://www.regesta-imperii.de/1181-03-11_1_0_4_2_4_4_2583 http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 Die veraltete URL wurde im Masseverfahren aktualisiert
=KLEIN(G4) In Zelle G4 befindlicher Text soll in Kleinbuchstaben wiedergegeben werden Ludwig_XIV ludwig_xiv Text in Kleinbuchstaben ausgegeben, z.b. für halbautomatische Erstellung von URLs
=VERKETTEN(E5;F5)2 Inhalt aus den Zellen E5 und F5 soll verbunden werden E5: http://www.regesta-imperii.de/id/ F5: 1181-03-11_1_0_4_2_4_4_2583 http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 Zelleninhalte verbunden, z.b. für halbautomatische Erstellung von URLs
=VERKETTEN(E5;"/id/";F5) Inhalt aus den Zellen E5 und F5 soll mit einer Einfügung verbunden werden E5: http://www.regesta-imperii.de F5: 1181-03-11_1_0_4_2_4_4_2583 http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 Zelleninhalte mit statischer Einfügung verbunden
=WECHSELN(C1;"ö";"oe")3 In Zelle C1 befindlicher Umlaut 'ö' soll in 'oe' umgewandelt werden http://www.öaw.ac.at/österreichische-akademie-der-wissenschaften/ http://www.oeaw.ac.at/oesterreichische-akademie-der-wissenschaften/ Der fehlerhafte Umlaut in der URL wurde entfernt
=RÖMISCH(B11) In Zelle B11 befindliche Zahl soll als römische Zahl wiedergegeben werden 14 XIV Die arabische Zahl 14 wird als römische Zahl (XIV) wiedergegeben
=ARABISCH(B11) In Zelle B11 befindliche Zahl soll als arabische Zahl wiedergegeben werden XIV 14 Die römische Zahl XIV wird als arabische Zahl (14) wiedergegeben
Funktion Problemstellung Beispiel Problem Beispiel Lösung Lösungsbeschreibung
=WECHSELN(WECHSELN(WECHSELN
((C1;"ö";"oe");"ü";"ue");"ß";"ss")
In Zelle C1 befindliche Umlaute und ß sollen umgewandelt werden größere Änderungen groessere Aenderungen Mehrere Änderungen können verschachtelt werden
=ERSETZEN(A3;1;6;VERKETTEN
(TEIL(A3;1;2);"_";TEIL(A3;3;2);"_";TEIL(A3;5;2)))
In Zelle A3 befindliches Datum soll mit Unterstrichen ausgegeben werden 090816 09_08_16 Auch hier ist eine Verschachtelung mehrerer Funktionen notwendig

Filterfunktionen

Funktion Problemstellung Beispiel Problem Beispiel Lösung Lösungsbeschreibung
=LINKS(D3;26) Eine genaue Anzahl an Zeichen aus einer Zelle ausgeben, beginnend von links www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 www.regesta-imperii.de/id/ Es wurde das Grundgerüst der URL zur Weiterverarbeitung vom veränderlichen Teil abgetrennt.
=RECHTS(D3;27) Eine genaue Anzahl an Zeichen aus einer Zelle ausgeben, beginnend von rechts www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 1181-03-11_1_0_4_2_4_4_2583 Es wurde die ID vom URL-Grundgerüst zur Weiterverarbeitung abgetrennt.4
=RECHTS(D3;FINDEN(„/“;D3)) Alle Zeichen aus einer Zelle bis zum Backslash ausgeben, beginnend von rechts www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 1181-03-11_1_0_4_2_4_4_2583 Es wurde eine beliebig lange ID vom URL-Grundgerüst zur Weiterverarbeitung abgetrennt.5
=TEIL(D3;5;15) Exakt 15 Zeichen ab dem fünften Zeichen der Zelle www.regesta-imperii.de/ regesta-imperii Es wurden exakt 15 Zeichen ab dem fünften Zeichen der Zelle ausgegeben.
=WENN(B6>1; "x"; "o")6 Wenn eine bestimmte Bedingung (z.B. B6>1) erfüllt ist, setze "x"; wenn nicht erfüllt, setze "o". =WENN(B6>1; "x"; "o"); B6 = 3 Ergebnis: "x" (d.h. "korrekt") Da B6 (3) größer als 1 ist, wird ein "x" in der Zelle gesetzt
=WENN(ISTLEER(B6); "Nicht vorhanden"; B6+C6) Weiteres Beispiel: Wenn Zelle C6 leer, zeige "nicht vorhanden" an; wenn Zelle C6 nicht leer, soll Summe von B6 und C6 berechnet werden. =WENN(ISTLEER(B6); "Nicht vorhanden"; B6+C6); B6 = 3; C6 = 6 Ergebnis: B6+C6 (9) Da die Zelle B6 nicht leer ist, wird die Rechenoperation durchgeführt.

Matrixfunktionen

Addieren, Multiplizieren etc. von ganzen Zellbereichen, auch mit Einbezug von Bedingungen
CalcFunktionenMatrix(2f)GrundRechenarten
CalcFunktionenMatrix(2f)RechnenWenn
CalcFunktionenMatrix(2f)Matrix

Tabellenfunktionen


CalcFunktionenTabellen(2f)DatenFinden




Anmerkungen

  1. Vgl. weiterführend die Funktionen-Übersicht von OpenOffice.↩︎
  2. Leider ist es nicht möglich, einen Zellbereich (E5:G5) direkt zu verketten. Es gilt, jede betroffene Zelle einzeln anzuführen (E5;F5;G5).↩︎
  3. Die Funktion kommt ohne Positions- oder Längenangabe aus. Die vorgegebene Zeichenkette wird gesucht und ersetzt. Wenn nur ein Vorkommen (und nicht alle Fälle) ausgetauscht werden sollen, kann dies entsprechend definiert werden: =WECHSELN(C1;"ö";"oe";1) würde das 'ö' nur beim ersten Vorkommen abändern.↩︎
  4. Dies ist beispielsweise sinnvoll, wenn eine Liste mit URLs vorliegt, bei denen sich ein Linkbestandteil geändert hat; man könnte sich alle variablen Linkbestandteile ausgeben lassen und vorne den neuen, unveränderlichen Linkbestandteil anfügen.↩︎
  5. Das automatische Aufsplitten von Zellen kann bequem auch über den Textkonvertierungsassistenten erfolgen.↩︎
  6. Bedingungen: Als Argumente können stets konstante Werte oder Formeln genutzt werden. Kriterien bei Bedingungen können WAHR oder FALSCH sein.↩︎