Im DHVLab findet sich mit Calc ein
kostenfreies Tabellenkalkulationsprogramm, welches zur
Eingabe, Auswertung und Visualisierung von Daten dient, die in Form von
Zahlen oder Text vorliegen. Mit Hilfe definierter Funktionen lassen sich
neue Daten berechnen oder bestehende Datensätze neu kalkulieren. Zur
Visualisierung der Arbeitsergebnisse können anschauliche Diagramme
erstellt werden.
Calc gehört zur OpenSorce-Produktfamilie LibreOffice.
LibreOffice
ist eine OpenOffice-Variante, die sich mittlerweile gegen den
Mitkonkurrenten OpenOffice.org, von dem sie sich einst abspaltete,
durchgesetzt hat1. Insbesondere
auf
Linux-Distributionen wird mittlerweile fast ausschließlich auf
LibreOffice gesetzt. Als freie Softwarealternative zu Microsoft
Excel können Excel-Dateien in Calc problemlos verarbeitet
werden; dies gilt auch im umgekehrten Fall für den Import von
Calc-Dateien in Excel2. Sie können
also ohne Bedenken
Excel-Dateien von Ihrem Rechner in die DHVLab-Umgebung importieren. Für
den unwahrscheinlichen Fall, dass ein Datenimport einmal nicht gelingen
sollte, empfiehlt sich die Umwandlung der Excel-Datei in das
CSV-Datenformat (Comma-Separated Values), welches von beiden
Office-Paketen ausnahmslos eingelesen werden kann (Nachteil: bestehende
Formatierungen werden nicht übernommen).
Unabhängig von dem Programm, dass Sie verwenden, werden Sie immer wieder mit denselben Fragen und Phänomenen konfrontiert. Zunächst gilt es zu eruieren:
An diesen Grundsatzfragen orientiert sich die Auswahl der entsprechenden
Software. Der Vorteil von Tabellenkalkulationsprogrammen besteht darin,
dass Sie eine grafische Benutzeroberfläche zur
Datenerfassung und Datenverarbeitung
bieten. Die Zellen dienen zur Eingabe von Daten, mit denen anschließend
Berechnungen durchgeführt werden können. Hierzu werden wir, nachdem wir
uns mit der Oberfläche vertraut gemacht haben, verschiedene
Funktionen in Calc und die Bedeutung von
Zellbezügen kennen lernen. Große Datenmengen lassen
sich in Calc mit Filterwerkzeugen und
Pivot-Tabellen analysieren. Ergebnisse können mit Hilfe
der vielfältigen Visualisierungsoptionen ansprechend
ausgeben.
Ziel ist letztlich immer eine zunehmende Reduktion der
anzuzeigenden Daten bei zunehmendem Erkenntnisgewinn über die
verbleibenden Daten - zum Beispiel:
Gesamter Datenbestand → Pivot-Tabelle → Diagramm
Ist der Erkenntnisgewinn nach dieser Datenauswahl nicht
zufriedenstellend, so gilt es über eine Veränderung der
Datenbasis nachzudenken.
Neben dieser Funktion als kompaktes Werkzeug zur Analyse und
Visualisierung von Datenmengen, dient Calc in einer Vielzahl von Fällen
als Mittel zum Zweck bei der strukturierten Aufnahme von
Forschungsdaten für einer anschließende Weiterverarbeitung in
Datenbanken
oder Statistiksoftware wie RStudio.
Hierfür sind grundlegende Kenntnisse der Tabellenkalkulation ebenfalls
unabdingbar4. Diese werden Sie
sich in unserem
Manual aneignen.
Das Tabellenkalkulationsprogramm Calc öffnen Sie
über den Pfad
Startbutton → Anwendungen → Büroprogramme → Tabellenkalkulation
.
Mit Start des Programms öffnet sich eine neue
Arbeitsmappe, die als Container für alle zugehörigen
Arbeitsblätter fungiert. Standardmäßig befindet sich im
Blattregister (unten links) ein Arbeitsblatt (bezeichnet als "Tabelle
1"). Es können bis zu 255 Arbeitsblätter parallel angelegt werden. Zum
Umbenennen des Arbeitsblatts genügt ein Doppelklick auf den
entsprechenden Reiter im Blattregister. Zum Anlegen neuer Arbeitsblätter
klicken Sie auf das grüne Pluszeichen im Blattregister. Möchten Sie ein
Arbeitsblatt löschen, so klicken Sie mit der rechten Maustaste auf den
entsprechenden Reiter. Planen Sie Ihre Tabelle zu einem späteren
Zeitpunkt in eine Datenbank zu importieren, so sollten Sie nur mit einem
Arbeitsblatt arbeiten.
Tipp: Speichern Sie Ihre Datei in der Cloud ab,
damit Sie stets Zugriff darauf haben:
Datei → Speichern unter → Cloud → Documents
. Wir benennen
unsere Datei "calctest". Standardmäßig wird die Datei im
„.ods“-Format (Open Document Spreadsheet)
abgespeichert. Mit Klick auf "Dateityp" kann zwischen mehreren
Dateiendungen gewählt werden, u.a. auch CSV (Comma
Separated Values), welches sich besonders für den Import in
phpMyAdmin-Datenbanken eignet. Eine ods-Datei kann auch zu einem
späteren Zeitpunkt in eine CSV-Datei umgewandelt werden.
Ein Arbeitsblatt beruht auf einem Koordinatensystem:
Zentraler Unterschied zu Datenbankentwicklungssoftware wie Microsoft Access/LibreOffice Base: Abgesehen von seiner bezeichnenden Funktion hat der Name einer Zelle keine Aussagekraft. Es gibt keinen Primärschlüssel, die Zeilennummerierung ist variabel. Werden Spalten oder Zeilen gelöscht, so hat dies keine Auswirkung auf die Struktur.
Das Tabellenfeld wird am oberen Rand durch die Bearbeitungsleiste begrenzt. Dort befindet sich das Namenfeld. Dieses zeigt die aktive Zelle an, d.h. die Zelle, in der sich der Cursor gerade befindet. Durch die Eingabe eines Zellbezugs (z.B. „C15“) springt der Cursor in die gewünschte Zelle. Möchten sie eine Zelle mit einem Namen versehen, so aktivieren Sie das Namenfeld mit einem Doppelklick und geben Sie den gewünschten Namen ein. Über den Reiter neben dem Namenfeld können Sie ab sofort immer direkt zu dem benannten Feld springen. Dies ermöglicht ein bequemes Navigieren durch größere Datensammlungen.
Neben dem Namenfeld befindet sich die Eingabezeile zur Eingabe von Funktionen. Die Zeile zeigt den Inhalt der aktiven Zelle an, also einen Wert (Zahl, Text) oder eine Berechnung (Funktion). Über den Reiter rechts der Eingabezeile lässt sich diese aufklappen. Dies ist sinnvoll bei der Eingabe längerer Funktionen. Auf die Icons neben der Eingabezeile werden wir bei den Funktionen zurückkommen.
Wenden wir uns nun dem unteren Ende der Anzeige zu. Dort befindet sich die sogenannte Statusleiste. Die verschiedenen, mehr oder weniger nützliche Hinweisen zum aktuellen Programmstatus aktivieren Sie durch einen Doppelklick auf das entsprechende Feld. Diese sind im Einzelnen (von links nach rechts):
Beispiel Mittelwert: gibt man in die Zellen B3, B4, B5 folgende Zahlenwerte ein: 5, 6, 7 und markiert diese Zellen im Anschluss, so wird im Funktionsfeld "Mittelwert = 6" angezeigt)
Das Menüband
umfasst folgende Reiter:
Datei – Bearbeiten – Ansicht – Einfügen – Format – Extras – Daten – Fenster – Hilfe
Die meisten bzw. wichtigsten Befehle, die sich hinter den einzelnen
Reitern verbergen, können bequem mit der Maus oder über
Tastenkürzel (Shortcuts) ausgeführt werden.
Die wichtigsten Shortcuts, die Sie kennen sollten1:
Tastenkürzel |
Funktion |
---|---|
Strg A |
Alles markieren2 |
Strg C |
Kopieren |
Strg X |
Ausschneiden |
Strg V |
Einfügen |
Strg Z |
Rückgängig |
Strg Y |
Wiederherstellen |
Strg F |
Suchen |
Strg H |
Ersetzen |
Strg S |
Speichern |
Strg O |
Öffnen |
Strg Mausrad |
Ansicht vergrößern bzw. verkleinern |
Hinzu kommt das Kontextmenü, welches sich durch
Rechtsklick auf eine Zelle öffnet. Dort sind einige zentrale Befehle zu
finden, z.B. Zellen einfügen
, Zellen löschen
,
Inhalte löschen
. Auch können Kommentare
erstellt werden, die anschließend als rotes Dreieck in der rechten
oberen Ecke einer Zelle angezeigt werden; beim Überfahren mit dem Cursor
wird der Kommentar angezeigt.
Taste(nkombination) |
Funktion |
---|---|
Enter |
Zelle darunter |
Umschalt Enter |
Zelle darüber |
Tab |
Zelle rechts daneben |
Umschalt Tab |
Zelle links daneben |
Bild Auf/Ab |
Sprung um eine Bildschirmseite nach oben/unten |
Strg → |
Sprung zur Begrenzung der x-Achse (= Spalte "AMJ") |
Strg ← |
Sprung zurück zur ersten Spalte der x-Achse ("A") |
Strg ↑ |
Sprung zur Begrenzung der y-Achse (= Zeile 1048576) |
Strg ↓ |
Sprung zurück zur ersten Zeile der y-Achse (1)3 |
Um eine Spalte komplett zu
markieren klickt man auf den entsprechenden
Spaltenkopf auf der x-Achse. Selbiges gilt für das
Markieren einer Zeile durch Anklicken des Zeilenkopfes.
Ein Rechtsklick öffnet das zugehörige Kontextmenü. Dort lassen sich u.a.
Spalten einfügen oder die markierte Spalte
löschen.
Zellen können entweder mit der Maus oder über die Tastatur markiert
werden:
Ziehen Sie bei gedrückter linker Maustaste den Cursor über den gewünschten Zellbereich. Sofern nur einzelne, nicht zusammenhängende Zellen markiert werden sollen, klicken Sie die einzelnen Zellen bei gedrückter Strg-Taste an.
Shift+Umschalt+Pfeiltasten
– beliebige AuswahlStrg+Shift+Pos1
– markiert wird der Bereich ab der
Cursorposition bis zur Zelle A1Strg+Shift+Ende
– markiert wird der Bereich ab der
Cursorposition zu der untersten, mit Inhalt gefüllten ZelleDie Zellen im Arbeitsblatt dienen zur Eingabe von Daten. Mit den eingegebenen Werten können Berechnungen vorgenommen werden. Prinzipiell gilt:
Esc
, um eine Dateneingabe abzubrechen.
F2
oder per Doppelklick in eine Zelle,
um
ihren Inhalt zu bearbeitenMit Hilfe
der Ausfüllfunktion können automatisch
Aufzählungen generiert werden. Nehmen wir an, in
der
Zelle C1
befindet sich die Zahl 1:
⇔ Markieren Sie dagegen zwei untereinander liegende Zellen selben Inhalts (z.B. 1,1) und ziehen diese auf, so wird die Zahl 1 in die darunterliegenden Zellen kopiert.
Standardmäßig werden beim
Kopieren
sowohl die Daten als auch die ihnen
zugrundeliegenden
Funktionen kopiert. Möchte man jedoch
nur die
Daten als Werte ohne Funktionen kopieren,
so wählt man mit
einem Rechtsklick an der gewünschten Stelle im
Kontextmenü
"Inhalte einfügen aus"
aus und bestätigt
mit OK4.
Alle verwendeten Daten und Aussagen sind frei erfunden und spiegeln keine realen Verhältnisse wieder.
Zur besseren Nachvollziehbarkeit empfehlen wir Ihnen, die in der Beispieldatei vorgehaltenen Daten für Ihre Berechnungen zu verwenden, um das Erreichen des Lernerfolges besser nachprüfen zu können.
Geben Sie in Ihre Datei zunächst die
Spaltenbezeichnungen aus der Beispieldatei ein. Zum
Anpassen der Spaltenbreite an die Namen doppelklicken
Sie mit der linken Maustaste auf die Trennlinie zwischen zwei
Spaltenköpfen.
Auch wenn wir mit unserem Beispiel keinen Designpreis gewinnen möchten,
so sei an dieser Stelle darauf verwiesen, dass selbstverständlich Ihrer
gestalterischen Freiheit keine Grenzen gesetzt sind. Einige gängige und
sinnvolle Design-Anpassungen:
Calc verfügt über eine große Zahl an Funktionen, die es zu einem wirkungsvollen Programm machen. Es stehen Funktionen beispielsweise für mathematische und statistische Berechnungen, für die Bearbeitung von Text, zum Nachschlagen oder Konvertieren von Werten oder zum Zählen von Zellen und Zahlen zur Verfügung. Jede Funktion gibt immer genau einen Wert zurück. Der Datentyp des Rückgabewertes ist abhängig von der durchgeführten Operation. Im Blick auf Formeln und Funktionen wenden wir uns zunächst der Summenfunktion zu, da wir an dieser einfachen Funktion ihre einzelnen Bestandteile und die allgemeine Funktionsweise kennenlernen werden.
=
B5:B16
)
B5; B6; B7;
)
B5:B16 C5:C16
)B1+B2
). Folgende Operatoren sind möglich:
Operator |
Operation |
Beispiel |
Ergebnis |
---|---|---|---|
= |
ist gleich |
4 = 9 |
falsch |
< |
kleiner als |
3 < 5 |
wahr |
> |
größer als |
6 > 4 |
wahr |
<= |
kleiner gleich als |
6 <= 9 |
wahr |
>= |
größer gleich als |
4 >= 10 |
falsch |
<> |
ungleich |
8 <> 2 |
wahr |
B5
und B16
). Es kann sich dabei auch um
andere Funktionen handeln; ihr Ergebnis wird als Wert zurückgegeben, der
dann verarbeitet wird.Ist eine Formel aktiv, so werden die einbezogenen
Zellen farbig umrahmt.
Um eine Formel inaktiv zu setzen, genügt ein
Hochkomma vor dem Gleichheitszeichen:
'=SUMME(B5:B16)
Es gibt mehrere Möglichkeiten, eine Summe
einzugeben. Beginnen wir - um die Gesamtbesucherzahl eines Jahres für
die Alte Nationalgalerie Berlin zu ermitteln - mit der einfachsten
Variante:
# Klicken Sie mit der Maus in die Zelle, in der die Summe berechnet
werden soll (hier: B17
, neben "Gesamt")
=SUMME(B5:B16)
). Der Bereich, der in die Summe einbezogen
werden soll, wird durch einen farbigen Rahmen eingefasst.Sie erhalten als Ergebnis die Gesamtbesucherzahl eines Jahres für die Alte Nationalgalerie Berlin.
Für das Museum Kunstpalast Düsseldorf versuchen wir eine weitere
Variante der Funktionseingabe: Hierzu klicken wir auf das Icon
"Funktionsassistent", welches sich neben dem
Summenzeichen befindet. Im Funktionsassistenten sind in der linken
Spalte alle verfügbaren Funktionen aufgelistet. Wählen Sie nun die
Funktion "SUMME" aus. Rechts wird daraufhin die Syntax der Funktion
(=SUMME(Zahl1; Zahl2; …)) und eine Kurzbeschreibung angegeben ("Summiert
die Argumente"). Geben Sie nun in das Summenfeld ein:
=SUMME(
Beim Eingeben der öffnenden Klammer öffnet sich der
Eingabeassistent. Dieser ist Ihnen bei der Auswahl der
betroffenen Zellen behilflich. Sie könnten nun alle Zellen, die in die
Summe einbezogen werden sollen (hier: Monate Januar-Dezember), einzeln
eingeben, getrennt jeweils durch ein Semikolon. Sinnvoller ist es, den
betroffenen Zellbereich zu definieren, indem nur der
Startwert (hier: Januar) sowie der
Endwert (hier: Dezember) angegeben werden, verbunden
durch einen Doppelpunkt. Damit wird der gesamte Bereich erfasst
(=SUMME(C5:C16)
). Bestätigen Sie mit OK.
Funktionen können auch direkt in die gewünschte
Zelle oder die Eingabezeile eingegeben werden.
Dies ist der einfachste und gängigste Weg, wenn man die entsprechende
Formel kennt. Für die Alte Pinakothek München wenden wir dieses
Verfahren an:
Doppelklicken Sie in das Feld D17
. Geben Sie
=SUMME(
ein. Schon nach den ersten Buchstaben erscheint ein
Funktionsvorschlag
durch Calc. Geben Sie nun die
entsprechenden Werte ein (D5:16
); alternativ können Sie
auch die entsprechenden Zellen anklicken. Bestätigen Sie mit der
Eingabetaste.
Sie kennen nun die drei Varianten der Eingabe einer
(Summen)Funktion in Calc. Wenn Sie wie im vorliegenden
Fall mehrere Felder haben, in denen dieselbe Berechnung durchgeführt
werden soll (hier: Gesamtbesucherzahl für versch. Museen), so ist es
ausreichend, wenn Sie die Funktion nur einmal eingeben
und durch Aufziehen der Zelle auf andere betroffene
Zellen erweitern:
Hierfür klicken Sie das Feld D17
(Gesamtwert Alte
Pinakothek München) an, klicken auf das kleine schwarze Kästchen unten
rechts und ziehen mit dem Cursor via E17
nach
F17
. Somit übertragen Sie die Funktion bequem auf diese
Felder.
Allgemein gilt: Bei Formeln handelt es sich um
Berechnungsanweisungen. Verändert sich ein
Wert innerhalb des von der Formel abgedeckten Zellenbereiches,
so aktualisiert sich das Ergebnis automatisch (Test:
Geben Sie in das Feld D7
anstelle "30475" die Zahl
"31475"
ein).
An dieser Stelle möchten wir noch ein paar weitere, grundlegende Funktionen kennenlernen:
B5
= Januar, B16
= Dezember] ein:=MITTELWERT(B5:B16)
Zur Kontrolle können Sie den
Zellbereich B5:B16
mit dem Cursor markieren und im
Funktionsfeld der Statusleiste durch Rechtsklick die Rechenoperation
"Mittelwert" auswählen.
=MIN(C5:C16)
INDEX(A5:A16)
liefert den Inhalt aus den MonatsnamenVERGLEICH(C5:C16)
findet in einem Zellbereich den
gewünschten Wert; dieser ist in unserem Fall der Minimalwert, weshalb
wir in die Funktion VERGLEICH
die oben angeführte Funktion
MIN(C5:C16)
einbinden.=INDEX(A5:A16;VERGLEICH(MIN(C5:C16);C5:C16;0))
=MAX(D5:D16)
=INDEX(A5:A16;VERGLEICH(MAX(D5:D16);D5:D16;0))
$C$2
: sowohl die
Spalte C als auch die Zeile 2 sind
absolut gesetzt und damit unveränderlich bei
Berechnungen.
A$4
: Die
Spalte ist veränderbar, jedoch immer in Bezug auf die Zellen in Zeile
4). absolute Spaltenbezüge, d.h. die Spalte ist absolut gesetzt, während
die Zelle relativ bleibt (z.B. $A4
: Die Spalte A ist
unveränderlich, variieren können dagegen die Zellen).
Für das Beispiel "Mehrwertsteuer" öffnen wir ein neues Arbeitsblatt. Übertragen Sie die Daten aus der verlinkten Datei (coming soon) und passen Sie das Format der Tabelle entsprechend an. Klicken Sie auf das Eurozeichen in der Bearbeitungsleiste, um den Daten Werte zuzuordnen.
=B3*C3
). Für die weiteren
Berechnungen ziehen wir mit dem Cursor von D3
nach
D6
, damit die weiteren Gesamtpreise ohne MwSt. automatisch
ausgefüllt werden (= relativer Zellbezug). Die
Gesamtsumme ohne MwSt. ermitteln wir in der Zelle
D7
über den bekannten Weg der Summenfunktion.
I2
und beträgt 19% (Ein Klick auf das
Prozentzeichen formatiert den Zahlenwert in Prozent). Da sich die
Mehrwertsteuer in der Rechnung nicht verändern soll, wenden wir einen
absoluten Zellbezug an. Um den Gesamtpreis mit
Mehrwertsteuer zu ermitteln geben wir in der entsprechenden
Zelle (E3
) folgende Formel ein: =D3+D3*$I$2
("D3 addiert um den Preis multipliziert mit der MwSt").E7
) angeben. Damit haben Sie den Gesamtpreis inkl. MwSt.
des Einkaufs im Museumsshop ermittelt.
Zunächst kopieren wir wiederum die Werte aus der verlinkten Datei (coming soon) in
die
Tabelle (Zelle A9
). Wir möchten in dieser Beispielrechnung
sehen, wie sich der Verkauf der Postkarten von Dürer, Cranach und
Botticelli im Museumsshop im Laufe der Jahre prozentual verändert
hat.
Nachdem wir die Werte übertragen haben, tragen wir mit einer Zeile
Abstand darunter nochmals die Jahreszahlen (2012-2015) in Spalte A ein.
Beginnen wir mit der Prozentberechnung in der Zelle neben 2012
(B15
): Um den Wert für Dürer im Jahr 2012 zu erhalten,
müssen wir die Anzahl der verkauften Dürerpostkarten durch die Summe aus
allen verkauften Karten dividieren: =B10/($B10+$C10+$D10)
1
Der relative Spaltenbezug gibt in diesem Beispiel an, dass die Werte
immer aus derselben Spalte stammen, die Zelle
jedoch relativ ist. Dadurch ist es möglich, das Ergebnis durch
Aufziehen auf die anderen Zellen für das Jahr 2012 zu übertragen und
anschließend die Formel auch auf die anderen Jahre ebenfalls durch
Aufziehen zu übertragen2. Das
(exemplarische)
Ergebnis lautet: Die Dürerpostkarten behalten über die
Jahre hinweg einen relativ konstanten Marktanteil von ca. 35%.
An dieser Stelle soll auch auf das Thema Fernbezüge eingegangen
werden. Es kann selbstverständlich auch auf andere
Tabellenblätter oder gar andere
Excel/Calc-Dateien Bezug genommen werden und z.B.
innerhalb einer Funktion eine Zelle aus einer anderen Arbeitsmappe oder
Datei verwendet werden. Veranschaulichen wir dies anhand des Beispiels
zur Mehrwertsteuerberechnung:
Hierzu findet sich eine separate Calc-Datei mit dem Namen
"Mehrwertsteuer"
.
E3
).A5
= 18%) an. Die farbige
Markierung zeigt Ihnen, dass der Wert in die Formel eingebunden wird.
Gehen Sie zurück in die Ausgangsdatei und bestätigen Sie mit Enter. Wie
Sie sehen wird der Dateipfad
[#$Tabelle1.$A$5
] in der Eingabezeile angezeigt; der
Wert hat sich durch die niedrigere Mehrwertsteuer
entsprechend verändert.
Kehren wir zurück zu Tabelle 1 (Besucherzahlen).
Hier hatten wir zuvor bei der Alten Pinakothek den Monat ausgegeben, in
dem die meisten Besucher gezählt wurden:
=INDEX(A5:A16;VERGLEICH(MAX(D5:D16);D5:D16;0))
Wir möchten nun auch den jeweiligen Top-Monat für die beiden
nachfolgenden Museen ermitteln. Da wir soeben die Zellbezüge
kennengelernt haben, merken wir, dass die genannte Formel ohne einen
gemischten Zellbezug bei den Monatsnamen nur bedingt Sinn macht.
Ergänzen Sie daher A5
und A16
jeweils um ein
Dollarzeichen, um den Spaltenbezug für die Monatsnamen
absolut zu setzen: $A5:$A16
Die Formel =INDEX($A5:$A16;VERGLEICH(MAX(D5:D16);D5:D16;0))
kann für die beiden anderen Museen entsprechend aufgezogen werden. Es
ergeben sich nun sinnvolle Werte ("Februar" und "März").
Berechnung für staatliche
und nicht-staatliche Museen – Besucherzahlen in Prozent Um uns noch ein
wenig mit den erlernten Formeln und Berechnungen, die Calc bietet,
vertraut zu machen, werden wir noch eine weitere Prozentrechnung
durchführen. Ziel ist eine vergleichende Berechnung der prozentualen
Besucherzahlen staatlicher und nicht-staatlicher Museen.
Nehmen wir an, der Kunstpalast Düsseldorf und das Städel Museum sind
privat, die restlichen drei Museen staatlich. Nun möchten wir sehen,
welche Trägerschaft mehr Besucherzahlen aufweist. Hierzu legen wir je
eine weitere Spalte für "Mittelwert staatlich" (G1
) und
"Mittelwert privat" (F1
) an.
Berechnen wir mit der uns bekannten Mittelwertfunktion
zunächst die beiden Mittelwerte:
=MITTELWERT(B17;D17;E17)
→ 258.358 (ohne
Nachkommastellen)=MITTELWERT(C17;F17)
→ 225.848 (ohne
Nachkommastellen)Anschließend berechnen wir die entsprechenden
Prozentwerte in der Zelle darunter:
=G17/(G17+H17)
bzw. H17/(G17+H17)
Ergebnis: Die staatlichen Museen liegen prozentual
gesehen bei den Besucherzahlen leicht vor den privat getragenen
Einrichtungen (53,36% zu 46,64%).
Fehlermeldungen sind zunächst immer ärgerlich. Wenn man jedoch
versteht, was hinter den einzelnen Fehlermeldungen steckt, können Sie in
den meisten Fällen relativ leicht behoben werden.
Häufige Ursachen für Fehler:
Einige Fehler werden bei der Eingabe von Calc als solche kenntlich gemacht, eingeleitet durch eine Raute (#); eine Auswahl:
Fehleranzeige |
Bedeutung |
---|---|
#DIV/0! |
Division durch Null |
#NUM! |
Ungültige numerische Werte |
#NAME? |
Ein Bezeichner konnte in der Formel nicht ausgewertet werden |
#WERT! |
Zellen in der Formel besitzen unterschiedliche Datentypen |
#BEZUG! |
Ungültiger Zellbezug, ausgelöst durch das Löschen einer Zeile oder Spalte, die in der Formel Verwendung findet |
Daneben gibt es eine Reihe an allgemeinen
Fehlermeldungen, die durch eine Nummer klassifiziert sind (z.B.
Err502
: Funktion besitzt ein ungültiges Argument).
⇒ Für eine ausführliche
Zusammenstellung zum Thema Fehlermeldungen
empfehlen wir Ihnen die umfassende Auflistung bei
OpenOffice.org.
Bei Visualisierungen handelt es sich um eine grafische
Darstellung von Forschungsdaten und der Beziehungen zwischen
Daten. Ziel von Visualisierungen ist das Erlangen von
Erkenntnissen, die ohne sie nur schwer begreifbar wären.
Visualisierungen müssen stets drei Kriterien
erfüllen:
Folgende Fragen sollten Sie sich vor der Erstellung einer Visualisierung stets stellen:
Es wird unterschieden zwischen Primär- und Sekundärachsen. Primärachsen umfassen die Größen- (y-Achse) und Rubrikenachse (x-Achse). Sie sind standardmäßig bei den meisten Diagrammtypen vorhanden. Sekundärachsen werden bei Bedarf zusätzlich zu den eben genannten Achsen am rechten und/oder oberen Rand der Zeichnungsfläche ergänzt. Dies hat den Zweck, dass Datenreihen sinnvoller angezeigt werden können, wenn diese unterschiedliche Intervalle oder Maßeinheiten nutzen.
Tabellenkalkulationsprogramme wie Calc bieten eine Reihe an
Visualisierungsmöglichkeiten in Form von
Graphen und Diagrammen. Diese basieren
stets auf den Daten eines Arbeitsblattes. Änderungen am Datenbestand
wirken sich automatisch auf die Visualisierung aus.
Es stehen zahlreiche verschiedene Diagrammtypen zur
Auswahl. Die wichtigsten sollen an dieser Stelle kurz vorgestellt
werden:
Anwendungsgebiet (Beispiel): Ausstellung von Urkunden eines Herrschers pro Jahr
Anwendungsgebiet (Beispiel): Rangfolgen (z.B. auf- oder absteigende Einwohnerzahlen)
Anwendungsgebiet (Beispiel): Prozentualer Anteil verschiedener Nationalitäten an Gesamtbevölkerung
Anwendungsgebiet (Beispiel): Bevölkerungsentwicklung
Der visuellen Ausgestaltung der Diagramme sind dabei keine Grenzen gesetzt. Dennoch sollte man folgende Ratschläge bei der Erstellung berücksichtigen:
Gehen wir zurück zur Tabelle mit den Besucherzahlen der einzelnen Museen. Wir möchten diese in Form eines Säulendiagramms visualisieren, in dem die Monate auf der x-Achse, die Besucherzahlen auf der y-Achse angelegt werden. Die Höhe der Säulen entspricht den Besucherzahlen des jeweiligen Museums.
Diagramm
.
Es öffnet sich der Diagramm-Assistent.$Tabelle1.$A$4:$F$16
). Beziehen Sie auch die
Beschriftungen ein, da diese die Achsen in Ihrem
Diagramm bezeichnen werden. Ab diesem Zeitpunkt wird Ihnen das Diagramm
im Entwurfstadium bereits angezeigt.
Fertigstellen
.
Datenreihe formatieren
.
Darüber hinaus können weitere Formatierungen
vorgenommen werden, z.B. Datenbeschriftungen an den
einzelnen Säulen oder Trendlinien (es empfiehlt sich
"Polynomisch") einfügen.
⇒ Als Zusatzaufgabe können Sie nun
ein Balkendiagramm erstellen, welches nur drei Museen
aufnimmt und ebenfalls eine Trendlinie verwendet.
Diagramme können direkt aus dem Tabellenkalkulationsprogramm in ein Textverarbeitungsprogramm exportiert werden. Vorgehen:
Start – Anwendungen – Büroprogramme
).Strg C
– Strg V
).Eine weitere Möglichkeit ist der statische Export als Bilddatei, die sich ebenfalls beliebig andernorts einbinden lässt:
Tabellenkalkulationsprogramme wie Calc sind vielseitig einsetzbar. Wir haben einerseits seine Funktion zur strukturierten Aufnahme von Forschungsdaten für die anschließende Weiterverwendung in Datenbanken oder Statistiksoftware, andererseits seine Funktionsweise bei der alltäglichen Verwaltung oder projektbezogenen Verarbeitung von Datenmengen kennengelernt.
Neben diesen Einsatzgebieten kann man größere Forschungsdatensammlungen auch direkt in Calc auswerten. Hierzu eignet sich die Verwendung von Pivot-Tabellen im Besonderen, d.h. interaktive Tabellen zur
Wichtig: Calc bietet viele Möglichkeiten der Gestaltung, Formatierung etc. Dies ist für den Einsatz als Bürosoftware sinnvoll und schön. Bei der Verwendung des Programms zur Datenaufnahme oder –analyse sollte auf ihren Einsatz möglichst verzichtet werden, da Pivot wie auch externe Programme Gefahr laufen, diese fehlerhaft zu interpretieren. Devise: Keep it simple!
Pivot-Tabellen besitzen den Vorteil, dass auf ihrer Datengrundlage
Berechnungen durchgeführt werden können,
ohne dabei den Ausgangsdatenbestand zu
verändern. Die Ursprungsdaten bleiben stets erhalten.
Grundvoraussetzung ist eine umfangreiche,
aussagekräftige und gut strukturierte
Datensammlung. Daher gilt es sich vorab zu überlegen:
Wir werden uns im Folgenden der Arbeit mit Pivot-Tabellen anhand der Künstlernamen-Datei (artists.csv1) des Museum of Modern Art (MoMa) nähern. Diese umfasst 14.770 Einträge. Die Datei wurde aus der MySQL-Datenbank heruntergeladen; anschließend wurden für die folgenden Übungszwecke unnötige Spalten entfernt. Die Tabelle umfasst folgende Spalten:
Da bei uns allein die Künstler im Fokus des Interesses stehen, gilt es den Datensatz zunächst noch auf Sinnhaftigkeit hin zu überprüfen. Dabei fällt beim Durchscrollen folgendes auf:
NULL
)Bei der Nationalität ist Nationality unknown
von
NULL
zu unterscheiden. Während in ersterem Fall die
Nationalität nicht bekannt ist, wurde bei
NULL
kein Eintrag in der Datenbank
vorgenommen; es könnte also sein, dass die Nationalität zwar ermittelbar
ist, jedoch (noch) nicht eingetragen wurde.
Filtern wir zunächst einmal alle Einträge heraus, die weder einen
Eintrag bei Geschlecht noch bei Nationalität besitzen:
Reiter "Daten" → Filter → Standardfilter
⇒
Feldname "Nationalität" – Bedingung "=" – Wert "NULL"
UND
⇒
Feldname "Geschlecht" – Bedingung "=" – Wert "NULL"
Anzahl
aus, um zu
erfahren, wie viele Datensätze betroffen sind: 3593Bearbeiten → Inhalte löschen
und
bestätigen Sie mit OK2.Daten → Filter → Standardfilter → Feldname "keiner"
.
Strg C
) und in einem neuen
Tabellenblatt wieder einzufügen (Strg V
).Selbiges wiederholen wir nun für die Einträge, die verdächtig hohes "Geburtsjahr" aufweisen; dieses ist häufig ein Indiz dafür, dass es sich um eine Institution handelt.
Unsere Datensammlung umfasst nun 12.902 Einträge. Passen wir die neue Tabelle an, in dem wir
Nun haben wir den Datensatz für unsere Zwecke aufbereitet und können eine Pivot-Tabelle erstellen3.
Daten → Pivot-Tabelle → Erstellen
.
Erkenntnisinteresse: Wir möchten ermitteln, wann – geordnet nach Jahren – im 19. Jahrhundert wie viele der Künstler, getrennt nach Geschlecht, geboren wurden.
Zeilenfelder
,
da wir unsere Untersuchung nach den entsprechenden Jahren ausrichten
werden.Datenfelder
.
Spaltenfelder
.Um nun aus der Übersicht diejenigen Fälle auszuwählen, die dem 19.
Jahrhundert entstammen, klicken wir mit der rechten Maustaste auf das
Feld Geburtsjahr
und anschließend auf "Filter". Im sich
öffnenden Kontextmenü können wir die Filterkriterien
bestimmen:
Feldname "Geburtsjahr" – Bedingung ">=" – Wert "1800"
UND
Feldname "Geburtsjahr" – Bedingung "<" – Wert "1901"
Zur Visualisierung des Ergebnisses bietet sich ein Liniendiagramm an. Wie wir im Abschnitt Visualisierung mit Calc kennengelernt haben
$‘Pivot-Tabelle_artists_1‘.$A$2:$D$102
)
…$B$3:$B$102
∫ Male: ……$C$3:$C$102
∫
NULL: …$D$3:$D$102
). Die Gesamtergebnisse werden nicht
berücksichtigt.
Wie wir sehen, eignet sich eine Pivot-Tabelle und die zugehörige
Visualisierung gut zur Darstellung von nach bestimmten Gesichtspunkten
gefilterten Datenmengen.
Andere mögliche Fragestellungen wäre
beispielsweise:
Die Aufnahme wissenschaftlicher Forschungsdaten erfolgt in der Regel mit einem Tabellenkalkulationsprogramm wie Calc. Geben Sie ihre Daten nicht zur primären Verarbeitung in Calc selbst ein, sondern ist Ihr Ziel die Sammlung und Aufbereitung von Daten für eine Weiterverwendung in einer Datenbank oder einer statistischen Software wie RStudio oder SSPS, so sollten Sie folgende Grundregeln der Datenaufnahme beachten:
Machen Sie sich vorab bereits Gedanken über das Datenbankschema und die Ziele, die sie mit Ihren Daten erreichen möchten1. Passen Sie die Struktur in Calc dementsprechend an und geben Sie die Daten standardisiert, diesem Muster folgend, in die Tabelle ein. Die Modellierung der Daten kann selbstverständlich auch zu einem späteren Zeitpunkt in der Datenbank selbst oder in RStudio erfolgen; dennoch raten wir Ihnen zu einer möglichst frühzeitigen Modellierung Ihrer Forschungsdaten. Calc bietet sich hierfür besonders wegen seiner graphischen Benutzeroberfläche an.
Wenn Sie eine fremde CSV-Datei erstmals öffnen, kann es vorkommen, dass alle Werte in einer einzigen Spalte angezeigt werden. Dies lässt sich jedoch leicht in die ursprüngliche Form bringen:
In den vorangehenden Kapiteln dieses Manuals haben Sie bereits die
Verwendung von Funktionen in Calc kennengelernt. Der
Einsatz von Funktionen kann auch bei der Aufbereitung einer
Datensammlung für den Import in eine Datenbank sinnvoll sein. Nicht
selten erhalten Sie die Daten nicht in der gewünschten Form; Anpassungen
sind daher in vielen Fällen vonnöten. In diesem Abschnitt werden Ihnen
zunächst eine Reihe an nützlichen Funktionen vorgestellt1.
Anschließend werden wir uns eine Beispieldatensammlung
aus der Praxis vornehmen, um dort die Funktionsweise ausgewählter
Formeln in praxi auszuprobieren.
Ein wichtiger Hinweis bereits vorab: Für den Import der
Daten müssen Sie diese unabhängig von den angewandten
Calc-Formeln abspeichern. Gehen Sie wie folgt vor:
Funktionen in Calc lassen sich in folgende Kategorien unterteilen:
Im Folgenden werden wir uns mit Funktionen aus den Bereichen Text, Filtern, Matrix und Tabellen befassen.
Textfunktionen sind hilfreich, um eine Datensammlung zu modellieren, d.h. in ein einheitliches Format zu bringen und zeitsparend für den Import in eine Datenbank aufzubereiten.
Funktion | Problemstellung | Beispiel Problem | Beispiel Lösung | Lösungsbeschreibung |
---|---|---|---|---|
=LÄNGE(E20) | Anzahl der Zeichen in Zelle E20? | Ludwig XIV. | 11 | Zelle E20 umfasst 11 Zeichen |
=FINDEN(„ä“;F4) | An welcher Position befindet sich in Zelle F4 ein "ä"? | Städel Museum | 3 | In Zelle F4 befindet sich ein "ä" an 3. Position |
=GLÄTTEN(C1) | Unnötige Leerzeichen innerhalb einer Zelle tilgen | Ludwig der XIV. | Ludwig der XIV. | Leerzeichen wurde entfernt |
=SÄUBERN(F3) | In Zelle F3 befinden sich fehlerhaft ausgegebene Zeichen | Ludðwig XIV. | Ludwig XIV. | Fehlerhaft ausgegebenes Zeichen wurde entfernt |
=ERSETZEN(Zelle; Position; Länge; "Textersatz") |
In Zelle E3 soll ab dem 32. Zeichen mit einer Länge von 30 Zeichen den bestehenden Text durch neuen Text ersetzen: =ERSETZEN(E3; 32; 30; "id/1181-03-11_1_0_4_2_4_4_2583") | http://www.regesta-imperii.de/1181-03-11_1_0_4_2_4_4_2583 | http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | Die veraltete URL wurde im Masseverfahren aktualisiert |
=KLEIN(G4) | In Zelle G4 befindlicher Text soll in Kleinbuchstaben wiedergegeben werden | Ludwig_XIV | ludwig_xiv | Text in Kleinbuchstaben ausgegeben, z.b. für halbautomatische Erstellung von URLs |
=VERKETTEN(E5;F5)2 | Inhalt aus den Zellen E5 und F5 soll verbunden werden | E5: http://www.regesta-imperii.de/id/ F5: 1181-03-11_1_0_4_2_4_4_2583 | http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | Zelleninhalte verbunden, z.b. für halbautomatische Erstellung von URLs |
=VERKETTEN(E5;"/id/";F5) | Inhalt aus den Zellen E5 und F5 soll mit einer Einfügung verbunden werden | E5: http://www.regesta-imperii.de F5: 1181-03-11_1_0_4_2_4_4_2583 | http://www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | Zelleninhalte mit statischer Einfügung verbunden |
=WECHSELN(C1;"ö";"oe")3 | In Zelle C1 befindlicher Umlaut 'ö' soll in 'oe' umgewandelt werden | http://www.öaw.ac.at/österreichische-akademie-der-wissenschaften/ | http://www.oeaw.ac.at/oesterreichische-akademie-der-wissenschaften/ | Der fehlerhafte Umlaut in der URL wurde entfernt |
=RÖMISCH(B11) | In Zelle B11 befindliche Zahl soll als römische Zahl wiedergegeben werden | 14 | XIV | Die arabische Zahl 14 wird als römische Zahl (XIV) wiedergegeben |
=ARABISCH(B11) | In Zelle B11 befindliche Zahl soll als arabische Zahl wiedergegeben werden | XIV | 14 | Die römische Zahl XIV wird als arabische Zahl (14) wiedergegeben |
Funktion | Problemstellung | Beispiel Problem | Beispiel Lösung | Lösungsbeschreibung |
---|---|---|---|---|
=WECHSELN(WECHSELN(WECHSELN ((C1;"ö";"oe");"ü";"ue");"ß";"ss") |
In Zelle C1 befindliche Umlaute und ß sollen umgewandelt werden | größere Änderungen | groessere Aenderungen | Mehrere Änderungen können verschachtelt werden |
=ERSETZEN(A3;1;6;VERKETTEN (TEIL(A3;1;2);"_";TEIL(A3;3;2);"_";TEIL(A3;5;2))) |
In Zelle A3 befindliches Datum soll mit Unterstrichen ausgegeben werden | 090816 | 09_08_16 | Auch hier ist eine Verschachtelung mehrerer Funktionen notwendig |
Funktion | Problemstellung | Beispiel Problem | Beispiel Lösung | Lösungsbeschreibung |
---|---|---|---|---|
=LINKS(D3;26) | Eine genaue Anzahl an Zeichen aus einer Zelle ausgeben, beginnend von links | www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | www.regesta-imperii.de/id/ | Es wurde das Grundgerüst der URL zur Weiterverarbeitung vom veränderlichen Teil abgetrennt. |
=RECHTS(D3;27) | Eine genaue Anzahl an Zeichen aus einer Zelle ausgeben, beginnend von rechts | www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | 1181-03-11_1_0_4_2_4_4_2583 | Es wurde die ID vom URL-Grundgerüst zur Weiterverarbeitung abgetrennt.4 |
=RECHTS(D3;FINDEN(„/“;D3)) | Alle Zeichen aus einer Zelle bis zum Backslash ausgeben, beginnend von rechts | www.regesta-imperii.de/id/1181-03-11_1_0_4_2_4_4_2583 | 1181-03-11_1_0_4_2_4_4_2583 | Es wurde eine beliebig lange ID vom URL-Grundgerüst zur Weiterverarbeitung abgetrennt.5 |
=TEIL(D3;5;15) | Exakt 15 Zeichen ab dem fünften Zeichen der Zelle | www.regesta-imperii.de/ | regesta-imperii | Es wurden exakt 15 Zeichen ab dem fünften Zeichen der Zelle ausgegeben. |
=WENN(B6>1; "x"; "o")6 | Wenn eine bestimmte Bedingung (z.B. B6>1) erfüllt ist, setze "x"; wenn nicht erfüllt, setze "o". | =WENN(B6>1; "x"; "o"); B6 = 3 | Ergebnis: "x" (d.h. "korrekt") | Da B6 (3) größer als 1 ist, wird ein "x" in der Zelle gesetzt |
=WENN(ISTLEER(B6); "Nicht vorhanden"; B6+C6) | Weiteres Beispiel: Wenn Zelle C6 leer, zeige "nicht vorhanden" an; wenn Zelle C6 nicht leer, soll Summe von B6 und C6 berechnet werden. | =WENN(ISTLEER(B6); "Nicht vorhanden"; B6+C6); B6 = 3; C6 = 6 | Ergebnis: B6+C6 (9) | Da die Zelle B6 nicht leer ist, wird die Rechenoperation durchgeführt. |
Addieren, Multiplizieren etc. von ganzen Zellbereichen, auch mit Einbezug von
Bedingungen
CalcFunktionenMatrix(2f)GrundRechenarten
CalcFunktionenMatrix(2f)RechnenWenn
CalcFunktionenMatrix(2f)Matrix
CalcFunktionenTabellen(2f)DatenFinden