Verschiedene Arten von Datenmodellen

From DHVLab

Revision as of 10:32, 5 April 2018 by Jschulz (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Mit Hilfe eines Datenmodells[A 1] werden die zu beschreibenden und zu verarbeitenden Daten eines bestimmten (Forschungs-)Bereiches modellhaft mit ihren Beziehungen zueinander dargestellt. Es dient in der konzeptionellen Phase eines Datenbankprojekts als Grundlage zur Erstellung des Datenbank-Designs. Zwei Fragen stehen bei der Erstellung eines Datenmodells im Fokus:

  • Welche Objekte stehen im Erkenntnisinteresse und welche Beziehungen zwischen diesen Objekten besitzen Relevanz?
  • Auf welche Weise sollen die Objekte und ihre Beziehungen dargestellt werden?

Ein Datenmodell gibt Antworten auf diese Fragen. Als theoretische Grundlage eines Datenbanksystems beschreibt ein Datenmodell, auf welche Weise Daten in einem Datenbanksystem abgespeichert und verarbeitet werden sollen. Ein Datenmodell besitzt im Gegensatz zu einem Datenbankmodell (Stichwort: Datenbankschema; siehe unten) nicht zwangsläufig einen konkreten technischen Bezug und ist damit abstrakter.

Grundsätzlich gilt bei der Modellierung von Daten:

  • Strukturierung durch Kategorisierung, d.h. einzelne Objekte werden übergeordneten Kategorien (Objektklassen/Entitäten) zugeordnet. Zunächst gilt es also die einzelnen Objekte (Instanzen der Entitäten) zu bestimmen. Objekte besitzen Beziehungen zu anderen Objekten. Objekte können beliebig viele Eigenschaften (Attribute) besitzen.
  • Die Modellierung ist abhängig vom Forschungsinteresse des/der Wissenschaftlers/-in, d.h. verschiedene Ansätze sind möglich.

Eine Auswahl wichtiger Arten von Datenmodellen[A 2]:

Als de-facto-Standard bei der Datenmodellierung gilt das Entity Relationship Modell, kurz ERM. Die Objekte werden als "Entitäten", ihre Beziehung untereinander als "Relationen" bezeichnet. Objekte können unterschiedliche Arten von Beziehung zueinander besitzen:

- 1:1-Beziehungen: Jedem Datensatz aus einer Tabelle A ist genau ein Datensatz aus einer Tabelle B zugeordnet und umgekehrt. Diese Art von Beziehung tritt eher selten auf.
Beispiel: Jede Urkunde besitzt genau eine Registraturnummer. Umgekehrt ist jede Nummer genau einer Urkunde zugeordnet.
- 1:n-Beziehungen: Jedem Datensatz aus einer Tabelle A können beliebig viele passende Datensätze aus einer Tabelle B zugeordnet werden, jedoch umgekehrt nur ein Datensatz aus Tabelle B einem Datensatz aus Tabelle A. Diese Form der Beziehung tritt am häufigsten auf.
Beispiel: Einer Partei können beliebig viele Politiker angehören. Umgekehrt kann jeder Politiker nur einer Partei angehören.
- n:m-Beziehungen: Jedem Datensatz aus einer Tabelle A können beliebig viele passende Datensätze aus einer Tabelle B zugeordnet werden und umgekehrt. Dies erfolgt über eine dritte, zu erstellende Tabelle, in der zur eindeutigen Zuordnung die Primärschlüssel der jeweiligen Datensätze in Verbindung gesetzt werden.
Beispiel: Ein Buch kann beliebig viele Autoren besitzen und jeder Autor kann beliebig viele Bücher verfasst haben.

Sowohl Objekte als auch die Beziehung zwischen Objekten können Eigenschaften (Attribute) aufweisen, die diese genauer beschreiben. Üblicherweise werden in einem ERM die Entitäten rechteckig, die Relationen rautenförmig dargestellt.
Grundlegende Komponenten des ERM sind also Entitäten, Relationen und Attribute. Ihre grafische, relationale Darstellung wird als Entity-Relationship-Diagramm (ERD) bezeichnet.
Nachfolgend ein Beispiel eines ERD aus dem Kurs "Vom gedruckten Buch zur digitalen Karte":

Er diagramm.png



Zurück zu Einführung Datenbanken ⇐⇒ Weiter zu Das relationale Datenmodell - Theoretische Grundlagen I

Anmerkungen

  1. Grundlage für die folgenden Ausführungen: Institut für Informatik und DH-Lehre.
  2. Vgl. hierzu die Beispiele im Handbuch von Stephan Lücke auf dh-lehre.