BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 1
InformationsmodellierungÜbersicht
Datei: IMVorlesung.ppt Autor: C. Riewerts
Inhalt:
• Überblick
• Entity Relation Ship Diagramm
• Attribute
• Relationenmodell (Tabellendarstellung)
• Normalisierung
• Integritätsbedingungen
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 2
InformationsmodellierungÜberblick
Phasen:
Analyse-Phase
Design-Phase
Programmier-Phase
Begriffe/Merkmale:
Informationsobjekte
ERD (oder auch ERM)
Tabellen
Datenbankschema
Integritätsbedingung
Datensätze, Indizes
Speicherstrukturen
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 3
InformationsmodellierungEntity Relationship (ER) Diagramm
MitarbeiterFertigmeldung
AbteilungArtikelBestellung
Kündigung
Projekt
ER-Diagramm (ERD):
Ein ER-Diagramm ist die grafische Darstellung von Informationsobjekten (auch Entitäten genannt) und deren Beziehungen untereinander (Peter Chen).
Informationsobjekt:
Ein Informationsobjekt ist ein individuelles und identifizierbares Exemplar von Dingen, Personen oder Begriffen der realen oder der Vorstellungswelt.
• gezeichnet im ERD als Rechteck
• Namensvergabe: Substantiv
• wird durch Attribute näher beschrieben
• Beispiele (für Personen, Dinge, Aktionen und abstrakte Begriffe):
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 4
InformationsmodellierungEntity Relationship (ER) Diagramm
Beziehung:
Eine Beziehung assoziiert wechselseitig zwei (oder mehr) Entitäten (Informationsobjekte):
• gezeichnet im ERD als Raute mit einer Linie zur jeweiligen Entität
• Namensvergabe:
– Verb, um die Darstellung Entität-Beziehung-Entität von links nach rechts lesen zu können oder
– Substantiv, wenn aus Gründen der Vereinheitlichung ein Hauptwort gefordert ist oder mehr als 2 Entitäten assoziiert sind.
• wird durch Attribute näher beschrieben
• Es gibt drei Typen von Beziehungen (nach Chen): 1:1, 1:n und n:m, die man mit dem Konditionalzeichen c erweitern kann, so dass Kann- und Muss-Beziehungen unterschiedlich dargestellt werden können, wie z.B. 1:c, 1:mc und n:mc mit
n = 1,2,3,4,… und m = 1,2,3,4,…
c = 0 oder 1 und mc = 0,1,2,3,4,…
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 5
InformationsmodellierungEntity Relationship (ER) Diagramm
1:1-Beziehung (Muss-Beziehung)
1:c-Beziehung (Kann-Beziehung)
1:n-Beziehung (Muss-Beziehung):Zu jedem Vater gibt es ein oder mehrere Kinder, jedes Kind hat genau einen Vater.
1:mc-Beziehung (Kann-Beziehung): Es gibt Männer, die haben keine Kinder.
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 6
n:m-Beziehung (Muss-Beziehung):Ein Schüler muss mindestens einen Kurs besuchen. Umgekehrt muss jeder Kurs von mindestens einem Schüler belegt werden.
nc:mc-Beziehung (Kann-Beziehung):Ein Schüler kann ein Fach oder mehrere Fächer belegen, ein Fach kann von mehreren Schülern belegt sein, jedoch auch von keinem.
InformationsmodellierungEntity Relationship (ER) Diagramm
Implizite Beziehung:
(heißt im INNOVATOR„hierarchische Beziehung“)
BuchBibliotheks-exemplar
gibt esals
1 mc
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 7
InformationsmodellierungEntity Relationship (ER) Diagramm
Implizite Beziehung (is part of):Rechnung
Rechnungs-position
enthält1 n
Implizite Beziehung (is a):
• Artikel auf Lager oderauch nicht
• Geschäftspartner kannein Lieferant oderein Kunde sein.
Sortiments-artikel
Lager-artikel
ist vorh. als1 c
Geschäfts-partner
Lieferant
ist ein1
c
Kundec
Rekursive Beziehung (mit Rollenbezeichnungen):
Mitarbeiter Mitarbeiterist Chef
von
cmc
Bauteilbesteht
aus
Baugruppe
Teil
UntergebenerVorgesetzter
c
mc
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 8
InformationsmodellierungEntity Relationship (ER) Diagramm
Bitte bei (min, max)-Notation Umkehrung beachten!
(0,*)(0,*)mc:nc
(1,1)(0,*)1:nc
(1,1)(1,*)1:n
(1,1)(0,1)1:c
(1,1)(1,1)1:1
Comp(E2, R)Comp(E1, R)Comp(E1, E2)
(min, max)-Notation(1,M,N)-Notation
Gegenüberstellung von (1,m,n)- und (min, max)-Notation: Eine Beziehung R = (E1, E2) wird in der (min, max)-Notationdurch Angabe der zwei Komplexitätsgrade Comp(E1, R) und Comp(E2, R) beschrieben, wobei für die Eckwerte von min und max gilt: 0 ge min ge 1 ge max ge *mit ge = grössergleich:
Weitere alternative Darstellungsformen der Kardinalität („Krähenfüße“):
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 9
InformationsmodellierungEntity Relationship (ER) Diagramm
Übung:Tragen Sie in das
nebenstehende
ERD zusätzlich die
(min, max)-Notation
ein.
Bestellung
Lieferant besitzt1 c
Konto
1
Artikel
Bestell-position
mcnc
erhält
enthält
bestehtaus
m
1
n
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 10
Attribute von Entitäten:
• Identifizierende Attribute (Schlüsselattribute):
– Primärschlüssel (i. d. R. durch Unterstrich gekennzeichnet, obligatorisch, kann zusammengesetzt sein)
– Sekundärschlüssel (alternativer Primärschlüssel)
– Fremdschlüssel (existiert in anderen Entitäten als Primärschlüssel)
• Beschreibende Attribute (sind optional):
– sollten funktional vom Primärschlüssel abhängen (2.Normalform)
– sollten untereinander nicht funktional abhängen (3. Normalform)
• Darstellung:
– als Liste
– in einer Ellipse als Erweiterung im ERD:
Mitarbeiter = (Pers-Nummer, Name, Geburtsdatum)
Konto
KontonrKontostand
InformationsmodellierungAttribute
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 11
Attribute von Beziehungen:
• Primärschlüssel von den assoziierten Informationsobjekten ( = Fremdschlüssel)
• Beschreibende Attribute (sind optional)
• Beispiel: n:m-Beziehung
InformationsmodellierungAttribute
Mitarbeiterarbeitet
inn mc
Projekt
Mitarbeiter = (Pers-Nummer, Name, Geburtsdatum, ..)
Projekt = (Projekt-ID, Projektlaufzeit, ..)
PrimärschlüsselPrimärschlüssel
arbeitet in = (Pers-Nummer, Projekt-ID, Kapazität)
Kapazität ist ein beschreibendes Attribut
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 12
Relationenmodell:
• Beim Übergang von der Analyse zum Design und damit bei der Wahl einer Relationalen Datenbank wird das Datenmodell in ein Relationenmodell überführt.
• In einer relationalen Datenbank sind alle Informationen explizit auf der logischen Ebene genau auf eine Art repräsentiert: als Werte in Tabellen (= Relationen) (E.F.
Codd)
InformationsmodellierungRelationenmodell
13.02.2007MüllerSN-32
Vormerkung
06.02.2007MüllerAW-90
01.02.2007MayerBB-45
01.02.2007MayerSN-32
DatumNameBuch-Signatur
Attribute (Spalte)
Ausprägung(Tupel)
Primärschlüssel
• Reihenfolge der Zeilen und Reihenfolge der Spalten sind ohne Bedeutung.
• Die Raute des Informations-modells wird umgesetzt und erscheint als Fremdschlüssel-Beziehung in einer Tabelle.
• Attributwerte sind immer vom gleichen Typ (Domäne)
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 13
1:n Beziehung im Relationenmodell:
Der Primärschlüssel der 1-Relation erscheint als zusätzliches Attribut in der n-Relation und wird dort als Fremdschlüssel bezeichnet:
InformationsmodellierungRelationenmodell
Abteilung Angestellter1
beschäftigtn
Angestellter-ID
Abteilungs-_Kürzel
NameAnzahl MA
Tabelle
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 14
Übung zur 1:n Beziehung im Relationenmodell:
Wie sehen die 2 Tabellen aus incl. Fremdschlüssel, wenn man die Relation „beschäftigt“ nicht dem Angestellten zuordnet - wie vorgeschrieben - , sondern der Abteilung (s. Bild)? Diskutieren Sie diese Alternative.
InformationsmodellierungRelationenmodell
Abteilung Angestellter1
beschäftigtn
Angestellter-ID
Abteilungs-_Kürzel
NameAnzahl MA
Tabelle
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 15
InformationsmodellierungRelationenmodell
Mehrfachattribute:
• Sind in der 1. Normalform (s. Normalisierung) nicht erlaubt
• Beispiel: Mitarbeiter ist in mehreren Wohnorten gemeldet
Mitarbeiter = (Mitarbeiter-Nummer, Adressen, Name)
• Lösung 1, wenn Anzahl der Wohnsitze begrenzt und bekannt
Mitarbeiter = (Mitarbeiter-Nummer, Adresse1, Adresse2, Adresse3, Name)
• Lösung 2 (Entität statt Attribut)
• Frage: wenn jetzt mehrere Mitarbeiter dieselbe Adresse haben?
Mitarbeiter = (Mitarbeiter-Nummer, Name)
Adresse = (Wohnsitz)
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 16
n:m Beziehung im Relationenmodell:
Aus einer n:m Beziehung im Datenmodell werden zwei 1:n Beziehungen mit einer sogenannten Beziehungsentität:
InformationsmodellierungRelationenmodell
Mitarbeiterarbeitet
inn mc
Projekt
Tabelle
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 17
Unnormalisierte Tabelle:
• Redundante Datenhaltung
• Speicheroperationen wie Neuzugang, Löschen und Aktualisieren können zu einer inkonsistenten Datenhaltung führen
• Schwierige Handhabung (z.B. wegen der Mehrfach-Attribute)
Aufgabe: Bringen Sie die Tabelle in die 1. Normalform.
InformationsmodellierungNormalisierung
PM-Einsatz
CASE-Konzept
S30020
S30021
20
80
KonstruktionKKönig112226
PC-AngebotS30022100ZentraleinkaufZEUKeiser112227
Mitarbeiter
100
80
20
Zeit [%]
Konstruktion
Entwicklung
Abt-Name
K
E7
Abt-Nr
Graf
Meyer
Name
112225
112224
MA-Nr.
PM-EinsatzS30020
SW-Installation
HW-Installation
S30001
S30002
ProjektnameProjektnr
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 18
1. Normalform
Eine Tabelle (Relation) ist in der 1. Normalform, wenn jedes Attribut zu einem bestimmten Schlüsselwert höchstens einen(!) Attributwert besitzt
Aufgabe: Bringen Sie die Tabelle in die 2. Normalform.
InformationsmodellierungNormalisierung
PM-EinsatzS3002020KonstruktionKKönig112226
SW-InstallationS3000180EntwicklungE7Meyer112224
CASE-KonzeptS3002180KonstruktionKKönig112226
PC-AngebotS30022100ZentraleinkaufZEUKeiser112227
Mitarbeiter
100
20
Zeit [%]
Konstruktion
Entwicklung
Abt-Name
K
E7
Abt-Nr
Graf
Meyer
Name
112225
112224
MA-Nr.
PM-EinsatzS30020
HW-InstallationS30002
ProjektnameProjektnr
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 19
InformationsmodellierungNormalisierung
Mitarbeiter
KonstruktionKKönig112226
EntwicklungE7Meyer112224
ZentraleinkaufZEUKeiser112227
Konstruktion
Abt-Name
K
Abt-Nr
Graf
Name
112225
MA-Nr.
20S30020112226
100S30020112225
100S30022112227
Projektzugehörigkeit
80S30021112226
20S30002112224
80S30001112224
Zeit [%]ProjektnrMA-Nr.
2. Normalform
Eine Tabelle (Relation) ist in der 2. Normalform, wenn sie in der 1. Normalform ist und jedes nicht dem Schlüssel angehörende Attribut funktional abhängig ist vom Gesamtschlüssel, nicht aber von einzelnen Schlüsselteilen.
Projekt
CASE-KonzeptS30021
PM-EinsatzS30020
SW-InstallationS30001
PC-AngebotS30022
HW-Installation
Projektname
S30002
Projektnr
Aufgabe: Bringen Sie die Tabelle(n) in die 3. Normalform.
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 20
InformationsmodellierungNormalisierung
Mitarbeiter
KKönig112226
E7Meyer112224
ZEUKeiser112227
K
Abt-Nr
Graf
Name
112225
MA-Nr.
Projekt
CASE-KonzeptS30021
PM-EinsatzS30020
SW-InstallationS30001
PC-AngebotS30022
HW-Installation
Projektname
S30002
Projektnr
20S30020112226
100S30020112225
100S30022112227
Projektzugehörigkeit
80S30021112226
20S30002112224
80S30001112224
Zeit [%]ProjektnrMA-Nr.
3. Normalform
Eine Tabelle (Relation) ist in der 3. Normalform, wenn sie in der 2. Normalform ist und jedes Attribut direkt vom Schlüssel abhängig ist.
Abteilung
KonstruktionK
EntwicklungE7
ZentraleinkaufZEU
Abt-NameAbt-Nr
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 21
Übung:
Kennzeichnen Sie in den vier Tabellen aus dem Normalisierungsbeispiel (s.v.) diejenigen Attribute, die Fremdschlüssel sind.
Wandeln Sie danach die Tabellen in ein ERD um unter Verwendung der Tabellennamen für die Entitäten. Die richtigen Kardinalitäten können aus den Beispieleinträgen abgeleitet werden.
InformationsmodellierungNormalisierung
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 22
Integritätsbedingungen sind notwendig, um mit den Abhängigkeiten der Tabellen (Fremdschlüsselbeziehungen) „richtig“ umgehen zu können:
• Anwendungsbezogene Integrität (domain integrity):
– Zwischen den Attributen bestehen inhaltliche Abhängigkeiten, z.B. Summenattribut
– Wertebereich von Attributen soll eingehalten werden
– Zwei Beziehungen sollen sich gegenseitig ausschließen
– ….
• Ganzheitliche Integrität (entity integrity):
– Kein Attribut, das Teil eines Primärschlüssels einer Tabelle ist, darf Nullwerte annehmen.
• Referenzielle Integrität / Beziehungsintegrität (referential integrity):
– Für jeden vom Nullwert verschiedenen Fremdschlüssel muss ein entsprechender Primärschlüssel aus derselben Domäne existieren.
– Für jeden Fremdschlüssel sind festzulegen:• Darf der Fremdschlüssel Nullwerte annehmen?
• Was soll mit dem Fremdschlüssel geschehen, wenn der Primärschlüssel gelöscht bzw. modifiziert wird?
InformationsmodellierungIntegritätsbedingungen
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 23
InformationsmodellierungIntegritätsbedingungen
Beispiele für Beziehungsintegrität (Löschen des Primärschlüssels):
1.) Weitergabe der Löschung (CASCADE), d.h. alle Tupel der Tabelle mit einem Fremdschlüssel, der dem gelöschten Primärschlüssel entspricht, werden ebenfalls gelöscht.
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 24
InformationsmodellierungIntegritätsbedingungen
Beispiele für Beziehungsintegrität (Löschen des Primärschlüssels):
2.) Bedingte Löschung (RESTRICT, default), d.h. ein Tupel in der Tabelle mit dem Primärschlüssel kann nur dann gelöscht werden, wenn in der referierenden Tabelle kein Tupel mehr mit einem Fremdschlüssel existiert, der dem Primarschlüssel entspricht.
BA Stuttgart, Technische Informatik, SW-Engineering, Informationsmodellierung Juni 2008
Seite 25
InformationsmodellierungIntegritätsbedingungen
Beispiele für Beziehungsintegrität (Löschen des Primärschlüssels):
3.) Nullsetzen bei der Löschung (SET NULL), d.h. alle Fremdschlüsselwerte, die dem Primärschlüssel entsprechen, werden in der referenzierten Tabelle zu Null gesetzt.