Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 1
Hochschule Anhalt, SS 2005 1Visualisierung, Prof. Dr. W. Müller
Visualisierung
Daten
Detlef KrömkerUni Frankfurt, Graphische Datenverarbeitung
Wolfgang MüllerPH Weingarten, Mediendidaktik und
Visualisierung
Frankfurt, WS 2007/2008 2Visualisierung, D. Krömker W. Müller
Übersicht
Wiederholung letzte Vorlesung (Teil B+C)
Was kann visualisiert werden? (Teil D)
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 2
Frankfurt, WS 2007/2008 3Visualisierung, D. Krömker W. Müller
Allgemeine Anforderungen
Eine Visualisierung soll expressiv, möglichst effektiv und angemessen
sein
Frankfurt, WS 2007/2008 4Visualisierung, D. Krömker W. Müller
Einflussfaktoren der Visualisierungsqualität
Einflussfaktoren auf die Visualisierung sind Art und Struktur der Daten
Z.B. Typ der Daten, Dimension des Beobachtungsbereiche Bearbeitungsziel bei der Visualisierung
Z.B. Überblick, Detailanalyse oderErgebnispräsentation für Dritte
Vorwissen des Anwenders/Betrachters Z.B. Laie, Entscheider, Planer
Visuellen Fähigkeiten und Vorlieben des Betrachters Z.B. rot-grün-blind, spezielle Farbpräferenzen
Übliche Metaphern oder Konventionen des Anwendungsgebietes, Z.B. übliche Symbole oder übliche Darstellungsformen
Charakteristika des Darstellungsmediums Z.B. Auflösung, Anzahl der darstellbaren Farben und Rechenleistung
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 3
Frankfurt, WS 2007/2008 5Visualisierung, D. Krömker W. Müller
Der Visualisierungsprozess
Die Visualisierungspipeline Transformationen (Funktionen) Datenarten und Datenfluss
Klassifikation der Visualisierungen
Rollen im Visualisierungsprozess
Referenzmodell für die Visualisierung
Visualisierungsszenarien
Frankfurt, WS 2007/2008 6Visualisierung, D. Krömker W. Müller
Die Visualisierungspipeline
Visualisierungspipeline Repräsentiert die typische
Vorgehensweise zurErzeugung einerVisualisierung fürvorgegebene Daten undVisualisierungsziel
Zeigt die verschiedenenStufen des Visualisierungs-prozesses und dieentsprechendenZwischenergebnisse auf
Filterung
Mapping
Rendering
Daten
Medien
Aufbereitete Daten
Visualisierungselemente
Steuerung
Steuerung
User
Wahrnehmung
Interaktion
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 4
Frankfurt, WS 2007/2008 7Visualisierung, D. Krömker W. Müller
VisualisierungsszenarienBsp. Interaktives Postprocessing
SchrittDatenerzeugung
Roh- daten
BeobachtungMessung
Modellierung
SimulationBerechnung
1 SchrittInteraktive Visualisierung
Bild
2
Roh- daten
Visualisierung
Analyse
Nutzer
Frankfurt, WS 2007/2008 8Visualisierung, D. Krömker W. Müller
Visualisierungsprozesse
Rollen im Visualisierungsprozess: Autor – Betrachter
Nutzungsszenarien: Tracking Interaktives Postprocessing Bewegungsmodus Interaktive Steuerung
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 5
Hochschule Anhalt, SS 2005 9Visualisierung, Prof. Dr. W. Müller
Was kann visualisiert werden?Teil D
Frankfurt, WS 2007/2008 10Visualisierung, D. Krömker W. Müller
Übersicht
Beschreibung der Daten Datenquellen Beobachtungsraum Datenmerkmale
Datenspezifikation
Datenformate
Reduktion einer Datenmenge Projektion Selektion
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 6
Frankfurt, WS 2007/2008 11Visualisierung, D. Krömker W. Müller
Beschreibung der Daten
Daten unterscheiden sich bezüglich Struktur Dimensionalität Umfang ... Bezugsraum in dem sie gemessen, beobachtet
berechnet, entworfen werden
Kennen und Berücksichtigen dieser Charakteristika istentscheidend für die Erfüllung des Kriteriums„Expressivität“
Frankfurt, WS 2007/2008 12Visualisierung, D. Krömker W. Müller
Datenquellen
Daten stammen aus der realen Welt theoretischen Welten künstlichen Welten
liefern Datenmengen im Mega-, Giga-, Terabytebereich,wobei maßgebend sind Anzahl der Mess- oder Beobachtungspunkte Anzahl der Parameter pro Punkt Anzahl der Werte pro Parameter Speicheraufwand pro Wert
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 7
Frankfurt, WS 2007/2008 13Visualisierung, D. Krömker W. Müller
Beispiele: Datenquellen
Filme
Spezialeffekte
WWW(gesamtes Web)
Spiele
VR-Szenarien
WWW(Einzeldokumente)
KünstlicheWelten
Hochenergie-physik
Astronomie
Geographie
(Militär ?)
Seismik
Kristallographie
Geographie
Meteorologie
Medizin
Medizin
Geographie
Meteorologie
Elektronen-mikroskopie
Reale Welt
Messdaten
TerabyteGigabyteMegabyte
Frankfurt, WS 2007/2008 14Visualisierung, D. Krömker W. Müller
Beispiele: Datenquellen
CustomerRelationship Data
Ökonomie- oderFinanzmodelle
GeschäftsdatenWirtschafts-wissenschaften
Styling (Auto)Architektur
Konstruktion (FEM)
Anlagenplanung
Ingenieur-wissenschaften
Moleküldesign
Meteorologie
Strömungs-simulation (CFD)
Molekulardynamik
Quantenchemie
Mathematik
Naturwissen-schaften
TerabyteGigabyteMegabyteTheoretischeWelten
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 8
Frankfurt, WS 2007/2008 15Visualisierung, D. Krömker W. Müller
Beobachtungsraum
Wir unterscheiden: physikalischer Raum (3 Ortsdimensionen + Zeit) abstrakter Raum beliebige Dimension
Allgemeine Annahme: metrische Räume
Beobachtungsraum Dimensionalität Wirkungskreis und Verbund der Beobachtungspunkte
Beobachtungspunkte Koordinaten des Beobachtungsraums, an denen Daten
vorliegen
Frankfurt, WS 2007/2008 16Visualisierung, D. Krömker W. Müller
Beobachtungsraum
Dimensionalität des Beobachtungsraums entspricht der Anzahl der unabhängigen Parameter
(Variablen)
Charakteristika des Beobachtungsraums diskret
regulär (äquidistant) nicht regulär (Scattered, z.B. Event-gesteuert)
Kontinuierlich Aber: im Rechner immer diskretisiert und
quantisiert!
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 9
Frankfurt, WS 2007/2008 17Visualisierung, D. Krömker W. Müller
Dimension des Beobachtungsraums
Terminologie zur Dimension des Beobachtungsraums 1-dimensionale Daten Dimension = 1 2-dimensionale Daten Dimension = 2 3-dimensionale Daten Dimension = 3 Multidimensionale Daten Dimension > 1
Frankfurt, WS 2007/2008 18Visualisierung, D. Krömker W. Müller
Datenmerkmale
Merkmale Größen, die in einem Beobachtungsraum gemessen,
berechnet oder entworfen werden Spannen den Merkmalsraum auf Andere Bezeichnung: abhängige Variable
Aspekte Datentyp: Typ des Merkmals Dimensionalität: Anzahl der Werte pro Beobachtungspunkt Wertebereich: mögliche Ausprägung des Wertebereichs Strukturierung: Beziehungen zwischen den Merkmalen
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 10
Frankfurt, WS 2007/2008 19Visualisierung, D. Krömker W. Müller
Merkmalsraum (I)
“Unabhängige Variablen" vs. “abhängige Variablen" Unabhängige Variablen werden durch den
Beobachtungsraum beschrieben Alle anderen Attribute sind “abhängige Variablen”
und beschreiben den Merkmalsraum Bemerkung: die Unterscheidung von
unabhängigen und abhängigen Variablen ist oftnur bei Daten mir Orts-/Raumbezug eindeutigmöglich und in vielen anderen Fällen willkürlich!
Frankfurt, WS 2007/2008 20Visualisierung, D. Krömker W. Müller
Merkmalsraum (II)
Terminologie Univariate Daten
Dimension des Merkmalsraums = 1 Bivariate data
Dimension des Merkmalsraums = 2 Multivariate Daten, Multiparameter-Daten
Dimension des Merkmalsraums > 2
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 11
Frankfurt, WS 2007/2008 21Visualisierung, D. Krömker W. Müller
Datentypen (I)
Datentypen Unterscheidung interner Formate wie zum Beispiel „Byte“ oder „Real“
Auch: Beschreibung des Grads der Quantisierung Charakterisierung der Anzahl der Komponenten eines Merkmals
Skalare Größen Werden als Zahl repräsentiert Beispiel: Temperatur
Vektorielle Größen Betrag und Richtung, n-Tupel von Skalaren Beispiel: Geschwindigkeit
Tensorielle Größen Zusammenfassung mehrerer skalarer Größen mit bestimmten
Transformationsverhalten Repräsentieren eine Menge von Werten und Richtungen
Frankfurt, WS 2007/2008 22Visualisierung, D. Krömker W. Müller
Datentypen (II)
Zusammenhänge Skalar: Tensor 0-ter Ordnung Vektor: Tensor 1-ter Ordnung Matrix: Tensor 2-ter Ordnung
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 12
Frankfurt, WS 2007/2008 23Visualisierung, D. Krömker W. Müller
Datentypen (III)
Qualitativ (Nominal) Keine Ordnungsrelation definiert Beispiele: Städtenamen, Automarken
Qualitativ (Ordinal) Ordnungsrelation, aber kein Maß zur
Bestimmung von Intervallgrößen Beispiele: erster, zweiter, dritter, …,
kalt, warm, heiß
Quantitativ (Intervall und Ratio) Kontinuierliche Prozesse oder
Phänomene Beispiel: Temperatur über die Zeit Ratio Scales erlauben zusätzlich zur
Bestimmung von Differenzen auch dieBestimmung von Verhältnissen
Daten
Qualitativ Quantitativ
Nominal Ordinal Intervall
Ratio
Frankfurt, WS 2007/2008 24Visualisierung, D. Krömker W. Müller
Datentypen (IV)
Bemerkung: Eine detailliertere Klassifikation von Datentypen ist
nur auf Basis eines akzeptierten gemeinsamenVerständnisses (z.B. standardisierte Ontologie)möglich
Dies korrespondiert zu einer Klassifikation desWissens und zumindest nicht trivial!
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 13
Frankfurt, WS 2007/2008 25Visualisierung, D. Krömker W. Müller
Beobachtungsraum: Wirkungskreis
punktuell
lokal
global
Daten gelten nur für denBeobachtungspunkt
Daten gelten in einer gewissenUmgebung um den Beobachtungs-punkt (z.B. durch endliche Aperturder Abtastung Integration übereine Region)
Daten gelten für den gesamtenBeobachtungsraum
Frankfurt, WS 2007/2008 26Visualisierung, D. Krömker W. Müller
Diskussion: Wirkungskreis
Wirkungskreis ist abhängig von Messverfahren und Kontext (d.h. Interpretation)
Bei punktuellem und globalem Wirkungskreis ist dieZuordnung der Messwerte eindeutig
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 14
Frankfurt, WS 2007/2008 27Visualisierung, D. Krömker W. Müller
Abtastung und Rekonstruktion (I)
Abtastung
Signal
Samples
Signal
Kontinuierliches Signal
Rekonstruktion
Diskretes Signal
Samples
Signal
Rekonstruiertes Signal
Frankfurt, WS 2007/2008 28Visualisierung, D. Krömker W. Müller
Abtastung und Rekonstruktion (II)
Abtastung
Signal
Rekonstruktion
Diskretes Signal
Samples
Signal
Rekonstruiertes Signal
Samples
Signal
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 15
Frankfurt, WS 2007/2008 29Visualisierung, D. Krömker W. Müller
Beispiel: Pixel Matrix
Frankfurt, WS 2007/2008 30Visualisierung, D. Krömker W. Müller
Abtasttheorem (I)
Frage: Wie muss ein Signal abgetastet werden, um eine korrekte
Rekonstruktion zu ermöglichen
Antwort: Shannon (1949)*:
„If a function f(t) contains no frequencies higher than W cps, itis completely determined by giving its ordinates at a series ofpoints spaced 1/2 W seconds apart.The function can be simply reconstructed from the samples byusing a pulse of the type
sin2
2
!
!
Wt
Wt
*Vorarbeiten durch H. Nyquist (1924) und J.M. Whittaker (1935).
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 16
Frankfurt, WS 2007/2008 31Visualisierung, D. Krömker W. Müller
Abtasttheorem (II)
Ein bandbegrenztes (kontinuierliches) Signal f(x),das mit Abtastintervallen abgetastet wird, kannfehlerfrei rekonstruiert werden, wenn dieAbtastfrequenzen größer als die Nyquist-Frequenzist:
x!
usbu
x2
1>=
!
mit
ubfürF >= !! 0)(
ub
su
(Bandbegrenzung)
© D
etle
f Krö
mke
r
Frankfurt, WS 2007/2008 32Visualisierung, D. Krömker W. Müller
Abtasttheorem (III)
Ein diskretes Signal lässt sich mit Hilfe eines (idealen)Tiefpasses mit der Übertragungsfunktion
rekonstruieren, so dass dieses mit dem ursprünglichen Signalidentisch ist. Das rekonstruierte Signal ist dann
][)sinc()(
][)()(
Ortsraumxxxh
bub
umFrequenzramiturectxuH
TP
uu
TP
!
!
!
"=
#"<<
"=
)(xfd
!
!
)(
)sin()()(
mx
x
mx
x
xmfxf
m "#
"##= $
%
"%=
© D
etle
f Krö
mke
r
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 17
Frankfurt, WS 2007/2008 33Visualisierung, D. Krömker W. Müller
Verbund der Beobachtungspunkte (I)
Unstrukturiert Keine implizite Ordnung der Datenobjekte Beispiel: Personendaten in Datenbank
Sequentiell Implizite Struktur der Datenobjekte in Form
eine geordneten Liste Beispiel: zeitvariante Daten
Gitter Datenobjekte definiert mit Bezug auf ein
Gitter Beispiel: Daten mit Raumbezug
Hierarchisch Hierarchische Struktur der Datenobjekte Beispiel: Dokumentenstruktur
Netz Netzstruktur der Datenobjekte Beispiel: Hypertext, Hypermedia, WWW
Frankfurt, WS 2007/2008 34Visualisierung, D. Krömker W. Müller
Verbund der Beobachtungspunkte (II)
Gitter als Verbund derBeobachtungspunkteMan unterscheidet: Regelmäßige Gitter Unregelmäßige Gitter Blockstrukturierte Gitter Strukturierte Gitter Hybride Gitter
Oft Vereinfachungen möglich,wenn eine bestimmteGitterstruktur gewählt wird
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 18
Frankfurt, WS 2007/2008 35Visualisierung, D. Krömker W. Müller
Regelmäßiges Gitter
Andere Bezeichnung uniformes Gitter
Eigenschaften achsparallele Gitterlinien
sehr oft orthogonal
häufig gleichabständig
Frankfurt, WS 2007/2008 36Visualisierung, D. Krömker W. Müller
Unregelmäßige Gitter
Andere Bezeichnung unstrukturierte Gitter
(Scattered Data)
Eigenschaften Gitterpunkte müssen immer
explizit angegeben werden
Typische Quellen Geländekartierungen
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 19
Frankfurt, WS 2007/2008 37Visualisierung, D. Krömker W. Müller
Blockstrukturierte Gitter
Eigenschaften Achsenparallele
Gitternetzlinien mitunterschiedlichen Abständen
Frankfurt, WS 2007/2008 38Visualisierung, D. Krömker W. Müller
Strukturiertes Gitter
Eigenschaften Koordinaten der
Gitterpunkte sind implizitdurch einen Index gegeben
Sind die Gitterlinien als Kurvenin Parameterform gegeben,sprechen wir von kurvilinearenGitter
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 20
Frankfurt, WS 2007/2008 39Visualisierung, D. Krömker W. Müller
Hybride Gitter
Zusammensetzung ausunterschiedlichenGittertypen
Frankfurt, WS 2007/2008 40Visualisierung, D. Krömker W. Müller
Schema zur Klassifikation von Daten
Daten über metrischen Räumen
skalare Daten tensorielle Datenvektorielle Daten
1,- 2,- 3-dimensionale Räume
höherdimensionale Räume
Einparameter-Daten Multiparameter-Daten
Daten auf regelmäßigenblockstrukturierten oderstrukturierten Gittern
gitterfreieDaten
Daten auf unregel-mäßigen oderhybriden Gittern
Dimensionalitätdes Beobach-tungsraums
Datenverbund
Anzahl der Merkmale
Datentyp
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 21
Frankfurt, WS 2007/2008 42Visualisierung, D. Krömker W. Müller
Unvollständige Daten undDaten mit lokalem Wirkungskreis
Viele Visualisierungsverfahren verlangen Vollständige Datensätze (Annährend) kontinuierliche Daten
Zusätzliches Problem Fehlende Daten könnnen zu unerwünschten
Artefakten bei der Visualisierung führen
Häufig gewählter Ansatz Interpolation oder Approximation des Werteverlaufs
für fehlende Daten auf Basis benachbarterDatenwerte mit lokalem/punktuellen Wirkungskreis
Frankfurt, WS 2007/2008 43Visualisierung, D. Krömker W. Müller
Interpolation und Approximation
Interpolation Verfahren zur Rekonstruktion des
kontinuierlichen Werteverlaufs aufBasis diskreter Datenwerte
Eigenschaft: alle ursprünglichenDatenwerte sind Teil der Kurve
Beispiele: Lagrange, SplinesInterpolation in 2d Voronoi Diagramme Scattered Data Interpolation
Approximation Eigenschaft: Datenwerte sind nicht
notwendigerweise Teil der Kurve Ggf. Vorteilhaft im Fall von
fehlerbehafteten Daten Beispiel: Taylor
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 22
Frankfurt, WS 2007/2008 44Visualisierung, D. Krömker W. Müller
Datenwertzuordnung
Datenwertzuordnung bei lokalem Wirkungskreis
Ausgangspunkt: Menge beliebig verteilter Beobachtungspunkte
(Scattered Data) in einem Beobachtungsraum
Übliche Verfahren zur Datenwertzuordnung Voronoi-Zerlegung Scattered-Data-Interpolation
Frankfurt, WS 2007/2008 45Visualisierung, D. Krömker W. Müller
Voronoi -Zerlegung
Vorgehensweise Beobachtungsraum wird unterteilt in Gebiete, so dass jedem
Gebiet genau ein Beobachtungspunkt zugeordnet ist Jeder Punkt X des Beobachtungsraumes wird nun genau
einem Gebiet Gj zugeordnet und zwar so, dass alle Punktedieses Gebietes zu dem Beobachtungspunkt dieses Gebieteseinen geringeren Abstand haben als zu allen anderenBeobachtungspunkten
{ }mkjkPXPXXG kj
n
j !"#$%<%&'= :
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 23
Frankfurt, WS 2007/2008 46Visualisierung, D. Krömker W. Müller
Beispiel: Voronoi-Zerlegung
Für die Messwerte wurde eine Klasseneinteilung vorgenommen
Voronoi-Zerlegung zur Visualisierung:
Frankfurt, WS 2007/2008 48Visualisierung, D. Krömker W. Müller
Scattered-Data-Interpolation
Voraussetzungen: Gegeben: Menge von Beobachtungspunkten
Pi = (x1i, .. ,xni) mit i = 1, 2, ... m; m ≥ 1 und m: Anzahl der Beobachtungspunkte, n: Dimension des Beobachtungsraumes mit n ≥ 1, xl: l-te Dimension des Beobachtungsraums mit l = 1, ...,n
und xli die Koordinate des i-ten Beobachtungspunktes bzgl. der
I-ten Dimension. Für jeden Beobachtungspunkt Pi sei ein Datenwert fi gegeben.
Gesucht: Funktion
F(x1, .. , xn) = fi
ohne Voraussetzungen bzgl. Verteilung derBeobachtungspunkte
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 24
Frankfurt, WS 2007/2008 49Visualisierung, D. Krömker W. Müller
Shepard-Interpolation
.
122
22
2
11
1
1
1
1
1
1
1
))(...)()(()..,,(..
)..,,(
)..,,(
),..,(
!!
=
=
!+!+!==
=
"
"
nknkkknk
m
k
nk
m
k
knk
n
xxxxxxdxxWmitBz
xxW
fxxW
xxF
Kritik: alle Datenwerte haben globalen Einfluss. Man beschränkt also den Einfluss eines Datenwertes, z.B. nach Franke-Little
!"#
$
>%=%
&'
()*
+
,
%=
+
+
k
kk
k
k
k
nk
dr
drdrdr
mitdr
drxxW
falls0
falls)(
)(),..,(
2
1
r ist Radius des Wirkungskreises
Frankfurt, WS 2007/2008 50Visualisierung, D. Krömker W. Müller
Beispiel: Shepard-Interpolation
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 25
Frankfurt, WS 2007/2008 51Visualisierung, D. Krömker W. Müller
Weitere Charakteristika
Zusammensetzung der Datenmenge:
Welche Datentypen mit welchen Wertebereich: nominal,ordinal, metrisch
Umfang der Datenmenge: Wieviele Merkmale, wie oft, an wievielen
Beobachtungspunkten
Qualität der Datenmenge: Vollständigkeit und Fehlerbetrachtung
Weitere bekannte Zusammenhänge: Redundanzen, Korrelationen, ...
Frankfurt, WS 2007/2008 52Visualisierung, D. Krömker W. Müller
Metadaten (nach Treinisch)
„Datenbasis“ – Metadaten Notwendige Informationen zum Datenzugriff (z.B.
Datenbankkennung, Passwort, Datenformate)
„Attribut“ – Metadaten Charakterisierung der Daten (z.B. Merkmalsraum, Typen, etc.)
„Hilfs“(meta)daten Zusätzliche (i. allg.) numerische Daten, die für eine richtige
Interpretation der gegebenen Datenmenge erforderlich sind(z.B. demographische Daten oder Zeitangaben)
„Andere“ Metadaten Daten zur qualitativen Beurteilung In der Regel begleitende Texte
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 26
Frankfurt, WS 2007/2008 53Visualisierung, D. Krömker W. Müller
Attributmetadaten (I)
Spezifikation von Attributmetadaten nach Bergeron und GrinsteinGrundlegender Ansatz zur Klassifikation m-dimensionale Datenelemente auf einem
k-dimensionalen Gitter
Beispiele: Multiparameter-Daten: mit m ≥ 2 und k beliebig.
Gitterfreie Daten: mit m ≥ 1. Volumendaten: und Datenelement ist
Skalar
Strömungsdaten: mit k ≤ 3 und Daten-element Vektor
Kritik: Volumendaten und Strömungsdaten nicht ohne weiteresunterscheidbar
k
mL
0
mL
3
1L
kL1
k
mL
Frankfurt, WS 2007/2008 54Visualisierung, D. Krömker W. Müller
Attributmetadaten (II)
Spezifikation von Attributmetadaten nach BrodlieGrundlegender Ansatz zur Klassifikation Unabhängige Variablen werden in ihrer Dimensionalität
(unterer Index) beschrieben: Wirkungskreis
Keine Klammer: Daten gelten an einem PunktEckige Klammer: Daten gelten in einem BereichGeschweifte Klammer: Daten sind vom Aufzählungstyp
Abhängige Variablen werden durch Dimensionalität und Typ(oberer Index) beschrieben, z.B.
iS: i SkalareiV3: i 3-Dimensionale Vektoren
Beispiele:3
3
VE [ ]
SE5
2
Achtung:unterer und oberer Index zu
Begeron, Grinsteinvertauscht!
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 27
Frankfurt, WS 2007/2008 55Visualisierung, D. Krömker W. Müller
Attributmetadaten (II)
Spezifikation von Attributmetadaten nach GrawA: Anzahl der Beobachtungsfällec: Qualität der Datenmenge (vollständig/unvollständig)di: Anzahl der Merkmale mit Charakteristik (ti, oi, ui)
ti: Datentypoi: Existenz einer Ordnungsrelation über Wertebereich (ja/nein)ui: Umfang des Wertebereichs
n: Dimensionalität des Beobachtungsraumesg: Verbund der Beobachtungspunktew: Wirkungskreis der Beobachtungspunkte (punktuell, lokal, global)t = (ta, tdis, te) mit
ta Anfangszeitpunkt tdis Größe der Zeitintervalle (kontinuierlich, diskret) te Endzeitpunkt
Frankfurt, WS 2007/2008 56Visualisierung, D. Krömker W. Müller
Datenformate
Daten werden in unterschiedlichsten Formen undFormaten abgelegt Große Anzahl proprietärerer Datenformate Einige internationale und de-facto Standards für
Datenaustausch und -zugriff
Im Folgenden wird eine kleine Auswahl kurz vorgestellt: Tabellen und Excel Datenbanken NetCDF Topic Maps
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 28
Frankfurt, WS 2007/2008 57Visualisierung, D. Krömker W. Müller
Datenformate: Tabellen
Tabellen: Meistverwendete Form zur Repräsentation großer
Datensätze
Case1 Case2 Case3 ...
Attribute1
Attribute2
Attribute3
...
Value11 Value21 Value31
Value12 Value22 Value32
Value13 Value23 Value33
Bermerkung:Cases korrespondieren zu Datenobjekten,sind im Kontext von Tabellen jedoch dieüblichere Bezeichnung
Frankfurt, WS 2007/2008 58Visualisierung, D. Krömker W. Müller
Datenformate: Beispiel für Datentabelle
2-3
1-2
.286
5
2
Washington
0-00-01-11-0Div.
1-32-13-24-1Conf.
.333.429.667.833Pct.
4421Loss
2345Win
MiamiOrlandoBostonNew Jersey
NBA Eastern Conference Standings
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 29
Frankfurt, WS 2007/2008 59Visualisierung, D. Krömker W. Müller
Datenformate: Excel und ASCII Dump Format
Typische Repräsentationsformen von Tabellen in der Praxis Proprietäres Austauschformat von Microsoft Excel ASCII Dump Formats, z.B.
TAB Separated List Semicolon Separated List
Viele Werkzeuge undDatenbanken unterstützendiese Formate zumImport und ExportDaten können im Netz häufigin einem dieser Formategefunden werden
;New Jersey;Boston;Orlando;Miami;Washington
Win;5;4;3;2;2
Loss;1;2;4;4;5
Pct.;.833;.667;.429;.333;.286
Div.;1-0;1-1;0-0;0-0;1-2
Conf.;4-1;3-2;2-1;1-3;2-3
Frankfurt, WS 2007/2008 60Visualisierung, D. Krömker W. Müller
Datenformate: Daten in Databanken
Große und mittelgroße Firmensowie Content Providerspeichern und managen ihreDaten häufig inDatenbanksystemen
Zugriff auf Daten erfolgt dannim allgemeinen unterVerwendung von SQL
72-6750income
34372450age
164163170187size
femalemalefemalemalesex
IreneBobElsaTomname
4321
72-6750income
34372450age
femalemalefemalemalesex
4321
SELECT sex, age, incomeFROM persons
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 30
Frankfurt, WS 2007/2008 63Visualisierung, D. Krömker W. Müller
Datenformate: NetCDF
Network Common Data Format (NetCDF)
Entwicklung der University Corporation for Atmospheric Research(UCAR, 1993)
Aspekte Textuelle Beschreibung sowohl von Daten wie auch von
Metadaten Primär zur Repräsentation von Daten mit Raum- und Zeitbezug
auf unterschiedlichen Gitterformen, aber auch Mechanismenzur Beschreibung von Netzen
Weite Verbreitung in der Wissenschaftswelt Selbsterklärend Erweiterbar
Frankfurt, WS 2007/2008 64Visualisierung, D. Krömker W. Müller
Beispiel eines NetCDF Filesnetcdf example { //example of CDL notation for a netCDF file
dimensions: // dimension names and sizes are declared firstlat = 5, lon = 10, level =4, time = unlimited;
variables: // variable types, names, shapes, attributesfloat temp(time, level, lat, lon);
temp: long_name = “temperature“;temp: units = “celcius“;
float rh(time, lat, lon);rh: long_name = „relative humidity“;rh: valid_range = 0.0, 1.0; // min and max
int lat(lat), lon(lon), level(level);lat: units = “degrees_north“;lon: units = “degrees_east“;level: units = “millibars“;
short time(time);time: units = “hours since 1990-11-25 12:00 UTC“;
// global attributes: source = “National Weather Service“;
data: //optional data assignments
level = 1000, 850, 700, 500;lat = 20, 30, 40, 50, 60;lon = -160, -140, -118, -96, -84, -52, -45, -35, -25, -15;time = 12;rh = .5, .2, .4, .2, .3, .2, .4, .5, .6, .7,
.1, .3, .1, .1, .1, .1, .5, .7, .8, .8, .1, .2, .2, .2, .2, .5, .7, .8, .8, .9, .1, .2, .3, .3, .3, .3, .7, .8, .8, .9, 0, .1, .2, .4, .4, .4, .4, .7, .9, .9;
}
Terminologie:
Dimensions: Unabh. Variablen
Variables: Abh. Variablen
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 31
Frankfurt, WS 2007/2008 65Visualisierung, D. Krömker W. Müller
Topic Maps
Semantische Netze Zuerst eingeführt auf dem
Gebiet der KünstlichenIntelligenz zurWissensrepräsentation(Quillian 1966)
Darstellung von Konzeptenund Relationen in Formeines Graphen
Frames Partitionen eines
semantischen Netzwerkes
Hierarchische StrukturKnorz, 2001
Frankfurt, WS 2007/2008 66Visualisierung, D. Krömker W. Müller
Topic Maps
Topic Maps Austauschformat für Begriffsnetze / Semantische Netze
Internationaler Standard seit 1999 (ISO/IEC FCCD 13250:2000)
XTM 1.0 XML Encoding für Topic Maps
Komponenten Typen, Instanzen (Occurrences), sowie Assoziationen
zwischen Topics
Weitere Informationen http://www.topicmaps.org/xtm/1.0/core.xtm
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 32
Frankfurt, WS 2007/2008 67Visualisierung, D. Krömker W. Müller
Topic Maps
Data
Meta Data
M0: Core Elements
M1: Conceptual Layer
M2: Core Elements
occurrence
association
Course
Wolfgang
Script.htm
Frankfurt, WS 2007/2008 68Visualisierung, D. Krömker W. Müller
Reduktion einer Datenmenge
Entfernung irrelevanter Daten statistische oder informationstheoretische Methoden
Abstraktion durch Aggregation: Durchschnittswert und min, max Werte oder Durchschnittswert und Standardabweichung Gruppierung (Clustern Clusteranalyse)
Angabe des Bereichs von Interesse Beobachtungsraum Merkmalsraum
Auswahl von Teilmengen: Projektion Selektion ggf. Teilmengen durch Methoden des Focusing & Linking verbinden
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 33
Frankfurt, WS 2007/2008 69Visualisierung, D. Krömker W. Müller
Datenauswahl
Gegeben sei
D = {d1, ..., dN} der Struktur ndmv
(n unabhängige und m abhängige Variable)
Der Beobachtungsraum enthalte N Beobachtungspunkte
Für jeden Beobachtungspunkt seien die Werte der zugehörigenabhängigen Variablen in einem Datensatz zusammengefasst undmit di bezeichnet.
Nach einer endlichen Zahl von Reduktionsschritten erhält man
!
˜ D = ˜ d 1, ..., ˜ d ̃ N { } der Struktur ˜ n d ˜ m v
mit ˜ N " N, ˜ m " m und ˜ n " n.
Frankfurt, WS 2007/2008 70Visualisierung, D. Krömker W. Müller
Projektion
Anzahl der abhängigen oder unabhängigen Variablen werden reduziert.
Reduzierung der abhängigen Variablen:
Eindeutigkeit bleibt erhalten(Funktion bleibt eine Funktion)
Reduzierung der unabhängigen Variablen:
Funktion Relation (mehrere Werte)
mit 0 ≤ l ≤ (n-1) und 0 ≤ k ≤ (m-1) und ((l ≠ 0) ∨ (k≠0)).
( ) ( )!:~
,n m n l m k N Nd v" # # =d v und
Visualisierung - WS07/08 26.10.2007
(c) 2007 D. Krömker, W. Müller 34
Frankfurt, WS 2007/2008 71Visualisierung, D. Krömker W. Müller
Selektion
Durch Festlegung von Bedingungen an denWertebereich der Variablen
{ } { }!! !
: , ... ,~
, ... ,~
~D d d D d d N NN N
= " = <1 1
und
© D
etle
f Krö
mke
r
Frankfurt, WS 2007/2008 72Visualisierung, D. Krömker W. Müller
Unterstützung zur Datenauswahl
Methoden der Statistik, u.a. Korrelationen, diverse statistische Tests, ... Varianzanalyse Faktoranalyse Clusteranalyse Diskriminanzanalyse
Methoden der Informationstheorie: Redundanzanalyse, Relevanzanalyse