Was ist und zu welchem Ende treiben wir Historische Fachinformatik?

Post on 05-Apr-2015

105 views 1 download

transcript

Was ist und zu welchem Ende treiben wir Historische Fachinformatik?

Historische Fachinformatik 1976

• Berufsbezeichnungen in historischen Dokumenten sind mehrdeutig. Deshalb sind direkte Kodierungen in statistische Kodes gefährlich.

Historische Fachinformatik 1978

• Berufsbezeichnungen in historischen Dokumenten sind mehrdeutig. Deshalb sind direkte Kodierungen in statistische Kodes gefährlich.

• Historische Quellen können auf den Rechner nur unter Zuhilfenahme der Theorie unscharfer Mengen abgebildet werden.

Historische Fachinformatik 1980

• Historische Quellen erfordern Datenbanken mit ungewöhnlichen, relational schwer abbildbaren Strukturen.

Historische Fachinformatik 1980

• Historische Quellen erfordern Datenbanken mit ungewöhnlichen, relational schwer abbildbaren Strukturen. Z.B.:

• Mehreren tausend Feldtypen.

Historische Fachinformatik 1980

• Historische Quellen erfordern Datenbanken mit ungewöhnlichen, relational schwer abbildbaren Strukturen. Z.B.:

• Mehreren tausend Feldtypen.

• Feldern unbeschränkter Länge.

Historische Fachinformatik 1980

• Historische Quellen erfordern Datenbanken mit ungewöhnlichen, relational schwer abbildbaren Strukturen. Z.B.:

• Mehreren tausend Feldtypen.

• Feldern unbeschränkter Länge.

• Feldern mit internen Strukturen.

Historische Fachinformatik 1982

• Die Orthographie von Eigennamen in historischen Quellen schwankt.

• Deshalb sind Techniken zur rechnergestützten Überwindung dieser Unterschiede notwendig.

Historische Fachinformatik 1982

query name=einwohner;part=/catalogue[test2,algorithm,"Appfalder"] write part=:each[]

date 27.7.1769 surname apfalter name konrad

date 22.3.1797 surname abvellder name konrad

Historische Fachinformatik 1984

• Die Orthographie von Texten schwankt historisch insgesamt.

• Deshalb ist eine Verbindung zur Computerlinguistik zu suchen, insbesonders mit Blick auf Verfahren automatischer Lemmatisierung.

Historische Fachinformatik 1984

query name=latin;part=:lemma[word,latin]="aufero"write part=:word

x (1 = "1") : word abstulit

Historische Fachinformatik 1986

• Alle Arten historischer Daten setzen die Fähigkeit zur Handhabung spezieller Darstellungsformen voraus.

• Operationen auf historischen Quellen sind daher nur in Verbindung von Funktionalitäten möglich, die normalerweise getrennt in Datenbanken und Expertensystemen realisiert sind.

Historische Fachinformatik 1986

query name=dummy;part=:weekday[:date]="Thursday" write part=:date

festival (1 = "1") : date Lady Day 1613 festival (3 = "3") : date Maundy Thursday 1613 festival (5 = "5") : date 3 days before Easter 1613

Historische Fachinformatik 1988

Historische Fachinformatik 1992

Was ist Historische Fachinformatik?

Historiker

Quelle

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik

Orthographie

Sprachliche Phänomene: Lemmatisierung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie

Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Software

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Software

Bildverbesserung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Software

Bildverbesserung Formverwaltung

Was ist Historische Fachinformatik?

Historiker

Quelle

Software

Chronologie Hist. Metrik Orthographie

Sprachliche Phänomene: Lemmatisierung

Software

Bildverbesserung Formverwaltung Schrifterkennung ?

Was ist Historische Fachinformatik?

Definition 1Das systematische Bestreben Information in historischen Quellen und handwerkliche Schritte im historischen Forschungsprozeß systematisch in geeignete Datenstrukturen und Rechenvorschriften (Algorithmen) abzubilden.

Was ist Historische Fachinformatik?

Definition 1Das systematische Bestreben Information in historischen Quellen und handwerkliche Schritte im historischen Forschungsprozeß systematisch in geeignete Datenstrukturen und Rechenvorschriften (Algorithmen) abzubilden.

Dies impliziert, daß es zwischen der Information in historischen Quellen und anderer Information systematische Unterschiede gibt.

Naturwissenschaftliche Hypothesen

a ba = reale Ursache

b = reale Wirkung

EErklärende These

Historische Hypothesen

a b

a = beobachtete Ursache

b = bebobachtete Wirkung

Historische Hypothesen

a ba = reale Ursache

b = reale Wirkung

a b

a = beobachtete Ursache

b = bebobachtete Wirkung

TThese über Abbildung

Historische Hypothesen

a ba = reale Ursache

b = reale Wirkung

EErklärende These

a b

a = beobachtete Ursache

b = bebobachtete Wirkung

TThese über Abbildung

Was ist Historische Fachinformatik?

Definition 2

Das systematische Bestreben logische Eigenschaften historischer Quellen zu untersuchen und formalem Kalkül zugänglich zu machen.

Historische Information?

<Datentyp> ::= { E, I, O }

E = Externe Darstellung

I = Interne Darstellung

O = Operationen definiert auf I

<Datentyp> Temporale Angaben

E ::= 31.5.2000

I ::= Vektor T von Tagen seit einem willkürlichen Tag "Null".

T::=

wobei ein Tag t ausgedrückt wird als Abstand vom Ursprung dieses Vektors.

t

<Datentyp> Temporale Angaben

O ::=

t-less ( t1, t2) Bool'scher Wert

t-less ( 31.5.2000, 1.6.2000) True

t-subtract ( t1, t2) Zahl

t-subtract ( 1.6.2000, 31.5.2000) 1

<Datentyp> Historische Temporale Angaben

E ::= Pri Kal Jun 2000

I ::= Vektor T von Tagen seit einem willkürlichen Tag "Null".

T::=

wobei ein Tag t ausgedrückt wird als Abstand vom Ursprung dieses Vektors.

t

<Datentyp> Historische Temporale Angaben

O ::=

t-less ( t1, t2) Bool'scher Wert

t-less ( Pri Kal Jun 2000, Kal Jun) True

t-subtract ( t1, t2) Zahl

t-subtract ( Kal Jun 2000, Pri Kal Jun 2000) 1

<Datentyp> Historische Temporale Angaben

E ::= Himmelfahrtsabend 2000

I ::= Vektor T von Tagen seit einem willkürlichen Tag "Null".

T::=

wobei ein Tag t ausgedrückt wird als Abstand vom Ursprung dieses Vektors.

t

<Datentyp> Historische Temporale Angaben

O ::=

t-less ( t1, t2) Bool'scher Wert

t-less (Himmelfahrtsabend 2000, Himmelfahrt 2000) True

t-subtract ( t1, t2) Zahl

t-subtract ( Himmelfahrt 2000, Himmelfahrtsabend 2000) 1

<Datentyp> Historische Temporale Angaben

E ::= 4.4.1458

(Anmerkung: Datum entstammt burgundischem Dokument)

<Datentyp> Historische Temporale Angaben

E ::= 4.4.1458

I ::= Vektor T von Tagen seit einem willkürlichen Tag "Null".

T::=

wobei ein Tag t ausgedrückt wird als Menge von Abständen vom Ursprung dieses Vektors.

t1 t2

<Datentyp> Historische Temporale Angaben

O ::=

t-less ( t1, t2) tertiärer Wahrheitswert (z.B. {True, Undecidable, False}

t-less (4.4.1458, 5.4.1458) Undecidable

t-subtract ( t1, t2) Historische Zahl

t-subtract ( 5.4.1458, 4.4.1458 ) { 1, 366 }

<Datentyp> Historische Temporale Angaben

E ::= 4.4.1758 - 14.7.1758

I ::= Vektor T von Tagen seit einem willkürlichen Tag "Null".

T::=

wobei ein Tag t ausgedrückt wird als Menge von Abstandspaaren vom Ursprung dieses Vektors.

P(t1) A(t2)

<Datentyp> Historische Temporale Angaben

O ::=

t-less ( t1, t2) kontinuierlicher Wahrheitswert (z.B. Prozentsatz der Überlappung zweier Intervalle)

t-less (4.4.1758 - 14.7.1758, 14.7.1758 - 24.10.1758) 99%

t-subtract ( t1, t2) Historische Zahl

t-subtract ( 14.7.1758 - 24.10.1758, 4.4.1758 - 14.7.1758 ) { 0 - 200 }

Was ist Historische Fachinformatik?

Definition 3

Die systematische Verallgemeinerung aus der allgemeinen Informatik bekannter Datenstrukturen und Algorithmen auf die Eigenschaften historischer Information.

Historische Fachinformatik 1995

Die systematische Bereitstellung großer Mengen historischen Quellenmaterials im Internet wird praktisch planbar.

"Objekte zwischen Findbuch und Edition"

Ziel: 10 mal mehr als in gedruckter Edition realisierbar; 10 mal besser erschlossen, als in klassischen Findbehelfen der Archive.

Historische Fachinformatik 1997

• 80.000 Quellenseiten.

Historische Fachinformatik 1997

• 80.000 Quellenseiten.

• 600 CDs Rohdaten.

Historische Fachinformatik 1997

• 80.000 Quellenseiten.

• 600 CDs Rohdaten.

• Erschlossen mit mindestens einem Suchbegriff pro Seite, plus Personenkatalog.

Historische Fachinformatik 1997

• 80.000 Quellenseiten.

• 600 CDs Rohdaten.

• Erschlossen mit mindestens einem Suchbegriff pro Seite, plus Personenkatalog.

• Größer als vergleichbares System der Library of Congress.

Historische Fachinformatik 1997

• 80.000 Quellenseiten.

• 600 CDs Rohdaten.

• Erschlossen mit mindestens einem Suchbegriff pro Seite, plus Personenkatalog.

• Größer als vergleichbares System der Library of Congress.

• "Duderstadt vor Washington, DC."

Historische Fachinformatik 1999

Prototypen sollen so verallgemeinert werden, daß Ressourcen dieser Art Gegenstand von studentischen Arbeiten werden können.

Historische Fachinformatik 1999

• Größte digitale Bibliothek der Bundesrepublik.

Historische Fachinformatik 1999

• Größte digitale Bibliothek der Bundesrepublik.

• Software verfügbar in ca. vier Wochen.

Historische Fachinformatik 1999

• Größte digitale Bibliothek der Bundesrepublik.

• Software verfügbar in ca. vier Wochen.

• Anwendungsprogramm in ca. zwei Wochen.

Historische Fachinformatik 1980

• Historische Quellen erfordern Datenbanken mit ungewöhnlichen, relational schwer abbildbaren Strukturen. Z.B.:

• Mehreren tausend Feldtypen.

• Feldern unbeschränkter Länge.

• Feldern mit internen Strukturen.

Was ist Historische Fachinformatik?

Definition 4

Die Verschmelzung der geisteswissenschaftlichen Tradition im Umgang mit großen Mengen unstrukturierter Informationen mit dem jeweils neuesten Stand der Technik.

Zu welchem Ende ...

Der "Brotgelehrte":

Seinen ganzen Fleiß wird er nach den Forderungen einrichten, die von dem künftigen Herrn seines Schicksals an ihn gemacht werden, und alles getan zu haben glauben, wenn er sich fähig gemacht hat, diese Instanz nicht zu fürchten.

F. Schiller

Zu welchem Ende ...

Der "Brotgelehrte":

Jede Erweiterung seiner Brotwissenschaft beunruhigt ihn, weil sie ihm neue Arbeit zusendet oder die vergangene unnütz macht; jede wichtige Neuerung schreckt ihn auf ...

F. Schiller

Zu welchem Ende ...

Vorschlag 1:

Um sicher zu stellen, daß die historischen Kulturwissenschaften nicht Ihre Fragestellungen der aktuellen Software anpassen, sondern die aktuelle Software Ihren Fragestellungen.

Zu welchem Ende ...

Vorschlag 2:

Um sicher zu stellen, daß außerhalb der Geisteswissenschaften die lange Tradition der historischen Kulturwissenschaften im Umgang mit unstrukturierter Information nicht übersehen wird.

Was ist Historische Fachinformatik?

Definition 5

Was von der Informationstechnologie für die Historischen Kulturwissenschaften relevant bleibt, wenn die neueste Hysterie abgeklungen ist.