+ All Categories
Home > Documents > 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

Date post: 05-Apr-2015
Category:
Upload: irmalinda-duren
View: 105 times
Download: 1 times
Share this document with a friend
34
1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen
Transcript
Page 1: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

1

Elisabeth BurrWiSe 2006/07

Das Korpus romanischer Zeitungssprachen

Page 2: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

2

Das Korpus

• geschaffen als Forschungsgrundlage• heterogen– Ausgaben wurden so aufgenommen, wie sie erschienen– Texte als ganze– fremdsprachliche, dialektale und diachronische

Elemente wurden nicht aussortiert• Porträt der tatsächlichen Kombination von stilistischen

und sozio-kulturellen Varietäten• repräsentieren das vom Publikum erwartete komplexe

sprachliche Wissen

Page 3: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

3

Korpuserstellung

• http://www.uni-leipzig.de/~burr/CorpusLing/htm/Korpuserstellung/Vortrag.htm

Page 4: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

4

Korpora & Subkorpora

• Italienische Zeitungen - Deutsche Einigung 1989 • Corriere della Sera (Zeitung) 19., 20.,

21.10.1989• Il Mattino (Zeitung) 20., 21.10.1989• La Repubblica (Zeitung) 20., 21.10.1989• La Stampa (Zeitung) 20., 21.10.1989• Französische, italienische und spanische Zeitungen -

Europawahlen 1994 • Le Monde (CD-ROM) 12./13., 14., 15.06.1994• Corriere della Sera (CD-ROM) 13., 14., 15.06.1994

• La Vanguardia (Magnetband) 13., 14., 15.06.1994

Page 5: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

5

Größe der Subkorpora

• Corriere della Sera 258.287 Wortformen• Il Mattino 171.501 Wortformen• La Repubblica 174.958 Wortformen• La Stampa 119.771 Wortformen

• Le Monde 236.236 Wortformen• Corriere della Sera 303.641 Wortformen• La Vanguardia 261.133 Wortformen

Page 6: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

6

Das Markup

• COCOA– <S Politica> ist so lange gültig bis z. B. <S

Interno> erscheint– <T Occhiello> ist so lange gültig bis z. B.

<T Titolo> erscheint

Page 7: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

7

Bibliographische Informationen

• Reference Variable Beispiel• Zeitung <Z> <Z La Vanguardia>• Ausgabe <E> <E 130694>• Ausgeweisenheit <A>• signiert <A firmato>• anonym <A non firmato>• Autor/Autorin <N> <N Tapia Juan>• Seite <C> <C 01>• Sprache <L> <L Inglese>

Page 8: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

8

Sparten <S>

• Sparte <S> <S Politica>

Page 9: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

9

Textart <T>

• Vorzeile <T Occhiello>• Schlagzeile <T Titolo>• Untertitel <T Sottotitolo>• Zusammenfassung <T Sommario>• Zwischenüberschrift <T Catenaccio>• Ankündigung <T Civetta>• Artikel <T Articolo>• 'Aufmacher' <T Spalla>• Fernseh-, Kinoprogramm <T Programma>• Filminhalt <T Film>• Glosse <T Corsivo>

Page 10: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

10

Textart <T> cont.

• Interview <T Intervista>• Kolumne <T Rubrica>• Kritik <T Critica>• Kurzmeldung <T Flash>• Kurznachricht <T Breve>• Leitartikel <T Fondo>• Leserbrief <T Lettera>• Liste <T Elenco>• Nachricht <T Notizia>• Wetterbericht <T Tempo>• Buch-, Film-, Liedtitel, etc. <T Nome>• Bildunterschrift <T Foto>

Page 11: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

11

Art des Sprechens <P>

• fortlaufender Text <P Prosa>• Zitat von schriftlichen Quellen <P

Citazione>• mündliches Sprechen <P Discorso>• Frage im Interview <P Domanda>• Antwort im Interview <P Risposta>

Page 12: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

12

Wiederholte Rede <r>

• Redewendung, Sprichwort, etc. <r id>

• restlicher Text <r nonid>

Page 13: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

13

Italienisches Korpus 1989

Page 14: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

14

Kodierung finiter Verbformen

• alle finiten Verbformen wurden kodiert

$• Zahlencode statt COCOA• direkt und ohne blank vor dem das Paradigma

bildenden Verb eingefügt

je $I110a003chante

• periphrastische Formen als Einheit gezählt (#)

j’ai#$I111a001chanté

Page 15: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

15

Zahlencode – Modi & Ebene

• entsprechend Kategorien des romanischen Verbalsystems aufge baut– setzt sich aus verschiedenen Ebenen zusammen– zusätzlich noch die Diathese (Aktiv / Passiv) berücksichtigt– differenziert sich zunächst in:

C Konjunktiv <______ I Indikativ ______> B Imperativ

– innerhalb der Modi Unterscheidung zwischen aktueller und inaktueller Ebene:

aktuelle Ebene: 1inaktuelle Ebene: 2

Page 16: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

16

Primäre Perspektive

– durch primäre Perspektive auf jeder Ebene abgegrenzte Zeiträume werden durch 1, 2 und 3 vertreten:

Gegenwart bzw. parallele Perspektive 1

Vergangenheit bzw. retrospektive Perspektive2

Zukunft bzw. prospektive Perspektive3

Page 17: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

17

Sekundäre Perspektive

– durch sekundäre Perspektive innerhalb der drei durch die primäre Perspektive abgegrenzten Zeiträume bestimmte Zeitpunkte werden durch die Zahlen 0, 1 und 2 repräsentiert

– Kodierung drückt somit zugleich funktionelle Relationen aus, die zwischen den einfachen und den periphrastischen Tempora innerhalb ihres gemeinsamen Zeitraums und auf der gleichen Ebene bestehen:

• Relation zwischen Präsens und passé composé • Relation zwischen Imperfekt und Plusquamperfekt

Page 18: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

18

Sekundäre Perspektive

– parallel 0– retrospektiv 1– prospektiv 2

Page 19: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

19

Indikativ

Page 20: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

20

parallel

chanteaichanté

vaischanter

chantaieuschanté

chanteraiauraichanté

aktuelle Ebene

parallel

chantaisavaischanté

allaischanter

chanteraisauraischanté

inaktuelle Ebene

retrospektiv prospektiv

retrospektiv prospektiv

chantechantai chanterai

chantais chanterais

Page 21: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

21

Indikativ

aktuelle Ebene inaktuelle Ebeneeinfache Temporaje chante I110 je chantais I210je chantai I120je chanterai I130 je chanterais I230periphrastische Temporaj’ai chanté I111 j’avais chanté I211je vais chanter I112 j’allais chanter I212j’eus chanté I121j’aurai chanté I131 j’aurais chanté I231

Page 22: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

22

Konjunktiv

Page 23: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

23

parallel

chanteaiechanté

aktuelle Ebene

parallel

chantasseeussechanté

inaktuelle Ebene

retrospektiv prospektiv

retrospektiv prospektiv

chante

chantasse

Page 24: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

24

Konjunktiv

aktuelle Ebene inaktuelle Ebeneeinfache Temporaje chante C110 je chantasse C210

periphrastische Temporaj’aie chanté C111 j’eusse chanté C211

Page 25: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

25

Imperativ

aktuelle Ebene inaktuelle Ebeneeinfache Temporachante B110

Page 26: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

26

Aktiv – Passiv – 4. Stelle

• Aktiv a• Passiv p

Page 27: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

27

Verbalperiphrasen• 00 temporalen Formen• 01 être en train de (Winkelschau)• 02 je viens faisant (retrospektive Schau)• 03 je vais (en) faisant (prospektive bzw. komitative

Schau / progressive Phase)• 04 je continue à faire (kontinuative Schau / Phase)• 05 être sur le point de (imminentielle / ingressive

Phase)• 06 se mettre à (inzeptive Phase)• 07 je finis de faire (regressive Phase)• 08 je viens de (egressive Phase)

Page 28: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

28

Person

• keine Unterscheidung zwischen Singular und Plural – 1. Person 1– 2. Person 2– 3. Person 3

Page 29: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

29

Beispiele

je $I110a001chante je suis en train de $I110a011chanter

j’ai $I111a001chanté

Auszug aus dem Korpus

beim Kodieren periphrastische Formen nicht durch # zu Einheit verbinden

Zahlenkode vor Paradigma-bildendes Verbj‘ai $I111a001chanté et $I111a001mangé

Page 30: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

30

Header

Page 31: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

31

Texte für die Bearbeitung

• http://www.uni-leipzig.de/~burr/Verb/French/2006_2007/Korpus.htm

Page 32: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

32

Vorgehen

• Teilkorpus wählen – Le Monde 13.06.1994– zumindest 2 Sparten– als Textdatei (!) auf Festplatte speichern (eigenen Ordner „Korpus“

einrichten)• WordPad verwenden

– WordPad aktivieren– Datei – öffnen – Dateityp Textdokumente – MS-DOS-Format (*.txt)– Sparte anklicken– geöffnete Sparte speichern unter

• an bisherigen Namen z.B. _PC für Passato composé anhängen: M130694_Sport_PC)

• aufpassen, dass Dateityp Textdokumente – MS-DOS-Format (*.txt)• Datei immer in WordPad öffnen• jedes Mal darauf achten, dass Dateityp Textdokumente – MS-DOS-

Format (*.txt)• vorhandenes Markup nicht verändern• Zahlencode direkt vor die Formen der zu untersuchenden Verbalkategorie

anfügen

Page 33: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

33

im Moment

• nur ausprobieren• werde ein Teilkorpus ganz auseinander

nehmen

Page 34: 1 Elisabeth Burr WiSe 2006/07 Das Korpus romanischer Zeitungssprachen.

34

Hilfreiches zum Ausdrucken

• ausführlichere Beschreibung des Markup des Korpus von 1994


Recommended