UNIVERSITAT HEIDELBERGINSTITUT FUR COMPUTERLINGUISTIK
EINFUHRUNG IN DIE KORPUSLINGUISTIK
HAUSARBEIT
Anglizismen und ihre deutschen EntsprechungenEine korpusbasierte Analyse des Verdeutschungsprozesses anhand
ausgewahlter Beispiele aus der Informatik
Vor- & Zuname
Victor ZIMMERMANN∗
Note
1.7
Studienfach
Computerlinguistik,2. Fachsemester, B.A.
Betreuer
Dipl.-Inform. Rainer PERKUHN
Dr. Marc KUPIETZ
2017-09-26Sommer 2017
Inhaltsverzeichnis
1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2 Methodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1 Begriffspaare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.2 Korpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.3 Varianten und Haufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.4 Zeitverlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.5 Thematische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1 Varianten und Haufigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
3.1.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 6
3.2 Zeitverlauf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 7
3.2.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
3.2.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 9
3.3 Thematische Verteilung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.1 Computer und Rechner . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.2 User und Benutzer . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
3.3.3 Interface und Benutzeroberflache . . . . . . . . . . . . . . . . . . . 12
4 Auswertung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.1 Sinkende Haufigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2 Verdeutschung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2.1 Akzeptanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4.2.2 Relevanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5 Fazit und Reflexion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
5.1 Methodik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 Ausblick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
ii
1 Einleitung
In der deutschen Sprache haben sich durch eine Reihe an englischen Vokabeln aus
der Informatik Quasi-Synonympaare mit deutschen Begriffen gebildet, die Untersu-
chungsgegenstand dieser Hausarbeit sein sollen. Die Informatik ist eine interessante
Datengrundlage, da durch die relativ kurzliche Addition des Vokabulars zum deutschen
Wortschatz noch immer eine Parallelverwendung der entlehnten englischen Begriffe und
deutschen Entsprechungen existiert.
Zu untersuchen gilt vor allem, ob es unter den ausgewahlten Paaren eine Tendenz
hin zum Anglizismus gibt, ob es einen allgemeinen An- oder Abstieg von informatischen
Begriffen im Sprachgebrauch1 gibt und ob und in welchem Ausmaß allgemeine Unter-
schiede zwischen der Nutzung von Anglizismen und ihren deutschen Entsprechungen
existieren.
Um dies zu erreichen, wird die Haufigkeit und Varietat ausgewahlter Beispiele (Com-puter, User und Interface) im heutigen Sprachgebrauch sowie historisch dargestellt und
die Begriffe thematisch aufgeschlusselt und verglichen. Zudem werden aus dieser Da-
tengrundlage allgemeine Entwicklungen und Ahnlichkeiten zwischen den Wortpaaren
hergeleitet.
Abschließend werden die Analyseergebnisse zusammengefasst, uber die Methodik reflek-
tiert und mogliche Ansatze fur eine tiefer- und weitergehende Analyse geboten.
2 Methodik
2.1 Begriffspaare
Als Untersuchungsgegenstand eignen sich vor allem Paare, die sowohl quasi-synonym 2
sind als auch nur eine geringe Ambiguitat aufweisen3.
Untersucht werden unter Rucksicht auf diese Gesichtspunkte die Begriffspaare:
• Computer und Rechner
• User und Benutzer
• Interface und Benutzeroberflache.
1Da DeReKo hauptsachlich aus Zeitungsquellen besteht, ist vielmehr das Ausmaß der Berichterstattunguber die ausgewahlten Begriffe Untersuchungsgegenstand als der allgemeine Sprachgebrauch.
2Vgl. Perkuhn et al. (2012, S. 136)3I.e. Web und Netz mogen vielleicht synonym genutzt werden, allerdings besitzt Netz ebenfalls eine
erweiterte Bedeutung.
KL | VERDEUTSCHUNG 1
Zudem werden die Variationen PC, Benutzer und Benutzeroberflache nach Verteilung,
zeitlicher und regionaler Einordnung4 untersucht. Benutzeroberflache wird zum Vergleich
mit Benutzer untersucht, obwohl diese Schreibweise keine statistische Relevanz aufweist5.
Um moglichst eindeutige Synonyme mit moglichst wenig abweichenden Lexemen zu
gewahrleisten, wird Benutzer anstelle von Nutzer und Benutzeroberflache im Gegensatz
zu Oberflache betrachtet. Benutzeroberflache wird zum besseren Vergleich mit Benutzerebenfalls gegenuber Nutzeroberflache bevorzugt, obwohl bei letzterem Begriff nicht die
gleiche Ambiguitat wie bei Nutzer auftritt.
2.2 Korpus
Als Grundlage der Recherche dient ein nicht-technisches Korpus, welches mittels Cosmas
II aus dem Deutschen Referenzkorpus (DeReKo-2017-I)6 fur diese Hausarbeit zusammen-
gestellt wurde. Dieses nicht-technische Korpus umfasst das DeReKo-Gesamtkorpus mit
Ausnahme folgender Quellen:
• Wikipedia (2011)
• COMPUTER ZEITUNG (1993-1998)
• Gebrauchsanleitungen (1960-1974)
• Lufthansa Bordbuch (dt.) (1995-1997)
All diese Korpora weisen Abweichungen fur mindestens eines der zu betrachtenden
Worte auf. Dies fuhrt zu einer uberproportionalen Reprasentation der zu untersuchenden
Begriffe in weiten Teilen der Analyse. Bei der Betrachtung des Zeitverlaufs fuhrt die
nicht kontinuierliche Inklusion dieser Quellen im Gesamtkorpus7 zudem dazu, dass,
uber einen großeren Betrachtungsrahmen, deutliche Ausreißer und Extreme vorkom-
men. Ein Gesamtkorpus ohne diese vier Quellen fuhrt zu einer gleichmaßigeren und
naturlichsprachlicheren Datengrundlage.
Texte Worter Korpora
Nicht-technisches Korpus 24618645 6818551425 631
W-offentlich 27277392 7647570408 640
Tabelle 1: Nicht-technisches Korpus in Zahlen
4Nur fur Benutzer, siehe Abb. 25Siehe Tab. 46IDS. 2017b. Deutsches referenzkorpus / archiv der korpora geschriebener gegenwartssprache. Release
vom 08.03.20177Im Gesamtkorpus sind lediglich Quellen aus der deutschen Wikipedia fur das Jahr 2011 vorhanden.
KL | VERDEUTSCHUNG 2
Das gewahlte nicht-technische Korpus umfasst somit insgesamt 10.2464% weniger Texte,
11.4615% weniger Worte und 1.41621% weniger Korpora als das Gesamtkorpus ’W-
offentlich’.
2.3 Varianten und Haufigkeiten
Die Varianten der zu untersuchenden Begriffe und deren Haufigkeiten werden mit-
tels des Cosmas II-Webdienstes8 des Instituts fur Deutsche Sprache ermittelt. Folgende
Einstellungen werden fur die Ermittlung der Varianten und Haufigkeiten verwendet:
• Groß-/Kleinschreibung beachten fur 1. Zeichen
Es sollen lediglich deutschsprachige Formulierungen evaluiert werden, daher wer-
den nur Treffer verwendet, in denen das gesuchte Wort kapitalisiert wird. Da es sich
bei samtlichen betrachteten Worten um Nomen handelt, wird hier die Großschrei-
bung dieser im Deutschen ausgenutzt. Durch diese Sortierung werden eventuelle
englischsprachige Zitate aus der Ergebnismenge gefiltert.
• Keine Begrenzung der Ergebnismenge
• Lemmatisierung: Flexionsformen
Bei zwei der zu untersuchenden Paare(Computer/Rechner, User/Benutzer) lasst sich
morphologisch keine Pluralform feststellen. Daher, um auch einen Vergleich zwi-
schen den Paaren zu ermoglichen, wird eine Lemmatisierung nach Flexionsformen
vorgenommen.
• Prozentuale Verteilung der Texte
• Prozentuale Verteilung der Worter
• Haufigkeitsmaß: Relative Haufigkeit in Prozent
Der Begriff Variante wurde bewusst an Stelle von Schreibweise gewahlt, da gezielt
verschiedene Worte verglichen werden sollen, welche das gleiche Lexem beschreiben,
was sowohl Abkurzungen (PC), Regionalismen (Benutzer) als auch Anglizismen umfassen
soll.
2.4 Zeitverlauf
Der Zeitverlauf der zu untersuchenden Begriffe wird ebenfalls mittels COSMAS II ermit-
telt. Die Suchanfrage nutzt dieselben Einstellungen wie zuvor bei der Haufigkeitsermittlung.
Fur diese Anfragen werden die Ergebnisse nach Jahren ausgegeben. Untersucht werden
8IDS. 2017a. Cosmas ii web. cosmas2.ids-mannheim.de/cosmas2-web
KL | VERDEUTSCHUNG 3
die Begriffe zwischen den Jahren 1967 und 2016.
Das Korpus weist fur verschiedene Jahre eine stark variierende Große auf 9. Daher wird
relative Haufigkeit als Maßstab genutzt, um zwischen den Jahren vergleichende Angaben
machen zu konnen.
Abbildung 1: Wortumfang des Korpusarchivs des Instituts fur Deutsche Sprache inMannheim nach Jahr
Bis einschließlich 2013 umfasst das Korpus weniger als 7 Milliarden Worter (i.G.z.
uber 29 Milliarden Wortern 2017) (IDS, 2017c). Durch die Restriktion auf ein nicht-
technisches Korpus entfallen zudem große Teile der fur die Hausarbeit relevanten Daten
zu Gunsten einer ausgeglicheneren Datengrundlage. Dadurch konnen einzelne Ereignisse
starke Ausreißer im Zeitverlauf verursachen 10.
2.5 Thematische Verteilung
Die thematische Verteilung wird uber die Kookkurrenzdatenbank CCDB (Belica, 2001 ff),
unter Verwendung von Contrasting Near-Synonyms (CNS), ermittelt. Diese vergleicht
Quasi-Synonympaare auf Basis von sogenannten SOM-Karten11, welche zu einem unter-
suchten Wort ahnliche Begriffe12 thematisch clustern (Belica, 1995). Bei CNS werden
diese Ahnlichkeitskarten zweier Begriffe verglichen und die resultierende Karte entspre-
chend ihrer Ahnlichkeit zum jeweiligen Begriff visuell reprasentiert (rot-gelber gradueller
Farbverlauf).
9Siehe Abb. 110Siehe Abb. 511Self-Organizing Lexical Feature Maps12Die Ahnlichkeit wird anhand von Kookkurrenzprofilen errechnet.
KL | VERDEUTSCHUNG 4
3 Ergebnisse
3.1 Varianten und Haufigkeiten
3.1.1 Computer und Rechner
Sowohl Computer als auch Rechner beschreiben laut Duden eine ’elektronische Rechenan-
lage’ (Dudenredaktion 2017a, Dudenredaktion 2017b), PC (Personal Computer) ist eine
Abkurzung und Konkretisierung von Computer, namlich ein solcher, welcher in einem
privaten Umfang verwendet wird. In der Umgangssprache wird letzterer Begriff aller-
dings synonym zu den zuvor Genannten genutzt, was ihn als Vergleichsobjekt interessant
macht.
Treffer rel. Hauf. Texte Korpora
Computer 287862 0.004222% 204694 597
Rechner 47201 0.000692% 34515 615
PC 72221 0.001061% 52678 557
Tabelle 2: Verteilung im Gesamtkorpus nach Variante: Computer, Rechner, PC
Computer ist, sowohl konkret als auch allgemein, haufiger im Korpus vorhanden als seine
deutsche Entsprechung Rechner, wobei Computer sowohl relativ als auch absolut etwa
vier mal haufiger vorkommt als PC und sechs mal haufiger als Rechner.Alle Varianten kommen in den meisten Korpora vor13. Rechner tritt in mehr Korpora
als die anderen Begriffe auf, obwohl es sich um die seltenste Variante handelt. Dies
konnte darauf zuruckzufuhren sein, dass es sich bei DeReKo hauptsachlich um einen
Zeitungskorpus handelt und Anglizismen von ausgewahlten Publikationen (evt. uber
einen gewissen Zeitraum) gemieden werden konnten. PC trat in Deutschland erst wirklich
in der Mitte der 1980er auf14, wodurch er in fruheren Korpora selbstverstandlich fehlt.
3.1.2 User und Benutzer
Sowohl User als auch Benutzer sind Personen, die etwas nutzen. Da User allerdings aus
dem Englischen mit einer eingeschrankten Bedeutung (Computernutzer, seltener Drogen-
nutzer) entlehnt wurde, handelt es sich bei User im Grunde um eine konkretere Variante
des Begriffes Benutzer. In der Kookkurrenzanalyse mit Contrasting Near-Synonyms15 zeigt
sich jedoch, dass Benutzer analog zu User fast ausschließlich in einem informatischen
Kontext gebraucht wird.
13Siehe Tab. 114Siehe Abb. 315Siehe Abb. 7
KL | VERDEUTSCHUNG 5
Abbildung 2: Regionale Verteilung in Prozent nach Land und Variante: User, Benutzer,Benutzer
Der Begriff Benutzer ist ein Regionalismus16, welcher hauptsachlich in Osterreich und der
deutschsprachigen Schweiz benutzt wird. Dementsprechend kommt dieser Begriff auch
lediglich in 232 Korpora vor, gegenuber den uberregionalen Begriffen User und Benutzer.Zudem ist auffallig, dass Luxemburg und Osterreich User gegenuber Benutzer bevorzugen,
wahrend Benutzer in deutschen und schweizer Publikationen haufiger auftritt.
Treffer rel. Hauf. Texte Korpora
User 15391 0.000226% 11830 526
Benutzer 22321 0.000327% 18770 596
Benutzer 3709 0.000054% 3428 232
Tabelle 3: Verteilung im Gesamtkorpus nach Variante: User, Benutzer, Benutzer
Wie auch zwischen Computer und Rechner, wird der Anglizismus in weniger Korpora
verwendet als seine deutsche Entsprechung, was in diesem Fall allerdings auch auf das
geringere Vorkommen des Anglizismus im Gesamtkorpus zuruckgefuhrt werden konnte.
3.1.3 Interface und Benutzeroberflache
Interface und Benutzeroberflache beschreiben einen sichtbaren Teil einer Anwendung,
welche dem Endnutzer dient, Befehle an das Programm zu erteilen und Informationen
abzurufen.
Zum Vergleich mit dem Regionalismus Benutzer wurde zusatzlich Benutzeroberflacheuntersucht, hat allerdings nur 6 Ergebnisse geliefert. Dieses Fehlen an relevanten Kom-
posita weist darauf hin, dass Benutzer nicht im gleichen Kontext wie Benutzer, sondern
16Siehe Abb. 2
KL | VERDEUTSCHUNG 6
vielmehr in nicht-informatischen Kontexten wie z.B. dem Straßenverkehr17 verwendet
wird und es sich beim Paar Benutzer/Benutzer nicht um echte Synonyme handelt.
Treffer rel. Hauf. Texte Korpora
Interface 1788 0.000026% 1498 368
Benutzeroberflache 2285 0.000034% 2014 408
Benutzeroberflache 6 0.000000% 6 6
Tabelle 4: Verteilung im Gesamtkorpus nach Variante: Interface, Benutzeroberflache,Benutzeroberflache
Interface und Benutzeroberflache kommen nur selten im Korpus vor, was im Vergleich
zu den anderen untersuchten Quasi-Synonympaaren auf die inhaltliche Tiefe dieser
Begriffe zuruckzufuhren ist. Sowohl Benutzer als auch Rechner sind konkrete Objekte,
wahrend eine Benutzeroberflache lediglich ein Element einer Softwareimplementierung
ist. Beide Begriffe kommen ahnlich haufig im Korpus vor, die Abweichung ist aufgrund
der geringen Stichprobengroße nicht sinnvoll zu bewerten.
3.2 Zeitverlauf
Trotz einer immer großer werdenden Prasenz von Computern in der Lebensrealitat der
deutschen Bevolkerung sinkt der Anteil der meisten zu untersuchenden Begriffe im
Korpus ab der Jahrtausendwende. Der Heimrechner verliert an Relevanz gegenuber
Enthullungen neuer Smartphones und Entwicklung abstrakterer Felder der Informatik
wie kunstlicher Intelligenz.
3.2.1 Computer und Rechner
Der Zeitverlauf fur Computer weist zwei großere Ausreißer 1979 und 1984 auf, welche
jeweils mit der Veroffentlichung des Atari 800-Computers 1979 und des Apple Macintoshs1984 zusammenfallen. Nach dem Jahr 2000 und dem ’Y2K Bug’ sinkt die mediale
Aufmerksamkeit am Computer.
17Eine Kookkurrenzanalyse mit der CCDBBelica (2001 ff) zeigt, dass Benutzer zwar vereinzelt im selbenKontext wie Benutzer, Benutzer aber nur sehr selten im informatischen Kontext genutzt wird.
KL | VERDEUTSCHUNG 7
Abbildung 3: Relative Haufigkeit in Prozent nach Jahr: Computer, Rechner, PC
Der Graph fur Rechner weist ahnliche Hohen und Tiefen wie Computer auf, nur in klei-
nerer Auspragung. Nachdem er Mitte der 1980er zum ersten Mal vermehrt aufkommt,
wird PC 1991 als Begriff haufiger gebraucht als Rechner, worauf sich die beiden Graphen
bis 2015 wieder angleichen.
3.2.2 User und Benutzer
Obwohl Benutzer bereits zu Beginn des Untersuchungszeitraums im Sprachgebrauch zu
finden ist, findet sich der Regionalismus Benutzer erst ab 1990, bleibt zehn Jahre prasent
und fallt darauf auf ein niedrigeres Plateau zuruck.
Abbildung 4: Relative Haufigkeit in Prozent nach Jahr: User, Benutzer, Benutzer
KL | VERDEUTSCHUNG 8
User tritt seit 1994 verstarkt auf, war allerdings auch zuvor vereinzelt im Korpus vor-
handen. Seit 2009 tritt User haufiger auf als die deutsche Entsprechung Benutzer. Der
Abwartstrend von Benutzer fangt, anders als bei Computer, schon vor dem Jahr 2000,
etwa um 1995, an und findet seinen Hochpunkt 1975, damals allerdings auch mit an-
deren Bedeutungen. Es ist davon auszugehen, dass die fallende Haufigkeit mit einer
Konkretisierung des Begriffs einhergeht.
User hingegen weist eine steigende Haufigkeit auf, nicht zuletzt durch einen Anstieg an
Berichterstattung uber soziale Medien, die ihre Benutzer vorzugsweise als User bezeich-
nen (i.e. ’Facebook User’).
3.2.3 Interface und Benutzeroberflache
Benutzeroberflache tritt zum ersten Mal 1989 im Korpus auf, hat 1995 einen Hochpunkt
und stabilisiert sich um die Jahrtausendwende. Interface fallt besonders durch seine drei
markanten Ausreißer 1973, 1990 und 2010 auf, welche auf ein Dreipersonenschach
namens Interface, die Hamburger Kunst- und Technologiemesse ’INTERFACE’ und eine
Kunstausstellung von Friedemann von Stockhausen zuruckzufuhren sind.
Abbildung 5: Relative Haufigkeit in Prozent nach Jahr: Interface, Benutzeroberflache
Durch die geringe Stichprobengroße18 fur Interface/Benutzeroberflache zeigt besonders
der Zeitverlauf, wie anfallig diese Datengrundlage fur Ausreißer ist und somit nur unter
Vorbehalt definitive Aussagen uber die Entwicklung des Quasi-Synonympaares getroffen
werden konnen.
18Siehe Tab. 4
KL | VERDEUTSCHUNG 9
3.3 Thematische Verteilung
Es wurden bewusst Begriffspaare gewahlt, die kaum außerhalb der Informatik Verwen-
dung finden. Daraus entstehen CNS-Karten, die keine Felder außerhalb dieses Themen-
bereichs enthalten, obwohl vereinzelt durchaus solche Falle existieren19.
3.3.1 Computer und Rechner
Computer und Rechner sind von den untersuchten Quasi-Synonympaaren das ahnlichste.
Es fallen weder besonders gelbe (treten in einem analogen Kontext wie Computer auf,
weniger mit Rechner), noch besonders rote (treten in einem analogen Kontext wie Rechnerauf, weniger mit Computer) Felder auf.
Die deutlichste Unterscheidung lasst sich dadurch treffen, ob es sich um ahnliche20
oder relationierte21 Kookkurrenzpartner handelt. Im Allgemeinen gilt: Ahnliche Begriffe
tendieren zu einem analogen Kookkurrenzprofil zu Computer, relationierte Begriffe zu
einem analogen Profil zu Rechner.19Drogenabhangige werden selten auch User genannt.20Fernseher, Hersteller, Steckdose, etc.21Transistor, Treiber, Ubertragungsrate, etc.
KL | VERDEUTSCHUNG 10
Abbildung 6: Contrasting Near-Synonyms: Computer, Rechner
Ebenfalls auffallig ist, dass es bei diesem Quasi-Synonympaar keine klare Aufteilung
zwischen englischen und deutschen Begriffen gibt. Der Anglizismus Cache22 ist ahnlicher
zu Rechner als zu Computer, wahrend Schreibmaschine23 ahnlicher zu Computer ist.
Komposita, in denen Computer bereits enthalten ist (i.e. Computerfirma, computergestutzt)weisen ein ahnliches Profil zu Computer auf.
3.3.2 User und Benutzer
Das Quasi-Synonympaar User/Benutzer weist eine Differenzierung zwischen Anglizismen
auf, welche tendenziell naher zu User stehen24, und deutschsprachigen Begriffen, die
22Abb. 6, rechts oben23Abb. 6, links unten24Siehe Abb. 7, rechts unten
KL | VERDEUTSCHUNG 11
eher dem Kookkurrenzprofil von Benutzer entsprechen. Geschaftsbezogene Anglizismen
wie Professional sind User sehr ahnlich.
Abbildung 7: Contrasting Near-Synonyms: User, Benutzer
Peripheriegerate und andere physische Objekte stehen tendenziell eher im selben Kontext
wie Benutzer. Eine umgekehrte Aussage, also dass abstrakte Begriffe ahnlicher zu Usersind, lasst sich nicht treffen. Begriffe, die im Zusammenhang mit sozialen Netzwerken
stehen, also Network, Chatroom, etc., haben eine großere Ahnlichkeit zu User.
3.3.3 Interface und Benutzeroberflache
Interface und Benutzeroberflache weisen die großte Diskrepanz der Quasi-Synonympaare
auf. Die Trennung zwischen Anglizismen und deutschen Begriffen ist hier noch starker
als zwischen User und Benutzer.Fast alle gelben Felder in Abb. 8 bestehen aus Anglizismen, mit der Ausnahme von
Abkurzung und abgekurzt. Durch die vielen Abkurzungen, welche Interface als Bestandteil
KL | VERDEUTSCHUNG 12
enthalten25, ist diese Korrelation zu erklaren. Auch Begriffe wie Hypertext (HDMI) sind
uber Abkurzungen mit Interface verbunden.
Abbildung 8: Contrasting Near-Synonyms: Interface, Benutzeroberflache
Ebenfalls auffallig ist, dass Begriffe, welche ein ahnliches Kookkurrenzprofil wie Be-nutzeroberflache aufweisen, durchschnittlich langer sind, als solche, die sehr ahnlich
zu Interface sind. Dies korreliert mit der Aufteilung in deutsche Begriffe und englische
Lehnworter.
25I.e. HDMI, API, GUI
KL | VERDEUTSCHUNG 13
4 Auswertung
4.1 Sinkende Haufigkeit
Abgesehen von User weisen samtliche untersuchten Begriffe ein sinkende relative
Haufigkeit auf. Da es sich bei DeReKo hauptsachlich um einen Zeitungskorpus han-
delt, konnte man aus diesen Daten einen Abfall in medialer Aufmerksamkeit fur Rechner
und benachbarte Themen ableiten. Wahrend uber neue Smartphones und soziale Medien
weiterhin stark berichtet wird, sind medienwirksame Durchbruche und Nachrichten
uber Computer selbst seltener geworden. Als Ausnahme sind die groß inszenierten
Apple-Konferenzen zu nennen, allerdings vermarktet dieser Konzern seine Computer
als ’Mac’, wodurch auch solche Medienereignisse nur wenig Auswirkungen auf diese
Ergebnisse nehmen sollten. Es benotigt eine breitere Suche uber technische Begriffe, um
festzustellen, ob es sich bei diesem Gefalle um einen Trend im gesamten Feld oder nur
in einzelnen ausgewahlten Bereichen handelt. Dies wurde allerdings den Skopus dieser
Hausarbeit uberschreiten.
4.2 Verdeutschung
Aus der thematischen Einordnung geht hervor, dass sich die drei betrachteten Anglizis-
men in verschiedenen Stadien der Verdeutschung befinden, also der Einbinding eines
fremdsprachlichen Begriffes (in diesem Fall Anglizismen) in die deutsche Sprache. Dies
ist bei den gewahlten Beispielen vor allem durch die Aufteilung zwischen englischen und
deutschen Kookkurrenzmustern ersichtlich.
4.2.1 Akzeptanz
Computer, ein Wort das schon vor dem Untersuchungszeitraum in seiner momentanten
Bedeutung im Deutschen gebraucht wurde, ist weder ahnlicher zu englischen, noch
deutschen Begriffen. User/Benutzer hingegen sieht eine solche Verteilung, mit einem
haufigeren Auftreten von Anglizismen bei User und einem niedrigeren Auftreten bei
Benutzer. Bei Interface ist diese Aufteilung sogar noch starker, mit Anglizismen als stark
Interface zugehorig, einer kleineren Schnittmenge an Begriffen, die Ahnlichkeiten zu
beiden Begriffen zeigen und einer ebenfalls großen Menge an Begriffen deutschen Ur-
sprungs, die eine hohe Ahnlichkeit zu Benutzeroberflache zeigen.
Computer hat bereits fruh nach seinem Auftauchen in der deutschen Sprache den deut-
schen Begriff Rechner abgelost. Dies wird durch die Dominanz des Anglizismus uber den
KL | VERDEUTSCHUNG 14
gesamten Untersuchungszeitraum26 bestatigt. User durchlauft einen ahnlichen Prozess,
hat in seiner Haufigkeit Benutzer aber erst 2010 uberholt27.
Interface und Benutzeroberflache sind zu selten im Korpus zu finden, um sichere Aussagen
uber deren Entwicklung zu treffen. Das Korpus ist durchzogen von Verwendungen von
Interface, die nicht direkt mit der Informatik in Verbindung stehen. Da noch immer eine
starke Korrelation zwischen dem Anglizismus und der Sprache analoger Kookkurrenzpro-
file besteht, bleibt offen, ob Interface denselben Prozess durchlaufen wird wie Computer.
Mit der thematischen Bindung eines Anglizismus an Kookkurrenzprofile anderer Fremdworter
als Maßstab fur Grade der Verdeutschung (mit Computer als Anglizismus mit hoher, Usermit maßiger und Interface mit niedriger Verdeutschung), lasst sich aus den Ergebnis-
sen der durchgefuhrten Korpussuche ableiten, dass der Grad der Verdeutschung davon
abhangt, wie lange der Begriff bereits im Wortschatz vorhanden ist. Eine Ausnahme bildet
Interface, welches etwa 10 Jahre vor User in den deutschen Wortschatz eingegangen
ist28, aber eine großere thematische Trennung zwischen englischen und deutschen Be-
griffen aufweist.29. Diese Ausnahme lasst vermuten, dass neben einem zeitlichen Aspekt
ebenfalls andere Faktoren den Prozess der Verdeutschung beschleunigen. Computer wird
bereits zu Beginn des Beobachtungszeitraumes gegenuber Rechner bevorzugt, User hat
Benutzer 2009 uberholt. Aus diesen beiden Beispielen lasst sich durchaus eine Tendenz
hin zum Anglizismus ableiten. Grund dafur konnte eine breitere Akzeptanz oder Kenntnis
englischer informatischer Begriffe sein.
Abbildung 9: Relative Haufigkeit in Prozent nach Jahr: Computer
Computer befindet sich seit 1964, mit vereinzelten Nennungen seit 1946 im Sprachge-
brauch30, User seit 199431. Es handelt sich also um 70 bzw. 22 Jahre, in denen diese26Siehe Abb. 327Nutzer wird haufiger als beide Begriffe genutzt, wurde aber in dieser Hausarbeit nicht naher untersucht.28Siehe Abb. 4 und 529Siehe Abb. 830Siehe Abb. 9, Suche basierend auf Google Books Ngram Viewer (Michel et al., 2010)31Siehe Abb. 4
KL | VERDEUTSCHUNG 15
Begriffe in der deutschen Sprache genutzt werden. Dadurch wird deutlich, dass es sich
bei diesen Begriffen zumindest um Begriffe handelt, deren Bedeutung einem Großteil
der Bevolkerung bekannt ist oder zumindest eingegrenzt werden kann.
4.2.2 Relevanz
Durch einen Mangel an Relevanz fur den gewohnlichen Sprecher ist der geringe Grad an
Verdeutschung von Interface zu erklaren. Interface beschreibt ein Element einer oder die
gesamte graphische Oberflache eines Programms und ist damit deutlich weniger ’fassbar’
als die anderen untersuchten Begriffe.
Interface bleibt u.a. weiterhin in der deutschen Sprache erhalten, weil die deutsche
Entsprechung Benutzeroberflache
1. deutlich komplexer und langer als der Anglizismus und
2. junger als der Anglizismus ist.
Interface tritt seit 1972 im Korpus auf32, Benutzeroberflache allerdings erst seit 198933. Der
Begriff wird nur von einem eingeschrankten Publikum verstanden und genutzt, und ist
damit kaum außerhalb von Publikationen, die ohnehin weit mehr Fachsprache verwenden
als ubliche Medien, zu finden. Aus diesen Umstanden ergibt sich die Ahnlichkeit mit
anderen Anglizismen trotz der fruhen Einfuhrung.
Ein dem Englischen entlehnter Begriff wird nicht in seiner gesamten Bedeutungsfulle
ubernommen34. Vielmehr entspricht der Begriff zu Beginn lediglich einem Lexem in
der entlehnenden Sprache. Wenn dieses Lexem nicht relevant fur die Sprecher dieser
’Zielsprache’ ist, also nur von einer ausgewahlten Menge an Sprechern genutzt wird,
wird es als Fachbegriff in die Sprache eingehen. Der verdeutschte Anglizismus muss also
sowohl ein Konzept beschreiben, dass durch sein Auftreten als Anglizismus automatisch
restringiert ist, und dennoch ein fur den Sprecher einer Sprache so relevantes Konzept
beschreiben, dass es auch außerhalb von Fachliteratur Verwendung findet.
5 Fazit und Reflexion
Mit der praferierten Ursprungssprache der durch CNS-Karten festgestellten, zum unter-
suchten Wort ahnlichen Kookkurrenzprofile als Maßstab, ließ sich aus den gegebenen
Daten fur die Verdeutschung von Anglizismen eine Abhangigkeit von
32Allerdings auch haufig als von der Informatik unabhangiger Begriff33Siehe Abb. 534Z.B. beschreibt der Begriff ’Web’ im Englischen 23 (vgl. Online 2017), in seiner Form als Anglizismus
lediglich ein Lexem (vgl. Dudenredaktion).
KL | VERDEUTSCHUNG 16
1. zeitlich restringierter Akzeptanz, und
2. thematisch restringierter Relevanz
herleiten. Je relevanter fur den gewohnlichen Sprecher ein Wort ist und je langer es sich
im Korpus befindet, desto wahrscheinlicher ist es, dass es auch in einem anderen Kontext
als andere Anglizismen verwendet wird. Im Umkehrschluss gilt daher, dass, je großer
der Grad der Verdeutschung ist, desto unahnlicher das Kookkurrenzprofil eines Begriffes
zu dem eines fremdsprachigen Begriffes ist.
Zudem zeigt sich unter den untersuchten Ergebnissen ein Abstieg in relativer Haufigkeit
der meisten Begriffe seit der Jahrtausendwende. Dies konnte allerdings auch auf die
kleine Stichprobengroße zuruckzufuhren sein, nicht zuletzt, da sich bereits unter den
untersuchten Begriffen Gegenbeispiele finden.
Auch festzustellen ist, dass sich der Anglizismus in der untersuchten Literatur durchsetzt.
Sowohl Computer als auch User weisen eine hohere relative Haufigkeit als ihre deutschen
Entsprechungen auf.
5.1 Methodik
Die Stichprobengroße war in vielen Fallen zu gering, um allgemeine Aussagen uber
Anglizismen in der Informatik treffen zu konnen. Die ausgewahlten Beispiele haben sich
gut geeignet, um Vergleiche zwischen der deutschen Entsprechung und dem Anglizismus
zu treffen, allerdings wurde, um moglichst bedeutungsgleiche Begriffe zu wahlen, nicht
immer der am haufigsten benutzte Begriff fur diese Bedeutung gewahlt. So ubertrifft
Nutzer sowohl User als auch Benutzer, wurde aber aufgrund der weiteren Bedeutung
nicht analysiert.
Begriffe wie Computer gehen auf das Ende des zweiten Weltkrieges zuruck, sind da-
mit allerdings in ihrem Ursprung nicht mehr im Korpus enthalten. Um dennoch einen
Vergleich zu ziehen, musste auf Google Books Ngram Viewer zuruckgegriffen werden,
dessen Ergebnisse deutlich weniger modular sind als solche, die durch Cosmas II erzielt
wurden.
Interface und Benutzeroberflache haben sich nicht als geeignete Untersuchungsgegenstande
herausgestellt. Benutzeroberflache weist ahnliche Problematiken wie Benutzer auf, hat zu-
dem ebenfalls die Schreibweise Oberflache, die auch andere Bedeutungen aufweist. Diese
Komplexitat wurde zu Beginn der Analyse nicht ausreichend eingeschatzt. Zudem sind
beide Begriffe nur selten im Korpus vertreten, weisen selbst mit dem eingeschrankten
Korpus noch viele Ausreißer auf und sind damit nur sehr vorsichtig zu klassifizieren.
Das nicht-technische Korpus hat sich geeignet, die meisten Ausreißer, vorausgesetzt
eine große Datengrundlage, aus der Suche auszuschließen. Allerdings wird durch den
KL | VERDEUTSCHUNG 17
Ausschluss der großten informatischen Korpusquellen auch die untersuchte Datenmenge
stark eingeschrankt.
5.2 Ausblick
Weiterhin zu untersuchen gilt, ob die hier festgestellten Tendenzen auch uber ein weite-
res Feld an informatischen Begriffen oder Anglizismen gultig sind. Es ist vor allem die
Effektivitat der Ursprungssprache der Kookkurrenzpartner als Maßstab fur graduelle
Verdeutschung weiter zu erkunden.
Eine tiefere Kookkurrenzanalyse ware ebenfalls zu begrußen, um festzustellen, ob Ang-
lizismen nicht nur ahnlicher zu anderen Anglizismen sind, sondern auch haufiger mit
ihnen auftreten.
Ebenfalls wurde die Beziehung zwischen Benutzer, User und Nutzer nicht in ausrei-
chendem Maße untersucht. Nutzer wurde aufgrund seiner erweiterten Bedeutung nicht
betrachtet, ist allerdings fur die untersuchte Thematik relevant. In diesem Zusammen-
hang konnte ebenfalls Benutzer erneut untersucht werden.
KL | VERDEUTSCHUNG 18
Literatur
Cyril Belica. 1995. Statistische kollokationsanalyse und -clustering.
Cyril Belica. 2001 ff. Kookkurrenzdatenbank ccdb. corpora.ids-mannheim.de/ccdb.
Dudenredaktion. ???? ”web” auf duden online.
http://www.duden.de/node/678917/revisions/1340744/view.
Dudenredaktion. 2017a. ”computer” auf duden online.
http://www.duden.de/node/695747/revisions/1376901/view.
Dudenredaktion. 2017b. ”rechner” auf duden online.
http://www.duden.de/node/656409/revisions/1294192/view.
IDS. 2017a. Cosmas ii web. cosmas2.ids-mannheim.de/cosmas2-web.
IDS. 2017b. Deutsches referenzkorpus / archiv der korpora geschriebener gegenwartss-
prache. Release vom 08.03.2017.
IDS. 2017c. Korpora der geschriebenen sprache / aktuelles korpusarchiv. www.ids-
mannheim.de/kl/projekte/korpora/archiv.
Jean-Baptiste Michel, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K.
Gray, William Brockman, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan
Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman
Aiden. 2010. Quantitative analysis of culture using millions of digitized books. SciencePublished online ahead of print: 16. 12. 2010.
OED Online. 2017. ”web, n.”. www.oed.com/view/Entry/226695.
Rainer Perkuhn, Holger Keibel, and Marc Kupietz. 2012. Korpuslinguistik. UTB. Fink,
Paderborn.
KL | VERDEUTSCHUNG 19