Fachkommunikation und Fachübersetzen:
Forschungsstand und Perspektiven
Gerhard BudinUniversität Wien
Universität Innsbruck, 14. Mai 2008
Themenüberblick
• Zum Stand der Forschung– Generelle Entwicklungen und Auswirkungen auf
• Fachsprachenforschung• Fachkommunikation• Fachübersetzen
– Auswirkungen auf bisherige Forschungsparadigmen
• Trends und Zukunftsszenarien– Forschungstrends– Fallbeispiele aus der eigenen Forschungswerkstatt
• Schlussfolgerungen• Forschungsfragen
Zum Stand der Forschung –Generelle Entwicklungen und ihre
Auswirkungen I**Anmerkung: diese Entwicklungen sind nicht neu!
• Technologien -> neue Methoden/Ansätze wie zB die
Korpuslinguistik, neue Forschungsprogramme wie „Europäische Forschungsinfrastrukturen“ -> vernetzte Forschung, eHumanities -> Integrative Übersetzungstechnologien
-> Multimedia-Technologien, Multimodale Kommunikation, Semantic Web Technologies, Social Web (-> soziale Auswirkungen der IT)
-> Virtuelle, global verteilte Übersetzungsprojekte
Zum Stand der Forschung –Generelle Entwicklungen und ihre
Auswirkungen II**Anmerkung: diese Entwicklungen sind nicht neu!
• Globalisierung– Ubiquitäre Mehrsprachigkeit UND steigende
Dominanz eines „English as a lingua franca“– Transkulturelle (Fach-)Kommunikation im
Unterschied** zur interkulturellen (Fach-) Kommunikation in vielen Berufsgemeinschaften
**Anmerkung: parallel zum Unterschied zwischen Inter- und Transkulturalität der Kulturwissenschaften
– Internationale „Communities of Practice“• Global(isiert)e Berufssprachen, Wissenschafts- und
Fachsprachen – multilingual bzw. monolingual
Zum Stand der Forschung –Generelle Entwicklungen und ihre
Auswirkungen III**Anmerkung: diese Entwicklungen sind nicht neu!
• Kommerzialisierung– Neue Produkte u. Dienstleistungen (multilinguale
Produktkataloge, Ontologien, Sprachtechnologien, umfassende Sprachdienstleistungsangebote, Berufsprofile, Professionalisierung, QS, etc.)
• Wissenschaftliche Erkenntnisfortschritte und neue Paradigmen– zB Kognitive Linguistik (Cognitive Science)– zB Kommunikationspragmatik und Globale Ethik– zB Multidimensionale Ansätze (zB MUTRA)
Auswirkungen auf diese bisherigen Forschungsparadigmen
• Notwendige Erweiterung des Spektrums der Forschungsgegenstände und der zu stellenden Forschungsfragen für die– Traditionelle Fachsprachenforschung
-> zB Mündliche Fachkommunikation, Transkulturelle Fachkommunikation und Technische Kommunikation
– Traditionelle Terminologiewissenschaft-> sozio-kognitive Ansätze, korpusbasierte Forschung,
historische Semantik, Semantische Interoperabilität und globale Informationsstrukturen, etc.
– Traditionelle Übersetzungswissenschaft-> übersetzungssoziologische Aspekte, technologische
Ansätze, ethische Fragen, Kultursemiotik, etc.
Trends und Zukunftsszenarien*
* Anmerkung: aus meiner (bescheidenen) Sicht!
• Fortsetzung der zuvor beschriebenen Generellen Entwicklungen und ihrer Auswirkungen in allen Bereichen der Gesellschaft – da zur Zeit nur bestimmte, aber noch nicht alle Branchen
von diesen Entwicklungen erfasst und verändert wurden– Umfangreiche Empirische Forschung notwendig, um die
Auswirkungen in unterschiedlichen Bereichen erforschen zu können (impact assessment)
– ---> deshalb nun Fallbeispiele aus der eigenen Forschungswerkstatt zur Verdeutlichung eines neuen, integrierten Ansatzes für die Forschung zu Fachsprachen und zum Fachübersetzen
Fallbeispiele aus der eigenen Forschungswerkstatt
• Zur Verdeutlichung eines neuen, integrierten Ansatzes für die Forschung zu Fachsprachen und zum Fachübersetzen– Aus folgenden Projekten seit 2005:
• MUTRA (Multidimensional Translation – Marie Curie Projekt mit H. Gerzymisch-Arbogast, L. Zybatow, et al.)
• LIRICS (Linguistic Infrastructure for Interoperable Resource and Systems in the eContent Programme) (mit Laurent Romary et al)
• MELLANGE (Multilingual eLearning for Language Engineering (in Leonardo da Vinci II) (mit N. Kubler, T. Hartley, E. Steiner, et al)
• DYNAMONT (Dynamic Ontologies Engineering im BMVIT-Programm Semantic Systems) (mit W. Behrendt, M. Harnoncourt et al)
• WIN (Wide Area Network for Risk Management, an Integrated Project in FP6, ICT for the Environment) – sub-project MULTH (WP 2200 “Human Language Interoperability”) (mit G. Greciano, A. Rothkegel et al)
• CLARIN (FP 7 project: Common Language Resource Research Infrastructure) (mit S. Krauwer, P. Wittenberg, N. Calzolari, et al.)
A Case Study for Testing and Further Elaborating the Model of Interactive Translation
Cross-cultural knowledge management
Hypermedia Communication
Collaborative Work
Dynamic ontologies
Translation resourceand multilingual
content management
Interactive Translations
Budin 2005
The Interactive Translation Model as an Operational Instance of the Multidimensional Translation (Meta-)Model (MuTra)
• Model properties – translation is– Knowledge-based
• Typology of knowledge representations• Conceptual basis
– knowledge structures
– Semantic systems
– ontologies
• Cognitive processes, knowledge management
The Interactive Translation Model as an Operational Instance of the Multidimensional Translation (Meta-)Model (MuTra)
– Communication-based• Typology of communication processes and situations
– Includes computer-mediated communication (CMC)
– Social interactions – constantly link all dimensions to each other
– Sign-based• Semiotic processes
– Inter-semiotic, multi-semiotic
– Inter- and intralinguistic, socio-linguistic basis
Case Study: International Risk Communication and Domain-specific Translation Processes
• Empirical basis: concurrent projects on risk management– Multilingual corpora– Multimedia corpora– Terminology databases– Dictionaries, glossaries
• Purposes– Supporting domain communication in risk management projects– Enhancing international information systems– Supporting translation processes
• Transformations– Term extraction, corpus analysis, visualization, textualization,
modeling, information aggregation, cross-lingual information retrieval, lexicography, terminology management, ontologization, translation (in the narrow sense) -> translational transformations (in a new, wider sense)
The following slides show examples of
• Various domain texts• Knowledge models• A terminology database• An (electronic) dictionary
Verbal, mono-semiotic (hyper-)text• hazard identification: [HAZARD ASSESSMENT] the first stage in hazard assessment,
consisting of the determination of substances of concern, the adverse effects they may have inherently on target systems under certain conditions of exposure, taking into account toxicity data Note: Definitions may vary in wording, depending on the context. Thus, here: [RISK ASSESSMENT] the first stage in risk assessment, consisting of the determination of particular hazards a given target system may be exposed to, including attendant toxicity data.
• hazard characterization: the second step in the process of hazard assessment, consisting in the qualitative and, wherever possible, quantitative description of the nature of the hazard associated with a biological, chemical, or physical agent, based on one or more elements, such as mechanisms of action involved, biological extrapolation, dose-response and dose-effect relationships, and their respective attendant uncertainties
• hazard evaluation: the third step in the process of hazard assessment aiming at the determination of the qualitative and quantitative relationship between exposure to a hazard under certain conditions, including attendant uncertainties and the resultant adverse effect
• RISK ASSESSMENT [back to chart]• risk assessment: process intended to calculate or estimate the risk for a given target
system following exposure to a particular substance, taking into account the inherent characteristics of a substance of concern as well as the characteristics of the specific target system. The process includes four steps: hazard identification, dose-response assessment, exposure assessment, and risk characterization. It is also the first step in risk analysis.
• hazard identification: [RISK ASSESSMENT] the first stage in risk assessment, consisting of the determination of particular hazards a given target system may be exposed to, including attendant toxicity dataNote: Definition may vary depending on the context. Thus, here: [HAZARD ASSESSMENT] the first stage in hazard assessment, consisting of the determination of substances of concern and the adverse effects they may inherently have on target systems under certain conditions of exposure, taking into account toxicity data.
Modeling the content -> translating content into a model -> transformation
Structure and purpose of the meta-hyper-text
Risk Assessment Terminology
by Dr. John H. Duffus **This article is a summary of the main points of a report of the work of a joint
International Program on Chemical Safety/Organization for Economic Cooperation and Development (IPCS/OECD) Working Party that was published in 1999 in Terminology Standardization and Harmonization (see ref 1).
Dr. John H. DuffusThe problem of "risk" and "hazard" terminology has bedeviled discussions
relating to the safe use of chemicals, because there have been different usages, although a consensus is emerging. This paper describes that consensus and how the Working Party identified it. We believe that the chemical community should be aware of the consensus position, and we think that the methodology applied is of considerable interest and agrees with that used by IUPAC terminologists.
Introduction Methodology used List of terms
Terms and definitions Action-oriented terms
Prevention and Mitigation: Different organizations will follow different
methodologies to analyze and produce results on different scales for hazards, vulnerabilities and risks. The resulting maps in turn can be used, for example, to build scenarios and aid planning. In the preparation phase emergency plans will be produced. In the previous phase (Reconstruction) results will be used for land use planning.
• Preparation: From analysis in the previous phase, emergency plans will be validated. When an alarm is activated, emergency scenarios could be run to determine how best to organize the territory in order to minimize the impact of the event, this could include the need to use sophisticated forecasting models. Additionally, pre-emergency plans might be used to communicate to the affected stakeholders, and alert the appropriate decision makers.
• Response: Geospatial information accessible through information services allow more timely interventions of teams and more efficient management of the operation on site. Additionally, non-spatial information like procedures, emergency plans and authorization modules can be quickly accessed and communicated. Further, information on critical infrastructures and ser-vices damaged by the event will be needed in order to prioritize actions needed to protect the affected society. Finally, efficient and reliable communication channels will be necessary to as-sure the transportation of this information between the appropriate decision makers and other emergency management actors.
INSPIRE Information Flow
Harmonised Data policy
Collaborativeagreements
CEN / ISO / OGCNational and Sub-
national SDI
Commercial & Professional Users
Citizens
Utility & PublicServices
NGOs and not-for-profit orgs
Government & Administrations
ResearchEuropean Data
National and Sub-national SDI
National and Sub-national SDI
Local data
Local data
European Data
Discovery Service
Technical Integration/harmonisation
Data resourcesData resources
INSPIRE specificationsINSPIRE specifications
UsersUsers
request for information services
delivery of information services
SDI – Spatial Data Infrastructure
Floodsite: Language of risk – a conceptual risk model
Conclusions for Translation Theory
• Translation theory as a – semiotic theory of knowledge transformation and – information (systems) design – governed by communicative purposes in social action situations– covering all types of
– (computer-assisted, digital) – (collaborative) – (distributed) – (international)
• communication processes – within and across languages– within and across semiotic knowledge representation forms– Within and across cultures and language communities
Terminologische Ontologien als Werkzeuge der Wissensorganisation
in verteilten Arbeitsumgebungen:Der „Dynamont“ Ansatz
Gerhard BudinUniversität Wien
Zentrum für Translationswissenschaft
WIST Kolloquium Chemnitz30. Juni 2007
DynamOntMethodology for Dynamic Ontology Creation
Übersicht
• Eckdaten zum Dynamont Projekt• Dynamont-Architektur, Werkzeuge und Arbeitsabläufe• Von Terminologien zu Ontologien – Werkzeuge der
Wissensorganisation• Verteilte Wissensarbeit – Szenarien• Fallstudie: Anwendung im Rahmen eines internationalen
Flüchtlingsinformationssystems und –Netzwerks• Schlussfolgerungen
Dynamont-Architektur, Werkzeuge und Arbeitsabläufe
Phase 1: Identify the Problem
Phase 2: Structure the Problem
Phase 3: Identify Purpose and Scenario
Phase 4: Identify concepts of domain / subject matter
Phase 5: Create Knowledge Model
Phase 6: Create Application Profile
Phase 7: Create Acceptance
Phase 8: Create System
Ontology Creation
Postgres
Phase 9: Implement System
Visualization
Storage
MethodologyCollaboration
MDA-Component
Von Terminologien zu Ontologien – Werkzeuge der Wissensorganisation
• Terminologien = strukturierte (+/-) Gesamtheiten von Begriffen und deren Benennungen in einer bestimmten Sprache in einem bestimmten Fachgebiet
• Ontologien = formale, explizite (begriffliche) Modelle von Weltausschnitten (Objekten) in einer Computer-Repräsentation
• Unterschiede und Gemeinsamkeiten• Methoden des Organisieren von Wissen (persönliche
und kollektive Ebenen)• Wissensorganisationssysteme: alle strukturierten
Terminologiesysteme: Klassifikationen, Thesauri, Taxonomien, Nomenklaturen – alle sind „ontologiesierbar“ -> in der Folge auch Ontologien
Verteilte Wissensarbeit – 3 Szenarien
• Internationales Risikomanagement – Datenmodellierung verknüpft mit mehrsprachiger, ontologie-gestützter Risikokommunikation
• eLearning Umgebung am Zentrum für Translations-wissenschaft der Universität Wien, mit Moodle, Wikis, ePortfolios, schrittweise unterlegt mit Lernontologien
• Flüchtlingsinformationsnetzwerk und –system – ontologiegestützte Thesaurus- und Textarbeit
Fallstudie: Anwendung im Rahmen eines internationalen Flüchtlingsinformations-
systems und –Netzwerks
• ECOINET: internationales Länderinformationssystem und –netzwerk zu Flüchtlingsthemen
• Existierende Thesauri: UNHCR, nationale Thesauri, Huridocs, etc.
• Aufgabe: neuer, mehrsprachiger harmonisierter Thesaurus (Indexierung, Suche, Navigation, Wissensorganisation)
• Textanalyse (unterschiedliche Textsorten), Identifizierung von Termini und ihrem Gebrauch
• Unterschiedliche Nutzergruppen mit ihren Interessen• Ontologisierung, social tagging/Annotation• Hybridmodell (top-down/bottom-up, multiling.)
• 05 Violations against the right to movement, right to residence
– 05 01 Direct actions which violate the right to movement or residence• 05 01 01 Internal exile• 05 01 02 Exile• 05 01 03 Eviction• 05 01 04 Displacement• 05 01 05 Blockading• 05 01 06 Restriction on travel• 05 01 07 Denial of right of return
– 05 21 Violations of the right to movement or residence in terms of legislation or policy-making
• 05 21 01 Promulgation of law or policy which violate the right to movement or residence
• 05 21 02 Repeal of law or policy which used to guarantee the right to movement or residence
• 05 21 03 Promulgation of law or policy which reduces guarantees for liberty of movement or residence
• 05 21 11 Lack of law or policy to guarantee/fulfil the right to movement or residence
Schlussfolgerungen und Ausblick
• Vergleichende Testläufe in den 3 Szenarien -> Optimierung der Dynamont-Methode
• Vertiefung der Kombination mit Textsemantik, FrameSemantik, lexikalisch-terminologisch-ontologische Semantik
• Testen der Werkzeuge, Integration in unterschiedlichen Arbeitsumgebungen, Implementierungsstrategien
• Semantische Interoperabilität im Workflow• Benutzerfreundlichkeit
Entwicklung internationaler Normen im Bereich der Translationsqualität
bei ISO/TC 37 - ein Lagebericht
Gerhard Budin
Universität Wien
Zentrum für Translationswissenschaft
LICTRA Konferenz Leipzig
Überblick
• Motivation: Wozu (translationsbezogene) Normung?• Historische Entwicklung translationsbezogener Normen• Bedarfsfeststellung: Einrichtung einer neuen Arbeitsgruppe
ISO/TC 37/SC 2/WG 6 „Translation and Interpretation Processes“ und ihre Arbeitsvorhaben
• Translationsqualität und translationsbezogene Normung im Kontext – pränormative Forschung & Entwicklung zur Translationsqualität– Kompetenzmodellierung und Qualitätssicherung durch Lehre/in der
Lehre– Normung im Bereich des multilingualen Sprachressourcenmanagements
Motivation: Wozu (translationsbezogene) Normung?
• Nutzen von Normung generell– Volkswirtschaftliche und betriebswirtschaftliche Argumente
(Fraunhofer Studie, Normungsforschung, etc.)– Instrument der Qualitätssicherung durch mehr Konsistenz ->
Verlässlichkeit -> Vertrauen
• Sprachbezogene Normen und ihr Nutzen– Sprachendokumentation, Sprachenidentifizierung und -kodierung– Technische Dokumentation, Fachkommunikation– Terminologie, Lexikografie– Translation - Übersetzen und Dolmetschen– Sprachtechnologien, Sprachverarbeitung, Korpuslinguistik
Motivation: Wozu (translationsbezogene) Normung?
• Translationsbezogene Qualitätsnormung – Dienstleistungsbezogen– Prozessbezogen – Ergebnisbezogen
• Interessen der– Dienstleister– Kunden (Auftraggeber in Wirtschaft, Industrie, etc.)– Endverbraucher– Behörden– Andere Interessensvertretungen
Bedarfsfeststellung: Einrichtung einer neuen Arbeitsgruppe ISO/TC 37/SC 2/WG 6 „Translation
and Interpretation Processes“ und ihre Arbeitsvorhaben
• Mehrere Mitgliedsstaaten von ISO/TC 37/SC 2 haben die Einrichtung einer neuen Arbeitsgruppe ISO/TC 37/SC 2/WG 6 „Translation and Interpretation Processes“ beantragt
• Arbeitsvorhaben (i.e.S.)– Spezifikation von Parametern zur Beurteilung von
Translationsqualität für die Vorbereitung und Begleitung von Übersetzungsprozessen
– Vorbereitung einer Norm zu Dolmetsch-Dienstleistungen• Weitere Vorhaben
– Vergleichende Studie aller existierenden translationsbezogenen Normen (läuft zur Zeit)
– Mehrsprachige Terminologie des Themenbereichs (aktuelles Beispiel: „interpreting“ vs. „interpretation“ im Englischen)
Integrativer Ansatz• Trends zur Internationalisierung der
translationsbezogenen Normung• Weiterentwicklung des Qualitätsbegriffs in der Forschung,
Weiterentwicklung des ISO 9000 ff Rahmenwerks• Diversifizierung der Themen und der Perspektiven bei
gleichzeitiger Integration– bisheriger Schwerpunkt: Dienstleistungsperspektive– In der Normungsarbeit sollen alle relevanten gesellschaftlichen
Bereiche repräsentiert sein (was nicht immer der Fall ist)– Prozessperspektive, Spezifikationsorientierung, technische
Orientierung („translation metrics“)• Umfang des Arbeitsauftrages der ISO-Arbeitsgruppe: alle Facetten
des Übersetzens und Dolmetschens, inkl. technischer Aspekte
Translation im Kontext: Pränormative Forschung & Entwicklung zur Translationsqualität
• Bedarf an pränormativer Forschung– Empirische Untersuchungen (auch vergleichende Studien)
– Methodologien zur Forschung, theoretische Modelle
– F & E – Umsetzung solcher Modelle
• Zum Begriff der Qualität in Sprache, Kommunikation, und Translation
• Ziel der Forschung & Entwicklung: Umsetzung in der Praxis durch Umsetzung in Normen, die in dieser Praxis zum Einsatz kommen
Forschung & Entwicklung Normung
Praxis, Dienstleistungen Wirtschaft, Industrie
Translations-qualität
Translation im Kontext: Kompetenzmodellierung und Qualitätssicherung durch Lehre/in der Lehre
• Das MeLLANGE Projekt – korpus-basiertes Übersetzen und Prozessmanagement
• MeLLANGE – Multilingual eLearning for Language Engineering
– EU-Projekt im Programm Leonardo da Vinci II
– Ziele:• EU-Masterprogramm (Spezialisierung) für
Übersetzungstechnologien
• Neue Methoden des korpus-basierten Übersetzungsmanagements
• Neue Methoden des eLearning-Unterrichts und der Weiterbildung für „Language Professionals“
Translationsqualität bei Mellange• In der Lehre:
– Qualitätssicherung in der Curriculumsentwicklung zur Spezialisierung „Übersetzungstechnologien“ im Rahmen des Bologna-Prozesses
– Qualitätssicherung bei der Gestaltung von eLearning-Prozessen– Qualitätssicherung bei der Erstellung von Lernobjekten– Qualitätssicherung in der Kompetenzmodellierung– Translatorisches Qualitätsmanagement als eigenes Seminar
• In der Praxis durch Weiterbildung:– Qualitätssicherung bei translatorischen Prozessen– Qualitätssicherung durch Qualifikationsmodellierung (European
Qualification Framework) und ihre Umsetzung in der Praxis
• In der Forschung & Entwicklung– Weiterentwicklung von Fehlertypologien und ihre Umsetzung in
eLearning-Umgebungen und Ü-Werkzeugen– Translationsqualität im korpusgestützten Übersetzungsmanagement– Weiterentwicklung von Testmethoden in der Korpuslinguistik
Themengebiete
• Corpora for Translation• Translation Memory• Specialised Translation• Localisation• Markup Languages• Terminology• Machine Translation• Information Management• Project Management• Quality Management
MeLLANGE Fehlertypologie
Forschungsfragen (zB translatorische Fehlerlinguistik)
• Welche sind die häufigsten Fehler?• Ausgangs- und Zielsprachen – Verteilungen?• Fehlerbeispiele• Fehlertypologien• Fehlerannotation • Vergleich der Strategien von ExpertInnen und Studierenden• Möglichkeiten der Umsetzung in teilautomatisierten Arbeitsabläufen
Übersetzungsworkflow und Qualitätsmanagement
Translation im Kontext: Normung im Bereich des multilingualen Sprachressourcenmanagements
• Das LIRICS-Projekt – Linguistic Infrastructure for Interoperable Resources and Systems– Pränormative (computerlinguistische) Forschung zur Erstellung
von Normen im Sprachressourcenmanagement – MLIF – Multilingual Information Framework – integrativer Ansatz
technischer Prozess-Spezifikationen (TMX, TBX, XLIFF, etc.)– Qualitätssicherung in der Normenerstellung durch Rückkopplung
zwischen Forschung und Praxis (Industrial Advisory Board + Forschungskonsortium)
– Umsetzung auch in translatorischen Arbeitsumgebungen
LIRICS: Linguistic Infrastructure for Interoperable Resources and Systems
GOALS:• LIRICS provides a common standards framework for language
engineering by translating requirements from European language industry into ISO standards on the basis of ongoing R&D work
• LIRICS provides input, on the basis of the cooperation and interaction between research consortia and industry groups, to ongoing standards work in ISO/TC 37, mainly focusing on lexicons, morpho-syntax, syntax and, to a certain extent, semantic content. These standards will be accompanied by a set of test suites in nine European languages to facilitate their implementation and an open source implementation platform allowing common-format, multi-lingual language processing compatible with legacy systems and tools
Primary resourcesTexts, spoken data,
multimedia information[TEI, MPEG7, TMX,
XHTML, etc.]
NLP structuresLinguistic annotations
TokenisationMorpho-Syntactic Tagging
Chunks (e.g. Named Entities, etc.)Deep syntactic structures
Co-references etc.[Eagles, ISLE,Multext/Multext-East
CES, MATE, Whiteboard]
Knowledge structuresHierarchies of types
Relations between concepts[Topic Maps,
RDF/RDFS/OWL]
Lexical structuresTerminologies
Morphological lexicaSyntactic lexicaTransfer lexica
[ISO 16642, TBX, OLIF, Genelex/Simple/ISLE]
Meta-data[Dublin core, TEI,
OLAC, IMDI, MPEG7]
Access protocols[Corba, SOAP]
LIRICS domain of impact
LIRICS scope
Primary resourcesTexts, spoken data,
multimedia information[TEI, MPEG7, TMX,
XHTML, etc.]
NLP structuresLinguistic annotations
TokenisationMorpho-Syntactic Tagging
Chunks (e.g. Named Entities, etc.)Deep syntactic structures
Co-references etc.[Eagles, ISLE,Multext/Multext-East
CES, MATE, Whiteboard]
Knowledge structuresHierarchies of types
Relations between concepts[Topic Maps,
RDF/RDFS/OWL]
Lexical structuresTerminologies
Morphological lexicaSyntactic lexicaTransfer lexica
[ISO 16642, TBX, OLIF, Genelex/Simple/ISLE]
Meta-data[Dublin core, TEI,
OLAC, IMDI, MPEG7]
Access protocols[Corba, SOAP]
LIRICS domain of impact
LIRICS scope
SKOS
Language Resource Management Standardization
• Standardization is needed for language resources (mono- and multilingual), e.g. speech data, written (full) text corpora, lexical (general language) corpora and their processing methods
• Relevant research areas are computational linguistics and computational lexicography, language engineering, etc., which have provided industrial best practices to be turned into official standards
• This process will contribute to the further development of the language industries at large
• As is the case with terminologies, language resources in general are often multilingual, multimedia and multimodal
MLIF – Multilingual Information Framework –
• Neues Arbeitsvorhaben• Integriertes, interaktives Management multilingualer
Ressourcen• Rahmenwerk für mehrere Normen, die miteinander
interagieren – Arbeitsprozesse, Interoperabilität• Multiple Zwecke und Perspektiven
Schlussfolgerungen (Lirics-Mellange)• Normen für das Sprachressourcenmanagement entstehen
anwendungsorientiert aus der Praxis heraus im Kontext anwendungsorientierter Forschung und werden bei der Umsetzung direkt in Arbeitsabläufe integriert
• Mehrsprachige Korpora werden zunehmend als „empirische Wissensbasis“ sowie als Instrumente für die Qualitätssicherung im Rahmen von Arbeitsabläufen des Übersetzungsmanagements verwendet
• Aus- und Weiterbildung für „Language Professionals“ ist zunehmend „korpusbasiert“, normungsbasiert und qualitätsorientiert
• Editoren werden zunehmend benutzerfreundlich und weniger „technologielastig“ (Annotierung, Markup, Konverter, etc.), Kommerzielle Tools und Arbeitsumgebungen übernehmen schrittweise diese Entwicklungen
• Weiterentwicklung von translationsbezogenen Qualitätsnormen auf internationaler Ebene ist im Zeitalter der Globalisierung unabdingbar– Wir stehen erst am Anfang!
ÜbersetzungsprojekteNormen (in ihrer Anwendung)
Arbeitsabläufe --------------> Qualitätssicherung
--------------> Übersetzungsprozesse
Korpora(Ausgangs- und Zielsprachen, Paralleltexte, lexikalisch-
terminologische Korpora, multimodale Korpora, Fehlerkorpora, etc.)
CLARIN in Österreich:Forschungsinfrastrukturen für
Sprachressourcen und SprachtechnologienUpdate April 2008
Gerhard BudinUniversität Wien
Eckpunkte von CLARIN
• Europäisches Netzwerk für den Ausbau von kollaborativen Infrastrukturen für die Forschung und Bereitstellung von Sprachressourcen and Sprachtechnologien
• Interdisziplinäre Ausrichtung für alle Geistes- und Sozialwissenschaften (aber auch für alle anderen Wissenschaften!)
• Aufbauend auf bestehenden Infrastrukturen, Netzwerken, Initiativen und Projekten wie Elsnet, ELRA, ISO/TC 37, LIRICS, etc.
Was sind Sprachressourcen?
• (Digitale) Sammlungen von Sprachdaten, Sprachkorpora– Volltexte (in allen Sprachen, div. Textsorten)– Lexikalische Ressourcen (Wortsammlungen)– Lexikografische und terminografische Ressourcen (für
Wörterbuchproduktion)– Alle Modalitäten und Darstellungsformen (gesprochen,
geschrieben, etc.)– Unterschiedliche Nutzungsformen und Zwecke
Was sind Sprachtechnologien?
• Technologien zur – Sprachanalyse, Korpusanalyse– Spracherkennung, Sprachproduktion (geschrieben,
gesprochen)– Maschinelle Übersetzung, computergestützte
Übersetzung– Wörterbuchproduktion– Technische Dokumentation– U.v.a.
CLARIN in Österreich• Wer ist beteiligt?
– Universitäten (Wien, Graz, Salzburg, Innsbruck)– Forschungsinstitute (z.B. ÖFAI) und Akademien (ÖAW)– Nationale Netzwerke (VERBAL, etc.)– Sprachindustrie (z.B. Frequentis, Siemens, Philips)
• International anerkannte Traditionen und Kompetenzen– Computerlinguistik– Sprachnormung, Sprachanalyse– Terminologiewissenschaft, Übersetzungstechnologien– Mehrsprachige Korpora für Forschung und Ausbildung
sowie für industrielle Anwendungen
Aktuelle Situation April 2008• Vertrag wird gerade unterschrieben • Universität Wien – vertreten durch das Zentrum f.
Translationswissenschaft – ist der österr. Vertrags-partner und ist vom BMWF beauftragt, ein österr. Netz (CLARIN-A) zu etablieren
• Kick-off Meeting fand Mitte März in Nijmegen (Max-Planck-Institut f. Psycholinguistik) statt
• Erstes Workshop von CLARIN-A im Dezember in Wien• Erste Aktivität: Erfassung des Ist-Standes (welche
Sprachressourcen und Sprachtechnologien werden verwendet?)
CLARIN am ZTW• An uns selbst lässt sich ablesen, wie wichtig eine solche
Bestandsaufnahme ist! – Fragmentierung bzw. fehlende Dokumentation von Sprachressourcen und -technologien (Terminologie-Datenbanken, Textkorpora, Software, Programme, etc.)
• PHAIDRA ist für uns ein nützliches Projekt der Universität Wien (ZTW ist Pilotpartner) für die interne Bestandsaufnahme und Archivierung (siehe weiter unten)
• Ziel: Schaffung eines Daten- und Ressourcen-Pools für multifunktionale Nutzung und verteilten Zugriff für Forschung und Lehre
Ausblick I• Nutzungsszenarien
– Korpusanalyse (soziolinguistische/textlinguistische Perspektiven zum Sprachgebrauch, Erstellung terminologischer und lexikografischer Ressourcen, etc.)
– Mono- und multilinguale Extraktion von Terminologie und Phraseologie aus Volltextkorpora
– Im Rahmen von Magisterarbeiten und Dissertationen– Für unterschiedliche Forschungsprojekte– Gesprochene Sprache, multimodale Ressourcen (Reden,
Gespräche Videos, Film, etc.): essentiell für empirische Dolmetschforschung, für Forschung zur interkulturellen Kommunikation sowie für die Übersetzungswissenschaft
– Essentiell für Terminologie- und Fachsprachenforschung
Ausblick II
• Basis für verbesserte interdisziplinäre Forschung– Mit Nachbardisziplinen wie Linguistik und Philologien – generell Kulturwissenschaften– Theaterwissenschaft, Film- und Kunstwissenschaften– Medienwissenschaften– Pädagogik, Soziologie, Philosophie, etc.– Allen Fachdisziplinen, mit denen gemeinsame
Forschungsinteressen entstehen
Schlussfolgerungen 2008
• Integrierter, transdisziplinärer und multidimensionaler Forschungsansatz zu– Fachtexten in transkulturellen Handlungskontexten– In translatorischen Handlungssituationen– Für unterschiedliche Kommunikationszwecke– In verschiedenen Wissensstrukturen
• Adäquate Methoden der Wissensrepräsentation
– Unter (interaktiver, vernetzter) Verwendung zahlreicher Sprachressourcen
• In genormten Formaten - für das Ziel der Interoperabilität• Aus unterschiedlichen Quellen
Danke für die Aufmerksamkeit!
Gerhard Budin
Zentrum für Translationswissenschaft
www.univie.ac.at/transvienna
Forschungsfragen
• Was verstehen SIE unter „Transkultureller Fachkommunikation“?
• Welche Chancen und Herausforderungen sehen SIE für das Fachübersetzen in den nächsten Jahren im Lichte der hier beschriebenen Entwicklungen?