Freie Translationstechnologie Für Übersetzer
Freie Translationstechnologie Für Übersetzer
Freie Translationstechnologie Für Übersetzer
Universität Innsbruck
Open-Source Tools -
Freie Translationstechnologie
für Übersetzer
Mit freier Software
kostenlos zum Erfolg
27.9.2014
Überblick
I. Was ist freie Software?
II. Freie Translationstechnologie
III. Freie Translationstechnologie im Set USBTrans und tuxtrans
IV.Arbeitsabläufe eines Übersetzers
✔ Übersetzen eines Word-Dokumentes mit TM-Support
✔ Übersetzen einer Website mit TM-Support
✔ Maschinenübersetzung nutzen
✔ Erstellen eines TM anhand vorhandener Übersetzungen
✔ Qualitätsprüfung
✔ Verwalten eigener Terminologiesammlungen
✔ Terminologieextraktion
✔ Referenzkorpus erstellen
✔ Dateiformate konvertieren ...
Freiheit zum
– benutzen Lizenzen:
– anpassen ●
GNU GPL
– weitergeben
●
Apache License 2.0
●
BSD 2/3
– verbessern ●
(L)PGL
●
MIT license
●
Mozilla Public License 2.0
●
Eclipse Public License
●
Creative Commons
●
Kostenschonenden Karrierebeginn ermöglichen
●
erleichterte Kooperation
●
Vermeiden von Urheberrechtsverletzungen durch
Softwarepiraterie
●
volle Kontrolle über eigenen PC
●
Einfaches Handling ohne Lizenz oder Aktivierungscode
●
Beteiligung an Entwicklercommunities
●
macht aus (abhängigen) Konsumenten (eigenverantwortliche)
Akteure
●
Translation Environment Tools (TenT)
umfassende Applikation für Übersetzer
mit allen nötigen Hilfsmitteln
●
Oberbegriff für „Translation-Memory-
✔ Translation-Memory
System“ oder „Computer aided ✔ Terminologie-Management
translation CAT-System“ ✔ Alignment
✔ Kollokationssuche
✔ Analyse und Statistik
✔ Projektmanagement
✔ Code-Protection
✔ Stapelverarbeitung
✔ Rechtschreibprüfung
✔ code page conversion
✔ Formatkonversion
✔ ...
OmegaT Pootle
OpenTMS
Gaupol FOLT
TinyTm SDL/Trados
Lokalizer BiText2TMX
Okapi
KBabel Sun OLT Virtaal
Rainbow AnaphraseusJubler
ForeignDesk MemoQ Across
Transolution
PO-Edit
Translate Toolkit Star Transit DéjàVu
Heartsome Wordfast Catalyst
1) ICT Spracheninfrastruktur
2) Allgemeine Translations-Technologie
3) Spezielle Translations-Technologie
4) Web-basierte kollaborative Translations-Technologie
●
Sammlung von translationsspezifischer freier
Software auf USB-Stick, die vom USB-Stick ohne
Installation gestartet werden kann (Portable
Apps)
●
Download von
http://homepage.uibk.ac.at/~c61302/fsftrans.html
aus Platzgründen nicht auf USB
●
Zip-Datei lokal entpacken und direkt auf einen
mind. 2 GB großen USB-Stick kopieren
●
USB-Stick einstecken und USB-Menü aufrufen
}
●
Betriebssystem
frei
Standardanwendungen
= kostenlos
●
Open-Source
●
spezielle Anwendungen
●
um damit arbeiten und übersetzen zu können
●
um es nach Belieben verwenden und installieren zu können
●
um es an Übersetzer und Studenten verteilen zu können
●
Live-DVD
(ohne Installation, langsame Ausführung)
●
Live-USB
(ohne Installation, etwas langsamere Ausführung)
●
Virtuelles System (VM)
●
Zweitbetriebssystem
(durch Installation, schnellere Ausführung und mögliche
Anpassung)
●
Hauptbetriebssystem
●
Cross-Platform-Anwendungen verwenden
●
und Standardformate
odt, pdf, tmx, tbx, xliff ...
MS-Windows Linux
➢
Textverarbeitung LO-Writer LO-Writer
➢
Tabellenkalkulation LO-Calc LO-Calc
➢
Präsentation LO-Impress LO-Impress
➢
Datenbanken Access MYSQL
➢
DTP Xpress Scribus
➢
Grafik Gimp Gimp
➢
Officesuite Libre Office Libre Office
➢
Browser Firefox Firefox
➢
E-Mail Thunderbird Thunderbird
Man nehme:
– eine Textverarbeitung
– ein TM-System
– mehrere Translation-Memories
– mehrere Terminologielisten
windkraft
Terminologie/Glossare
energie.txt, anlagenbau.tbx ...
Projektspezifische
Einstellungsdateien
filters.conf, segmentation.conf
Ausgangstext
it-ispezione ordinaria.docx ...
Translation-Memories
windkraft1.tmx, windkraft2.tmx ...
●
Zieltext(e) im Format
des Ausgangstextes
●
mit identischer
Formatierung
● projektspezifische Glossardatei
● Format *.txt
AT (TAB) ZT (TAB) Anm
Rechtschreibprüfung:
ignored_words.txt, learned_words.txt
Projektspezifische
Einstellungsdateien
filters.conf, segmentation.conf
Zieltext:
it-ispezione ordinaria.docx
man nehme:
●
Website bestehend aus mehreren HTML-Dokumente
●
Website lokal speichern
●
Translation-Memory-System
●
bestehende Translation-Memories
●
bestehende Terminologielisten
●
HTML-Editor
man nehme:
●
Ausgangstext und Übersetzung (ZT)
●
ein Alignment-Tool
● keine
Weiterentwicklung
● Textformat nur *.txt
● Tm als TMX
man nehme:
●
ein freies Maschinenübersetzungssystem
●
ein kostenloses Online-MT-System
●
eine Schnittstelle zum TM-System
●
MT-Registrierung in OmegaT:
– Mymemory (E-Mail)
– Microsoft Translator
API ID + Secret key
– Google Translate
API key
}
●
XLIFF ● Ausgangstext extrahieren
● bereits vorhandene Übersetzungen wiederverwenden
●
sdlxliff ● neue Übersetzungen anfertigen
●
ttx
● bilinguales Dateiformat als Zieltext abspeichern
Darstellung mit
Virtaal
Heartsome
●
PDF-Dateien
mit OmegaT übersetzen
textbasiertes PDF
●
Text aus PDF-Dateien
extrahieren mit gPDFText eBook-Editor
●
PDF-Dateien in
Teile zerlegen bzw.
zusammenfügen mit PDF-Sam
●
PDF-Dateien annotieren
mit Xournal
●
PDF-Dateien vergleichen mit DiffPDF
●
OmegaT QA scripts
●
Okapi Checkmate
●
TMX-Validator
●
XLIFF Checker
TMX-Validator
XLIFF-Checker
Wozu? Terminologierecherche,
Kollokationensuche, idiomatische Wendungen …
man nehme:
●
eine repräsentative Menge an Texten aus dem zu
übersetzenden Fachgebiet
●
ein freies Konkordanzprogramm
●
Präsentation Folien im PDF-Format
●
tuxtrans vollständiges Linuxsystem startet vom USB-Stick
●
Beispieltexte in verschiedenen Formaten
●
OmegaT-Projekte
●
Korpusdateien
●
Alignment-Dateien