Übersetzungsunternehmen Kocarek GmbH
Facebook LinkedIn GooglePlus Besuchen Sie uns auf Twitter YouTube

+49 201 24 69 90-0 | info@kocarek-gmbh.com

Übersetzungsunternehmen Kocarek GmbH
Home » News
28.12.2016

TWB: Maschinelles Übersetzungssystem für kurdische Sprachen

Mitarbeiter der gemeinnützigen Organisation Translators without Borders (TWB) haben ein neues maschinelles Übersetzungssystem für kurdische Sprachen entwickelt. Es ist das erste krisenspezifische System der Welt.

maschinelles Übersetzungssystem für kurdische Sprachen

Kurdisch

Im Kurdischen gibt es zahlreiche Dialekte, die in drei Hauptdialektgruppen aufgeteilt werden: Sorani (Zentralkurdisch), Kurmandschi (Nordkurdisch) und Südkurdisch. Kurmandschi ist die kurdische Sprache, die am weitesten verbreitet ist: 8-10 Millionen Menschen sprechen sie in Syrien, in der Türkei, im Irak, Iran, Libanon und in Armenien. Im Westiran und im Süden der Autonomen Region Kurdistan sprechen etwa 5 Millionen Menschen Sorani.

Kurmandschi & Sorani

Translators without Borders (TWB) haben ihr neues System für Kurmandschi und Sorani entwickelt, da dies die beiden Sprachen sind, die die meisten kurdischen Flüchtlinge sprechen. Die Übersetzungsmaschine ist auch offline verfügbar und ermöglichte nach nur einer Woche Arbeit bereits eine grundlegende Kommunikation zwischen kurdischen Flüchtlingen und griechischen Hilfsarbeitern. Die Übersetzer, die das System entwickelten, wurden speziell geschult. So konnten sie das Vokabular und die Grammatikregeln auswählen, die am ehesten für eine Kommunikation in Krisensituationen benötigt werden würden.

Die Vorteile des RBMT-Systems

Die Entwickler des Systems verwendeten RBMT, "rule-based machine translation". Das heißt, dass die sprachwissenschaftlichen Informationen (Semantik, Morphologie und Syntaktik) über Ausgangs- und Zielsprache hauptsächlich von Wörterbüchern und Grammatiken stammt. Besonders in humanitären Kontexten müsse bei der Wahl der entsprechenden Technologie der tatsächliche Bedarf berücksichtigt werden. Es sei egal, welche Technik sonst die neuste auf dem Markt sei, so Technikchef von TWB, Mirko Plitt, laut translatorswithoutborders.org.

RBMT-Systeme haben gegenüber der statistischen Maschinenübersetzung ("statistical machine translation", SMT) oder der neuronalen  Maschinenübersetzung ("neural machine translation", NMT, beispielsweise verwendet im Google-Übersetzer) den Vorteil, dass man weniger Hardware dafür benötigt. Deshalb können RBMT-Systeme auch auf einfachen Smartphones und ohne Internetverbindung funktionieren – was in Krisensituationen von wesentlicher Bedeutung ist. TWBs Kurdischübersetzer läuft über eine kostenlose App.

Hilfe für andere Sprachgemeinschaften

Das Projekt soll auch anderen Sprachgemeinschaften bei der Entwicklung eigener Sprachtechnologien als Ausgangspunkt dienen. Diese müssten sich dann nicht ausschließlich von den großen Technologiefirmen abhängig machen, so Plitt.
Die Kocarek GmbH freut sich TWB als Silver Sponsor bei den unterschiedlichen Hilfsprojekten zu unterstützen.

 

Kocarek GmbH | Kronprinzenstraße 5-7 | 45128 Essen | Tel.: +49 201 24 69 90-0 | Fax: +49 201 24 69 90-10 | info@kocarek-gmbh.com