Maschinelle Übersetzung

Maschinelle Übersetzung, die manchmal auf durch Abkürzungs-MT verwiesen ist (um mit der computerunterstützten Übersetzung, maschinengeholfene menschliche Übersetzung MAHT und interaktive Übersetzung nicht verwirrt zu sein), ist ein Teilfeld der linguistischen Datenverarbeitung, die den Gebrauch der Software untersucht, um Text oder Rede von einer natürlicher Sprache bis einen anderen zu übersetzen.

Auf einem grundlegenden Niveau führt MT einfachen Ersatz von Wörtern in einer natürlicher Sprache für Wörter in einem anderen durch, aber dass allein gewöhnlich keine gute Übersetzung eines Textes erzeugen kann, weil die Anerkennung von ganzen Ausdrücken und ihren nächsten Kollegen auf der Zielsprache erforderlich ist. Das Beheben dieses Problems mit dem Korpus und den statistischen Techniken ist ein schnell wachsendes Feld, das zu besseren Übersetzungen führt, Unterschiede in der Sprachtypologie, Übersetzung von Idiomen und der Isolierung von Anomalien behandelnd.

Aktuelle Software der maschinellen Übersetzung berücksichtigt häufig Anpassung durch das Gebiet oder den Beruf (wie Wetterberichte), Produktion durch das Begrenzen des Spielraums von zulässigen Ersetzungen verbessernd. Diese Technik ist in Gebieten besonders wirksam, wo formelle oder formulaic Sprache verwendet wird. Hieraus folgt dass die maschinelle Übersetzung von gesetzlichen und Regierungsdokumenten mehr sogleich verwendbare Produktion erzeugt als Gespräch oder weniger standardisierter Text.

Verbesserte Produktionsqualität kann auch durch das menschliche Eingreifen erreicht werden: Zum Beispiel sind einige Systeme im Stande, genauer zu übersetzen, wenn sich der Benutzer eindeutig identifiziert hat, welche Wörter im Text Namen sind. Mit dem Beistand von diesen Techniken hat sich MT nützlich erwiesen, weil ein Werkzeug, um menschlichen Übersetzern und, in sehr begrenzter Zahl von Fällen zu helfen, sogar Produktion erzeugen kann, die verwendet werden kann, wie (z.B, Wetterberichte) ist.

Der Fortschritt und das Potenzial der maschinellen Übersetzung sind viel durch seine Geschichte diskutiert worden. Seit den 1950er Jahren haben mehrere Gelehrte die Möglichkeit infrage gestellt, vollautomatische maschinelle Übersetzung der hohen Qualität zu erreichen. Einige Kritiker behaupten, dass es im Prinzip Hindernisse für das Automatisieren des Übersetzungsprozesses gibt.

Geschichte

Die Idee von der maschinellen Übersetzung kann zurück zum 17. Jahrhundert verfolgt werden. 1629 hat René Descartes eine universale Sprache mit gleichwertigen Ideen in verschiedenen Zungen vorgeschlagen, die ein Symbol teilen. In den 1950er Jahren ist Das Georgetown Experiment (1954) mit vollautomatischer Übersetzung von mehr als sechzig russischen Sätzen ins Englisch verbunden gewesen. Das Experiment war ein großer Erfolg und hat in einem Zeitalter der wesentlichen Finanzierung für die Forschung der maschinellen Übersetzung hineingeführt. Die Autoren haben behauptet, dass innerhalb von drei bis fünf Jahren maschinelle Übersetzung ein behobenes Problem sein würde.

Echter Fortschritt war viel langsamer, jedoch und nach dem ALPAC Bericht (1966), der gefunden hat, dass die zehn Jahre lange Forschung gescheitert hatte, Erwartungen zu erfüllen, wurde Finanzierung außerordentlich reduziert. Als man gegen Ende der 1980er Jahre begonnen hat, weil rechenbetonte Macht zugenommen hat und weniger teuer geworden ist, wurde mehr Interesse in statistischen Modellen für die maschinelle Übersetzung gezeigt.

Die Idee, Digitalcomputer für die Übersetzung von natürlichen Sprachen zu verwenden, wurde schon in 1946 von A. D. Booth und vielleicht anderen vorgeschlagen. Warren Weaver hat einen wichtigen Vermerk "Übersetzung" 1949 geschrieben. Das Georgetown Experiment war keineswegs die erste derartige Anwendung, und eine Demonstration wurde 1954 auf der APEXC Maschine in der Birkbeck Universität (Universität Londons) einer rudimentären Übersetzung von Englisch ins Französisch gemacht. Mehrere Papiere auf dem Thema wurden zurzeit, und sogar Artikel in populären Zeitschriften veröffentlicht (sieh zum Beispiel Radiowelt, September 1955, Kleben Sie und Zacharov). Eine ähnliche Anwendung, hat auch in der Birkbeck Universität zurzeit den Weg gebahnt, las und setzte Braille-Texte durch den Computer zusammen.

Übersetzungsprozess

Der menschliche Übersetzungsprozess kann als beschrieben werden:

  1. Die Entzifferung der Bedeutung des Quelltexts; und
  2. Die Wiederverschlüsselung dieser Bedeutung auf der Zielsprache.

Hinter diesem scheinbar einfachen Verfahren liegt eine komplizierte kognitive Operation. Um die Bedeutung des Quelltexts vollständig zu decodieren, muss der Übersetzer interpretieren und alle Eigenschaften des Textes, ein Prozess analysieren, der eingehende Kenntnisse der Grammatik, Semantik, Syntax, Idiome, usw., der Quellsprache, sowie der Kultur seiner Sprecher verlangt. Der Übersetzer braucht dieselben eingehenden Kenntnisse, um die Bedeutung auf der Zielsprache wiederzuverschlüsseln.

Darin liegt die Herausforderung in der maschinellen Übersetzung: Wie man einen Computer programmiert, der einen Text "verstehen" wird, wie eine Person tut, und das einen neuen Text auf der Zielsprache "schaffen" wird, die "klingt", als ob es von einer Person geschrieben worden ist.

Diesem Problem kann auf mehrere Weisen genähert werden.

Annäherungen

Maschinelle Übersetzung kann eine auf Sprachregeln gestützte Methode verwenden, was bedeutet, dass Wörter auf eine Sprachweise - das passendste übersetzt werden (mündlich sprechend), werden Wörter der Zielsprache diejenigen auf der Quellsprache ersetzen.

Es wird häufig behauptet, dass der Erfolg der maschinellen Übersetzung verlangt, dass das Problem der natürlichen Sprache, die versteht zuerst gelöst wird.

Allgemein analysieren regelbasierende Methoden einen Text grammatisch, gewöhnlich eine intermediäre, symbolische Darstellung schaffend, von der der Text auf der Zielsprache erzeugt wird. Gemäß der Natur der intermediären Darstellung wird eine Annäherung als zwischensprachliche maschinelle Übersetzung oder Übertragungsbasierte maschinelle Übersetzung beschrieben. Diese Methoden verlangen umfassende Lexika mit der morphologischen, syntaktischen und semantischen Information und große Regelwerke.

In Anbetracht genug Daten arbeiten Programme der maschinellen Übersetzung häufig ganz gut für einen Muttersprachler einer Sprache, um die ungefähre Bedeutung dessen zu bekommen, was vom anderen Muttersprachler geschrieben wird. Die Schwierigkeit veranlasst, dass genug Daten der richtigen Art die besondere Methode unterstützen. Zum Beispiel ist das große mehrsprachige Korpus von für statistische Methoden erforderlichen Daten zu arbeiten für die Grammatik-basierten Methoden nicht notwendig. Aber dann brauchen die Grammatik-Methoden einen Fachlinguisten, um die Grammatik sorgfältig zu entwerfen, die sie verwenden.

Um zwischen nah zusammenhängenden Sprachen zu übersetzen, kann eine als maschinelle Übersetzung der seichten Übertragung gekennzeichnete Technik verwendet werden.

Regelbasierend

Das regelbasierende Paradigma der maschinellen Übersetzung schließt Übertragungsbasierte maschinelle Übersetzung, zwischensprachliche maschinelle Übersetzung und Wörterbuch-basierte Paradigmen der maschinellen Übersetzung ein.

Übertragungsbasierte maschinelle Übersetzung

Zwischensprachlicher

Zwischensprachliche maschinelle Übersetzung ist ein Beispiel von regelbasierenden Annäherungen der maschinellen Übersetzung. In dieser Annäherung wird die Quellsprache, d. h. der zu übersetzende Text, in eine zwischensprachliche d. h. source-/target-language-independent Darstellung umgestaltet. Die Zielsprache wird dann aus dem interlingua erzeugt.

Wörterbuch-basierter

Maschinelle Übersetzung kann eine auf Lexikoneinträgen gestützte Methode verwenden, was bedeutet, dass die Wörter übersetzt werden, wie sie durch ein Wörterbuch sind.

Statistisch

Statistische maschinelle Übersetzung versucht, Übersetzungen mit statistischen Methoden zu erzeugen, die auf der zweisprachigen Textkorpora, wie das kanadische Hansard-Korpus, die englisch-französische Aufzeichnung des kanadischen Parlaments und EUROPARL, die Aufzeichnung des Europäischen Parlaments gestützt sind. Wo solche Korpora verfügbar ist, eindrucksvolle Ergebnisse erreicht werden können, Texte einer ähnlichen Art übersetzend, aber solche Korpora ist noch sehr selten. Die erste statistische Software der maschinellen Übersetzung war CANDIDE von IBM. Google hat SYSTRAN seit mehreren Jahren verwendet, aber hat auf eine statistische Übersetzungsmethode im Oktober 2007 umgeschaltet. Kürzlich haben sie ihre Übersetzungsfähigkeiten verbessert, indem sie eingegeben

haben

etwa 200 Milliarden Wörter von Materialien der Vereinten Nationen, um ihr System zu erziehen. Die Genauigkeit der Übersetzung hat sich verbessert.

Beispiel-basiert

Annäherung der Beispiel-basierten maschinellen Übersetzung (EBMT) wurde von Makoto Nagao 1984 vorgeschlagen. Es wird häufig durch seinen Gebrauch eines zweisprachigen Korpus als seine Hauptkenntnisse-Basis an der Durchlaufzeit charakterisiert. Es ist im Wesentlichen eine Übersetzung analog und kann als eine Durchführung der Fall-basierten vernünftig urteilenden Annäherung des Maschinenlernens angesehen werden.

Hybrides MT

Hybride maschinelle Übersetzung (HMT) stärkt die Kräfte von statistischen und regelbasierenden Übersetzungsmethodiken. Mehrere MT-Gesellschaften (Asien Online, LinguaSys, Systran, PangeaMT, UPV) behaupten, eine hybride Annäherung mit beiden Regeln und Statistik zu haben. Die Annäherungen unterscheiden sich auf mehrere Weisen:

  • Regeln sind durch die Statistik in einer Prozession postgegangen: Übersetzungen werden mit durchgeführt Regeln haben Motor gestützt. Statistiken werden dann in einem Versuch verwendet, sich die Produktion vom Regel-Motor anzupassen zu/korrigieren.
  • Statistik hat durch Regeln geführt: Regeln werden verwendet, um Daten in einem Versuch zu vorbearbeiten, den statistischen Motor besser zu führen. Regeln werden auch verwendet, um die statistische Produktion zu postbearbeiten, um Funktionen wie Normalisierung durchzuführen. Diese Annäherung hat viel mehr Macht, Flexibilität und Kontrolle, wenn sie übersetzt.

Hauptprobleme

Begriffserklärung

Wortsinn-Begriffserklärung betrifft Entdeckung einer passenden Übersetzung, wenn ein Wort mehr als eine Bedeutung haben kann. Das Problem wurde zuerst in den 1950er Jahren durch die Yehoshua Bar-Hillel erhoben. Er hat darauf hingewiesen, dass ohne eine "universale Enzyklopädie" eine Maschine nie im Stande sein würde, zwischen den zwei Bedeutungen eines Wortes zu unterscheiden. Heute gibt es zahlreiche Annäherungen, die entworfen sind, um dieses Problem zu überwinden. Sie können in "seichte" Annäherungen ungefähr geteilt werden und nähern sich "tief".

Seichte Annäherungen nehmen keine Kenntnisse des Textes an. Sie wenden einfach statistische Methoden auf die Wörter an, die das zweideutige Wort umgeben. Tiefe Annäherungen wagen umfassende Kenntnisse des Wortes. Bis jetzt sind seichte Annäherungen erfolgreicher gewesen.

Der verstorbene Claude Piron, ein langfristiger Übersetzer für die Vereinten Nationen und die Weltgesundheitsorganisation, hat geschrieben, dass maschinelle Übersetzung, an seinem besten, den leichteren Teil eines Jobs eines Übersetzers automatisiert; der härtere und zeitraubendere Teil schließt gewöhnlich das Tun umfassender Forschung ein, um Zweideutigkeiten im Quelltext aufzulösen, den die grammatische und lexikalische Dringlichkeit der Zielsprache verlangt, um aufgelöst zu werden:

: Warum braucht ein Übersetzer einen ganzen Werktag, um fünf Seiten, und nicht eine Stunde oder zwei zu übersetzen?..... Ungefähr 90 % eines durchschnittlichen Textes entsprechen diesen einfachen Bedingungen. Aber leider gibt es die anderen 10 %. Es ist dieser Teil, der noch sechs Stunden der Arbeit verlangt. Es gibt Zweideutigkeiten, die man auflösen muss. Zum Beispiel hat der Autor des Quelltexts, ein australischer Arzt, das Beispiel einer Epidemie zitiert, die während des Zweiten Weltkriegs in einem "japanischen Kriegsgefangener-Lager" erklärt wurde. Sprach er über ein amerikanisches Lager mit japanischen Gefangenen oder ein japanisches Lager mit amerikanischen Gefangenen? Der englische hat zwei Sinne. Es ist deshalb notwendig, Forschung vielleicht in Höhe von einem Anruf nach Australien zu tun.

Die ideale tiefe Annäherung würde verlangen, dass die Übersetzungssoftware die ganze Forschung tut, die für diese Art der Begriffserklärung selbstständig notwendig ist; aber das würde einen höheren Grad von AI verlangen, als es noch erreicht worden ist. Eine seichte Annäherung, die einfach auf den Sinn des zweideutigen englischen Ausdrucks geschätzt hat, dass Piron erwähnt (gestützt, vielleicht, auf dem die Art des Kriegsgefangener-Lagers öfter in einem gegebenen Korpus erwähnt wird) würde eine angemessene Chance haben, falsch ziemlich häufig zu schätzen. Eine seichte Annäherung, die verbunden ist, "fragen den Benutzer nach jeder Zweideutigkeit", würde durch die Schätzung von Piron, nur ungefähr 25 % eines Jobs eines Berufsübersetzers automatisieren, die härteren 75 % noch verlassend, um von einem Menschen getan zu werden.

Genannte Entitäten

Verbunden mit der genannten Entitätsanerkennung in der Informationsförderung.

Anwendungen

Es gibt jetzt viele Softwareprogramme, um natürliche Sprache, mehrere von ihnen online zu übersetzen, wie:

  • Anusaaraka Eine freie offene maschinelle Quellübersetzung von Englisch ins Hindi hat auf der Grammatik von Panini und dem Gebrauch-Stand der Technik NLP Werkzeuge gestützt. Kann online verwendet und von http://anusaaraka.iiit.ac.in heruntergeladen werden
  • Apertium, eine freie und offene Quellplattform der maschinellen Übersetzung (gibt WinXLator dem Windows GUI)
  • AppTek, der ein hybrides MT-System 2009 veröffentlicht hat.
  • Arabische maschinelle Übersetzung im mehrsprachigen Fachwerk.
  • Asien Onlinehttp://www.asiaonline.net stellt einem kundenspezifischen Motor der maschinellen Übersetzung Gebäude der Fähigkeit zur Verfügung, die sie fordern, gibt nah-menschliche Qualität im Vergleich zur gestützten Qualität des "Hauptinhalts" von gratis online Motoren. Asien stellt online auch Werkzeuge zur Verfügung, um kundenspezifische Motoren der maschinellen Übersetzung mit ihrem Sprachstudio-Gefolge von Produkten zu editieren und zu schaffen.
  • Bing_Translator http://www.microsofttranslator.com/ gratis online Übersetzer von Microsoft.
  • Cunei http://www.cunei.org/ Eine Plattform der offenen Quelle für die datengesteuerte maschinelle Übersetzung laut der MIT-Lizenz veröffentlicht. Mit der Plattform unabhängiger javanischer Code sowohl mit einer Befehl-Linie als auch mit grafischer Schnittstelle.
  • DocTranslator Ein Webdienst, der den Google verwendet, Übersetzen API, um Bürodokumentendateien (Wort automatisch zu übersetzen und zurückzugeben, PowerPoint, PDF Hervorzuragen), während sie die Originalurkunde-Lay-Outs bewahren.
  • Englisch zu Pandschabi Translationhttp://h2p.learnpunjabi.org/eng2pun.aspx Web hat Englisch zum pandschabischen System der Maschinellen Übersetzung gestützt.
  • Google Übersetzen gratis online Übersetzer von Google.
  • Google Übersetzer-Werkzeug Ein Webdienst hat vorgehabt, Übersetzern zu erlauben, die Übersetzungen zu editieren, die Google automatisch Übersetzen, erzeugt. Mit dem Google Übersetzer-Werkzeug können Übersetzer ihre Arbeit organisieren und geteilte Übersetzungen, Wörterverzeichnisse und Übersetzungserinnerungen verwenden.
  • Hindi zur pandschabischen Maschinellen Übersetzung Systemhttp://h2p.learnpunjabi.org, stellt maschinelle Übersetzung mit einer direkten Annäherung zur Verfügung. Es übersetzt Hindi in Pandschabi. Es zeigt auch Schreiben-E-Mail auf der Hindi-Sprache und dem Senden von demselben in Pandschabi dem Empfänger.
  • Pandschabi zur Maschinellen Hindi-Übersetzung Systemhttp://www.jgmatrix.com, stellt maschinelle Übersetzung mit einer direkten Annäherung zur Verfügung. Es übersetzt Pandschabi ins Hindi. Es zeigt auch das Umwandeln jeder Website in Pandschabi ins Hindi im Fluge. Die pandschabische Website muss in Unicode sein.
  • IdiomaX, der Mächte Online-Übersetzungsdienste an idiomax.com
  • Lokalisierungswerkzeuge, solcher und Alchemy Catalyst und Multilizer.
  • iTranslate4 ist eine Plattform der MT-Ansammlung einschließlich einer API, die von den europäischen Haupt-MT-Versorgern wie SYSTRAN, PROMT, Linguatec, PWN.pl, MorphoLogic, SkyCode, Amebis, Sunda und andere unterstützt ist. Die Plattform erlaubt Übersetzung aus 46 Sprachen und ist für neue MT-Versorger offen.
  • Jibbigo verkauft http://www.Jibbigo.com eine bidirektionale, indirekte, Rede-zu-Rede-Übersetzung app für den App-Laden des Apfels und den Androide-Markt.
  • Kilgray memoQ Eine Übersetzungsumgebung hat für menschliche Übersetzer gesorgt. http://kilgray.com/products/memoq
  • LetsMT! http://www.letsmt.com hat die Wolkenbasierte Plattform für die Generation von kundenspezifischen MT-Motoren vom Benutzer Daten zur Verfügung gestellt. Angetrieben von Moses.
  • LinguaSys stellt http://www.linguasys.net hoch kundengerecht angefertigte hybride maschinelle Übersetzung zur Verfügung, die von jeder Sprache bis jede Sprache gehen kann.
  • Software von Lucy Übersetzt http://www.lucysoftware.com auf mehreren europäischen Sprachen.
  • Kostenlose Software von Moses A statistischer unter dem LGPL veröffentlichter Motor der maschinellen Übersetzung lizenziert für Windows und Linux.
  • NeuroTran ist ein Softwareübersetzer, der Bücher, Webseiten, Dokumente, E-Mails, Fax, Merkzettel, Handbücher, Berichte, Spreadsheets, Ähnlichkeit, Briefe und mehr zu und aus vielen Sprachen übersetzt. Für Windows und Macintosh.
  • Power Translator
  • PROMT, der Mächte Online-Übersetzungsdienste an Voila.fr und Orange.fr
  • SDL ETS und SDL Sprachweber der Macht FreeTranslation.com (Website)
  • SDL Passolo
  • SiShiTra - Ein hybrider Motor der maschinellen Übersetzung für die spanisch-katalanische Übersetzung.
  • SYSTRAN, der Mächte Yahoo! Babel Fisch
  • Ta mit Ihnen wird http://www.tauyou.com in kundengerecht angefertigten Lösungen der maschinellen Übersetzung auf jeder Sprache spezialisiert. Ihre webbasierte Benutzerschnittstelle macht es leicht für jeden Sprachdienst-Versorger, jede Kombination des Gebiets und Sprachpaares zu erzeugen, um die beste Qualität zu erreichen. Ihre Lösung arbeitet mit fast der menschlichen Qualität für ein großes Angebot an Sprachpaaren.
  • Tilde-Übersetzer http://translate.tilde.com Gratis online Übersetzer für die lettische Sprache. Stellt auch freien apps für den Androiden und das EIN/AUSGABE-STEUERSYSTEM zur Verfügung.
  • Toggletext verwendet ein Übertragungsbasiertes System (bekannt als Kataku), um zwischen Englisch und Indonesischer Sprache zu übersetzen.
  • Übersetzen Sie und Zurück http://trans121.com Ein gratis online Rückfahrwerkzeug der maschinellen Übersetzung, das ermöglicht, Genauigkeit durch die Zurückübersetzung zu überprüfen. Enthält virtuelle Tastaturen und menschliche Stimme. Passend für das Recht auf linke Sprachen, ebenso.
  • Yandex übersetzt http://translate.yandex.ru/ zwischen Englisch und Russisch und Ukrainisch.
  • WebTrance ist ein regelbasierendes interlingua MT-System mit dem statistischen Bestandteil. Es erlaubt Übersetzung zwischen Englisch, Bulgarisch, Deutsch, Französisch, Spanisch, Italienisch und Türkisch.
  • Worldlingo stellt maschinelle Übersetzung mit sowohl dem statistischen basierten TE'S als auch Regel gestützt TE'S zur Verfügung. Am erkennbarsten als der MT-Partner in Windows von Microsoft und Microsoft Mac Office.
  • Yahoo! Babel Fisch, der von SYSTRAN angetrieben ist

Mehrere Übersetzungssoftwareprogramme stehen z.B kostenlos zur Verfügung. ForeignDesk, das Mehrplattform-Okapi-Fachwerk, der GTS Website-Übersetzer und OmegaT +.

Während kein System den heiligen Gral der vollautomatischen hochwertigen maschinellen Übersetzung des uneingeschränkten Textes zur Verfügung stellt, erzeugen viele völlig automatisierte Systeme angemessene Produktion. Die Qualität der maschinellen Übersetzung wird wesentlich verbessert, wenn das Gebiet eingeschränkt und kontrolliert wird.

Trotz ihrer innewohnenden Beschränkungen werden MT-Programme um die Welt verwendet. Wahrscheinlich ist der größte Institutionsbenutzer die Europäische Kommission. Das MOLTO-Projekt, zum Beispiel, koordiniert von der Universität von Gothenburg, hat die Projektunterstützung von mehr als 2.375 Millionen Euro von der EU erhalten, um ein zuverlässiges Übersetzungswerkzeug zu schaffen, das eine Mehrheit der EU-Sprachen http://www.molto-project.eu / bedeckt

Google hat behauptet, dass viel versprechende Ergebnisse mit einem statistischen Eigentumsmotor der maschinellen Übersetzung erhalten wurden. Das statistische Übersetzungsmodul in den Sprachwerkzeugen von Google für Arabisch verwendet

Mit dem neuen Fokus auf dem Terrorismus haben die militärischen Quellen in den Vereinigten Staaten bedeutende Beträge des Geldes in der Technik der natürlichen Sprache investiert. In-Q-Tel (ein Risikokapital-Fonds, der größtenteils von der US-Nachrichtendienstgemeinschaft gefördert ist, um neue Technologien durch private Sektor-Unternehmer zu stimulieren), hat Gesellschaften wie Sprachweber heraufgebracht. Zurzeit interessiert sich die militärische Gemeinschaft für die Übersetzung und Verarbeitung von Sprachen wie Arabisch, Pashto und Dari. Die Information, die Technologiebüro in DARPA Bearbeitet, veranstaltet Programme wie GEZEITEN und Babyloner Übersetzer. US-Luftwaffe hat einen Vertrag von $ 1 Million zuerkannt, um eine Sprachübersetzungstechnologie zu entwickeln.

Der bemerkenswerte Anstieg des sozialen Netzwerkanschlusses im Web hat in den letzten Jahren noch eine andere Nische für die Anwendung der Software der maschinellen Übersetzung - in Dienstprogrammen wie Facebook oder sofortige Nachrichtenübermittlungskunden wie Skype, GoogleTalk, MSN Bote, usw. - das Erlauben von Benutzern geschaffen, die verschiedene Sprachen sprechen, um mit einander zu kommunizieren. Anwendungen der maschinellen Übersetzung sind auch für die meisten beweglichen Geräte, einschließlich Handys, Taschen-PCs, PDAs usw. veröffentlicht worden. Wegen ihrer Beweglichkeit sind solche Instrumente gekommen, um als bewegliche Übersetzungswerkzeuge benannt zu werden, die beweglichen Geschäftsnetzwerkanschluss zwischen Partnern ermöglichen, die verschiedene Sprachen sprechen, oder sowohl das fremdsprachige Lernen als auch Reisen ohne Begleitung zu fremden Ländern ohne das Bedürfnis nach der Vermittlung eines menschlichen Übersetzers erleichtern.

Einschätzung

Systeme der maschinellen Übersetzung und Produktion können entlang zahlreichen Dimensionen bewertet werden. Der beabsichtigte Gebrauch der Übersetzung, die Eigenschaften der MT-Software, die Natur des Übersetzungsprozesses, usw., betreffen alle, wie man MT-Systeme und ihre Produktion bewertet. Die FEMTI Taxonomie von Dimensionen, mit der verbundenen Einschätzungsmetrik, erscheint an http://www.issco.unige.ch:8080/cocoon/femti/st-home.html.

Es gibt verschiedene Mittel, für die Produktionsqualität von Systemen der maschinellen Übersetzung zu bewerten. Das älteste ist der Gebrauch von menschlichen Richtern, um eine Qualität einer Übersetzung zu bewerten. Wenn auch menschliche Einschätzung zeitraubend ist, ist es noch die zuverlässigste Weise, verschiedene Systeme wie regelbasierende und statistische Systeme zu vergleichen. Automatisierte Mittel der Einschätzung schließen BLEU, NIST und METEOR ein.

Das Verlassen exklusiv auf die nicht redigierte maschinelle Übersetzung ignoriert die Tatsache, dass die Kommunikation auf der menschlichen Sprache - eingebettet ist, und dass es eine Person nimmt, um den Zusammenhang des ursprünglichen Textes mit einem angemessenen Grad der Wahrscheinlichkeit umzufassen. Es ist sicher wahr, dass sogar rein von den Menschen erzeugte Übersetzungen für den Fehler anfällig sind. Deshalb, um sicherzustellen, dass eine maschinenerzeugte Übersetzung für einen Menschen nützlich sein wird, und dass Publishable-Qualitätsübersetzung erreicht wird, müssen solche Übersetzungen nachgeprüft und von einem Menschen editiert werden. Der verstorbene Claude Piron hat geschrieben, dass maschinelle Übersetzung, an seinem besten, den leichteren Teil eines Jobs eines Übersetzers automatisiert; der härtere und zeitraubendere Teil schließt gewöhnlich das Tun umfassender Forschung ein, um Zweideutigkeiten im Quelltext aufzulösen, den die grammatische und lexikalische Dringlichkeit der Zielsprache verlangt, um aufgelöst zu werden. Solche Forschung ist eine notwendige Einleitung zum notwendigen Vorredigieren, um Eingang für die solche Software der maschinellen Übersetzung zur Verfügung zu stellen, dass die Produktion nicht sinnlos sein wird.

In bestimmten Anwendungen, jedoch, z.B, auf einer kontrollierten Sprache geschriebenen Produktbeschreibungen, hat ein Wörterbuch-basiertes System der maschinellen Übersetzung befriedigende Übersetzungen erzeugt, die kein menschliches Eingreifen bis auf die Qualitätsinspektion verlangen.

Siehe auch

  • Vergleich von Anwendungen der maschinellen Übersetzung
  • Statistische maschinelle Übersetzung
  • Künstliche Intelligenz
  • Sprachmodell des geheimen Lagers
  • Linguistische Datenverarbeitung
  • Universale Netzwerkanschlusssprache
  • Computergestützte Übersetzung und Translation Memory
  • Das fremdsprachige Schreiben hilft
  • Kontrollierte natürliche Sprache
  • Das krause Zusammenbringen
  • Das Postredigieren
  • Geschichte der maschinellen Übersetzung
  • Menschliche Sprachtechnologie
  • Sprachbarriere
  • Liste von erscheinenden Technologien
  • Liste von Forschungslabors für die maschinelle Übersetzung
  • Pseudoübersetzung
  • Übersetzung
  • Translation Memory
  • Universaler Übersetzer
  • Phraselator
  • Bewegliche Übersetzung

Referenzen

  • Cohen, J.M. "Übersetzung", Enzyklopädie Amerikana, 1986, vol. 27, Seiten 12-15.
  • Claude Piron, Le défi des langues — Du gâchis au bon sens (Die Sprachherausforderung: Von der Verwirrung bis Gesunden Menschenverstand), Paris, L'Harmattan, 1994.

Links


Montana / Hauptmoment
Impressum & Datenschutz