Silnik automatycznego tłumaczenia Google

Google tłumaczenia maszynowego Silnik jest Program używany przez Translate Google maszynowego tłumaczenia usługi .

W 2007 roku silnik tłumaczenia maszynowego Google wprowadził innowacje w dziedzinie tłumaczenia maszynowego. System Systran , którego używał do tej pory, był przeznaczony dla komputerów osobistych i podlegał ich ograniczeniom: obsługiwał setki tysięcy słów i wyrażeń, z możliwymi tłumaczeniami, stosując reguły gramatyczne, które zostały do ​​niego zaszczepione.

Inną zauważalną różnicą jest to, że dzięki tłumaczeniu Google język angielski znajduje się teraz w sercu systemu. Ponieważ jego konkurenci, na przykład hiszpański jest bezpośrednio tłumaczony na francuski i odwrotnie, Google tłumaczy język źródłowy na angielski , a następnie ponownie tłumaczy z angielskiego na język docelowy. Jest to system, który ma podobieństwa z projektem tłumaczenia języków rozproszonych , z tą różnicą, że język pomostowy nie jest już językiem sztucznym opracowanym tak, aby przedstawiać jak najmniej dwuznaczności, ale prawdziwym językiem zawierającym nieścisłości.

Google, Systran i Promt

System Google , który działa z centrum serwera , jest w stanie żonglować miliardami słów i wyrażeń „pochodzących z jednojęzycznych tekstów w języku docelowym oraz z tekstów równoległych do tych dwóch języków”. Gramatyka jest opóźnione za najbliższymi odpowiednikami. Jeśli Google nie może znaleźć frazy w swojej bazie danych, pomija ją. Christian Boitet, dyrektor GETA (Study Group for Automatic Translation) w Grenoble, powiedział: „Każdy może zobaczyć, że GoogleTranslate zapewnia tłumaczenia, które są pozornie„ płynne ”, ale w co najmniej 30% niezrozumiałe lub fałszywe, a zwłaszcza tam, gdzie informacje zniknął. "

Zwiększenie liczby osobistych słowników spowalnia pracę, a liczba słów, które można wstawić, czasami nie jest nieograniczona.

Zasięg słownictwa

Ze względu na różnorodność słownictwa Google ma przewagę w przypadku przedmiotów średnio technicznych. Aby przetłumaczyć, na przykład, „Erbkrankheit” Promt i Systran podzielą to słowo na dwa elementy i dadzą „chorobę dziedziczną”, przeciwstawną „chorobie genetycznej”, dokładniejsze i bardziej profesjonalne od Google . Z drugiej strony, jeśli zaproponujemy „erbliche Belastung” (tara dziedziczna), żaden z tych trzech nie zna „Belastung” w tym sensie i będą oddawać to słowo w jego zwykłym znaczeniu: „opłata dziedziczna” dla Google i „erbliche opłata "za Promta i Systrana, którzy ignorują nawet przymiotnik. Jednak w przypadku tych dwóch ostatnich lekarz, który wprowadził to wyrażenie do słownika użytkownika, zawsze uzyska „wadę dziedziczną”, podczas gdy nie ma uprawnień do narzucenia tego tłumaczenia Google .

Google dochodzi nawet do tego, że nie tłumaczy tego, czego nie rozumie, nawet nie pozostawia tego w oryginalnym języku. Czy mamy: „  Wielu Żydów zarabiało teraz na życie, zapewniając zakwaterowanie i żywność masom chasydów, którzy odwiedzali Admor  ”, a tłumaczenie będzie brzmiało: „Wielu Żydów żyjących dzisiaj zapewnia zakwaterowanie i wyżywienie masom chasydów, którzy odwiedzili Admor „,”  made a  ”zostaje odłożone na bok, jakby nie istniało. Możemy to zweryfikować, składając to samo zdanie pozbawione tych dwóch słów: wynik jest taki sam.

Sprawa terminów technicznych

W przypadku tekstów technicznych zakres słownictwa dostępnego w Google zna swoje ograniczenia. Jeśli czytamy w artykule w Niemiecki na gatunki z pająków Brachypelma smithi  :

„  Oft richtet das Weibchen den Vorderkörper auf, um dem Männchen das Einhaken seiner Schienbeinhaken in ihre Beißklauen zu ermöglichen  ”, podaje Google : „Często suka atakuje Vorderkörper, dla samca Einhaken jest to haczyk. tłumaczy „Weibchen” przez „suka” i w obliczu nieznanych słów nie próbuje ich analizować tak, jak robi to Systran w obu przypadkach („Często samica wcześniej prostuje ciało, aby w szponach pojawiły się haki zwisające z jej nóg ugryźć samca ”) i Promt w jednym („ Samica często unosi przednią część ciała, aby móc zawiesić swoje haki piszczelowe w Beißklauen u samca ”).

Ewolucja Tłumacza Google

Trudno jest śledzić w książkach, nawet artykułach, nawet najnowszych, rzeczywistość tak zmienną, jak tłumaczenie maszynowe. Plik15 listopada 2014 Frédéric Kaplan napisał:

„Poproś Tłumacza Google o przetłumaczenie tego„  Ta dziewczyna jest ładna  ”na włoski, a otrzymasz dziwną propozycję:„  Questa ragazza è abbastanza  ”, dosłownie ta dziewczyna jest„  przeciętna  ”. Piękno zostało utracone w tłumaczeniu . Jak jeden z najwydajniejszych współczesnych tłumaczy automatycznych, dysponujący unikalnym na świecie kapitałem językowym, miliardami zdań, może popełnić tak poważny błąd? Odpowiedź jest prosta, kręci się po angielsku. Dość przekłada ładna i całkiem przez abbastanza . […] Kiedy zrozumiemy tę zasadę, łatwo będzie tworzyć niezwykle dziwne zdania w tłumaczeniu. Idiomatyczne wyrażenie Pada sznury przekształca się w bardzo poetyckie wyrażenie Piove cani i gatti . To bezpośrednie tłumaczenie Pada koty i psy jest absolutnie niezrozumiałe dla Włocha. "

Ale 1 st maja 2015pierwsze zdanie zostało lepiej oddane przez Questa ragazza è bella  ; jeśli chodzi o drugie, jest zredukowane do prostego Piove , oczywiście mniej precyzyjnego, ale dokładniejszego. Pomimo tych postępów korzystanie z Tłumacza Google pozostaje delikatne poza środowiskiem prywatnym, więc policja w Kopenhadze znalazła się w kłopotliwej sytuacji po przyznaniu się, że przesłuchała podejrzanego na podstawie „SMS-a nieprawidłowo przetłumaczonego przez Tłumacza Google.

Uwagi i odniesienia

  1. Barbara Cassin , dyrektor ds. Badań w CNRS , mimochodem mówi nam w Intraduisible et mondialisation, że „oferta wielojęzyczna, jak również oferta tłumaczeń, wszechobecna w Google, w rzeczywistości dotyczą jednego języka, l angielskiego, a dokładniej Globish . "
  2. Często zadawane pytania dotyczące Tłumacza Google
  3. Tłumaczenie maszynowe: działa czy nie?
  4. Jednakże od 18 marca 2010 tłumaczenie stało się poprawne
  5. „  Wielu Żydów zarabiało wtedy na życie, zapewniając zakwaterowanie i wyżywienie tłumom chasydzkim, którzy przybyli z wizytą do Admora  ”
  6. Od 13 lipca 2009 r. Tłumaczenie prawie się nie poprawiło.
  7. Samica często prostuje głowotułów, aby umożliwić samcowi zamocowanie haczyków piszczeli w swojej chelicerze
  8. Profesor humanistyki cyfrowej w Szwajcarskim Federalnym Instytucie Technologii w Lozannie
  9. Angielski jako język kręgosłupa lub ukryty imperializm językowy Tłumacza Google
  10. Arnaud Devillard, Kiedy policja walczy z terroryzmem za pomocą tłumaczeń Google Sciences i Avenir z 2 stycznia 2013 r.

Zobacz też

Powiązane artykuły