Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego
This presentation is the property of its rightful owner.
Sponsored Links
1 / 28

Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego PowerPoint PPT Presentation


  • 100 Views
  • Uploaded on
  • Presentation posted in: General

Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego. Zbigniew Piotrowicz Moravia IT [email protected] Drodzy przyjaciele z konferencji

Download Presentation

Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


T umacze i firmy lokalizacyjne w obliczu t umaczenia maszynowego

Tłumacze i firmy lokalizacyjne w obliczu tłumaczenia maszynowego

Zbigniew Piotrowicz

Moravia IT

[email protected]


Notka pokonferencyjna

Drodzy przyjaciele z konferencji

Przekazuję Wam moją prezentację. Pod slajdami znajdują się komentarze; niektóre były już wcześniej, a niektóre dodałem specjalnie dla Was, aby ułatwić odczytanie i interpretację niektórych slajdów.

Część danych w prezentacji to informacje ogólnodostępne, ale prosiłbym o zachowanie niektórych slajdów (oceny MT w Microsofcie oraz wyniki analityczne zastosowalności MT w Moravii) do własnych potrzeb i niepublikowanie ich dalej. Dziękuję za zrozumienie.

Zbigniew Piotrowicz

Notka pokonferencyjna


Program

Program

Czym jest tłumaczenie maszynowe (MT)

Historia MT

Idea, zasady, problemy

Zastosowanie w praktyce

Przykłady

MT a tłumacz (post-editing)

Ocena MT

Podsumowanie


Czym jest t umaczenie maszynowe

1. Proces komputerowego tłumaczenia z języka źródłowego na język docelowy z użyciem aplikacji translacyjnych

2. Tłumaczenie będące wynikiem działania takich aplikacji

Metody:

Tłumaczenie bezpośrednie (zamiana słów i wyrażeń)

Analiza składni

Powierzchniowy transfer semantyczny (analiza składni + atrybuty dodatkowe, np. znaczeniowe, dnt)

Tłumaczenie statystyczne

Tłumaczenie oparte na przykładach

Metody hybrydowe

Czym jest tłumaczenie maszynowe


Historia mt

Wiek XVII – początki koncepcji interlingua, trudno mówić o MT ze względu na brak M

Praca Johna Wilkinsa

„An Essay towards Real Character and a Philosophical Language”

Historia MT


Historia mt1

Historia MT

  • Georges B. Artsrouni, Francja,

  • rok 1932 (patent w 1933)

  • Maszyna do zapisywania i wyszukiwaniainformacji; jedna z możliwości obejmowałazapisanie słownika oraz rozbudowaniego o frazy; tłumaczenie na 4 języki

Piotr Trojański, ZSRR,

(patent w 1933)

Prace teoretyczne nad maszyną z pamięcią na szerokiej taśmie perforowanej; tekst źródłowy przed tłumaczeniem opisywany był symbolami opisującymi charakter gramatyczny poszczególnych słów oraz określeniami w esperanto


Historia mt2

1954 – system IBM i Uniwersystetu Georgtown (połączenie słownika z regułami gramatycznymi dotyczącymi kolejności wyrazów w zdaniu)

1964 – raport ALPAC o braku perspektyw MT (wolniejsze, gorsze i dwa razy bardziej kosztowne tłumaczenie MT od tradycyjnego)

1968 – SYSTRAN i zimna wojna

Lata 70-80 – kolejne systemy bazujące na regułach

Koniec lat 80 – pierwsze systemy statystyczne i bazujące na przykładach (IBM Candide)

Lata 90-do dziś… (MS – początek prac NLP w 1991 roku; 1999 początek prac nad MT; 2003 Translator 1, oparty na przykładach; 2009 MT->PL)

Historia MT


Idea i zasady

MT jako narzędzie do tłumaczenia tekstów, które nigdy nie byłyby standardowo tłumaczone ze względu na koszty

MT jako narzędzie przyspieszające pracę tłumacza

MT jako narzędzie obniżające koszty

MT ma nie zmniejszyć rynku tłumaczeń,a wręcz przeciwnie

Celem użycia MT jest uzyskanie jakości komunikatywnej

PRAWDA CZY FAŁSZ?

Idea i zasady


Idea zasady problemy

Idea, zasady, problemy

FAMT & HAMT

Preedycja i postedycja

Zastosowalność (dokumentacja techniczna, literatura, marketing...)

Oczekiwania jakościowe (komunikatywność vs jakość premium)

Akceptacja wśród tłumaczy


Idea zasady problemy1

Homografy/polisemy (wyrazy pisane identycznie, ale o innym znaczeniu) np. pokój (pomieszczenie albo brak wojny); light (rzeczownik, czasownik, przymiotnik, przysłówek)

Niejednoznaczności w obrębie języka i między językami: „Kill that man with the hammer”; Bear – miś (pluszowy) czy niedźwiedź

Złożona struktura zdań

Odmiana (końcówki, rodzaj męski/żeński)

Język nieformalny, potoczny, neologizmy, figury retoryczne, idiomy

(it's raining cats and dogs=Pada deszcz psów i kotów)

Błędy (literówki, interpunkcja)

Tagi, znaki specjalne

Idea, zasady, problemy

C3PO zna 6 milionów form porozumiewania się,

tylko Chuck Norris zna wszystkie...


Zastosowanie w praktyce

Zastosowanie w praktyce

Tłumaczenia prywatne (często darmowe, ogólne zrozumienie tekstu, Google Translator, Microsoft Translator, Bable Fish, translatory w formie aplikacji)

Tłumaczenia komercyjne, np. Chrysler obniżył koszty o 35% i zwiększył wydajność tłumaczeń dokumentacji (model HAMT); Microsoft Support (model FAMT; osobne slajdy)

Tłumaczenia wewnętrzne (np. wojsko, korporacje)

Ukierunkowanie: szeroko pojęte tłumaczenia techniczne (IT, motoryzacja, elektronika...)


Przyk ad hamt w ms office14 ui

Przykład HAMT w MS Office14 UI

Pamięć

tłumaczeń

Silnik

SMT

Fuzzy

>75%

<75%

Bucket 13+

<75%

Bucket 1-12

Jednostki

100%

Tłumacz

(żywy)

Tłumaczenie

Źródło


Model z pracy z tm

Model z pracy z TM

Pamięć

HT

Pamięć

MT

Pamięć

HT + MT

Opcja 1

Tłumacz

Tłumaczenie

Źródło

Opcja 2

Opcja 3 = brak pamięci MT, tłumaczenia w formie pretranslacji bezpośrednio w pliku


Famt ocena resolve rate

FAMT - ocena „resolve rate”

(źródło: Chris Wendt, Microsoft corp.)


Global english

„Global English”

1. Standardowy styl 2. Prawidłowa interpunkcja 3. Eliminacja długich zdań4. Poprawne użycie wielkich liter 5. Poprawna pisownia

(źródło: Chris Wendt, Microsoft corp.)


Wp yw na prac t umacza

Wpływ na pracę tłumacza

Produktywność tłumaczy

dzięki MT

Po specjalnym szkoleniu

z MT post-editingu

(źródło: Chris Wendt, Microsoft corp.)


Mt a j zyk polski

MT a język polski

O14 Pilot

O14 FLK5


Przyk ad 1

Kto zgadnie, jak to zostało przetłumaczone?

Przykład 1 


Przyk ad d ugie zdania tekst og lny

The forces of the Teutonic Knights were decisively defeated in the battle, but were able to defend their castles and retain most of their territories despite the long-term consequences they suffered as a result of losing the battle. The order never recovered its former power, and the financial burden of the ensuing reparations eventually caused a rebellion of cities and landed gentry.

Przykład (długie zdania, tekst ogólny)

Spuśćmy zasłonę milczenia... (English Translator 3.0)

Siły Krzyżaków były zdecydowanie pokonane w bitwie, ale mogły obronić ich zamki i zachować najbardziej z ich terenów pomimo długoterminowych konsekwencji, z powodu których cierpieli w efekcie z przegrywania bitwy. Porządek nigdy nie odzyskał swojej dawnej mocy, i obciążenie finansowe wywiązujących się zadośćuczynień ostatecznie spowodowało bunt miast i ziemiaństwa. (translatica.pl)

Siły krzyżackie były zdecydowanie pokonany w walce, ale były zdolne do obrony swych zamków i zachować większość ich terytorium, mimo długoterminowe konsekwencje ponieśli w wyniku utraty bitwy. Aby nigdy nie odzyskał dawnej potęgi, a obciążenia finansowe wynikające z odszkodowań wynikających ostatecznie spowodowało bunt miast i ziemiańskiej. (Google Translator)

Siły Teutonic Rycerzy zdecydowanego zostali pokonani w bitwie pod, ale byli w stanie bronić swoich zamków i zachowuje większość z ich terytoriów, pomimo długoterminowe skutki one poniesione w wyniku zastosowania utraty bitwy. Kolejność nigdy nie odzyskać swojego byłego energią i obciążeń finansowych z tym reparations ostatecznie spowodował powstanie miast i wyładowanych gentry. (Microsoft Translator)


Przyk ady it

Przykłady (IT)

If you still cannot see the Tree view, it might be because another window pane is in the way. Resize the visible window pane from the left to reveal the Tree view.

The Tree View button in the toolbar and in the View menu appears depressed, indicating the Tree view is active.

To hide the Tree View, select View>Tree View again.

Click the + or - symbols next to the folders in the Tree View to expand or collapse the tree.

Jeśli nadal nie widać widoku drzewa, może to być spowodowaneinnym okienku jest w drodze. Resize widoczne okienku z lewej strony, aby odsłonić widok drzewa.Przycisk Widok drzewa na pasku narzędzi w menu Widokpojawia się w depresji, wskazując Widok drzewa jest aktywny.Aby ukryć widoku drzewa wybierz Widok> Widok drzewa ponownie.Kliknij przycisk + lub - symbole obok folderów w widoku drzewa, aby rozwinąć lub zwinąć drzewa.

MT


Przyk ad tekst marketingowy

Przykład (tekst marketingowy)

Out with the old, in with the new.

Sound processesand smart technologyare at the heart of anytruly efficient localization effort.

HT

MT

Się ze starym, z nowym.

Sound procesówi inteligentnych technologii w sercu każdego naprawdę skuteczne wysiłki lokalizacji.

Żegnamy się z przeszłością, witamy przyszłość.

Niezawodne procesyi inteligentne technologie stanowią istotę w pełni efektywnych prac lokalizacyjnych.


Kr tkie proste zdania it

It contains the following sections:

Select Actions>Update...

Use the Replace command to find and replace specific items in the translation project.

Put the pointer on a column division.

The Modes preference tab displays the following options:

Krótkie, proste zdania IT

  • To zawiera poszły za _brak_tłum_:

  • Wybrane Operacje > _brak_tłum_...

  • Użyj Zastąp _brak_tłum_, by znaleźć i zastąpić sprecyzowanych _brak_tłum_ w _brak_tłum_ rzucie.

  • Położył _brak_tłum_ na rozdzielaniu _brak_tłum_. : (English Translator 3.0; kontekst=IT)

  • Tryby preferencja naszywka okazuje następujące opcje: (Translatica.pl)

  • Zawiera on następujące działy:

  • Działań Wybierz> Update ...

  • Użyj polecenia Replace, aby znaleźć i zastąpić poszczególne pozycje w projekcie tłumaczenia.

  • Umieść wskaźnik w sprawie podziału kolumny.

  • Kartę preferencji tryby są wyświetlane następujące opcje: (Google Translator)

  • Zawiera on następujące sekcje:

  • Wybierz polecenie Operacje > Aktualizuj...

  • Polecenie Zamień służy do znajdowania i zamieniania konkretne elementy w projekcie tłumaczenia.

  • Umieść wskaźnik myszy na podział kolumny.

  • Na karcie Preferencje tryby są wyświetlane następujące opcje: (Microsoft Translator)


Mt a t umacz post editing

MT a tłumacz (post-editing)

  • W dłuższej perspektywie MT jest nieuniknione w większości branż

  • Nawet jeśli istnieją mocne argumenty przeciw MT z punktu widzenia języka, klienci i tak będą kierować się ceną, a MT obniża ich koszty pomimo dużych nakładów początkowych na technologię

  • MT jest wyborem klientów, a nie firm lokalizacyjnych i samych tłumaczy (przynajmniej na razie)

  • Jakość MT wzrasta wraz ze zwiększaniem się zasobów tłumaczeń – stanowi to istotny czynnik rozwojowy MT

Post-editing staje się nową formą usługi świadczoną przez tłumaczy


Zasady posteditingu mt

Przeczytać zdanie źródłowe

Zrozumieć ogólną treść zdania

„Rzucić okiem”

na jednostkę MT

Decyzja w maks. 2 sek. później

Edycja

Odrzucenie

Zasady posteditingu MT


Z ote zasady

Złote zasady

  • Czy bardziej pracochłonne jest tłumaczenie czy edycja MT?

  • Nawet jeśli zdanie nie jest idealne, użyj go jeśli jest zrozumiałe.

  • Terminologia powinna być poprawna, nie trać czasu na sprawdzanie jej za każdym razem.

  • Jeśli tłumaczenie zawiera dużo tagów, skopiuj źródło i poprzeklejaj fragmenty tekstu.

  • W przypadku dłuższych zdań – oceń 5 pierwszych słów, jeśli brzmią sensownie, oceń 5 ostatnich.

  • Jeśli zdanie jest poprawne, nie „walcz” z tłumaczeniem, aby było w Twoim stylu.

  • Nie staraj się zrozumieć dlaczego tłumaczenie MT jest jakie jest.


Oceny t umaczy

Oceny tłumaczy

  • Jednowyrazowe jednostki są w 90% OK - tu nie ma problemu.

  • Przy pierwszym pliku, gdy nie byłam obeznana jeszcze w terminologii Projecta, MT faktycznie mi pomagało, bo używana terminologia faktycznie pochodziła z Projecta.

  • W krótkich tekstach bywa to pomocne, w długich trochę mniej, bo nie zna toto gramatyki i czasem śmieszne podpowiedzi podsuwa.

  • Z moich obserwacji wynika, że MT sprawdza się głównie w krótszych sformułowaniach.

  • Jak dla mnie, to Machine Translation przydaje się w krótszych, kilkuwyrazowych jednostkach.

  • Czasem jednostki są naprawdę świetnie przetłumaczone


Oceny t umaczy1

Oceny tłumaczy

  • To nie działa i nie będzie dobrze działać, bo do działania takich systemów jest niezbędna sztuczna inteligencja, której jak na razie nie udało się stworzyć.

  • Zwodnicze - w większości przypadków niektóre wyrazy są wyjątkowo dziwnie przetłumaczone i trudno się domyślić, dlaczego akurat tak, a nie inaczej.

  • Jednostki z czymś w środku (u mnie to były nawiasy klamrowe) - zupełny bełkot

  • Nie zna toto gramatyki i czasem śmieszne podpowiedzi podsuwa. Najgorsze, że daje złudne poczucie, że ma się sensowną podpowiedź, i może totalnie wprowadzić w błąd

  • W bardziej skomplikowanych przypadkach automat zwykle gubi się i nieraz powstaje zdanie bez sensu

  • Te tłumaczenia maszynowe to żadna pomoc - mnie one wręcz przeszkadzają 

  • Czuję się coraz bardziej jak pracownik Biedronki


Dzi kuj za uwag

Dziękuję za uwagę

Podsumowanie

  • Kontakt:

  • [email protected]


  • Login