1 / 26

Klasyfikacja spójników polskich pod kątem automatycznego przetwarzania tekstów (tłumaczenia)

Klasyfikacja spójników polskich pod kątem automatycznego przetwarzania tekstów (tłumaczenia). Krzysztof Jassem Uniwersytet Adama Mickiewicza, Poznań jassem@amu.edu.pl. O czym będzie mowa?. Spójnik: jednostka leksykalna czy syntaktyczna? Próba ponownego zdefiniowania spójnika

kallima
Download Presentation

Klasyfikacja spójników polskich pod kątem automatycznego przetwarzania tekstów (tłumaczenia)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Klasyfikacja spójników polskich pod kątem automatycznego przetwarzania tekstów (tłumaczenia) Krzysztof Jassem Uniwersytet Adama Mickiewicza, Poznań jassem@amu.edu.pl

  2. O czym będzie mowa? • Spójnik: jednostka leksykalna czy syntaktyczna? • Próba ponownego zdefiniowania spójnika • Opis klas spójników przy pomocy wektora liczbowego • Przykłady klas spójników • „To ile jest tych spójników?” • Przykłady tłumaczeń wyrażeń spójnikowych w systemie TRANSLATICA IPI PAN 14 października 04

  3. Cele i środki • Cel praktyczny: • TRANSLATICA • Cele naukowe (lub powiedzmy: bardziej ogólne): • określenie własności składniowych spójników • uzyskanie współczesnej listy spójników i ich własności • Stan badań: Łojasiewicz, 1992 „Własności składniowe spójników polskich” • Narzędzia i zasoby: • korpus POLENGa • przeglądarki internetowe • Korpus IPI PAN i Poliqarp IPI PAN 14 października 04

  4. Definicja spójnika (1). Jednostka syntaktyczna • Spójnik jako jednostka syntaktyczna: • wyraz • jednostka kilkuwyrazowa (wobec tego że) • fraza leksykalna (wobec tego) • On został, wobec tego ja już nie musiałem. Wobec tego że on został, ja już nie musiałem. • Jestem bezradny wobec tego przykładu niekompetencji. • A co robimy z przecinkami wewnątrz spójników? • Jak traktować spójniki złożone – razem czy osobno?Odpowiedź: jednak osobno, bo: - takie są wymogi parsera - bo spójnikowi lewemu często odpowiada kilka spójników prawych (zarówno – jak, jak i, jak też, jak również) IPI PAN 14 października 04

  5. Jaką grupę wyrazów traktujemy jako jeden spójnik? Które z poniższych wyrażeń jest jednym spójnikiem?- ale gdyby- gdyby nawet- a i tak- a następnie Odpowiedź: Grupę wyrazów traktujemy jako jednostkę wyrazową, gdy w efekcie analizy syntaktycznej uzyskujemy „pożądany wynik”. Pożądany wynik weryfikowany jest poprawnym tłumaczeniem na język angielski. Nie grupujemy w jedną jednostkę grup występujących obok siebie spójników, które łączą różne komponenty zdania. Nie przyszedłem, ale gdybym wiedział, że ty będziesz, przyszedłbym. IPI PAN 14 października 04

  6. Definicja spójnika (2) – część mowy odmienna czy nieodmienna? Jednostka nieodmienna (Saloni) lub odmienna, gdy przyłącza cząstki aglutynacyjne:gdybynawet jeślibychoćby nawet • Czy zaimki nieokreślone (...kolwiek) traktować jako spójniki? • Można wyróżnić trzy typy występowania takich wyrazów: • w funkcji stricte zaimka, np. Możesz pojechać gdziekolwiek. • w funkcji zarazem spójnika prostego jak i zaimka. Nie lubimy obcokrajowców, skądkolwiek by nie pochodzili. Cokolwiek uczynisz, źle uczynisz. • w funkcji zarówno spójnika złożonego jak i zaimka. Ktokolwiek by mnie nie poprosił o pieniądze, to na pewno mu dam. Tłumaczenie automatyczne: Whoever asks me for money, I will surely give it to him. Odpowiedź: Jednak nie, bo to za trudne IPI PAN 14 października 04

  7. Definicja spójnika (3) – występuje samodzielnie? Wg Saloniego spójnik nie występuje samodzielnie w odróżnieniu np. od wykrzyknika. Przyjmujemy ten punkt widzenia. Jakie to ma znaczenie do tłumaczenia? Jeśli wypowiedź składa się wyłącznie z wyrazu homonimicznego, który w słowniku występuje jako spójnik i jako inna część mowy, to do tłumaczenia wybierana jest interpretacja „niespójnikowa”. Lecz  Treat (a nie Or) To  It (a nie Then) Ile razy  How many times (a nie Whenever) IPI PAN 14 października 04

  8. Definicja spójnika (4) – pełni funkcję łączącą Spójnik pełni funkcję łączącą w odróżnieniu od partykuło- przysłówka. Spójnik pełni funkcję łączącą w odróżnieniu od partykuło- przysłówka. • Jak spójniki łączą? • spójnik występuje przed drugą grupą (kot i pies) • spójnik występuje przed pierwszą grupą (Skoro przyszedłeś, zostań tu) • spójnik złożony występuje zarówno przed pierwszą, jak i przed drugą grupą (zarówno przed pierwszą, jak i przed drugą grupą) • spójnik może występować wewnątrz grupy (a konkretnie zdania). (Ja się zgodziłem, on jednakże odmówił).Jak odróżnić spójnik inkorporacyjny od przysłówka? - referencja do innego zdania (nawet w zdaniu pojedynczym) - przeniesienie na początek zdania nie zmienia znaczenia IPI PAN 14 października 04

  9. Definicja spójnika (5) – brak rządu? • Saloni: Spójnik nie ma rządu w odróżnieniu np. od przyimków • A jak potraktować wyraz jako? • Rozmawiasz ze mną jako pełnomocnikiem właściciela – spójnik • Przybyłem tutaj jako pełnomocnik właściciela - przyimek • Odpowiedź: taktujemy jako jako dwa oddzielne leksemy. • A co zrobić z taką konstrukcją: • Co się tyczy mnie, to nie mam zdania. • Odpowiedź: Traktujemy jako spójnik (złożony), bo nie pełni funkcji podrzędnej (patrz definicja (6)). • Co jeszcze spójnik może narzucać? • Odpowiedź: Czas (gdyby, choćby), stopień (im, tym)... IPI PAN 14 października 04

  10. Definicja spójnika (6) – spójnik nie zastępca Grochowski: Spójnik nie może zastępować innego składnika zdania – w przeciwieństwie do zaimka My przyjmujemy taką definicję: spójnik nie może być podrzędny w stosunku do innego elementu zdania. To eliminuje spójniko-zaimki nieokreślone (cokolwiek, itp.) Czegokolwiek byś nie uczynił, źle byś uczynił. Zależność zaimka od zanegowanej grupy czasownikowej IPI PAN 14 października 04

  11. Definicja spójnika (7) – problemy implementacji Deszcz padał przez tydzień, co spowodowało powódź. Wrócił szybko do domu, po czym położył się spać. W powyższych zdaniach rolę spójników pełnią odpowiednio: co, po czym W systemie TRANSLATICA wyrazy te nie są oznaczone jako spójniki. Dlaczego? Bo znacznie psuła się jakość tłumaczenia. Wrócił szybko do domu, po czym poznałem, że przyjęcie nie było udane. Jest to rzecz jasna uproszczenie, ale jak się nie ma, co się lubi... IPI PAN 14 października 04

  12. Definicja spójnika (podsumowanie) • Spójnik to wyraz, jednostka kilkuwyrazowa lub fraza leksykalna o wyszczególnionych własnościach syntaktycznych. • Spójnik jest nieodmienna częścią mowy lub odmienną w przypadku przyłączania cząstek aglutynacyjnych. • Spójnik samodzielnie nie tworzy pełnego wypowiedzenia. • Spójnik pełni funkcję łączącą między zdaniami lub grupami. • Spójnik nie ma rządu – w z wyjątkiem niektórych spójników złożonych. Może narzucać formę występujących po nich grup. • Spójnik nie może być komponentem podrzędnym wobec innych składników zdania. • Rozstrzygnięcie, czy pewne wyrazy lub ciągi należy uznać za spójniki zależy od algorytmu analizy syntaktycznej. IPI PAN 14 października 04

  13. Wektor składniowego opisu spójników Wektor składniowy – pięcioelementowy wektor cyfr. Jest to podejście wygodne w zastosowaniu w regułach, np.jeśli pewna reguła ma dotyczyć wszystkich spójników, które narzucają formę czasu przeszłego, to piszemy w niej:PS4 = 2 (czwarty element wektora ma wartość 2) Jeden spójnik może należeć do kilku klas (być opisanym przez kilka wektorów). Każda przynależność traktowana jest jako osobna jednostka klasyfikacji i podany jest dla niej odpowiednik angielski. (1) kiedy  when; (2) kiedy  when (1) ponieważ  because; (2)  since IPI PAN 14 października 04

  14. PS[1]: Podstawowy podział spójników 0 - spójniki szeregowe (i, lub) 1 - spójniki zdaniowe (ponieważ) 2 - spójniki grupowe (albo) 3 - spójniki wtrąceniowe (aczkolwiek – albeit) 4 - spójniki łączące zdanie z przysłówkiem (i to) 5 - spójniki końcowe (występują tylko przed ostatnią grupą zdania) (choćby tylko) 6 - spójniki końcowe (występują przed ostatnią grupą zdania lub zdaniem dopełnieniowym) (a co dopiero) 7 - spójniki złożone lewe – rzeczownikowe lub przymiotnikowe (co do) 8 - spójniki złożone prawe (jak i) 9 - spójniki złożone prawe szeregowe (albo też) IPI PAN 14 października 04

  15. PS[2]: Jakie grupy łączy spójnik? Rodzaje łączonych grup: - zdania - grupy czasownikowe niefinitywne (np. bezokoliczniki) - grupy rzeczownikowe - grupy przymiotnikowe i przysłówkowe 0 – tylko zdania 1 - łączy wszelkie rodzaje grup (a także) 2 - łączy grupy rzeczownikowe, przymiotnikowe, przysłówkowe (a – but) 3 - łączy grupy przymiotnikowe i przysłówkowe (lecz jednak) 4 - występuje przed dopełniaczem (co się tyczy) 5 - występuje przed mianownikiem (gdyby nie) 6 - występuje przed biernikiem (jeśli chodzi o) 7 – występuje przed st. równym; dotyczy lewych przymiotnik. (tak) 8 – występuje przed st. wyższym; dotyczy lewych przymiotnik.(im) IPI PAN 14 października 04

  16. PS[3] – Gdzie spójnik może wystąpić? 0 - dla spójników występujących między grupami 1 - spójnik zdaniowy występuje przed pierwszym lub drugim zdaniem (ponieważ) 2 - spójnik zdaniowy występuje tylko przed drugim zdaniem (bo) 3 - spójnik zdaniowy inkorporacyjny (bowiem) 4 - spójnik złożony lewy (zdaniowy lub grupowy) (zarówno) IPI PAN 14 października 04

  17. PS[4] - Czy spójnik narzuca jakieś formy zdania? 0 - nie 1 – za spójnikiem występuje czas przeszły (bezosobnik) lub bezokolicznik (chociażby) 2 - za spójnikiem czas przeszły (lub bezosobnik) (jakoby) 3 - bezokolicznik za spójnikiem (byle – in order to) 4 - spójnik wprowadza tryb przypuszczający (gdyby) 5 – narzuca czas przyszły (bo – or else; bo inaczej) 6 – występuje przed frazą rzeczownikową w mianowniku IPI PAN 14 października 04

  18. PS[5] – Trochę semantyki i składni 0 – brak nowych cech 1 –spójnik wprowadza zdanie „równorzędne” (a następnie) 2 – spójnik wprowadza zdanie „podrzędne” (gdyż) 3 – bezpośrednio po spójniku często występuje przecinek lub myślnik (co prawda) 4 – spójniki, po których wystąpienie czasu przyszłego tłumaczone jest na czas teraźniejszy (jeśli) 5 – spójniki z nadmiarową negacją (aż) 6 – po spójniku może pojawić się dwukropek (a mianowicie) IPI PAN 14 października 04

  19. Przykłady klas spójników (1) Wektor składniowy: 00000 Charakterystyka klasy: Spójniki szeregowe Przykład użycia: Na murawę wbiegli i Polacy i Anglicy, i sędzia. spójnik tłum. albo or ani or bądź or bądź or czy or i and lub or oraz and tudzieżas well as fraza tłum. bądź to or IPI PAN 14 października 04

  20. Przykłady klas spójników (2) Wektor składniowy: 10104 Charakterystyka klasy: Spójniki zdaniowe. Łączą zdania podrzędne. Występują przed pierwszym lub drugim zdaniem. Dla zdania występującego po spójniku czas przyszły powinien być tłumaczony na czas teraźniejszy. Przykład użycia: „A jak będzie słońce i pogoda, pójdziemy se razem do ogroda.” spój. tłum. dopóki as long as gdy when ilekroć whenever jeśli if jeżeli if kiedy when ledwie as soon as ledwo as soon as póki as long as zaledwie as soon as jedn. wielow. tłum.a gdy whena jeśliand ifa jeśli nawet even if a jeżeli ifa jeżeli nawet even ifkiedy zaś andwhen nawet gdy even when nawet jeśli even if nawet jeżeli even ifzwłaszcza kiedy particularly when fraza tłum.a jak wheno ile provided that IPI PAN 14 października 04

  21. Przykłady klas spójników (3) Wektor składniowy: 10122 Charakterystyka klasy: Spójniki odmienne, po których występuje forma czasu przeszłego (lub bezosobnik). Spójniki mogą występować zarówno przed pierwszym, jak i drugim zdaniem. Przykład użycia: Abyśmy mogli dojść do porozumienia, obniżyliśmy swoje wymagania. spójnik tłum. aby so that ażeby so that by so that coby so that iżby so that oby so that hopefully żeby so that Jednostka kilkuw. Tłum.choćby dlatego aby just so that choćby dlatego by just so that choćby dlatego żeby just so that dlatego aby so that dlatego by so that dlatego żeby so that oby tylkoso that onlytak aby so that IPI PAN 14 października 04

  22. Przykłady klas spójników (4) Wektor składniowy: 21000 Charakterystyka klasy: Spójnik łączy zarówno grupy, jak i zdania. Niezależnie czy spójnik łączy grupy, czy zdania – posiada ten sam odpowiednik w języku angielskim. Przykład użycia: Bohaterki bajek są mądre, a jednocześnie piękne. spój. tłum. acz although aczkolwiek although ale but aniżeli than lecz but niźli than niż than niżeli than tylko but względnie or jedn. wielow. tłum.a jednak and yet a jednakże and yeta jedynie and only a konkretniemore specificallya na dodatek in additionjak i as well as jak również as well as jak też as well as lecz i but also lecz również but also fraza tłum.a mimo tego in spite of thisa może or perhaps a może i or perhaps ale za to but inturni tak yetlecz za to but in turnmimo tego yet pomimo tego yet IPI PAN 14 października 04

  23. Przykłady klas spójników (5) Wektor składniowy: 21400 Charakterystyka klasy: Spójnik złożony lewy stosowany dla zdań lub grup. (Początek kodu "21" zapewnia możliwość łączenia wszelkiego typu grup). Przykład użycia: Jesteś po pierwsze głupi, a po drugie uparty. spój. tłum. prawy albo either alboor ani neitheraninor chociaż eventhough to0czy whether czy_teżor czy whether czyor tyleas muchcoastyleż as muchcoaswprawdzie admittedly alebut wprawdzie admittedly jednakbut zarówno both jakand j. kilkuw. tłum. prawy co najmnniej at least jeśli_nieif notnie tylko not only alebutalso nie tylko not onlyale_takżebutalso nie tylko not only leczbutalso po pierwsze firstly po_drugiesecondly frazy tłum. prawya to eithera_toorbądź to either bądźorjuż to either już_toorni to neither ninor IPI PAN 14 października 04

  24. Przykłady klas spójników (6) Wektor składniowy: 21400 Wektor składniowy: 80001 Charakterystyka klasy: Spójnik złożony prawy Przykład użycia: Lubię zarówno czytać, jak i pisać. spój. tłum. typ ale but ale dopóty so long dopóty póty so long dopóty dotąd so longdotąd gdy when gdykiedy when gdyjak as jak jednak but jednak jednakże but jednak lecz but lecz to then to j. kilkuw. tłum. typ albo i or alboalbo też or alboale but ale ale jednak but ale_jednak ale i but also ale_takżeale również but alsoale_takżeale także but also ale_także ale też but also ale_także bądź też or bądź frazy tłum. prawyale za to but ale_za_to jeśli nie if not jeśli_nie o tyle as o_tyle to i tak still to_i_tak IPI PAN 14 października 04

  25. Podsumowanie liczbowe 48 klas spójników 124 spójniki pojedyncze 220 jednostki spójników pojedynczych (spójnik + wektor składniowy) 325 spójników – jednostek kilkuwyrazowych 423 jednostki spójników kilkuwyrazowych (spójnik + wektor składniowy) 41 fraz spójnikowych 53 jednostki fraz (fraza + wektor) W sumie: 500 spójników 696 jednostek IPI PAN 14 października 04

  26. Tłumaczenie on-line WWW.TRANSLATICA.PL IPI PAN 14 października 04

More Related