1 / 12

RussNet как компьютерный тезаурус нового типа

RussNet как компьютерный тезаурус нового типа. И.В.Азарова Санкт - Петербургский государственный университет Филологический факультет Кафедра математической лингвистики. RussNet http://project.phil.pu.ru/RussNet/.

latona
Download Presentation

RussNet как компьютерный тезаурус нового типа

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. RussNet как компьютерный тезаурус нового типа И.В.Азарова Санкт-Петербургскийгосударственный университет Филологический факультет Кафедра математической лингвистики

  2. RussNethttp://project.phil.pu.ru/RussNet/

  3. WordNet (G.Miller, Ch.Fellbaum) – Психолексикология http://wordnet.princeton.edu/ • единица лексического пространства – «синсет»–синонимия «литералов» • критерии синонимии; • глоссы = родовидовые определения; • примеры употребления; • родовидовые отношения организуют синсеты в деревья • между родовым и видовым синсетом есть хотя бы один различительный признак; • доступны согипономы и видны их отличия; • возможно двойное подчинение синсетов; • «наследование» свойств в родовидовых деревьях • «лес» семантических деревьев существительных и глаголов

  4. Структура WordNet

  5. Структура WordNet

  6. EuroWordNet– Многоязычнаялексическаябазаhttp://www.illc.uva.nl/EuroWordNet/

  7. Структура EuroWordNet

  8. Relation type NEAR_SYNONYMY XPOS_NEAR_SYNONYM HAS_HYPERONYM HAS_HYPONYM HAS_XPOS_HYPERONYM HAS_HOLONYM HAS_HOLO_PART NEAR_ANTONYMY XPOS_NEAR_ANTONYMY CAUSESIS HAS_SUBEVENT IS_SUBEVENT_OF … EQ_SYNONYM EQ_HAS_HYPERONYM EQ_HAS_HYPONYM … Data types WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM WM<>WM … WM<>ILIR WM<>ILIR WM<>ILIR … Семантические отношения в EuroWordNet • Parts of speech • N<>N, V<>V • N<>N, V<>V • N>N, V>V • N>N, V>V • N>N, V>V • N>N • N>N • N<>N, V<>V • N<>N, V<>V • V>V, N>V… • N>N, V>V… • N>N, V>V … • … • N<>N, V<>V… • N>N, V>V … • N>N, V>V … • …

  9. RussNet (Кафедра математической лингвистики)http://project.phil.pu.ru/RussNet/ Унаследованные свойства wordnet-словарей • Значения четырех основных ЧР • Опора на корпус современных текстов (21 млн. с/у) • Нетерминологический характер лексикона • Устойчивые словосочетания • Объединение синсетов в «семантические деревья» отношением гипонимии или меронимии

  10. Структура RussNet Дополнительные свойства RussNet • синонимы в синсетах упорядочены по частоте встречаемости; есть доминанта синсета • расширен набор собственно семантических отношений • введен набор семантико-деривационных и семантико-грамматических отношений • добавлено описание валентностной структуры, включающее как семантические, так и поверхностно-грамматические атрибуты • прилагательные организованы в иерархические структуры на основе их сочетаемости с существительными • введены наборы «семантических деревьев»

  11. Структура RussNet Причины изменения методики построения словаря • специфика русского языка (флективный язык, развитая деривационная система) • отсутствие некоторых источников лексической информации • недостатки и недочеты стандартных методик, ставшие очевидными при практическом использовании wordnet-тезаурусов

  12. Рамки валентности в тезаурусе RussNet • обязательность/ факультативность валентности • активная / пассивная рамка валентностей • общая семантическая характеристика валентности • ролевая характеристика валентности • семантические ограничения на заполнение валентной позиции • грамматическая спецификация валентности

More Related