1 / 41

5.2. Онтологии товаров и услуг

5.2. Онтологии товаров и услуг . Онтология . О нтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории . Основные компоненты: Классы или понятия Отношения Функции Аксиомы Примеры.

tuvya
Download Presentation

5.2. Онтологии товаров и услуг

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 5.2. Онтологии товаров и услуг

  2. Онтология • Онтология это система, состоящая из набора понятий и набора утверждений об этих понятиях, на основе которых можно строить классы, объекты, отношения, функции и теории. • Основные компоненты: • Классы или понятия • Отношения • Функции • Аксиомы • Примеры

  3. Таксономия публикаций • Publication • Article • Article in book • Conference paper • … • Book • Journal • IEEE expert

  4. Отношения в (КА) Employee Head-of-project Project Works-on-Project Project Affiliation Organization Head-of-group Research group

  5. Пример аксиомы • Работник, являющийся руководителем проекта, работает в проекте • Переменные Е, Р • Forall (E,P) Employee (E) and Head-Of-Project (E,P) => Works-At-Project (E,P)

  6. Лингвистические онтологии • -The main characteristic of this kind of ontologies is that they are bound to the semantics of grammatical units (words, nominal groups, etc) • Основной источник понятий в онтологии – значения языковых единиц • Лингвистические онтологии: WordNet, Mikrokosmos, Sensus, РуТез

  7. Задачи • Сбор информации о товарах • Представление информации о товаре • Классификация товаров – разделение по назначению • Поиск по товарам • Показ баннеров • Показ текстов (обзоров, новостей, форумов) по товарам

  8. Системы по товарамобщего назначения • Froogle (www.froogle.com) • Яндекс. Маркет • Ручное занесение товара • Ручная классификация • Тындекс (www.tyndex.ru) • Автоматизированный поиск новых прайс-листов • Автоматический разбор прайсов • Автоматическая рубрикация

  9. Рубрикаторы продукции • Общероссийский классификатор продукции (ОКП) • Таможенная номенклатура внешнеэкономической деятельности (ТНВЭД) • United Nations Standard Products and Services Code (UNSPSC)

  10. Фрагмент классификатора продукции ООН • 42203700 Medical imaging processing equipment and supplies  • 42203701 Medical x ray film daylight stampers or identification printers  • 42203702 Medical imaging wet darkroom or daylight processors  • 42203703 Medical x ray passthrough boxes  • 42203704 Medical toners or developers  • 42203705 Medical imaging dry laser printers or imagers

  11. Рубрикаторы. Особенности • Иерархическая структура (древоподобная) • Могут достигать значительной величины (20000 тысяч рубрик) • При делении по разным основаниям могут быть близкие по смыслу рубрики-листья • Невозможно автоматическая классификация на основе только формулировок рубрик – необходимо каждую рубрику снабдить списком выражений

  12. Рубрикаторы интернет-систем по товарам • Простые формулировки • 10-15 рубрик на каждом уровне • Величина небольшая • И сложные классификаторы, и экранные рубрикаторы – виды онтологий

  13. Автоматическая рубрикация по товарам (Tyndex) • Рубрикатор: набор категорий без иерархии • К каждой категории приписан список слов и последовательностей слов • Рубрика проставляется товару, если в начале строчки встречается элементы списка • Накопленные списки «типов товаров» можно дополнительно использовать для контекстной рекламы

  14. Назначение рубрик • Запрос слишком общий – уточнение запроса (Щипцы) • Запрос неоднозначный – выбор значения (масло, стремянка) • Возможность избавиться от побочных рубрик (велосипед – рубрика «Игрушки»)

  15. Фрагмент описания рубрики «Автозапчасти» • Стремянка ГАЗ • стремянка зад • Стремянка задней рессоры • Стремянка задняя • Стремянка КАМАЗ • Стремянка МАЗ • Стремянка передняя • Стремянка пер.рес • Стремянка рессоры • стремянка УАЗ

  16. Фрагмент описания рубрики «Бытовые товары» • Стремянка БЕТТИ • Стремянка бытовая • Стремянка высотой • Стремянка оцинк • Стремянка стальная • Стремянки "Elkop • Стремянка 3-х ступ • Стремянка 5 ступ • Стремянка 6-ти ступ • Стремянка 8 ступ • Стремянка 8 ступеней • Стремянка 9 ступеней • Стремянка 10 ступеней • Стремянка 11 ступ • Стремянка 12 ступ

  17. Рубрикация на специализированном интернет-сайте • www.price.ru - цены на компьютеры, hi-tech, офисное оборудование • Сложный рубрикатор • Сложное описание товара • Поступление списков товаров. Много повторов. Товары с небольшими изменениями • Автоматизированная рубрикация

  18. OntoSeek - Content-Based Access to the Web Guarino N. Проект – 1996г. Статья – 1999г.

  19. Поиск товаров «по смыслу» -использование таксономии • Обработка синонимов: • Запрос: Automobile • Описание услуги: Car repair • Обработка видов и конкретных марок • Запрос:Automobile • Описание услуги : Jeep repair

  20. Поиск товаров «по смыслу» - семантический разбор запроса • Запрос: automobile retail • Описание услуги: • automobile radio and stereo retail store • Car repair and retail shop • Представление товара (услуги) как набор атрибут – значение_атрибута

  21. Проблемы Ontoseek • Нужна большая лингвистическая онтология товаров с подробными списками текстовых вариантов. Вместе это предполагается использовать лингвистическую онтологию общего назначения WordNet. • Такая онтология должна включать не только типы товаров, но и конкретные марки товаров • Каждому понятию онтологии должна быть приписана совокупность языковых выражений – в реальных прайсах много сокращений • Каждое понятие должно иметь внутреннюю структуру – набор (атрибут – значение атрибута)

  22. Проблемы Ontoseek-2 • Каждый товар в прайсах – нужно представить в формализованном виде • Многозначность слов в описаниях товаров и в запросах

  23. Вопросы к лекции • Что такое рубрикатор? • Использование рубрикаторов в интернет-системах по товарам и услугам • Система Ontoseek: какие проблемы пословного поиска и какими средствами предполагалось решать?

More Related