1 / 36

Скипор И.Л., канд. пед . наук, доцент кафедры ТАОИ Кемеровского государственного

Технологическая схема индексирования на базе информационно-поисковых языков к оординатного типа. Скипор И.Л., канд. пед . наук, доцент кафедры ТАОИ Кемеровского государственного университета культуры и искусств  (384-2) 35-80-63 e-mail: taoi@kemguki.ru www.taoi.kemguki.ru. План.

amara
Download Presentation

Скипор И.Л., канд. пед . наук, доцент кафедры ТАОИ Кемеровского государственного

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Технологическая схема индексирования на базе информационно-поисковых языков координатного типа • Скипор И.Л., канд. пед. наук, • доцент кафедры ТАОИ • Кемеровского государственного • университета культуры и искусств • (384-2)35-80-63 • e-mail: taoi@kemguki.ru • www.taoi.kemguki.ru

  2. План • Средства реализации технологии координатного индексирования • Состав и характеристика операций, выполняемых при координатном индексировании • Избыточное индексирование • Соотношение формализуемых и неформализуемых процедур при координатном индексировании

  3. Средства реализации технологии координатного индексирования 1. Информационно-поисковые языки: • информационно-поисковые тезаурусы (ИПТ); • дескрипторные словари; • словари ключевых слов 2. Стандарты: • ГОСТ 7.66-92 СИБИД. Индексирование документов. Общие требования к координатному индексированию • ГОСТ 7.0.47-2008 СИБИД. Формат для представления на машиночитаемых носителях словарей информационных языков и терминологических данных. Содержание записи • ГОСТ 7.24-2007 СИБИД. Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению • ГОСТ 7.25-2001 СИБИД. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления • ГОСТ 7.52-85 СИБИД. Коммуникативный формат для обмена библиографическими данными на магнитной ленте. Поисковый образ документа • ГОСТ ИСО 8601-2001 СИБИД. Представление дат и времени. Общие требования 3. Методики, инструкции, правила и т.п. координатного индексирования

  4. Этапы индексирования 1.1 Анализ содержания документа (запроса, факта) и формы документа как объекта индексирования I этап. Анализ содержания и формы индексируемого сообщения 1.2 Выбор понятий, характеризующих содержание документа (запроса, факта), форму документа 2.1 Выбор терминов индексирования для обозначения понятий II этап. Перевод результатов анализа с естественного языка на ИПЯ 2.2 Формирование поискового образа документа (запроса, факта) из терминов индексирования

  5. Элементы издания, подлежащие анализу при выделении ключевых слов, характеризующих основное смысловое содержание документа • справочный аппарат издания (титульный лист, предисловие/ • введение, послесловие/заключение, содержание/ • оглавление, аннотация, реферат и др.); • заголовки частей и глав; • первые фразы глав и параграфов; • иллюстрации, схемы, таблицы и подписи к ним; • слова и группы слов, выделенные в тексте специальными • полиграфическими средствами; • ключевые слова, присвоенные автором/ составителем • документа.

  6. Элементы электронного документа, подлежащие анализу при выделении ключевых слов, характеризующих его основное смысловое содержание • титульный экран; • основное меню; • заглавие электронного документа; • аннотации, представленные на вкладышах и/ или этикетках; • сведения об электронном документе (программе, сайте и т.п.); • содержание/ оглавление электронного ресурса; • предисловие и заключение, представленные на титульном или ином экране; • список литературы/ библиография; • алфавитно-предметный указатель; • глоссарий/ словарь терминов.

  7. Перечень характеристик, подлежащих отражению в поисковом образе документа • предмет рассмотрения (например, тракторы, документы первичные, системы информационные); • содержательный аспект рассмотрения (ремонт, комплектование); • территориальный аспект (Кузбасс, г. Москва, Красноярский край); • хронологический аспект (1954г., 20-е гг., 20-50-е гг.); • вид издания (учебники, пособия учебные, монографии, стандарты); • язык издания.

  8. Условия тождественной замены ключевых слов лексическими единицами дескрипторного ИПЯ • Ключевое слово полностью совпадает с дескриптором • Ключевое слово совпадает с имеющимся в дескрипторном словаре (ИПТ) аскриптором, сопровождаемым пометой см. • Ключевое слово, представленное словосочетанием, совпадает с дескриптором в прямом или в инвертированном виде • Для каждого слова, входящего в состав словосочетания, найдены дескрипторы- отдельные слова • Для каждого из терминоэлементов ключевого слова, представленного сложным словом, найдены дескрипторы (в т.ч. однокоренные существительные, прилагательные)

  9. Избыточное индексирование Восходящее индексирование Нисходящее индексирование • осуществляется при • индексировании • документов; • предполагает • включение в ПОД • вышестоящих • по отношению к • данному дескрипторов/ • ключевых слов • осуществляется при • индексировании • запросов; • предполагает • включение в ПОЗ • нижестоящих • по отношению к • данному дескрипторов/ • ключевых слов

  10. Проведение операции избыточного индексирования

  11. Группы правил координатного индексирования 1. Правила нормализации ключевых слов на морфологическом уровне: 1.1. Правила приведения к единой форме записи ключевого слова (род, падеж, число) 1.2. Правила использования слов и словосочетаний 1.3. Правила установления порядка слов в словосочетании 2. Правила нормализации ключевых слов на семантическом уровне: 2.1. Правила субстантивации прилагательных, причастий и глаголов 2.2. Правила устранения синонимии и полисемии

  12. Группы правил координатного индексирования 3. Правила представления специфических характеристик 3.1. Правила написания географических названий 3.2. Правила написания номенклатур (названий технических, программных средств, торговых марок, фирм и т.п.) 3.3. Правила написания дат и хронологических периодов 3.4. Правила написания имен собственных и персоналий 3.5. Правила описания видов изданий 4. Правила оформления ключевыхслов

  13. Использование единственного и множественного числа при нормализации ключевых слов

  14. Использование единственного и множественного числа при нормализации ключевых слов

  15. Использование единственного и множественного числа при нормализации ключевых слов

  16. Лингвистические критерии распознавания устойчивых словосочетаний

  17. Лингвистические критерии распознавания устойчивых словосочетаний

  18. Лингвистические критерии распознавания устойчивых словосочетаний

  19. Прагматические критерии распознавания устойчивых словосочетаний • Следует сохранять словосочетание, если в данном словаре ключевых слов очень мала вероятность использования его компонентов по отдельности; • Следует сохранять часто встречающиеся словосочетания, разделение которых в принципе возможно, но неэкономично с точки зрения ввода в автоматизированную библиотечно-информационную систему.

  20. Морфологический анализ ключевых слов в составе поисковых образов документов

  21. Способы достижения однозначности лексических единиц Языковедение см ЯЗЫКОЗНАНИЕ ЯЗЫКОЗНАНИЕ с Лингвистика Языковедение пометы: см с Устранение синонимии ТЕХНОЛОГИИ БИБЛИОТЕЧНЫЕ ТЕХНОЛОГИИ ИНФОРМАЦИОННЫЕ развертывание слова до словосочетания Устранение омонимии и полисемии БИБЛИОГРАФИЯ (деятельность) БИБЛИОГРАФИЯ (наука) БИБЛИОГРАФИЯ (указатель литературы) Пометы в круглых скобках (реляторы)

  22. Виды эквивалентности ключевых слов • имманентная • факультативная

  23. Имманентная (безусловная) эквивалентность ключевых слов • лексические синонимы (например, дефект = неисправность; габарит = размер); • полное наименование и общепринятое сокращение, аббревиатура (например, автоматизированные информационные системы = АИС; избирательное распространение информации = ИРИ; запись видеомагнитная = видеозапись).

  24. Факультативная (условная) эквивалентность ключевых слов • эллипсы (пропуски слов в речи), имеющие хождение в той или иной отрасли знания (например, машина = электронно-вычислительная машина; инфракрасный = диапазон инфракрасный); • квазисинонимы, т.е. семантически родственные слова, смысловым различием которых можно пренебречь в рамках данной ИПС (например, воздух = атмосфера; местоположение = координата; диаметр = радиус); • термины, выражающие понятия и представления, связанные логическими отношениями и психологическими ассоциациями (например, авиация = самолет; алюминий = дюраль; точность = ошибка).

  25. Заглавие Актуальные вопросы взаимодействия членов инженерно-педагогического коллектива профтехучилища по воспитанию учащихся Ключевые слова ПРОФЕССИОНАЛЬНО-ТЕХНИЧЕСКОЕ УЧИЛИЩЕ, УЧЕБНО-ВОСПИТАТЕЛЬНАЯ РАБОТА, ПТУ СМ. ПРОФЕССИОНАЛЬНО-ТЕХНИЧЕСКОЕ УЧИЛИЩЕ, ВОСПИТАНИЕ МОЛОДЕЖИ, КАДРЫ ИНЖЕНЕРНО-ПЕДАГОГИЧЕСКИЕ, КОЛЛЕКТИВ ПЕДАГОГИЧЕСКИЙ, ВЗАИМОДЕЙСТВИЕ В ВОСПИТАНИИ, ВЗАИМОДЕЙСТВИЕ, ВОСПИТАНИЕ, ВОСПИТАНИЕ В ПРОФТЕХУЧИЛИЩЕ, УЧАЩИЙСЯ ПРОФЕССИОНАЛЬНО-ТЕХНИЧЕСКОГО УЧИЛИЩА Заглавие Адреса передового опыта Ключевые слова БЕЛОРУССКАЯ ССР, АГРОПРОМЫШЛЕННЫЙ КОМПЛЕКС, БЕЛОРУССИЯ см. также БЕЛАРУСЬ, БЕЛОРУССКАЯ ССР, ПЕРЕДОВОЙ ОПЫТ Правила устранения синонимии

  26. Правила устранения полисемии и омонимии (использование специальных помет) Заглавие Волны. Оптика Ключевые слова ВОЛНА (ФИЗ.), ВОЛНА УПРУГАЯ, ВОЛНА ЭЛЕКТРОМАГНИТНАЯ, ОПТИКА, ИНТЕРФЕРЕНЦИЯ СВЕТА, ДИФРАКЦИЯ СВЕТА, ПОЛЯРИЗАЦИЯ СВЕТА, ДИСПЕРСИЯ СВЕТА, ПОГЛОЩЕНИЕ СВЕТА, РАССЕЯНИЕ СВЕТА, ЭФФЕКТ ВАВИЛОВА-ЧЕРЕНКОВА Заглавие Основы математического анализа Ключевые слова ЧИСЛА ВЕЩЕСТВЕННЫЕ, ФУНКЦИЯ (МАТ.), ФУНКЦИЯ ОДНОЙ ПЕРЕМЕННОЙ, ТЕОРИЯ ПРЕДЕЛОВ, ПРЕДЕЛ ФУНКЦИИ, СХОДИМОСТЬ (МАТ.), ФУНКЦИЯ НЕПРЕРЫВНАЯ, ДИФФЕРЕНЦИРОВАНИЕ, ПРОИЗВОДНАЯ (МАТ.), ДИФФЕРЕНЦИАЛ, ТЕОРЕМА ФЕРМА, ТЕОРЕМА Ролля, ФОРМУЛА Тейлора, ИССЛЕДОВАНИЕ ФУНКЦИЙ, ФУНКЦИЯ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ, ЭКСТРЕМУМ ФУНКЦИЙ, ФУНКЦИЯ ПЕРВООБРАЗНАЯ, ИНТЕГРАЛ НЕОПРЕДЕЛЕННЫЙ, ИНТЕГРИРОВАНИЕ, , ИНТЕГРАЛ ОПРЕДЕЛЕННЫЙ, ВЫЧИСЛЕНИЕ ИНТЕГРАЛА, ИСЧИСЛЕНИЕ ИНТЕГРАЛЬНОЕ

  27. Правила устранения полисемии и омонимии (развертывание слова до словосочетания ) 8. Омская государственная областная научная библиотека им. А.С. Пушкина.ogonbp_gak - Основной каталог Заглавие Заглавие Больничный лист Фотосинтетический аппарат и световой режим Ключевые слова Больничный лист Ключевые слова ЛИСТ, ФОТОСИНТЕЗ Заглавие Интенсификация работы листоформовочных машин асбестоцементной промышленности Ключевые слова АСБЕСТОЦЕМЕНТ, ИНТЕНСИФИКАЦИЯ ПРОИЗВОДСТВА, Лист асбестоцементный, Листоформовочная машина, ПРОМЫШЛЕННОСТЬ асбестоцементная

  28. Правила написания географических названий

  29. Заглавие Эффективная работа с Corel Draw 8 Предмет вычислительная техника программированиеcoreldraw 8 windous corel фирма macintosh internet corelscan Правила написания названий номеклатур (технических программных средств, торговых марок, фирм и т.п.) Результаты поиска: Интернет (330) Internet (27) Интернет ИЛИ Internet (354) Интернет И Internet (23) Интернет И-НЕ Internet (262)

  30. Правила написания дат и хронологических периодов • При описании века используют арабские цифры и «в» без точки и пробелов. Например, 19в, 20в • Устоявшиеся названия веков или иных временных периодов записываются как одна лексическая единица. Например, Серебряный век, Бронзовый век, средневековье • Годы записываются арабскими цифрами и буквой «г» для одного года или «гг» для интервала лет. Например, 1954г, 1941-1945гг • Десятилетия записываются арабскими цифрами, дефис, «е», интервал и «гг». Например, 20-е гг; 20-50-е гг

  31. Правила написания имен собственных и персоналий • Имена собственные, присвоенные неодушевленным предметам, событиям и т.п., а также объединениям и партиям, пишутся в кавычках. Например, «Багратион», «Адмирал Нахиов», «Комсомолец», «Яблоко» и т.п. • Имена литературных героев, персонажей художественных и анимационных фильмов, спектаклей и т. п. приводятся в КС с соответствующим уточнением «литературные персонажи» или «персонажи». Например: Раскольников; литературные персонажи; Евгений Онегин; Владимир Ленский; литературные персонажи; Бемби; персонажи

  32. Заглавие Экономико-математическийсловарь. Словарьсовременной экономической науки Предмет экономика словари справочная литератураматематикаэкономико-математический анализ Заглавие Энциклопедический словарьюного математика: для среднего и старшего школьного возраста / сост. А. П. Савин; ред. Л. В. Звягинцев Предмет НАУКА РАЗВИТИЕ ИСТОРИЯ ПОНЯТИЯ ТЕРМИНЫ ЛОГИКА МЫШЛЕНИЕ УЧЕНЫЕ Правила отражения видов изданий

  33. Соотношение формализуемых и неформализуемых процедур, осуществляемых в ходе координатного индексирования

  34. Соотношение формализуемых и неформализуемых процедур, осуществляемых в ходе координатного индексирования

  35. Соотношение формализуемых и неформализуемых процедур, осуществляемых в ходе координатного индексирования

  36. Соотношение формализуемых и неформализуемых процедур, осуществляемых в ходе координатного индексирования

More Related