150 likes | 334 Views
Тезаурус классификационных систем по физике полупроводников. Белоозеров В. Н. Шабурова Н. Н. . Использованы материалы и данные из публикаций :.
E N D
Тезаурус классификационных систем по физике полупроводников Белоозеров В. Н.Шабурова Н. Н.
Использованы материалы и данные из публикаций: • Библиотечно-библиографическая классификация: Таблицы для научных библиотек. Раздел «В3 Физика» [Электронный ресурс]. – [Электронная версия эталона таблиц 2009 г. / НИЦ РГБ]. • УДК. Универсальная десятичная классификация: Тт. 1 – 10 / ВИНИТИ РАН. – 4-е полное изд на рус. яз. – М., 2001 – 2009. • Рубрикатор информационных изданий ВИНИТИ. Тт. 1 – 4. – М., 2005. • Государственный классификатор – Рубрикатор научно-технической информации (ГРНТИ). Тт. 1, 2. – Изд. 6. – М.: ВИНИТИ, 2007. • Physics and Astronomy Classification Scheme (PACS) // American Physical Society [Электронный ресурс]. – Доступ: http://publish.aps.org/PACS (дата обращения 2009-04-05). • Белоозеров В. Н., Шабурова Н. Н. Классификационные системы как средство поиска информации по физике полупроводников // Библиосфера. / ГПНТБ СО РАН. – 2008. - № 3. – С. 34 – 42. – (ISSN 1815-3186). • DeRidder J. L. The immediate prospects for the application of ontologies in digital libraries // Knowledge Organization. – 2007. – Vol. 34, No.4, pp.227-246. – (ISSN 0943-7444). • U.S. National Library of Medicine. Fact sheet:. UMLS Metathesaurus / National Institutes of Health, 28 March 2006. [Электронный ресурс]. – Доступ: http://www.nlm.nih.gov/pubs/factsheets/umlsmeta.html (дата обращения 2009-05-07). • Aнтопольский А. Б., Белоозеров В. Н. Процедура формирования макротезауруса политематич. информац. систем // Классификация и кодирование / ВНИИКИ. - 1976. - № 1 (57). – С. 25 – 29. • Белоозеров В. Н., Носиков С. М., Федосимов В. И. Макротезаурус ГАСНТИ и Базисный тезаурус САЦНТИ – нормативные языковые средства информационно-поисковых систем // Материалы межотраслевых научно-технических конференций, совещаний, семинаров и выставок. – М.: ВИМИ, 1983. – С. 128. • Белоозеров В. Н., Федосимов В. И. Место макротезауруса в лингвистическом обеспечении сети органов научно-технич. информации // Проблемы информац. систем / МЦНТИ. 1986. – № 1. – С. 6 – 10. • Использование и ведение Макротезауруса ГАСНТИ / ГКНТ СССР. Методические рекомендации. – М., 1983. • Nuovo soggettario: guida al sistema italiano di indicizzazione per soggetto, prototipo del thesaurus [Рецензия] // Knowledge Organization. – 2007. – Vol. 34, No. 1. – Pp. 58 – 60. – (ISSN 0943-7444). • Проблемы сопоставления информационно-поиск. классификац. систем при формировании тезауруса тематич. рубрик по физике полупроводников / В. Н. Белоозеров, Н. Н. Шабурова // Роль ГПНТБ СО РАН в развитии информац.-библиотеч. обслуживания в регионе. Межрегион. научно-практич. конф. (Новосибирск 6-10 окт. 2008) – Новосибирск: ГПНТБ СО РАН, 2008. – С. 27 – 29. • ISO 2788:1986. Documentation – Guidelines for the Establishment and Development of Monolingual Thesauri. – Genève: ISO, 1986. – 61 p. • ГОСТ 7.25-2001 Система стандартов по информации, библиотечному и издательскому делу. Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления. – М.: Изд-во стандартов, 2001.
Актуальность • Использование неод-нородных ИПЯ информационными структурами различных территорий и ведомств или публикующими организациями (УДК, ГРНТИ, ББК, Рубрикатор ВИНИТИ, PACS = Physical and Astronomy Classifi-cational Scheme)могут осложнять взаимодей-ствие информационных ресурсов • Физика полупроводников – довольно узкая область знания • являющаяся, тем не менее, важным напра-влением развития современной науки • и позволяющая в обозримой перспективе получить практически применимые результаты
Фрагмент таблицы соответствия полупроводниковых рубрик PACS табличным классам других классификаций
В таблице слово «примерно» означает, что объём рубрик частично не пересекается, но в пересечение входит большая часть. Слово «часть» означает, что объём рубрики PACS явля-ется частью объёма сопоставляемой рубрики. «Неполно» означает, что имеется противоположное отношение: сопоставляемая рубрика неполно отражает рубрику PACS. Когда в качестве сопоставляемой рубрики указан только код , это соответствует примерному совпадению объёмов рубрик. Когда указаны два или более кодов, это означает, что темати-ка рубрики PACS отражается в разных рубриках сопоставляе-мого классификатора, но соотношение этих рубрик остаётся не определённым: в зависимости от конкретного объекта рубрике PACS может соответствовать либо объединение (в большинстве случаев) либо пересечение объёмов рубрик сравниваемых классификаций.
Данные таблицы свидетельствуют о том, что соотношения между рубриками различных классификаций представляют собой достаточно сложную структуру, которая не укладывает-ся в плоскую сопоставительную таблицу. Кроме отношений эквивалентности при сопоставлении рубрик необходимо от-мечать отношения родовидового подчинения (теоретико-множественного включения), а также ассоциативные отноше-ния частичного пересечения. Эти отношения наиболее полно отражаются структурой ИНФОРМАЦИОННО-ПОИСКОВОГО ТЕЗАУРУСА. Если эту структуру дополнить терминами понятий, входящих в содержание каждой классификационной рубрики, то мы получим модель онтологии предметной области физи-ки полупроводников, представленную в различных проекциях соответственно включённым в тезаурус классификаторам.
Э э (156 статей) Фрагмент информационно-поискового тезауруса
1) При индексировании документов (запросов) индексатор определяет тему документа, которая обычно выражается его наименованием, и отыскивает в тезаурусе наиболее близкие лексические единицы, заменяя аскрипторы на синонимичные им дескрипторы. Если найденные дескрипторы достаточно точно и полно отражают действительное содержание докуме-нта, то они образуют дескрипторный поисковый образ доку-мента, а указанные при них коды классификационных рубрик принимаются в качестве индекса тематики документа по той или иной классификационной системе. Если при дескрипторах отсутствует код класса необходимой для индексирования клас-сификации, то используются коды, указанные при родовых и/или ассоциативных дескрипторах, т. е. дескрипторах, связан-ных с исходным ссылками «выше» (В:) и «ассоциация» (А:). В ряде случаев следует использовать видовые дескрипторы (указанные ссылками Н:), если из содержания документа ясно, что заглавие сформулировано слишком широко.
2) При поиске информации в базе данных с доступом по одной из классификационных систем, включённых в тезаурус, отыскиваются дескрипторы, наиболее полно соответствующие тексту (смыслу) запроса, путём интел-лектуального анализа или автоматического индексирова-ния. В качестве поискового предписания в базу данных предъявляются коды соответствующей классификации, указанные при найденных дескрипторах, а затем коды при ассоциативных дескрипторах и по всем цепям видо-вых (нижестоящих) дескрипторов. 3) При поиске в информационных ресурсах с доступом по ключевым словам в тезаурусе отыскиваются дескрипторы аналогично предыдущему пункту, и на вход поисковой программы подаются найденные дескрипторы, затем нижестоящие по всей цепи видовых ссылок и затем ассо-циативные к ним.
4) При обращении к информационным ресурсам с пословным индексированием текста документов (например, к поисковым машинам Интернета) интел-лектуальность поиска может быть увеличена за счёт расширения запроса дескрипторами, непосредственно связанными в тезаурусе с термином запроса. 5) В тех случаях, когда документальный фонд включает в свой состав информацию из другого фонда, заиндекси-рованную по классификации, принятой в фонде-источни-ке, фонд-приёмник может определить по тезаурусу тема-тических рубрик (ТТР) индекс своей классификации на основе как прямого сопоставления, так и на основе повторного индексирования по процедурам, описанным в пунктах 1) и 2).
6) Интеграция разнородных информационных ресурсов в составе сети с единым средством тематического и пред-метного доступа осуществляется с помощью ТТР по физике полупроводников путём формирования поиско-вых образов документов и запросов одновременно на всех информационно-поисковых языках общающихся баз данных – на языках классификационных систем (УДК, ББК, ГРНТИ, Рубрикатора ВИНИТИ, PACS), языке ключевых слов и языке интеллектуального поиска по полному тексту. При этом наиболее точную и полную информацию даёт обращение именно к тому ресурсу сети, в классифи-кационной системе которого обнаруживается по тезауру-су класс, точно соответствующий запросу.
Кроме чисто иллюстративной функции сопоставительный тезаурус классификационных систем может служить инструментом выполнения следующих практических задач: 1) индексирование информации (документов и запросов) в интеллектуальном и автоматическом режимах, 2) поиск информации в базах данных, систематизированных по какой-либо из классификационных систем, включённых в тезаурус, 3) информационный поиск в фондах документов, индексиро-ванных ключевыми словами, 4) интеллектуальный поиск по полным текстам документов, 5) перекодировка поисковых образов одной информационной системы в поисковые образы другой, 6) интеграция разнородных информационных ресурсов в составе сети с единым средством тематического и предметно- го доступа.
Применение тезауруса в научной библиотеке Института физики полупроводников СО РАН (Новосибирск)
Выводы В соответствии с информационной теорией и данными зарубежной практики разработанный тезаурус может быть языком-посредником и связующим звеном в сети взаимодействующих информационных ресурсов, которые обменива-ются данными на основе тематического описа-ния документов и информационных запросов. Дальнейшее развитие ТТР ФПП предполагается вести в направлении расширения тематики, включения новых классификаций, совершенст-вования методики сопоставления классифика-ционных систем.
Благодарим за внимание ! Белоозеров Виктор Николаевич nomoip@viniti.ru Шабурова Наталья Николаевна shaburova@isp.nsc.ru