290 likes | 474 Views
ПОДХОД К РАЗРАБОТКЕ МЕТОДОВ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ ИНФОРМАЦИОННОЙ ЦЕЛОСТНОСТИ ТЕХНИЧЕСКИХ ТЕКСТОВ. О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань. Контроль информационной целостности технических текстов.
E N D
ПОДХОД К РАЗРАБОТКЕ МЕТОДОВ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ ИНФОРМАЦИОННОЙ ЦЕЛОСТНОСТИ ТЕХНИЧЕСКИХ ТЕКСТОВ О.А Невзорова НИИММ им. Н.Г. Чеботарева, г. Казань
Контроль информационной целостности технических текстов Технические тексты «Логика работы…» – основа для разработки спецификаций бортовых алгоритмов и алгоритмов деятельности членов экипажа проектируемого антропоцентрического объекта
Назначение документа«Логика работы…» • разработка спецификаций бортовых алгоритмов и алгоритмов деятельности экипажа; • определение состава информации (протоколы информационного обмена), передаваемой между бортовыми компьютерами, бортовыми измерительными и исполнительными устройствами.
Структура документа «Логика работы…» • Структурирование процесса функционирования сложного объекта через сеть типовых ситуаций и проблемных ситуаций в каждой из них; • Представление описаний каждой проблемной ситуации через полное множество обобщенных алгоритмов и бортовых алгоритмов.
Структура бортового алгоритма • входная информация (совокупность информационных сигналов или семантическое описанием входного информационного потока с указанием источника информации: конкретный алгоритм, конкретное измерительное устройство); • шаги преобразования информации (допустимый способ разрешения проблемы); • выходная информация (совокупность информационных сигналов или семантическое описанием выходного информационного потока).
Алгоритмы (БЦВМ-алгоритмы / АДЭ) Изм/ устройство Исп/ устройство Информационный поток на входе Информационный поток на выходе Схема бортовых алгоритмов
Методы автоматизированного контроля информационной целостности текста • Технологии морфосинтаксического анализа • Технологии взаимодействия с прикладной онтологией
Методы автоматизированного контроля информационной целостности текста • Распознавание ситуаций неполных алгоритмических описаний ("белых пятен") • Разрешение ситуаций «белых пятен» на основе специализированных активных диалогов
Ситуации «белых пятен» • тексты содержат ссылку на объект, не конструируемый последующим текстовым описанием; • построенное описание объекта является неполным и требует доопределения; • используются описания с нечеткой алгоритмической моделью;
Подсистема "OntoEditor+" Подсистема "Анализатор" Редактирование словарной базы данных Проектирование онтологии Построение лингвистической оболочки онтологии Обслуживание внешних запросов к словарной базе данных Т е к с т т Морфосинтаксический анализ текста Обслуживание запросов по онтологии Онтологическое покрытие текста. Построение дерева сегментов Выводы по онтологии Подсистема "Интегратор" Извлечение информации Базовая архитектура программного комплекса
Прикладная АвиаОнтология • 1600 понятий (4700 текстовых единиц) • Отношения - иерархические (Выше- Ниже, Часть-Целое) - концептуальной зависимости АСЦ1- «зависит от» АСЦ2- «главное для»
АвиаОнтология Пуск ракеты • с запуск ракеты • с запустить ракету • с отстрел ракеты • с применение ракет • с применение ракетного вооружения • с пуск ракеты • с пустить ракету • с ракетная атака • с ракетный удар
АвиаОнтология (пуск ракеты) • ВЫШЕ ПРИМЕНЕНИЕ ОРУЖИЯ • НИЖЕ ЭФФЕКТИВНЫЙ ПУСК РАКЕТЫ • ЧАСТЬ ДАЛЬНОСТЬ ПУСКА РАКЕТЫ • ЧАСТЬ ЗОНА ВОЗМОЖНОГО ПУСКА • ЧАСТЬ МАКСИМАЛЬНО ДОПУСТИМАЯ ПЕРЕГРУЗКА ПРИ ПУСКЕ • АСЦ1 РАКЕТА • АСЦ2 ВЫХОД В ЗОНУ ВОЗМОЖНОГО ПУСКА • АСЦ2 КОМАНДА “ПУСК РАЗРЕШЕН” • АСЦ2 ОШИБКА ПУСКА • АСЦ2 УПРАВЛЕНИЕ РАКЕТОЙ
Инструментальная система визуального проектирования онтологий «OntoEditor+» • Проектирование онтологий в табличной и графической формах • Исследовательский инструментарий • Лингвистический инструментарий
Система "OntoEditor +" Блок проектирования онтологий Блок настройки Блок визуализации Реляционные таблицы АвиаОнтологии Лингвистический инструментарий Интерпретатор команд Архитектура системы «OntoEditor+»
Вывод связных поддеревьев по отношению
Лингвистический инструментарий системы «OntoEditor+» • задачи корпусного исследования (загрузка корпуса; сегментация на предложения; автоматическое ведение статистики по различным объектам корпуса) • построение лингвистической оболочки онтологии • задача покрытия текста онтологическими входами • построение выводов по онтологии • поддержка протоколов информационного обмена системы "OntoEditor+" с внешними программными модулями, в том числе с внешними информационными ресурсами
Подсистема «Анализатор» • Графематический анализ • Морфосинтаксический анализ • Покрытие текста онтологическими входами (взаимодействие с системой «OntoEditor+»)
Подсистема «Интегратор» • Анализ и исполнение внешнего запроса (информационная модель алгоритма) • Интерпретация внешнего запроса в терминах прикладной онтологии (взаимодействие с системой «OntoEditor+») • Интерпретация внешнего запроса в структурных компонентах дерева сегментов (взаимодействие с системой «Анализатор») • Контроль информационной целостности (анализ компонент внешнего запроса)
Использование авиаонтологии • Построение допустимых цепочек связей между заданной парой понятий; • Пошаговое тестирование построенных цепочек. Пошаговое тестирование означает, что все элементы построенной цепочки допустимы в заданной проблемной ситуации, заявлены в данном тексте или выводимы по разрешенным правилам.
Использование авиаонтологии • Информационный анализ выделенных из текста концептуальных структур: • распознавании и анализ используемых в описаниях терминов; • установление семантических классов параметров алгоритмов и проверка их соответствия допустимым типам
Пример анализа текста 1 • Алгоритм анализа структуры налёта. На вход алгоритма поступает информация о взаимном расположении самолетов противника (структура его строя). Происходит сравнение со структурой строев, активизированных в БД. По некоторой метрике выбирается структура строя налета, наиболее близкая к наблюдаемой. В соответствии с отождествляемой структурой строя в наблюдаемом строю расставляются приоритеты атаки целей.
Пример анализа текста 2 • Имя алгоритма: алгоритм анализа структуры налёта; • Задача алгоритма: анализ структуры налета; • Входная информация для алгоритма: взаимное расположение самолетов противника (структура его строя); • Точка возникновения входной информации: • Вопрос: Откуда поступает информация? • Ответ: Информация отсутствует. • Действие_1: происходит сравнение (произвести сравнение). • Что сравнивается: входная информация (=построен вывод) • С чем сравнивается: со структурой строев, активизированных в БД. • Действие_2: Выбирается структура строя налета, наиболее близкая к наблюдаемому расположению самолетов противника (=построен вывод). Выбирается по некоторой метрике. • Действие_3: расставляютсяприоритеты атаки целей в наблюдаемом строю. Расставляются в соответствии с отождествляемой структурой строя. • Выходная информация для алгоритма: • 1. Структура строя налета наиболее близкая к наблюдаемому расположению самолетов противника. • 2. Приоритеты атаки целей в наблюдаемом строю. • Точка приема выходной информации: • Вопрос: Что является приемником информации? • Ответ: Информация отсутствует.
Текущая задача исследования • Проектирование онтологии мета-уровня, обеспечивающую эффективную трансляцию внешних запросов и взаимодействие с прикладной онтологией по выполнению внешних запросов
Пример: проблемная ситуация «Целераспределение» Наблюдаемый на борту командира звена ИП воздушный противник (самолеты-цели) анализируется с учетом генеральной задачи вылета на предмет: • назначение для каждой цели (на множестве наблюдаемых целей, среди которых выделены ударные самолеты (УС) и истребители сопровождения (ИС)) приоритета для атаки, • назначения приоритетности на множестве критериев {K1,K2…,Kk}, по которым будет оцениваться исход настоящего боя.
Проблемная ситуация «Целераспределение»: «белые пятна» • Текстовый вход наблюдаемый воздушный противник требует установления источника поступления информации, связанного с процессом наблюдение. • Для текстового входа генеральная задача вылета должен быть построен вывод, позволяющий установить связь данного входа с понятием информация, для того чтобы рассматривать данный вход как источник информации. • Решение задачи назначения для каждой цели приоритетов для атакитребует описания общей семантики процедуры назначения. Семантика процедуры (алгоритма) назначения (распределения) суть построение некоторых пар элементов (A,B), где A И B – заданные множества; A- множество целей, B – множество приоритетов для атаки. • Для решения задачи назначения приоритетности на множестве критериев требуется установить источник поступления информации о множестве критериев для алгоритма назначения.