610 likes | 799 Views
Нижегородский филиал Государственного Университета − Высшей Школы Экономики, кафедра «Информационные системы и технологии».
E N D
Нижегородский филиал Государственного Университета −Высшей Школы Экономики, кафедра «Информационные системы и технологии» Сравнительный анализ использования Табу−машины и нейронных сетей Хопфилда для решения задач дискретной оптимиза- ции из области распределенных баз данных Карпунина Маргарита Евгеньевна, аспирант Научный руководитель: БабкинЭдуард Александрович, к.т.н., доцент, зав. кафедрой «Информационные системы и технологии»
2 ОБЗОР • Роль распределенныхбаз данных в современной информационной среде • Известные подходы к синтезу структуры распределенной базы данных • Комбинация нейросетей Хопфилда и генетических алгоритмов • Табу-машина и алгоритм табу-поиска • Программная реализация • Полученные результаты, оценки, прогнозы • Планы дальнейшей работы
3 РОЛЬ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ В СОВРЕМЕННОЙ ИНФОРМАЦИОННОЙ СРЕДЕ Разработка распределенных систем обуславливает необходимость изучения архитектурных и функциональных принципов обработки распределенных данных. • РБД облегчает распарал-леливание обработки запросов пользователей. • РБД повышает надежность хранения данных и отказо-устойчивость системы.
4 СИНТЕЗ ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД Синтез оптимальной логической структуры РБД дает оптимальное разбиение множества групп данных по типам логических записей с последующим размещением типов записей по узлам вычислительной сети. Рассмотрим задачу синтеза оптимальной логической структуры РБД с одним критерием оптимизации (минимизации)−на общее время, необходимое для последовательной обработки множества запросов пользователей РБД.
5 ПОСТАНОВКА ЗАДАЧИ Всем характеристикам задачи,включая исходную структуру РБД, множество запросов, множество пользователей РБД, множество узлов и топологию вычислительной сети (ВС), усредненные исходные временные характеристики, было дано математическое описание.
6 ПОСТАНОВКА ЗАДАЧИ Математическая постановка задачи синтеза оптимальной логической структурыРДБ включает задание • целевой функции задачи • ограничений задачи: • на число групп в составе логической записи • на однократность включения групп в записи • на длину формируемой логической записи • на общее число типов синтезируемых логических записей, размещенных на каждом из серверов • на объем доступной внешней памяти серверов ВС для хранения ЛБД • на требуемый уровень информационной безопасности системы • на суммарное время обслуживания оперативных запросов на серверах
7 СИНТЕЗ ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД: ИЗВЕСТНЫЕ ПОДХОДЫ Анализ комбинаторных особенностей Точные и приближенные методы ( схема ветвей и границ ) : • трудоемкость, • сложность имплементации, • неэффективность с точки зрения времени работы алгоритма при незначительном изменении параметров задачи. Математическая постановка задачи : • многокритериальность, • нелинейная задача целочисленного программирования, • NP-полная задача. Эвристические методы проектирования оптимальных логических структур РБД Искусственные нейронные сети (ИНС).
8 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА Структура нейронной сети Хопфилда показывает, чтогруппа данных xбудет включена вi-ую логическую запись.
9 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА Математическая постановка решаемой нами задачи была разработана в терминах нейронных сетей. • Результат 1-го этапа решения задачи: матрица распределения групп данных по типам логических записей, где • Результат 2-го этапа решения задачи: матрица безызбыточного размещения типов логических записей по узлам ВС, где • Вектора весовых коэффициентов: ,
10 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА: ФУНКЦИЯ ЭНЕРГИИ НЕЙРОСЕТИ, ПОСТРОЕННОЙ ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ Выведено уравнение динамики однослойной с обратными связями сети Хопфилда для решения задачи синтеза типов логических записей с учетом ограничений 1, 2 и 6.
11 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА: ФУНКЦИЯ ЭНЕРГИИ НЕЙРОСЕТИ, ПОСТРОЕННОЙ ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ Выведено уравнение динамики однослойной с обратными связями сети Хопфилда для решения задачи безызбыточного размещения синтезированных типов логических записей по узлам вычислительной сети с учетом ограничений 3, 4, 5 и 7. где − нормированная сумма, т.е. .
12 ПРЕИМУЩЕСТВА И НЕДОСТАТКИ НЕЙРОСЕТЕВОГО АЛГОРИТМА • Робастность нейронной сети Хопфилда • К сожалению, систематического способа определения значений элементов векторов и не существует. Известно только, что должно выполняться ограничение .
Создание начальной популяции Скрещивание Результат Мутация • Отбор 13 ПУТИ РАЗРЕШЕНИЯ НЕДОСТАТКОВ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ • Движение в сторону использования генетических алгоритмов для подстройки весовых коэффициентов термов функций энергии сетей. • Использование метода анализа устойчивых состояний (Stable State Analysis (SSA) Technique)¹ Структурная схема генетического алгоритма ¹ Feng G., Douligeris С.Using Hopfield Networks to Solve Traveling Salesman Problems Based on Stable State Analysis Technique // Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks, 2000. P. 6521.
Структурная схема реализованного НС-ГА-алгоритма Функция приспособленности 1Функция приспособленности 2 Программная реализация Генетический алгоритм Генетический алгоритм Выходные данные НС-ГА-алгоритма: оптимальная логич. структура РБД, графики Исход- ные данные НС-ГА-алго- ритма 14 ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА
15 НЕЙРОСЕТЕВОЙ АЛГОРИТМ: НЕКОТОРЫЕ ТЕСТОВЫЕ РЕЗУЛЬТАТЫ ДЛЯ ПОЛНОЙ ЗАДАЧИ СИНТЕЗА ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД Качество решений, полученных с помощью нейросетевого алгоритма, сравнивалось с качеством решений, полученных с помощью метода ветвей и границ, построенного для решаемой задачи в труде В. В. Кульбы¹. Процент отклонения качества решения Средний процент отклонения, полученный в результате тестирования на задачах различной размерности составил ¹ В.В. Кульба, С.С. Ковалевский, С.А. Косяченко, В.О. Сиротюк “Теоретические основы проектирования оптимальных структур распределенных баз данных”. Серия “Информатизация России на пороге XXI века”. — М.: СИНТЕГ, 1999, 660 с.
16 ПРЕДПОСЫЛКИ ИССЛЕДОВАНИЯ ТАБУ-МАШИНЫ КАК АЛЬТЕРНАТИВНОГО НЕЙРОСЕТЕВОГО АЛГОРИТМА • Тенденция сетей Хопфилда стабилизироваться в локальном, а не глобальном минимуме функции энергии • Осуществляемый генетическим алгоритмом подбор коэффициентов A, B, C, D, E, F, влияющих на сходимость сети Хопфилда, способен значительно увеличить время работы НС-ГА-алгоритма
17 ТАБУ-МАШИНА • < l, C, β > − набор парамет-ров Табу-машины¹, где l 0− табу-размер, C 0−максимальное число вызовов обработки удаленныхсостояний, β > 0−предопределенный коэффициент такой, что βn > l. • Механизм смены состояний в Табу-машине регулируется табу-поиском. Алгоритм смены состояний ¹ Mingne Sun, Hamid R. Nemati “Tabu Machine: A New Neural Network Solution Approach for Combinatorial Optimization Problems”. Journal Of Heuristics, 9: 5 − 27, 2003.
18 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ: ОСОБЕННОСТИ • Функция энергии • Улучшение качества решения: степень учета семантической смежности групп данныхопределяется по формуле , где — заданная матрица семантической смежности групп данных. Если , то семантическая связность групп данных полностью учтена. • Увеличение производительности алгоритма
19 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ Степень близости полученных решений к решению, полностью учитывающему семантическую смежность групп данных Зависимость времени решения задачи от ее размерности.
20 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ОСОБЕННОСТИ • Функция энергии • Улучшение качества решения: значение целевой функции задачи. Качество полученного решения будем оценивать значением целевой функции задачи. Чем ближе оно к нулю, тем более оптимальным является решение. • Увеличение производительности алгоритма • Исследование области параметров < l, C, β > Табу-машины: описание экспериментов
Конфигурации задачи: количество групп данных n = 10; 20; 40 Набор параметров < l, C, β >: 21 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
22 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
23 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
24 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
25 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
26 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
27 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
28 НС-ГА-АЛГОРИТМ И АЛГОРИТМ ТАБУ-ПОИСКА: ВЫВОДЫ • С увеличением размерности задачи решения, полученные с помощью Табу-машины, качественно превосходят решения, полученные в результате применения сетей Хопфилда. • К преимуществам использования Табу-машины можно отнести независимость решения от коэффициентов энергетической функции A, B, C, D, E, F сети. • Чем больше значение параметра С, тем больше качественно лучших решений удается получить при различных значениях l. • Наилучшим значением параметра l является величина, равная количеству типов логических записей, синтезированных на первом этапе решения задачи.
29 ЗАКЛЮЧЕНИЕ Мы рассмотрели возможности применения аппарата искусственных нейронных сетей для решения задач дискретной оптимизации. В ходе обсуждения были продемонстрированы возможности сетей Хопфилда для решения задач такого рода. А исследования Табу-машины как альтернативного способа решения выявили возможность не только качественного улучшения решения задачи, но и возможность увеличения производительности алгоритма. Были даны рекомендации по смягчению недостатков нейросетевых алгоритмов, такие, как использование SSA-технологии и симбиоз нейронных сетей и генетических алгоритмов.
30 ПЛАНЫ ДАЛЬНЕЙШЕЙ РАБОТЫ • Интегрировать Табу-машины для первого и второго этапов решения задачи синтеза в единый алгоритм табу-поиска. • Выполнить распараллеливание алгоритма табу-поиска с целью повышения его эффективности. • Расширение множества тестовых конфигураций задачи с целью получения решений задачи синтеза оптимальной логической структуры РБД для канонических структур с большим числом групп данных.
ЦЕЛЕВАЯ ФУНКЦИЯ ЗАДАЧИ 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ЧИСЛО ГРУПП В СОСТАВЕ ЛОГИЧЕСКОЙ ЗАПИСИ где − максимальное число групп в записи Постановка задачиПервый этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ОДНОКРАТНОСТЬ ВКЛЮЧЕНИЯ ГРУПП В ЛОГИЧЕСКИЕ ЗАПИСИ где − мощность множества логических записей, − мощностьмножества групп данных, , если -аягруппа данных включена в -уюлогическую запись, и , иначе. Постановка задачиПервый этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ДЛИНУ ФОРМИРУЕМОЙ ЛОГИЧЕСКОЙ ЗАПИСИ где − максимально допустимая длина-ой записиопределяемая характеристиками сервера Постановка задачиВторой этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ОБЩЕЕ ЧИСЛО ТИПОВ СИНТЕЗИРУЕМЫХ ЛОГИЧЕСКИХ ЗАПИСЕЙ, РАЗМЕЩЕННЫХ НА КАЖДОМ ИЗ СЕРВЕРОВ где − максимальное число типов логических записей, поддерживаемое локальной СУБД узла-сервера Постановка задачиВторой этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ОБЪЕМ ДОСТУПНОЙ ВНЕШНЕЙ ПАМЯТИ СЕРВЕРОВ ВС ДЛЯ ХРАНЕНИЯ ЛБД Постановка задачиВторой этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА ТРЕБУЕМЫЙ УРОВЕНЬ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ СИСТЕМЫ для заданных и Постановка задачиПервый этап решения 1 2 3 4 5
ОГРАНИЧЕНИЕ НА СУММАРНОЕ ВРЕМЯ ОБСЛУЖИВАНИЯ ОПЕРАТИВНЫХ ЗАПРОСОВ НА СЕРВЕРАХ для заданных , где − допустимое время обслуживания -го оперативного запроса Постановка задачиВторой этап решения 1 2 3 4 5
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Особьв нашем случае — это точка в -мерном пространстве. Количество генов каждой особи равно . Хромосома — последовательное объединение всех генов . Для построения генотипаразработана следующая символьная модель: каждый ген представляется строкой из 32-х бит, такое представление получается с помощью двух операций: • перевод значения гена в десятичной системе счисления в двоичную (при дополнении старших разрядов нулями, если это необходимо) , • перевод гена в двоичной системе счисления в код Грея . С точки зрения генетического алгоритма нейросетевой алгоритм используется как своеобразный “черный ящик”, осуществляющий отображение особи в соответствующую ей матрицу или (в зависимости от номера этапа решения задачи), по которой определяется фенотип особи .
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Для ГА-оболочки первого этапа была взята следующая функция приспособленности
ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Для ГА-оболочки второго этапа была взята следующая функция приспособленности
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ НС-ГА-АЛГОРИТМА • ОО библиотека классов нейронных сетей Хопфилда на С++ • ОО модель генетических алгоритмов. Результатами решения задачи являются: • вектор и матрица разбиения групп данных по типам логических записей (этап 1); • вектор и матрица размещения типов логических записей по узлам ВС (этап 2). Особенности реализации ГАРезультаты работы ГА
ОСОБЕННОСТИ РЕАЛИЗАЦИИ ГЕНЕТИЧЕСКОГО АЛГОРИТМА • Код Грея для представления символической модели генотипа • Формирование начальной популяции по фенотипу • Способ выбора пары − панмиксия. • Генетические операции − простой кроссинговер и точечная мутация • Общий способ формирования репродукционной группы, т.е. в новую популяцию включаются и дети, и родители • Строгий естественный отбор. Критерии останова алгоритма: • На протяжении нескольких поколений рекордсмен по приспособленности не меняется • Приспособленность хотя бы одной особи текущей популяции равна 1.
Приспособленность особей начальной популяции Приспособленность особей второй популяции Приспособленность особей первой популяции РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ И ИХ АНАЛИЗ
ТАБУ-МАШИНА: СТРУКТУРА И КОНЦЕПЦИИ ФУНКЦИОНИРОВАНИЯ • Табу-машина определяется как множество бинарных нейронов, соединенных двунаправленными связями. • Состояние Табу-машины определяется состояниями ее нейронов и обозначается , где n − число нейронов в Табу-машине. • Сила связи между нейронами называется весом. Если нейроны i и j связаны друг с другом, то вес, приписываемый этой связи, обозначается через , причем . • Устойчивость состояния Табу-машины зависит от ее энергии. Чем меньше энергия, тем более устойчиво состояние.
ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ
ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ