1 / 60

Карпунина Маргарита Евгеньевна, аспирант

Нижегородский филиал Государственного Университета − Высшей Школы Экономики, кафедра «Информационные системы и технологии».

Download Presentation

Карпунина Маргарита Евгеньевна, аспирант

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Нижегородский филиал Государственного Университета −Высшей Школы Экономики, кафедра «Информационные системы и технологии» Сравнительный анализ использования Табу−машины и нейронных сетей Хопфилда для решения задач дискретной оптимиза- ции из области распределенных баз данных Карпунина Маргарита Евгеньевна, аспирант Научный руководитель: БабкинЭдуард Александрович, к.т.н., доцент, зав. кафедрой «Информационные системы и технологии»

  2. 2 ОБЗОР • Роль распределенныхбаз данных в современной информационной среде • Известные подходы к синтезу структуры распределенной базы данных • Комбинация нейросетей Хопфилда и генетических алгоритмов • Табу-машина и алгоритм табу-поиска • Программная реализация • Полученные результаты, оценки, прогнозы • Планы дальнейшей работы

  3. 3 РОЛЬ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ В СОВРЕМЕННОЙ ИНФОРМАЦИОННОЙ СРЕДЕ Разработка распределенных систем обуславливает необходимость изучения архитектурных и функциональных принципов обработки распределенных данных. • РБД облегчает распарал-леливание обработки запросов пользователей. • РБД повышает надежность хранения данных и отказо-устойчивость системы.

  4. 4 СИНТЕЗ ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД Синтез оптимальной логической структуры РБД дает оптимальное разбиение множества групп данных по типам логических записей с последующим размещением типов записей по узлам вычислительной сети. Рассмотрим задачу синтеза оптимальной логической структуры РБД с одним критерием оптимизации (минимизации)−на общее время, необходимое для последовательной обработки множества запросов пользователей РБД.

  5. 5 ПОСТАНОВКА ЗАДАЧИ Всем характеристикам задачи,включая исходную структуру РБД, множество запросов, множество пользователей РБД, множество узлов и топологию вычислительной сети (ВС), усредненные исходные временные характеристики, было дано математическое описание.

  6. 6 ПОСТАНОВКА ЗАДАЧИ Математическая постановка задачи синтеза оптимальной логической структурыРДБ включает задание • целевой функции задачи • ограничений задачи: • на число групп в составе логической записи • на однократность включения групп в записи • на длину формируемой логической записи • на общее число типов синтезируемых логических записей, размещенных на каждом из серверов • на объем доступной внешней памяти серверов ВС для хранения ЛБД • на требуемый уровень информационной безопасности системы • на суммарное время обслуживания оперативных запросов на серверах

  7. 7 СИНТЕЗ ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД: ИЗВЕСТНЫЕ ПОДХОДЫ Анализ комбинаторных особенностей  Точные и приближенные методы ( схема ветвей и границ ) : • трудоемкость, • сложность имплементации, • неэффективность с точки зрения времени работы алгоритма при незначительном изменении параметров задачи. Математическая постановка задачи : • многокритериальность, • нелинейная задача целочисленного программирования, • NP-полная задача.  Эвристические методы проектирования оптимальных логических структур РБД Искусственные нейронные сети (ИНС).

  8. 8 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА Структура нейронной сети Хопфилда показывает, чтогруппа данных xбудет включена вi-ую логическую запись.

  9. 9 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА Математическая постановка решаемой нами задачи была разработана в терминах нейронных сетей. • Результат 1-го этапа решения задачи: матрица распределения групп данных по типам логических записей, где • Результат 2-го этапа решения задачи: матрица безызбыточного размещения типов логических записей по узлам ВС, где • Вектора весовых коэффициентов: ,

  10. 10 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА: ФУНКЦИЯ ЭНЕРГИИ НЕЙРОСЕТИ, ПОСТРОЕННОЙ ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ Выведено уравнение динамики однослойной с обратными связями сети Хопфилда для решения задачи синтеза типов логических записей с учетом ограничений 1, 2 и 6.

  11. 11 НЕЙРОННЫЕ СЕТИ ХОПФИЛДА: ФУНКЦИЯ ЭНЕРГИИ НЕЙРОСЕТИ, ПОСТРОЕННОЙ ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ Выведено уравнение динамики однослойной с обратными связями сети Хопфилда для решения задачи безызбыточного размещения синтезированных типов логических записей по узлам вычислительной сети с учетом ограничений 3, 4, 5 и 7. где − нормированная сумма, т.е. .

  12. 12 ПРЕИМУЩЕСТВА И НЕДОСТАТКИ НЕЙРОСЕТЕВОГО АЛГОРИТМА • Робастность нейронной сети Хопфилда • К сожалению, систематического способа определения значений элементов векторов и не существует. Известно только, что должно выполняться ограничение .

  13. Создание начальной популяции Скрещивание Результат Мутация • Отбор 13 ПУТИ РАЗРЕШЕНИЯ НЕДОСТАТКОВ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ • Движение в сторону использования генетических алгоритмов для подстройки весовых коэффициентов термов функций энергии сетей. • Использование метода анализа устойчивых состояний (Stable State Analysis (SSA) Technique)¹ Структурная схема генетического алгоритма ¹ Feng G., Douligeris С.Using Hopfield Networks to Solve Traveling Salesman Problems Based on Stable State Analysis Technique // Proceedings of the IEEE-INNS-ENNS International Joint Conference on Neural Networks, 2000. P. 6521.

  14. Структурная схема реализованного НС-ГА-алгоритма Функция приспособленности 1Функция приспособленности 2 Программная реализация Генетический алгоритм Генетический алгоритм Выходные данные НС-ГА-алгоритма: оптимальная логич. структура РБД, графики Исход- ные данные НС-ГА-алго- ритма 14 ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА

  15. 15 НЕЙРОСЕТЕВОЙ АЛГОРИТМ: НЕКОТОРЫЕ ТЕСТОВЫЕ РЕЗУЛЬТАТЫ ДЛЯ ПОЛНОЙ ЗАДАЧИ СИНТЕЗА ЛОГИЧЕСКОЙ СТРУКТУРЫ РБД Качество решений, полученных с помощью нейросетевого алгоритма, сравнивалось с качеством решений, полученных с помощью метода ветвей и границ, построенного для решаемой задачи в труде В. В. Кульбы¹. Процент отклонения качества решения Средний процент отклонения, полученный в результате тестирования на задачах различной размерности составил ¹ В.В. Кульба, С.С. Ковалевский, С.А. Косяченко, В.О. Сиротюк “Теоретические основы проектирования оптимальных структур распределенных баз данных”. Серия “Информатизация России на пороге XXI века”. — М.: СИНТЕГ, 1999, 660 с.

  16. 16 ПРЕДПОСЫЛКИ ИССЛЕДОВАНИЯ ТАБУ-МАШИНЫ КАК АЛЬТЕРНАТИВНОГО НЕЙРОСЕТЕВОГО АЛГОРИТМА • Тенденция сетей Хопфилда стабилизироваться в локальном, а не глобальном минимуме функции энергии • Осуществляемый генетическим алгоритмом подбор коэффициентов A, B, C, D, E, F, влияющих на сходимость сети Хопфилда, способен значительно увеличить время работы НС-ГА-алгоритма

  17. 17 ТАБУ-МАШИНА • < l, C, β > − набор парамет-ров Табу-машины¹, где l  0− табу-размер, C  0−максимальное число вызовов обработки удаленныхсостояний, β > 0−предопределенный коэффициент такой, что βn > l. • Механизм смены состояний в Табу-машине регулируется табу-поиском. Алгоритм смены состояний ¹ Mingne Sun, Hamid R. Nemati “Tabu Machine: A New Neural Network Solution Approach for Combinatorial Optimization Problems”. Journal Of Heuristics, 9: 5 − 27, 2003.

  18. 18 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ: ОСОБЕННОСТИ • Функция энергии • Улучшение качества решения: степень учета семантической смежности групп данныхопределяется по формуле , где — заданная матрица семантической смежности групп данных. Если , то семантическая связность групп данных полностью учтена. • Увеличение производительности алгоритма

  19. 19 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ПЕРВОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ Степень близости полученных решений к решению, полностью учитывающему семантическую смежность групп данных Зависимость времени решения задачи от ее размерности.

  20. 20 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ОСОБЕННОСТИ • Функция энергии • Улучшение качества решения: значение целевой функции задачи. Качество полученного решения будем оценивать значением целевой функции задачи. Чем ближе оно к нулю, тем более оптимальным является решение. • Увеличение производительности алгоритма • Исследование области параметров < l, C, β > Табу-машины: описание экспериментов

  21. Конфигурации задачи: количество групп данных n = 10; 20; 40 Набор параметров < l, C, β >: 21 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  22. 22 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  23. 23 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  24. 24 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  25. 25 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  26. 26 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  27. 27 ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  28. 28 НС-ГА-АЛГОРИТМ И АЛГОРИТМ ТАБУ-ПОИСКА: ВЫВОДЫ • С увеличением размерности задачи решения, полученные с помощью Табу-машины, качественно превосходят решения, полученные в результате применения сетей Хопфилда. • К преимуществам использования Табу-машины можно отнести независимость решения от коэффициентов энергетической функции A, B, C, D, E, F сети. • Чем больше значение параметра С, тем больше качественно лучших решений удается получить при различных значениях l. • Наилучшим значением параметра l является величина, равная количеству типов логических записей, синтезированных на первом этапе решения задачи.

  29. 29 ЗАКЛЮЧЕНИЕ Мы рассмотрели возможности применения аппарата искусственных нейронных сетей для решения задач дискретной оптимизации. В ходе обсуждения были продемонстрированы возможности сетей Хопфилда для решения задач такого рода. А исследования Табу-машины как альтернативного способа решения выявили возможность не только качественного улучшения решения задачи, но и возможность увеличения производительности алгоритма. Были даны рекомендации по смягчению недостатков нейросетевых алгоритмов, такие, как использование SSA-технологии и симбиоз нейронных сетей и генетических алгоритмов.

  30. 30 ПЛАНЫ ДАЛЬНЕЙШЕЙ РАБОТЫ • Интегрировать Табу-машины для первого и второго этапов решения задачи синтеза в единый алгоритм табу-поиска. • Выполнить распараллеливание алгоритма табу-поиска с целью повышения его эффективности. • Расширение множества тестовых конфигураций задачи с целью получения решений задачи синтеза оптимальной логической структуры РБД для канонических структур с большим числом групп данных.

  31. СПАСИБО ЗА ВНИМАНИЕ

  32. ЦЕЛЕВАЯ ФУНКЦИЯ ЗАДАЧИ 1 2 3 4 5

  33. ОГРАНИЧЕНИЕ НА ЧИСЛО ГРУПП В СОСТАВЕ ЛОГИЧЕСКОЙ ЗАПИСИ где − максимальное число групп в записи Постановка задачиПервый этап решения 1 2 3 4 5

  34. ОГРАНИЧЕНИЕ НА ОДНОКРАТНОСТЬ ВКЛЮЧЕНИЯ ГРУПП В ЛОГИЧЕСКИЕ ЗАПИСИ где − мощность множества логических записей, − мощностьмножества групп данных, , если -аягруппа данных включена в -уюлогическую запись, и , иначе. Постановка задачиПервый этап решения 1 2 3 4 5

  35. ОГРАНИЧЕНИЕ НА ДЛИНУ ФОРМИРУЕМОЙ ЛОГИЧЕСКОЙ ЗАПИСИ где − максимально допустимая длина-ой записиопределяемая характеристиками сервера Постановка задачиВторой этап решения 1 2 3 4 5

  36. ОГРАНИЧЕНИЕ НА ОБЩЕЕ ЧИСЛО ТИПОВ СИНТЕЗИРУЕМЫХ ЛОГИЧЕСКИХ ЗАПИСЕЙ, РАЗМЕЩЕННЫХ НА КАЖДОМ ИЗ СЕРВЕРОВ где − максимальное число типов логических записей, поддерживаемое локальной СУБД узла-сервера Постановка задачиВторой этап решения 1 2 3 4 5

  37. ОГРАНИЧЕНИЕ НА ОБЪЕМ ДОСТУПНОЙ ВНЕШНЕЙ ПАМЯТИ СЕРВЕРОВ ВС ДЛЯ ХРАНЕНИЯ ЛБД Постановка задачиВторой этап решения 1 2 3 4 5

  38. ОГРАНИЧЕНИЕ НА ТРЕБУЕМЫЙ УРОВЕНЬ ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ СИСТЕМЫ для заданных и Постановка задачиПервый этап решения 1 2 3 4 5

  39. ОГРАНИЧЕНИЕ НА СУММАРНОЕ ВРЕМЯ ОБСЛУЖИВАНИЯ ОПЕРАТИВНЫХ ЗАПРОСОВ НА СЕРВЕРАХ для заданных , где − допустимое время обслуживания -го оперативного запроса Постановка задачиВторой этап решения 1 2 3 4 5

  40. ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Особьв нашем случае — это точка в -мерном пространстве. Количество генов каждой особи равно . Хромосома — последовательное объединение всех генов . Для построения генотипаразработана следующая символьная модель: каждый ген представляется строкой из 32-х бит, такое представление получается с помощью двух операций: • перевод значения гена в десятичной системе счисления в двоичную (при дополнении старших разрядов нулями, если это необходимо) , • перевод гена в двоичной системе счисления в код Грея . С точки зрения генетического алгоритма нейросетевой алгоритм используется как своеобразный “черный ящик”, осуществляющий отображение особи в соответствующую ей матрицу или (в зависимости от номера этапа решения задачи), по которой определяется фенотип особи .

  41. ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Для ГА-оболочки первого этапа была взята следующая функция приспособленности

  42. ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ КАК ОБОЛОЧКА ДЛЯ НЕЙРОСЕТЕВОГО АЛГОРИТМА Для ГА-оболочки второго этапа была взята следующая функция приспособленности

  43. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ НС-ГА-АЛГОРИТМА • ОО библиотека классов нейронных сетей Хопфилда на С++ • ОО модель генетических алгоритмов. Результатами решения задачи являются: • вектор и матрица разбиения групп данных по типам логических записей (этап 1); • вектор и матрица размещения типов логических записей по узлам ВС (этап 2). Особенности реализации ГАРезультаты работы ГА

  44. ОСОБЕННОСТИ РЕАЛИЗАЦИИ ГЕНЕТИЧЕСКОГО АЛГОРИТМА • Код Грея для представления символической модели генотипа • Формирование начальной популяции по фенотипу • Способ выбора пары − панмиксия. • Генетические операции − простой кроссинговер и точечная мутация • Общий способ формирования репродукционной группы, т.е. в новую популяцию включаются и дети, и родители • Строгий естественный отбор. Критерии останова алгоритма: • На протяжении нескольких поколений рекордсмен по приспособленности не меняется • Приспособленность хотя бы одной особи текущей популяции равна 1.

  45. Приспособленность особей начальной популяции Приспособленность особей второй популяции Приспособленность особей первой популяции РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ И ИХ АНАЛИЗ

  46. ТАБУ-МАШИНА: СТРУКТУРА И КОНЦЕПЦИИ ФУНКЦИОНИРОВАНИЯ • Табу-машина определяется как множество бинарных нейронов, соединенных двунаправленными связями. • Состояние Табу-машины определяется состояниями ее нейронов и обозначается , где n − число нейронов в Табу-машине. • Сила связи между нейронами называется весом. Если нейроны i и j связаны друг с другом, то вес, приписываемый этой связи, обозначается через , причем . • Устойчивость состояния Табу-машины зависит от ее энергии. Чем меньше энергия, тем более устойчиво состояние.

  47. ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  48. ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  49. ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

  50. ТАБУ-МАШИНА ДЛЯ РЕШЕНИЯ ВТОРОГО ЭТАПА ЗАДАЧИ: ПОЛУЧЕННЫЕ РЕЗУЛЬТАТЫ, ОЦЕНКИ, ПРОГНОЗЫ

More Related