1 / 41

Кластерный анализ

Кластерный анализ. Цель работы. ознакомление с проблемой кластерного анализа при интеллектуальной обработке данных в информационных системах; изучение алгоритмов кластеризации, использующих построение минимального остовного дерева ;

hank
Download Presentation

Кластерный анализ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Кластерный анализ

  2. Цель работы • ознакомление с проблемой кластерного анализа при интеллектуальной обработке данных в информационных системах; • изучение алгоритмов кластеризации, использующих построение минимального остовного дерева; • приобретение навыков в программной реализации изученных алгоритмов в среде Borland Delphi и в компьютерном проведении кластерного анализа.

  3. Общие сведенияо кластерном анализе Кластерный анализ (англ.Dataclustering) — задача разбиения заданной выборкиобъектов (ситуаций) на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

  4. Задачакластерного анализа Выявление естественного локального сгущения объектов, каждый из которых описан набором переменных или признаков.

  5. Использованиекластерного анализа «…от анализа морфологии мумифицированных грызунов в Новой Гвинее до изучения результатов голосования сенаторов США, от анализа поведенческих функций замороженных тараканов при их размораживании до исследования географического распределения некоторых видов лишая в Саскачеване»

  6. Примерыкластерного анализа

  7. Практическая ценностькластерного анализа • группировка объектов не только по одному параметру, но и по целому набору признаков; • сокращение, сжатие больших объёмов информации в хранилищах и базах данных; • Data Mining.

  8. Классификация задачкластерного анализа • число кластеров априори задано; • число кластеров неизвестно и подлежит определению; • число кластеров неизвестно, но его определение не является условием решения задачи, а необходимо построить иерархическое дерево (дендрограмму) разбиения анализируемой совокупности объектов на кластеры.

  9. Дендрограмма последовательность разбиений, в которой каждое разбиение вложено в последующее разбиение в последовательности.

  10. Формализация задачикластеризации Неотрицательная, вещественнозначная функция называется функцией расстояния (метрикой), если: для всех Xi и Xj; тогда и только тогда, когда Xi=Xj; выполняется неравенство треугольника ,где Xi, Xj, Xk– любые 3 объекта. 2-й кластер x3 Xi Xj  (Xi, Xj) x2 1-й кластер (класс, таксон) x1

  11. Функции расстояния • евклидова метрика • хеммингово расстояние

  12. Алгоритм кластеризации 0 0 0

  13. Алгоритм построения минимального остовного дерева (МОД) • Шаг 0. [Инициализация] Построение матрицы расстояний (близости) R по результатам измерений n объектов, представленным матрицей данных размером p×n. 0 0 0

  14. Алгоритм построения минимального остовного дерева (МОД) • Шаг 1. [Построение минимального остовного дерева] Cиспользованием матрицы R осуществляется построение минимального остовного дерева T. Для построения минимального остовного дерева предлагается воспользоваться алгоритмами Крускала и Прима

  15. Алгоритм построения минимального остовного дерева (МОД) • Шаг 2. [Группировка объектов в кластеры] Вершины – объекты минимального остовного дерева группируются в кластеры. Выбираются два объекта, которым соответствует минимальное ребро , где . Далее эти объекты стягиваются в один кластер (класс, таксон, страту) и процедура шага 2 повторяется до тех пор, пока на n-1 этапе группирования не будет сформирован один кластер, объединяющий все объекты. STOP.

  16. Алгоритм построения минимального остовного дерева (МОД)

  17. Алгоритм построения минимального остовного дерева (МОД)

  18. Алгоритм построения минимального остовного дерева (МОД)

  19. Алгоритм построения минимального остовного дерева (МОД)

  20. Алгоритм построения минимального остовного дерева (МОД)

  21. Алгоритм построения минимального остовного дерева (МОД)

  22. Алгоритм построения минимального остовного дерева (МОД)

  23. Способы описания результатов иерархической кластеризации • Скобочная запись

  24. Способы описания результатов иерархической кластеризации • Дендрограмма

  25. Алгоритмы построенияминимального остовного дерева • Минимальным остовным деревом T сети G является самая дешёвая подсеть, т.е. подсеть минимального веса, которая покрывает все вершины сети G и не содержит циклов.

  26. Алгоритм Крускала • Шаг 0. [Инициализация]Создаём сеть T с nвершинами, но без рёбер. Создаём сеть Hидентичную сети G.

  27. Алгоритм Крускала • Шаг 1. [Цикл] До тех пор, пока сеть T не является связной сетью выполнять шаг 2, в противном случае STOP.

  28. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  29. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  30. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  31. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  32. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  33. Алгоритм Крускала • Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом в сети H. Если при добавлении ребра (u,v) к сети T в последней не образуется циклов, то это ребро добавляется к T.

  34. Алгоритм Прима Шаг 0. [Инициализация] Помечаем все вершины «невыбранными». Создаём сеть T с nвершинами, но без рёбер. Выбираем произвольную вершину и помечаем её «выбранной». 0 1 T[0] 5 2 3 4

  35. Алгоритм Прима Шаг 1. [Цикл] До тех пор, пока существуют «невыбранные» вершины, выполнять шаг 2, в противном случае – STOP. 0 1 T[0] 5 2 3 4

  36. Алгоритм Прима Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом между произвольно выбранной вершиной u и произвольной невыбранной вершиной v. Помечаем v как «выбранную» и добавляем ребро (u,v) в сеть T. 1 1 T[1] 5 2 1 6 4 3

  37. Алгоритм Прима Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом между произвольно выбранной вершиной u и произвольной невыбранной вершиной v. Помечаем v как «выбранную» и добавляем ребро (u,v) в сеть T. 2 1 T[1] 7 5 2 2 1 6 4 3

  38. Алгоритм Прима Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом между произвольно выбранной вершиной u и произвольной невыбранной вершиной v. Помечаем v как «выбранную» и добавляем ребро (u,v) в сеть T. 3 1 T[1] 7 5 2 9 2 3 1 6 4 3

  39. Алгоритм Прима Шаг 2. [Отыскание ребра с наименьшим весом] Пусть (u,v) – ребро с наименьшим весом между произвольно выбранной вершиной u и произвольной невыбранной вершиной v. Помечаем v как «выбранную» и добавляем ребро (u,v) в сеть T. 4 1 T[1] 11 4 7 5 2 9 2 3 1 6 4 3

  40. Разработка программы кластерного анализа

  41. Разработка программы кластерного анализа

More Related