1 / 26

Теория баз данных и информационного поиска

Теория баз данных и информационного поиска. Информационно-графовая модель данных. Содержание. Метод управляющих систем в теории информационного поиска Поиск идентичных объектов Интервальный поиск Включающий поиск Задача информационного поиска Поиск идентичных объектов 2 Базовое множество

shanna
Download Presentation

Теория баз данных и информационного поиска

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Теория баз данных и информационного поиска Информационно-графовая модель данных

  2. Содержание • Метод управляющих систем в теории информационного поиска • Поиск идентичных объектов • Интервальный поиск • Включающий поиск • Задача информационного поиска • Поиск идентичных объектов2 • Базовое множество • Пример базового множества • Информационный граф • Решение задачи информационного поиска • ИГ, решающий задачу поиска • Алгоритм, соответствующий ИГ • Сложность информационных графов • Поиск идентичных объектов 3 • Включающий поиск 2 • Интервальный поиск 2 • Литература

  3. Метод управляющих систем в теории информационного поиска • Шаг 1. Определяется понятие задачи информационного поиска и функции ответа, реализуемой этой задачей. • Шаг 2. Вводится специальная схема (называемая информационным графом), которая моделирует алгоритм поиска и реализует функцию ответа. • Шаг 3. Вводятся сложностные характеристики информационного графа (число ребер графа, время поиска в среднем и худшем случае). • Шаг 4. Находятся нижние оценки временной сложности для рассматриваемых задач информационного поиска. • Шаг 5. Строится информационный граф, реализующий функцию ответа и имеющий сложность, близкую к нижней оценке.

  4. Поиск идентичных объектов • Y=[0,1] - множество записей. • X=[0,1]- множество запросов. • V- база данных. • Поиск идентичных объектов: для любогоxнайтиy такую, чтоx

  5. Интервальный поиск [ ] • .Y=[0,1]– множество записей. • .Xмножество запросов. • .Vбаза данных. • Интервальный поиск: для • любого запросаu • перечислить все те и • только тезаписи ,y • которыеu

  6. Включающий поиск • .Y- множество записей. • X- множество запросов. • .V- база данных. • Включающий поиск: для любого запроса • x • перечислить все те и только те записи • y • которые 1111 1101 1011 1110 0111 1001 1010 1100 0101 0011 0110 1000 0001 0010 0100 0000

  7. Задача информационного поиска • - множество записей. • - множество запросов. • < - вероятностное пространство, где-алгебраподмножеств , -вероятностная мера на. • - бинарное отношение. • - тип информационного поиска. • Если и , то- задача информационного поиска типа . • Задачаинформационного поиска : для произвольного запроса перечислить те и только те записи, для которых.

  8. для любого Поиск идентичных объектов Бинарный поиск if , найти

  9. Базовое множество • - множество запросов. • - предикат. • - переключатель. • - множество предикатов. • - множество переключателей. • - базовое множество.

  10. Пример базового множества • - мн-во запросов. • - мн-во предикатов. • , • - множество переключателей. • - базовое множество.

  11. Информационный граф если если - множество записей, включенных в ответ на запросx проводимость предикатного ребра на запросеx проводимость переключательного ребра на запросеx запись включается в ответ на запросx проводимость пути на запросеx нагрузка переключательных вершин нагрузка переключательных ребер нагрузка предикатных ребер переключательные вершины переключательные ребра предикатные ребра нагрузка листьев листья корень

  12. Решение ЗИП • Проводимостьпредикат. ребра: • Проводимость переключательногоребра : • Проводимость путиC из ребер: • Функция фильтра вершины:Х • Характеристическаяфункция записиXдля отношения • ИГрешаетЗИП если для любого запроса выполнено • ТеоремаИГрешает ЗИП точно тогда, когда для любой записи выполнено корень ИГ

  13. Характеристические функции включающего поиска

  14. ИГ, решающий задачу включающего поиска • а 1111 1101 1011 1110 0111 1001 1010 1100 0101 0011 0110 1000 0001 0010 0100 0000

  15. ИГ, решающий задачу интервального поиска

  16. Алгоритм, соответствующий ИГ • Устанавливаем ответкорень ИГ помечаем и включаем в вспомогательное множествоA. • Для каждой вершины , выполняем следующее: • если-лист, то записьприписанная листувключается в ответ ; • если- переключательная вершина, товычисляем переключательприписанный вершине ; еслии - номер, приписанный переключательному ребруивершина- непомеченная, то помечаем вершинуи включаем ее в множествоA; • если- не переключательнаявершина, топросматриваем все ребра, исходящие из ; для каждого ребраисходящего из, вычисляем предикат,приписанныйпредикатномуребруесли и вершина- непомеченная, товершинупомечаем и включаем в множествоA; • вершинуисключаем из множестваA.

  17. Алгоритм, соответствующий ИГ • а 1111 1101 1011 1110 0111 1001 1010 1100 0101 0011 0110 1000 0001 0010 0100 0000

  18. Алгоритм, соответствующий ИГ [ ] [ ]

  19. Сложность ИГ • Q(U) – число ребер ИГU. • .- число ребер, исходящих из вершины ; - множество вершинИГU; - множествопереключательныхвершинU; еслиf - предикат, определенный наX, то • СложностьИГ Uна запросеx: • Сложность ИГUвхудшем случае: • - множествоИГнад, решающихЗИПI. • - вероятностное пространство над X. • Сложность ИГUв среднем:T(U)=ET(U,x), т.е. • СложностьЗИПIдлябазового множестваи объемаq: • СложностьЗИП Iдля:

  20. СложностьИГ,решающего задачу включающего поиска • . • . • . 1111 1101 1011 1110 0111 1001 1010 1100 0101 0011 0110 1000 0001 0010 0100 0000

  21. Сложность ИГ, решающего задачу интервального поиска [ ] [ ]

  22. Поиск идентичных объектов • X=Y=(0,1]. - тип поиска идентичных объектов. • ТеоремаПустьвероятностнаямераPзаданафункцией плотностивероятностиI , , |V|=k , - базовое множество, заданное (1)-(4); тогдаI и существуеттакой ИГI, что

  23. Включающий поиск • ЕслиyтоO • ЕслиI- ЗИП,тоR • S- тип включающего поиска. • - множество всех монотонных конъюнкций от nпеременных. • - множество монотонных булевых функций отn переменных. • ТеоремаПустьF- базовое множество, где • F , xдля любогоx ; тогда • T для любой ЗИП I и существует • такая ЗИПIчтоT, • гдеas

  24. Пример включающего поиска • . • . • . • . • . • . • . • . • . 1111 1101 1011 1110 0111 1001 1010 1100 0101 0011 0110 1000 0001 0010 0100 0000

  25. Интервальный поиск • X - множество запросов. • ТеоремаПустьвероятностнаямераPзадается функцией плотности вероятностиI , - задачаинтервального поиска, - базовое множество (1)-(5), тогдаI

  26. Литература • Гасанов Э.Э. Теория сложности информационного поиска. Изд-во МГУ, Москва, 2005. • Гасанов Э.Э., Кудрявцев В.Б. Теория хранения и поиска информации. Физматлит, Москва, 2002. • Гасанов Э.Э. Об одной математической модели информационного поиска. Дискретная математика(1995) 3, N 2, 69-76. • Гасанов Э.Э. Об одномерной задаче интервального поиска. Дискретная математика(1995) 7, N 2, 40-60. • Гасанов Э.Э. Мгновенно решаемые задачи поиска. Дискретная математика(1996) 8, N 3, 119-134. • Гасанов Э.Э. Нижняя оценка сложности информационных сетей для одного отношения частичного порядка. Дискретная математика(1996) 8, N 4, 108-122. • Гасанов Э.Э. Нижняя оценка сложности включающего поиска в классе древовидных схем. Дискретная математика(1998) 10, N 1, 63-72. • Гасанов Э.Э., Кузнецова И.В. О функциональной сложности двумерной задачи интервального поиска. Дискретная математика(2002) 14, N 1, 114-141.

More Related