130 likes | 249 Views
Система коллаборативных рекомендаций туристических достопримечательностей. Манаев Дмитрий Сергеевич , 545 группа Научный руководитель : к.ф.-м.н., доцент каф. Информатики Д . Ю . Бугайченко Рецензент : ст.преп . каф. Системного Программирования Н. A . Зонова. Цели работы.
E N D
Система коллаборативных рекомендаций туристических достопримечательностей Манаев Дмитрий Сергеевич, 545 группа Научный руководитель:к.ф.-м.н., доцент каф. Информатики Д.Ю. Бугайченко Рецензент: ст.преп. каф. Системного Программирования Н.A.Зонова
Цели работы • Помочь пользователям запланировать путешествие , рекомендуя наиболее релевантные им туристические достопримечательности (места) • Сервисы • Yelp • Facebook • Google Places
Описание сервисов • Yelp, Facebook, TripAdvisor– много полезной информации, нет алгоритмов рекомендаций • Foursquare – простые рекомендации по чекинам друзей • Google Places - копия Yelp, рекомендации: • Социальныйс Google +, мало используемая соц.cеть, лучше Facebook и Twitter • По содержанию, на основе тэгов привязанных к местам, громоздкийи не точный, не находит похожих “местных”
Постановка задач • Проанализировать существующие решения и подходы к рекомендациям • Провести анализ схожести • предложить подход к решению • построить матрицы схожести для пользователей и мест • Реализовать генерацию рекомендации • Сравнить эффективность стандартных подходов с нашим алгоритмом
Анализ схожести Вычисление схожестиUser-User: • P - мн-во мест, U – мн-во пользователей • R = - матрица рейтингов • C - мн-во городов, где : • и -сравниваемые пользователи • - мн-во мест пользователя • - Евклидово расстояние • - Евклидова метрика • Расстояние между местными и путешественникамиуменьшено, благодаря уменьшению размерности пр-ва
1*(1-a) ½*(1-a) 1*(1-a) ½ *(1-a) Что такое Random Walkwith Restart? a – вероятность вернуться вначальное состояние пользователи, места a пользователь t=0 a
Построение графа • Связи в графе “Random Walk with Restart” • User Place (оценка пользователя) • User User (user-user similarity) • PlacePlace (item-item similarity) Формула итерации : • - отражает вероятность перехода в элемент на шаге • – это вектор нулей с единицией в элементе, с которого начинается алгоритм • - матрица перехода
Особенности реализации • Метрики для расчета схожести пользователей и мест: • Евклидова метрика • Корреляция Пирсона • Метрики для оценки релевантности результатов • Precision and Recall • Технологии • Java, Mahout (Taste) реализация системы коллаборативных рекомендаций • С#, MSSQL Server 2008 сбор тестовых данных
Тестовые данные • Два города • Лондон • Нью-Йорк • ~ 102300 оценок • ~ 39000 жителей • ~ 5000 мест • ~ 370 путешественников
Методика оценки Точность и охват (Precisionand Recall) можно представить в виде следующих формул соответственно: и • - это кол-во релевантных(рейтинг >= 3) среди выбранных • - это кол-во всех выбранных • – это кол-во релевантных
Результаты • Проанализированы существующие решения и подходы к рекомендациям • Проведен анализ схожести • Реализована генерация рекомендаций • Сделано сравнение с стандартными коллаборативными алгоритмами на собранных тестовых данных